








































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
ESTADISTICA BASICA CONCEPTOS BASICOS EJERCICIOS
Tipo: Apuntes
1 / 80
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!









































































UNI- NORTE - SEDE REGIONAL Estelí, Nicaragua
21/10/
Este texto básico de estadística está diseñando y organizado en función del contenido de la mayoría de los temas que se aborda en las asignaturas de Estadística I y Estadística II que se imparte en las carreras de Ingeniería en Sistemas, Civil, Industrial y Agroindustrial de la Universidad Nacional de Ingeniería, UNI, de Nicaragua. Sin embargo por su forma sencilla y asequible con que se trató de abordar los diferentes temas, este texto puede ser útil en cualquier otra carrera universitaria.
Este libro tiene un enfoque utilitario, práctico, respetando el principio que la Estadística debe ser una herramienta fundamental para describir procesos y tomar decisiones en el trabajo cotidiano de un Ingeniero. En el mismo se trató de romper la dicotomía entre teoría y realidad, respondiendo permanentemente a la pregunta ¿Cuándo puedo usar esta teoría? ¿Qué me permite conocer o responder la misma?
Es por lo anterior, respetando el principio de asequibilidad es que buena cantidad de los ejercicios fueron generados en el aula con la información que tienen los estudiantes mano. Creo que la estadística no puede funcionar si primero no se sabe como generar el dato, y como organizar la información en forma de matriz de datos y que estos puedan ser analizados usando un programa estadístico computacional. Para hacer los ejercicios de este texto y construir gráficos digitales se sugiere utilizar el programa estadístico INFOSTAT, el cual dispone de una versión de uso libre que se puede descargar gratuitamente desde la página www.infostat.com.ar.
Reflexión sobre el uso de la estadística Introducción a la recolección de datos
Objetivos
Construcción de concepto básicos Explicar los diferentes tipos de medidas Construir Distribuciones de Frecuencia. Realizar los tipos de Gráficos más comunes Construir medidas de tendencia central Construir medidas de variabilidad Utilizar las medidas en el análisis de datos Explicar principio básicos de muestreo
Los procedimientos estadísticos son de particular importancia en las ciencias biológicas y sociales para reducir y abstraer datos. Una definición que describe la estadística de manera utilitaria es la que dice que esta es: “un conjunto de técnicas para describir grupos de datos y para tomar decisiones en ausencia de una información completa”. La estadística a diferencia de la matemática no genera resultados exactos, los resultados siempre tienen asociada un grado de incertidumbre o error. La estadística trata de lograr una aproximación de la realidad, la cual es siempre mucho más compleja y rica que el modelo que podemos abstraer. Si bien esta ciencia es ideal para describir procesos cuantitativos, tiene serios problemas para explicar “el porqué” cualitativo de las cosas
En general podemos hablar de dos tipos de estadísticas, las descriptivas que nos permiten resumir las características de grandes grupos de individuos y las inferenciales que nos permite dar respuestas a preguntas (hipótesis) sobre poblaciones grandes a partir de datos de grupos pequeños o muestras.
Construcción de Variables a partir de información de un cuestionario. Para poder analizar datos, ya sea de forma manual o por computadora, hay que entender que trataremos a partir del estudio de la realidad observable crear un
miles datos reales que puede generar una encuesta de tamaño mediano. Es por ello que el énfasis de la clase estará en la interpretación de resultados que en los procedimientos de cálculo.
El procedimiento de análisis se esquematiza en la figura siguiente:
En general el investigador busca en primer término describir sus datos y posteriormente efectuar análisis estadístico para relacionar las variables. Los tipos de análisis son variados y cada método tiene su razón de ser un propósito específico, “la estadística no es un fin en si misma sino una herramienta para analizar los datos”. Los principales análisis que pueden efectuarse son: Estadística descriptiva para variables tomadas individualmente Pruebas paramétricas. Pruebas no paramétricas.
Una primera tarea luego de construir la tabla de datos es explorar los datos buscando información atípica o anormal y corregir los datos en caso que esta información atípica se deba a una mala digitación o error en la recolección de datos.
Lo siguiente para observar el comportamiento de los datos es realizar una “distribución frecuencias” en forma de tabla y gráfico. Para esto los datos se agrupan en clases o categorías y para grupo se calcula la frecuencia absoluta y relativa.
En este momento es importante poder definir el tipo de escala de medición usada para agrupar los datos, en este sentido se pueden reconocer diferentes escalas:
Definición de análisis a realizar
Creación de la matriz de datos
Ejecución de análisis en microcomputadora
Interpretación de resultados
Las escalas Nominales, es cuando describimos algo dándole un nombre a cada categoría o clase y estas son mutuamente excluyentes. Por ejemplo la variable sexo donde “varón = 1” y “mujer = 2”. Las escalas Ordinales, donde hay un orden de un conjunto de objetos o eventos con respecto a a algún atributo específico, por ejemplo ordenar los ingresos en tres niveles: “alto =1”, “medio = 2” y “bajo = 3”. Las Escalas de Intervalos Iguales, estas pueden ser sumadas, restadas multiplicadas y divididas sin afectar las distancias relativas entre las calificaciones. Por ejemplo las medidas de temperatura en Grados C^0 , las calificaciones de un examen en una escala de 1 a 100 o un juicio de valor en una escala Likert. En esta escala el “0” es arbitrario y no necesariamente representa ausencia, también nos dice que un valor de 30 puntos de un examen de español no necesariamente representa la mitad de conocimiento de un valor de 60 puntos. Escala de Razón Constante, tienen todas las propiedades de las clases de intervalos más un cero absoluto, por ejemplo las medidas de tiempo, peso y distancia el valor “0” representa ausencia del valor.
Un caso especial “La escala de Likert”, esta escala es muy usada en las ciencias sociales y se usa para medir actitudes, “Una actitud es una predisposición aprendida par responder consistentemente de una manera favorable o desfavorable ante un objeto de sus símbolos”. Así las personas tenemos actitudes hacia muy diversos objetos o símbolos, por ejemplo: actitudes hacia la política económica, un profesor, la ley, nosotros, etc. Las actitudes están relacionadas con el comportamiento que mantenemos. Estas mediciones de actitudes deben interpretarse como “síntomas” y no como hechos. Esta escala consiste en un conjunto de ítem presentado en forma de afirmaciones o juicios ante los cuales se pide reacción a los sujetos en estudio en una escala de 5 puntos, cada punto tiene un valor numérico. Un ejemplo de cómo calificar con afirmaciones positivas es ¿Le gusta cómo se imparte la clase de estadística?: 1- Muy en desacuerdo, 2- En desacuerdo, 3- Ni de acuerdo, ni en desacuerdo, 4- De acuerdo, 5-Muy de acuerdo.
caso lo que se hace es generar un variable del tipo 0-1 para cada opción de práctica de cultivo, generando muchas variables en una sola pregunta.
Para crear una base de datos hay que recordar que está formando una matriz de datos donde en la primera fila se tiene el nombre abreviado de la variable y en el resto de las filas los datos para cada encuesta o individuo en estudio. Las variables cualitativas se deben recodificar, veamos el siguiente ejemplo hipotético de 8 encuestas:
Encuesta Sexo Edad Ingresos semanales C$
Comunidad Labor realizada 1 1 31 1,394 2 3 2 1 35 1,311 4 2 3 1 43 1,300 2 3 4 1 28 1,304 3 1 5 2 45 1,310 1 3 6 2 36 1,443 2 2 7 2 21 1,536 2 3 8 2 32 1,823 1 3 Esta matriz se codifica así: la variable “Sexo”: 1= varón, 2 = mujer. Para la variable “comunidad” hay 4 tipos diferentes donde: 1= Estelí, 2= Condega, 3= Pueblo Nuevo y 4= Limay y para “Labor realizado”: 1= en otra finca, 2= en la cuidad y 3= en la propia finca.
De esta manera se transforma en datos numéricos una información descriptiva, estos números permiten luego hacer estadística.
Ejercicio 1.4 : Intente codificar numéricamente las respuestas que se generan a partir de la encuesta de caracterización socioeconómica, que a continuación se detalla, discuta las posibles respuestas, diga si las preguntas están bien formuladas, sugiera si alguna de ellas está de más y que preguntas propone para completar la información.
Hoja de Encuesta Número de ficha___________ Fecha: ______________________________________________________ Primer Apellido_______________________________________________ Segundo Apellido______________________________________________ Nombres:_____________________________________________________ Año____________ Dirección: _____________________________________________________ Estado Civil: ____________ Número de personas que habitan la vivienda__________________________ Nivel de estudio de ellos__________________________________________ Edad de cada una de ellos_________________________________________ Profesión: _____________________________________________________
Ejercicio 1.5: Defina variables para caracterizar a los estudiantes del curso con el objetivo de determinar posibles causas que tengan influencia en el rendimiento académico del grupo. Cree una base de datos de al menos 25 individuos. Ver ejemplo. Ejemplo de una matriz de datos generados con datos de estudiantes.
Códigos: Estado Civil: 1 Soltero, 2 Casado; Origen: 1 Estelí, 2 No Estelí; Sexo: 1 Varón, 2 Mujer; Becas: 1 Si 2 No; Opinión: 1 Negativa 5 Positiva
menor de 5 ni mayor de 20. Al ancho de clase se calcula dividiendo el Rango (valor mayor – valor menor), con un valor que debe variar entre 5 y 20. Hay que utilizar más clases cuando se tiene más datos disponibles, si el número de clases es muy grande es posible tener muchas clases vacías, si es demasiado pequeño podrían quedar ocultas características importantes de los datos al agruparlos. Se tendría que determinar el número de clases a partir de la cantidad de datos presente y de su uniformidad, en general con menos de treinta datos se usa una TDF con 5 clases.
El valor central de una clase se llama “marca de clase”, este valor se usa para construir los gráficos de polígonos de frecuencia. Veamos un ejemplo de cómo se construye una Tabla de Distribución de Frecuencias. Es importante resaltar que con las variables nominales no se construyen intervalos, límites ó marcas de clase, estos no tienen sentido con este tipo de variable.
Ejemplo con Datos de ingresos de 24 familias. Variable: Ingresos semanales en C$ por familia, n = 24 datos. 1,450 1,443 1,536 1,394 1,623 1, 1,480 1,355 1,350 1,430 1,520 1, 1,425 1,360 1,430 1,450 1,680 1, 1,304 1,260 1,328 1,304 1,360 1, Secuencia de actividades Se calcula el Rango de los datos, valor mayor menos valor menor : 1680- 1,260 = 420 C$. Ancho de clase: El rango se divide en cuatro, 420/4= 105 C$, se ajusta a 100 C$ y de esta manera el número de clases queda en cinco. Se construye los límites inferiores y superiores de cada clase como intervalos semiabiertos, Luego se cuentan las frecuencias por clase, esto es la Frecuencia Absoluta Se calcula la Frecuencia Relativa (Frecuencia Absoluta / n)
Se hace Frecuencia Acumulada. que es la suma de las frecuencias absolutas. También se pueden hacer las frecuencias expresadas en porcentajes. Tabla de Distribución de frecuencias, TDF. Clase Límite Inferior Igual a
Lim. Superior Menor a
Marca de clase
Frecuencia Absoluta
Frecuencia Relativa
Frecuencia Acumulada 1 1,2 00 <1,3 00 1, 250 1 0.04 1 2 1,3 00 <1,4 00 1,3 50 8 0.33 9 3 1,4 00 <1,500 1,45 0 7 0.29 16 4 1,500 <1, 600 1,550 4 0.17 20 5 1, 600 <1, 700 1,65 0 4 0.17 24 Total 24 1. Ejemplo de gráfico construido con estos datos
“Histograma y Polígono de Frecuencias Relativas de Ingresos semanales de 24 familias del Barrio Virginia Quintero, Estelí. 2008” (Observar que la información que lleva el gráfico es completa y permite explicar el contenido del mismo).
Una manera de representar una distribución de Frecuencias es:
0.00 (^1100 1200 1300 1400) C$ 1500 1600 1700 1800
0.
0.
0.
0.
0.
frecuencia relativa
Texto..
Histograma de Frecuencias absolutas, de la edad, de una muestra de personas de una comunidad rural del Departamento de Estelí. 2008.
Este gráfico univariado se acompaña de estadística descriptiva como promedios, medianas, desvíos estándares e intervalos de confianza.
“Gráfico de Pastel o Sectores” Ejemplo del nivel de educación, de una muestra de 598 personas de origen rural, obtenida como salida de un análisis con SPSS. Este Gráfico es creado con frecuencias y porcentajes, permite resaltar segmentos de clases determinadas.
Edad
0 5 10 15 20 25 30 3540 45 50 55 60 65 70 75 8085 90
Frecuencia de personas
40
30
20
10
0
Gráfico de pastel o sectores.
“Gráfico de Barras bivariado”. Ejemplo de las notas de tres asignaturas presentadas en forma de barras. Este resume el promedio de notas obtenido por asignatura. Entre barra y barra hay un espacio. El gráfico observado a continuación se construyó con una variable nominale, asignatura y una variable continua, nota.
19%
15%
21%
45%
otros
ninguno
secundaria
primaria
Días despues del trasplante
13 20 27 34 41 48 55 62 69 76
% Desa
o o de T zón en Toma e
30
20
10
0
Polígono de frecuencias acumuladas, en porcentaje del desarrollo de una enfermedad fungosa, en plantas de tomate.
Gráfico de Barras que incorpora 4 variables dicotómicas (si- no)
Este tipo de gráfico permite resumir de manera muy eficiente la información de hasta 6 o 7 variables. Es ideal para usar con escalas de opinión como la escala Likert o variables dicotómica, SI y NO.
Gráfico De Barras, Bivariado en Cluster o
Teléfono Asistencia Médica
Agua Potable Electricidad
Escuela Cercana
120
100
80
60
40
20 0
19
30
43
98
Agrupamientos Gráfico bivariado, que se puede acompañar de una tabla cruzada de frecuencias y porcentajes con una prueba estadística X^2 de independencia.
Gráfico Bivariado De Barras Apiladas Gráfico bivariado que reduce el número de barras y por lo tanto se simplifica el diseño. Se puede construir con frecuencias o porcentajes
Nivel educativo
Porcentaje primaria secundaria univers itario solo lee
50
40
30
20
10
0
Sexo varón mujer
13
23
41
(^98)
19
46
Sexo
varón mujer
140 120 100 80 60 40 20 0
Rol en la familia hijo/a madre padre jefe de familia
62
79
22 28
(^1510)