




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Para ayudar a tu conocimiento académico
Tipo: Ejercicios
1 / 154
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























































































Se han planteado muchas definiciones de la estadística, algunas caracterizando la
estadística como ciencia, y otras como metodología. Con fines estrictamente
académicos daremos la siguiente definición.
Estadística
Es un conjunto de técnicas para:
Recopilar,
Organizar (clasificar, agrupar),
Presentar y
Analizar datos con el fin de describirlos o de realizar inferencias válidas
De acuerdo a esta definición.
𝑳𝐚 𝐄𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚 𝐬𝐞 𝐜𝐥𝐚𝐬𝐢𝐟𝐢𝐜𝐚 𝐞𝐧 ൝
𝐄𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚 𝐃𝐞𝐬𝐜𝐫𝐢𝐩𝐭𝐢𝐯𝐚
𝐄𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚 𝐈𝐧𝐟𝐞𝐫𝐞𝐧𝐜𝐢𝐚𝐥
Estadística Descriptiva
Es un conjunto de técnicas para: describir, mostrar o presentar datos a través de
tablas, gráficos y medidas estadísticas.
Estadística Inferencial
Es un conjunto de técnicas para: inferir los resultados obtenidos en la muestra
hacia la población de la cual fue extraída.
NOTA: Estas dos partes de la estadística no son mutuamente excluyentes, ya que,
para utilizar las técnicas de la inferencia estadística, se requiere conocer las
técnicas de la estadística descriptiva.
(1) Dato estadístico (o información estadística)
Es cualquier dato que se puede comparar, analizar e interpretar
Ejemplo:
Si lanzamos 5 veces una moneda, obtenemos 5 datos: cara, cara, sello, cara,
sello.
Pero los valores son sólo dos: cara y sello
(2) Población
Es el conjunto de todos los datos con características comunes.
Al número de datos de la población se le llama “N” (tamaño poblacional).
𝑳𝐚 𝐩𝐨𝐛𝐥𝐚𝐜𝐢ó𝐧 𝐩𝐮𝐞𝐝𝐞 𝐬𝐞𝐫 ൝
(3) Muestra
Es un subconjunto representativo de la población.
Al número de datos de la muestra se le llama “n” (tamaño muestral).
(4) Unidad de análisis
Es cada uno de los objetos sobre los que se realiza la observación de una o
más variables. Son los sujetos u objetos de estudio
(5) Variable
Es cada una de las características que poseen los objetos. Se denotan con las
letras X, Y, Z, etc.
(1) Variable cualitativa
Son aquellas que expresan una cualidad o atributo, sus datos se expresan
mediante palabras.
Ejemplos: Género, Estado Civil; Profesión; Nivel Educacional; Causas de
Accidentes; etc.
(1.1) Variable cualitativa nominal
Es aquella cuando se definen categorías y se cuenta el número de
datos pertenecientes a cada categoría y no lleva ninguna ordenación
en las posibles modalidades
Ejemplos:
Género: femenino y masculino
Color de ojos: negro, azul, verde, etc.
Partidos políticos: DC, PPD, RN, UDI, PS, etc
Profesiones: Profesor, Ingeniero, Médico, etc.
(7) Estadígrafo
Es una medida de alguna característica en la muestra:
𝐋𝐨𝐬 𝐄𝐬𝐭𝐚𝐝í𝐠𝐫𝐚𝐟𝐨𝐬 𝐦á𝐬 𝐮𝐬𝐚𝐝𝐨𝐬 𝐬𝐨𝐧
𝟐
𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢ó𝐧 𝐞𝐬𝐭á𝐧𝐝𝐚𝐫 𝐦𝐮𝐞𝐬𝐭𝐫𝐚𝐥: 𝐬
𝐏𝐫𝐨𝐩𝐨𝐫𝐜𝐢ó𝐧 𝐦𝐮𝐞𝐬𝐭𝐫𝐚𝐥: 𝐩
Es una tabla que divide un conjunto de datos en un número adecuado de “clases”.
Se utilizan para presentar los datos obtenidos en alguna investigación en forma
clara y ordenada. Son auto-explicativas
𝑷𝐚𝐫𝐭𝐞𝐬 𝐝𝐞 𝐮𝐧𝐚 𝐃𝐢𝐬𝐭𝐫𝐢𝐛𝐮𝐜𝐢ó𝐧 𝐝𝐞 𝐟𝐫𝐞𝐜𝐮𝐞𝐧𝐜𝐢𝐚
⎩
⎪
⎪
⎪
⎨
⎪
⎪
⎪
⎧
𝐓í𝐭𝐮𝐥𝐨 ൞
¿ 𝐐𝐮é?
¿ 𝐃ó𝐧𝐝𝐞?
¿ 𝐂ó𝐦𝐨?
¿ 𝐂𝐮á𝐧𝐝𝐨?
𝐂𝐮𝐚𝐝𝐫𝐨 ൝
𝐂𝐮𝐞𝐫𝐩𝐨
𝐄𝐧𝐜𝐚𝐛𝐞𝐳𝐚𝐦𝐢𝐞𝐧𝐭𝐨
𝐂𝐨𝐥𝐮𝐦𝐧𝐚 𝐦𝐚𝐭𝐫𝐢𝐳
𝐈𝐧𝐝𝐢𝐜𝐚𝐜𝐢𝐨𝐧𝐞𝐬
𝐜𝐨𝐦𝐩𝐥𝐞𝐦𝐞𝐧𝐭𝐚𝐫𝐢𝐚𝐬
൝
𝐅𝐮𝐞𝐧𝐭𝐞
𝐍𝐨𝐭𝐚
𝐂𝐨𝐦𝐞𝐧𝐭𝐚𝐫𝐢𝐨
(1) El Titulo. Es la indicación que se coloca en la parte superior de la misma y
debe responder a las preguntas:
¿Qué son los datos incluídos en el cuerpo de la tabla?
¿Dónde está el área representada por los datos?
¿Cómo están los datos clasificados?
¿Cuándo ocurrieron los datos?
(2) El cuerpo. Está formado por un conjunto de filas y columnas que contienen
respectivamente, las series horizontales y verticales de información.
(3) El encabezamiento. Es la parte de la tabla en que se indica la naturaleza del
contenido de cada columna. Estos al igual que los títulos deben ser breves,
pero suficientemente explícitos.
(4) Columna Matriz. Es la parte de la tabla en que es designada la naturaleza (las
categorías, las modalidades de la variable) del contenido de cada fila.
(5) Indicaciones complementarias.
(a) Fuente: Es el indicador de la entidad responsable de donde se obtuvieron
los datos.
(b) Notas: Son colocadas al pie del cuadro para esclarecimientos de orden
general.
(c) Comentarios. También colocadas al pie del cuadro, sirven para aclarar
minucias en relación a las celdas, columnas, filas.
Ejemplo
Formas genéricas:
Formato de una Distribución de frecuencias para Variable Cualitativa
Categorías de la Variable
𝒊
Frecuencia Absoluta
𝐢
Frecuencia Relativa
𝐢
𝐢
𝟏
ଵ
ଵ
𝟐
ଶ
ଶ
𝑴
ெ
ெ
Total 𝑛 1
Tipos de frecuencias
(1) Frecuencia absoluta (𝑭𝑨 = 𝒏
𝒊
Es el número de veces que aparece un determinado valor en un estudio
estadístico.
La suma de las frecuencias absolutas es igual a " n", o sea:
ଵ
ଶ
ெ
ெ
ୀଵ
(2) Frecuencia absoluta acumulada (𝑭𝑨𝑨 = 𝑵 𝒊
Es la suma de las frecuencias absolutas de todos los valores inferiores o
iguales al valor considerado, o sea:
ଵ
ଶ
ୀଵ
(3) Frecuencia relativa (𝑭𝑹 = 𝒇 𝒊
Es el cuociente entre la frecuencia absoluta de un determinado valor y el
número total de datos, o sea:
La suma de las frecuencias relativas es igual a " 1 " , en efecto:
ଵ
ଶ
ெ
ெ
ୀଵ
(4) Frecuencia relativa acumulada (𝑭𝑹𝑨 = 𝑭
𝒊
Es el cociente entre la frecuencia absoluta acumulada de un determinado
valor y el número total de datos, o sea:
ଵ
ଶ
ୀଵ
Ejemplo de Distribución Categórica
Género de los empleados de la empresa TBC, en el pueblo de HUATACONDO. Año 2017
Género
((Variable)
Número de Empleados
Porcentaje de Empleados
Femenino 19 47,5%
Masculino 21 52,5%
Total 40 100,0%
FUENTE: RRHH de Huatacondo, 2017
NOTA: Las cifras corresponden a una muestra hipotética
Ejemplo de distribución numérica discreta
Número de hijos de los empleados de la empresa TBC, en el pueblo de
HUATACONDO. Año 2017
Número
de hijos
(Variable)
Número de
empleados
Porcentaje
de
empleados
Número de
empleados
acumulados
Porcentaje de
empleados
acumulados
Total 40 100,0%
FUENTE: RRHH de Huatacondo, 2017
Edad de los empleados de la empresa TBC en HUATACONDO, año 2017
Edad
(en años)
(Variable)
Marca de
Clase
Nº de
Empleados
Nº de empleados
Acumulados
Porcentaje
De empleados
Porcentaje
De empleados
Acumulados
Las clases también pueden ser escritas como:
Edad
(en años) Otra forma
Edad
(en años) En SPSS
Se lee por ejemplo:
𝑷𝒓𝒊𝒎𝒆𝒓 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐: 𝑫𝒆 𝟐𝟎 𝒉𝒂𝒔𝒕𝒂 𝒎𝒆𝒏𝒐𝒔 𝒅𝒆 𝟐𝟔, 𝟓 𝒂ñ𝒐𝒔
𝑺𝒆𝒈𝒖𝒏𝒅𝒐 𝒊𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐: 𝑫𝒆 𝟐𝟔, 𝟓 𝒉𝒂𝒔𝒕𝒂 𝒎𝒆𝒏𝒐𝒔 𝒅𝒆 𝟑𝟑 𝒂ñ𝒐𝒔
El polígono de frecuencias, de menor interés que el histograma, es la
poligonal que une los puntos medios de las bases superiores de los rectángulos
y se cierra con el punto medio anterior y posterior al histograma.
(3) Polígono de frecuencias acumuladas (ojivas)
Se utiliza para representar distribuciones de frecuencias acumuladas agrupadas
en intervalos. En el eje de abscisas se representan los distintos intervalos de
clase. Sobre el extremo superior de cada intervalo de clase se levanta una línea
perpendicular de altura proporcional a la frecuencia absoluta acumulada del
intervalo. Partiendo del extremo inferior del primer intervalo y uniendo los
extremos de las líneas anteriores, se obtiene el polígono de frecuencias
acumuladas.
(4) Gráfico circular o de sector
Se utiliza para representar distribuciones de frecuencias cualitativas.
En el diagrama de sectores, cada carácter se representa por un sector circular
de área proporcional a la frecuencia absoluta del mismo, es decir:
𝒊
𝒊
°
(5) Gráfico de Pareto
Se utiliza en Control de Calidad
Clasifica la cantidad y tipo de defectos que se presentan en un producto o en un
servicio. Recibe este nombre en honor al científico italiano del siglo XIX, Vilfredo
Pareto, quien observó que la mayor parte de la “actividad” en un proceso es
causada por una cantidad pequeña de “factores”. Su concepto, a menudo
denominado “regla 80-20”, es que “80% de la actividad es provocada por 20%
de los factores”. Si se concentran en este último dato, 20%, los gerentes
pueden resolver 80% del problema.
(6) Gráfico de caja y bigote (gráfico de los 5 números)
Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".
Suministra información sobre los valores mínimo y máximo, los percentiles P 25 ,
P 50 , y P 75 , y sobre la existencia de valores atípicos y la asimetría de la
distribución.
(7) Pictogramas; son figuras alusivas al tema
Una vez clasificados los datos originales, cuyas características más esenciales se
destacan, será necesario calcular un conjunto de estadísticas (indicadores) que
caractericen en forma algo más precisa la distribución que se está estudiando.
𝐌𝐞𝐝𝐢𝐝𝐚𝐬 𝐞𝐬𝐭𝐚𝐝í𝐬𝐭𝐢𝐜𝐚𝐬
𝐃𝐞 𝐏𝐨𝐬𝐢𝐜𝐢ó𝐧
𝐌𝐞𝐝𝐢𝐚 𝐀𝐫𝐢𝐭𝐦é𝐭𝐢𝐜𝐚
𝐌𝐞𝐝𝐢𝐚 𝐆𝐞𝐨𝐦é𝐭𝐫𝐢𝐜𝐚
𝐌𝐞𝐝𝐢𝐚 𝐀𝐫𝐦ó𝐧𝐢𝐜𝐚
𝐌𝐞𝐝𝐢𝐚 𝐂𝐮𝐚𝐝𝐫á𝐭𝐢𝐜𝐚
𝐃𝐞 𝐃𝐢𝐬𝐩𝐞𝐫𝐬𝐢ó𝐧
𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢ó𝐧 𝐦𝐞𝐝𝐢𝐚
𝐃𝐞𝐬𝐯𝐢𝐚𝐜𝐢ó𝐧 𝐞𝐬𝐭á𝐧𝐝𝐚𝐫
𝐂𝐨𝐞𝐟𝐢𝐜𝐢𝐞𝐧𝐭𝐞 𝐝𝐞 𝐯𝐚𝐫𝐢𝐚𝐜𝐢ó𝐧
𝐀𝐬𝐢𝐦𝐞𝐭𝐫í𝐚
Nos facilitan información sobre los datos que estamos analizando. Estas medidas
permiten conocer diversas características de los datos.
Nos dan el valor que ocupa una determinada “posición" respecto al resto de la
muestra.
Características de las medidas de posición
1°) Debe estar definido en forma objetiva.
2°) Debe depender de toda la información obtenida en lo posible.
3°) Debe ser fácil de comprender (no debe tener un carácter abstracto) y de
interpretar.
4°) Debe ser fácil de calcular.
5°) Debe ser estable (no debe ser sensible a fluctuaciones).
6°) Debe ser adecuado a cálculos algebraicos posteriores.
Tipos
Medidas de posición central: informan sobre los valores medios de los datos.
Medidas de posición no central: informan de como se distribuye el resto de los
valores de los datos.
(1.1) Medidas de posición central
Nos dan un centro de la distribución de frecuencias, es un valor que se puede
tomar como representante de todos los datos. Las principales medidas de posición
central son: Promedio, Moda y Mediana.
(1.1.1) Promedio
Es el valor medio ponderado de los datos. Se pueden calcular diversos tipos de
promedio, siendo los más utilizados:
(1.1.1.1) Media aritmética
Es el v a l or obtenido al s uma r todos los da tos y div i di r el resultado
entre el núme ro total de da tos. Se representa por 𝑥̅. O sea:
ଵ
ଶ
ୀଵ
Ejemplo
Los pesos en kilogramos de seis trabajadores son: 84, 91, 72, 68, 87 y 78.
Hallar el peso medio.
ଵ
ଶ
Media aritmética para datos agrupados
Si los da tos vienen a grupa dos en una tabla de frecuencias, la
expresión de la me dia es:
ଵ
ଵ
ଶ
ଶ
ெ
ெ
ெ
ୀଵ
ெ
ୀଵ
Propiedades de la media aritmética
1 º ) La s uma de las des v i ac i ones de los datos de una distribución
respecto de su me di a es igual a c e ro:
− 𝑥̅ ) = 0. Teorema de Koning
Ejemplo:
La suma de las desviaciones de los números 84, 91, 72, 68, 87, 78 de
su media aritmética 80 es igual a 0, en efecto:
2 º ) La me di a a ri tmé tic a de los c ua dra dos de las de sv i a ci one s
de los valores de la variable con respecto a un núme ro cualquiera
(1.1.1.3) Media armónica
Es igual al número recíproco de la media aritmética de los valores
recíprocos de la distribución:
ு
ଵ
ଵ
ଶ
ଶ
ெ
ெ
Se usa cuando las unidades de los valores son cuocientes (m/seg; km/hr,
etc).
(1.1.1.4) Media cuadrática
Es igual a la raíz cuadrada de la media aritmética de los cuadrados de los
valores de la variable.
Se usa en el análisis de la varianza y para valores negativos de una
variable.
ଵ
ଵ
ଶ
ଶ
ଶ
ଶ
ெ
ெ
ଶ
En datos agrupados, para calcular las medidas anteriores utilizamos las
marcas de clase, es decir, 𝑦
indicará el punto medio del intervalo.
La relación entre: la media, la media geométrica, y la media armónica es:
ு
ீ
(1.1.2) Mediana
Es el v a l or que ocupa el l uga r ce ntra l de los da tos cuando éstos están
orde na dos de menor a ma y or. Se representa por: 𝑋
La me di a na se puede ha l la r sólo para vari a bl es c ua nti ta tiv a s.
Cálculo de la mediana para datos no agrupados
1 º ) O rde na mos los da tos de me nor a may or.
2 º ) Ubicar la posición de la mediana, usando:
ାଵ
ଶ
3 º ) Aplicar la fórmula: 𝑀
(௦)ାଵ
(௦)
E j e mpl o: 2, 3, 4, 4, 5 , 5, 5, 6, 6
Ubicar la posición de la mediana, usando:
௧
𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛 ⟹ 𝑀
E j e mpl o: 7, 8, 9, 10, 11, 12
(1º) Ubicar la posición de la mediana, usando:
𝑒𝑠𝑡á 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎 3
௧
𝑝𝑜𝑠𝑖𝑐𝑖ó𝑛
2º) Aplicar la interpolación lineal:
(௦)ାଵ
(௦)
Cálculo de la mediana para datos agrupados
1º) La me dia na se encuentra en el i nte rv a l o donde la frec ue nc ia
a c umul a da llega hasta la mi ta d de la s uma de l a s fre cue nc i as
a bs ol uta s , es decir tenemos que buscar el intervalo hasta donde tenemos
el 𝟓𝟎% 𝒅𝒆 𝒏.
2º) Aplicamos la fórmula de interpolación:
ெ
ெ
ெ
ெ
ି ଵ
Donde :
𝑴 𝒆
, 𝑒𝑠 𝑒𝑙 𝑙í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 𝑑𝑜𝑛𝑑𝑒 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎.
𝑴 𝒆
ି 𝟏
𝑴
𝒆
𝑴
𝒆
Propiedad
La mediana hace mínima la suma de todas las desviaciones absolutas de
los valores de la variable respecto a una constante k cualquiera. Es decir:
ୀଵ
ୀଵ
; para cualquier constante k.