












Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Cómo calcular las medidas de localización (cuartiles y percentiles) y dispersión (varianza, desviación estándar y coeficiente de variación) de un conjunto de datos. Se incluyen ejemplos prácticos para calcular estas medidas tanto en datos no agrupados como en datos agrupados, utilizando Excel.
Tipo: Esquemas y mapas conceptuales
1 / 20
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!













Palabras clave : varianza, desviación estándar, coeficiente de variación, cuartil, percentil.
Medidas de localización Medidas de dispersión
Además de las medidas de tendencia central (media, mediana, moda) existen otras medidas que determinan la ubicación de los datos, dividiendo un conjunto de observaciones en partes iguales. Estas medidas son los cuartiles y los percentiles.
Símbolo Qk
De las medidas de tendencia central recuerde que la mediana es el valor que está en el centro de los datos, de tal manera que el 50% de los valores más pequeños, son menores o iguales a la mediana y el 50% de los valores más grandes son mayores o iguales a la mediana. Así como la mediana divide los datos en dos partes iguales, los tres cuartiles, Q1, Q2, Q3 dividen los valores ordenados en cuatro partes iguales.
Los cuartiles se denotan usualmente Q1, Q2, Q
» Q1, el primer cuartil, supera al 25% de los datos ordenados y es superado por el 75%. » Q2, el segundo cuartil, supera al 50% de los datos ordenados y es superado por el 50%. » Q3,^ el tercer cuartil es el valor por debajo del cual se encuentra el 75% de las observaciones.
¿Sabía qué...?
Cuando los datos están organizados en una tabla de distribución de frecuencias, los cuartiles se pueden calcular en una forma similar a la mediana en datos agrupados siguiendo los siguientes pasos:
kn 4 - Ni-1
en donde:
» Li = Límite inferior del grupo en donde se ubica^ k*n 4
» N^ i-1= Frecuencia absoluta acumulada en el grupo anterior donde está ubicado^ k*n 4
» ni = Frecuencia del intervalo donde está^ k*n 4
» C = Amplitud del intervalo
Ejemplo : los siguientes datos representan los puntajes obtenidos por un grupo de estudiantes en una prueba de aptitud. Tabla 2. Distribución de frecuencia (puntajes) Puntaje 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80
4 9 19 7 6 5
No. estudiantes ni 4 13 32 39 45 50
Grupo del primercuartil Q^ N 1 i-
Ni
Fuente: elaboración propia
De acuerdo a los pasos definidos para el cálculo de los cuartiles:
Símbolo Pk
Los percentiles dividen los datos ordenados en cien partes iguales, cuando los datos están sin agrupar se pueden manejar utilizando la función fx estadística:
Figura 2. Pantallazo de percentiles en Excel Fuente : elaboración propia
Por ejemplo para los datos 12, 15, 22, 28, 31, 34, 35, 38 tenemos: Tabla 4. Percentiles
Fuente : elaboración propia
Cuando los datos están agrupados en una tabla de frecuencia se calculan con la siguiente fórmula:
Pk = Li + (^) ni Ci
100 kn - Ni-1
Para aplicar la fórmula, como en el caso de los cuartiles, primero se ubica el grupo o intervalo que contiene al percentil con el valor k*n 100
Este valor se compara con las frecuencias acumuladas Nj, y luego se aplica la fórmula así como en el siguiente ejemplo: Calcular el percentil 62 P 62 Grupo del percentil con k= 62* 100 = 31
Tabla 5. Distribución de frecuencias (percentil) Puntaje 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80
4 9 19 7 6 5
No. estudiantes ni 4 13 32 39 45 50
Grupo del percentil 62Ni-
Ni
Fuente: elaboración propia
En la fórmula: P 62 = 40 + P 62 = 40 + 9,47 = 49,
Este valor indica que el 62% de las personas con menores puntajes tienen un valor máximo de 49,47.
20 1 unidades, etc. Para el segundo grupo, el B, las diferencias son entre 4 y 20, 16 unidades, entre 5 y 20 15 unidades etc. Quiere decir que las distancias que hay de los datos del segundo grupo con respecto al primero son mayores que las del primero. Esta situación nos indica que una medida de tendencia central no es suficiente para la descripción completa de una serie de datos. Entonces existe la necesidad de encontrar una medida que mida la distancia, variación o dispersión de los datos con respecto a la media.
En síntesis...
Para Variables cuantitativas
Absolutas • Rango
Relativas • Coeficiente de variación
Figura 3. Variables cuantitativas Fuente : elaboración propia
El rango es una medida de dispersión muy fácil de calcular. Esta medida se conoce también como recorrido o amplitud y como se vio en los pasos para elaborar una tabla de frecuencias es la diferencia entre el valor máximo y el valor mínimo. Esta medida, aunque es muy sencilla de calcular su empleo
no es muy usual pues no considera las variaciones de valores intermedios y es muy sensible a los valores extremos. Esta medida se vá a identificar con la letra R. El rango de las edades en el grupo A es: R = 22 - 18 = 4 Significa que la diferencia entre la edad de la persona de mayor edad, con respecto a la de menor edad, es de 4 años. Para el grupo B el rango es: R = 65 – 4 = 61 La diferencia entre la edad de la persona mayor con respecto a la menor es de 61 años. En el segundo ejemplo se ve que aunque el rango es sencillo de calcular es sensible a los valores extremos.
Tabla 7. Símbolo varianza
Fuente: elaboración propia
2.2.1. Datos sin agrupar
Por definición la varianza es igual al promedio de las desviaciones al cuadrado, esto lo expresamos en la siguiente fórmula: Tabla 8. Datos sin agrupar
∑ (X Ni - μ)
Fuente: elaboración propia ∑ (Xn - 1i^ - X)
Método abreviado La varianza se puede calcular utilizando una nueva expresión conocida como la fórmula del método abreviado:
Si la aplicamos a los datos del grupo A del ejemplo:
Tabla 9. Ejemplo 1 Xi Xi² 18 19 20 21 22 100
18² = 324 19²= 361 20² = 400 21² = 441 22² = 484 2010 ∑ Xi Fuente: elaboración propia
Las dos fórmulas para la varianza dan el mismo resultado. Por facilidad de cálculo se recomienda la fórmula del método abreviado. Recuerde que son dos formas diferentes para llegar al mismo resultado.
2.2.2. Datos agrupados
Para datos agrupados hacemos una pequeña modificación de la fórmula, teniendo en cuenta la frecuencia de ocurrencia ni:
Ejemplo: los siguientes datos representan el peso (kg) para un grupo de personas.
Tabla 10. Cálculo de la varianza (por definición)
n = 100
Pesos Marca declase Xi n^ i Xi * n^ i Xi - μ^ (X (^) i - μ)^2 (X^ i - μ)² n^ i
Fuente: elaboración propia
La desviación estándar o desviación típica es la raíz cuadrada positiva de la varianza.
En el ejemplo en donde teníamos el peso de los 100 estudiantes la desviación estándar es:
La fórmula de la varianza muestra que las unidades en las que se mide la variable siempre quedan al cuadrado, es decir, si la variable se refiere a peso en Kg, al calcular la varianza estará dado el peso en Kg. al cuadrado. Es por esto que se utiliza la desviación estándar como medida de dispersión, pues se expresa en las mismas unidades de la variable. La desviación estándar se interpreta como la variación promedio de los datos con respecto a la media, así para el ejemplo se dice que el peso de los estudiantes tiene una variación de 2,92 Kg. con respecto al peso promedio. Observe que la desviación estándar es la raíz cuadrada de la varianza, independientemente de si la varianza se obtuvo de datos agrupados o de datos originales. Así, en el ejemplo para datos originales sobre la edad de dos grupos de personas, tenemos que:
La edad en el grupo A tiene una variación promedio de 1,41 años con respecto a la edad media, mientras que en el grupo B la variación promedio es de 25,99 años con respecto a la edad media o promedio, indicando que los datos en el grupo B tienen una mayor variación o dispersión.
Es una medida relativa de dispersión. De gran utilidad cuando las variables a comparar no están en las mismas unidades. Por ejemplo, cuando se quiere comparar la variabilidad del ingreso per-cápita de Colombia ($) y de Estados Unidos ($US). Tabla 12. Coeficiente de variación
Fuente: elaboración propia
Para la interpretación del coeficiente de variación en este módulo se va a tener en cuenta lo siguiente:
¿Sabía qué...?
Si se sigue trabajando con el ejemplo de la edad, en el grupo A en donde:
Referencias Lind, Marchal y Wathen (2012), Estadística Aplicada a los negocios y la economía , México: editorial Mac Graw Hill. Martinez, C. (2002), Estadística y Muestreo , Bogotá, Colombia: ECOE Ediciones. Newbold, P. (2008), Estadística para los Negocios y la Economía. México: Editorial Prentice Hall. Triola, M. (2013), Estadística , México: editorial Pearson
INFORMACIÓN TÉCNICA
Módulo: Estadística I Unidad 2: Medidas descriptivas, de localización y de variación de datos Escenario 4: Medidas de localización y de variación de datos Autor: Patricia Castillo Garzón
Asesor Pedagógico: Judy Fernanda Villanueva Diseñador Gráfico: Yinet Rodríguez Asistente: Ginna Quiroga
Este material pertenece al Politécnico Grancolombiano. Por ende, es de uso exclusivo de las Instituciones adscritas a la Red Ilumno. Prohibida su reproducción total o parcial.