Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Médicas de localización y dispersión de datos: cuartiles y percentiles, Esquemas y mapas conceptuales de Estadística

Cómo calcular las medidas de localización (cuartiles y percentiles) y dispersión (varianza, desviación estándar y coeficiente de variación) de un conjunto de datos. Se incluyen ejemplos prácticos para calcular estas medidas tanto en datos no agrupados como en datos agrupados, utilizando Excel.

Tipo: Esquemas y mapas conceptuales

2020/2021

Subido el 24/11/2021

angela-sofia-acosta
angela-sofia-acosta 🇨🇴

2 documentos

1 / 20

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Palabras clave: varianza, desviación estándar, coeficiente de variación, cuartil, percentil.
Contenido
1
2
Medidas de localización
Medidas de dispersión
Medidas de localización y de
dispersión de datos
Unidad 2 / Escenario 4
Lectura fundamental
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14

Vista previa parcial del texto

¡Descarga Médicas de localización y dispersión de datos: cuartiles y percentiles y más Esquemas y mapas conceptuales en PDF de Estadística solo en Docsity!

Palabras clave : varianza, desviación estándar, coeficiente de variación, cuartil, percentil.

Contenido

Medidas de localización Medidas de dispersión

Medidas de localización y de

dispersión de datos

Unidad 2 / E scenario 4

Lectura f undamental

1. Medidas de localización

1.1. Cuartiles

Además de las medidas de tendencia central (media, mediana, moda) existen otras medidas que determinan la ubicación de los datos, dividiendo un conjunto de observaciones en partes iguales. Estas medidas son los cuartiles y los percentiles.

Símbolo Qk

De las medidas de tendencia central recuerde que la mediana es el valor que está en el centro de los datos, de tal manera que el 50% de los valores más pequeños, son menores o iguales a la mediana y el 50% de los valores más grandes son mayores o iguales a la mediana. Así como la mediana divide los datos en dos partes iguales, los tres cuartiles, Q1, Q2, Q3 dividen los valores ordenados en cuatro partes iguales.

Los cuartiles se denotan usualmente Q1, Q2, Q

Q1 Q2 Q

» Q1, el primer cuartil, supera al 25% de los datos ordenados y es superado por el 75%. » Q2, el segundo cuartil, supera al 50% de los datos ordenados y es superado por el 50%. » Q3,^ el tercer cuartil es el valor por debajo del cual se encuentra el 75% de las observaciones.

¿Sabía qué...?

El cuartil 2 es igual a la mediana.

Cuando los datos están organizados en una tabla de distribución de frecuencias, los cuartiles se pueden calcular en una forma similar a la mediana en datos agrupados siguiendo los siguientes pasos:

  1. Encuentre las frecuencias absolutas acumuladas.
  2. Con base en la frecuencia absoluta acumulada, ubique el intervalo donde quede ubicado el k-ésimo cuartil, es decir (k*n)/
  3. Compare el valor de (k*n)/4 con la frecuencia absoluta acumulada, hasta obtener la menor frecuencia acumulada que lo contiene.
  4. Aplique la siguiente fórmula: (^) Q (^) x = Li + ni Ci

 kn 4 - Ni-1 

en donde:

» Li = Límite inferior del grupo en donde se ubica^ k*n 4

» N^ i-1= Frecuencia absoluta acumulada en el grupo anterior donde está ubicado^ k*n 4

» ni = Frecuencia del intervalo donde está^ k*n 4

» C = Amplitud del intervalo

Ejemplo : los siguientes datos representan los puntajes obtenidos por un grupo de estudiantes en una prueba de aptitud. Tabla 2. Distribución de frecuencia (puntajes) Puntaje 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80

4 9 19 7 6 5

No. estudiantes ni 4 13 32 39 45 50

Grupo del primercuartil Q^ N 1 i-

Ni

Fuente: elaboración propia

De acuerdo a los pasos definidos para el cálculo de los cuartiles:

  1. En esta tabla ya están calculadas las frecuencias acumuladas.
  2. Calculamos el valor k*n 4 , como k= 1 entonces queda 1*50 4 =12,5.
  3. Al comparar el valor de 12,5 con las frecuencias acumuladas, se observa que el valor está contenido en el segundo grupo con una frecuencia acumulada de 13.
  4. Reemplazamos en la fórmula: (^) Q 1 = 30 + Q 1 = 30 + 9,44 = 39,
^50 4 - 4 

1.2. Percentiles

Símbolo Pk

Los percentiles dividen los datos ordenados en cien partes iguales, cuando los datos están sin agrupar se pueden manejar utilizando la función fx estadística:

Figura 2. Pantallazo de percentiles en Excel Fuente : elaboración propia

Por ejemplo para los datos 12, 15, 22, 28, 31, 34, 35, 38 tenemos: Tabla 4. Percentiles

Percentil 30

Percentil 65

Percentil 90

Fuente : elaboración propia

Cuando los datos están agrupados en una tabla de frecuencia se calculan con la siguiente fórmula:

Pk = Li + (^) ni Ci

 100 kn - Ni-1 

Para aplicar la fórmula, como en el caso de los cuartiles, primero se ubica el grupo o intervalo que contiene al percentil con el valor k*n 100

Este valor se compara con las frecuencias acumuladas Nj, y luego se aplica la fórmula así como en el siguiente ejemplo: Calcular el percentil 62 P 62 Grupo del percentil con k= 62* 100 = 31

Tabla 5. Distribución de frecuencias (percentil) Puntaje 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80

4 9 19 7 6 5

No. estudiantes ni 4 13 32 39 45 50

Grupo del percentil 62Ni-

Ni

Fuente: elaboración propia

En la fórmula: P 62 = 40 + P 62 = 40 + 9,47 = 49,

Este valor indica que el 62% de las personas con menores puntajes tienen un valor máximo de 49,47.

20 1 unidades, etc. Para el segundo grupo, el B, las diferencias son entre 4 y 20, 16 unidades, entre 5 y 20 15 unidades etc. Quiere decir que las distancias que hay de los datos del segundo grupo con respecto al primero son mayores que las del primero. Esta situación nos indica que una medida de tendencia central no es suficiente para la descripción completa de una serie de datos. Entonces existe la necesidad de encontrar una medida que mida la distancia, variación o dispersión de los datos con respecto a la media.

En síntesis...

Las medidas de dispersión son las que miden la agrupación o dispersión de

los datos con respecto a la media. Las medidas de dispersión son el rango,

la varianza y la desviación estándar (medidas absolutas) y el coeficiente de

variación (variación relativa).

Para Variables cuantitativas

Absolutas • Rango

  • Varianza• Desviación estándar

Relativas • Coeficiente de variación

Figura 3. Variables cuantitativas Fuente : elaboración propia

2.1. El Rango

El rango es una medida de dispersión muy fácil de calcular. Esta medida se conoce también como recorrido o amplitud y como se vio en los pasos para elaborar una tabla de frecuencias es la diferencia entre el valor máximo y el valor mínimo. Esta medida, aunque es muy sencilla de calcular su empleo

no es muy usual pues no considera las variaciones de valores intermedios y es muy sensible a los valores extremos. Esta medida se vá a identificar con la letra R. El rango de las edades en el grupo A es: R = 22 - 18 = 4 Significa que la diferencia entre la edad de la persona de mayor edad, con respecto a la de menor edad, es de 4 años. Para el grupo B el rango es: R = 65 – 4 = 61 La diferencia entre la edad de la persona mayor con respecto a la menor es de 61 años. En el segundo ejemplo se ve que aunque el rango es sencillo de calcular es sensible a los valores extremos.

2.2. La Varianza

Tabla 7. Símbolo varianza

Símbolo σ²^ =

S² =

Varianza poblacional

Varianza muestral

Fuente: elaboración propia

2.2.1. Datos sin agrupar

Por definición la varianza es igual al promedio de las desviaciones al cuadrado, esto lo expresamos en la siguiente fórmula: Tabla 8. Datos sin agrupar

Población

Muestra

S² =

∑ (X Ni - μ)

Fuente: elaboración propia ∑ (Xn - 1i^ - X)

Método abreviado La varianza se puede calcular utilizando una nueva expresión conocida como la fórmula del método abreviado:

Si la aplicamos a los datos del grupo A del ejemplo:

Tabla 9. Ejemplo 1 Xi Xi² 18 19 20 21 22 100

18² = 324 19²= 361 20² = 400 21² = 441 22² = 484 2010 ∑ Xi Fuente: elaboración propia

Las dos fórmulas para la varianza dan el mismo resultado. Por facilidad de cálculo se recomienda la fórmula del método abreviado. Recuerde que son dos formas diferentes para llegar al mismo resultado.

2.2.2. Datos agrupados

Para datos agrupados hacemos una pequeña modificación de la fórmula, teniendo en cuenta la frecuencia de ocurrencia ni:

Su fórmula es: σ² =^ ∑ (Xi N- μ)2 n^ i

Ejemplo: los siguientes datos representan el peso (kg) para un grupo de personas.

Tabla 10. Cálculo de la varianza (por definición)

n = 100

Pesos Marca declase Xi n^ i Xi * n^ i Xi - μ^ (X (^) i - μ)^2 (X^ i - μ)² n^ i

Fuente: elaboración propia

2.3. La desviación estándar

La desviación estándar o desviación típica es la raíz cuadrada positiva de la varianza.

En el ejemplo en donde teníamos el peso de los 100 estudiantes la desviación estándar es:

La fórmula de la varianza muestra que las unidades en las que se mide la variable siempre quedan al cuadrado, es decir, si la variable se refiere a peso en Kg, al calcular la varianza estará dado el peso en Kg. al cuadrado. Es por esto que se utiliza la desviación estándar como medida de dispersión, pues se expresa en las mismas unidades de la variable. La desviación estándar se interpreta como la variación promedio de los datos con respecto a la media, así para el ejemplo se dice que el peso de los estudiantes tiene una variación de 2,92 Kg. con respecto al peso promedio. Observe que la desviación estándar es la raíz cuadrada de la varianza, independientemente de si la varianza se obtuvo de datos agrupados o de datos originales. Así, en el ejemplo para datos originales sobre la edad de dos grupos de personas, tenemos que:

La edad en el grupo A tiene una variación promedio de 1,41 años con respecto a la edad media, mientras que en el grupo B la variación promedio es de 25,99 años con respecto a la edad media o promedio, indicando que los datos en el grupo B tienen una mayor variación o dispersión.

2.4. Coeficiente de variación

Es una medida relativa de dispersión. De gran utilidad cuando las variables a comparar no están en las mismas unidades. Por ejemplo, cuando se quiere comparar la variabilidad del ingreso per-cápita de Colombia ($) y de Estados Unidos ($US). Tabla 12. Coeficiente de variación

CV = σ μ^ *100% Población

CV = X^ S *100% Muestra

Fuente: elaboración propia

Para la interpretación del coeficiente de variación en este módulo se va a tener en cuenta lo siguiente:

¿Sabía qué...?

Si los datos son heterogéneos, son muy dispersos, es decir existen

valores extremos, por lo tanto, la media deja de ser una medida

representativa y en esos casos es mejor describir los datos con otra

medida de tendencia central, que puede ser la mediana o la moda.

Si se sigue trabajando con el ejemplo de la edad, en el grupo A en donde:

Referencias Lind, Marchal y Wathen (2012), Estadística Aplicada a los negocios y la economía , México: editorial Mac Graw Hill. Martinez, C. (2002), Estadística y Muestreo , Bogotá, Colombia: ECOE Ediciones. Newbold, P. (2008), Estadística para los Negocios y la Economía. México: Editorial Prentice Hall. Triola, M. (2013), Estadística , México: editorial Pearson

INFORMACIÓN TÉCNICA

Módulo: Estadística I Unidad 2: Medidas descriptivas, de localización y de variación de datos Escenario 4: Medidas de localización y de variación de datos Autor: Patricia Castillo Garzón

Asesor Pedagógico: Judy Fernanda Villanueva Diseñador Gráfico: Yinet Rodríguez Asistente: Ginna Quiroga

Este material pertenece al Politécnico Grancolombiano. Por ende, es de uso exclusivo de las Instituciones adscritas a la Red Ilumno. Prohibida su reproducción total o parcial.