


















Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadística, Profesor: , Carrera: Biologia, Universidad: UdG
Tipo: Apuntes
1 / 26
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!



















Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
Se desconocen con exactitud los orígenes de la Estadística. Parece que fueron los chinos, en el 2200 a. C., los primeros en efectuar recuentos de su población. Tanto los egipcios como los griegos y los romanos preveían sus cosechas por medios que podríamos llamar estadísticos y efectuaban censos de población.
En los siglos XVI y XVII la Estadística pasa a tener como principal objetivo el estudio de los asuntos de Estado, de donde deriva el sentido etimológico de la palabra. Desde entonces experimenta una evolución que pasa por varias fases. Inicialmente, la preocupación fundamental era la recogida, clasificación y representación de los datos; más tarde se pasó a la fase de análisis e interpretación de los mismos.
En una primera aproximación, usamos la palabra estadística para designar colecciones de datos numéricos de la misma naturaleza, relativos a un determinado fenómeno: estadística de los automóviles vendidos, estadística de las importaciones, estadística de los divorcios, etc. En un sentido más riguroso, la Estadística es un método científico que, a partir del conocimiento de diversos hechos recogidos, hace inferencias que permiten la previsión de nuevos acontecimientos.
Para hablar del objeto de la Estadística, hemos de comenzar por distinguir fenómenos deterministas y aleatorios.
Fenómenos deterministas (o causales) son los que al repetirlos en idénticas condiciones producen el mismo resultado. Por ejemplo, el tiempo que tarda un móvil, a velocidad constante, en recorrer una distancia dada.
Fenómenos aleatorios (de azar o estadísticos) son los que al repetirlos un gran número de veces, en idénticas condiciones, presentan resultados diferentes, siendo imposible predecir el resultado de cada prueba particular. Por ejemplo, los resultados del lanzamiento de un dado.
El método de trabajo de la Estadística tiene tres vertientes:
Descripción de los datos observados (Estadística Descriptiva).
Modelización del comportamiento (Cálculo de Probabilidades).
Estimación de lo desconocido y generalización (Teoría de Muestras e Inferencia Estadística).
Teniendo en cuenta los métodos de trabajo de la Estadística encontramos sus aplicaciones:
Descripción.
Análisis.
Predicción.
Una clasificación más general presenta las técnicas estadísticas en dos grupos con funciones distintas:
Estadística Descriptiva.
o Reducción y descripción de informaciones voluminosas.
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
o Recuento, ordenación y clasificación de datos observados. o Presentación de datos en forma resumida y manejable: Tablas. Gráficas. Cálculo de parámetros estadísticos que caracterizan la distribución de los datos: medias, medianas, cuartiles, percentiles, varianza, desviación típica, ... o No utiliza el Cálculo de Probabilidades.
Estadística Inferencial.
o Se apoya en el Cálculo de Probabilidades. o Maneja resultados de la Estadística Descriptiva. o Plantea y resuelve el problema de establecer previsiones y conclusiones generales sobre una población o colectivo.
Tanto en esta tema como en el siguiente se trabajará la Estadística Descriptiva en una variable (unidimensional) y en dos variables (bidimensional).
La población o universo estadístico es el conjunto de elementos que poseen al menos una característica común y sobre los cuales va a incidir el análisis estadístico. El número de elementos de una población es su tamaño (que puede ser finito o no). Si la población es finita lo representaremos por N.
No siempre es posible efectuar el estudio de todos los elementos de una población. En este caso, el estudio se puede limitar a una parte de ese todo: a una muestra. Así, una muestra es un subconjunto de la población.
Los elementos de la población se llaman individuos o unidades estadísticas.
Estudiando muestras finitas representativas se obtienen conclusiones que se pueden aplicar a toda la población. Para que una muestra sea representativa de la población es preciso que el muestreo sea aleatorio , es decir, que cualquier individuo de la población tenga la misma probabilidad de pertenecer a la muestra, en cuyo caso se habla de muestra aleatoria.
Ejemplos
a) En un sondeo de opinión realizado por una empresa para conocer la intención de voto de los habitantes de una ciudad, la población está formada por el conjunto de todos los individuos con derecho a voto. De ella se extraerá un conjunto de personas a las que se entrevistará: éstas forman la muestra. b) Para estudiar la proporción de tornillos defectuosos que produce una fábrica en una semana, se eligen al azar 1000 tornillos. La población la constituyen todos los tornillos fabricados en la semana. La muestra la forman los 1000 tornillos seleccionados.
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
Diremos que una variable estadística es discreta si su campo de variación, esto es, el conjunto de valores que toma la variable, está formado por puntos aislados (en número finito o infinito numerable).
Diremos que una variable estadística es continua si su campo de variación es, al menos teóricamente, un intervalo de la recta real. Dados dos valores cualesquiera de los que toma la variable, siempre existe entre ellos una infinidad de valores que puede tomar.
Ejemplo
Son variables estadísticas discretas: El número de coches fabricados en un año. El número de pacientes atendidos cierto día en un Centro de Salud. El número de ordenadores en cada Instituto de la provincia. Son variables estadísticas continuas: El peso de los alumnos de un Instituto. La estatura de los mismos alumnos. Las temperaturas registradas en un observatorio cada hora.
En la práctica, aunque una variable sea continua, cuando la medimos la estamos haciendo discreta, dada la limitación de los instrumentos de medida. No obstante, al clasificar las variables lo que hacemos es atender a su naturaleza, y no a los resultados obtenidos de la medición.
Atendiendo al número de caracteres cuantitativos que observamos en cada individuo, las variables pueden ser unidimensionales , bidimensionales , tridimensionales , ..., según se estudie en cada individuo de la población uno, dos, tres, ..., caracteres, respectivamente.
En este tema nos dedicaremos al estudio de las variables estadísticas unidimensionales y, en el siguiente, a las bidimensionales.
En el siguiente esquema se resumen los conceptos anteriores:
Caracteres Estadísticos
Cuantitativos (Variables Estadísticas)
Discretas : valores aislados
Continuas : valores en un intervalo de la recta real.
Cualitativos (Atributos)
Consideremos una población o muestra que consta de N individuos. Sea k el número de modalidades definidas para un determinado carácter. Tendremos entonces las modalidades M 1 , M 2 , ..., Mk.
Se llama frecuencia absoluta, ni, de la modalidad Mi, al número de individuos de la población que pertenecen a dicha modalidad (el número de veces que se repite). Como
las modalidades son incompatibles y exhaustivas, se tiene que
n i i 1
n
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
Se llama frecuencia relativa , fi, de la modalidad Mi, a la proporción de individuos de la población que presentan dicha modalidad. Es decir, si el número total de individuos es
N, entonces: i i n f N
(^) y por tanto 0 fi 1
Llamaremos frecuencia absoluta acumulada , Ni, de la modalidad Mi, a la suma de las frecuencias absolutas hasta la i-ésima modalidad. Es decir:
Ni = n 1 + n 2 + ... + ni =
i r r 1
n
Llamaremos frecuencia relativa acumulada , Fi, de la modalidad Mi, a la suma de las frecuencias relativas hasta la de la i-ésima modalidad. Es decir:
Fi = f 1 + f 2 + ... + fi =
i r r 1
f
Los datos observados de una población se muestran clasificados y ordenados para dar mayor claridad y ofrecer una visión global del conjunto, que sea interpretable. Las dos formas de representación, que suponen los dos primeros pasos que hay que dar en el tratamiento estadístico de la información, son las tablas estadísticas y las representaciones gráficas.
Las tablas más simples son las que constan de una primera columna en la que se reflejan las distintas modalidades que presenta el carácter en estudio. Se añaden una o más columnas a su derecha en las que se anotan las respectivas frecuencias y otras más para cálculos posteriores.
El aspecto general de una tabla simple, para un carácter con k modalidades, es la siguiente:
Modalidades Mi
Frecuencias absolutas ordinarias ni
Frecuencias absolutas acumuladas Ni
Frecuencias relativas ordinarias fi
Frecuencias relativas acumuladas Fi M 1 n 1 N 1 f 1 F 1 M 2 n 2 N 2 f 2 F 2 ... ... ... ... ... Mi ni Ni fi F 1 ... ... … … … Mk nk Nk = N fk Fk = 1 N 1
Observemos que:
La suma de todas las frecuencias absolutas ordinarias ha de coincidir con el número
total de individuos de la población, es decir, con el tamaño N:
n i i 1
n
La suma de todas las frecuencias relativas ordinarias ha de ser 1, ya que representa
la suma de todas las proporciones:
n i i 1
f
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
En el caso continuo, o en el discreto con un gran número de datos, la población se particiona en clases o intervalos. Es decir, los datos se clasifican en intervalos de la recta real ( “El número de clases debe ser aproximadamente igual a la raíz cuadrada del número de datos” ), dando lugar a datos agrupados en intervalos:
(e0, e 1 ] (e 1 , e 2 ] ... (ei– 1 , ei] ... (ek– 1 , ek]
Clase 1ª Clase 2ª ... Clase i-ésima ... Clase última (k-ésima)
En las clases o intervalos tendremos en cuenta los siguientes conceptos:
Extremos de clase : dada la clase i-ésima (ei– 1 , ei], a ei– 1 lo llamaremos límite inferior y a ei límite superior.
Amplitud de clase : llamaremos amplitud de la clase i-ésima (ei– 1 , ei] a la longitud del intervalo, es decir, al número ai = ei – ei– 1
Marcas de clase : son los puntos medios de las clases o intervalos. En el caso de la
clase i-ésima (ei– 1 , ei], la marca de clase es xi = i 1^ i e e 2
Hemos de tener en cuenta las siguientes observaciones:
Las amplitudes de las clases no tienen por qué ser iguales. No obstante, si podemos elegir, es cómodo tomar todas las clases con la misma amplitud. Esto habrá que tenerlo muy en cuenta a la hora delas representaciones gráficas: histogramas de frecuencias.
Más aún, las clases primera y última pueden ser intervalos no acotados, de amplitud infinita. Lo que se pretende con esto es recoger los casos muy extremos, “raros”, que se pudieran dar.
En resumen, en el caso de las variables estadísticas continuas, o discretas con datos agrupados (tratamiento continuo por ser muy grande el número de datos), la distribución de frecuencias es un conjunto de la forma:
{(I 1 , n 1 ), (I 2 , n 2 ), ..., (Ii, ni), ..., (Ik, nk)} (en el caso de frecuencias absolutas)
o bien:
{(I 1 , f 1 ), (I 2 , f 2 ), ..., (Ii, fi), ..., (Ik, fk)} (en el caso de frecuencias relativas)
donde:
Ii = (ei– 1 , ei] = {xi / ei– 1 < x ei} es la clase i-ésima.
Las clases primera y última pueden ser de la forma:
o I 1 = (–, e 1 ] = {x / x e 1 } o Ik = (ek– 1 , +) = {x / ek– 1 < x}
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
Las edades de las personas que acuden a un médico a lo largo de un mes son:
3 2 11 13 4 3 2 4 5 6 7 3
4 5 3 2 5 6 27 15 4 21 14 4
3 6 29 13 6 17 6 13 6 5 12 26
Construir la correspondiente tabla de frecuencias agrupando los datos en clases o intervalos de amplitud 5.
Clases Ii
Marcas de clase xi
ni Ni fi Fi
Observemos que se trata de una variable estadística discreta a la que, por haber un número grande de datos, se trata como continua agrupando los datos en intervalos.
Aunque las tablas de frecuencias contienen información suficiente para permitir el análisis de los datos, comúnmente se recurre a su representación gráfica con el objetivo de obtener una mejor idea del comportamiento de los datos.
Según sea el carácter estudiado, se emplean distintos tipos de representaciones gráficas o diagramas:
Carácter cualitativo (atributo)
Diagrama rectangular. Diagrama de sectores. Pictogramas. Cartogramas. Pirámides de población.
Carácter cuantitativo (variable estadística)
Variable discreta ^ Diagrama de barras. Función de distribución.
Variable continua ^ Histograma. Función de distribución.
En este tema veremos los diagramas rectangulares y de sectores para caracteres cualitativos y los diagramas de barras e histogramas para los cuantitativos.
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
Mi ni fi pi (%)^ i (º) Muy Deficiente 0 0/32 = 0,0000 0,00 0, Insuficiente 5 5/32 = 0,15625 15,625 56, Suficiente 6 6/32 = 0,1875 18,75 67, Bien 4 4/32 = 0,1250 12,50 45, Notable 12 12/32 = 0,3750 37,50 135, Sobresaliente 5 5/32 = 0,15625 15,625 56, N = 32 32/32 = 1 100,00 360,
Se llama así la representación gráfica de frecuencias de una variable estadística discreta (carácter cuantitativo discreto) obtenida de la forma siguiente:
Sobre el eje de abscisas se marca cada uno de los valores de la variable en una escala aritmética (divisiones iguales).
Sobre el eje de ordenadas se lleva a cabo una graduación aritmética que permita representar las frecuencias absolutas o relativas (si se van a hacer comparaciones mejor relativas).
Sobre cada punto del eje de abscisas, correspondiente a un valor de la variable, se levanta una barra de altura proporcional a la frecuencia de dicho valor.
Es un diagrama similar al diagrama rectangular para caracteres cualitativos.
Por ejemplo, consideremos una población formada por 1000 lotes de ciertas piezas mecánicas. El carácter (cuantitativo) que se observa en cada unidad estadística es el número de piezas defectuosas que contiene: 0, 1, 2, 3, 4, 5 ó 6 (estas son las modalidades, los valores de la variable discreta en cuestión).
MDF 0% INS 16%
SUF 19%
BIEN 12%
NOT 37%
SOB 16%
(Carácter cualitativo-ordinal)
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
Las frecuencias vienen dadas en la siguiente tabla:
Número de piezas defectuosas por lote xi 0 1 2 3 4 5 6 Número de lotes con xi piezas defectuosas ni 300 365 214 83 23 7 8 1000 Frecuencias acumuladas Ni 300 665 879 962 985 992 1000
Cambiando frecuencias absolutas ordinarias, ni, por frecuencias absolutas acumuladas Ni, tendríamos el diagrama de barras acumulativo.
0
50
100
150
200
250
300
350
400
1 2 3 4 5 6 7
ni: frecuencias absolutas
xi: número de piezas defectuosas
(Variable estadística discreta)
0
200
400
600
800
1000
1200
1 2 3 4 5 6 7
Ni: frecuencias absolutas acumuladas^ xi: número de piezas defectuosas
(Variable estadística discreta)
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
Uniendo el vértice superior izquierdo o los puntos medios de los techos de los rectángulos, se obtiene una línea poligonal que encierra sobre el eje X un área igual a la que encierran los rectángulos. Tal línea es el polígono de frecuencias.
Hasta ahora hemos tratado y representado gráficamente las distribuciones de frecuencias según un carácter. Con ello tenemos una primera aproximación al conocimiento de las mismas.
Ahora daremos un conjunto de medidas descriptivas que resuman cuantitativamente, de modo sucinto y significativo, las características más importantes de una distribución. Esto nos permitirá comparar distintas distribuciones.
Por ejemplo, si se desea comparar las temperaturas de Granada y Ciudad Real a lo largo de un año, sería mejor disponer de unos pocos números que representaran de forma resumida a cada una de las provincias que comparar las temperaturas de todos y cada uno de los días del año. Lo único que hay que hacer es tomar esos números de modo que sean representativos de todo el grupo; es decir, unos valores que representen o resuman a toda la población. Estos números se llaman parámetros estadísticos o, simplemente, estadísticos. En nuestro ejemplo se suele recurrir a la temperatura media de las máximas y a la temperatura media de las mínimas.
Las medidas o estadísticos de centralización, o de tendencia central, nos indican los punto en torno a los cuales se encuentran los valores de la variable estadística en estudio; es decir, nos indican los puntos centrales de una distribución. Representan el conjunto de los datos mediante un solo valor numérico, tratando de resumir y sintetizar la distribución de frecuencias. Las medidas de posición central más utilizadas son la mediana, la moda y la media aritmética.
0
100
200
300
400
500
600
700
800
900
(0, 4] (4, 8] (8, 12] (12, 16] (16, 20] (20, 24]
Frecuencias absolutas (ni)
Recorrido anual (en miles de Km)
Variable continua (amplitudes iguales)
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
Mediana
Sea X una variable estadística (carácter cuantitativo) de una población o muestra con N individuos.
Se llama mediana a un valor, representado por Me, tal que, ordenados los N valores de X en orden creciente, el 50% de ellos son menores o iguales que Me y el 50% restante son mayores o iguales que Me.
Para determinar la mediana los haremos en el caso discreto y continuo.
Caso discreto
Consideraremos la siguiente distribución de frecuencias que nos servirá de ejemplo: xi ni Ni fi Fi 3 1 1 1/9 1/ 4 2 3 2/9 3/ 5 1 4 1/9 4/ 6 1 5 1/9 5/ 7 3 8 3/9 8/ 8 0 8 0 8/ 9 0 8 0 8/ 10 1 9 1/9 9/9 = 1 N = 9 1 Podemos proceder de dos formas: Directamente sobre los datos : ordenamos los datos sin agrupar; es decir, repitiendo cada uno tantas veces como indique su frecuencias absoluta. 3 4 4 5 6 7 7 7 10 Me En este caso, N = 9 es impar y la mediana es el valor central: Me = 6 deja a la mitad de individuos por encima y a la otra mitad por debajo. A partir de la tabla de frecuencias : observamos en la columna de las frecuencias absolutas acumuladas donde se encuentra el valor N/2. Este dejará por encima la frecuencia absoluta acumulada Ni y por debajo la frecuencia absoluta acumulada Ni+1. La mediana es el valor de la variable que se encuentra inmediatamente por debajo de esta posición, es decir, xi+1. En nuestro ejemplo N/2 = 4,5 y por tanto Me = 6. Observa la tabla: xi ni Ni fi Fi 3 1 1 1/9 1/ 4 2 3 2/9 3/ 5 = xi 1 4 = Ni 1/9 4/ 4, 6 1 5 = Ni+1 1/9 5/ 7 3 8 3/9 8/ 8 0 8 0 8/ 9 0 8 0 8/ 10 1 9 1/9 9/9 = 1 N = 9 1
Me = xi+
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
Me =
i 1 i 1 i i i 1
e 2 a N N
donde ei– 1 es el límite inferior del intervalo mediano, ai es la amplitud del intervalo mediano, Ni– 1 es la frecuencia absoluta acumulada que se encuentra inmediatamente por encima del intervalo mediano, Ni es la frecuencia absoluta acumulada correspondiente al intervalo mediano y N es el número de individuos de la población.
En nuestro ejemplo: Me =
i 1 i 1 i i i 1
e 2 a N N
Moda
Caso discreto
Dada una variable estadística discreta X con distribución de frecuencias
{(x 1 , n 1 ), (x 2 , n 2 ), ..., (xi, ni), ..., (xk, nk)}
se llama moda , y se representa por Mo, a la modalidad que presenta una frecuencia máxima. En el diagrama de barras es la modalidad a la que corresponde la barra más alta. Una distribución puede tener, pues, más de una moda, en el caso de que la frecuencia más alta corresponda a más de una modalidad.
Si consideramos el ejemplo de las páginas 132 y 133:
Número de piezas defectuosas por lote xi^
Número de lotes con xi piezas defectuosas ni^300 365^214 83 23 7 8 1000
El valor que se presenta con más frecuencia es el 1 (365 veces). Por tanto Mo = 1.
Caso continuo Dada una variable estadística continua X con distribución de frecuencias
{(I 1 , n 1 ), (I 2 , n 2 ), ..., (Ii, ni), ..., (Ik, nk)}
se llama clase o intervalo modal al intervalo que presenta una “mayor densidad de frecuencia”. En el histograma es al que le corresponde el rectángulo de mayor altura.
En el ejemplo de la página 134:
Kilometraje anual (en miles de kilómetros)
Número de vehículos
(ei– 1 , ei] ni (0, 4] 228 (4, 8] 634 (8, 12] 821 (12, 16] 475 (16, 20] 233 (20, 24] 87 N = 2478
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
La clase o intervalo modal es, en este caso, (8, 12] pues es la que se presenta en un mayor número de ocasiones (821).
Si queremos especificar más concretamente a que valor de la variable le atribuimos el papel de moda, aplicaremos la siguiente fórmula:
Mo = i 1 i^ i 1 i i i 1 i i 1
n n e a (n n ) (n n )
donde ei– 1 es el límite inferior de la clase modal, ni es la frecuencia absoluta correspondiente al intervalo modal, ni– 1 es la frecuencia absoluta inmediatamente anterior a ni, ni+1 es la frecuencia absoluta inmediatamente posterior a ni y ai es la amplitud de la clase modal.
En nuestro ejemplo Mo = 8 +
Si llamamos 1 = ni – ni– 1 (exceso de la clase modal sobre la clase contigua anterior) y 2 = ni – ni+1 (exceso de la clase modal sobre la clase contigua posterior), la fórmula anterior se convierte en:
Mo = i 1 1 i 1 2
e (^) a
En el ejemplo 1 = 821 – 634 = 187 y 2 = 821 – 475 = 346, y entonces se tiene que
Mo = 8 +
Observaciones:
Cuando una distribución presenta varios máximos locales, bien en el diagrama de barras (caso discreto) o bien en el histograma (caso continuo), se habla de una distribución multimodal. Cuando la clase modal sea una clase extrema, la primera o la última, se supone que la clase anterior o la posterior, respectivamente, es de frecuencia nula.
Media aritmética
Caso discreto
Sea X una variable estadística discreta de una población finita de tamaño N y sean x 1 , x 2 , ..., xN los N valores observados de X.
La media aritmética , o simplemente media , de esos N valores es:
x =
N i 1 2 N i 1
x x x ... x N N
Si de esos N valores sólo hay k distintos x 1 , x 2 , ..., xk, que se repiten, respectivamente, n 1 , n 2 , ..., nk veces (sus frecuencias absolutas), entonces podemos escribir:
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
Para la clase extrema (500, ) se podrían adoptar diversos convenios. Hemos adoptado el de asignarle la misma amplitud que a la anterior.
La media es, por tanto: (^) x=
6 i i i 1
n x
N
Son una generalización de la mediana. En general, sirven para determinar en qué posición de la distribución se encuentra un individuo, supuestos ordenas en orden creciente.
Sea X una variable estadística (discreta o continua) sobre una población finita de tamaño N, y sea t un número real tal que 0 < t < 1.
Se llama cuantil de orden t al valor Ct tal que t·N individuos de la población son tales que X Ct y los (1 – t)·N individuos restantes son tales que X Ct. Dicho de otro modo, el 100t % de los individuos se encuentra por debajo del cuantil Ct y el 100(1 – t) % de individuos restante se encuentra por encima del cuantil Ct.
Si t = 0,5, entonces C0,5 = Me (la mediana). Si para un individuo ocurre que X Me, tal individuo está en la primera mitad de la población ordenada.
La interpretación de los cuantiles y las circunstancias que se pueden dar en su determinación, según los casos, son exactamente las mismas que para la mediana.
En el caso discreto, bien a partir de los datos sin agrupar o bien a partir de la distribución de frecuencias absolutas tomando como referencia el valor tN para mirar en la columna de frecuencias absolutas acumuladas. En el ejemplo de variable discreta al final de este apartado se verá con toda claridad.
Para el caso continuo, con los datos agrupados en intervalos, existe una fórmula análoga a la de la mediana para el cuantil de orden t:
Ct = i 1 i 1 i i i 1
tN N e a N N
Los cuantiles se estudian en grupos que dividen a la población en un cierto número de partes iguales, ordenados los individuos por el valor de la variable en orden creciente.
Según el número de partes en que dividen a la población reciben distintos nombre:
Cuartiles
Dividen a la población en cuatro partes, cada una de las cuales contiene al 25% de las observaciones. Los cuartiles son:
Primer cuartil: Q 1 = C1/4 (t = 1/4 = 0,25) Segundo cuartil: Q 2 = C1/2 = Me (t = 1/2 = 0,5) Tercer cuartil: Q 3 = C3/4 (t = 3/4 = 0,75)
En el caso continuo, una vez determinado el intervalo (ei– 1 , ei] que contiene a Qk, de frecuencia absoluta acumulada Nk, las fórmulas para los tres cuartiles son:
Matemáticas aplicadas a las Ciencias Sociales I Tema 8: Estadística en una variable
i 1 i 1 i i i 1
e 4 a N N
i 1 i 1 i i i 1
e 2 a N N
= Me
i 1 i 1 i i i 1
e 4 a N N
Es conveniente observar que los cuartiles no tienen por qué estar unos a la misma distancia de otros: lo que han de verificar es que entre cada dos consecutivos esté el 25% de la población:
25 % 25 % 25 % 25 %
e 0 Q 1 Q 2 = Me Q 3 ek
Deciles
Dividen a la población en diez partes, cada una de las cuales contiene al 10% de las observaciones. Los deciles son:
Primer decil: D 1 = C1/10 (t = 0,10) Segundo decil: D 2 = C2/10 (t = 0,20) …………………………………………………… Quinto decil: D 5 = C5/10 = Q 2 = Me (t = 0,50) …………………………………………………… Noveno decil: D 9 = C9/10 (t = 0,90)
La forma de calcularlos es la misma de antes:
i 1 i 1 i i i 1
e 10 a N N
Centiles o percentiles
Dividen a la población en cien partes, cada una de las cuales contiene al 1% de ella. Los percentiles son:
P 1 = C1/100 (t = 0,01) …………………………………….. P 25 = C25/100 = Q 1 (t = 0,25) …………………………………….. P 50 = C50/100 = Q 2 = Me (t = 0,50) …………………………………….. P 75 = C75/100 = Q 3 (t = 0,75) …………………………………….. P 99 = C99/100 (t = 0,99)