Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Estadístico de Distribución de Frecuencias: Ejemplos y Propiedades - Prof. 9937, Apuntes de Estadística

Conceptos básicos de análisis estadístico de distribución de frecuencias, incluyendo ejemplos con datos agrupados y desagrupados, y propiedades de media aritmética, moda, varianza y desviación típica.

Tipo: Apuntes

2016/2017

Subido el 06/06/2017

beatriz_carrion
beatriz_carrion 🇪🇸

5

(1)

6 documentos

1 / 40

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
ESTADÍSTICA I
TEMA 1.- ANÁLISIS DE UNA VARIABLE
1.1. INTRODUCCIÓN.
1.2. CONCEPTOS BÁSICOS.
1.3. MEDIDAS DE TENDENCIA CENTRAL.
1.4. MEDIDAS DE DISPERSIÓN.
1.5. MEDIDA DE FORMA: ASIMETRÍA Y CURTOSIS.
1.6. MEDIDAS DE DESIGUALDAD.
1.1. INTRODUCCIÓN
estadística (en minúscula): Es una colección de datos numéricos
presentados de manera ordenada y sistemática.
Acepciones de la palabra
Estadística Estadística: Ciencia que estudia la realidad utilizando grandes
conjuntos de datos, obteniendo las regularidades que se presentan
para describir su comportamiento y predecir su evolución futura.
* Estadística y Economía: La Estadística aporta instrumentos que permiten analizar y verificar las
hipótesis que se establecen sobre un determinado comportamiento económico o social.
1.2. CONCEPTOS BÁSICOS
Población: Colectivo de individuos o elementos que poseen ciertas características
comunes y que son el objeto de la observación y estudio estadístico. Ejemplos:
Hoteles de la Costa del Sol, Centros de salud de Málaga.
Definiciones. Elemento: Cada uno de los entes o fenómenos que integran la población. Ejemplos:
Cada uno de los hoteles de la Costa del Sol, cada uno de los Centros de Salud de
Málaga.
Caracteres: Propiedades, rasgos o cualidades que presentan los elementos de una
población.
Cualitativos o atributos
Discretos
Tipos de caracteres Cuantitativos
o variables Continuos
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28

Vista previa parcial del texto

¡Descarga Análisis Estadístico de Distribución de Frecuencias: Ejemplos y Propiedades - Prof. 9937 y más Apuntes en PDF de Estadística solo en Docsity!

ESTADÍSTICA I

TEMA 1.- ANÁLISIS DE UNA VARIABLE

1.1. INTRODUCCIÓN.

1.2. CONCEPTOS BÁSICOS.

1.3. MEDIDAS DE TENDENCIA CENTRAL.

1.4. MEDIDAS DE DISPERSIÓN.

1.5. MEDIDA DE FORMA: ASIMETRÍA Y CURTOSIS.

1.6. MEDIDAS DE DESIGUALDAD.

1.1. INTRODUCCIÓN

estadística (en minúscula) : Es una colección de datos numéricos presentados de manera ordenada y sistemática. Acepciones de la palabra Estadística Estadística : Ciencia que estudia la realidad utilizando grandes conjuntos de datos, obteniendo las regularidades que se presentan para describir su comportamiento y predecir su evolución futura.

  • Estadística y Economía: La Estadística aporta instrumentos que permiten analizar y verificar las hipótesis que se establecen sobre un determinado comportamiento económico o social.

1.2. CONCEPTOS BÁSICOS

Población : Colectivo de individuos o elementos que poseen ciertas características comunes y que son el objeto de la observación y estudio estadístico. Ejemplos: Hoteles de la Costa del Sol, Centros de salud de Málaga.

Definiciones. Elemento : Cada uno de los entes o fenómenos que integran la población. Ejemplos: Cada uno de los hoteles de la Costa del Sol, cada uno de los Centros de Salud de Málaga. Caracteres : Propiedades, rasgos o cualidades que presentan los elementos de una población.

Cualitativos o atributos

Discretos Tipos de caracteres Cuantitativos o variables Continuos

Atributos : Son caracteres cualitativos. Las diferentes categorías que presente un atributo se llamarán modalidades. Las modalidades deben ser exhaustivas y mutuamente excluyentes. A veces pueden medirse mediante una escala nominal u ordinal. Escala nominal: Cuyos valores numéricos representan una categoría e identifican un grupo de pertenencia. La asignación de los valores se realiza en forma aleatoria porque NO cuenta con un orden lógico. Ejemplos, los dorsales de los atletas, nacionalidad, religión, etc. Escala ordinal : Cuyos valores numéricos representan una categoría o identifican un grupo de pertenencia contando con un orden lógico. Podemos identificar si una categoría es mayor o menor que otra. Ejemplos: la escala de Mohs (dureza de los minerales), grado de satisfacción, calidad de servicios, etc. Tipos de caracteres Variables : Son caracteres cuantitativos. (Las variables pueden expresarse en forma de atributo). La medición de una variable da lugar a un valor. Pueden medirse mediante una escala de intervalo o de razón.

Variables discretas : Las que sólo pueden tomar determinados valores y no un valor intermedio entre dos de aquellos (el número de valores es finito o infinito Tipos de numerable). Ejemplos: Número de contratos firmados, variables número de quejas recibidas, número de errores en una cadena de producción.

Variables continuas : Las variables pueden tomar infinitos valores dentro de un intervalo. Ejemplos: Renta, salario.

Observación exhaustiva : Se observan todos los elementos de la población. No hay error muestral pero supone un elevado coste.

Observación parcial : Sólo se observa una parte de la población. Subpoblación : Subconjunto de elementos de la población que presentan una cierta característica que los diferencia de los demás. No es representativa de la población. Muestra : Subconjunto de elementos de la población que Formas de Formas de no presentan una característica que los diferencie de los observación observación parcial demás sino que pretenden representar a toda la población. Se podría decir que es una población de tamaño reducido. Muestreo aleatorio : Elementos elegidos al azar. Todos los elementos de la población tienen la misma probabilidad de estar en la muestra. Muestreo no aleatorio (opinático).

Observación mixta: Ciertos caracteres que se consideran importantes se estudian de forma exhaustiva y otros mediante una muestra.

*Error muestral : El que se produce por el hecho de estudiar una característica en la muestra en lugar de en la población: los resultados sólo pueden ser aproximaciones a los resultados que se tendrían si se analizaran todos los elementos de la población.

  • Frecuencia relativa : La frecuencia relativa fi es la proporción de observaciones que presentan el valor xi. Se calcula como el cociente entre la frecuencia absoluta ni y el número total de

observaciones, N, es decir, N

n f (^) i = i 0 ≤ f (^) i ≤ (^11) 1

∑^ =

=

k i

fi

  • Frecuencia relativa porcentual : La frecuencia relativa porcentual pi es el porcentaje de observaciones que presentan el valor xi. Para su cálculo se multiplican las frecuencias relativas por 100: pi = fi * 100.La suma de todas las frecuencias relativas porcentuales es igual a 100. 100 1

∑^ =

=

k

i

pi

  • Frecuencias acumuladas : el resultado de acumular (sumar) todas las frecuencias observadas para valores menores o iguales al valor concreto para el que se busca la frecuencia acumulada. Hay frecuencias absolutas acumuladas , denominadas Ni, frecuencias relativas acumuladas , denominadas Fi, y frecuencias relativas porcentuales acumuladas , denominadas Pi.

Distribución de frecuencias (datos no agrupados) Valores de la variable

x i

Frecuencias absolutas

n i

Frecuencias relativas

f i = ni / N

Frecuencias relativas porcentuales

pi = fi ⋅ 100

Frecuencias absolutas acumuladas

N i

Frecuencias relativas acumuladas

F i

Frecuencias relativas porcentuales acumuladas

P i

x 1 n 1 f 1 p 1 N 1 = n 1 F 1 = f 1 P 1 = p 1

x 2 n 2^ f^ 2 p 2^ N^ 2 =^ N 1 + n 2 F 2^ =^ F 1 + f 2 P 2^ = P 1 + p 2

M M M M M M M

x i ni f (^) i pi N (^) i = Ni − 1 + ni Fi = Fi − 1 + fi Pi = Pi − 1 + pi

M M M M M M M

x k nk f k pk Nk = N Fk = 1 Pk = 100

n N

k

i

∑ i^ =

= 1

1

∑^ =

=

k

i

f i 100

1

∑^ =

=

k

i

pi

Las distribuciones de frecuencias absolutas se conocen como estadísticas primarias , por obtenerse directamente de la observación de un carácter. Las distribuciones de frecuencias relativas o acumuladas se conocen como estadísticas derivadas.

Las distribuciones de frecuencias relativas sirven para comparar correctamente dos distribuciones distintas.

Ejemplo: Distribución de frecuencias para datos no agrupados Variable xi^ ni N

ni fi = pi = fi *100 Ni N

N

Fi = i Pi = Fi*

3 20 0,22 22 20 0,22 22 4 25 0,28 28 45 0,50 50 5 14 0,16 16 59 0,66 66 6 12 0,13 13 71 0,79 79 9 10 0,11 11 81 0,90 90 10 9 0,10 10 90 1 100 90 1 100

En las estadísticas con datos agrupados en intervalos , se produce una agrupación en intervalos, del tipo (Li-1-Li]. (Por convenio, se trata de intervalos abiertos por la izquierda y cerrados por la derecha, es decir, en cada intervalo quedan excluidos los valores iguales al extremo inferior Li-1 e incluidos los iguales al extremo superior Li). El único que difiere es el primer intervalo, que es cerrado por la izquierda y por la derecha, [L 0 -L 1 ], quedando incluidos en él tanto el limite inferior como el superior).

En distribuciones con agrupación en intervalos nos encontramos con otros conceptos adicionales:

  • Amplitud del intervalo : Es la diferencia entre el extremo superior y el inferior del mismo. Se

representa por ai. Para el intervalo i-ésimo sería: ai = Li − Li − 1.

  • Marca de clase : Es el punto central de cada intervalo. Se suele representar por xi. Para el

intervalo i-ésimo sería: 2

xi = Li +^ Li −^1

  • Densidad de frecuencia : Si las amplitudes de los intervalos son distintas, es necesario calcular las densidades de frecuencia, que son el resultado de dividir las frecuencias absolutas

por la amplitud del intervalo. Se denota por hi..

i

i i (^) a

n h =

  • Error de agrupamiento : Error debido a la pérdida de información provocada al incluir un conjunto de observaciones en un intervalo, con la correspondiente pérdida de información.

Ejercicios

  1. En las familias de un edificio se observa el número de personas ocupadas. Los resultados de la observación son:

Nº personas ocupadas Nº familias 1 6 2 8 3 4 4 2

a) Cuál es la población → Las familias de un edificio b) Elementos → Cada una de las familias c) Tamaño de la población → N = 20 familias d) Cuál la variable de interés → Número de personas ocupadas e) Tipo de variable → Variable discreta f) Diga si es una distribución de datos agrupados o no agrupados→ Es de datos no agrupados g) Calcule todas la frecuencias

xi ni fi pi Ni Fi Pi 1 6 0,3 30 6 0,3 30 2 8 0,4 40 14 0,7 70 3 4 0,2 20 18 0,9 90 4 2 0,1 10 20 1 100 Total 20 1 100

  1. A continuación, se presenta la distribución los trabajadores de una empresa, según su salario/hora en euros. Salario/hora (Euros) Nº empleados 6-16 55 16-20 47 20-24 32 24-34 26

a) Cuál es la población → Trabajadores de una empresa b) Elementos → Cada uno de los trabajadores c) Cuál la variable de interés → Salario/hora en euros d) Tipo de variable → Variable continua e) Diga si es una distribución de datos agrupados o no agrupados → Es de datos agrupados f) Calcule todas las frecuencias, las marcas de clase, las amplitudes de los intervalos y las densidades de frecuencia.

Li-1-Li ni xi ai hi fi pi Ni Fi Pi 6-16 55 11 10 5,5 0,34 34 55 0,34 34 16-20 47 18 4 11,75 0,30 30 102 0,64 64 20-24 32 22 4 8 0,20 20 134 0,84 84 24-34 26 29 10 2,6 0,16 16 160 1 100 Total 160 1 100

REPRESENTACIONES GRÁFICAS.

Representaciones gráficas para variables:

Datos sin agrupar:

Diagrama de barras: frecuencias absolutas o relativas, pero NO acumuladas. Se utiliza un diagrama cartesiano: en el eje de abscisas se ponen los valores de la variable y en el de ordenadas las frecuencias, absolutas o relativas, pero sin acumular. En cada valor de la variable se eleva un segmento de altura igual a la frecuencia que le corresponde.

Ejemplo

Diagrama en escalera: frecuencias absolutas o relativas acumuladas.

Se utiliza un diagrama cartesiano: en el eje de abscisas se sitúan los valores de la variable

y en el de ordenadas las frecuencias acumuladas (absolutas o relativas). En cada valor de

la variable se dibuja una línea horizontal (paralela al eje de abscisas) a la altura de su

frecuencia acumulada correspondiente, que va hasta el siguiente valor de la variable. A

partir del último valor de la variable se prolonga una paralela al eje de abscisas hacia la

derecha, a la altura de la última frecuencia acumulada, y a partir del menor valor de la

variable se prolonga un trazo horizontal sobre el eje de abscisas hacia la izquierda,

indicando que no hay acumulación de observaciones antes del menor valor ni después del

mayor valor observado.

Ejemplo

Variable xi

ni

N

n

f i = i

Variable xi

ni Ni

18 1 1 19 2 3 20 3 6 21 4 10 10

Polígono de frecuencias acumuladas : Representación gráfica de una variable agrupada en intervalos. A diferencia del histograma, se representan las frecuencias acumuladas (relativas o absolutas). En el eje horizontal se representan los límites de los intervalos y en el de ordenadas las frecuencias acumuladas, absolutas o relativas. En el extremo superior de cada intervalo se marca como coordenada vertical la frecuencia acumulada correspondiente, uniendo a continuación dichas ordenadas. Al extremo inferior del primer intervalo le corresponde una coordenada vertical de 0. A partir del extremo superior del último intervalo se prolonga una paralela al eje de abscisas hacia la derecha, a la altura de la ultima frecuencia acumulada y a partir del extremo inferior del primer intervalo se prolonga un trazo horizontal sobre el eje de abscisas hacia la izquierda, indicando que no hay acumulación de observaciones antes del valor mínimo ni después del valor máximo observado.

Siguiendo con el ejemplo anterior:

Representaciones gráficas para atributos:

Diagrama de sectores: Representación gráfica de un atributo. Para la representación se divide un círculo en tantos sectores como modalidades existan, asignando a cada modalidad del atributo un arco de círculo proporcional a su frecuencia.

Ejemplo

Persona física Sociedad limitada S.A y S. Anónima laboral Sociedad civil Sociedad en cooperativa Otras formas jurídicas

Intervalos Li-1 - Li^ ni^ Li^ Ni 0 - 3 3 3 3 3 – 6 6 6 9 6 – 9 14 9 23 9 – 12 19 12 42 12 - 18 10 18 52 18 - 24 5 24 57 24 -36 2 36 59

Forma jurídica Total Grados Persona física 331.290 206 Sociedad limitada (^) 175.645 109

S.A y S. Anónima laboral 29.624 18 Sociedad civil 20.233 13 Sociedad en cooperativa 8.736 5 Otras formas jurídicas (^) 13.273 8

Total general 578.801 360

Diagrama de rectángulos: Se utiliza un diagrama cartesiano. En el eje de abscisas se ponen las modalidades del atributo y en el de ordenadas las frecuencias, absolutas o relativas. Sobre los atributos se levantan rectángulos de amplitud constante y de altura su frecuencia. (Es muy parecido al diagrama de barras, debido a que la amplitud de la barra no tiene que ver con ninguna medida).

Ejemplo

Fuente: IEA. Directorio de establecimientos con actividad económica en Andalucía. Resumen 2006. Elaboración propia.

Representaciones gráficas para estadísticas mixtas:

Nos centramos en la pirámide de población, que representa simultáneamente una variable (edad) y un atributo (sexo).

Pirámide de Población: Son dos histogramas que se rotan y unen de forma que comparten el eje de ordenadas, sobre el que se representa la variable edad. Uno representa la distribución de frecuencias de los hombres y el otro el de las mujeres. Las diferentes formas que adopta informa sobre la estructura de edad de la población. Por ejemplo, el envejecimiento de la población se ve en pirámides invertidas.

Ejemplo

Fuente: INE, Boletín Últimas Cifras, Septiembre 2006

Forma jurídica Total Persona física 331. Sociedad limitada (^) 175. S.A y S. Anónima laboral (^) 29.

Sociedad civil 20. Sociedad en cooperativa 8. Otras formas jurídicas (^) 13. Total general (^) 578.

Establecimientos Andalucía por forma jurídica 2006

Personafísica Sociedad lilimitada S.A y S. Anónima

Sociedad civil Sociedad cooperativ

Otras formas jurídica

  1. Distribución de frecuencias con datos agrupados

Ventajas: 1.- Utiliza toda la información: hace uso de todos los valores para su cálculo. 2.- Es única. 3.- Es sencilla de calcular y tiene una interpretación intuitiva.

Inconvenientes: 1.- Es muy sensible a los valores extremos de la variable. 2.- En el caso de variable agrupada en intervalos, su valor depende de los intervalos elegidos. 3.- No puede calcularse en distribuciones abiertas (si el límite inferior del primer intervalo o el límite superior del último intervalo están sin determinar), a no ser que se disponga de información adicional.

  • Media aritmética ponderada : valor que resulta de dividir la suma de todas las observaciones, multiplicadas cada una por un peso o ponderación (que expresa la importancia de esa observación) entre la suma de ponderaciones:

=

n

i

i

n

i

i i p w

xw x

1

1

Ejemplo

Las notas del primer ejercicio de selectividad de un alumno junto con sus ponderaciones aparecen en la tabla adjunta:

Salario Euros / hora Intervalos

Número de trabajadores ni

xi xi · ni

64 , 26 euros/hora 54

=^ ∑=^1 =^3.^470 =

N

x n x

k

i

i i

Notas xi

Peso wi^ xi^ · wi

7,5 16,5 123, 4 33,5 134 5,8 25,0 145 7,5 25,0 187, 100 590,

1

1

5 9 0 , 2 5 5, 9 0 2 5 1 0 0

n i i p i n i i

x w x w

=

=

= = =

es la nota final del primer ejercicio

  • Propiedades de la media aritmética

1.- La suma de desviaciones de los valores de la variable respecto a la media vale cero.

1

∑ −^ =

=

i

k

i

xi x n

2.- La media aritmética no varía si todas las frecuencias de la distribución se multiplican o dividen por una constante.

ni = bn i '

x '= x

3.- Cambio de origen: AFECTA. Si a todos los valores de la variable se les suma (o resta) una constante C, la media aritmética queda aumentada (o disminuida) en esa constante.

x (^) i ' = xi + C x '= x + C

4.- Cambio de escala: AFECTA. Si todos los valores de la variable se multiplican (o dividen) por una constante C, la media aritmética queda multiplicada (o dividida) por esa constante.

x (^) i = Cx i '

x '= Cx

5.- Cambio simultáneo de origen y de escala (transformación lineal).

xi = a + bx i '

x '= a + b x

6.- Si de un conjunto de valores se obtienen dos o más subconjuntos disjuntos, puede calcularse la media aritmética de todo el conjunto a partir de las medias aritméticas de cada subconjunto.

=

h

i

x N ni 1

1 1

Conocidos

=+

k

ih

x N ni 1

2 2

1 2

1 1 2 2

N N

Nx Nx

x

Ejemplos

  1. Distribución de frecuencias agrupada con intervalos de igual amplitud

  2. Distribución de frecuencias agrupada con intervalos de distinta amplitud

Ventajas: 1.- Tiene una interpretación y cálculo sencillos. 2.- No está influida por los valores anormalmente grandes o pequeños de la variable. 3.- Puede no importar que los intervalos sean abiertos, si se puede determinar cuál es el intervalo modal y se pueden calcular las alturas de los intervalos adyacentes a éste.

Inconvenientes : 1.- En su determinación no intervienen todos los valores de la variable. 2.- Sólo se debe aplicar en distribuciones con un número elevado de observaciones. 3.- No está definida algebraicamente. 4.- Puede no existir y no tiene por qué ser única. La distribución puede ser bimodal, trimodal, …. Entonces es necesario utilizar otro promedio. 5.- Depende de los intervalos elegidos en el caso de variable agrupada en intervalos. 6.- En ocasiones las distribuciones abiertas, por la indefinición de los límites, puede impedir el cálculo de la moda.

  • Propiedades:

La moda se ve afectada por cambios de origen y cambios de escala.

  • Cambio de origen: x (^) i '^ = xi + C lleva a Mo '= Mo + C
  • Cambio de escala: x (^) i '^ = xiC lleva a Mo '= MoC

Salario Euros / hora Intervalos

Número de trabajadores ni

ai

1 1 1 1

55 10 20 64,1 euros/hora 12 10

i i i i i

Mo L n a n n

− − +

= + =

= + =

Salario Euros / hora Intervalos

Número de trabajadores ni

ai

i i i

n h a

1 1 1 1

0, 35 45 10 50, 38 euros/hora 0, 30 0, 35

i i i i i

h Mo L a h h

− − +

= + =

= + =

MEDIANA.

  • Definición: La mediana es aquel valor de la distribución, una vez ordenada de menor a mayor, que deja a su izquierda y a su derecha el mismo número de observaciones. Tiene, por tanto, la misma unidad de medida que la variable.
  • Cálculo: Importante: en todos los casos, hay que ordenar la variable de menor a mayor 1. - Para distribuciones de datos no agrupados, con todas las frecuencias unitarias se pueden presentar dos casos:

a) Número de observaciones impar: la mediana es el valor central una vez ordenados de menor a mayor. b) Número de observaciones par: la mediana es la semisuma de los dos valores centrales, una vez ordenados éstos de menor a mayor.

Ejemplos:

  1. Número de observaciones impar

  2. Número de observaciones par

Horas de estudio xi

23 26 29 31 32

M e = 29 horasde estudio

Horas de estudio xi

23 26 29 31 32 34

30 horasde estudio 2

e =

M =

Ejemplos:

1 1

(^2 55 22 2240) 55 euros/hora 12

i i i i

N N Me L a n

− −

− (^) − = + = + =

ó bien

1 1

(^2 45 22 910) 55 euros/hora 13

i i i i

N (^) N Me L a n

− −

− (^) − = + = + =

Ventajas: 1.- Es única. 2.- La mediana no se ve influida por los valores extremos de la variable, ya que no depende de los valores de la variable, sino del orden de los mismos. Por ello, su uso es más adecuado que la media aritmética en distribuciones campaniformes fuertemente asimétricas, o distribuciones con forma de L o de J. 3.- En caso de intervalos abiertos, puede calcularse sin problema ya que en su cálculo no intervienen los valores extremos, sino tan sólo se hace uso del intervalo mediano.

Inconvenientes: 1.- En su determinación no intervienen todos los valores de la variable, sólo es preciso saber el valor de la observación central. 2.- No es adaptable al cálculo algebraico. 3.- En el caso de distribuciones agrupadas en intervalos, su valor depende de los intervalos elegidos.

Salario Euros / hora Intervalos

Número de trabajadores ni

Ni

N

1 1

2

55 27 2120 63, 57 euros/hora 14

i i i i

N (^) N Me L a n

− −

− = + =

= + − =

Salario Euros / hora Intervalos

Número de trabajadores ni

Ni

N

(al coincidir N/2 con un valor de Ni puede calcularse la mediana con ese intervalo o con el siguiente)

  • Propiedades:

La mediana se ve afectada por cambios de origen y cambios de escala.

  • Cambio de origen: x (^) i '^ = xi + C lleva a Me '= Me + C
  • Cambio de escala: x (^) i '^ = xiC lleva a Me '= MeC

Visión conjunta de los promedios:

  • En distribuciones campaniformes y simétricas los tres promedios: media aritmética, mediana y moda son adecuados, pero es preferible la media aritmética por sus propiedades algebraicas y por su estabilidad en el muestreo.
  • En distribuciones campaniformes fuertemente asimétricas y distribuciones con forma de J ó L, el promedio más adecuado es la mediana.
  • Si la distribución tiene forma de U, los tres promedios tienen poca fuerza representativa.
  • La moda es el único promedio que puede obtenerse para distribuciones de atributos.

PERCENTILES.

  • Definición: Son noventa y nueve valores de la distribución, que, ordenada ésta en orden creciente de las observaciones, la dividen en cien intervalos, dentro de los cuales se encuentra el 1% de los valores de la distribución.
  • Llamamos percentil j, con j = 1,…, 99 al valor numérico de la variable que deja por debajo de sí el j% de las observaciones.
  • Su cálculo es idéntico que para la mediana con la única diferencia que en lugar de utilizar N/2 se usará N/100, 2N/100, …, ó 99N/100 según corresponda.

Ejemplo:

  • Para distribuciones con datos agrupados: Se busca el intervalo cuya frecuencia absoluta acumulada sea mayor o igual que jN/100 y se calcula mediante la siguiente fórmula:

i i

i j i n a

N

jN

P L

1 1

= + con j = 1, 2…

Número de personas ocupadas xi

Número de familias ni

Ni

Total 20

⋅ N

P 12 (^) =1 persona ocupadas

⋅ N

P 67 (^) =2 personas ocupadas