










Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: estadistica, Profesor: Joaquin Joaquin, Carrera: Economía, Universidad: UAM
Tipo: Apuntes
1 / 18
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!











3 3. Momentos potencialesMomentos potenciales
Parámetro : es una cantidad numérica calculada sobre
Estadístico : es una cantidad numérica calculada sobre
Posición central (centralización)
Posición no central
Medidas o estadísticos de distribución
Posición no central
Dispersión
Forma
Visualización gráfica
Son medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran tendencia a agruparse.
Suma de los valores dividido por el tamaño muestral.
De posición central
^ ^ N i ii
N N i ii
N i i fx N
nx
N
xx x N
x X 1
1 1 2 ...^1 OJO!!! La media no tiene por qué ser representativa
Ejemplo: (^) Media=6,
Conveniente cuando los datos se concentran simétricamente con respecto a ese valor. Muy sensible a valores extremos. Centro de gravedad de los datos. ¿Cómo se calcula cuando los datos están agrupados en intervalos? Marca de clase
De posición central
la distribución.
De posición central
N
n
i
n i
N n n G xn^ xn xn^ xi 1
1 2
i 1
Características:
(^) xi ni
valores de la variable.
De posición central
(^) n ni
Características:
i
i 1 xi
De posición central
de forma creciente) en dos grupos con el mismo número de individuos. Si el número de datos es par, se elige la media de los dos datos centrales.
De posición central
Ejemplos: Mediana de 1,2,4, 5 ,6,6,8 es 5 Mediana de 1,2,4, 5 , 6 ,6,8,9 es (5+6)/2=5, Es conveniente cuando los datos son asimétricos. No es sensible a valores extremos. Mediana de 1,2,4, 5 ,6,6, 800 es 5. ¡La media es 117,7!
Media=
Media=
De posición central
Características de la mediana:
i i
i
1 1
Las medidas de posición NO CENTRAL resumen los valores que separan a los datos en grupos significativos. Una medida de posición es un indicador que se usa para señalar qué porcentaje de datos dentro de la muestra se encuentra a un lado y a otro del mismo.
De posición NO central
debajo del cual se encuentra una frecuencia acumulada a “tal” porcentaje.
iguales, es decir, en cuatro intervalos dentro de cada cual se encuentra el 25% de los valores de la distribución. (k=4)
f d d d á i l id l 10% d l l d
De posición NO central
forma que dentro de cada una están incluidos el 10% de los valores de la distribución. (k=10)
partes. (k=100)
Datos NO AGRUPADOS Datos AGRUPADOS
k
r Q N k
r ^ i i
i
1 1
De posición NO central
x (^) i ni N (^) i fi F (^) i 1 2 2 0.05 0. 2 6 8 0.15 0. 3 10 18 0.25 0. 4 5 23 0.125 0.
24
C 2 Me 4
95100
Momentos respecto al origen (ar )
Momentos respecto a la media (mr )
origen de orden r de una variable estadística a la expresión:
Respecto al origen
x n a
N
i
i
r
r
i ^1
x (^) i ni x (^) i∙ni x (^) i^2 ∙ni 1 2 2 2 2 6 12 24 3 10 30 90 4 5 20 80 5 10 50 250 6 3 18 108 7 2 14 98 8 2 16 128 TOTAL 40 162 780
1 40
1 40
0
0
N
x n a
N i ii
4 , 05 40
1 162
1 1
N
x n a x
N i ii
19 , 5 40
1 780
2
2
N
x n a
N i ii
4 , 05 40
1 162
1 1
N
x n a x
N i ii
media de orden r de una variable estadística a la expresión:
Respecto a la media
N
x x n m
N
i
i
r
r
i 1
x (^) i ni (x (^) i‐ ) (x (^) i‐ ) 2 (x (^) i‐ )∙ni (x (^) i‐ ) 2 ∙ni 1 2 ‐3.05 9.30 ‐6.1 18. 2 6 ‐2.05 4.20 ‐12.3 25. 3 10 ‐1.05 1.10 ‐10.5 11. 4 5 ‐0.05 0.00 ‐0.25 0. 5 10 0.95 0.90 9.5 9. 6 3 1.95 3.80 5.85 11. 7 2 2.95 8.70 5.9 17. 8 2 3.95 15.60 7.9 31. TOTAL 40 0 123.
1 40
1 1 40 0
N
n
N
x xn m
N i i
N i i
o i
0 40
1 0
1
1
N
x x n m
N
i i i
3 , 0975 90
1 123.^9
2
2
N
x x n m
N
i i i
Desviación típica (Sx ): Es la parte positiva de la
raíz cuadrada de la varianza.
Medidas de dispersión absolutas
Sx S x
x x
La Tipificación no es más que hacer un cambio de
Transformación de variables
x
i S
x x Z
Medidas de dispersión relativas
Es el número de veces que el Re contiene a la media.
min( )
max() i
i x
A x
r x Re ^ Re
3 1
Re 3 1 C C
C C s (^)
Medidas de dispersión relativas
S CV
x
Adimensional. Interesante para comparar la variabilidad de diferentes variables.
x
CV
xi n (^) i xi∙n (^) i xi^2 ∙n (^) i (xi‐ )^2 ∙n (^) i Ixi‐ I Ixi‐ I∙n (^) i 1 2 2 2 18.61 3.05 6. 2 6 12 24 25.22 2.05 12. 3 10 30 90 11.03 1.05 10. 4 5 20 80 0 01 0 05 0 25
Desviación media respecto a :
Coeficiente de variación de Pearson:
4 5 20 80 0 .01 0.05 0. 5 10 50 250 9.03 0.95 9. 6 3 18 108 11.41 1.95 5. 7 2 14 98 17.41 2.95 5. 8 2 16 128 31.21 3.95 7. TOTAL 40 162 780 123.9 58.
4 , 05 40
1 162
1
1
N
x n a x
N
i ii
19 , 5 40
1 780
2 2
N
x n a x
N i ii
S^2 x^ a 2 ( a 1 )^2 19 , 5 ( 4 , 05 )^2 3. 0975
Varianza:
0975 40
9
( )^2 2 2
N
x x n m S i
i i x
Desviación Típica:
Sx S^2 x^ 3. 0975 1 , 76
1 , 4575 40
N
x x n D
i
N
x i i
desviación típica (dispersión) sino que también es importante conocer su forma a partir de la asimetría y el apuntamiento.
completo.
Asimetría
comparar los valores con la media aritmética.
la media, pero sabemos que la suma de todos es cero (prop. Media).
(interesa conocer el signo). ( PROBLEMA: no es adimensional ni invariante ante cambios de escala)
N
x x n m
N
1
3
3
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
Apuntamiento o curtosis
distribución con respecto a la distribución normal o gaussiana.
Coeficiente de asimetría de Fisher:
No tiene sentido porque no hay única moda
x (^) i ni (x (^) i‐ ) 3 ∙ni (x (^) i‐ ) 4 ∙ni Coeficiente de asimetría de Pearson: 1 2 ‐56.75 173. 2 6 ‐51.69 105. 3 10 ‐11.58 12.
Coeficiente de apuntamiento o curtosis:
2 , 135 40
85 , 41
( )^3 · 3
N
x x n m i
i i 24 , 526 40
981 , 06
( )^4 · 4
N
x x n m i
i i
3 3
m g Asimetría a la derecha
3 0 , 440 ( 1. 76 )
981 , 06 2 ^44 ^3 4 S
m g Platicúrtica
En la distribución de salarios de una empresa se puede estudiar si la masa salarial (o nómina de la empresa) se encuentra concentrada en unos pocos trabajadores o si, por el contrario, está bien repartida entre ellos.
Concepto
Dispersión “opuesto a” concentración
concentración En estadística esto no es así: Dispersión significa variabilidad de los datos y, por tanto, representatividad Concentración indica igualdad en el reparto de alguna variable
900 900 €€
10 empleados10 empleados 1 director1 director
8.1008.100 €€
Estos sueldos estarían muy desproporcionados,Estos sueldos estarían muy desproporcionados, muy concentradosmuy concentrados en una sola personaen una sola persona
Miden el grado de igualdad en el reparto del total de los valores de la variable.
Indican el grado de equidistribución de la variable = grado de CONCENTRACIÓN.
Concepto
LLos casos extremos serían: í ConcentraciónConcentración mínimamínima oo equidistribuciónequidistribución:: Cuando todos los trabajadores reciben la misma cantidad:
x 1 x 2 x n
ConcentraciónConcentración máximamáxima:: Cuando de los n trabajadores sólo uno percibe el total de las rentas (de los salarios) y los demás nada:
x MTV
x x x
n
n
1 ^2 1 ^0
Masa Total de la VariableMasa Total de la Variable (MTV)
Curva de Lorenz
A continuación en unos ejes de coordenadas, se marca en el de abcisas los siguientes valores de p (^) i en porcentajes:
n N
p que^ indican^ loslos^ porcentajesporcentajes^ dede trabajadorestrabajadores concon unun nivelnivel dede salariosalario
5 1 2 3 4 5 5
4 1 2 3 4 4
3 1 2 3 3
2 1 2 2
n n n n n N
p
n n n n N
p
n n n N
p
n n N
p N
trabajadorestrabajadores concon unun nivelnivel dede salariosalario igualigual oo inferiorinferior alal ii--ésimoésimo..
Por ejemplo, si i = 3 tenemos que p (^3) es el 60%, lo que significa que el 60% de los trabajadores obtienen un salario anual igual o inferior al “tercero” en orden ascendente.
Curva de Lorenz
Sobre el eje de ordenadas se anotan los valores de q (^) i , también porcentajes:
11 22 2
11 1
xn xn x n
xn xn q
xn q
11 22 33 44 55 5
11 22 33 44 4
11 22 33 3
xn xn xn xn xn q
xn xn xn xn q
xn xn xn q
que indican lala parteparte queque deldel totaltotal dede lala masamasa salarialsalarial lesles correspondecorresponde aa loslos trabajadorestrabajadores cuyocuyo salariosalario eses igualigual oo inferiorinferior alal ii--ésimoésimo. Por ejemplo para i = 4 se tiene que q 4 es el 56,95%, es decir, de los 181.505,66 €, el 56,95% corresponde a los trabajadores con salario igual o inferior al “cuarto” en orden ascendente.
Curva de Lorenz
Es siempre creciente (porque p y q son acumulados)
Se sitúa siempre por debajo de la diagonal, ya que, al estar ordenados los salarios de menor a mayor, ningún q (^) i. podrá ser mayor que su correspondiente p (^) i GRÁFICO 1 D En caso de equidistribución p (^) i = q (^) i. , la curva de concentración sería la diagonal , recta que se denomina recta de equidistribución.
En caso de máxima concentración , la curva de concentración, denominada curva de máxima concentración , vendría dada por ABD donde p 1 = (N-1/N) %; q 1 = 0% p 2 = 100%; q 2 = 100%
0
10
20
30
40
50
60
70
80
90
100
0 10 20 30 40 50 60 70 80 90 100 pi (%) porcentaje acumulado de trabajadores
qi (%) porcentaje acumulado de la masa salar
Curva de concentración Rect a de Equidistribución Curva de Máxima Concentración
(80 ; 56,95)
(60 ; 30,46) (50 ; 22,18) (20 ; 8,28)
D
A B C
Curva de Lorenz
A (^) n 10 0
A (^) n 10 0
p (^) i (% )
q i (% )
B p a
O 1 00 p^ i^ ( % )
q i (% )
B p a
O 1 0 0
Área Conc (^) Área Máx Conc
Cuanto mayor sea el área de concentración respecto del área máxima concentración, mayor será la desigualdad en el reparto de la masa total de la variable. Por consiguiente, de manera natural, las medidas de concentración se obtendrán por cociente entre estas dos áreas.
Índice de Gini
Índice deÍndice de GiniGini
Índice deÍndice de GiniGini
Índice de Gini
Equidistribución
1
1
1
N
i
i
N
i
i i
p
p q IG
Máxima Concentración
xi ni xini Ni Ui pi qi pi-qi* 300 3 900 3 900 9,68 3,59 6, 500 10 5000 13 5900 41,94 23,51 18, 625 4 2500 17 8400 54,84 33,47 21, 950 6 5700 23 14100 74,19 56,18 18, 1000 5 5000 28 19100 90,32 76,10 14, 2000 3 6000 31 25100 100,00 100,00 0, 5375 31 25100 73500 N-1 270,97 192,83 78,
1
1
N
i
1
1
N
i