



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: estadistica teorica, Profesor: alfredo crespo, Carrera: Economía, Universidad: UAM
Tipo: Apuntes
1 / 5
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




Contrastes de bondad de ajuste
Prueba Chi-cuadrado cuando no se estiman
parámetros
Prueba Chi-cuadrado cuando se estiman
parámetros
Contrastes de independencia
Contrastes de homogeneidad
Introducción
En el tema anterior nos hemos ocupado de contrastes
paramétricos. Determinábamos la credibilidad de ciertas
hipótesis sobre los valores de parámetros poblacionales.
Los contrastes no paramétricos hacen referencia a la
distribución poblacional en su conjunto:
población sigue (“se ajusta a”) una determinada
distribución de probabilidad? (bondad de ajuste).
distribución? (homogeneidad).
características poblacionales?
Contrastes de bondad de ajuste
¿En qué consisten?
Partimos de una m.a.s.
A la vista de los datos de la muestra, se quiere contrastar si
las observaciones han sido extraídas de una población con
distribución de probabilidad F 0
(x) (Binomial, Poisson,
Normal, etc.).
Por tanto, las hipótesis serían:
0
: F(x)=F 0
(x)
1
: F(x)≠ F 0
(x)
Para resolver esta cuestión, utilizaremos el contraste de la
chi-cuadrado de Pearson. Distinguiremos dos casos:
◦ Cuando F 0
(x) no contiene parámetros desconocidos
◦ Cuando F 0
(x) contiene parámetros desconocidos
Contrastes de bondad de ajuste. Prueba chi-
cuadrado cuando no se estiman parámetros.
¿Cómo se realiza?
Vamos a usar un ejemplo para la explicación (Newbold,
En un estudio, se ha observado una muestra de 33 individuos
comprando 3 bebidas refrescantes. De estos individuos, 15
seleccionaron 3 clases de bebidas refrescantes;
seleccionaron 2 de una clase y 1 de otra clase diferente; y 8
seleccionaron las 3 de la misma clase:
Categorías
(Ak)
Número de
individuos
(nk)
1 8
2 10
3 15
Categorías
(Ak)
Nº de valores
observados
(nk)
A 1 n 1
A 2 n 2
A 3 n 3
Contrastes de bondad de ajuste. Prueba chi-
cuadrado cuando no se estiman parámetros.
En este ejemplo queremos contrastar:
0
: La muestra ha sido extraída de una población que sigue
una distribución uniforme (misma probabilidad de cada
categoría).
1
: La muestra no ha sido extraída de una población que
sigue una distribución uniforme.
Por tanto, bajo la H 0
, la probabilidad de que una
observación muestral caiga en una de las 3 categorías (o
proporción de observaciones que hay en cada categoría)
sería: 1/
Esto quiere decir que el número esperado de
observaciones en cada categoría (frecuencia esperada)
sería:
Ek =npk=33*1/3=11, donde n=8+10+15=
Contrastes de bondad de ajuste. Prueba chi-
cuadrado cuando no se estiman parámetros.
Por tanto, se tiene la siguiente situación:
Ahora comparamos los valores observados con los
esperados. Para ello Pearson propuso el estadístico:
Categorías
(Ak)
Número de
individuos
observado
(nk)
P(Ak)
Número
esperado de
individuos
bajo H 0 (Ek)
1 8 1/3 33*1/3=
2 10 1/3 33*1/3=
3 15 1/3 33*1/3=
2
1
1
2
2
r
k
r
k
k k
n E
Discrepancia entre los
valores observados y
los valores esperados
Contrastes de bondad de ajuste. Prueba chi-
cuadrado cuando no se estiman parámetros.
Por tanto, se tiene:
Ahora calculamos el valor crítico al nivel de significación
elegido (supongamos un 10%):
Finalmente comparamos el valor del estadístico con el
valor crítico:
Por tanto, la hipótesis nula no puede ser rechazada
0 , 1 0
2
2
P kH
2 2 2
3
1
2
2
k
k
k k
n E
k 4 , 61
Contrastes de bondad de ajuste. Prueba chi-
cuadrado cuando no se estiman parámetros.
Se trata de un test asintótico: n debe ser elevado para
que la aproximación del estadístico a una chi-cuadrado sea
buena.
Por eso se deben escoger las categorías de modo que:
n· p k
≥ 5 k
Si alguna categoría no cumple esta condición hay que
reagruparla con otra (generalmente la anterior o la
posterior) para que sí se cumpla.
Contrastes de independencia.
El estadístico de contraste es ahora:
valorqueen deja deprobabilidadpor encima
Re
2
( 1 )( 1 )
2
2 2
0
2
( 1 )( 1 )
1 1
2
2
n m
i j
ij
n m
n
i
m
j ij
ij ij
chazamosH si
n
n n
n E
Contrastes de independencia.
Para estudiar si el grupo sanguíneo tiene relación con la
predisposición a padecer diabetes, se seleccionan al azar 400
individuos de los que se ha determinado el grupo sanguíneo
(X) y la cantidad de glucosa (Y) en idénticas condiciones
experimentales. Usar α=0,05. Calcular el p-valor.
X\Y Bajo Medio Alto Total
0 137 86 35 258
A 42 23 11 76
B 19 17 7 43
AB 14 7 2 23
Total 212 133 55 400
Contrastes de homogeneidad.
¿En qué consisten?
Supongamos que disponemos de los datos de m muestras
aleatorias:
A la vista de los datos de la muestra, deseamos contrastar:
0
: Todas las muestras provienen de la misma
población
1
: Todas las muestras no provienen de la misma
población
m
n n n ...n 1 2
Tamaño
total de todas
las muestras.
Tamaño de
la muestra m.
Contrastes de homogeneidad.
Partimos de nuevo de una tabla de contingencia, siendo el
estadístico de contraste:
valorqueen deja deprobabilidadpor encima
Re
2
( 1 )( 1 )
2
2 2
0
2
( 1 )( 1 )
1 1
2
2
n m
i j
ij
n m
n
i
m
j ij
ij ij
chazamosH si
n
n n
n E
Contrastes de independencia.
El Ministerio de Hacienda piensa que el porcentaje de
individuos que defraudan en el IRPF es similar en las distintas
Comunidades. Para analizarlo toma m.a.s. cuyos resultados
fueron:
Analizar la homogeneidad del comportamiento de los
contribuyentes en las distintas CC.AA. con un nivel de
significación del 5%.
Defrauda No defrauda Total
Madrid 1000 3050 4050
Cataluña 950 3000 3950
Murcia 800 2300 3100
Galicia 750 2280 3030
Total 3500 10630 14130