Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


estadística, Apuntes de Estadística

Asignatura: estadistica teorica, Profesor: alfredo crespo, Carrera: Economía, Universidad: UAM

Tipo: Apuntes

2017/2018

Subido el 12/02/2018

mauii24
mauii24 🇪🇸

4

(3)

9 documentos

1 / 5

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
12/12/2016
1
Tema 8. Contrastes no
paramétricos
Contrastes de bondad de ajuste
Prueba Chi-cuadrado cuando no se estiman
parámetros
Prueba Chi-cuadrado cuando se estiman
parámetros
Contrastes de independencia
Contrastes de homogeneidad
Introducción
En el tema anterior nos hemos ocupado de contrastes
paramétricos. Determinábamos la credibilidad de ciertas
hipótesis sobre los valores de parámetros poblacionales.
Los contrastes no paramétricos hacen referencia a la
distribución poblacional en su conjunto:
1. ¿Cómo podemos decidir a partir de una muestra si la
población sigue (“se ajusta a”) una determinada
distribución de probabilidad? (bondad de ajuste).
2. ¿Estas muestras provienen de poblaciones con la misma
distribución? (homogeneidad).
3. ¿Son independientes o dependientes varias
características poblacionales?
Contrastes de bondad de ajuste
¿En qué consisten?
Partimos de una m.a.s.
A la vista de los datos de la muestra, se quiere contrastar si
las observaciones han sido extraídas de una población con
distribución de probabilidad F
0
(x) (Binomial, Poisson,
Normal, etc.).
Por tanto, las hipótesis serían:
H
0
: F(x)=F
0
(x)
H
1
: F(x)≠ F
0
(x)
Para resolver esta cuestión, utilizaremos el contraste de la
chi-cuadrado de Pearson. Distinguiremos dos casos:
Cuando F0(x) no contiene parámetros desconocidos
Cuando F0(x) contiene parámetros desconocidos
Contrastes de bondad de ajuste. Prueba chi-
cuadrado cuando no se estiman parámetros.
¿Cómo se realiza?
Vamos a usar un ejemplo para la explicación (Newbold,
1998):
En un estudio, se ha observado una muestra de 33 individuos
comprando 3 bebidas refrescantes. De estos individuos, 15
seleccionaron 3 clases de bebidas refrescantes;10
seleccionaron 2 de una clase y 1 de otra clase diferente; y 8
seleccionaron las 3 de la misma clase:
Categorías
(A
k
)
Número de
individuos
(n
k
)
1 8
2 10
3 15
Categorías
(A
k
)
Nº de valores
observados
(n
k
)
A
1
n
1
A
2
n
2
A
3
n
3
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga estadística y más Apuntes en PDF de Estadística solo en Docsity!

Tema 8. Contrastes no

paramétricos

 Contrastes de bondad de ajuste

 Prueba Chi-cuadrado cuando no se estiman

parámetros

 Prueba Chi-cuadrado cuando se estiman

parámetros

 Contrastes de independencia

 Contrastes de homogeneidad

Introducción

 En el tema anterior nos hemos ocupado de contrastes

paramétricos. Determinábamos la credibilidad de ciertas

hipótesis sobre los valores de parámetros poblacionales.

 Los contrastes no paramétricos hacen referencia a la

distribución poblacional en su conjunto:

  1. ¿Cómo podemos decidir a partir de una muestra si la

población sigue (“se ajusta a”) una determinada

distribución de probabilidad? (bondad de ajuste).

  1. ¿Estas muestras provienen de poblaciones con la misma

distribución? (homogeneidad).

  1. ¿Son independientes o dependientes varias

características poblacionales?

Contrastes de bondad de ajuste

¿En qué consisten?

 Partimos de una m.a.s.

 A la vista de los datos de la muestra, se quiere contrastar si

las observaciones han sido extraídas de una población con

distribución de probabilidad F 0

(x) (Binomial, Poisson,

Normal, etc.).

 Por tanto, las hipótesis serían:

H

0

: F(x)=F 0

(x)

H

1

: F(x)≠ F 0

(x)

 Para resolver esta cuestión, utilizaremos el contraste de la

chi-cuadrado de Pearson. Distinguiremos dos casos:

◦ Cuando F 0

(x) no contiene parámetros desconocidos

◦ Cuando F 0

(x) contiene parámetros desconocidos

Contrastes de bondad de ajuste. Prueba chi-

cuadrado cuando no se estiman parámetros.

¿Cómo se realiza?

 Vamos a usar un ejemplo para la explicación (Newbold,

En un estudio, se ha observado una muestra de 33 individuos

comprando 3 bebidas refrescantes. De estos individuos, 15

seleccionaron 3 clases de bebidas refrescantes;

seleccionaron 2 de una clase y 1 de otra clase diferente; y 8

seleccionaron las 3 de la misma clase:

Categorías

(Ak)

Número de

individuos

(nk)

1 8

2 10

3 15

Categorías

(Ak)

Nº de valores

observados

(nk)

A 1 n 1

A 2 n 2

A 3 n 3

Contrastes de bondad de ajuste. Prueba chi-

cuadrado cuando no se estiman parámetros.

 En este ejemplo queremos contrastar:

H

0

: La muestra ha sido extraída de una población que sigue

una distribución uniforme (misma probabilidad de cada

categoría).

H

1

: La muestra no ha sido extraída de una población que

sigue una distribución uniforme.

 Por tanto, bajo la H 0

, la probabilidad de que una

observación muestral caiga en una de las 3 categorías (o

proporción de observaciones que hay en cada categoría)

sería: 1/

 Esto quiere decir que el número esperado de

observaciones en cada categoría (frecuencia esperada)

sería:

Ek =npk=33*1/3=11, donde n=8+10+15=

Contrastes de bondad de ajuste. Prueba chi-

cuadrado cuando no se estiman parámetros.

 Por tanto, se tiene la siguiente situación:

 Ahora comparamos los valores observados con los

esperados. Para ello Pearson propuso el estadístico:

Categorías

(Ak)

Número de

individuos

observado

(nk)

P(Ak)

Número

esperado de

individuos

bajo H 0 (Ek)

1 8 1/3 33*1/3=

2 10 1/3 33*1/3=

3 15 1/3 33*1/3=

2

1

1

2

2

 

r

k

r

k

k k

E

n E

Discrepancia entre los

valores observados y

los valores esperados

Contrastes de bondad de ajuste. Prueba chi-

cuadrado cuando no se estiman parámetros.

 Por tanto, se tiene:

 Ahora calculamos el valor crítico al nivel de significación

elegido (supongamos un 10%):

 Finalmente comparamos el valor del estadístico con el

valor crítico:

Por tanto, la hipótesis nula no puede ser rechazada

  0 , 1 0

2

2

 P  kH 

2 2 2

3

1

2

2 

k

k

k k

E

n E

k 4 , 61

Contrastes de bondad de ajuste. Prueba chi-

cuadrado cuando no se estiman parámetros.

OBSERVACIONES:

 Se trata de un test asintótico: n debe ser elevado para

que la aproximación del estadístico a una chi-cuadrado sea

buena.

 Por eso se deben escoger las categorías de modo que:

n· p k

≥ 5 k

Si alguna categoría no cumple esta condición hay que

reagruparla con otra (generalmente la anterior o la

posterior) para que sí se cumpla.

Contrastes de independencia.

 El estadístico de contraste es ahora:

valorqueen deja deprobabilidadpor encima

Re

2

( 1 )( 1 )

2

2 2

0

2

( 1 )( 1 )

1 1

2

2

 

 

 

 



n m

i j

ij

n m

n

i

m

j ij

ij ij

chazamosH si

n

n n

E
E

n E

Contrastes de independencia.

EJEMPLO:

Para estudiar si el grupo sanguíneo tiene relación con la

predisposición a padecer diabetes, se seleccionan al azar 400

individuos de los que se ha determinado el grupo sanguíneo

(X) y la cantidad de glucosa (Y) en idénticas condiciones

experimentales. Usar α=0,05. Calcular el p-valor.

X\Y Bajo Medio Alto Total

0 137 86 35 258

A 42 23 11 76

B 19 17 7 43

AB 14 7 2 23

Total 212 133 55 400

Contrastes de homogeneidad.

¿En qué consisten?

 Supongamos que disponemos de los datos de m muestras

aleatorias:

 A la vista de los datos de la muestra, deseamos contrastar:

H

0

: Todas las muestras provienen de la misma

población

H

1

: Todas las muestras no provienen de la misma

población

m

n  n n ...n 1 2

Tamaño

total de todas

las muestras.

Tamaño de

la muestra m.

Contrastes de homogeneidad.

 Partimos de nuevo de una tabla de contingencia, siendo el

estadístico de contraste:

valorqueen deja deprobabilidadpor encima

Re

2

( 1 )( 1 )

2

2 2

0

2

( 1 )( 1 )

1 1

2

2

 

 

 

 



n m

i j

ij

n m

n

i

m

j ij

ij ij

chazamosH si

n

n n

E
E

n E

Contrastes de independencia.

EJEMPLO:

El Ministerio de Hacienda piensa que el porcentaje de

individuos que defraudan en el IRPF es similar en las distintas

Comunidades. Para analizarlo toma m.a.s. cuyos resultados

fueron:

Analizar la homogeneidad del comportamiento de los

contribuyentes en las distintas CC.AA. con un nivel de

significación del 5%.

Defrauda No defrauda Total

Madrid 1000 3050 4050

Cataluña 950 3000 3950

Murcia 800 2300 3100

Galicia 750 2280 3030

Total 3500 10630 14130