Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Estadístico: Contraste de Medias - Prof. Carnero, Apuntes de Gestión de Recursos Humanos

Documento que presenta un análisis estadístico para contrastar la diferencia de medias entre dos grupos, utilizando el estadístico de t y el p-valor. Se calculan los p-valores para niveles de significación aproximados de 0.01 y 0.05, y se discuten los resultados para diferentes casos.

Tipo: Apuntes

2012/2013

Subido el 04/07/2013

danii92
danii92 🇪🇸

3.5

(21)

12 documentos

1 / 16

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Departamento de Fundamentos del Análisis Económico.
Universidad de Alicante.
Curso 2012/13
ESTADÍSTICA E INTRODUCCIÓN A LA ECONOMETRÍA
Soluciones a los problemas del Tema 4
Notas: - En todos los ejercicios se supone que la muestra que se utiliza constituye
una muestra aleatoria simple.
- En todos los contrastes en los que no se indique el nivel de signi…cación,
utiliza = 0:05 como nivel de signi…cación.
1. Una empresa tiene dos plantas de fabricación de pilas. Se sabe que la duración de
una pila fabricada por la planta A es una variable aleatoria (v.a.) con distribución
normal con desviación pica 3horas, y que la duración de una pila fabricada por la
planta B es una v.a. con distribución normal con desviación típica 2:5horas. Se ha
observado la duración de 9pilas de la planta A; la duración media de estas 9pilas ha
sido 19:2horas, con una varianza muestral de 9:4horas2:Se ha observado también
la duración de 16 pilas de la planta B; la duración media de estas 16 pilas ha sido
21:3horas, con una varianza muestral de 7:7horas2:Se quiere contrastar si con los
datos observados, se puede a…rmar que la duración media de las pilas fabricadas por
la planta A es inferior a la duración media de las pilas fabricadas por la planta B.
(a) Escribe la hipótesis nula y la alternativa.
(b) Si se toma como nivel de signi…cación = 0:10;
i. ¿hay evidencia su…ciente para rechazar la hipótesis nula?
ii. ¿cambiaría la respuesta si se tomara como nivel de signi…cación = 0:05?
iii. ¿y si se tomara como nivel de signi…cación = 0:01?
(c) Calcula el p-valor del contraste.
(d) Un encargado de la empresa, con pocos conocimientos de Estadística, dice que
él rechazaría la hipótesis nula si la diferencia entre la duración media de la
muestra de 16 pilas de la planta B y la duración media de la muestra de 9pilas
de la planta A es superior a una hora. Si efectuamos el contraste siguiendo el
consejo del encargado, ¿cuál es la probabilidad de cometer un error de tipo I?
Solución:
(a) Llamando XAa la v.a. que indica la duración de una pila fabricada por la
planta A y Aa su media, nos indican que XAN(A;32):Análogamente,
llamando XBa la v.a. que indica la duración de una pila fabricada por la planta
B y Ba su media, nos indican que XBN(B;2:52):Queremos contrastar:
H0:AB
H1:A< B
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Análisis Estadístico: Contraste de Medias - Prof. Carnero y más Apuntes en PDF de Gestión de Recursos Humanos solo en Docsity!

Departamento de Fundamentos del An·lisis EconÛmico. Universidad de Alicante. Curso 2012/ ESTADÕSTICA E INTRODUCCI”N A LA ECONOMETRÕA Soluciones a los problemas del Tema 4

Notas: - En todos los ejercicios se supone que la muestra que se utiliza constituye una muestra aleatoria simple.

  • En todos los contrastes en los que no se indique el nivel de signiÖcaciÛn, utiliza = 0: 05 como nivel de signiÖcaciÛn.
  1. Una empresa tiene dos plantas de fabricaciÛn de pilas. Se sabe que la duraciÛn de una pila fabricada por la planta A es una variable aleatoria (v.a.) con distribuciÛn normal con desviaciÛn tÌpica 3 horas, y que la duraciÛn de una pila fabricada por la planta B es una v.a. con distribuciÛn normal con desviaciÛn tÌpica 2 : 5 horas. Se ha observado la duraciÛn de 9 pilas de la planta A; la duraciÛn media de estas 9 pilas ha sido 19 : 2 horas, con una varianza muestral de 9 : 4 horas^2 : Se ha observado tambiÈn la duraciÛn de 16 pilas de la planta B; la duraciÛn media de estas 16 pilas ha sido 21 : 3 horas, con una varianza muestral de 7 : 7 horas^2 : Se quiere contrastar si con los datos observados, se puede aÖrmar que la duraciÛn media de las pilas fabricadas por la planta A es inferior a la duraciÛn media de las pilas fabricadas por la planta B.

(a) Escribe la hipÛtesis nula y la alternativa. (b) Si se toma como nivel de signiÖcaciÛn = 0: 10 ; i. øhay evidencia suÖciente para rechazar la hipÛtesis nula? ii. øcambiarÌa la respuesta si se tomara como nivel de signiÖcaciÛn = 0:05? iii. øy si se tomara como nivel de signiÖcaciÛn = 0:01? (c) Calcula el p-valor del contraste. (d) Un encargado de la empresa, con pocos conocimientos de EstadÌstica, dice que Èl rechazarÌa la hipÛtesis nula si la diferencia entre la duraciÛn media de la muestra de 16 pilas de la planta B y la duraciÛn media de la muestra de 9 pilas de la planta A es superior a una hora. Si efectuamos el contraste siguiendo el consejo del encargado, øcu·l es la probabilidad de cometer un error de tipo I?

SoluciÛn:

(a) Llamando XA a la v.a. que indica la duraciÛn de una pila fabricada por la planta A y A a su media, nos indican que XA  N (A; 32 ): An·logamente, llamando XB a la v.a. que indica la duraciÛn de una pila fabricada por la planta B y B a su media, nos indican que XB  N (B ; 2 : 52 ): Queremos contrastar:

H 0 : A  B H 1 : A < B

que es equivalente a contrastar:

H 0 : A = B H 1 : A < B

(b) Puesto que las distribuciones de X e Y son normales y sus desviaciones tÌpicas son conocidas, nuestro estadÌstico de contraste es:

T =

XA XB

q ^2 A nA +^

^2 B nB

que bajo H 0 se distribuye como una distribuciÛn normal est·ndar. En la muestra, el estadÌstico toma el valor

t =

q 32 9 +^

2 : 52 16

Rechazaremos la hipÛtesis nula si este valor est· en la regiÛn crÌtica, que en este caso es (1; z ). i. Si tomamos como nivel de signiÖcaciÛn = 0: 10 ; debemos calcular z 0 : 10 = 1 : 28 : Como el valor que toma T en la muestra es t = 1 : 78 , que est· dentro de la regiÛn (1; 1 :28); se rechaza la hipÛtesis nula y concluimos que con un nivel de signiÖcaciÛn de 0 : 10 ; los datos nos dan evidencia para aÖrmar que la duraciÛn media de las pilas fabricadas por la planta A es inferior a la duraciÛn media de las pilas fabricadas por la planta B. ii. Si tomamos como nivel de signiÖcaciÛn = 0: 05 ; entonces el valor que debemos calcular es z 0 : 05 = 1: 64 :Como t = 1 : 78 tambiÈn est· dentro de la regiÛn (1; 1 :64); tambiÈn se rechaza la hipÛtesis nula y concluimos que con un nivel de signiÖcaciÛn de 0 : 05 ; los datos nos dan evidencia para aÖrmar que la duraciÛn media de las pilas fabricadas por la planta A es inferior a la duraciÛn media de las pilas fabricadas por la planta B. iii. Finalmente, si tomamos como nivel de signiÖcaciÛn = 0: 01 ; debemos cal- cular z 0 : 01 = 2: 33 : Como t = 1 : 78 no est· dentro de la regiÛn (1; 2 :33); no se rechaza la hipÛtesis nula y concluimos que con un nivel de signiÖ- caciÛn de 0 : 01 ; con los datos observados no podemos aÖrmar que la du- raciÛn media de las pilas fabricadas por la planta A es inferior a la duraciÛn media de las pilas fabricadas por la planta B. (c) Como la hipÛtesis alternativa es unilateral izquierda y la distribuciÛn de T bajo la hipÛtesis nula es normal est·ndar, el p-valor es:

p-valor = P (Z < 1 :78) = 0: 037

(d) Puesto que las muestras son independientes, la distribuciÛn de XB XA es

N

B A;

Por tanto, el intervalo de conÖanza para X Y con nivel de conÖanza del 95% es:

x y t118;0: 025

s s^2 p nX

s^2 p ny

; x y + t118;0: 025

s s^2 p nX

s^2 p ny

r 0 : 8543 74

r 0 : 8543 74

(b) Queremos contrastar, con nivel de signiÖcaciÛn = 0: 05 :

H 0 : X Y = 0 H 1 : X Y 6 = 0

Por la dualidad entre contrastes de hipÛtesis e intervalos de conÖanzas, sabemos que rechazar H 0 en este contraste equivale a decir que 0 no est· en el intervalo de conÖanza para X Y con nivel de conÖanza del 95%. En este caso, 0 no est· en el intervalo de conÖanza que hemos obtenido en el apartado anterior, luego se rechaza H 0 : Para obtener el p-valor del contraste es necesario obtener el estadÌstico de contraste. En este caso es:

T =

X Y

q S^2 p nX +^

S p^2 nY

) t =

q 0 : 8543 74 +^

0 : 8543 46

Luego, el p-valor del contraste es:

p-valor = P (t 118 < 8 :01) + P (t 118 > 8 :01) = 2  P (t 118 > 8 :01)  0

La hipÛtesis nula es muy poco verosÌmil: se rechaza con todos los niveles de signiÖcaciÛn habituales.

  1. Una empresa agrÌcola quiere analizar si dos tipos de fertilizantes producen resulta- dos similares. Para ello selecciona 60 parcelas del mismo tamaÒo, con suelo, drenaje y exposiciÛn al sol similares, y prueba el fertilizante A sobre 30 de estas parcelas y el fertilizante B sobre las otras 30. Los rendimientos obtenidos en cada parcela se muestran en la hoja ìProblema 3î del archivo Problemas4Datos.xlsx. Supon- dremos que el rendimiento obtenido en una parcela tratada con el fertilizante A es una v.a. con distribuciÛn normal N (A; ^2 A); y que el rendimiento obtenido en una parcela tratada con el fertilizante B es una v.a. con distribuciÛn normal N (B ; ^2 B ):

(a) Suponiendo que ^2 A = 121 y que ^2 B = 144; contrasta si el efecto medio de am- bos fertilizantes es el mismo e indica quÈ supuestos sobre las muestras obtenidas son necesarios para asegurar la validez del contraste realizado.

(b) Calcula el p-valor del contraste realizado en el apartado anterior. (c) Suponiendo que ^2 A = ^2 B ; contrasta si el efecto medio de ambos fertilizantes es el mismo, e indica quÈ supuestos sobre las muestras obtenidas son necesarios para asegurar la validez del contraste realizado. (d) Calcula el p-valor del contraste realizado en el apartado anterior.

SoluciÛn:

(a) Llamando XA a la v.a. que indica el rendimiento obtenido en una parcela tratada con el fertilizante A y XB a la v.a. que indica el rendimiento obtenido en una parcela tratada con el fertilizante B, el estadÌstico de este contraste es:

T =

XA XB

q ^2 A nA +^

^2 B nB

Las medias muestrales son: XA = 55: 29 y XB = 50: 68 : Por tanto, el valor que toma el estadÌstico de contraste es:

t =

q 121 30 +^

144 30

Se rechaza H 0 si el valor del estadÌstico queda en (1; za= 2 ) [ (za= 2 ; + 1 ): Si tomamos como nivel de signiÖcaciÛn = 0: 05 ; entonces z 0 : 025 = 1:96; por tanto como 1 : 55 2 = (1; 1 :96) [ (1: 96 ; + 1 ); no se rechaza la hipÛtesis nula y concluimos que no hay evidencia para rechazar que, en media, ambos fertilizantes producen el mismo efecto. El ˙nico supuesto adicional sobre las muestras obtenidas que debe hacerse es que Èstas son independientes (teniendo en cuenta el enunciado del problema, este supuesto puede considerarse razon- able). (b) En este caso el p-valor es:

p-valor = P (Z < 1 :55) + P (Z > 1 :55) = 2  P (Z < 1 :55) = 0: 12

(c) Si suponemos que las varianzas de XA y XB son iguales, entonces el estadÌstico de este contraste es: T =

XA XB

q S p^2 nA +^

S p^2 nB Las desviaciones tÌpicas de cada una de las muestrales son: SA = 13: 6705 y SB = 12: 4383 : Por tanto, la estimaciÛn de la varianza S p^2 es:

S p^2 =

S^2 A +

S B^2 ) s^2 p = 170: 797

supondremos que D es una v.a. con distribuciÛn normal, y que D 1 ; :::; D 20 consti- tuyen una muestra aleatoria simple de D: Admitiendo estos supuestos, el estadÌstico que debemos utilizar para contrastar la hipÛtesis nula es:

T =

D

q S^2 D n En este caso podemos obtener, con la opciÛn AÒadir )DeÖnir nueva variable de Gretl las observaciones de Di a partir de las de Xi e Yi; y con ellas calculamos D = 2: 15 asÌ como SD = 5: 8604 : Por tanto, el valor que toma el estadÌstico es:

t =

5 :p 8604 20

Debemos rechazar la hipÛtesis nula si el valor del estadÌstico queda en (1; t19; = 2 )[ (t19; = 2 ; + 1 ); si tomamos como nivel de signiÖcaciÛn = 0: 05 ; entonces t19;0: 025 = 2 : 093 : Como t = 1: 64 no est· dentro de la regiÛn (1; 2 :093) [ (2: 093 ; + 1 ); no rechazamos H 0 ; y por tanto concluimos que no hay suÖciente evidencia para rechazar la aÖrmaciÛn de que el aumento del precio no ha afectado al gasto medio.

  1. Los trabajadores del sector A reclaman un incremento salarial argumentando que el salario medio que perciben es inferior al salario medio de los trabajadores del sector B. Se ha seleccionado una muestra de 141 trabajadores del sector A y, de modo independiente, otra muestra de 160 trabajadores del sector B. Los resultados obtenidos se muestran en la tabla siguiente: n X S^2 Sector A: 141 4 : 9 0 : 85 Sector B: 160 5 : 1 0 : 94 Se desea contrastar si efectivamente los trabajadores del sector A reciben un salario medio inferior al de los trabajadores del sector B.

(a) Con los datos de que se dispone, øcu·l es el p-valor aproximado del contraste?; øse rechaza la hipÛtesis nula si se toma como nivel de signiÖcaciÛn aproximado = 0: 05 ?; øy si se toma como nivel de signiÖcaciÛn aproximado = 0: 01? (b) Si quisiÈramos contrastar la hipÛtesis de que la diferencia media de salarios entre los sectores B y A es mayor a 0 : 05 , øcu·l serÌa H 0 y cu·l H 1? ørec- hazarÌamos la hipÛtesis nula tomando como nivel de signiÖcaciÛn aproximado = 0:05?; øcu·l serÌa el p-valor aproximado del contraste?

SoluciÛn:

(a) Llamemos XA a la v.a. que indica el salario de un trabajador del sector A y A a su media y, por otra parte, llamemos XB a la v.a. que indica el salario de un trabajador del sector B y Y a su media. Queremos contrastar: H 0 : A = B H 1 : A < B

o lo que es lo mismo

H 0 : A B = 0 H 1 : A B < 0

No se conocen las distribuciones de XA ni de XB ; ni tampoco sus varianzas. Como los tamaÒos muestrales son relativamente grandes, podemos efectuar el contraste de modo aproximado utilizando como estadÌstico de contraste:

T =

XA XB

q S^2 A nA +^

S^2 B nB

) t =

q 0 : 85 141 +^

0 : 94 160

El p-valor aproximado del contraste es:

p-valor  P (Z < 1 :833) = 0: 0334

Por tanto, si tomamos como nivel de signiÖcaciÛn aproximado = 0: 05 sÌ rechazamos la hipÛtesis nula, pero si tomamos como nivel de signiÖcaciÛn = 0: 01 no rechazamos la hipÛtesis nula.

(b) El contraste que tendrÌamos que hacer es:

H 0 : B A = 0: 05 H 1 : B A > 0 : 05

En este caso el estadÌstico de contraste es:

T =

XB XA 0 : 05

q S^2 B nB +^

S A^2 nA

) t =

q 0 : 94 160 +^

0 : 85 141

Debemos rechazar la hipÛtesis nula si el valor del estadÌstico queda en la regiÛn (z ; + 1 ); si tomamos como nivel de signiÖcaciÛn aproximado = 0: 05 ; en- tonces z 0 : 05 = 1: 645 : Como t = 1: 375 no est· dentro de la regiÛn (1: 645 ; + 1 ); no rechazamos H 0 : El p-valor aproximado del contraste es:

p-valor  P (Z > 1 :375) = 0: 0846

NÛtese que podrÌamos haber hecho el contraste:

H 0 : A B = 0 : 05 H 1 : A B < 0 : 05

que es exactamente el mismo que el anterior pero si lo escribimos asÌ el estadÌs- tico de contraste ser·

T =

XA XB + 0: 05

q S A^2 nA +^

S B^2 nB

) t =

q 0 : 85 141 +^

0 : 94 160

Las medias muestrales son: X = 0: 72 e Y = 0: 44 ; y las desviaciones tÌpicas muestrales son: SX = 1: 18134 y SY = 0: 70094 : Por tanto, el valor que toma el estadÌstico de contraste es:

T =

X Y

q S^2 X nX +^

S^2 Y nY

) t =

q 1 : 181342 100 +^

0 : 700942 100

Se rechaza H 0 si el valor del estadÌstico queda en (1; za= 2 ) [ (za= 2 ; + 1 ): Si tomamos como nivel de signiÖcaciÛn aproximado = 0: 05 ; entonces z 0 : 025 = 1 :96; por tanto como 2 : 038 2 (1; 1 :96) [ (1: 96 ; + 1 ); se rechaza la hipÛte- sis nula, es decir, hay evidencia suÖciente para aÖrmar que el n˙mero medio de partes de accidente que presentan los hombres es distinto del n˙mero medio de partes que presentan las mujeres. Como la hipÛtesis alternativa es bilateral, el p-valor aproximado del contraste es:

p-valor  P (Z < 2 :038) + P (Z > 2 :038) = 2  P (Z < 2 :038) = 0: 0415

NOTA: El resultado de este apartado tambiÈn puede obtenerse directamente utilizando la opciÛn Herramientas )Calculadora de estadÌsticos de contraste en Gretl.

(b) El analista de la compaÒÌa aÖrma que X = 2Y :

i. Queremos contrastar: H 0 : X 2 Y = 0 H 1 : X 2 Y 6 = 0 La v.a. X 2 Y deberÌa ser cercana a 0 si la hipÛtesis nula es cierta; cuanto m·s lejos de 0 estÈ el resultado de esta v.a., m·s evidencia hay en contra de la hipÛtesis nula. Por el teorema central del lÌmite, bajo H 0 la distribuciÛn aproximada de X 2 Y es normal con media 0 y varianza ^2 X =nX + (2)^2 ^2 Y =nY ; por tanto, bajo H 0 se tiene que:

T =

X 2 Y

q S^2 X nX + 4

S^2 Y nY

' N (0; 1)

AsÌ pues, una regla de decisiÛn con nivel de signiÖcaciÛn aproximado es ìRechazar H 0 si T 2 (1; za= 2 ) [ (za= 2 ; + 1 ): ii. Con los datos del apartado (a), el estadÌstico de contraste toma el valor:

T =

X 2 Y

q S X^2 nX + 4

S^2 Y nY

) t =

q 1 : 181342 100 + 4^ ^

0 : 700942 100

Si tomamos como nivel de signiÖcaciÛn aproximado = 0: 05 ; entonces el valor que aparece en la regiÛn crÌtica es z 0 : 025 = 1:96; por tanto como 0 : 8728 2 = (1; 1 :96) [ (1: 96 ; + 1 ); no se rechaza la hipÛtesis nula. El p-valor aproximado del contraste es:

p-valor  P (Z < 0 :8728)+P (Z > 0 :8728) = 2P (Z < 0 :8728) = 0: 3828

  1. Sean p 1 y p 2 las proporciones de hombres y mujeres (respectivamente) que est·n a favor de que se permita fumar en las cafeterÌas. De una muestra de 200 mujeres, 28 est·n a favor de esta medida, y de una muestra de 250 hombres, 44 est·n a favor de la medida.

(a) Analiza si hay suÖciente evidencia para aÖrmar que la proporciÛn de hombres y mujeres que est·n a favor de fumar en las cafeterÌas es la misma. (b) Calcula un intervalo de conÖanza para p 1 p 2 con un nivel de conÖanza aprox- imado del 95% y, utilizando dicho intervalo, analiza si podrÌamos aÖrmar que hay un 10% m·s de hombres que de mujeres a favor de fumar en las cafeterÌas.

SoluciÛn:

(a) Queremos contrastar: H 0 : p 1 p 2 = 0 H 1 : p 1 p 2 6 = 0 Las estimaciones de p 1 y de p 2 que se obtienen con estas muestras son pb 1 = 44 250 = 0:^176 y^ pb^2 =^

28 200 = 0:^14 :^ Por tanto, el estadÌstico que debe utilizarse para contrastar estas hipÛtesis es:

T =

pb 1 pb 2 q pb 1 (1bp 1 ) n 1 +^

pb 2 (1bp 2 ) n 2

) t =

q 0 : 176  0 : 824 250 +^

0 : 14  0 : 86 200

Se rechaza H 0 si el valor del estadÌstico queda en (1; za= 2 ) [ (za= 2 ; + 1 ): Si tomamos como nivel de signiÖcaciÛn aproximado = 0: 05 ; entonces z 0 : 025 = 1 :96; por tanto como 1 : 047 2 = (1; 1 :96) [ (1: 96 ; + 1 ); no se rechaza la hipÛtesis nula y concluimos que no hay suÖciente evidencia para rechazar que las proporciones de hombres y mujeres que est·n a favor de que se permita fumar en las cafeterÌas son iguales. (b) El intervalo de conÖanza para p 1 p 2 con nivel de conÖanza aproximado del 95% es: 0 @bp 1 bp 2 z 0 : 025

s pb 1 (1 bp 1 ) n 1

pb 2 (1 pb 2 ) n 2

; bp 1 bp 2 +z 0 : 025

s bp 1 (1 pb 1 ) n 1

pb 2 (1 bp 2 ) n 2

A =

r 0 : 176  0 : 824 250

r 0 : 176  0 : 824 250

Por otra parte, para analizar si podrÌamos aÖrmar que hay un 10% m·s de hombres que de mujeres a favor de fumar en las cafeterÌas deberÌamos con- trastar:

Como podÌa esperarse, si las varianzas poblacionales son iguales resulta muy poco probable que la varianza muestral de las observaciones de X sea superior al triple de la varianza muestral de las observaciones de Y: (b) Operando con sucesos, es sencillo expresar el suceso cuya probabilidad quiere hallarse como un suceso relativo a la v.a. S X^2 S^2 Y^ ;^ cuya distribuciÛn es conocida:

P

SX <

SY

= P

SX

SY

= P

S X^2

S^2 Y

= P (F 7 ; 12 < 0 :25)

= 1 P (F 7 ; 12  0 :25) = 1 0 :9624 = 0: 0376

Como podÌa esperarse, si las desviaciones tÌpicas poblacionales son iguales re- sulta muy poco probable que la desviaciÛn tÌpica muestral de las observaciones de X sea inferior a la mitad de la desviaciÛn tÌpica muestral de las observaciones de Y: (c) En este caso: S X^2 =^2 X S Y^2 =^2 Y

S^2 X =

2 Y

S Y^2 =^2 Y

S X^2

S Y^2

 F 7 ; 12

Por tanto, ahora se tiene que:

P (S X^2 < 3 S Y^2 ) = P

S X^2

S Y^2

= P

S X^2

S^2 Y

= P (F 7 ; 12 < 4 :5)

= 1 P (F 7 ; 12  4 :5) = 1 0 :0112 = 0: 9888

Como podÌa esperarse, si la varianza poblacional de X es inferior a la vari- anza poblacional de Y resulta muy probable que la varianza muestral de las observaciones de X sea inferior al triple de la varianza muestral de las obser- vaciones de Y:

  1. Un profesor quiere analizar si las notas que obtienen en el examen Önal los estudi- antes que asisten regularmente a clase son similares a las que obtienen los estudiantes que no asisten regularmente a clase. En la hoja ìProblema 9îdel archivo Prob- lemas4Datos.xlsx pueden verse las notas obtenidas por los 54 estudiantes que han seguido su curso el aÒo pasado; tambiÈn se indica, para cada estudiante, si ha asistido o no regularmente a clase. Supondremos que las notas de los estudiantes que asisten regularmente a clase siguen una distribuciÛn normal N ( 1 ; ^21 ); que las notas de los estudiantes que no asisten regularmente a clase siguen una distribuciÛn normal N ( 2 ; ^22 ); y que las muestras observadas de estudiantes de uno y otro tipo son independientes.

(a) Contrasta que las varianzas de las dos distribuciones son iguales frente a una alternativa bilateral, calcula el p-valor del contraste e indica para quÈ niveles de signiÖcaciÛn se rechaza la hipÛtesis nula.

(b) Suponiendo que ^21 = ^22 ; contrasta que la nota media obtenida en el examen Önal por los estudiantes que asistieron regularmente a clase es mayor que la nota media de los estudiantes que no asistieron a clase. Calcula el p-valor del contraste e indica para quÈ niveles de signiÖcaciÛn se rechaza la hipÛtesis nula.

SoluciÛn:

(a) Queremos contrastar: H 0 : ^21 = ^22 H 1 : ^21 6 = ^22 El estadÌstico de contraste es: T =

S^2 X

S Y^2

En este caso, para obtener S X^2 y S^2 Y en primer lugar necesitamos reordenar las observaciones, por ejemplo poniendo en una variable las correspondientes a estudiantes que asisten regularmente a clase y en otra las correspondientes a estudiantes que no asisten regularmente a clase. Tras esta ordenaciÛn se observa que hay 32 estudiantes que asisten regularmente a clase y 22 que no lo hacen, y es posible obtener SX = 2: 9847 y SY = 2: 6877 : Por tanto, el valor que toma el estadÌstico de contraste es:

T =

S^2 X

S Y^2

) t =

Se rechaza H 0 si el valor del estadÌstico queda en (0; F 31 ;21;1 = 2 )[(F 31 ;21; = 2 ; + 1 ): Si tomamos como nivel de signiÖcaciÛn = 0: 05 ; los valores que necesita- mos son F 31 ;21;0: 975 = 0: 46 y tambiÈn F 31 ;21;0: 025 = 2:30; como 1 : 2332 2 = (0; 0 :46) [ (2: 30 ; + 1 ); no se rechaza la hipÛtesis nula y concluimos que no hay evidencia para rechazar que las varianzas de las dos distribuciones son iguales. En cuanto al p-valor del contraste, como H 1 es bilateral y el valor del estadÌs- tico de contraste ha quedado a la derecha del centro de la distribuciÛn, se tiene que: p-valor = 2  P (F 31 ; 21 > 1 :2332) = 0: 624 Por tanto, sÛlo se rechaza la hipÛtesis nula con niveles de signiÖcaciÛn supe- riores a 0 :624; asÌ pues, con todos los niveles de signiÖcaciÛn habituales no rechazamos la hipÛtesis nula. (b) Queremos contrastar: H 0 :  1   2 H 1 :  1 >  2

que se harÌa como contrastar:

H 0 :  1 =  2 H 1 :  1 >  2

(d) Diez investigadores contrastan, por separado, la hipÛtesis nula de que la difer- encia de medias entre dos poblaciones normales con varianzas conocidas es 0, con nivel de signiÖcaciÛn = 0: 05 ; las muestras que utilizan estos diez in- vestigadores son independientes unas de otras. Si la hipÛtesis nula es cierta, entonces la probabilidad de que al menos uno de los diez investigadores rechace la hipÛtesis nula es superior al 40%.

SoluciÛn:

(a) El estadÌstico de contraste es:

T =

X Y

q S p^2 nX +^

S^2 p nY Este estadÌstico es el mismo tanto en el contraste unilateral como en el bilateral. Al realizar el contraste bilateral con nivel de signiÖcaciÛn = 0: 10 ; rechazare- mos H 0 si T 2 (1; tnX +nY 2;0: 05 ) [ (tnX +nY 2;0: 05 ; + 1 ): Si en el contraste unilateral hemos rechazado H 0 con nivel de signiÖcaciÛn = 0: 05 ; entonces o bien T 2 (1; tnX +nY 2;0: 05 ) si la hipÛtesis alternativa era X < Y ; o bien T 2 (tnX +nY 2;0: 05 ; + 1 ) si la hipÛtesis alternativa era X > Y : En cualquiera de los dos casos, se cumple la condiciÛn requerida en la regla de decisiÛn para rechazar H 0 ; luego la aÖrmaciÛn es VERDADERA. (b) Llamando D = X Y; contrastar la hipÛtesis nula de que las medias pobla- cionales de X y de Y coinciden equivale a contrasta la hipÛtesis nula de que la media de D es 0 ; y esto puede contrastarse de modo aproximado si el tamaÒo muestral es grande con el procedimiento descrito en el tema anterior, utilizando las observaciones D 1 = X 1 Y 1 ; :::; Dn = Xn Yn: Por tanto, la aÖrmaciÛn es VERDADERA. (c) La regla de decisiÛn del contraste de igualdad de varianzas se dedujo en clase suponiendo ˙nicamente distribuciones normales y muestras independientes, sin necesidad de hacer ning˙n supuesto sobre las medias poblacionales. Por tanto, la aÖrmaciÛn es FALSA. (d) La probabilidad de que un investigador rechace la hipÛtesis nula siendo cierta es el nivel de signiÖcaciÛn del contraste, es decir 0 : 05. Por tanto, teniendo en cuenta que las muestras son independientes: P (Al menos un investigador rechaza H 0 j H 0 cierta)

= 1 P (Ninguno rechaza H 0 j H 0 cierta)

= 1 P (El invest. 1 no rechaza H 0 j H 0 cierta)    

    P (El invest. 10 no rechaza H 0 j H 0 cierta) = 1 0 : 9510 = 0: 4013 Por tanto, la aÖrmaciÛn es VERDADERA.