Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


ejemplos estadistica, Ejercicios de Estadística

Asignatura: estadistica, Profesor: nebr nebr, Carrera: Trabajo Social, Universidad: UCM

Tipo: Ejercicios

2012/2013

Subido el 04/09/2013

paticorto
paticorto 🇪🇸

4.6

(5)

5 documentos

1 / 44

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
169
Capítulo IV
Pruebas de hipótesis para
medidas de asociación
[11]
En muchas situaciones es de interés estudiar la relación entre dos
o más variables definidas en una población, basados en los resul-
tados encontrados en la muestra. Por ejemplo, podemos estar in-
teresados en estudiar la relación entre el sexo y el lugar de proce-
dencia de los participantes, entre el sexo y el rendimiento acadé-
mico en el curso de álgebra, entre la edad y el tiempo de servicio
de los participantes en el programa de capacitación. En todos los
casos nos basamos en valores que encontramos en la muestra y nos
preguntamos si dichos valores son estadísticamente significativos.
Para abordar el problema planteado, en cada tipo de si-
tuación, primero presentaremos la metodología para calcu-
lar el coeficiente de correlación en la muestra y luego la metodo-
logía correspondiente a pruebas de hipótesis para el parámetro
poblacional.
El estudio de la relación entre dos variables cuantitativas se
realizará en el siguiente capítulo, juntamente con el tópico de
análisis regresión.
Prueba de hipótesis para el coeficiente de
correlación PHI
Cuando se desea estudiar la asociación entre dos variables de
naturaleza cualitativas dicotómicas, se recomienda obtener el co-
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c

Vista previa parcial del texto

¡Descarga ejemplos estadistica y más Ejercicios en PDF de Estadística solo en Docsity!

1 6 9

Capítulo IV

Pruebas de hipótesis para

medidas de asociación

[11]

En muchas situaciones es de interés estudiar la relación entre dos o más variables definidas en una población, basados en los resul- tados encontrados en la muestra. Por ejemplo, podemos estar in- teresados en estudiar la relación entre el sexo y el lugar de proce- dencia de los participantes, entre el sexo y el rendimiento acadé- mico en el curso de álgebra, entre la edad y el tiempo de servicio de los participantes en el programa de capacitación. En todos los casos nos basamos en valores que encontramos en la muestra y nos preguntamos si dichos valores son estadísticamente significativos. Para abordar el problema planteado, en cada tipo de si- tuación, primero presentaremos la metodología para calcu- lar el coeficiente de correlación en la muestra y luego la metodo- logía correspondiente a pruebas de hipótesis para el parámetro poblacional. El estudio de la relación entre dos variables cuantitativas se realizará en el siguiente capítulo, juntamente con el tópico de análisis regresión.

Prueba de hipótesis para el coeficiente de

correlación PHI

Cuando se desea estudiar la asociación entre dos variables de naturaleza cualitativas dicotómicas, se recomienda obtener el co-

eficiente de correlación phi. Por ejemplo, se desea estudiar la aso- ciación entre las variables estado civil y deserción de los estudian- tes de maestría; entre el sexo de los estudiantes y su opinión respec- to a la reelección del Decano.

Coeficiente de correlación phi en la muestra

Se definen:

X: variable dicotómica con valores 0 y 1, Y: variable dicotómica con valores 0 y 1, p (^) x : proporción de puntuaciones 1 en la variable X, q (^) x^ : proporción de puntuaciones 0 en la variable X, p (^) y : proporción de puntuaciones 1 en la variable Y, q (^) y : proporción de puntuaciones 0 en la variable Y, p (^) xy : proporción de puntuaciones 1 tanto en la variable X como en la variable Y, luego, el coeficiente de correlación phi, φ , se calcula de la siguiente manera:

. (4.1) pq p q

p p p

x x y y

φ= xy^ − x y

Cuando los datos están tabulados en una tabla de contin- gencia (tabla que muestra la ocurrencia conjunta de pares de pun-

tuaciones en dos variables), puede calcularse φ mediante la si-

Valores de la Valores de la Total variable Y variable X 0 1 1 A B a + b 0 C D c + d Total a + c b + d

guiente metodología:

( a c)(b d)(a b)(c d)

bc ad

se presentan los resultados de un seguimiento realizado a 15 estu- diantes de la maestría en Política Social que se matricularon en el semestre 2004-II y que abandonaron el curso de Herramientas de Análisis Cuantitativo. Encontraremos el coeficiente de correla- ción phi y haremos la prueba de hipótesis correspondiente.

X: estado civil 1: no casado 0: casado Y: permanencia 0: abandona el curso 1: permanece en el curso hasta el final

Estudiante Estado civil( xi ) Permanencia( yi )

1 0 0 2 1 1 3 0 1 4 0 0 5 1 1 6 1 0 7 0 0 8 1 1 9 0 0 10 0 1 11 0 0 12 1 1 13 0 0 14 0 0 15 0 0

Solución

La información anterior se resume en el siguiente cuadro:

Valores de la Valores de la variable X variable Y 0 (casado) 1 Total 1 (permanece) 2 4 6 0 (abandona) 8 1 9 Total 10 5 15

y se calculan las respectivas proporciones:

p (^) x = =^0.^6667

q (^) x = =^0.^4

p (^) y= =

q (^) y = =^0.^2667

p (^) xy= =

que se reemplazan en la fórmula:

( )( )( )( )

El coeficiente de correlación phi en la muestra entre estado civil y deserción vale 0.578. ¿Es estadísticamente significativo el valor encontrado?. A continuación responderemos la pregunta planteada usando la metodología de pruebas de hipótesis.

Paso 1: La hipótesis nula es que no existe asociación entre esta- do civil y deserción en los estudios y la hipótesis alternativa nie- ga ese enunciado. Si ρ^ phies la asociación entre estado civil y de- serción, las hipótesis son:

H 0 : ρ phi= 0 H 1 : ρphi≠ 0

Paso 2: El valor de la estadística de prueba es:

z c = n φ=^15 ( 0. 578 )=2.

Paso 3: Para α = 0.05, P( Z< zteórico)^ = 0. 95 , por lo que la región de rechazo es el intervalo (- ∞, -1.96) ∪ (1.96, ∞).

Paso 4: Como el valor de zc = 2.24, cae en el intervalo indicado,

se rechaza la hipótesis nula. Luego, con nivel de significación 0.05, existe evidencia para rechazar la hipótesis nula. Cabe indicar, que por razones estrictamente académicas, en el ejemplo se ha considerado un tamaño de muestra menor que

de donde el valor del coeficiente phi en la muestra es φ =− 0. 119.

z c = n φ =^41 ( − 0. 119 )=-0.76.

Paso 3: Para α = 0.05 P (^ Z< zteórico)^ = 0. 975 , por lo que la región

de rechazo es el intervalo (- ∞, -1.96) ó el intervalo (1.96, ∞).

Asimismo, con el criterio del p _ valuela decisión es la si-

guiente: Si p _value< αse rechaza la hipótesis nula.

Paso 4: Como el valor de zc = -0.76 no cae en el intervalo indica-

do, no se rechaza la hipótesis nula. Luego, con nivel de significa- ción 0.05, no existe evidencia para rechazar la hipótesis nula de que las variables deserción y estado civil no están asociadas.

Se llega a la misma decisión si se compara p _ valuecon el

valor de α, pues p^ _^ value= 0.446 > 0.05, por lo que no existe

evidencia para rechazar la hipótesis nula.

TADO CIVIL/ STATISTICS/ seleccionar PHI/CONTINUE/ OK. El output del SPSS es el siguiente: ESTADO CIVIL Total 0 1

DESERCIÓN 0 9 7 16 1 17 8 25 Total 26 15 41

Symmetric Measures

Value Approx. Sig.

Nominal by Nominal Phi -.119. N of Valid Cases 41

Prueba de hipótesis para el coeficiente de

correlación biseral-puntual

El coeficiente de correlación biseral-puntual se usa cuando una variable es de naturaleza cualitativa dicotómica y la segunda es interval o de razón. Por ejemplo, podemos estar interesados en saber si existe alguna asociación entre sexo (Y) y altura de los estudiantes (X).

Coeficiente de correlación biseral-puntual en la muestra

Y es una variable dicotómica (1 y 0), X es una variable continua

X 1 es la media de las puntuaciones de la variable para los que

la variable tiene puntaje "1",

X 0 es la media de las puntuaciones de la variable para los que

la variable tiene puntaje "0",

Sx es la desviación estándar de los valores de la variable X,

n 1 : número de unos en la variable Y, n 0 : número de ceros en la variable Y,

luego, el coeficiente de correlación biseral se calcula con:

( 1 )

1 0 0 1 −

n^ n

nn S

X X r x

bP (^) (4.2)

Prueba de hipótesis para el coeficiente de correlación

Paso 1: En la hipótesis nula se postula que no existe asociación entre las dos variables en la población y la hipótesis alternativa

niega en afirmación. Si denotamos con ρbp el coeficiente de co-

rrelación biseral-puntual en la población, entonces, las hipótesis son:

X 1 : con las estaturas de los adolescentes del sexo masculino. Es decir: Y se realizan los cálculos auxiliares, para luego obtener el co- eficiente de correlación biseral-puntual:

x=

x =

n 1 =^8 n 0 =^7 sx=^4.^749

15 (

r (^) bP=

¿Es estadísticamente significativo el valor del coeficiente de correlación biseral puntual encontrado en la muestra?. Para res- ponder la pregunta planteada, procederemos a usar la metodo- logía de pruebas de hipótesis.

Adolescente Sexo (Y) Estatura (X) X0 X

1 1 69 - 69 2 0 67 67 - 3 1 73 - 73 4 1 65 - 65 5 0 55 55 - 6 1 72 - 72 7 0 62 62 - 8 0 60 60 - 9 1 64 - 64 10 1 66 - 66 11 1 63 - 63 12 0 61 61 - 13 1 62 - 62 14 0 63 63 - 15 0 60 60 -

Paso 1: Se postula como hipótesis nula que no existe asociación entre sexo y estatura en la población y la hipótesis alternativa niega esa afirmación. Si se denota con ρbp el coeficiente de correla- ción biseral-puntual en la población, entonces, las hipótesis son:

H 0 : ρbp = 0 H 1 : ρbp≠ 0

Paso 2: El valor de la estadística de prueba es:

n

r

r

t

bp

bp

c =^2.^77

−^2 =

Paso 3: Para α = 0.05 P( t( 13 )<^ tteórico)^ = 0. 975 , en la tabla t-Stu-

dent se encuentra el valor de tteórico = 2. 16. Luego, la región de

rechazo es el intervalo (2.16, ∞).

Paso 4: Como el valor de tc = 2.77 cae en el intervalo indicado,

se rechaza la hipótesis nula.

Ejemplo 4.

Si se quiere resolver el ejemplo anterior usando comandos del SPSS no se puede encontrar directamente el coeficiente, pues el SPSS sólo nos proporciona los cálculos auxiliares que luego se reemplaza en la fórmula (4.2) y se sigue la trayectoria descrita para realizar la prueba de hipótesis. En el SPSS se siguen los si- guientes pasos:

Crear (o abrir) el archivo, en este caso vamos a ilustrar con la base de DATOS9-puntual, con las dos variables X e Y. Crear la variable ficticia X 0 donde se guarda las estaturas del sexo femenino. Se usa el comando recode. Crear la variable ficticia X 1 donde se guarda las estaturas del sexo masculino. Se usa el comando recode.

como la descrita.

Coeficiente de correlación en la muestra

Sean:

X: variable con distribución normal que ha sido dicotomizada

X = 1 estatura ≥ 1.50 mts

0 estatuta < 1.50 mts

Y: variable con distribución normal que ha sido dicotomizada Y = 1 respuesta correcta 0 respuesta incorrecta,

para las que se encuentra la siguiente tabla bidimensional:

Se calcula el cociente

ad

b cy luego ubicar el valor en la Tabla

E del Apéndice, donde se encuentran funciones del cociente

obtenido:

  • Si la proporción

ad

b c

es mayor que 1, de la Tabla E se obtiene directamente el valor del coeficiente tetracórico, en la co- lumna (^) r (^) t , (4.3)

  • Si la proporción

ad

b c

es menor que 1, en la Tabla E se lee la columna (ad)/(bc) y el valor (^) r (^) t del coeficiente tetracórico será negativo.

Prueba de hipótesis para el coeficiente

ITEM Y ITEM X 0 1

1 a b 0 c d

Paso 1: La hipótesis nula indica que no existe asociación entre las dos variables en la población y la hipótesis alternativa niega esa

afirmación. Si denotemos con ρtr el coeficiente de correlación tetra-

córico en la población, entonces, las hipótesis son:

H 0 : ρtr = 0 H 1 : ρtr≠ 0

Paso 2: Bajo la hipótesis nula, y para tamaños de muestra mayo- res que 20, la distribución del coeficiente (^) r (^) t es aproximadamen-

te normal con medio cero y desviación estándar x y

x x y y

n uu

p qpq 1 ,

donde:

p x es la proporción de puntuaciones "1" en la variable X dicoto-

mizada,

p y es la proporción de puntuaciones "0" en la variable dicoto-

mizada Y,

u x es la ordenada de la curva normal unitaria correspondiente

a la puntuación z en el cual se halla la proporción p xdel

área (ver la tabla A) y

u y es la ordenada de la curva normal unitaria correspondiente

a la puntuación z en el cual se halla la proporción p ydel

área (ver la tabla A). Así, para un tamaño de muestra mode- rado o muy grande:

x y

x x y y

t

n uu

pqpq

r

z

= puede compararse con la distribución

normal unitaria para contrastar que el coeficiente ρt de la po-

blación vale cero. Con los resultados obtenidos en la muestra se calcula el va-

lor de la estadística de prueba: zc^.

Paso 3: Para α = 0.05 P(^ t( n− 2 ) de hipótesis.

Paso 1: Se postula en la hipótesis nula que no existe asociación entre las respuestas a las preguntas X e Y. La hipótesis alternati- va niega dicha afirmación.

H 0 : ρtr = 0 H 1 : ρtr≠ 0

Paso 2: Con los datos de la muestra procedemos a realizar los cálculos de:

p x 0. 5

= = p^ y 0. 46

En la Tabla A del anexo se observa que la ordenada de la

curva normal unitaria que corresponde a p^ x= 0.5 de área, es

u x =0.3989 y la ordenada de la curva correspondiente al punto

en el cual se obtiene py = 0,46, es u x= 0,3970.

Finalmente obtenemos el valor de la estadística de prueba:

=^0.^812

zc =3.

Paso 3: Para α = 0.05 P^ (^ z<^ zteórico)^ =^0.^975 , en la tabla normal

se encuentra el valor de zteórico = 1.96.

Luego, la región de rechazo es el intervalo (1.96, ∞).

Paso 4: Como el valor de zc = 3.64 cae en el intervalo indicado,

se rechaza la hipótesis nula y concluimos que el coeficiente de correlación tetracórico de la población no es nulo, cuando el ni- vel de significación es 0.05.

Ejemplo 4.

Suponga que para una determinada tabla de contingencia 2x2,

a=62, b=20, c=10, d=24 y se desea obtener el valor del coeficiente de correlación tetracórico.

Como

ad

b c= 0.1344, para encontrar el valor del coeficiente

se consulta la Tabla A, bajo los valores de la columna = 7. 44

bc

ad

Se encuentra que el valor del coeficiente de correlación tetracó-

rico es negativo, (^) r t = -0.67. Debe prevenirse al lector sobre la posibilidad de cometer se-

rios errores. No debe emplearse el método si

n

b d

n

a + b +

o

se apartan considerablemente de 0.5. Si

n

b d

n

a + b +

o son ma-

yores que 0.7 o menores que 0.3, tampoco debería utilizarse la tabla A, y en su lugar, debería emplearse las tablas de Jenkins (1955). Cuando las distribuciones subyacentes son normales, sola- mente esta propiedad confiere superioridad al coeficiente (^) r (^) t so- bre el coeficiente PHI como medida de asociación.

Ejemplo 4.

Si deseamos encontrar el coeficiente de correlación tatracórico para las variables de la base de DATOS6-tetracórico, se observa que son 99 estudiantes, donde las notas del curso de estadística y del curso de metodología de investigación han sido dicotomiza- das, pues los profesores calificaron con aprobado o desaproba- do. Obtendremos el coeficiente de correlación tetracórico.

Y: notas en el curso de estadística- dicotimizada, 0 desaprobó con notas inferiores a 11 1 aprobó con notas de 11 o más

X: notas en el curso de metodología de investigación-dico- tomizada, 0 desaprobó con notas inferiores a 11

te diferente de cero el coeficiente de correlación tetracórico en la población?. Se deja como ejercicio para el estudiante.

Prueba de hipótesis para el coeficiente de

correlación biseral

Se usa en situaciones donde se tiene dos variables con distri- buciones normales subyacentes, una de las cuales ha sido di- cotomizada. Una de las situaciones donde se puede obtener el coeficiente de correlación biseral es la siguiente. Un profesor desea relacio- nar el tiempo que los estudiantes emplean en resolver un proble- ma (X) y la habilidad que tiene para resolver el problema (Y). El profesor anota el tiempo (X) que cada estudiante demora en resolver el problema, pero la variable Y no la calificó con una nota en la escala vigecimal o cualquier otra, sólo anotó que apro- bó (1) si llegó a la solución correcta y anotó no aprobó (0) si no llegó a la solución correcta.

Coeficiente de correlación biseral en la muestra

Sean las variables continuas Y dicotomizada (1 y 0) y X también dicotomizada (0 y 1).

Calcular:

X 0 : la media de las puntuaciones de la variable X para los que en Y tienen puntaje "0", X 1 : la media de las puntuaciones de la variable X para los que en Y tienen puntaje "1", S (^) X: desviación estándar de la variable X,

n 1 : número de unos en Y,

n 0 : número de ceros en Y.

Usar la TABLA A, para obtener:

u :^ ordenada (es decir la altura) de la unidad de la distribución

normal, en el punto a partir del cual se obtiene el porcentaje 100(

n

n 1 ) del área bajo la curva normal, donde n + n =n

Luego el coeficiente de correlación biseral muestral es igual a:

u n n n

nn S

X X r x

b (^) (4.4)

Este coeficiente puede ser menor que -1 y mayor que +1. Estos valores extremos indican que no era cierto que las puntuaciones X, categorizadas, tienen distribución normal sub- yacente o también puede indicar fluctuaciones de muestreo cuan-

do n es pequeño y produce una distribución de X marcadamente

platicúrtica.

Prueba de hipótesis para el coeficiente

Paso 1: La hipótesis nula indica que no existe asociación entre las dos variables en la población y la hipótesis alternativa niega

dicha afirmación. Si denotamos con ρb el coeficiente de correla-

ción biseral en la población, entonces, las hipótesis son:

H 0 : ρb = 0 H 1 : ρb≠ 0

Paso 2: Bajo la hipótesis nula, y para tamaños de muestra mayo- res que 20, la distribución del coeficiente (^) r b es aproximadamen-

te normal con medio cero y desviación estándar

n un

n 1 n 01. La

estadística:

n u n

nn

r

z b

= puede compararse con la distribución normal uni-

taria para contrastar que el coeficiente ρ (^) bpoblacional vale cero.