




































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: estadistica, Profesor: nebr nebr, Carrera: Trabajo Social, Universidad: UCM
Tipo: Ejercicios
1 / 44
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





































1 6 9
[11]
En muchas situaciones es de interés estudiar la relación entre dos o más variables definidas en una población, basados en los resul- tados encontrados en la muestra. Por ejemplo, podemos estar in- teresados en estudiar la relación entre el sexo y el lugar de proce- dencia de los participantes, entre el sexo y el rendimiento acadé- mico en el curso de álgebra, entre la edad y el tiempo de servicio de los participantes en el programa de capacitación. En todos los casos nos basamos en valores que encontramos en la muestra y nos preguntamos si dichos valores son estadísticamente significativos. Para abordar el problema planteado, en cada tipo de si- tuación, primero presentaremos la metodología para calcu- lar el coeficiente de correlación en la muestra y luego la metodo- logía correspondiente a pruebas de hipótesis para el parámetro poblacional. El estudio de la relación entre dos variables cuantitativas se realizará en el siguiente capítulo, juntamente con el tópico de análisis regresión.
Cuando se desea estudiar la asociación entre dos variables de naturaleza cualitativas dicotómicas, se recomienda obtener el co-
eficiente de correlación phi. Por ejemplo, se desea estudiar la aso- ciación entre las variables estado civil y deserción de los estudian- tes de maestría; entre el sexo de los estudiantes y su opinión respec- to a la reelección del Decano.
Coeficiente de correlación phi en la muestra
Se definen:
X: variable dicotómica con valores 0 y 1, Y: variable dicotómica con valores 0 y 1, p (^) x : proporción de puntuaciones 1 en la variable X, q (^) x^ : proporción de puntuaciones 0 en la variable X, p (^) y : proporción de puntuaciones 1 en la variable Y, q (^) y : proporción de puntuaciones 0 en la variable Y, p (^) xy : proporción de puntuaciones 1 tanto en la variable X como en la variable Y, luego, el coeficiente de correlación phi, φ , se calcula de la siguiente manera:
. (4.1) pq p q
p p p
x x y y
φ= xy^ − x y
Cuando los datos están tabulados en una tabla de contin- gencia (tabla que muestra la ocurrencia conjunta de pares de pun-
Valores de la Valores de la Total variable Y variable X 0 1 1 A B a + b 0 C D c + d Total a + c b + d
guiente metodología:
se presentan los resultados de un seguimiento realizado a 15 estu- diantes de la maestría en Política Social que se matricularon en el semestre 2004-II y que abandonaron el curso de Herramientas de Análisis Cuantitativo. Encontraremos el coeficiente de correla- ción phi y haremos la prueba de hipótesis correspondiente.
X: estado civil 1: no casado 0: casado Y: permanencia 0: abandona el curso 1: permanece en el curso hasta el final
1 0 0 2 1 1 3 0 1 4 0 0 5 1 1 6 1 0 7 0 0 8 1 1 9 0 0 10 0 1 11 0 0 12 1 1 13 0 0 14 0 0 15 0 0
Solución
La información anterior se resume en el siguiente cuadro:
Valores de la Valores de la variable X variable Y 0 (casado) 1 Total 1 (permanece) 2 4 6 0 (abandona) 8 1 9 Total 10 5 15
y se calculan las respectivas proporciones:
p (^) x = =^0.^6667
q (^) x = =^0.^4
p (^) y= =
q (^) y = =^0.^2667
p (^) xy= =
que se reemplazan en la fórmula:
( )( )( )( )
El coeficiente de correlación phi en la muestra entre estado civil y deserción vale 0.578. ¿Es estadísticamente significativo el valor encontrado?. A continuación responderemos la pregunta planteada usando la metodología de pruebas de hipótesis.
Paso 1: La hipótesis nula es que no existe asociación entre esta- do civil y deserción en los estudios y la hipótesis alternativa nie- ga ese enunciado. Si ρ^ phies la asociación entre estado civil y de- serción, las hipótesis son:
Paso 2: El valor de la estadística de prueba es:
Paso 3: Para α = 0.05, P( Z< zteórico)^ = 0. 95 , por lo que la región de rechazo es el intervalo (- ∞, -1.96) ∪ (1.96, ∞).
se rechaza la hipótesis nula. Luego, con nivel de significación 0.05, existe evidencia para rechazar la hipótesis nula. Cabe indicar, que por razones estrictamente académicas, en el ejemplo se ha considerado un tamaño de muestra menor que
Paso 3: Para α = 0.05 P (^ Z< zteórico)^ = 0. 975 , por lo que la región
de rechazo es el intervalo (- ∞, -1.96) ó el intervalo (1.96, ∞).
do, no se rechaza la hipótesis nula. Luego, con nivel de significa- ción 0.05, no existe evidencia para rechazar la hipótesis nula de que las variables deserción y estado civil no están asociadas.
evidencia para rechazar la hipótesis nula.
TADO CIVIL/ STATISTICS/ seleccionar PHI/CONTINUE/ OK. El output del SPSS es el siguiente: ESTADO CIVIL Total 0 1
DESERCIÓN 0 9 7 16 1 17 8 25 Total 26 15 41
Symmetric Measures
Value Approx. Sig.
Nominal by Nominal Phi -.119. N of Valid Cases 41
El coeficiente de correlación biseral-puntual se usa cuando una variable es de naturaleza cualitativa dicotómica y la segunda es interval o de razón. Por ejemplo, podemos estar interesados en saber si existe alguna asociación entre sexo (Y) y altura de los estudiantes (X).
Coeficiente de correlación biseral-puntual en la muestra
Y es una variable dicotómica (1 y 0), X es una variable continua
la variable tiene puntaje "1",
la variable tiene puntaje "0",
n 1 : número de unos en la variable Y, n 0 : número de ceros en la variable Y,
luego, el coeficiente de correlación biseral se calcula con:
( 1 )
1 0 0 1 −
n^ n
nn S
X X r x
bP (^) (4.2)
Prueba de hipótesis para el coeficiente de correlación
Paso 1: En la hipótesis nula se postula que no existe asociación entre las dos variables en la población y la hipótesis alternativa
rrelación biseral-puntual en la población, entonces, las hipótesis son:
X 1 : con las estaturas de los adolescentes del sexo masculino. Es decir: Y se realizan los cálculos auxiliares, para luego obtener el co- eficiente de correlación biseral-puntual:
x=
x =
n 1 =^8 n 0 =^7 sx=^4.^749
15 (
r (^) bP=
¿Es estadísticamente significativo el valor del coeficiente de correlación biseral puntual encontrado en la muestra?. Para res- ponder la pregunta planteada, procederemos a usar la metodo- logía de pruebas de hipótesis.
Adolescente Sexo (Y) Estatura (X) X0 X
1 1 69 - 69 2 0 67 67 - 3 1 73 - 73 4 1 65 - 65 5 0 55 55 - 6 1 72 - 72 7 0 62 62 - 8 0 60 60 - 9 1 64 - 64 10 1 66 - 66 11 1 63 - 63 12 0 61 61 - 13 1 62 - 62 14 0 63 63 - 15 0 60 60 -
Paso 1: Se postula como hipótesis nula que no existe asociación entre sexo y estatura en la población y la hipótesis alternativa niega esa afirmación. Si se denota con ρbp el coeficiente de correla- ción biseral-puntual en la población, entonces, las hipótesis son:
Paso 2: El valor de la estadística de prueba es:
bp
bp
Paso 3: Para α = 0.05 P( t( 13 )<^ tteórico)^ = 0. 975 , en la tabla t-Stu-
rechazo es el intervalo (2.16, ∞).
se rechaza la hipótesis nula.
Ejemplo 4.
Si se quiere resolver el ejemplo anterior usando comandos del SPSS no se puede encontrar directamente el coeficiente, pues el SPSS sólo nos proporciona los cálculos auxiliares que luego se reemplaza en la fórmula (4.2) y se sigue la trayectoria descrita para realizar la prueba de hipótesis. En el SPSS se siguen los si- guientes pasos:
Crear (o abrir) el archivo, en este caso vamos a ilustrar con la base de DATOS9-puntual, con las dos variables X e Y. Crear la variable ficticia X 0 donde se guarda las estaturas del sexo femenino. Se usa el comando recode. Crear la variable ficticia X 1 donde se guarda las estaturas del sexo masculino. Se usa el comando recode.
como la descrita.
Coeficiente de correlación en la muestra
Sean:
X: variable con distribución normal que ha sido dicotomizada
0 estatuta < 1.50 mts
Y: variable con distribución normal que ha sido dicotomizada Y = 1 respuesta correcta 0 respuesta incorrecta,
para las que se encuentra la siguiente tabla bidimensional:
Se calcula el cociente
E del Apéndice, donde se encuentran funciones del cociente
obtenido:
es mayor que 1, de la Tabla E se obtiene directamente el valor del coeficiente tetracórico, en la co- lumna (^) r (^) t , (4.3)
es menor que 1, en la Tabla E se lee la columna (ad)/(bc) y el valor (^) r (^) t del coeficiente tetracórico será negativo.
Prueba de hipótesis para el coeficiente
ITEM Y ITEM X 0 1
1 a b 0 c d
Paso 1: La hipótesis nula indica que no existe asociación entre las dos variables en la población y la hipótesis alternativa niega esa
córico en la población, entonces, las hipótesis son:
Paso 2: Bajo la hipótesis nula, y para tamaños de muestra mayo- res que 20, la distribución del coeficiente (^) r (^) t es aproximadamen-
te normal con medio cero y desviación estándar x y
x x y y
donde:
mizada,
mizada Y,
área (ver la tabla A) y
área (ver la tabla A). Así, para un tamaño de muestra mode- rado o muy grande:
x y
x x y y
t
normal unitaria para contrastar que el coeficiente ρt de la po-
blación vale cero. Con los resultados obtenidos en la muestra se calcula el va-
Paso 3: Para α = 0.05 P(^ t( n− 2 ) de hipótesis.
Paso 1: Se postula en la hipótesis nula que no existe asociación entre las respuestas a las preguntas X e Y. La hipótesis alternati- va niega dicha afirmación.
Paso 2: Con los datos de la muestra procedemos a realizar los cálculos de:
En la Tabla A del anexo se observa que la ordenada de la
Finalmente obtenemos el valor de la estadística de prueba:
Paso 3: Para α = 0.05 P^ (^ z<^ zteórico)^ =^0.^975 , en la tabla normal
Luego, la región de rechazo es el intervalo (1.96, ∞).
se rechaza la hipótesis nula y concluimos que el coeficiente de correlación tetracórico de la población no es nulo, cuando el ni- vel de significación es 0.05.
Ejemplo 4.
Suponga que para una determinada tabla de contingencia 2x2,
a=62, b=20, c=10, d=24 y se desea obtener el valor del coeficiente de correlación tetracórico.
Como
Se encuentra que el valor del coeficiente de correlación tetracó-
rico es negativo, (^) r t = -0.67. Debe prevenirse al lector sobre la posibilidad de cometer se-
rios errores. No debe emplearse el método si
se apartan considerablemente de 0.5. Si
yores que 0.7 o menores que 0.3, tampoco debería utilizarse la tabla A, y en su lugar, debería emplearse las tablas de Jenkins (1955). Cuando las distribuciones subyacentes son normales, sola- mente esta propiedad confiere superioridad al coeficiente (^) r (^) t so- bre el coeficiente PHI como medida de asociación.
Ejemplo 4.
Si deseamos encontrar el coeficiente de correlación tatracórico para las variables de la base de DATOS6-tetracórico, se observa que son 99 estudiantes, donde las notas del curso de estadística y del curso de metodología de investigación han sido dicotomiza- das, pues los profesores calificaron con aprobado o desaproba- do. Obtendremos el coeficiente de correlación tetracórico.
Y: notas en el curso de estadística- dicotimizada, 0 desaprobó con notas inferiores a 11 1 aprobó con notas de 11 o más
X: notas en el curso de metodología de investigación-dico- tomizada, 0 desaprobó con notas inferiores a 11
te diferente de cero el coeficiente de correlación tetracórico en la población?. Se deja como ejercicio para el estudiante.
Se usa en situaciones donde se tiene dos variables con distri- buciones normales subyacentes, una de las cuales ha sido di- cotomizada. Una de las situaciones donde se puede obtener el coeficiente de correlación biseral es la siguiente. Un profesor desea relacio- nar el tiempo que los estudiantes emplean en resolver un proble- ma (X) y la habilidad que tiene para resolver el problema (Y). El profesor anota el tiempo (X) que cada estudiante demora en resolver el problema, pero la variable Y no la calificó con una nota en la escala vigecimal o cualquier otra, sólo anotó que apro- bó (1) si llegó a la solución correcta y anotó no aprobó (0) si no llegó a la solución correcta.
Coeficiente de correlación biseral en la muestra
Sean las variables continuas Y dicotomizada (1 y 0) y X también dicotomizada (0 y 1).
Calcular:
X 0 : la media de las puntuaciones de la variable X para los que en Y tienen puntaje "0", X 1 : la media de las puntuaciones de la variable X para los que en Y tienen puntaje "1", S (^) X: desviación estándar de la variable X,
Usar la TABLA A, para obtener:
normal, en el punto a partir del cual se obtiene el porcentaje 100(
Luego el coeficiente de correlación biseral muestral es igual a:
u n n n
nn S
X X r x
b (^) (4.4)
Este coeficiente puede ser menor que -1 y mayor que +1. Estos valores extremos indican que no era cierto que las puntuaciones X, categorizadas, tienen distribución normal sub- yacente o también puede indicar fluctuaciones de muestreo cuan-
platicúrtica.
Prueba de hipótesis para el coeficiente
Paso 1: La hipótesis nula indica que no existe asociación entre las dos variables en la población y la hipótesis alternativa niega
ción biseral en la población, entonces, las hipótesis son:
Paso 2: Bajo la hipótesis nula, y para tamaños de muestra mayo- res que 20, la distribución del coeficiente (^) r b es aproximadamen-
te normal con medio cero y desviación estándar
estadística:
taria para contrastar que el coeficiente ρ (^) bpoblacional vale cero.