¡Descarga Análisis de Datos en Psicología II: Introducción a la Inferencia Estadística - Prof. Olmos y más Ejercicios en PDF de Psicología solo en Docsity!
Análisis de datos
en psicología II
Formulario
Curso 2011-
Capítulo 1
Introducción a la inferencia
Distribución muestral del estadístico media
- Si Y 1 , Y 2 , ..., Y (^) n , son variables aleatorias continuas: y.
- Si las variables Y 1 , Y 2 , ..., Y (^) n se distribuyen normalmente con parámetros y , entonces la distribución muestral de es también normal con parámetros y.
- Y de acuerdo con el teorema del límite central siendo Y 1 , Y 2 , ..., Y (^) n , variables aleatorias independientes e igualmente distribuidas (cualquiera que sea su distribución) con parámetros y , ambos finitos, la distribución muestral de tiende a la normalidad, con parámetros y a medida que n va aumentando.
- Si es una variable aleatoria que, bajo las mencionadas circunstancias, se distribuye nor- malmente, entonces:
Y con desconocida:
Distribución muestral del estadístico proporción
Si: – X es una variable dicotómica: 1 = “éxito” y 0 = “fracaso”;
- Medida en una muestra aleatoria de tamaño n ;
- Con proporción de éxito ( 1 ) constante en cada extracción;
- n 1 = “número de éxitos en las n extracciones”, es decir: ;
- P 1 = n 1 /n = “proporción de éxitos en las n extracciones”.
Entonces:
Y a medida que el tamaño muestral va aumentando:
Capítulo 2
Inferencia con una variable
Una variable dicotómica: contraste sobre una proporción
- Variable dicotómica.
- Muestra aleatoria de tamaño n.
- 1 = probabilidad asociada a una de las dos categorías de la variable.
- Hipótesis : a. Contraste bilateral: H 0 : 1 = k 0 ; H 1 : 1 =/ k 0. b. Contraste unilateral derecho: H 0 : 1 <$ k 0 ; H 1 : 1 > k 0. c. Contraste unilateral izquierdo: H 0 : 1 >$ k 0 ; H 1 : 1 < k 0. ( k 0 se refiere a la proporción concreta que interesa contrastar).
- Supuestos : muestra aleatoria de n observaciones con probabilidad de éxito constante en cada extracción.
- Estadísticos del contraste : 3.1. n 1 ' «número de éxitos en los n ensayos». P 1 ' n 1 / n ' «proporción de éxitos en los n ensayos».
3.2. (^) = =
- Distribuciones muestrales : 4.1. n 1 y P 1 se distribuyen según el modelo binomial con parámetros n y 1. 4.2. Z se aproxima a la distribución N (0, 1) a medida que n va aumentando^3.
- Reglas de decisión : a. Contraste bilateral: a .1. Se rechaza H 0 si n 1 o P 1 toman un valor tan alejado de su valor esperado bajo H 0 que la probabilidad de obtener un valor tan alejado como ése o más es menor que /2. a .2. Se rechaza H 0 si Z <$ Z /2 o Z >$ Z 1! /. b. Contraste unilateral derecho: b .1. Se rechaza H 0 si n 1 o P 1 toman un valor tan grande que la probabilidad de obtener un valor como ése o mayor es menor que . b .2. Se rechaza H 0 si Z >$ Z 1! . c. Contraste unilateral izquierdo: c .1. Se rechaza H 0 si n 1 o P 1 toman un valor tan pequeño que la probabilidad de obtener un valor como ése o más pequeño es menor que . c .2. Se rechaza H 0 si Z <$ Z .
- Intervalo de confianza : =.
Una variable politómica: contraste sobre bondad de ajuste
- Variable categórica ( X ) con I categorías.
- Muestra aleatoria de tamaño n.
- Cada observación puede ser clasificada en una (y sólo una) de las I categorías de la variable X (^) i.
- El subíndice i se refiere, de forma genérica, a una cualquiera de esas categorías ( i = 1, 2, ..., I ).
- i = la probabilidad asociada a cada categoría.
- Con n extracciones se tiene, como resultado muestral, n 1 observaciones en la categoría 1, n 2 observaciones en la categoría 2, ..., n (^) I observaciones en la categoría I.
X 1 2 ... i ... I
n (^) i n 1 n 2 ... n (^) i ... n (^) I n
X = variable categórica. n (^) i = número de sujetos clasificados en la categoría i (frecuencias observadas). mi = n i (Frecuencias esperadas: número de sujetos que cabe esperar en la categoría i ).
En este contexto, el concepto de bondad de ajuste se refiere al grado en que lo encontrado en la muestra ( n (^) i ) se parece (se ajusta) a lo que teóricamente debería haberse encontrado ( mi ).
- Hipótesis : H 0 : f ( n (^) i ) = M ( n ; 1 , 2 , ..., I ). Es decir, la función de probabilidad de la variable n (^) i es multinomial con probabilidades teóricas 1 , 2 , ..., I asociadas a cada categoría i de la variable X. H 1 : f ( n (^) i ) =/ M ( n ; 1 , 2 , ..., I ). Es decir, la función de probabilidad de la variable n (^) i no es la propuesta en H 0.
- Supuestos : tenemos una muestra aleatoria de n observaciones ( n ensayos) clasificada en las I categorías exclusivas y exhaustivas de una variable categórica. La probabilidad de que una observación pertenezca a cada una de las categorías de la variable se mantiene constante en los n ensayos (es decir, las n observaciones son independientes entre sí).Y no más del 20 % de las frecuencias esperadas ( mi ) son menores que 5.
- Estadístico del contraste (ver ecuación [9.4]): (^) =
- Distribución muestral : se aproxima a con I! 1 grados de libertad. La aproximación es tanto mejor cuanto mayores son las frecuencias esperadas de las casillas.
- Zona crítica : >$.
- Regla de decisión : se rechaza H 0 si el estadístico cae en la zona crítica; en caso contrario, se mantiene.
- Intervalo de confianza para la proporción teórica de cada casilla: siendo P (^) i = n (^) i / n y teniendo en cuenta que la frecuencia de cada casilla se distribuye según el modelo de probabilidad binomial:
=
Si se rechaza H 0 , este intervalo de confianza permite determinar en qué categorías de la variable falla el ajuste. En concreto, decidiremos que el ajuste se rompe en una categoría cualquiera i cuando el intervalo construido para esa categoría a partir de P (^) i no incluya el valor de la corres- pondiente proporción teórica i.
Capítulo 3
Inferencia con dos variables categóricas
Prueba X^2 de Pearson
- Dos variables: la primera, X , con I categorías a cada una de las cuales nos referiremos con el subíndice i ( i = 1, 2, ..., I ); la segunda, Y , con J categorías a cada una de las cuales nos refe- riremos con el subíndice j ( j = 1, 2, ..., J ).
- n observaciones de una muestra aleatoria son clasificadas según dos criterios: las I categorías de la variable X y las J categorías de la variable Y.
- Llamaremos i+ a la probabilidad de que una observación cualquiera pertenezca a la categoría i de la variable X (^) i. Llamaremos +j a la probabilidad de que una observación cualquiera per- tenezca a la categoría j de la variable Y (^) j. Y llamaremos, por último, ij a la probabilidad de que una observación cualquiera pertenezca a una de las IJ casillas.
Y
X 1 2 AAA j AAA J n (^) i + 1 n 11 n 12 AAA n 1 j AAA n 1 J n 1+ n (^) i j n (^) i + n + j n
= frecuencias conjuntas de X e Y. = frecuencias marginales de X. = frecuencias marginales de Y. = número total de casos.
2 n 21 n 22 AAA n 2 j AAA n 2 J n 2+ AAA AAA AAA AAA AAA AAA AAA AAA i n (^) i 1 n (^) i 2 AAA n (^) i j AAA n (^) i J n (^) i + AAA AAA AAA AAA AAA AAA AAA AAA I n (^) I 1 n (^) I 2 AAA n (^) I j AAA n (^) I J n (^) I + n + j n +1 n +2 AAA n + j AAA n + J n
- Hipótesis : H 0 : X e Y son variables independientes (es decir, = , para todo ij ). H 1 : X e Y no son variables independientes (es decir, =/ , para algún ij ).
- Supuestos : una muestra aleatoria de n observaciones es clasificada en las I × J combinaciones (casillas) resultantes de combinar dos variables categóricas; la probabilidad de que una obser- vación cualquiera pertenezca a cada una de las casillas se mantiene constante durante todo el proceso de clasificación; no más del 20 % de las frecuencias esperadas son menores que 5 (ver, en el Apéndice 9, el apartado Supuestos del estadístico X 2 de Pearson ).
- Estadístico del contraste (ver 10.7]: (^) = ( )
- Distribución muestral : se aproxima a con ( I !1) ( J !1) grados de libertad.
- Zona crítica : >$ (ver Tabla D del Apéndice final).
- Regla de decisión : se rechaza H 0 si el estadístico cae en la zona crítica; en caso contrario, se mantiene. Si se rechaza H 0 se concluye que las variables X e Y están relacionadas.
Residuos tipificados corregidos: =
Medidas de asociación: C = , =
Prueba de McNemar
Y n 1+ n + n 11 , n 22 n 12 n 21 n
' nº de casos con X ' 1 ' nº de casos con Y ' 1 ' nº de casos con X ' Y ' nº de casos con X < Y ' nº de casos con X > Y ' nº total de casos
X 1 2 Total 1 n 11 n 12 n 1+ 2 n 21 n 22 n 2+ Total n +1 n +2 n
1+ = proporción de “unos” en X o en el momento “antes”. +1 = proporción de “unos” en Y o en el momento “después”.
- Hipótesis : a. Contraste bilateral: H 0 : 1+ = +1 ; H 1 : 1+ =/ +. b. Contraste unilateral derecho: H 0 : 1+ <$ +1 ; H 1 : 1+ > +. c. Contraste unilateral izquierdo: H 0 : 1+ >$ +1 ; H 1 : 1+ < +.
- Supuestos : muestra aleatoria de n sujetos en la que se ha medido una variable dicotómica en dos momentos distintos ( X e Y ) o dos variables dicotómicas ( X e Y ) con las mismas categorías; o bien, muestra aleatoria de n pares ( X e Y ) de sujetos en la que se ha medido una variable dicotómica.
- Estadístico del contraste : =.
- Distribución muestral : se aproxima a la distribución ji-cuadrado con 1 grado de liber- tad ( ). La aproximación es buena incluso con muestras pequeñas.
- Zonas críticas : a. Contraste bilateral: >$. b. Contraste unilateral derecho 2 : >$. c. Contraste unilateral izquierdo^2 : >$.
- Decisión : se rechaza H 0 si el estadístico del contraste cae en la zona crítica; en caso contrario, se mantiene.
- Nivel crítico (valor p ): a. Contraste bilateral: p = [ P ( >$ )]. b. Contraste unilateral derecho: p = 2 [ P ( >$ )]. c. Contraste unilateral izquierdo: p = 2 [ P ( >$ )].
- Intervalo de confianza (ver [3.6]): =.
Índice de riesgo relativo: =
Odds ratio: = =
Contraste sobre el coeficiente de correlación de Spearman
- Hipótesis : a. Contraste bilateral: H 0 : X e Y no están relacionadas. H 1 : la relación entre X e Y es monótona. b. Contraste unilat. derecho: H 0 : X e Y no están relacionadas. H 1 : la relación entre X e Y es monótona creciente. c. Contraste unilat. izquierdo: H 0 : X e Y no están relacionadas. H 1 : la relación entre X e Y es monótona decreciente.
- Supuestos : muestra aleatoria de n pares de puntuaciones, independientes entre sí, obtenidos al medir dos variables al menos ordinales.
- Estadísticos del contraste :
3.1. R (^) S = 1!
3.2. T (^) =
- Distribución muestral : 4.1. Los puntos críticos r 1! de la distribución muestral de R (^) S se encuentran en la Tabla R del Apéndice final para n <$ 30 y algunos valores de . 4.2. La distribución del estadístico T se aproxima al modelo de probabilidad t de Student con n! 2 grados de libertad ( t (^) n! 2 ).
- Zona crítica : a. Contraste bilateral: a .1. R (^) S < r / 2 y R (^) S > r 1! / 2. a .2. T <$ t (^) n !2; / 2 y T >$ t (^) n !2; 1! / 2. b. Contraste unilateral derecho: b .1. R (^) S > r . b .2. T >$ t (^) n !2; 1! . c. Contraste unilateral izquierdo: c .1. R (^) S < r 1! . c .2. T <$ t (^) n !2; .
- Regla de decisión : se rechaza H 0 si el estadístico del contraste cae en la zona crítica; en caso contrario, se mantiene.
- Nivel crítico (valor p ): a. Contraste bilateral: p = 2[ P ( T >$ * T (^) h *)], siendo T (^) h el valor muestral concreto que toma el estadístico T. b. Contraste unilateral derecho: p = P ( T >$ T (^) h ). c. Contraste unilateral izquierdo: p = P ( T <$ T (^) h ).
Capítulo 5
Inferencia con una variable categórica
y una cuantitativa
Prueba T para dos medias independientes
- Hipótesis : a. Contraste bilateral: H 0 :! = k 0 ; H 1 :! =/ k 0. b. Contraste unilateral derecho: H 0 :! <$ k 0 ; H 1 :! > k 0. c. Contraste unilateral izquierdo: H 0 :! >$ k 0 ; H 1 :! < k 0.
- Supuestos : tenemos dos muestras de tamaños n 1 y n 2 seleccionadas aleatoria e independiente- mente de dos poblaciones normales.
- Estadístico del contraste^5 :
3.1. Si puede asumirse = : T (^) =
3.2. Si no puede asumirse = : T N (^) =
- Distribución muestral : T y T N se distribuyen según.
4.1. Para T , gl = n 1 + n 2! 2
4.2. Para T N, gl (^) =
- Zona crítica : a. Contraste bilateral: T o T N <$ y T o T N >$. b. Contraste unilateral derecho: T o T N >$. c. Contraste unilateral izquierdo: T o T N <$.
- Regla de decisión : rechazar H 0 si el estadístico T cae en la zona crítica; en caso contrario, man- tenerla.
- Intervalo de confianza : (^) =
Medidas del tamaño del efecto
=
R XY =
- Distribución muestral : la Tabla J del Apéndice final contiene los puntos críticos t bilaterales de la distribución muestral de T (^) DB y T N DB para F = 0,05 y F = 0,01, y para diferentes valores de k (número de comparaciones) y gl error. En el caso de T (^) DB , gl error = N! J. En el caso de T N DB ,
gl Nerror =
- Decisión : se rechaza la hipótesis nula si el valor de T (^) DB o de T N DB es mayor que el corres- pondiente punto crítico de la Tabla J.
- Intervalo de confianza : = ±
Comparaciones de tendencia
Si la VI es cuantitativa y sus niveles se encuentran igualmente espaciados, puede utilizarse el pro- cedimiento del apartado anterior para estudiar el tipo de relación entre la VI y la VD. Lo único que hay que hacer es seleccionar los coeficientes oportunos de la tabla de polinomios ortogonales (tabla H del Apéndice final).
Prueba de Dunnett para comparaciones con un grupo control
DMS (^) Dunnett =
donde t es el valor de la Tabla K del Apéndice final que corresponde a un nivel de significación F con J medias (incluida la del grupo control) y N! J grados de libertad. La tabla ofrece puntos críticos para (^) F = 0,05 y (^) F = 0,01, y para contrastes bilaterales y unilaterales
Comparaciones post hoc o a posteriori
Prueba de Tukey
DMS (^) Tukey =
donde q es el cuantil de la distribución del rango studentizado (Tabla L del apéndice final) que corresponde a un nivel de significación (^) F con J medias y N! J grados de libertad. Los puntos críticos de la Tabla L se refieren siempre a contrastes bilaterales.
Con tamaños muestrales desiguales: DMS (^) Tukey-Kramer =
Intervalo de confianza para la diferencia entre dos medias: = | Y
_
j!^ Y
_
j N | ±^ DMS^ Tukey
Prueba de Scheffé
DMS (^) Scheffé =
Intervalo de confianza: = ]
Si no puede asumirse homocedasticidad: DMS (^) Brown-Forsythe =
con gl Nerror =
Capítulo 7. Análisis de varianza (II)
Dos factores completamente aleatorizados
Factor B Factor A b 1 b 2 ··· b (^) k ··· b (^) K Suma a (^) 1 ··· ··· a (^) 2 ··· ··· ··· ··· ··· ··· ··· ··· ··· ··· a (^) j ··· ··· ··· ··· ··· ··· ··· ··· ··· ··· a (^) J (^) ··· ···
Suma ··· ···
- Hipótesis : a. H 0 ( A ) : (^) 1+ = (^) 2+ = · · · = (^) J + (las medias poblacionales correspondientes a los J niveles del factor A son iguales). Es decir, no existe efecto del factor A. H 1 ( A ) : (^) j + =/ (^) j ’+ para algún j o j N (con j =/ j N ) (no todas las medias correspondientes a los niveles del factor A son iguales). Es decir, existe efecto del factor A. b. H 0 ( B ) : (^) +1 = (^) +2 = · · · = (^) + K (las medias poblacionales correspondientes a los K niveles del factor B son iguales). Es decir, no existe efecto del factor B. H 1 ( B ) : (^) + k =/ (^) + k ’ para algún k o k N (con k =/ k N ) (no todas las medias correspondientes a los niveles del factor B son iguales). Es decir, existe efecto del factor B. c. H 0 ( AB ) : (^) j k! (^) j ’ k = (^) j +! (^) j ‘+ para todo j , j N o k (con j =/ j N) (la diferencia entre las medias de dos casillas cualesquiera de la misma columna es igual a la diferencia entre las medias marginales correspondientes a esas casillas). Es decir, no existe efecto de la interacción. H 1 ( AB ) : j k! (^) j ‘ k =/ (^) j +! (^) j ‘+ para algún j , j N o k (con j =/ j N) (no todas las diferencias entre las medias de dos casillas cualesquiera de la misma columna son iguales a la diferencia entre las medias marginales correspondientes a esas casillas). Es decir, existe efecto de la interacción.
- Supuestos : JK muestras de tamaño n aleatoriamente seleccionadas de JK poblaciones normales con la misma varianza.
- Estadísticos del contraste :
a. Para H 0 ( A ) : F (^) A =
b. Para H 0 ( B ) : F (^) B =
c. Para H 0 ( AB ) : F (^) AB =
Capítulo 8. Análisis de varianza (III)
Un factor con medidas repetidas
ANOVA de un factor con medidas repetidas (A-MR)
- Hipótesis : H 0 : = = · · · = (todas las medias son iguales). H 1 : =/ para algún j o j N ( j =/ j N) (no todas las medias son iguales).
- Supuestos : J muestras aleatoriamente seleccionadas de J poblaciones normales con la misma varianza; asumimos también que las varianzas de las diferencias entre cada par de medidas son iguales (ver siguiente apartado).
- Estadístico del contraste : F =
- Distribución muestral : F se distribuye según F (^) J! 1, ( n !1) ( J! 1).
- Zona crítica : F >$ F (^) J! 1, ( J !1) ( n! 1) ; 1! .
- Regla de decisión : se rechaza H 0 si el estadístico F cae en la zona crítica; en caso contrario, se mantiene. El rechazo de H 0 indica que no todas las medias poblacionales son iguales, es decir, que hay al menos una media que difiere de al menos otra.
- Nivel crítico (valor p ): p = P ( F >$ F (^) h ), siendo F (^) h el valor muestral concreto que toma el esta- dístico F.
Medidas del tamaño del efecto
! (^) = (efectos fijos)
! (^) = (efectos aleatorios)