Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


estadistica t8, Apuntes de Estadística

Asignatura: Estadistica 1, Profesor: coello coello, Carrera: Psicología, Universidad: UCM

Tipo: Apuntes

2015/2016

Subido el 06/11/2016

mvg27
mvg27 🇪🇸

4.5

(11)

9 documentos

1 / 27

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
Tema 8. Correlación entre variables
cualitativas y cuasi-cuantitativas!
1.Concepto de correlación
2.Correlación entre variables cualitativas: χ2 y
coeficiente C de contingencia
3.Correlación entre variables cuasi-cuantitativas:
coeficiente de correlación de Spearman rs
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b

Vista previa parcial del texto

¡Descarga estadistica t8 y más Apuntes en PDF de Estadística solo en Docsity!

1

Tema 8. Correlación entre variables

cualitativas y cuasi-cuantitativas

1. Concepto de correlación

2. Correlación entre variables cualitativas: χ

2

y

coeficiente C de contingencia

3. Correlación entre variables cuasi-cuantitativas:

coeficiente de correlación de Spearman r

s

2

1. Concepto de correlación

La correlación hace referencia a la variación conjunta de dos o más variables, analizando las características de la posible relación entre ellas:

  • Existe correlación entre variables si cierta o ciertas modalidades de una variable están ligadas o se dan de forma conjunta con cierta o ciertas modalidades de otra variable u otras variables
  • Se analiza: ü intensidad ü sentido
  • En función del tipo de variables implicadas se utilizaran diferentes índices de correlación

4 Correlación entre variables cualitativas Y 1 Y 2 … Yj … Yc X 1 n 11 n 12 … n1j … n1c X 2 n 21 n 22 … n2j … n2c … … … … … … Xi ni1 ni2 … nij … nic … … … … … … Xf nf1 nf2 … nfj … nfc … … € n • 1 € n • 2 € njncn 1 • € n 2 • € n i • € n (^) f • € N Número de sujetos con la modalidad 1 de la variable Y con cualquier modalidad en la variable X Número de sujetos con la modalidad j de la variable Y y con cualquier modalidad en la variable X Número de sujetos con la modalidad de la variable i de la variable X y con la modalidad j de la variable Y Número de sujetos con la modalidad 1 de la variable X y con cualquier modalidad en la variable Y Número de sujetos con la modalidad i de la variable X y con cualquier modalidad en la variable Y Número de sujetos con la modalidad 1 de la variable X con modalidad 2 en la variable Y Número de sujetos con la modalidad 1 de la variable X con modalidad 1 en la variable Y Número de sujetos con la modalidad 2 de la variable X con modalidad 1 en la variable Y

5 Concepto Correlación entre variables cualitativas Y: Sexo (mujer, varón) Sexo Varón (B 1 ) Mujer (B 2 ) Fumar Sí (A 1 ) 42 (A 1 B 1 ) 28 (A 1 B 2 ) 70 (A 1 ) No (A 2 ) 18 (A 2 B 1 ) 12 (A 2 B 2 ) 30 (A 2 ) 60 (B 1 ) 40 (B 2 ) 100 (N) X: Fumar (sí, no)

7

Índice de correlación: χ

χ

= ( f

e

f

t

)

f

t

f

t ( ij )

n

i •

n

  • j

N

Frecuencia empírica u observada: la frecuencia obtenida en la muestra para cada casilla Frecuencia teórica: la frecuencia que se esperaría obtener si las variables no tuviesen relación Cálculo

8 Sexo Varón Mujer Fumar Sí 42 28 70 No 18 12 30 60 40 100 f t ( 11 ) = 70

  • 60 100 = 42 f t ( 21 ) = 30

60 100 = 18 € ft ( 12 ) = (^70) • 40 100 = 28 f t ( 22 ) = 30

40 100 = 12 Ejemplo Índice de correlación: χ 2 (42) (18) (28) (12)

10

  1. No tiene límite máximo no podemos saber la intensidad de la relación

Índice de correlación: χ

Inconvenientes

  1. Al multiplicar por k el valor de χ 2 aumenta sin que lo haga la relación entre las variables Se utiliza como índice de la intensidad de la relación el COEFICIENTE C DE CONTINGENCIA

11

Coeficiente C de Contingencia

  1. C es función del nº de filas y de columnas para comparar valores obtenidos con las mismas variables en distintas muestras es necesario que el número de filas y de columnas sea el mismo
0 ≤ C < 1

C = χ

n + χ

número total de casos Cálculo Propiedades

13

  1. Existencia de relación

Coeficiente C de Contingencia

Interpretación

  1. Intensidad de la relación
    • Se compara el valor del coeficiente C con: ü C max si la tabla de contingencia es cuadrada ü 1 si la tabla de contingencia no es cuadrada cuanto más próximo a 0, menor intensidad cuanto más próximo al valor máximo (C max ó 1), mayor intensidad
  • Siempre conviene comparar con los valores obtenidos en otras investigaciones (con las mismas variables y el mismo número de categorías en cada una de ellas)
C

C (^) No existe relación entre las variables Existe relación entre las variables

14

  1. Sentido de la relación ¿Qué modalidades de una variable se relacionan con qué modalidades de la otra? Se comparan las frecuencias empíricas con las frecuencias teóricas de cada casilla Se relacionan aquellas modalidades correspondientes a las casillas cuya frecuencia empírica es distinta de la teórica
  • En estadística inferencial: se interpretan los residuos tipificados mayores que +2 o menores que -

Coeficiente C de Contingencia

Interpretación (cont.)

16

  1. Ver si existe correlación:
  2. Intensidad: Intensidad media Hay comparar con los valores obtenidos en otras investigaciones realizadas con las mismas variables y el mismo número de categorías en cada una de ellas 2 x 2 ⇒ C max = ( 2 − 1 ) 2 = 0 , 707 24 20 ( 32 20 ) 30 ( 18 30 ) 20 ( 8 20 ) 30 ( ) ( 42 30 ) (^22222) 2 = −

t e t f f f χ 0 , 43 24 100 24 2 2 =

=

= N C χ χ Correlación entre variables cualitativas

C = 0 , 43 Existe relación entre el género y tener

trastorno de la alimentación

2

Ejemplo (Cont.)

17 Trastorno de la alimentación Sí No Sexo Mujer (^) Recuento (f e) Frecuencia esperada (ft) 42 8 50 Varón (^) Recuento (f e) Frecuencia esperada (ft) 18 32 50 60 40 100 (30) (20) (30) (20) **[f e > f t ]

[f e > f t ]

[f e < f t ]**

- Existe una tendencia mayor entre las mujeres a tener trastorno de la alimentación y entre los varones a no tenerlo Correlación entre variables cualitativas Ejemplo (Cont.) [fe < ft] -

19 Correlación entre variables cuasi-cuantitativas: coeficiente de correlación de Spearman r s Concepto

  • Existe correlación positiva si los sujetos que ocupan las primeras posiciones en X tienden a ocupar las primeras posiciones en Y y los sujetos que ocupan las últimas posiciones en X tienden a ocupar las últimas posiciones en la Y y los sujetos con posiciones intermedias en X tienden a ocupar posiciones intermedias en Y
  • Existe correlación negativa si los sujetos que ocupan las primeras posiciones en X tienden a ocupar las últimas posiciones en Y y los sujetos que ocupan las últimas posiciones en X tienden a ocupar las primeras posiciones en la Y y los sujetos con posiciones intermedias en X tienden a ocupar posiciones intermedias en Y
  • No existe correlación si algunos sujetos que ocupan las primeras posiciones en en ocupan las primeras posiciones en Y, otros las últimas posiciones en Y y otros posiciones intermedias en Y

20

Coeficiente de correlación de

Spearman (r

s

Notas en matemáticas Notas en literatura Sujeto 1 8 7 Sujeto 2 3 8 Sujeto 3 5 4 Sujeto 4 4 6 Sujeto 5 9 5 Notas en matemáticas (órdenes) Notas en literatura (órdenes) Sujeto 1 2º 2º Sujeto 2 5º 1º Sujeto 3 3º 5º Sujeto 4 4º 3º Sujeto 5 1º 4º

r

s

6 d

i 2 i = 1 n

n n

2 ( −^1 ) d i la diferencia en el orden que ocupa el sujeto “i” en las dos variables Cálculo Ejemplo