Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


tema 4 dedap, Apuntes de Psicología

Asignatura: dedap, Profesor: Ignacio Martín, Carrera: Psicología, Universidad: UGR

Tipo: Apuntes

2014/2015

Subido el 22/01/2015

almudenaolmedoc
almudenaolmedoc 🇪🇸

3.7

(18)

5 documentos

1 / 16

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
27/10/2010
1
Tema 4. Tema 4.
Descripción Descripción BivariadaBivariada y y
MultivariadaMultivariada de los Datosde los Datos
Ignacio Martín Tamayo DEDAP 2010-2011
1. Introducción
2
Distribuciones
bivariadas
2
.
Distribuciones
bivariadas
3. Representación Gráfica
4. Correlación
5. Regresión
Índice
2
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga tema 4 dedap y más Apuntes en PDF de Psicología solo en Docsity!

Tema 4.Tema 4.

DescripciónDescripción BivariadaBivariada yy

MultivariadaMultivariada de los Datosde los Datos

Ignacio Martín Tamayo (^) DEDAP 2010-

1. Introducción

2 Distribuciones bivariadas2.Distribuciones bivariadas

3. Representación Gráfica

4. Correlación

5. Regresión

Índice

2

‰ Uno de los objetivos principales de la ciencia consiste en descubrir las relaciones entre variables, y la estadística ha desarrollado instrumentos para ello ‰ En el campo de la Psicología podemos preguntarnos si, por ejemplo, el rendimiento laboral en un determinado tipo de trabajo guarda relación con la personalidad del trabajador o si el fracaso escolar es mas probable en niños con determinadas circunstancias familiares y personales. ‰ La observación de relaciones claras y estables entre variables ayuda a comprender los fenómenos y a encontrar explicaciones de los mismos e indica las vías probablemente mas eficaces para intervenir sobre las situaciones. ‰ Desde el punto de vista matemático las relaciones entre variables pueden ser de muchos tipos (Y=1+2·X;Y=X^2 ;Y=8 2 ;Y=1/X).

Introducción

3

‰ Estas funciones son conceptos matemáticos y, por tanto, teóricos e ideales. Son habitualmente útiles en las ciencias exactas, en las que las variables guardan una relación determinista o funcional.

‰ Pero en las ciencias sociales, incluida la psicología nunca se encuentran relaciones deterministas, sino mas bien conjuntos de observaciones que manifiestan una configuración concreta, y nos preguntaremos si esa configuración (que refleja la relación entre variables) se parece a alguno de los modelos teóricos; en caso afirmativo diremos que ese modelo explica bien la relación. ‰ Nosotros nos centraremos en el estudio de las relaciones lineales, que son las más sencillas. Esto es, lo que vamos a exponer en el tema son las formas más habituales de observar y cuantificar las relaciones lineales entre variables ‰ Advertimos por tanto que aunque en el tema hablemos sobre relaciones o correlaciones entre variables, estrictamente hablando deberíamos utilizar la expresión relación lineal y si no lo hacemos será únicamente por

Introducción

4

economía de espacio. ‰ Igualmente los índices que vamos a describir son aplicables exclusivamente a las variables al menos de intervalo. La asociación entre variables con otros niveles de medida (nominales u ordinales) se pueden evaluar por otros procedimientos que exceden los objetivos del temario.

Tiempo de respuesta (X)

ud

de

la

lista

(Y) 2 3 4 5 6 2 2 2 1 0 0 3 2 3 2 1 0 4 1 2 2 2 0 5 0 1 1 3 0

5 8 7 5

Distribución bidimensional

nsionales

Longitu

6 0 1 2 2 1 7 0 1 1 2 2 5 10 9 10 3

(Y/X 1 ) ni 2 2

6 6 37

(Y/X 4 ) ni (X/Y 2 ) ni

(X/Y 5 ) ni

spuesta

2 0 3 1

Distribuciones condicionadas

Distribuciones bidimen

7

Longitud

de

la lista

^2 3 2 4 1 5 0 6 0 7 0 5

( / 2 ) (^) i

Tiempo

de

respuesta

2 2 3 3 4 2 5 1 6 0 8

Longitud

de

la^

lista

^2 3 1 4 2 5 3 6 2 7 2 10

Tiempo

de

res 4 2 5 2 6 1 6

La representaciones gráficas conjunta de dos variables permite

observar visualmente este tipo de relaciones.

Estas representaciones gráficas se denominan diagramasdiagramas dede

dispersióndispersión , que constituyen nubes de puntos donde

representamos los pares de valores de X e Y para cada uno de

a

los sujetos y los representamos en un eje de coordenadas.

4

5

6

spuesta

Representación Gráfica

8

0

1

2

3

0 2 4 6 8

Tiempo

de

re

Longitud de la lista

Relación lineal positiva. Motivación y rendimiento

Relación lineal negativa. Tiempo en una tarea y numero de errores

a

Ausencia de relación lineal. Estatura e Inteligencia

Representación Gráfica

9

1. Introducción

2 Distribuciones bivariadas2.Distribuciones bivariadas

3. Representación Gráfica

4. Correlación

5. Regresión

Índice

10

COEFICIENTE DE CORRELACIÓN DE PEARSON (Rxy )

Un segundo índice de asociación lineal consistirá en hallar también un promedio de productos cruzados, de las puntuaciones típicas. Este índice se denomina coeficiente de correlación de Pearson y se representa por la letra r (a veces puede aparecer en mayúsculas). Así, la correlación de Pearson entre X e Y será:

n

z z r

xi yi xy

·

xi^ · y^ i

Índices de relación

13

x y

xy xy

x y

i i xy

S S

S r

nS S

x y r

·

· ·

=

=

( )( )

∑ (∑^ )^ ∑ (∑^ )

∑ ∑ ∑

− −

2 2 2 2 i i i i

i i i i xy

n X X n Y Y

n XY X Y r

tos no agrupados

CÁLCULO DE r^ xy

( )( )

∑ (∑^ )^ ∑ (∑^ )

∑ ∑ ∑ ∑

− −

2 2 2 2 x i x i y i y i

xy i i x i y i xy

n n X n X n nY nY

n n XY n X nY r

Dat

atos agrupados

14

Da

Índices de relación

(^) Donde: nx: observaciones o frecuencias marginales de X ny: observaciones o frecuencias marginales de Y nxy: observaciones dentro de las casillas interiores de la tabla de frecuencias. Es decir, el número de observaciones que pertenecen a un cierto intervalo de la variable X y a otro de la variable Y

INTERPRETACIÓNINTERPRETACIÓN Y PROPIEDADES DEY PROPIEDADES DE rr xyxy

1. El coeficiente de correlación de Pearson no puede valer menos

que -1 y mas que 1, esto es -1≤ 0 ≤ 1

9 Cercano a -1: correlación lineal negativa 99 Cercano a 0: ausencia de correlación linealCercano a 0: ausencia de correlación lineal 9 Cercano a 1: correlación lineal positiva

2. Es un valor adimensional, es invariante frente a cualquier

unidad de medida –permite comparar diferentes variables o la

misma variable medida en diferentes grupos-

3. Si hacemos transformaciones lineales de una o de las dos

variables, en que las constantes multiplicadoras son positivas, elvariables, en que las constantes multiplicadoras son positivas, el

coeficiente de correlación de Pearson no se altera

Si U= a·X+b y V= c·Y+d siendo (a y c >0) entonces Ruv=R xy

15

Índices de relación

Ejemplo: Obtención de la covarianza entre cinco pares de puntuaciones para los mismos sujetos en ansiedad y depresión medidos en dos cuestionarios diferentes (X,Y) y (V,W)

AnsAns(X)(X) DeprDepr(Y)(Y) XYXY AnsAns(V)(V) DeprDepr(W)(W) VWVW 1,711,71 7878 133,38133,38 5,615,61 171,96171,96 964,70964, 1,601,60 6565 104104 5,255,25 143,30143,30 752,33752, 1,571,57 6363 98,9198,91 5,155,15 138,89138,89 715,28715, 1,661,66 7474 122,84122,84 5,455,45 163,14163,14 889,11889, 1,671,67 7373 121,91121,91 5,485,48 160,94160,94 881,95881, 8,218,21 353353 581,04581,04 26,9426,94 778,23778,23 4203,374203,

1 , 624 70 , 6 V 5 , 388 W 155 , 646

S vw

S
X Y

xy

9 Las situaciones típicas a las que se aplican las técnicas de regresión son aquellas en las que disponemos de la medida de dos variables X e Y en una muestra de sujetos, y en un momento posterior, para alguno de los sujetos disponemos solamente de la información en una de ellas, X, y queremos hacer un pronóstico de cual será su valor en Y. 9 Aunque las predicciones pueden basarse también en relaciones no lineales, en este curso veremos únicamente las lineales por varias razones: 9 Son las más sencillas y por lo tanto la forma más fácil de acercarnos al problema 9 En muchas ocasiones son suficientes para describir las relaciones entre las variables 9 Su lógica es la misma en otros tipos de modelos predictivos 9 No obstante, en ocasiones en Psicología nos vemos obligados a utilizar otros modelos como el cuadrático potencial exponencial logarítmica

Regresión 19

modelos como el cuadrático, potencial, exponencial, logarítmica…

ECUACIONESECUACIONES LINEALES O FUNCIÓN DE LA RECTALINEALES O FUNCIÓN DE LA RECTA

Se dice que la relación entre dos variables es lineal si entre ellas podemos escribir la siguiente función: Y = a + b·X Donde a y b son constantes. Un ejemplo es la relación entre el uso del teléfono medido en pasos y la cantidad facturada. Supongamos que la cantidad que cobra la compañía telefónica cada mes por mantener el teléfono es de 15 euros y que cobra 0.05 céntimos por paso. La relación entre el númeroteléfono es de 15 euros y que cobra 0.05 céntimos por paso. La relación entre el número de pasos (X) y el importe de la factura será lineal, siendo las constantes a y b iguales a 15 y 0.05, respectivamente Y= 15+0.05·X

X Y 0 15 10 15, 30 16,5 b: pendiente 50 17, 70 18, 90 19,

0 10 20 30 40 50 60 70 80 90

a: punto de corte

p

Regresión 20

En la práctica en Ciencias Sociales no nos encontramos nunca situaciones como estas, los puntos ya no están estrictamente en línea recta y además normalmente desconocemos las constantes de la ecuación. Normalmente disponemos de datos en dos variables X e Y y nos preguntamos sobre la posible relación entre ellas y por si hay algunapreguntamos sobre la posible relación entre ellas y por si hay alguna función lineal que pueda aproximarla, es decir, queremos ajustar una recta a los puntos, pero desconocemos cual es esta función. Un primer paso por tanto será obtener el diagrama de dispersión. Porque a la hora de realizar estimaciones de los valores de una variable en función de los valores de otra, tenemos que comprobar: 9 Si a la vista del diagrama de dispersión podemos inducir una posible dependencia lineal 9 El coeficiente de correlación está próximo a 1 o - 99 ElEl sentido común nos hace pensar que exista alguna relación lineal entre ambas d ú h l l ó l l b variables Recordemos algunos de los diagramas vistos.

Regresión 21

Relación entre inteligencia y rendimiento

6 5 4 3

INTELIG

RENDIM 2 4 6 8 10 12 14

2 1 0

Una situación opuesta la encontramos

6 5 4 3 para la relación entre el tiempo y los errores

TIEMPO

ERRORES 2 4 6 8 10 12 14

2 1 0

Regresión 22

¿Qué recta es la que mejor predice estos datos? ¿cómo calcularla?

Ejemplo: Supongamos que queremos calcular la recta de regresión de Y sobre X. Hemos tomado los datos de 8 pacientes, considerando X como el nivel de depresión de un paciente e Y el número de pensamientos negativos diarios experimentados por los pacientes.

XX YY

Diagrama de dispersión

0

1

2

3

4

5

6

Y (niv e l de de pre s ión)

0 2 4 6 8 X (ideas negativa)

Diagrama de dispersión

5

6 ión)

0

1

2

3

4

5

0 2 4 6 8

Y (niv e l de de pre s

X (ideas negativa)

XX YY XX^22 YY^22 XYXY

2 2

S x

Y

X

Sy^2 = 69 / 8 − 2. 6252 = 1. 734

( )( ) ( )( ) ( )( ) ( )( )

2 2

rxy =

( )( )

  1. 705 8 · 184 36

8 · 110 36 · 21 2 2 2

= −

= −

⎟⎟⎠

⎞ ⎜⎜⎝

⎛ −

∑ ∑

∑ ∑ ∑

n Xi X i

n XY X Y b a = Yb · X =

Y = − 0. 548 + 0. 705 · X

En el ejemplo anterior imaginemos que tenemos tres nuevos pacientes con niveles de depresión 4, 6 y 8 respectivamente (valores en X) vamos a predecir que número de pensamientos negativos diarios predice el modelo que tengan X 1 =4, X 2 =6, X 3 =

Y = − 0. 548 + 0. 705 · X

Y

Y

Y

Sustituimosenlostrescasos

Esto es a un paciente que tenga un nivel de depresión 4 (valor en X) se predice que tenga 2.27 pensamientos negativos (valor en Y). Un paciente que tenga un nivel de depresión 6 (valor en X) se predice que tenga 3. pensamientos negativos (valor en Y) y un paciente que tenga un nivel de depresión 8 (valor en X) se predice que tenga 5.09 pensamientos negativos (valor en Y).

a

n X X

n XY X Y

b

ECUACIONESDEL MODELO

∑ ∑

∑ ∑ ∑

Y X

Y a bX

Valoración del modelo: Coeficiente de determinación r^2 xy =0.871 2 =0. luego el % de variación explicada por el modelo es 75,95%. La proporción de varianza no explicada es de 0,2405, lo que representa un % del 24.05% Aplicación del modelo Supongamos que a un macaco hemos medido el nivel de serotonina y tiene 11 (valor en la variable X) ¿Cuántos actos agresivos al día (valor en Y) podemos predecir que tiene considerando el modelo? Y’ = -0.728 + 0.466·11 = 4. Luego, según el modelo se predice que un macaco que tenga un nivel de serotonina de 11 microgramos realizará 4.389 actos agresivos diarios.