Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Covarianza y Correlación: Conceptos y Cálculo - Prof. Lorente, Apuntes de Trabajo Social

La definición, cálculo y propiedades de la covarianza y correlación entre dos variables cuantitativas, incluyendo ejemplos y fórmulas para datos agrupados. Además, se aborda la relación entre correlación y relaciones lineales entre variables.

Tipo: Apuntes

2016/2017

Subido el 21/04/2017

miirmeervaal
miirmeervaal 🇪🇸

4.2

(12)

19 documentos

1 / 17

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
3. CORRELACI ´
ON Y REGRE-
SI ´
ON
Objetivo
Medir y ajustar una relaci´on lineal entre dos
variables cuantitativas.
Bibliografia recomendada
Pe˜na y Romo (1997), Cap´ıtulos 8 y 9.
´
Indice
1. Covarianza y sus propiedades
2. Correlaci´on y sus propiedades
3. omo calcular la covarianza y correlaci´on con datos
agrupados
4. La recta de regresi´on y sus propiedades
130
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Covarianza y Correlación: Conceptos y Cálculo - Prof. Lorente y más Apuntes en PDF de Trabajo Social solo en Docsity!

3. CORRELACI ´ON Y REGRE-

SI ´ON

Objetivo

Medir y ajustar una relaci´on lineal entre dos variables cuantitativas.

Bibliografia recomendada

Pe˜na y Romo (1997), Cap´ıtulos 8 y 9.

´Indice

  1. Covarianza y sus propiedades
  2. Correlaci´on y sus propiedades
  3. C´omo calcular la covarianza y correlaci´on con datos agrupados
  4. La recta de regresi´on y sus propiedades

Covarianza

Se ve en el Ejemplo 63 que existe una relaci´on creciente y m´as o menos lineal entre el peso p´erdido y el peso original de las pacientes. La covarianza es una medida de la fuerza de la relaci´on lineal entre dos variables cuantitativas.

Definici´on 18 Para una muestra de n datos bivariantes

(x 1 , y 1 ),... , (x (^) n , y (^) n)

la covarianza entre las dos variables es

sxy =

n

∑n i=

(x (^) i − x¯)(y (^) i − y¯)

donde ¯x = (^) n^1 ∑ni=1 x (^) i e ¯y = (^) n^1 ∑ni=1 y (^) i son las medias de ambas variables.

Otra manera de calcular la covarianza

En la pr´actica, se c´alcula la covarianza medi- ante la siguiente f´ormula.

Teorema 5

sxy =

n

  ∑^ n i=

x (^) i y (^) i − n¯x¯y

 

El c´alculo a trav´es de este resultado es mucho m´as r´apido, ya que no se tiene que restar las medias de todos los datos.

Demostraci´on

s (^) xy = (^1) n

∑n i=

(xi − ¯x)(yi − ¯y)

= (^1) n

( (^) ∑n

i=

[xi yi − xiy¯ − ¯xyi + ¯xy¯]

)

= (^1) n

( (^) ∑n

i=

xi yi −

∑^ n i=

xiy¯ −

∑^ n i=

¯xyi +

∑^ n i=

¯x¯y

)

= (^1) n

( (^) ∑n

i=

xi yi − ¯y

∑n i=

xi − ¯x

∑n i=

yi + n¯xy¯

)

= (^1) n

( (^) ∑n

i=

xi yi − n¯y (^1) n

∑n i=

xi − nx¯ n^1

∑n i=

yi + n¯x¯y

)

= (^1) n

( (^) ∑n

i=

xi yi − n¯y¯x − n¯x¯y + nx¯y¯

)

= (^1) n

( (^) ∑n

i=

xi yi − n¯xy¯

)

x 42 , 7 40 , 2 38 , 2 37 , 6 32 , 2 32 , 2 28 , 0 y 92 120 128 110 153 162 202 x 27 , 2 26 , 6 23 , 0 22 , 7 21 , 8 21 , 3 20 , 2 y 140 218 195 180 193 238 213

Diagrama de dispersión

20 24 28 32 36 40 44

x

90

120

150

180

210

240

y

Vemos que existe una relaci´on negativa entre las dos variables.

Calculamos ahora la covarianza.

Tenemos:

¯x =

y¯ = 1 14

(92 +^...^ + 213)

∑^14

i=

x (^) i y (^) i = 42 , 7 × 92 +... + 20, 2 × 213 = 65334 , 2 sxy =

(65334,^2 −^14 ×^29 ,^56 ×^167 ,43)

La covarianza es positiva si existe una relaci´on (lineal) creciente y negativa si existe una relaci´on decreciente.

C´alculo de la covarianza para datos agru- pados

Dada la tabla de doble entrada,

Y y 1 y 2... y (^) J x 1 f 11 f 12... f 1 J f 1 · x 2 f 21 f 22... f 2 J f 2 · X ... ... ... ... ... ... x (^) I fI 1 fI 2... fIJ fI· f· 1 f· 2... f·J 1

la media de X es ¯x = ∑I i=1 fi·x^ i^ con varianza

s^2 x =

∑^ I i=

fi·x^2 i − x¯^2.

Igualmente se calculan la media y varianza de Y.

Ahora covarianza es

sxy =

∑^ I i=

∑^ J j=

fij x (^) i y (^) j − ¯xy.¯

Ejemplo 67 En el Ejemplo 57 tuvimos la sigu- iente tabla de frecuencias relativas.

Y 5 6 7 8 0 , 3 , 1 , 06 , 04 , 5 1 , 08 , 16 , 04 , 02 , 3 X 2 0 , 04 , 02 , 06 , 12 3 0 0 0 , 08 , 08 , 38 , 3 , 12 , 2 1

y en el Ejemplo 58 demostramos que ¯x = , 78 e ¯y = 6, 14. Ahora, la covarianza es

sxy =

∑ i

∑ j

fij x (^) i y (^) j − ¯x¯y

i

∑ j

fij x (^) i y (^) j = 0 × 5 × ,3 + 0 × 6 × ,1 +... +

3 × 7 × 0 + 3 × 8 × , 08 = 5 , 44 sxy = 5 , 44 − , 78 × 6 , 14 = 0 , 6508

Propiedades

− 1 ≤ rxy ≤ 1.

rxy = 1 si y s´olo si existen constantes α y β > 0 donde y (^) i = α+βx (^) i para i = 1,... n. Es decir que existe una relaci´on lineal positiva exacta entre las dos variables.

rxy = −1 si y s´olo si existen constantes α y β < 0 donde y (^) i = α+βx (^) i para i = 1,... n. Es decir que existe una relaci´on lineal negativa exacta entre las dos variables.

Si no existe ninguna relaci´on entre las dos variables, la correlaci´on se aproxima a 0.

Si la correlaci´on est´a cerca de 1 o −1, entonces hay una relaci´on aproximadamente lineal.

Ejemplo 68 Retomamos el Ejemplo 66 sobre las vacas.

Calculamos las medias y la covarianza anteri- ormente. Ya calculamos las varianzas, desvia- ciones t´ıpicas y la correlaci´on.

s^2 x = 1 n

  ∑^ n i=

x^2 i − n × ¯x^2

 

( 42 , 72 +... + 20, 22 − 14 × 29 , 562

)

≈ 54 , 43 y de manera parecida, s^2 y ≈ 1868 , 82.

Entonces la correlaci´on es

rxy =

54 , 43 × 1868 , 82

Existe una relaci´on negativa aproximadamente lineal entre las dos variables.

Si no hay relaci´on entre las variables, la correlaci´on es aproximadamente cero

Ejemplo 71 Los datos son 30 parejas de n´umeros aleatorios.

Correlación = -0.

(^0 2 4 6 8) (X 10000) 10 x

0

2

4

6

8

(X 10000) 10

y

La correlaci´on es casi cero.

Al rev´es no es verdad.

¡Ojo! Cero correlaci´on no implica ninguna relaci´on

Se ha visto que si hay una relaci´on m´as o menos lineal, la correlaci´on entre las dos vari- ables es bastante alta pero ¿Qu´e pasa si hay una relaci´on no lineal? Correlación = 0.

x

y

(^00 4 8 12 16 )

100

200

300

400

Correlación = 0

-6 -4 -2 0 2 4 6 xx

0

10

20

30

40

yy

En ambas gr´aficas se ha utilizado la f´ormu- la y = x^2 para generar los datos. Una fuerte relaci´on no lineal.