









Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
La definición, cálculo y propiedades de la covarianza y correlación entre dos variables cuantitativas, incluyendo ejemplos y fórmulas para datos agrupados. Además, se aborda la relación entre correlación y relaciones lineales entre variables.
Tipo: Apuntes
1 / 17
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!










Objetivo
Medir y ajustar una relaci´on lineal entre dos variables cuantitativas.
Bibliografia recomendada
Pe˜na y Romo (1997), Cap´ıtulos 8 y 9.
´Indice
Covarianza
Se ve en el Ejemplo 63 que existe una relaci´on creciente y m´as o menos lineal entre el peso p´erdido y el peso original de las pacientes. La covarianza es una medida de la fuerza de la relaci´on lineal entre dos variables cuantitativas.
Definici´on 18 Para una muestra de n datos bivariantes
(x 1 , y 1 ),... , (x (^) n , y (^) n)
la covarianza entre las dos variables es
sxy =
n
∑n i=
(x (^) i − x¯)(y (^) i − y¯)
donde ¯x = (^) n^1 ∑ni=1 x (^) i e ¯y = (^) n^1 ∑ni=1 y (^) i son las medias de ambas variables.
Otra manera de calcular la covarianza
En la pr´actica, se c´alcula la covarianza medi- ante la siguiente f´ormula.
Teorema 5
sxy =
n
∑^ n i=
x (^) i y (^) i − n¯x¯y
El c´alculo a trav´es de este resultado es mucho m´as r´apido, ya que no se tiene que restar las medias de todos los datos.
Demostraci´on
s (^) xy = (^1) n
∑n i=
(xi − ¯x)(yi − ¯y)
= (^1) n
( (^) ∑n
i=
[xi yi − xiy¯ − ¯xyi + ¯xy¯]
)
= (^1) n
( (^) ∑n
i=
xi yi −
∑^ n i=
xiy¯ −
∑^ n i=
¯xyi +
∑^ n i=
¯x¯y
)
= (^1) n
( (^) ∑n
i=
xi yi − ¯y
∑n i=
xi − ¯x
∑n i=
yi + n¯xy¯
)
= (^1) n
( (^) ∑n
i=
xi yi − n¯y (^1) n
∑n i=
xi − nx¯ n^1
∑n i=
yi + n¯x¯y
)
= (^1) n
( (^) ∑n
i=
xi yi − n¯y¯x − n¯x¯y + nx¯y¯
)
= (^1) n
( (^) ∑n
i=
xi yi − n¯xy¯
)
x 42 , 7 40 , 2 38 , 2 37 , 6 32 , 2 32 , 2 28 , 0 y 92 120 128 110 153 162 202 x 27 , 2 26 , 6 23 , 0 22 , 7 21 , 8 21 , 3 20 , 2 y 140 218 195 180 193 238 213
20 24 28 32 36 40 44
90
120
150
180
210
240
Vemos que existe una relaci´on negativa entre las dos variables.
Calculamos ahora la covarianza.
Tenemos:
¯x =
y¯ = 1 14
∑^14
i=
x (^) i y (^) i = 42 , 7 × 92 +... + 20, 2 × 213 = 65334 , 2 sxy =
La covarianza es positiva si existe una relaci´on (lineal) creciente y negativa si existe una relaci´on decreciente.
C´alculo de la covarianza para datos agru- pados
Dada la tabla de doble entrada,
Y y 1 y 2... y (^) J x 1 f 11 f 12... f 1 J f 1 · x 2 f 21 f 22... f 2 J f 2 · X ... ... ... ... ... ... x (^) I fI 1 fI 2... fIJ fI· f· 1 f· 2... f·J 1
la media de X es ¯x = ∑I i=1 fi·x^ i^ con varianza
s^2 x =
∑^ I i=
fi·x^2 i − x¯^2.
Igualmente se calculan la media y varianza de Y.
Ahora covarianza es
sxy =
∑^ I i=
∑^ J j=
fij x (^) i y (^) j − ¯xy.¯
Ejemplo 67 En el Ejemplo 57 tuvimos la sigu- iente tabla de frecuencias relativas.
Y 5 6 7 8 0 , 3 , 1 , 06 , 04 , 5 1 , 08 , 16 , 04 , 02 , 3 X 2 0 , 04 , 02 , 06 , 12 3 0 0 0 , 08 , 08 , 38 , 3 , 12 , 2 1
y en el Ejemplo 58 demostramos que ¯x = , 78 e ¯y = 6, 14. Ahora, la covarianza es
sxy =
∑ i
∑ j
fij x (^) i y (^) j − ¯x¯y
∑
i
∑ j
fij x (^) i y (^) j = 0 × 5 × ,3 + 0 × 6 × ,1 +... +
3 × 7 × 0 + 3 × 8 × , 08 = 5 , 44 sxy = 5 , 44 − , 78 × 6 , 14 = 0 , 6508
Propiedades
− 1 ≤ rxy ≤ 1.
rxy = 1 si y s´olo si existen constantes α y β > 0 donde y (^) i = α+βx (^) i para i = 1,... n. Es decir que existe una relaci´on lineal positiva exacta entre las dos variables.
rxy = −1 si y s´olo si existen constantes α y β < 0 donde y (^) i = α+βx (^) i para i = 1,... n. Es decir que existe una relaci´on lineal negativa exacta entre las dos variables.
Si no existe ninguna relaci´on entre las dos variables, la correlaci´on se aproxima a 0.
Si la correlaci´on est´a cerca de 1 o −1, entonces hay una relaci´on aproximadamente lineal.
Ejemplo 68 Retomamos el Ejemplo 66 sobre las vacas.
Calculamos las medias y la covarianza anteri- ormente. Ya calculamos las varianzas, desvia- ciones t´ıpicas y la correlaci´on.
s^2 x = 1 n
∑^ n i=
x^2 i − n × ¯x^2
( 42 , 72 +... + 20, 22 − 14 × 29 , 562
)
≈ 54 , 43 y de manera parecida, s^2 y ≈ 1868 , 82.
Entonces la correlaci´on es
rxy =
Existe una relaci´on negativa aproximadamente lineal entre las dos variables.
Si no hay relaci´on entre las variables, la correlaci´on es aproximadamente cero
Ejemplo 71 Los datos son 30 parejas de n´umeros aleatorios.
Correlación = -0.
(^0 2 4 6 8) (X 10000) 10 x
0
2
4
6
8
(X 10000) 10
y
La correlaci´on es casi cero.
Al rev´es no es verdad.
¡Ojo! Cero correlaci´on no implica ninguna relaci´on
Se ha visto que si hay una relaci´on m´as o menos lineal, la correlaci´on entre las dos vari- ables es bastante alta pero ¿Qu´e pasa si hay una relaci´on no lineal? Correlación = 0.
x
y
(^00 4 8 12 16 )
100
200
300
400
Correlación = 0
-6 -4 -2 0 2 4 6 xx
0
10
20
30
40
yy
En ambas gr´aficas se ha utilizado la f´ormu- la y = x^2 para generar los datos. Una fuerte relaci´on no lineal.