Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Regresión Simple: Análisis de la Correlación Lineal entre Dos Variables, Apuntes de Estadística

El concepto de regresión simple, donde se consideran dos variables x e y medidas juntas y se busca determinar si existen relaciones funcionales entre ellas, específicamente la correlación lineal. Se presentan diferentes tipos de correlación (lineal, cuadrática, exponencial, cúbica) y se discute el problema de la regresión simple, centrándonos en el modelo lineal. Se incluyen conceptos como recta de regresión, coeficientes de correlación lineal y su significado.

Tipo: Apuntes

2013/2014

Subido el 04/03/2014

eveliaherreros
eveliaherreros 🇪🇸

3.9

(10)

8 documentos

1 / 22

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Regresión Simple.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16

Vista previa parcial del texto

¡Descarga Regresión Simple: Análisis de la Correlación Lineal entre Dos Variables y más Apuntes en PDF de Estadística solo en Docsity!

Regresión Simple.

Consideramos dos variables X e Y, que medimos conjuntamente:

X Y

x 1

x 2

xn

y 1

y 2

yn

Observaciones

Por ejemplo: X=distancia a una planta industrial, Y=contaminación por cierto elemento, peso y altura, nivel de CO 2 en una ciudad y nº de habitantes, etc.

Sin embargo, cuando trabajamos con variables estadísticas, la situación que se da es…

En los casos anteriores decimos que entre las variables X e Y existe correlación (ó que X e Y son variables correladas). El tipo de correlación tiene que ver con el tipo de función que ajusta bien la relación entre X e Y:

Lineal Cuadrática

Exponencial Cúbica

Dadas dos variables X e Y (continuas),

  • (^) ¿Están linealmente correlacionadas? Supone evaluar la idoneidad de un modelo del tipo Y = a + bX para predecir la variable Y a partir de la variable X…

Dadas dos variables X e Y (continuas),

  • (^) ¿Funciona bien algún otro tipo de correlación (cuadrática, cúbica, exponencial, …)?

Este es el problema de la regresión simple.

(Se habla de regresión lineal, cuadrática, exponencial… Nosotros nos centraremos en el modelo más común, que es el lineal )

Si la nube de puntos sugiere la existencia de correlación lineal, tiene sentido buscar cuál es la recta que “mejor” aproxima la nube de puntos ( recta de regresión )

0 100 200 300 400

0

20

40

60

80

100

120

Y = a + bX

b: pendiente a: ordenada en el origen

Corr. directa o positiva: b>0; corr. inversa o negativa: b< (si b=0 se entiende que no hay correlación lineal)

0 100 200 300 400

0

20

40

60

80

100

120

y i (^) :valor real

  • (^) Sirve para hacer predicciones sobre y (conocido x ).
  • (^) Residuo de cada observación : diferencia entre el valor real, y el valor predicho.
  • (^) La recta de regresión se obtiene por el método de mínimos cuadrados: es aquella que hace mínima la suma de los cuadrados de los residuos).

0 100 200 300 400

0

20

40

60

80

100

120

y ˆ i

Valor predicho: y ˆ^ i  a  bxi

Residuo: diferencia entre el valor real y el valor predicho

Y  a  bX

a  y  b x

Media marginal de Y

Media marginal de X

2 x

xy

S

S

b 

Varianza marginal de X

Covarianza

Ecuación de la recta de regresión y/x :

Coeficiente de correlación lineal de Pearson.

x y

xy S S

S

 

-1 -0.9 -0.5 0 0.5^ 0.9^1

Débil - Débil +

Moderada - Moderada +

Fuerte - (Fuente: Susan Milton, Fuerte + p.412)

¿Basta con esto para evaluar la bondad del

modelo? NO!!

Ejemplos de ANSCOMBE: cuatro conjuntos de datos, todos con el mismo coeficiente de correlación (0.8164), pero “muy distintos”…

Gráfico del Modelo Ajustado

x

y

4 6 8 10 12 14

4,

6,

8,

10,

12,

Razonable…

Gráfico del Modelo Ajustado

x

y

4 6 8 10 12 14

3,

5,

7,

9,

11,

No hay linealidad…