Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Regresión y Correlación: Estudio de la Relación entre Variables Cuantitativas - Prof. Fern, Ejercicios de Estadística Descriptiva

Un resumen sobre la regresión y correlación de dos variables cuantitativas. Se explica cómo investigar la asociación entre ellas, cuantificar su fuerza mediante el coeficiente de correlación, estudiar su forma y proponer un modelo matemático. Se incluyen ejemplos históricos y se describe el análisis de regresión para predecir una variable a partir de otra.

Tipo: Ejercicios

2017/2018

Subido el 20/05/2018

leceoso
leceoso 🇪🇸

2 documentos

1 / 26

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Regresión y Correlación
Tema 5
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a

Vista previa parcial del texto

¡Descarga Regresión y Correlación: Estudio de la Relación entre Variables Cuantitativas - Prof. Fern y más Ejercicios en PDF de Estadística Descriptiva solo en Docsity!

Regresión y Correlación

Tema 5

 Al estudiar la relación entre dos variables

CUANTITATIVAS. En general interesa:

 Investigar si existe asociación entre las dos variables.

 Cuantificar la fuerza de la asociación, a través de una medida de

asociación denominada coeficiente de correlación.

 Estudiar la forma de la relación y en lo posible proponer un modelo

matemático para la relación.

 Predecir una variable a partir de la otra usando el modelo propuesto

(regresión)

 Un MODELO MATEMÁTICO es una función matemática que propone la

forma de relación entre la variable dependiente (Y) y la o las variables

independientes.

 La función más simple para la relación entre dos variables es la FUNCIÓN

LINEAL Y = a + b ⋅ X

Estudio conjunto de dos variables

Regresión

 Galton

 Pearson, un estudio

 El ejemplo del estudio de la altura en grupos familiares de

Pearson:

 Altura del hijo = 85cm + 0,5 altura del padre (Y = 85 + 0,5 X)

 Si el padre mide 200cm ¿cuánto mide el hijo?

 Se espera (predice) 85 + 0,5x200=185 cm.

 Alto, pero no tanto como el padre. Regresa a la media.

 Si el padre mide 120cm ¿cuánto mide el hijo?

 Se espera (predice) 85 + 0,5x120=145 cm.

 Bajo, pero no tanto como el padre. Regresa a la media.

 Es decir, nos interesaremos por modelos de regresión lineal

simple

Regresión

 El análisis de regresión sirve para predecir una

medida en función de otra medida (o varias).

 Y = Variable dependiente

 predicha

 explicada

 X = Variable independiente

 predictora

 explicativa

 ¿Es posible descubrir una relación?

 Y = f(X) + error

 f es una función de un tipo determinado

 el error es aleatorio, pequeño, y no depende de X

Regresión

 En el modelo de regresión lineal simple, dado dos

variables

 Y (dependiente)

 X (independiente, explicativa, predictora)

 buscamos encontrar una función de X lineal que nos

permita aproximar Y mediante

 Ŷ = b 0 + b 1 X

 b 0 (ordenada en el origen, constante)

 b 1 (pendiente de la recta)

 Y e Ŷ rara vez coincidirán por muy bueno que sea el

modelo de regresión. A la cantidad

 e=Y-Ŷ se le denomina residuo o error residual.

Regresión

 En el ejemplo de Pearson y las alturas, él encontró:

 Ŷ = b 0 + b 1 X

 b 0 =85 cm (Ojo: no interpretar como altura de un hijo cuyo padre mide 0

cm )

 b 1 =0,5 (En media el hijo gana 0,5 cm por cada cm del padre.)

 El modelo lineal de regresión se construye utilizando la técnica de estimación mínimo cuadrática:  Buscar b 0 , b 1 de tal manera que se minimice la cantidadΣi ei^2 Con e=Y-Ŷ Es decir minimizar los errores que se comenten, elevados al cuadrado  Se comprueba que para lograr dicho resultado basta con elegir:

 Que además tiene unas ventajas:  El error residual medio es nulo  La varianza del error residual es mínima para este tipo de estimación.

 Quiere decir: en término medio no nos equivocamos. Cualquier otra estimación que no cometa error en término medio, si es de tipo lineal, será peor por presentar mayor variabilidad con respecto al error medio (que es cero).

b y b x S

S b X

XY 1 = 2 0 = − 1

 Sustituyendo y operando en la recta de regresión b0 y b 1 por sus valores, se obtiene:

es la recta de regresión mínimo cuadrática de Y sobre X.

b y b x S

S b X

XY 1 = 2 0 = − 1

( ) 2 (X- x ) S

S Y y X

− = XY

 ¿Qué ocurre si X e Y son independientes? que las rectas resultantes son:

 La pendiente de una recta ( b1 ), significa lo que varía la vble Y dependiente (o exógena) cuando la vble X independiente (endógena) varía en una unidad.

 Ejemplo: propensión marginal a consumir. Cuando la recta es la función de consumo en relación con la renta.

Y = y X = x

Ejemplo (visto en el tema anterior)

X\Y 1 2 3

m 10 =

m 01^2

m 11 =52/

SXY = 0

S X^2 =

m 20

m 02 =40/

S Y^2 =

(X- 26 / 9 ) 0

S X

Y

Y = 2

Ojo: recordar que no son independientes

Con estos valores calculados en el ejercico anterior, sustituimos en la recta de

regresión y se obtiene:

Haciendo cuentas la recta es:

Coeficiente de correlación lineal de Pearson

x y

xy

S S

S r =

 es adimensional  Sólo toma valores en [-1,1]  Las variables son incorreladas  r=  Relación lineal perfecta entre dos variables  r=+1 o r=- ( excluimos los casos de puntos alineados horizontal o verticalmente)  Cuanto más cerca esté r de +1 o -1 mejor será el grado de relación lineal.  Siempre que no existan observaciones anómalas.

Coeficiente de correlación lineal de Pearson

r=0,

r=0, 30

r=0, 30

r=0, 30

Coeficiente de correlación lineal de Pearson

 ¿Si r=0 eso quiere decir que no las variables son independientes?

 no tiene por qué ser cierto

 Lo contrario si es cierto: Independencia implica incorrelación.

 Me ha salido r=1’4 …

Eso es un error de cálculo. Siempre debe tomar un valor entre -1 y +1.