Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


tema 2 de econometria, Apuntes de Econometría

apuntes de tema 2 de econometria

Tipo: Apuntes

2018/2019

Subido el 13/05/2019

amyzbn
amyzbn 🇪🇸

3.9

(20)

92 documentos

1 / 19

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
TEMA 2. EL MODELO DE REGRESIÓN
2.1 El modelo de regresión lineal simple
2.2 El modelo de regresión lineal múltiple
2.3 Interpretación de coeficientes
2.4 Unidades de medida y formas funcionales
Objetivos del Tema 2:
Descripción del MRLS
Descripción y justificación del criterio MCO
Descripción del MRLM
Interpretación de los parámetros
Aplicación del criterio MCO al ML
Interpretación de los parámetros con distintas formas funcionales: niveles, logaritmos
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13

Vista previa parcial del texto

¡Descarga tema 2 de econometria y más Apuntes en PDF de Econometría solo en Docsity!

TEMA 2. EL MODELO DE REGRESIÓN

2.1 El modelo de regresión lineal simple

2.2 El modelo de regresión lineal múltiple

2.3 Interpretación de coeficientes

2.4 Unidades de medida y formas funcionales

Objetivos del Tema 2 :

  • Descripción del MRLS
  • Descripción y justificación del criterio MCO
  • Descripción del MRLM
  • Interpretación de los parámetros
  • Aplicación del criterio MCO al ML
  • Interpretación de los parámetros con distintas formas funcionales: niveles, logaritmos

2.1 El modelo de regresión lineal simple

La Econometría se ocupa de formular relaciones entre variables económicas, cuantificarlas y valorar los resultados obtenidos.

Un análisis econométrico empírico suele comenzar con la formulación de una pregunta. Por ejemplo: ¿Cómo afectan los cursos de reciclaje al salario?, ¿Cómo afecta la renta disponible al nivel de consumo en la economía española?

Supongamos que nos interesa analizar la variable Y. Con frecuencia en economía nos encontramos con modelos en los que el comportamiento de una variable Y viene explicada por otra variable, la variable X:

Y = f (X)

Si consideramos que la relación entre Y e X es lineal,

Y =β 1 + β 2 X

Dicho modelo es determinista. Sin embargo las relaciones económicas no son deterministas, siempre hay un cierto grado de incertidumbre o aleatoriedad. Además estas relaciones no suelen ser exactas, sino aproximaciones en las que se omiten variables de importancia secundaria. Por lo tanto, en el modelo debe de introducirse un término adicional llamado perturbación aleatoria (u), de forma que, tendremos un modelo estocástico:

Y = β 1 + β 2 X + u

Para cuantificar la relación entre Y e X (valores de los parámetros) es necesario disponer de datos de Y y X. Supongamos que tenemos n observaciones de cada una de ellas:

Y i =β 1 +β 2 Xi + ui i = 1 , 2 ,.... n

  • Y es la variable a explicar, generalmente llamada regresando
  • X es la variable explicativa o regresor
  • β son parámetros desconocidos
  • u es la perturbación aleatoria

Gráfico 2

Parece lógico elegir una estimación de los parámetros que haga que los valores

predichos por el modelo estimado ( Y ˆ i^ ) estén próximos al valor real observado ( Yi ), es

decir, que los residuos sean pequeños.

El criterio que se va a utilizar para obtener los valores de los parámetros será minimizar la suma de los cuadrados de los residuos. Se denomina mínimos cuadrados (MC) y los estimadores que se obtienen se denominan mínimo-cuadráticos.

Ajuste mínimo cuadrático de la recta de regresión

Vamos a obtener los estimadores de β 1 y β 2 por MC (objetivo minimizar la suma de los

cuadrados de los residuos):

Min ∑

=

n

i

ui u u un 1

2 2 2

2 1

Recordar que Y (^) i = Y ˆ i^ + u ˆ i , por lo que los residuos:

ui Yi Yi Yi 1 2 X i

Por tanto hay que minimizar la expresión siguiente respecto de βˆ 1 y βˆ 2 :

Min ( )

2

1

1 2 1

= =

n

i

i i

n

i

S ui Y β β X

Para minizar S se deriva respecto de βˆ 1 y βˆ 2 :

∑^ (^ )

=

n i

Yi Xi

S

1

1 2 1

∑^ (^ )

=

n i

Yi Xi Xi

S

1

1 2 2

Igualando a cero las expresiones anteriores se obtienen dos ecuaciones que se denominan ecuaciones normales :

= =

n

i

i

n

i

Yi n X 1 1

= = =

n

i

i

n

i

n

i

Yi Xi Xi X 1

2 1

2 1

1

Resolviendo el sistema de ecuaciones normales se obtienen las expresiones analíticas de los estimadores mínimo-cuadráticos para el MRLS:

var( )

ˆ cov( , )

1

2

1 (^2) X

X Y

X X

X X Y Y

n

i

i

n

i

i i

=

βˆ 1 = Y − βˆ 2 X

¿Cuál es el signo de βˆ 2?

Ejemplo:

Estimar por MCO los parámetros del siguiente modelo:

Ventasi = β 1 + β 2 publicidadi + u i

Para ello contamos con los siguientes datos correspondientes a 5 empresas:

Ahora podemos calcular los errores o residuos ( u ˆ i^ ) y los valores predichos ( Y ˆ i^ ) por el

modelo:

Ventas (Yi) Publicidad (X (^) i) 1 200 30 133.3 66. 2 400 50 700.0 -300. 3 800 50 700.0 100. 4 1200 60 983.3 216. 5 900 60 983.3 -83. Suma 3500 250 3500 0. Media 700 50 700

( Yi −) Y^2 YY ˆˆ ii^ u ˆ i

2.2 El modelo de regresión lineal múltiple

Vamos a generalizar el MLRS puesto que es evidente que una variable puede venir explicada o influida por más de una variable.

Se considera que la variable endógena es una función lineal de k-1 variables explicativas y de una perturbación aleatoria. El modelo de regresión lineal múltiple (MRLM) con K regresores (k-1 variables explicativas más el término constante) se expresa como:

Y t =β 1 +β 2 X 2 i +β 3 X 3 i +β kXki + ui i = 1 , 2 ,.... n

Ajuste mínimo cuadrático del hiperplano de regresión

Vamos a obtener los estimadores de β 1 , β 2 …… β k por MC (objetivo minimizar la

suma de los cuadrados de los residuos):

Min ∑

=

n

i

ui u u un 1

2 2 2

2 1

Recordar que Y (^) i = Y ˆ i^ + u ˆ i , por lo que los residuos:

ui Yi Yi Yi β β X i β kX ki

Por tanto hay que minimizar la expresión siguiente respecto de βˆ 1 , βˆ 2 ….. βˆ^ k :

Min ( )

2

1

1 2 2 1

= =

n

i

i i k ki

n

i

S ui Y β β X  β X

Para minizar S se deriva respecto de βˆ 1 , βˆ 2 ….. βˆ^ k :

∑^ (^ )

=

n i

Yi X i kXki

S

1

1 2 2 1

∑^ (^ )

=

n i

Yi X i kXki X i

S

1

1 2 2 2 2

∑^ (^ )

=

n i

i i k ki ki k

Y X X X

S

1

1 2 2

Igualando a cero las expresiones anteriores se obtienen k ecuaciones que se denominan ecuaciones normales :

= = =

n

i

k ki

n

i

i

n

i

Yi n X X 1 1

2 1

= = = =

n

i

k i ki

n

i

i

n

i

n

i

Yi X i X i X X X 1

2 1

2 2 1

2 1

2 1 2

= = = =

n

i

k ki

n

i

i ki

n

i

n

i

Yi Xki Xki X X X 1

2 1

2 1

2 1

Resolviendo el sistema de ecuaciones normales se obtienen las expresiones analíticas de los estimadores mínimo-cuadráticos para el MRLM.

Formas funcionales

Modelo nivel-nivel

Yi = β 1 + β 2 Xi + u ii

i X

Y

∂ β 2 =

Modelo log-log (potencial o doblemente logarítmico)

u i

Yi Xi e

2 1

=β^ β

LYi = β 1 + β 2 LXi + u i → (^) Y X

i

i

i

i

i

i

X

X

Y

Y

LX

LY β (^2) ∂ = ε /

= ∂

Modelo nivel-log

Yi = β 1 + β 2 LXi + u i

i

i

i i

i

X

X

Y LX

Y

∂ β 2 =

Modelo log-nivel (exponencial)

Xi u i

Yi e

β β

LYi = β 1 + β 2 Xi + u ii

i

i

i

i X

Y

Y

X

LY

= ∂

∂ β 2 =

Ejemplo: (Caso 3.7 del libro de Uriel y Gea (1997), pág. 135):

ABSEN= Días que en el último año han faltado al trabajo cada uno de los trabajadores EDAD= Edad en años de cada empleado ANTIGUE= Años de antigüedad en la empresa SALARIO= Salario mensual en euros

ABSEN i = β 1 +β 2 SALARIOi +β 3 EDADi + β 4 ANTIGUEi + u i

APÉNDICE

OBTENCIÓN DE LOS ESTIMADORES

Supongamos que tenemos un modelo con k=3 (dos variables explicativas):

Y t =β 1 +β 2 X 2 i +β 3 X 3 i + ui i = 1 , 2 ,.... n

Vamos a obtener los estimadores de β 1 , β 2 y β 3 por MC (objetivo minimizar la suma

de los cuadrados de los residuos):

Min ∑

=

n

i

ui u u un 1

2 2 2

2 1

Recordar que Y (^) i = Y ˆ i^ + u ˆ i , por lo que los residuos:

ui Yi Yi Yi 1 2 X 2 i 3 X 3 i

Por tanto hay que minimizar la expresión siguiente respecto de βˆ 1 , βˆ 2 y βˆ 3 :

Min ( )

2

1

1 2 2 3 3 1

= =

n

i

i i i

n

i

S ui Y β β X β X

Para minizar S se deriva respecto de βˆ 1 , βˆ 2 y βˆ 3 :

∑^ (^ )

=

n i

Yi X i X i

S

1

1 2 2 3 3 1

∑^ (^ )

=

n i

Yi X i X i X i

S

1

1 2 2 3 3 2 2

β β β β

∑^ (^ )

=

n i

i i i i k

Y X X X

S

1

1 2 2 3 3 3

β β β β

Igualando a cero las expresiones anteriores se obtienen 3 ecuaciones que se denominan ecuaciones normales :

= = =

n

i

i

n

i

i

n

i

Yi n X X 1

3 3 1

2 1

1 2

= = = =

n

i

i i

n

i

i

n

i

n

i

Yi X i X i X X X 1

3 2 3 1

2 2 1

2 1

2 1 2 βˆ βˆ βˆ

∑ ∑ ∑ ∑ = = = =

n

i

k i

n

i

i i

n

i

n

i

Yi X i X i X X X 1

2 3 1

2 3 1

2 1

3 1 3

Resolviendo el sistema de ecuaciones normales se obtienen las expresiones analíticas de los estimadores mínimo-cuadráticos para el MRL:

βˆ 1 = Y −βˆ 2 X 2 − βˆ 3 X 3

( )( ) ( ) ( )( ) ( )( )

∑ (^ )^ ∑(^ )^ (∑^ (^ )(^ ))

∑ ∑ ∑ ∑ − − − − −

2 2 3 3

2 3 3

2 2 2

3 3 2 2 3 3

2 2 2 3 3 2

X X X X X X X X

Y Y X X X X Y Y X X X X X X

i i i i

i i i i i i i

( )( ) ( ) ( )( ) ( )( )

∑ (^ )^ ∑(^ )^ (∑^ (^ )(^ ))

∑ ∑ ∑ ∑ − − − − −

2 2 3 3

2 2 2

2 3 3

2 2 2 2 3 3

2 3 3 2 2 ˆ 3 X X X X X X X X

Y Y X X X X Y Y X X X X X X

i i i i

β i i i i i i i

Si (^ )(^ )^

( )( ) ( )

∑ ∑

∑ −

2 2

2 2 2 2 3 3 2

X X

Y Y X X

X X X X

i

i i i

i i^ β^ y

( )( ) ( ) 2 3 3

3 3 ˆ 3 ∑

∑ −

X X

Y Y X X

i

β i i i

Las expresiones para βˆ 2 y βˆ 3 pueden expresarse de la siguiente forma:

( )

∑ ∑

2

2 2 2

2 2

i

i i i

i i d

d Y d

d Y Y

β donde d 2 i son los residuos MCO de una regresión

simple de X (^) 2 sobre X (^) 3.

Esta ecuación demuestra que podemos hacer una regresión simple de Y sobre (^) d 2 i para

obtener βˆ 2. Además, nos proporciona una interpretación de efecto parcial de βˆ 2 , esto

es, los residuos d 2 i son la parte de X (^) 2 i que no está correlacionada con X (^) 3 i. Esto

significa que d 2 i es X (^) 2 i después de que los efectos de X (^) 3 i hayan sido tomados en

cuenta, o descontados. Por lo tanto, βˆ 2 mide la relación muestral entre Y y X 2 después

de X (^) 3 haya sido tenido en cuenta.

Similarmente, βˆ 3 vendrá dado por:

Cuando se dispone de n observaciones sobre y y sobre X, la estimación de los parámetros del modelo consiste en ajustar un hiperplano al conjunto de observaciones sobre el regresando y los regresores. Al igual que en el modelo lineal simple se pueden utilizar diversos criterios de ajuste. La discusión efectuada con el MRLS es válida en el contexto de la regresión múltiple. Por tanto, se aplicará el criterio de minimizar la suma de los cuadrados de los residuos.

Una vez estimado los parámetros, el modelo estimado y los residuos mínimo- cuadráticos tomarán la forma:

Modelo estimado: Y ˆ^ = X βˆ

Residuos: u ˆ^ = Y − Y ˆ= Y − X βˆ

Ajuste mínimo cuadrático del hiperplano de regresión

El modelo en notación matricial es:

y = X β+ u

Vamos a minimizar la suma de los cuadrados de los residuos (SCR). El vector de residuos puede expresarse como:

u ˆ^ = y − y ˆ= y − X βˆ

La suma de los cuadrados de los residuos es:

=

n

i

i

n

n u

u

u

u

u u u u u 1

(^22)

1

1 2 ˆ

ˆ

Lo cual puede expresarse como:

u ˆ u ˆ ( y X βˆ ) ( y − X βˆ)= y ′ y − y ′ X βˆ−βˆ′ X ′ y +βˆ′ X ′ X βˆ= y ′ y − 2 βˆ′ X ′ y +βˆ′ X ′ X βˆ

[βˆ ′ X^ y ′ = y ′ X βˆ por ser ambos un escalar]

Ahora vamos a minimizar la suma de los cuadrados de los residuos respecto del vector de parámetros, esto es minimizamos:

u ˆ^ ′ u ˆ= y ′ y − 2 βˆ ′ X ′ y +βˆ′ X ′ X βˆ

Para obtener el mínimo de la SCR hay que obtener la primera derivada e igualarla a cero:

β β

Xy XX u u =− ′ + ′ ∂

Igualando a cero obtenemos un sistema de k ecuaciones denominadas ecuaciones normales:

X ′ X βˆ= X ′ y

Este sistema de ecuaciones en forma extendida toma la forma:

∑ ∑ ∑

∑ ∑ ∑

∑ ∑

=

=

=

= = =

= = =

= =

n

i

ki i

n

i

i i

n

i

i

k n

i

ki

n

i

i ki

n

i

ki

n

i

i ki

n

i

i

n

i

i

n

i

ki

n

i

i

X Y

X Y

Y

X X X X

X X X X

n X X

1

1

2

1 2

1

1

2 1

2 1

1

2 1

2 2 1

2

1 1

2

[Reflexionar sobre que X’X es simétrica, recoge los productos cruzados entre los regresores mientras que X’ y recoge los productos cruzados entre los regresores e y ]

Para resolver el sistema de ecuaciones normales se debe cumplir que el rango de la matriz X’X sea igual a k. Si se cumple esta condición, el sistema de ecuaciones tiene una única solución. Para que la matriz X’X sea invertible debe de cumplirse que:

  1. Las k columnas de X deben ser linealmente independientes, es decir, que los regresores no sean linealmente dependientes entre sí.
  2. Se debe disponer al menos de tantas observaciones como regresores, esto es n≥k.

Si el rango de X’X es igual a k se dice que X’X es no singular, es decir es invertible y

se puede resolver el sistema de ecuaciones premultiplicándolo por ( XX ) −^1 , de forma

que se obtiene la expresión del vector de estimadores mínimo-cuadráticos:

βˆ= (^ XX )^ −^1 Xy

Si X’X no fuere invertible (matriz singular), el sistema de ecuaciones tiene infinitas soluciones (Multicolinealidad perfecta).

( ) 

X X^1

( ) 

βˆ^ XX^1 XY

  • Calcule el residuo para Julián (la tercera observación):

Y ˆ X βˆ

u ˆ^ Y Y ˆ