











Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
apuntes de tema 2 de econometria
Tipo: Apuntes
1 / 19
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!












Objetivos del Tema 2 :
2.1 El modelo de regresión lineal simple
La Econometría se ocupa de formular relaciones entre variables económicas, cuantificarlas y valorar los resultados obtenidos.
Un análisis econométrico empírico suele comenzar con la formulación de una pregunta. Por ejemplo: ¿Cómo afectan los cursos de reciclaje al salario?, ¿Cómo afecta la renta disponible al nivel de consumo en la economía española?
Supongamos que nos interesa analizar la variable Y. Con frecuencia en economía nos encontramos con modelos en los que el comportamiento de una variable Y viene explicada por otra variable, la variable X:
Y = f (X)
Si consideramos que la relación entre Y e X es lineal,
Y =β 1 + β 2 X
Dicho modelo es determinista. Sin embargo las relaciones económicas no son deterministas, siempre hay un cierto grado de incertidumbre o aleatoriedad. Además estas relaciones no suelen ser exactas, sino aproximaciones en las que se omiten variables de importancia secundaria. Por lo tanto, en el modelo debe de introducirse un término adicional llamado perturbación aleatoria (u), de forma que, tendremos un modelo estocástico:
Y = β 1 + β 2 X + u
Para cuantificar la relación entre Y e X (valores de los parámetros) es necesario disponer de datos de Y y X. Supongamos que tenemos n observaciones de cada una de ellas:
Gráfico 2
Parece lógico elegir una estimación de los parámetros que haga que los valores
predichos por el modelo estimado ( Y ˆ i^ ) estén próximos al valor real observado ( Yi ), es
decir, que los residuos sean pequeños.
El criterio que se va a utilizar para obtener los valores de los parámetros será minimizar la suma de los cuadrados de los residuos. Se denomina mínimos cuadrados (MC) y los estimadores que se obtienen se denominan mínimo-cuadráticos.
Ajuste mínimo cuadrático de la recta de regresión
cuadrados de los residuos):
=
n
i
ui u u un 1
2 2 2
2 1
Recordar que Y (^) i = Y ˆ i^ + u ˆ i , por lo que los residuos:
ui Yi Yi Yi 1 2 X i
2
1
1 2 1
= =
n
i
i i
n
i
=
∂ n i
Yi Xi
1
1 2 1
=
∂ n i
Yi Xi Xi
1
1 2 2
Igualando a cero las expresiones anteriores se obtienen dos ecuaciones que se denominan ecuaciones normales :
= =
n
i
i
n
i
Yi n X 1 1
= = =
n
i
i
n
i
n
i
Yi Xi Xi X 1
2 1
2 1
1
Resolviendo el sistema de ecuaciones normales se obtienen las expresiones analíticas de los estimadores mínimo-cuadráticos para el MRLS:
var( )
ˆ cov( , )
1
2
1 (^2) X
n
i
i
n
i
−
=
Ejemplo:
Estimar por MCO los parámetros del siguiente modelo:
Para ello contamos con los siguientes datos correspondientes a 5 empresas:
Ahora podemos calcular los errores o residuos ( u ˆ i^ ) y los valores predichos ( Y ˆ i^ ) por el
modelo:
Ventas (Yi) Publicidad (X (^) i) 1 200 30 133.3 66. 2 400 50 700.0 -300. 3 800 50 700.0 100. 4 1200 60 983.3 216. 5 900 60 983.3 -83. Suma 3500 250 3500 0. Media 700 50 700
2.2 El modelo de regresión lineal múltiple
Vamos a generalizar el MLRS puesto que es evidente que una variable puede venir explicada o influida por más de una variable.
Se considera que la variable endógena es una función lineal de k-1 variables explicativas y de una perturbación aleatoria. El modelo de regresión lineal múltiple (MRLM) con K regresores (k-1 variables explicativas más el término constante) se expresa como:
Ajuste mínimo cuadrático del hiperplano de regresión
suma de los cuadrados de los residuos):
=
n
i
ui u u un 1
2 2 2
2 1
Recordar que Y (^) i = Y ˆ i^ + u ˆ i , por lo que los residuos:
2
1
1 2 2 1
= =
n
i
i i k ki
n
i
=
∂ n i
Yi X i kXki
1
1 2 2 1
=
∂ n i
Yi X i kXki X i
1
1 2 2 2 2
=
∂ n i
i i k ki ki k
1
1 2 2
Igualando a cero las expresiones anteriores se obtienen k ecuaciones que se denominan ecuaciones normales :
= = =
n
i
k ki
n
i
i
n
i
Yi n X X 1 1
2 1
= = = =
n
i
k i ki
n
i
i
n
i
n
i
Yi X i X i X X X 1
2 1
2 2 1
2 1
2 1 2
= = = =
n
i
k ki
n
i
i ki
n
i
n
i
Yi Xki Xki X X X 1
2 1
2 1
2 1
Resolviendo el sistema de ecuaciones normales se obtienen las expresiones analíticas de los estimadores mínimo-cuadráticos para el MRLM.
Formas funcionales
Modelo nivel-nivel
Yi = β 1 + β 2 Xi + u i → i
i X
Y ∂
∂ β 2 =
Modelo log-log (potencial o doblemente logarítmico)
u i
2 1
LYi = β 1 + β 2 LXi + u i → (^) Y X
i
i
i
i
i
i
X
X
Y
Y
LX
LY β (^2) ∂ = ε /
∂
= ∂
Modelo nivel-log
Yi = β 1 + β 2 LXi + u i →
i
i
i i
i
X
X
Y LX
Y ∂
∂
∂ β 2 =
Modelo log-nivel (exponencial)
Xi u i
β β
LYi = β 1 + β 2 Xi + u i → i
i
i
i
i X
Y
Y
X
LY ∂
∂
= ∂
∂ β 2 =
Ejemplo: (Caso 3.7 del libro de Uriel y Gea (1997), pág. 135):
ABSEN= Días que en el último año han faltado al trabajo cada uno de los trabajadores EDAD= Edad en años de cada empleado ANTIGUE= Años de antigüedad en la empresa SALARIO= Salario mensual en euros
Supongamos que tenemos un modelo con k=3 (dos variables explicativas):
de los cuadrados de los residuos):
=
n
i
ui u u un 1
2 2 2
2 1
Recordar que Y (^) i = Y ˆ i^ + u ˆ i , por lo que los residuos:
ui Yi Yi Yi 1 2 X 2 i 3 X 3 i
2
1
1 2 2 3 3 1
= =
n
i
i i i
n
i
=
∂ n i
Yi X i X i
1
1 2 2 3 3 1
=
∂ n i
Yi X i X i X i
1
1 2 2 3 3 2 2
β β β β
=
∂ n i
i i i i k
1
1 2 2 3 3 3
β β β β
Igualando a cero las expresiones anteriores se obtienen 3 ecuaciones que se denominan ecuaciones normales :
= = =
n
i
i
n
i
i
n
i
Yi n X X 1
3 3 1
2 1
1 2
= = = =
n
i
i i
n
i
i
n
i
n
i
Yi X i X i X X X 1
3 2 3 1
2 2 1
2 1
2 1 2 βˆ βˆ βˆ
∑ ∑ ∑ ∑ = = = =
n
i
k i
n
i
i i
n
i
n
i
Yi X i X i X X X 1
2 3 1
2 3 1
2 1
3 1 3
Resolviendo el sistema de ecuaciones normales se obtienen las expresiones analíticas de los estimadores mínimo-cuadráticos para el MRL:
( )( ) ( ) ( )( ) ( )( )
∑ (^ )^ ∑(^ )^ (∑^ (^ )(^ ))
∑ ∑ ∑ ∑ − − − − −
2 2 3 3
2 3 3
2 2 2
3 3 2 2 3 3
2 2 2 3 3 2
i i i i
i i i i i i i
( )( ) ( ) ( )( ) ( )( )
∑ (^ )^ ∑(^ )^ (∑^ (^ )(^ ))
∑ ∑ ∑ ∑ − − − − −
2 2 3 3
2 2 2
2 3 3
2 2 2 2 3 3
2 3 3 2 2 ˆ 3 X X X X X X X X
i i i i
Si (^ )(^ )^
( )( ) ( )
∑ ∑
∑ −
2 2
2 2 2 2 3 3 2
i
i i i
( )( ) ( ) 2 3 3
3 3 ˆ 3 ∑
∑ −
i
( )
∑
∑ ∑
2
2 2 2
2 2
i
i i i
i i d
d Y d
d Y Y
simple de X (^) 2 sobre X (^) 3.
Esta ecuación demuestra que podemos hacer una regresión simple de Y sobre (^) d 2 i para
es, los residuos d 2 i son la parte de X (^) 2 i que no está correlacionada con X (^) 3 i. Esto
significa que d 2 i es X (^) 2 i después de que los efectos de X (^) 3 i hayan sido tomados en
de X (^) 3 haya sido tenido en cuenta.
Cuando se dispone de n observaciones sobre y y sobre X, la estimación de los parámetros del modelo consiste en ajustar un hiperplano al conjunto de observaciones sobre el regresando y los regresores. Al igual que en el modelo lineal simple se pueden utilizar diversos criterios de ajuste. La discusión efectuada con el MRLS es válida en el contexto de la regresión múltiple. Por tanto, se aplicará el criterio de minimizar la suma de los cuadrados de los residuos.
Una vez estimado los parámetros, el modelo estimado y los residuos mínimo- cuadráticos tomarán la forma:
Ajuste mínimo cuadrático del hiperplano de regresión
El modelo en notación matricial es:
Vamos a minimizar la suma de los cuadrados de los residuos (SCR). El vector de residuos puede expresarse como:
La suma de los cuadrados de los residuos es:
=
n
i
i
n
n u
u
u
u
u u u u u 1
(^22)
1
1 2 ˆ
ˆ
Lo cual puede expresarse como:
Ahora vamos a minimizar la suma de los cuadrados de los residuos respecto del vector de parámetros, esto es minimizamos:
Para obtener el mínimo de la SCR hay que obtener la primera derivada e igualarla a cero:
β β
Xy XX u u =− ′ + ′ ∂
Igualando a cero obtenemos un sistema de k ecuaciones denominadas ecuaciones normales:
Este sistema de ecuaciones en forma extendida toma la forma:
∑
∑
∑
∑ ∑ ∑
∑ ∑ ∑
∑ ∑
=
=
=
= = =
= = =
= =
n
i
ki i
n
i
i i
n
i
i
k n
i
ki
n
i
i ki
n
i
ki
n
i
i ki
n
i
i
n
i
i
n
i
ki
n
i
i
n X X
1
1
2
1 2
1
1
2 1
2 1
1
2 1
2 2 1
2
1 1
2
[Reflexionar sobre que X’X es simétrica, recoge los productos cruzados entre los regresores mientras que X’ y recoge los productos cruzados entre los regresores e y ]
Para resolver el sistema de ecuaciones normales se debe cumplir que el rango de la matriz X’X sea igual a k. Si se cumple esta condición, el sistema de ecuaciones tiene una única solución. Para que la matriz X’X sea invertible debe de cumplirse que:
Si el rango de X’X es igual a k se dice que X’X es no singular, es decir es invertible y
se puede resolver el sistema de ecuaciones premultiplicándolo por ( X ′ X ) −^1 , de forma
que se obtiene la expresión del vector de estimadores mínimo-cuadráticos:
βˆ= (^ X ′ X )^ −^1 X ′ y
Si X’X no fuere invertible (matriz singular), el sistema de ecuaciones tiene infinitas soluciones (Multicolinealidad perfecta).
( )
( )
βˆ^ XX^1 XY
u ˆ^ Y Y ˆ