








Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Econometría, Profesor: Francis Hernández, Carrera: Economía, Universidad: UNED
Tipo: Apuntes
1 / 14
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!









5.1 Definición, grados y consecuencias en la estimación MCO
5.1.1 Definición
El problema de la multicolinealidad hace referencia a la existencia de relaciones lineales entre las variables explicativas del modelo de regresión y conlleva el incumplimiento de una de las hipótesis básicas del modelo.
Esta hipótesis básica, que suponía que no existían combinaciones lineales entre los regresores, garantizaba que la matriz X fuera de rango pleno
de regresión, ya que el determinante de la matriz (X’X) sería nulo y, en consecuencia, no existiría la inversa de dicha matriz.
La multicolinealidad es un problema muestral, en el sentido de que puede suceder que las variables explicativas presenten un alto grado de correlación lineal en una determinada muestra, de forma que sea difícil aislar la influencia de cada una de ellas sobre la variable dependiente del modelo.
A modo de ejemplo, supongamos el siguiente modelo de regresión: y i = β 1 x1i + β 2 x (^) 2i + u (^) i ; i =1,..., n
donde x^ 2i = λ^ x1i.
Puede observarse que, en este caso, no sería posible estimar las influencias individuales de las dos variables explicativas, sino únicamente una combinación lineal de ambas:
5.1.2 Grados
Aunque originalmente el término ‘multicolinealidad’ hacía referencia a la existencia de relaciones lineales exactas entre variables explicativas del modelo (como el ejemplo anterior), puede hablarse en un sentido más amplio de la presencia de un alto grado de correlación lineal entre las variables explicativas y, por tanto, podría distinguirse el problema en función del grado de multicolinealidad:
A) Exacta ó Perfecta: presencia de relaciones lineales exactas entre algunas de las variables explicativas del modelo de regresión. Es decir,
λ 0 + λ 1 x1i + λ 2 x (^) 2i + ... + λ (^) k x (^) ki= 0
Este grado de multicolinealidad es el que supone el incumplimiento de la hipótesis básica mencionado en el apartado anterior y el que conlleva la imposibilidad de estimar por MCO los parámetros β del modelo de regresión.
Dado que el coeficiente de correlación simple entre las dos variables
explicativas es (^1 )
n^2 1i 2i 2 i 1 x ,x (^) n 2 n 2 1i 2 2ii i 1 i 1
x x
x x
=
= =
ρ =
ɶ ɶ
ɶ ɶ
, podemos plantear las expresiones anteriores en
función de dicho coeficiente:
( )
( )
1 2
1 2
n 2 n n n 2i 1i i 1i 2i 2i i 1 i 1^ i 1^ i 1^ i 1 n 2 n 2 2 1i 2 2ii x ,x i 1 i 1 n 2 n n n i 1 1i^ i 1 2i^ i^ i 1 1i^ 2i^ i 1 1i^ i 2 n 2 n 2 2 1i 2 2ii x ,x i 1 i 1
x x y x x x y ˆ x x 1 ˆ x x y x x x y ˆ x x 1
= = = =
= =
= = = =
= =
(^) − β = (^) − ρ β = (^) (^) − β^ = (^) − ρ
ɶ ɶ ɶ ɶ ɶ ɶ ɶ
ɶ ɶ
ɶ ɶ ɶ ɶ ɶ ɶ ɶ
ɶ ɶ
y (^) ( )
( ) ( )
( ) ( )
1 2
1 2
2 1 n (^2 ) 1i x ,x i 1 j 2 2 n (^2 ) 2i x ,x i 1
Var x 1 Var ˆ ˆ^1 Var x 1
=
=
(^) β = σ − ρ β = (^) β = σ (^) − ρ
A) Exacta ó Perfecta: x (^) 2i = λx (^) 1ió ρ^2 x ,x 1 2 = 1
En este caso, no puede realizarse la estimación por MCO de los parámetros del modelo, dado que el determinante de la matriz (X’X) es nulo y, por tanto, no existe su inversa:
( ) ( )
1 2
1 2
ˆ 0 ˆ (^) (indeterminados) 0 Var ˆ^ Var ˆ
β = = β (^) β = β → ∞
B) Aproximada ó no exacta: x (^) 2i = λx (^) 1i + vió ρ (^2) x ,x 1 2 ≠ 0
En esta situación, sí puede estimarse por MCO, dado que, aunque el determinante de la matriz (X’X) será próximo a cero en función del grado de correlación, no es nulo y, por tanto, sí existe su inversa. Sin embargo, dicha estimación será imprecisa, ya que las varianzas aumentarán a medida que el grado de correlación sea más alto:
( ) ( 1 2 )
2 (^1) n 2 2 1i x ,x i 1
Var ˆ^1 x 1 =
β = σ
y (^) ( ) ( 1 2 )
2 (^2) n 2 2 2i x ,x i 1
Var ˆ^1 x 1 =
β = σ
En este caso, ρ^2 x ,x 1 2 = 0 y, por tanto,
n 1i 2i i 1
( )
( )
n 1i i 2 1 i 1 1 n 2 n 2 1i 1i i 1 i 1 n 2i i 2 2 i 1 2 n 2 n 2 2 2ii 2i i 1 i 1
x y ˆ ˆ^1 y Var x x
x y ˆ (^) y Var ˆ^1 x x
=
= =
=
= =
β = β = σ β = β = σ
ɶ ɶ
ɶ ɶ
ɶ ɶ
ɶ ɶ
Es decir, se obtienen los mismos resultados que si se realizaran las regresiones por separado de cada una de las variables explicativas:
i 1 1i 1i i 2 2i 2i
y x u y x u
^ = β^ + (^) = β +
ɶ ɶ ɶ ɶ
Si comparamos el resultado de las varianzas en presencia de multicolinealidad aproximada con el obtenido en ausencia de correlación, obtendríamos el factor de incremento ó inflación de la varianza a causa de la multicolinealidad (VIF):
( ) ( ) (^1 )
j 2 j,ausencia correlación^ x ,x
Var ˆ 1 VIF Var ˆ^1
β = = β − ρ
o j A j
β = (^) β ≠
( )
j n K j
t (^) ˆ t S
−
β
Por la misma razón, los intervalos de confianza se incrementan.
5. Coeficiente de Theil:
( ) 2 k 2 2 h (^2) h 1
0 ausencia de correlación Theil R R R = R^ multicolinealidad exacta
6. Matriz de correlaciones ó (X’X):
1 2 1 k 2 k
x ,x x ,x X x ,x X X X
R 0 multicolinealidad exacta 1 R R 0 multicolinealidad aproximada R 1 ausencia total de correlación 1
ρ^ ρ ^ =^ → ρ^ = (^) → (^) ≈ → = →
X X 0 multicolinealidad exacta X X X X 0 multicolinealidad aproximada
5.3 Soluciones posibles
No existe una única solución general al problema, sino que depende de la información disponible, del tipo de modelo planteado y también del objetivo propuesto. Además, estas soluciones pueden generar otro tipo de problemas que incluso podrían ser más graves.
1. Incorporar nueva información
A) Muestral: Al ser un problema muestral, podría mejorarse depurando los datos o incorporando nuevos datos que recojan mejor los efectos de las variables explicativas y no presenten correlación alta.
Inconveniente : pueden incorporarse datos de una situación estructuralmente diferente, dando lugar a un problema de cambio estructural.
B) Extramuestral: Añadir estimaciones auxiliares o externas de algún parámetro o incorporar restricciones lineales entre parámetros (estimación restringida, MCR).
Inconveniente : la estimación dependerá de las propiedades de la información incorporada; debe asegurarse que dicha información sea cierta o correcta.
2. Reespecificación del modelo
A) Eliminar variables: Quitar alguna o algunas variables explicativas que eliminen el problema de multicolinealidad existente.
Inconveniente : puede incurrirse en un problema de omisión de variables relevantes.
B) Transformar variables: Transformar las variables aplicando logaritmos, cocientes, incrementos, … Podría mejorar el grado de multicolinealidad al tratarse de definiciones diferentes de las variables.
Inconveniente : pueden generarse otros problemas, tales como no linealidad (en el caso de aplicar logaritmos), heterocedasticidad (cocientes) y autocorrelación (diferencias).
C) Incorporar las relaciones exactas al modelo: En el caso de multicolinealidad exacta, si no existe otra solución, pueden incorporarse las relaciones lineales exactas entre las variables explicativas al modelo de regresión y estimar por MCO el modelo resultante, tal y como se planteó en el ejemplo del apartado 5.1.1.
Inconveniente : sólo pueden estimarse combinaciones lineales de los parámetros deseados.
3. Nuevos métodos de estimación
A) Componentes principales
B) Regresiones cresta ( ridge regression )
4. ‘Soportarla’
Si se comprueba que no es posible solucionar el grado de multicolinealidad existente a través de las propuestas anteriores, se puede trabajar con el modelo de regresión ‘ a pesar de la multicolinealidad ’, siempre que no afecte al objetivo planteado. Es decir, utilizar la validez del análisis conjunto del modelo pero tener precauciones con la imprecisión e inseguridad de la estimación individual.
a) Interprete económicamente las estimaciones de los parámetros y el valor del coeficiente R^2 ; analice la significatividad individual y conjunta al 95% de confianza. Comente el valor del coeficiente de correlación simple entre las dos variables explicativas.
¿Qué conclusión sacaría? ¿Hay algún problema que justifique los resultados encontrados?
Nota : t15;0.975 = 2.13y F2,15;0.95^ =3.
b) Se añaden dos nuevas observaciones al estudio planteado anteriormente, con lo que se trabaja con una muestra de 20 datos, y se obtienen los siguientes resultados por MCO:
Parámetro Estimación Desv. Típica Estadístico t β 0 75.48 32.05 2. β 1 1.97 0.74 2. β 2 1.27^ 0.38^ 3. R 2 = 0.94 F = 133.17 ρ^2 L,K =0.
¿Qué conclusión obtendría ahora? ¿Hay alguna razón que justifique las diferencias encontradas?
Nota : t17;0.975 = 2.11y F2,17;0.95 =3.
Ejercicio 4 En el modelo de regresión yi = β + β 0 1 x1i + β 2 x (^) 2i + β 3 x (^) 3i + ui , se sabe que x 3i = x (^) 2i − 2x1i + 5 a) ¿Qué tipo de problema se presenta en la estimación MCO del modelo? b) Si no hubiese ninguna otra solución posible, salvo incorporar la relación lineal existente entre las variables explicativas en el modelo de regresión, ¿podría estimarse por MCO todos los parámetros del modelo?
Ejercicio 5 La estimación por MCO de una función de producción de Cobb- Douglas ofrece los siguientes resultados:
ln Q^ ˆɶ^ t = 0.42ln Lɶ^ t +0.67 ln Kɶ^ t ; R 2 =0. Se dispone también de la estimación de las siguientes regresiones auxiliares: Regresión auxiliar R^2 ln Qɶ^ t = α 1 ln Lɶ^ t +u1t R 2 =0. ln Qɶ^ t = α 2 ln Kɶ^ t +u2t R 2 =0.
ln Lɶ^ t = γ ln Kɶ^ t +vt R 2 =0.
a) Calcule el coeficiente de Theil y comente si existen indicios de multicolinealidad.
b) Calcule el VIF y comente si existen indicios de multicolinealidad.
Ejercicio 6 Para analizar el gasto en consumo (y) en función de los ingresos salariales (x 1 ) y de la riqueza (x 2 ), se dispone de 50 observaciones y se plantea el siguiente modelo de regresión: y i = β + β 0 1 x1i + β 2 x (^) 2i +ui
cuya estimación por MCO ofrece los siguientes resultados:
Parámetro Estimación Desv. Típica Estadístico t β 0 320.60^ 219.60^ 1. β 1 0.28 0.18 1. β 2 -0.31^ 1.06^ -0. R 2 = 0.95 F = 446. Se dispone también de la estimación de las siguientes regresiones auxiliares: Regresión auxiliar R^2 y ˆ i = 269.5 + 0.23x1i R 2 =0. y ˆ i = 75.76 + 1.32x2i R 2 =0.
x^ ˆ (^) 2i = 162.15 + 0.17x1i R 2 =0.
a) Analice la significatividad individual y conjunta al 95% de confianza y comente el valor del coeficiente R^2.
¿Qué conclusión sacaría? ¿Hay algún problema que justifique los resultados encontrados?
Nota : t (^) 47;0.975= 2.01y F2,47;0.95 =3.
b) Calcule el coeficiente de Theil y comente si existen indicios de multicolinealidad.
c) Calcule el VIF y comente si existen indicios de multicolinealidad.
Ejercicio 7 Klein y Goldberger plantearon una relación para la economía de EEUU entre el Consumo Interior Total (C) y las variables Renta Salarial (W), Renta no salarial no agraria (NW) y Renta Agraria (A):
(1) Ct = β + β 0 1 Wt + β 2 NWt + β 3 A (^) t +ut Con 20 observaciones anuales, la estimación por MCO es la siguiente: Parámetro Estimación Desv. Típica Estadístico t^ I^ 95%β (^) j VIF β 0 8.13 8.92 0.91 [-10.78 ; 27.04] ―― β 1 1.06 0.17 6.23 [0.70 ; 1.42]^ 7. β 2 0.45^ 0.66^ 0.68^ [-0.95 ; 1.85]^ 2. β 3 0.12 1.09 0.11 [-2.19 ; 2.43] 6. R 2 = 0.95 F = 101.33^ Theil = 0.84 SCR = 32^8
Matriz de correlaciones: (^) X X
Ejercicio Soluciones
a) β^ ˆ 1 =0.30=efecto ventas-calidad β^ ˆ 2 =0.25=efecto ventas-gastos en publicidad
b) No existe multicolinealidad, ya que
30 1i 2i i 1
2 β^ ˆ^0 = − 69 , β =^ ˆ^1 4.32y β^ ˆ^2 =1.
a) Claros indicios de multicolinealidad aproximada:
b) Cambios importantes ante una variación pequeña en la muestra: claros indicios de multicolinealidad.
a) Presencia de multicolinealidad exacta, lo que hace imposible la estimación por MCO del modelo b) No, sólo podrían estimarse las tres combinaciones siguientes:
a) Theil=0.77 → evidencia de un problema de multicolinealidad b) VIF=6.25 → evidencia de un problema de multicolinealidad
a) Claro indicio de multicolinealidad aproximada:
SOLUCIONES EJERCICIOS (Continuación)
Ejercicio Soluciones
a) 1. Claros indicios de multicolinealidad aproximada:
b) b.1)• (1)-(2)→→→→F=0.24→ no se rechaza H (^) o : β 2 = 0.75β 1 → modelo 2
- (1)-(3)→→→→F=0.19→ no se rechaza H (^) o : β 3 = 0.625β 1 → modelo 3 - (1)-(4)→→→→F=0.17→ no se rechaza H (^) o : β 2 = 0.75 β 1 y β 3 = 0.625β 1 → modelo 4 - Conclusión: preferible el modelo 4 (las dos restricciones son ciertas)
b.2) En el modelo 4 disminuyen todas las varianzas respecto al modelo 1 y, en consecuencia, aumentan los valores de todos los estadísticos t de significación individual, dando lugar a que las tres variables explicativas resulten significativas (β 0 → t=1.52 , β 1 → t=19.4 , β 2 → t=18 y β 3 → t=20)
b.3) El modelo restringido sería:
con lo que se trata de un modelo de regresión simple y, por tanto, ha desaparecido completamente la multicolinealidad existente en el modelo (1).