Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Tema 5 Econometría, Apuntes de Econometría

Asignatura: Econometría, Profesor: Francis Hernández, Carrera: Economía, Universidad: UNED

Tipo: Apuntes

2015/2016

Subido el 30/03/2016

reubens_munhiz
reubens_munhiz 🇪🇸

4.5

(2)

1 documento

1 / 14

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ECONOMETRÍA
3º GRADO ECONOMÍA
CURSO 2014-15
ESQUEMAS Y EJERCICIOS
TEMA 5
PROBLEMAS CON LA
INFORMACIÓN MUESTRAL.
MULTICOLINEALIDAD
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Vista previa parcial del texto

¡Descarga Tema 5 Econometría y más Apuntes en PDF de Econometría solo en Docsity!

ECONOMETRÍA

3º GRADO ECONOMÍA

CURSO 2014-

ESQUEMAS Y EJERCICIOS

TEMA 5

PROBLEMAS CON LA

INFORMACIÓN MUESTRAL.

MULTICOLINEALIDAD

5.1 Definición, grados y consecuencias en la estimación MCO

5.1.1 Definición

El problema de la multicolinealidad hace referencia a la existencia de relaciones lineales entre las variables explicativas del modelo de regresión y conlleva el incumplimiento de una de las hipótesis básicas del modelo.

Esta hipótesis básica, que suponía que no existían combinaciones lineales entre los regresores, garantizaba que la matriz X fuera de rango pleno

( rango X^ (^ )^ =^ K). Su incumplimiento implica que el rango de la matriz X no sea

completo, ( rango X( )< K), y, por tanto, afecta a la estimación por MCO del modelo

de regresión, ya que el determinante de la matriz (X’X) sería nulo y, en consecuencia, no existiría la inversa de dicha matriz.

La multicolinealidad es un problema muestral, en el sentido de que puede suceder que las variables explicativas presenten un alto grado de correlación lineal en una determinada muestra, de forma que sea difícil aislar la influencia de cada una de ellas sobre la variable dependiente del modelo.

A modo de ejemplo, supongamos el siguiente modelo de regresión: y i = β 1 x1i + β 2 x (^) 2i + u (^) i ; i =1,..., n

donde x^ 2i = λ^ x1i.

Puede observarse que, en este caso, no sería posible estimar las influencias individuales de las dos variables explicativas, sino únicamente una combinación lineal de ambas:

yi = β + β λ ( 1 2 )x1i + ui ; i =1,..., n

5.1.2 Grados

Aunque originalmente el término ‘multicolinealidad’ hacía referencia a la existencia de relaciones lineales exactas entre variables explicativas del modelo (como el ejemplo anterior), puede hablarse en un sentido más amplio de la presencia de un alto grado de correlación lineal entre las variables explicativas y, por tanto, podría distinguirse el problema en función del grado de multicolinealidad:

A) Exacta ó Perfecta: presencia de relaciones lineales exactas entre algunas de las variables explicativas del modelo de regresión. Es decir,

λ 0 + λ 1 x1i + λ 2 x (^) 2i + ... + λ (^) k x (^) ki= 0

Este grado de multicolinealidad es el que supone el incumplimiento de la hipótesis básica mencionado en el apartado anterior y el que conlleva la imposibilidad de estimar por MCO los parámetros β del modelo de regresión.

Dado que el coeficiente de correlación simple entre las dos variables

explicativas es (^1 )

n^2 1i 2i 2 i 1 x ,x (^) n 2 n 2 1i 2 2ii i 1 i 1

x x

x x

=

= =

     ρ =

ɶ ɶ

ɶ ɶ

, podemos plantear las expresiones anteriores en

función de dicho coeficiente:

( )

( )

1 2

1 2

n 2 n n n 2i 1i i 1i 2i 2i i 1 i 1^ i 1^ i 1^ i 1 n 2 n 2 2 1i 2 2ii x ,x i 1 i 1 n 2 n n n i 1 1i^ i 1 2i^ i^ i 1 1i^ 2i^ i 1 1i^ i 2 n 2 n 2 2 1i 2 2ii x ,x i 1 i 1

x x y x x x y ˆ x x 1 ˆ x x y x x x y ˆ x x 1

= = = =

= =

= = = =

= =

 (^) −  β =  (^) − ρ  β = (^)   (^) −  β^ =  (^) − ρ 

ɶ ɶ ɶ ɶ ɶ ɶ ɶ

ɶ ɶ

ɶ ɶ ɶ ɶ ɶ ɶ ɶ

ɶ ɶ

y (^) ( )

( ) ( )

( ) ( )

1 2

1 2

2 1 n (^2 ) 1i x ,x i 1 j 2 2 n (^2 ) 2i x ,x i 1

ˆ^1

Var x 1 Var ˆ ˆ^1 Var x 1

=

=

 (^) β = σ   − ρ β =    (^) β = σ  (^) − ρ 

A) Exacta ó Perfecta: x (^) 2i = λx (^) 1ió ρ^2 x ,x 1 2 = 1

En este caso, no puede realizarse la estimación por MCO de los parámetros del modelo, dado que el determinante de la matriz (X’X) es nulo y, por tanto, no existe su inversa:

( ) ( )

1 2

1 2

ˆ 0 ˆ (^) (indeterminados) 0 Var ˆ^ Var ˆ

β = = β    (^) β = β → ∞ 

B) Aproximada ó no exacta: x (^) 2i = λx (^) 1i + vió ρ (^2) x ,x 1 2 ≠ 0

En esta situación, sí puede estimarse por MCO, dado que, aunque el determinante de la matriz (X’X) será próximo a cero en función del grado de correlación, no es nulo y, por tanto, sí existe su inversa. Sin embargo, dicha estimación será imprecisa, ya que las varianzas aumentarán a medida que el grado de correlación sea más alto:

( ) ( 1 2 )

2 (^1) n 2 2 1i x ,x i 1

Var ˆ^1 x 1 =

β = σ

y (^) ( ) ( 1 2 )

2 (^2) n 2 2 2i x ,x i 1

Var ˆ^1 x 1 =

β = σ

  • Ausencia de correlación: es interesante plantear la situación extrema de ausencia total de correlación entre las dos variables explicativas, con el objetivo de comparar los resultados para analizar las consecuencias de la presencia de multicolinealidad aproximada.

En este caso, ρ^2 x ,x 1 2 = 0 y, por tanto,

n 1i 2i i 1

x x 0

∑ ɶ^ ɶ^ = , con lo que

( )

( )

n 1i i 2 1 i 1 1 n 2 n 2 1i 1i i 1 i 1 n 2i i 2 2 i 1 2 n 2 n 2 2 2ii 2i i 1 i 1

x y ˆ ˆ^1 y Var x x

x y ˆ (^) y Var ˆ^1 x x

=

= =

=

= =

  β = β = σ     β = β = σ   

ɶ ɶ

ɶ ɶ

ɶ ɶ

ɶ ɶ

Es decir, se obtienen los mismos resultados que si se realizaran las regresiones por separado de cada una de las variables explicativas:

i 1 1i 1i i 2 2i 2i

y x u y x u

^ = β^ +  (^) = β + 

ɶ ɶ ɶ ɶ

Si comparamos el resultado de las varianzas en presencia de multicolinealidad aproximada con el obtenido en ausencia de correlación, obtendríamos el factor de incremento ó inflación de la varianza a causa de la multicolinealidad (VIF):

( ) ( ) (^1 )

j 2 j,ausencia correlación^ x ,x

Var ˆ 1 VIF Var ˆ^1

β = = β − ρ

  • Entre las consecuencias más importantes de la presencia de multicolinealidad aproximada, se encuentran las siguientes: 1. Los estimadores MCO de β siguen siendo ELIO. Ninguna de las propiedades se ve afectada, ya que en ninguna de ellas se exigía el cumplimiento de la hipótesis básica de ausencia de multicolinealidad. 2. La matriz de varianzas-covarianzas depende directamente de la mayor o menor relación entre las variables explicativas del modelo; las varianzas de los estimadores crecen a medida que aumenta el grado de correlación entre las variables explicativas. 3. Los estimadores, aunque insesgados, pueden sufrir errores considerables y presentar cambios importantes ante variaciones, incluso pequeñas, en la información muestral, lo que pone de manifiesto la inseguridad de la estimación. 4. Las varianzas elevadas hacen aumentar la probabilidad de no rechazar la hipótesis nula de los contrastes de significación individual de los parámetros (la probabilidad de error tipo II, no rechazar una hipótesis nula falsa), dado que el estadístico t depende inversamente del valor de la varianza:

o j A j

H : 0

H : 0

 β =  (^) β ≠ 

( )

j n K j

t (^) ˆ t S

β

β

Por la misma razón, los intervalos de confianza se incrementan.

5. Coeficiente de Theil:

( ) 2 k 2 2 h (^2) h 1

0 ausencia de correlación Theil R R R = R^ multicolinealidad exacta

^ =^ →

donde R 2 hes el coeficiente R^2 de la regresión auxiliar y = f ( x , x ,..., x 1 2 k )sin xh.

6. Matriz de correlaciones ó (X’X):

1 2 1 k 2 k

x ,x x ,x X x ,x X X X

R 0 multicolinealidad exacta 1 R R 0 multicolinealidad aproximada R 1 ausencia total de correlación 1

 ρ^ ρ    ^ =^ →  ρ^   = (^)   → (^)  ≈ →    = →     

X X 0 multicolinealidad exacta X X X X 0 multicolinealidad aproximada

 ′^ ≈^ →

5.3 Soluciones posibles

No existe una única solución general al problema, sino que depende de la información disponible, del tipo de modelo planteado y también del objetivo propuesto. Además, estas soluciones pueden generar otro tipo de problemas que incluso podrían ser más graves.

1. Incorporar nueva información

A) Muestral: Al ser un problema muestral, podría mejorarse depurando los datos o incorporando nuevos datos que recojan mejor los efectos de las variables explicativas y no presenten correlación alta.

Inconveniente : pueden incorporarse datos de una situación estructuralmente diferente, dando lugar a un problema de cambio estructural.

B) Extramuestral: Añadir estimaciones auxiliares o externas de algún parámetro o incorporar restricciones lineales entre parámetros (estimación restringida, MCR).

Inconveniente : la estimación dependerá de las propiedades de la información incorporada; debe asegurarse que dicha información sea cierta o correcta.

2. Reespecificación del modelo

A) Eliminar variables: Quitar alguna o algunas variables explicativas que eliminen el problema de multicolinealidad existente.

Inconveniente : puede incurrirse en un problema de omisión de variables relevantes.

B) Transformar variables: Transformar las variables aplicando logaritmos, cocientes, incrementos, … Podría mejorar el grado de multicolinealidad al tratarse de definiciones diferentes de las variables.

Inconveniente : pueden generarse otros problemas, tales como no linealidad (en el caso de aplicar logaritmos), heterocedasticidad (cocientes) y autocorrelación (diferencias).

C) Incorporar las relaciones exactas al modelo: En el caso de multicolinealidad exacta, si no existe otra solución, pueden incorporarse las relaciones lineales exactas entre las variables explicativas al modelo de regresión y estimar por MCO el modelo resultante, tal y como se planteó en el ejemplo del apartado 5.1.1.

Inconveniente : sólo pueden estimarse combinaciones lineales de los parámetros deseados.

3. Nuevos métodos de estimación

A) Componentes principales

B) Regresiones cresta ( ridge regression )

4. ‘Soportarla’

Si se comprueba que no es posible solucionar el grado de multicolinealidad existente a través de las propuestas anteriores, se puede trabajar con el modelo de regresión ‘ a pesar de la multicolinealidad ’, siempre que no afecte al objetivo planteado. Es decir, utilizar la validez del análisis conjunto del modelo pero tener precauciones con la imprecisión e inseguridad de la estimación individual.

a) Interprete económicamente las estimaciones de los parámetros y el valor del coeficiente R^2 ; analice la significatividad individual y conjunta al 95% de confianza. Comente el valor del coeficiente de correlación simple entre las dos variables explicativas.

¿Qué conclusión sacaría? ¿Hay algún problema que justifique los resultados encontrados?

Nota : t15;0.975 = 2.13y F2,15;0.95^ =3.

b) Se añaden dos nuevas observaciones al estudio planteado anteriormente, con lo que se trabaja con una muestra de 20 datos, y se obtienen los siguientes resultados por MCO:

Parámetro Estimación Desv. Típica Estadístico t β 0 75.48 32.05 2. β 1 1.97 0.74 2. β 2 1.27^ 0.38^ 3. R 2 = 0.94 F = 133.17 ρ^2 L,K =0.

¿Qué conclusión obtendría ahora? ¿Hay alguna razón que justifique las diferencias encontradas?

Nota : t17;0.975 = 2.11y F2,17;0.95 =3.

Ejercicio 4 En el modelo de regresión yi = β + β 0 1 x1i + β 2 x (^) 2i + β 3 x (^) 3i + ui , se sabe que x 3i = x (^) 2i − 2x1i + 5 a) ¿Qué tipo de problema se presenta en la estimación MCO del modelo? b) Si no hubiese ninguna otra solución posible, salvo incorporar la relación lineal existente entre las variables explicativas en el modelo de regresión, ¿podría estimarse por MCO todos los parámetros del modelo?

Ejercicio 5 La estimación por MCO de una función de producción de Cobb- Douglas ofrece los siguientes resultados:

ln Q^ ˆɶ^ t = 0.42ln Lɶ^ t +0.67 ln Kɶ^ t ; R 2 =0. Se dispone también de la estimación de las siguientes regresiones auxiliares: Regresión auxiliar R^2 ln Qɶ^ t = α 1 ln Lɶ^ t +u1t R 2 =0. ln Qɶ^ t = α 2 ln Kɶ^ t +u2t R 2 =0.

ln Lɶ^ t = γ ln Kɶ^ t +vt R 2 =0.

a) Calcule el coeficiente de Theil y comente si existen indicios de multicolinealidad.

b) Calcule el VIF y comente si existen indicios de multicolinealidad.

Ejercicio 6 Para analizar el gasto en consumo (y) en función de los ingresos salariales (x 1 ) y de la riqueza (x 2 ), se dispone de 50 observaciones y se plantea el siguiente modelo de regresión: y i = β + β 0 1 x1i + β 2 x (^) 2i +ui

cuya estimación por MCO ofrece los siguientes resultados:

Parámetro Estimación Desv. Típica Estadístico t β 0 320.60^ 219.60^ 1. β 1 0.28 0.18 1. β 2 -0.31^ 1.06^ -0. R 2 = 0.95 F = 446. Se dispone también de la estimación de las siguientes regresiones auxiliares: Regresión auxiliar R^2 y ˆ i = 269.5 + 0.23x1i R 2 =0. y ˆ i = 75.76 + 1.32x2i R 2 =0.

x^ ˆ (^) 2i = 162.15 + 0.17x1i R 2 =0.

a) Analice la significatividad individual y conjunta al 95% de confianza y comente el valor del coeficiente R^2.

¿Qué conclusión sacaría? ¿Hay algún problema que justifique los resultados encontrados?

Nota : t (^) 47;0.975= 2.01y F2,47;0.95 =3.

b) Calcule el coeficiente de Theil y comente si existen indicios de multicolinealidad.

c) Calcule el VIF y comente si existen indicios de multicolinealidad.

Ejercicio 7 Klein y Goldberger plantearon una relación para la economía de EEUU entre el Consumo Interior Total (C) y las variables Renta Salarial (W), Renta no salarial no agraria (NW) y Renta Agraria (A):

(1) Ct = β + β 0 1 Wt + β 2 NWt + β 3 A (^) t +ut Con 20 observaciones anuales, la estimación por MCO es la siguiente: Parámetro Estimación Desv. Típica Estadístico t^ I^ 95%β (^) j VIF β 0 8.13 8.92 0.91 [-10.78 ; 27.04] ―― β 1 1.06 0.17 6.23 [0.70 ; 1.42]^ 7. β 2 0.45^ 0.66^ 0.68^ [-0.95 ; 1.85]^ 2. β 3 0.12 1.09 0.11 [-2.19 ; 2.43] 6. R 2 = 0.95 F = 101.33^ Theil = 0.84 SCR = 32^8

Matriz de correlaciones: (^) X X

R 1 0.63 R 0.

= ^ → =

SOLUCIONES EJERCICIOS

Ejercicio Soluciones

a) β^ ˆ 1 =0.30=efecto ventas-calidad β^ ˆ 2 =0.25=efecto ventas-gastos en publicidad

b) No existe multicolinealidad, ya que

30 1i 2i i 1

x x 0

∑ ɶ^ ɶ^ =

2 β^ ˆ^0 = − 69 , β =^ ˆ^1 4.32y β^ ˆ^2 =1.

a) Claros indicios de multicolinealidad aproximada:

  • ρ^2 L,K elevado
  • contradicciones individual-conjunta:
    • Individual: signo incoherente para β^ ˆ 1 y variable K irrelevante
    • Conjunta: R^2 elevado y F conjunta significativa

b) Cambios importantes ante una variación pequeña en la muestra: claros indicios de multicolinealidad.

  • Análisis individual-conjunto:
    • Individual: cambios importantes en las estimaciones de los parámetros, signos coherentes y todas las variables relevantes
    • Conjunta: sigue igual; R^2 elevado y F conjunta significativa
  • ρ^2 L,K desciende Mejoran todos los resultados en el apartado b

a) Presencia de multicolinealidad exacta, lo que hace imposible la estimación por MCO del modelo b) No, sólo podrían estimarse las tres combinaciones siguientes:

( β + 0 5 β 3 ),^ ( β − 1 2 β^3 )y^ ( β 2 + β 3 )

a) Theil=0.77 → evidencia de un problema de multicolinealidad b) VIF=6.25 → evidencia de un problema de multicolinealidad

a) Claro indicio de multicolinealidad aproximada:

  • contradicciones individual-conjunta:
    • Individual: ninguna de las variables es relevante, además de un signo incoherente para β^ ˆ 2
    • Conjunta: R^2 elevado y F conjunta significativa b) Theil=0.92 → alto grado de multicolinealidad c) VIF=50 → alto grado de multicolinealidad

SOLUCIONES EJERCICIOS (Continuación)

Ejercicio Soluciones

a) 1. Claros indicios de multicolinealidad aproximada:

  • contradicciones individual-conjunta:
    • Individual: sólo relevante la variable W
    • Conjunta: R^2 elevado y F conjunta significativa
  • VIF>5 → evidencia de multicolinealidad
  • Theil≈R^2 → evidencia de multicolinealidad
  • R (^) X ≈ 0 y ρ^2 W ,Aelevado → evidencia de multicolinealidad 2. Los estimadores siguen siendo ELIO, pero sus varianzas se incrementan, dando lugar a estadísticos t bajos y a intervalos de confianza amplios.

b) b.1)• (1)-(2)→→→→F=0.24→ no se rechaza H (^) o : β 2 = 0.75β 1 → modelo 2

- (1)-(3)→→→→F=0.19→ no se rechaza H (^) o : β 3 = 0.625β 1 → modelo 3 - (1)-(4)→→→→F=0.17→ no se rechaza H (^) o : β 2 = 0.75 β 1 y β 3 = 0.625β 1 → modelo 4 - Conclusión: preferible el modelo 4 (las dos restricciones son ciertas)

b.2) En el modelo 4 disminuyen todas las varianzas respecto al modelo 1 y, en consecuencia, aumentan los valores de todos los estadísticos t de significación individual, dando lugar a que las tres variables explicativas resulten significativas (β 0 → t=1.52 , β 1 → t=19.4 , β 2 → t=18 y β 3 → t=20)

b.3) El modelo restringido sería:

Ct = β + β 0 1 ( Wt + 0.75NWt + 0.625A t )+ut

con lo que se trata de un modelo de regresión simple y, por tanto, ha desaparecido completamente la multicolinealidad existente en el modelo (1).