









Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: econometria 2, Profesor: rafael de arce, Carrera: Derecho + ADE, Universidad: UAM
Tipo: Apuntes
1 / 15
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!










Dpto. de Economía Aplicada Universidad Autónoma de Madrid [email protected]
Wooldridge, J.F. (2003). Introductory Econometrics. Capítulo 12 Econometría. D.N. Gujarati. Ed. McGraw Hill. Capítulo 12. Análisis Econométrico. W.H. Green.Capítulo 13 Dougherty, C. (1992). Introduction to Econometrics. Capitulo 12.
En el caso de los modelos transversales, el carácter exógeno de los regresores garantizaba el sesgo y/o la consistencia de los parámetros MCO en el marco del MBRL. Así mismo, la homocedasticidad de la perturbación aleatoria era necesaria para asegurar el carácter insesgado del estimador de la varianza de los parámetros. Ninguna de estas hipótesis se refería específicamente a la autocorrelación como causa de sesgo en la estimación de los parámetros o de sus desviaciones estándar.
En el marco de un modelo transversal, la relación entre perturbaciones aleatorias correspondientes a distintos individuos (particulares, empresas, sectores,….) es menos probable^2 pero, sin embargo se vuelve más verosímil en el caso de un modelo de series temporales; la razón estriba en que las propias variables exógenas y la variable endógena contienen reflejan en mayor o menor medida cierta persistencia temporal, lo que dificulta que los errores cometidos en un período no conecten en alguna medida con los cometidos en períodos previos.
La existencia de autocorrelación se define, por tanto, como la existencia de correlación entre perturbaciones aletaorias correspondientes a períodos (u observaciones) distintas:
Cov U (^) iUj ij 0 ij
En un plano intuitivo, la autocorrelación conecta con la idea de que los errores contienen cierta persistencia y, por tanto, no se deben a factores puramente aleatorios, desconectados los unos de los otros. Así pues, cuando existe autocorrelación, el error cometido en un momento del tiempo está “influido” por el error de períodos previos.
(^1) El problema de la autocorrelación se denomina también frecuentemente de “correlación serial”. (^2) Salvando el caso de la denominada autocorrelación espacial, es decir, una correlación existente las
perturbaciones de elementos próximos en el espacio, más que en el tiempo.
Cuando existe autocorrelación, y en un plano puramente analítico, la matriz de varianzas- covarianzas de las perturbaciones de un modelo contiene ahora elementos no nulos fuera de la diagonal principal:
Matriz de varianza y covarianzas Homocedástica e Incorrelacionada
n
n n n
Euu Euu Eu
Euu Eu
Eu
E UU^2
2
2
2
2 1 2
2 2 1 2
2 1
Matriz de varianza y covarianzas Heterocedástica pero Incorrelacionada
2
2 2
2 1
2 1 2
2 2 1 2
2 1
i n
n n n n
Euu Euu Eu
Euu Eu
Eu
EUU
Matriz de varianza y covarianzas Heterocedástica y con Autocorrelación
2 1 2
3 1 3 2 3
2
2 2 1 2
1 2 1
2 1
2 1 2
2 2 1 2
2 1
i n
n n n
n
n
n
n n n
CovUU CovUU
CovUU CovUU CovUU
CovUU CovUU
CovUU CovUU
Euu Euu Eu
Euu Eu
Eu
EUU
En términos generales los efectos de la presencia de autocorrelación sobre el MBRL estimado con Mínimos Cuadrados Ordinarios son extremadamente similares a los analizados para la Heterocedasticidad:
3 Recuerde que en su forma matricial esta expresión es
o para un único
2
1
j j
u V (^) j Vx R
Al igual que en el resto de hipótesis, debe decirse que la presencia de autocorrelación es un característica esencialmente natural en todos los modelos de series temporales, los factores que se encuentran en la perturbación aleatoria (los errores) tienen inevitablemente conexiones temporales, es decir, una cierta persistencia y esto sucede, de forma inevitable, porque los fenómenos de causalidad analizados con perspectiva temporal y los acontecimientos imprevisibles que impactan en esas relaciones muestran también cierta persistencia.
Este fenómeno “natural” es tanto más frecuente cuanto mayor es la frecuencia de los datos; en datos de frecuencia baja, la posibilidad de que un acontecimiento que impactó en una perturbación extienda sus efectos a la siguiente es menor.
En todo caso, y más allá de la autocorrelación “natural”, y como siempre repetimos, conviene identificar algunas situaciones específicas, habituales en la econometría empírica, asociadas al riesgo de autocorrelación.
1.- Omisión de variables relevantes en el modelo especificado.
Esta es, sin duda alguna, la principal causa de autocorrelación en un MBRL hasta el punto de que las pruebas de autocorrelación se consideran generalmente pruebas para evaluar si una especificación es completa o no.
Efectivamente, si omitimos una variable relevante, su efecto quedará recogido en la perturbación aleatoria y en la medida en que esa variable omitida muestre una mínima persistencia y/o una evolución sistemática, la perturbación quedará “contagiada” inevitablemente de ella.
En el caso de series temporales, la omisión de variables relevantes implica notables problemas de autocorrelación en tanto que algunas series presentan comportamientos temporales especialmente persistentes (clara tendencia) o sistemáticas (estacionales, o cíclicas por ejemplo) de modo que, en ausencia de variables adecuadas que expliquen esos movimientos sistemáticos, la persistencia o el “artefacto” acentúa la autocorrelación residual.
En el gráfico siguiente, por ejemplo, la variable analizada es claramente estacional; si omitimos las variables que “conectan” con esa estacionalidad, el error contendrá un patrón estacional inevitable:
Ilustración gráfica de un ajuste que ha omitido variables estacionales
0
2000
4000
6000
5000
10000
15000
20000
25000
99 00 01 02 03 04 05
Residual Actual Fitted
2.- Asincronía temporal causa – efecto cuando los datos se miden en forma “discreta”, no continua
En algunos fenómenos temporales, los cambios en las variables exógenas no se transmiten siempre de forma instantánea a la variable endógena, lo cual genera un riesgo de inducir un cierto patrón autocorrelacionado en el error; si el efecto de un cambio en Xt se retrasa total o parcialmente a “t+1”, el efecto sobre Yt estará subestimado (error positivo) en tanto que el efecto en Yt+1 estará sobre estimado (error negativo).
Evitar este tipo de problemas no es fácil en la práctica pero requiere atender cuidadosamente a la selección de la frecuencia de análisis correcta y/o a considerar la posibilidad de incluir retardos / adelantos de exógenas / endógenas en la especificación temporal del modelo, es decir, optar por un modelo dinámico en lugar de estático.^5
Una vez más, la utilización de una forma funcional incorrecta, por ejemplo la utilización de una función lineal en lugar de una logarítmica o potencial, puede provocar que la calidad del ajuste de la regresión (y por tanto los errores) muestre comportamientos sistemáticos en el tiempo, ajustando, por ejemplo, adecuadamente los valores pasados y mal los recientes, induciéndose de esta manera una autocorrelación positiva.
Ilustración gráfica de la relación NO LINEAL entre producción y coste y resultado de un ajuste lineal para datos anuales entre 1975 y 2008
(^5) Un ejemplo de asincronía cásico es el debido a Kaldor, 1934 con relación al modelo la teoría “cobweb”
que explicaba las fluctuaciones “cíclicas” de precios y los movimientos asincrónicos oferta – demanda en aquellos mercados en los que la oferta ha de decidirse antes de conocer los precios reales y, por tanto, ha de basarse en expectativas sobre precios. Cuando estas expectativas son “adaptativas” en lugar de “racionales”, los productores utilizarán los precios en “t” para decidir su oferta en “t+1” generando excesos o contracciones de oferta asincrónicas y cíclicas y cíclicos movimientos de precios.
momento “t” del tiempo, este “shock” queda reducido al período siguiente a un menor tamaño ρut; es decir, el “shock” aletaorio va “diluyéndose” progresivamente con el tiempo.
Este modelo, sugiere que sólo existe correlación parcial entre la perturbación aleatoria de un período (t) y la del período anterior (t-1) conforme a una sencilla forma funcional lineal. En concreto, el valor de la perturbación aleatoria en “t” es una fracción del valor de la perturbación previa “t-1” dado que “ρ” es menor que la unidad.
Cuando el valor del coeficiente “ρ” es positivo, dos perturbaciones consecutivas comparten valores similares y del mismo signo^8 y decimos entonces que existe autocorrelación positiva. Cuando el valor del coeficiente “ρ” es negativo, las perturbaciones mantienen también valores similares pero van alternando sus signos; decimos entonces que existe autocorrelación “negativa”.
La relación entre cada perturbación ut y la previa no es exacta, determinista, sino que viene condicionada por la existencia de una nueva perturbación aleatoria εt de carácter “esférico”:
E (^) t 0 V (^) t ^2 cte. Cov (^) t , t s 0 t,s
Aunque cabría pensar que el proceso real de autocorrelación fuera más complejo, por ejemplo un AR de orden superior AR(p) o un proceso de medias móviles MA(q), lo cierto es que este modelo de autocorrelación simple, captura con facilidad la mayor parte de las situaciones reales de autocorrelación. En primer lugar, la perturbación no puede seguir un proceso regular AR de orden superior, por ejemplo un AR(2), sin mostrar también una correlación parcial con el retardo de orden uno;^9 es decir, el proceso verosímil sería:
ut 1 ut 1 2 ut 2 t
y nunca:
ut 2 ut 2 t
Por otro lado, en caso de existir un patrón de autocorrelación MA (de “medias móviles”), por ejemplo un MA(1) del tipo:
tiempo, sino que inician un proceso de crecimiento progresivo en los sucesivos períodos; una situación, poco verosímil y que generaría demás, desde el punto de vista técnico, importantes problemas que se analizarán en una sección posterior del curso. (^8) Obsérvese que esta propiedad no significa que TODOS los errores tengan siempre el mismo signo. La
relación entre ut y ut-1 es de naturaleza estocástica está influida por la presencia del componente aleatorio εt que puede tomar aleatoriamente valores positivos y negativos. Por otro lado, conviene además recordar que la perturbación aleatoria ut conserva su media nula, de modo que sería imposible que todos sus valores sean de un mismo signo. (^9) Esto se conoce como “ergodicidad”; una propiedad necesaria para garantizar que un proceso
estocástico temporal sea ergódico es que la correlación entre las observaciones tienda a cero al aumentar la separación entre ellas.
debe recordarse que, merced al teorema de Wald, siempre podrá expresarse ese proceso MA(q) como un proceso AR(p).
A.1) Gráfica temporal del error
La presencia de una autocorrelación severa puede observarse gráficamente analizando el gráfico secuencial (temporal) de los residuos. En una serie sin autocorrelación, el valor del residuo “hoy” no informa sobre dónde estará el valor del residuo “mañana”. Así, en una serie puramente aleatoria, no autocorrelacionada, los datos cambian frecuentemente de tamaño y signo, de positivos a negativos, de grandes a pequeños y viceversa, cruzando la media nula con asiduidad y sin mostrar ningún patrón reconocible; cuando se produce un error puntual muy elevado, la serie “no tiene memoria” y retorna al valor nulo promedio con facilidad. Sin embargo, en presencia de autocorrelación imprime un comportamiento sistemático en la serie de residuos que normalmente es visible. Los residuos muestran comportamientos predecibles en valor y en signo:
En el caso de la autocorrelación positiva, los residuos consecutivos comparten valores y signos similares, mostrándose amplias zonas de sobrestimación y subestimación lo que genera visibles patrones de “ondas”.
En el caso de autocorrelación negativa, los residuos muestran valores semejantes entre observaciones pero alternando el signo constantemente, generándose de este modo patrones “dentados”.
A.2) Gráfica de dispersión del error con su retardo
Un gráfico aún más ilustrativo es el gráfico de dispersión (Scat) del residuo con sus retardos (generalmente con el primero). Si existe autocorrelación, la nube de puntos que ilustra la conexión entre los residuos en “t” y los resiudos en “t-1” mostrará un aspecto “creciente” o “decreciente” muy ilustrativo de esa relación.
Ejemplo de series residuales con distinto grado de autocorrelación
NO autocorrelación
0,2 0 0,4^ 0,
0,8^1
(^15913172125293337414549535761656973778185899397) - 1,5^ -^1
0
0,
1
1,
Autocorrelación AR(1) POSITIVA muy débil ρ=0.25 Autocorrelación AR(1) NEGATIVA muy débil ρ=0.
0,2^ 0,
0,6^ 0,
1
(^15913172125293337414549535761656973778185899397)
0
0,
1
1,
0,2^ 0,
0,6^ 0,
1,2 1
(^15913172125293337414549535761656973778185899397) - 1,5^ -^1
0
0,
1
1,
Autocorrelación AR(1) POSITIVA débil ρ=0.5 Autocorrelación AR(1) NEGATIVA débil ρ=0.
Por otro lado, la última de las ratios es una aproximación casi exacta a la expresión de la correlación muestral entre et y et-1:
^ ^ ^
t
t t
n
t
t t
n
t
t t t t ee
2
2 1 1 1
2
2
1 1 , (^1)
Considerando que la correlación muestral entre et y et-1 es un buen estimador del coeficiente “ρ” del proceso subyacente AR(1) en las perturbaciones aleatorias^10 tenemos entonces que:
Así pues, ahora resulta más fácil interpretar los valores límites del DW:
En caso de autocorrelación máxima y positiva:
1 DW 2 1 1 DW 0
En caso de autocorrelación máxima y negativa:
1 DW 2 1 ( 1 ) DW 4
En caso de que no exista autocorrelación:
0 DW 2 1 0 DW 2
Para evaluar si el valor del DW de un modelo de regresión refleja autocorrelación positiva, negativa o nula, no bastará con los valores extremos: ¿qué ocurre, por ejemplo, si el DW toma en nuestro modelo el valor 2,3?. Lo ideal sería disponer de la función de densidad de este estadístico para poder contrastar hipótesis sobre su valor; sin embargo, Durbin y Watson comprobaron que, lamentablemente, la distribución de este estadístico no sólo depende de los grados de libertad con los que se calcula (como siempre ocurre con cualquier estadístico e contraste) sino también de los valores de las variables exógenas “x” empleadas en la regresión. Es decir, en algunas regresiones, el valor del estadístico DW tiende a acercarse más a 2 que en otras cuando ρ=0, lo que impide utilizar valores tabulados exactos para contrastar la hipótesis de ausencia de autocorrelación. Pese a todo, existen unas tablas de Durbin Watson que, de forma aproximada, permiten establecer áreas de certeza alrededor de los valores límites examinados previamente.
Para un determinado nivel de significación (o confianza) fijado por el analista, las tablas del DW ofrecerán siempre dos valores, uno inferior “di” y otro superior “ds” que habrán de situarse del siguiente modo alrededor de los valores límite del DW:
(^10) Aunque no se han examinado todavía en el curso las propiedades de un proceso AR(1) para una serie
genérica yt, puede demostrarse que el valor del coeficiente “ρ” de un proceso de este tipo coincide con el coeficiente de correlación simple (y parcial) entre yt y yt-1.
0 2 4
di ds 4-ds 4-di
Estos límites, permiten así identificar, alrededor del 2, la zona consistente con la hipótesis nula de ausencia de autocorrelación H 0 :ρ=0.
0 2 4
di ds 4-ds 4-di
Las zonas de rechazo de la hipótesis nula son las que circundan el valor “0” y el valor “4”, es decir, los valores que claramente indican autocorrelación positiva o negativa :
0 2 4
di ds 4-ds 4-di
Lamentablemente, y por la limitación antes mencionada, existen zonas de “duda” en las que el estadístico DW no permite rechazar o aceptar la hipóteis nula, son las zonas intermedias entre di y ds y entre 4-di y 4-ds.
0 2 4
di ds 4-ds 4-di
Por un criterio de “prudencia valorativa”, si el valor del DW “cae” en zona de duda, conviene quizá concluir que existe autocorrelación y tratar de profundizar más en su naturaleza y corregirla, antes que arriesgar un diagnóstico en sentido contrario.
B.2) Contraste “t” en el modelo AR(1) residual
Un test alternativo a la prueba DW consiste en estimar el modelo simple AR(1) utilizando los residuos “e” de nuestra regresión:
et e (^) t 1 t
El modelo puede estimarse con o sin término independiente y en todo caso, la hipótesis nula de No Autocorrelación se asociaría con un valor estimado ρ=0, algo que podemos verificar con el contraste de significación estadística habitual “t”.
El valor estimado de “ρ” es sólo un estimador consistente del verdadero valor de “ρ” por lo que, para muestras grandes, podemos utilizar el resultado del test “t” como un buen indicador de la presencia de autocorrelación en la perturbación.
B.3) Contraste “t” en presencia de regresores estocásticos y prueba de Breusch - Godfrey
El test DW expuesto previamente no sólo presenta la importante limitación de presentar zonas de incertidumbres sino que, además, exige el cumplimiento de algunas hipótesis adicionales. Entre ellas, la más relevante es la exigencia de exógenas deterministas en la regresión. En este
Una vez más, como en los anteriores temas, debe decirse que la verdadera corrección de la autocorrelación pasa necesariamente por la solución de su causa. En este sentido, debe recordarse que, en muchas ocasiones^12 , la autocorrelación es síntoma de una especificación inadecuada insuficiente y, por tanto, la corrección de la autocorrelación implicaría necesariamente un replanteamiento de la misma.
No obstante, y desde un punto de vista estrictamente técnico, pueden proponerse diversas técnicas adaptativas ante la incómoda presencia de autocorrelación.
1.- Utilización de MCG factibles en presencia de autocorrelación AR(1)
Una alternativa teórica a la presencia de autocorrelación es la utilización de MCG. Sin embargo, como es sabido, la utilización de MCG exige disponer de información precisa sobre el modelo de autocorrelación existente y los parámetros que lo regulan. Desde un punto de vista práctico, la utilización de MCG no es posible de modo que debemos conformarnos con una versión “factible” de esos MCG que denominaremos, como ya ocurriera en el caso de la heterocedasticidad MCGF.
La idea consiste, de hecho, en seguir utilizando el estimador MCO realizando previamente la adecuada transformación en los datos originales para que, el nuevo modelo transformado, sea un modelo libre de autocorrelación.
La transformación propuesta en este caso consiste en utilizar las “semidiferencias” de los datos originales a partir del valor del coeficiente “ρ” de autocorrelación:
1
1
Esta transformación se explica con facilidad si partimos del modelo original en el que presuntamente existe autocorrelación AR(1). Por simplicidad, imaginemos que ese modelo es:
con:
ut u (^) t 1 t
Entonces, se sigue que:
yt 1 2 x 2 t ut yt 1 2 x 2 t ut 1 t yt 1 2 x 2 t yt 1 1 2 x 2 t 1 t
de modo que:
yt y (^) t 1 1 1 2 x 2 t x 2 t 1 t yt *^ 1 1 2 x 2 * t t
(^12) Algunos autores distinguen esta situación de aquella en la que la autocorrelación no viene provocada por
una deficiente especificación. Gujarati, por ejemplo, define esta situación como Autocorrelación Pura.
donde recordemos, habíamos definido la nueva perturbación εt como una perturbación aleatoria esférica y, por tanto, sin autocorrelación.
Utilizar los datos en semi – diferencias, permite por tanto obtener estimaciones de los parámetros y sus desviaciones aparentemente libres de autocorrelación. Para el término constante. Debe observarse que no se obtendrá el verdadero valor de β 1. Para evitar este problema, o bien utilizamos como término constante la expresión (1-ρ) o bien realizmaos la regresión con término constante:
yt xt t
1 2 2
y después obtenemos β 1 como:
(^)
1 1
Para la utilización de MCGF en la práctica conviene llamar la atención sobre algunas cuestiones importantes:
1.- Evidentemente, realizar la estimación MCGF exige disponer del valor de “ρ”, o dicho con más propiedad, de una estimación de este valor. Esta estimación puede obtenerse de varias formas, todas ellas equivalentes o casi – equivalentes. Podemos, por ejemplo, utilizar el valor del DW y su relación con “ρ”
Alternativamente, podemos realizar la estimación AR(1) residual y obtener “ρ” por MCO:
Utilizar una estimación de “ρ” parece sencillo pero, sin embargo, entraña importantes repercusiones. Efectivamente, la utilización de los datos transformados como propone MCGF resuelve, teóricamente, los problemas de la autocorrelación pero debe señalarse que eso solo ocurre si disponemos del verdadero valor de “ρ”. Si, como sucede en la práctica, usamos una estimación de “ρ”, el estimador MCGF presenta un comportamiento desconocido en muestras pequeñas. Es cierto que, en general, el esimador MCGF gana en eficiencia y suele ser consistente, pero no es insesgado y los contrastes “t” y “F” no se ajustan en realidad verdaderas distribuciones “t” y “F” aún cuando la perturbación aleatoria siga una normal.
2.- Normalmente, el cálculo y la utilización de estos estimadores de “ρ” suele realizarse de forma iterativa, y no en un único paso. Así, comenzaremos por calcular un valor estimado de “ρ” a partir del modelo original y procederemos a realizar una primera corrección del modelo. Una vez corregido, recalcularemos de nuevo el valor de “ρ” con el nuevo conjunto de residuos y realizaremos una segunda corrección sobre el modelo previamente corregido. El proceso iterativo termina cuando entre dos estimaciones sucesivas de “ρ” no exista una diferencia significativa como para seguir con correcciones adicionales^13. Este método iterativo es conocido habitualmente como Cochrane – Orcutt.
(^13) Un valor de cambio en “ρ” inferior a 0,05 es suficientemente pequeño para ser considerado
irrelevante Normalmente, esto sucede en dos o, a lo sumo, tres iteraciones.