




























































































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Econometria II, Profesor: Josep Raymond, Carrera: Economia, Universidad: UAB
Tipo: Apuntes
1 / 287
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!





























































































An´alisis de datos: un enfoque econom´etrico
Autores: M. Victoria Esteban Gonzalez Marta Reg´ulez Castillo
Departamento de Econom´ıa Aplicada III. Econometr´ıa y Estad´ıstica Facultad de Ciencias Econ´omicas y Empresariales Universidad del Pa´ıs Vasco/Euskal Herriko Unibertsitatea
Presentaci´on
El objetivo de este documento es presentar un conjunto de t´ecnicas econom´etricas avanzadas para la estimaci´on de modelos lineales en situaciones donde las hip´otesis estad´ısticas de comportamiento habituales no se cumplen. Estas notas se estructuran en cinco temas m´as un tema introductorio y de contextualizaci´on del curso y un tema final con orientaciones dirigidas al desarrollo por parte de los alumnos de un proyecto final donde se muestre la evoluci´on de un caso pr´actico de inter´es. A trav´es de los temas se van relajando las hip´otesis b´asicas sobre la perturbaci´on aleatoria y sobre la matriz de regresores. El tema introductorio revisa los conceptos de Teor´ıa Asint´otica que los alumnos ya han visto en las asignaturas de Estad´ıstica. Muestra los diferentes conceptos de convergencia y el Teorema de Mann y Wald adiestrando al alumno en su utilidad para derivar las propiedades en muestras grandes y distribuci´on asint´otica de los diferentes estimadores que ver´an en el curso.
El tema uno introduce el concepto de perturbaciones esf´ericas y muestra las consecuencias en las propiedades del estimador M´ınimo Cuadr´atico Ordinario de que las perturbaciones no cumplan las hip´otesis b´asicas. Asimismo deriva el estimador M´ınimo Cuadr´atico Generalizado. Los temas dos y tres analizan los problemas de heterocedasticidad y autocorrelaci´on, respectivamente. Muestran como detectar perturbaciones no esf´ericas y como contrastar la existencia de heterocedasticidad y/o autocorrelaci´on. Aplican el estimador M´ınimo Cuadr´atico Generalizado en el caso de que sea necesario y ense˜nan c´omo estimar cuando la matriz de varianzas y covarianzas de la perturbaci´on es desconocida utilizando el estimador de M´ınimos Cuadrados Generalizados Factibles.
En el tema cuatro se relaja la hip´otesis b´asica sobre la matriz de regresores. Se aborda el escenario en que la matriz de datos es estoc´astica analizando los diferentes estadios de relaci´on entre los regresores estoc´asticos y la perturbaci´on aleatoria. Se deriva el estimador de Variables Instrumentales y se muestra la utilidad del contraste de Hausman. En el quinto tema se intenta relacionar todos los temas anteriores para lo cual se abordan modelos con din´amica en la parte sistem´atica y/o din´amica en la perturbaci´on.
En cada tema se muestran ejemplos que ilustran los diferentes escenarios de trabajo as´ı como se recomienda la realizaci´on de ejercicios. Se incluye tambi´en preguntas evaluativas de los contenidos desarrollados. Al t´ermino de cada tema se muestra la bibliograf´ıa correspondiente. Al final del documento aparece la bibliograf´ıa completa.
v
SARRIKO-ON 04/10 An´alisis de datos
El dise˜no de este curso y la organizaci´on de sus contenidos cumple con los criterios de la declaraci´on de Bolonia, que tiene como ejes fundamentales el proceso de ense˜nanza-aprendizaje y la adquisici´on no s´olo de conocimientos, sino tambi´en, y fundamentalmente, de destrezas. Esta adaptaci´on al Espacio Europeo de Educaci´on Superior (EEES) ha permitido basar la metodolog´ıa docente del curso en clases magistrales (CM), las clases pr´acticas de aula (PA), las clases pr´acticas del Centro de C´alculo (PO), los seminarios (S) y los talleres (TA). Cada una de estas clases conlleva una hora de trabajo presencial. Con respecto a las horas no presenciales por cada clase recibida, es decir de tiempo de trabajo no presencial del alumno, las equivalencias son las siguientes: cada clase magistral implica una hora de trabajo no presencial del alumno, mientras que cada clase pr´actica de aula, pr´actica de laboratorio inform´atico, de taller o de seminario implica dos horas de trabajo no presencial del alumno. Este curso conlleva 50 horas de trabajo presencial y 70 horas de trabajo no presencial. Tiene asignados 5 cr´editos ECTS. En este curso cada tipo de docencia tiene las siguientes caracter´ısticas:
vi
SARRIKO-ON 04/10 An´alisis de datos
“Lo que escucho olvido, lo que veo recuerdo, lo que hago entiendo” (Proverbio Chino)
Toda la organizaci´on de la metodolog´ıa docente junto con el dise˜no de los contenidos de los temas del curso van dirigidos a que los alumnos alcancen las siguientes competencias espec´ıficas de la asignatura:
El sistema actual de docencia dentro del EEES tiene como ejes fundamentales el proceso de en- se˜nanza-aprendizaje y la adquisici´on no s´olo de conocimientos, sino tambi´en, y fundamentalmente, de destrezas implica directamente la valoraci´on del trabajo diario del alumno y su evoluci´on en la adquisici´on de las competencias. La utilizaci´on de la evaluaci´on continua en la evaluaci´on de los alumnos implica la realizaci´on en clase, en general con componente de sorpresa, es decir sin previo aviso, de test r´apidos o de preguntas cortas en relaci´on a todo lo visto en las clases, conceptos te´ori- cos y ejercicios pr´acticos tanto de pr´actica de aula como de pr´actica de ordenador que permitan evaluar individualmente al alumno y saber si han aprendido los procedimientos adecuados y ver si han alcanzado as´ı las competencias espec´ıficas, en nuestro caso las competencias (1), (2) y (3). La evaluaci´on del proyecto permitir´a juzgar la competencia (4). Por ello en estas notas se incluye al final de cada tema ejemplos de preguntas cortas evaluativas de los contenidos de las CM, PA y PO a modo de ejemplo de lo que el alumno podr´ıa encontrarse en su propia evaluaci´on.
Como se indicaba anteriormente estas notas sirven de apoyo al estudio. Analizan los problemas en profundidad y permiten al alumno profundizar en los temas que conforman el contenido del curso. As´ı mismo tienen una fuerte vertiente pr´actica que permitir´a al alumno no solo saber sino tambi´en saber hacer. En ning´un caso deben utilizarse como sustituto de los libros incluidos en la bibliograf´ıa. De igual manera se recomienda la realizaci´on de ejercicios tanto los recomendados en clase como los que aparecen en la bibliograf´ıa. La uni´on del estudio de los conceptos y la utilizaci´on de los mismos en los ejercicios permite adquirir la agilidad necesaria para el dominio de la asignatura y alcanzar las competencias espec´ıficas de la misma.
Las notas tienen como objetivo servir de apoyo al proceso de aprendizaje de los estudiantes de la asignatura Econometr´ıa de los Grados en Econom´ıa, Administraci´on y Direcci´on de Empresas, Marketing, Fiscalidad y Administraci´on P´ublica, y Finanzas y Seguros as´ı como de las Licenciaturas en Econom´ıa y Administraci´on y Direcci´on de Empresas, ambas en extinci´on. As´ı mismo sirven de apoyo a estudiantes de master por ejemplo el Master Universitario en Econom´ıa: Instrumentos del An´alisis econ´omico o el M´aster Universitario en Banca y Finanzas Cuantitativas.
viii
Tablas
6.1. Modelos estimados para el precio de la vivienda P RICE............... 268 6.2. Funci´on de Salarios..................................... 268
A.3. Observaciones de Consumo y Renta........................... 271 A.4. Datos de la empresa Lydia Pinkham (1907-1960).................... 272
xv
Tema 0
Introducci´on y Contextualizaci´on
La asignatura de Econometr´ıa avanza en el estudio de la materia profundizando en t´opicos como: la relajaci´on de las hip´otesis b´asicas sobre la perturbaci´on, los regresores estoc´asticos y los modelos din´amicos. Todos ellos conceptos con dificultad relativa. Es por ello, que merece la pena dedicar un tiempo a contextualizar los conceptos que van a estudiarse en esta asignatura recordando algunos vistos en clases de estad´ıstica o en econometr´ıa no tan avanzada en relaci´on a la estimaci´on e inferencia del modelo de regresi´on lineal. Este tema introductorio pretende situarnos en los nuevos marcos a trabajar en el resto del curso. Le dedicaremos tres clases magistrales en las que recordamos los conceptos te´oricos y los ilustraremos con ejemplos para su mejor comprensi´on. Al final del tema se proponen algunos ejercicios que ser´ıa interesante resolver para fijar los conceptos.
La inferencia estad´ıstica es el ´area que trata sobre los procedimientos que permiten utilizar la in- formaci´on contenida en los datos muestrales de forma eficaz, para obtener informaci´on sobre la poblaci´on de la que provienen o sobre el proceso que los ha generado. Supongamos que existe un proceso desconocido que ha generado los datos muestrales descrito mediante una funci´on de distri- buci´on que se caracteriza por un conjunto de par´ametros. Sea una muestra de T variables aleatorias Z = (Z 1 , Z 2 ,... , ZT ), cuya funci´on de densidad conjunta f (Z; θ) depende de un vector de par´ame- tros θ = (θ 1 , θ 2 ,... , θk) ∈ Θ. Es habitual suponer que tanto la forma matem´atica de la funci´on de densidad f como el espacio de par´ametros Θ son conocidos, por lo que queda perfectamente determinado el modelo estad´ıstico generador de las variables aleatorias Z. La inferencia estad´ıstica consiste en usar los datos muestrales de Z para inferir el valor del vector de par´ametros θ. Para ello utilizaremos un estimador o regla.
Un estimador por punto es un estad´ıstico calculado a partir de la muestra que nos proporciona un ´unico valor para cada par´ametro desconocido del vector de par´ametros. Un estimador por intervalo proporciona un rango de valores que contiene el verdadero par´ametro con una proba- bilidad determinada. Un estimador es una variable aleatoria ya que es una funci´on de variables aleatorias. Sustituidos los valores muestrales en el estad´ıstico obtenemos una estimaci´on, o valor en la muestra del estimador. Es importante distinguir entre estimador, una funci´on luego variable aleatoria y estimaci´on, un n´umero o realizaci´on en la muestra del estimador.
1
SARRIKO-ON 04/10 An´alisis de datos
Estimadores de los par´ametros desconocidos contenidos en θ podemos encontrar muchos, pero solo algunos ser´an estimadores adecuados por lo que necesitaremos criterios de comparaci´on entre ellos. En general compararemos estimadores a partir de una variedad de atributos. Las propiedades en muestras finitas de los estimadores son aquellos atributos que pueden ser comparados inde- pendientemente del tama˜no de muestra y por tanto se cumplen independientemente de ´este. En ocasiones algunas caracter´ısticas de los estimadores no ser´an conocidas para muestras de tama˜no finito, en esta situaci´on compararemos los estimadores mediante sus propiedades asint´oticas, es decir cuando el tama˜no de muestra crece y tiende a infinito.
¿Qu´e estimadores nos interesan? En principio querremos estimadores que con alta probabilidad proporcionen estimaciones que est´en cerca del verdadero valor del par´ametro. Las propiedades en muestras finitas que en general se desean en un estimador son: que sea insesgado, es decir que en media coincida con el verdadero valor del par´ametro y que tenga varianza m´ınima.
Al reconocer la eficiencia como una propiedad deseable en un estimador estamos dejando excluidos a estimadores sesgados incluso cuando su varianza sea muy peque˜na y en ocasiones podr´ıamos tolerar un cierto sesgo a cambio de una varianza reducida. Un criterio que nos permite tener en cuenta estas situaciones de un sesgo tolerable unido a varianza peque˜na es el criterio del Error Cuadr´atico Medio (ECM).
ECM (θˆ) = E(ˆθ − θ)^2 = V (θˆ) + [Sesgo(θˆ)]^2
y elegimos el estimador que lo minimice. Utilizando el ECM vemos que entre dos estimadores insesgados preferimos aquel con menor varianza. Sin embargo, no es cierto que entre un estimador insesgado y otro sesgado tenga que ser mejor el insesgado. El sesgado puede tener menor ECM y ser el preferido si el criterio elegido es el de minimizar el ECM. El ECM permite comparar entre s´ı estimadores insesgados, sesgados o sesgados con insesgados.
La distribuci´on de un estimador puede cambiar con el tama˜no muestral. En ocasiones no es posible obtener cuantitativamente el valor medio de un estimador para saber si es insesgado o no. Lo mismo puede ocurrir con su varianza para un tama˜no de muestra dado. En estas situaciones determinar las propiedades anal´ıticas del estimador en muestras finitas es muy complicado y se pasa a estudiar las propiedades asint´oticas. El conocimiento del comportamiento en el l´ımite de la distribuci´on de un estimador, puede utilizarse para inferir una distribuci´on aproximada para el estimador obtenido en una muestra finita. Para ello necesitaremos conceptos de teor´ıa asint´otica.
2
SARRIKO-ON 04/10 An´alisis de datos
Es importante notar que consistencia no implica insesgadez asint´otica ni viceversa, un estimador consistente no tiene porqu´e ser insesgado asint´oticamente. De igual forma un estimador insesgado asint´oticamente no tiene porque ser consistente. Sin embargo, si un estimador es insesgado asint´oti- camente y adem´as su varianza en el l´ımite es cero el estimador es consistente. La uni´on de estas dos condiciones, insesgadez asint´otica y varianza asint´otica que tienda a cero cuando el tama˜no de muestra tiende a infinito conforman las condiciones suficientes, aunque no necesarias, de consisten- cia:
E(θˆT ) = θ (2) (^) lim T → ∞
V ar(θˆT ) = 0
θˆT −→p θ =⇒ plimθˆT = θ
Estas condiciones se corresponden con la Proposici´on 2.9 Novales pp.38.
En ocasiones demostrar la consistencia de un estimador mediante la definici´on formal es complicado y resulta m´as sencillo utilizar las condiciones suficientes de consistencia. Es importante notar que para que un estimador sea consistente no necesitamos conocer los momentos de θˆT , es decir E(θˆT ) ´o E(θˆ^2 T ), ´o E[θˆ^2 T − E(θˆT )] etc... ni necesitamos que existan para cada tama˜no muestral. Sin embargo, si decidimos probar la consistencia de un estimador mediante las condiciones suficientes de consistencia si necesitamos conocer E(θˆT ) y V ar(θˆT ).
Distribuci´on Asint´otica: La distribuci´on asint´otica es una distribuci´on que se utiliza para apro- ximar la verdadera distribuci´on muestral de una variable aleatoria, que puede ser perfectamente un estimador. Cuando es dif´ıcil o imposible derivar la distribuci´on muestral de un estimador o estad´ısti- co estudiaremos su distribuci´on de probabilidad cuando la muestra tiende a infinito. Si a medida que el tama˜no de muestra aumenta la distribuci´on del estimador se aproxima a una distribuci´on espec´ıfica conocida, para tama˜nos de muestra grandes podemos usar esta distribuci´on como una aproximaci´on a la verdadera distribuci´on del estimador. Esta es la idea que transmite la siguiente definici´on de convergencia:
4
An´alisis de datos SARRIKO-ON 04/
aleatorias ZT converge en distribuci´on a Z, donde Z es una variable aleatoria con funci´on de distribuci´on F , y se representa por ZT −→d Z (o tambi´en como ZT ∼a F (z)). La distribuci´on F (z) se conoce como Distribuci´on Asint´otica o Distribuci´on L´ımite. Estas condiciones se corresponden con la Definici´on 2.3 Novales pp.40.
A continuaci´on se van a enunciar dos teoremas de gran utilidad para demostrar las propiedades asint´oticas de un estimador: El Teorema de Mann y el teorema de Cramer. Ambos teoremas ser´an de utilidada en el marco del MRLG para derivar propiedades asint´oticas de ciertos estimadores, en particular consistencia y distribuci´on asint´otica.
i) E(u) = 0, E(uu′) = σ^2 uIT ii) E(X i′u) = 0 i = 1, 2 ,... , K, donde Xi es la columna i-´esima de la matriz X. (⇒ E(X′u) = 0) iii) plim X ′X T =^ Q^ matriz finita, sim´etrica y definida positiva. Si i), ii) y iii) se verifican, entonces tenemos dos resultados:
a) plim X
′u T = 0 b) X
′u √ T
−→^ d N ( 0 , σ^2 uQ
Este teorema aparece en Novales pp. 43.
(1) YT p −→ A (matriz de constantes) (2) XT −→d X
se tiene que YT XT −→d AX
Este teorema se corresponde con la Proposici´on 2.16 Novales pp. 41.
Escribimos el Modelo de Regresi´on Lineal General:
Yt = β 1 X 1 t + β 2 X 2 t +... + βK XKt + ut t = 1, 2 ,... , T ⇐⇒ Yt = X t′β + ut (1)
donde explicamos el comportamiento de la variable end´ogena Y con un conjunto de K variables ex´ogenas o independientes, X 1 t, X 2 t, X 3 t,... , XKT donde X 1 t = 1 ∀t, con lo que el modelo tiene
5