Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Apunts Econometria II, Apuntes de Econometría

Asignatura: Econometria II, Profesor: Josep Raymond, Carrera: Economia, Universidad: UAB

Tipo: Apuntes

2012/2013

Subido el 07/12/2013

adri15-3
adri15-3 🇪🇸

4.1

(85)

9 documentos

1 / 287

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Análisis de datos: un enfoque econométrico
Maria Victoria Esteban González
Marta Regúlez Castillo
04-10
ISBN: 978-84-693-8458-9
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Vista previa parcial del texto

¡Descarga Apunts Econometria II y más Apuntes en PDF de Econometría solo en Docsity!

Análisis de datos: un enfoque econométrico

Maria Victoria Esteban González

Marta Regúlez Castillo

ISBN: 978-84-693-8458-

An´alisis de datos: un enfoque econom´etrico

Autores: M. Victoria Esteban Gonzalez Marta Reg´ulez Castillo

Departamento de Econom´ıa Aplicada III. Econometr´ıa y Estad´ıstica Facultad de Ciencias Econ´omicas y Empresariales Universidad del Pa´ıs Vasco/Euskal Herriko Unibertsitatea

Presentaci´on

El objetivo de este documento es presentar un conjunto de t´ecnicas econom´etricas avanzadas para la estimaci´on de modelos lineales en situaciones donde las hip´otesis estad´ısticas de comportamiento habituales no se cumplen. Estas notas se estructuran en cinco temas m´as un tema introductorio y de contextualizaci´on del curso y un tema final con orientaciones dirigidas al desarrollo por parte de los alumnos de un proyecto final donde se muestre la evoluci´on de un caso pr´actico de inter´es. A trav´es de los temas se van relajando las hip´otesis b´asicas sobre la perturbaci´on aleatoria y sobre la matriz de regresores. El tema introductorio revisa los conceptos de Teor´ıa Asint´otica que los alumnos ya han visto en las asignaturas de Estad´ıstica. Muestra los diferentes conceptos de convergencia y el Teorema de Mann y Wald adiestrando al alumno en su utilidad para derivar las propiedades en muestras grandes y distribuci´on asint´otica de los diferentes estimadores que ver´an en el curso.

El tema uno introduce el concepto de perturbaciones esf´ericas y muestra las consecuencias en las propiedades del estimador M´ınimo Cuadr´atico Ordinario de que las perturbaciones no cumplan las hip´otesis b´asicas. Asimismo deriva el estimador M´ınimo Cuadr´atico Generalizado. Los temas dos y tres analizan los problemas de heterocedasticidad y autocorrelaci´on, respectivamente. Muestran como detectar perturbaciones no esf´ericas y como contrastar la existencia de heterocedasticidad y/o autocorrelaci´on. Aplican el estimador M´ınimo Cuadr´atico Generalizado en el caso de que sea necesario y ense˜nan c´omo estimar cuando la matriz de varianzas y covarianzas de la perturbaci´on es desconocida utilizando el estimador de M´ınimos Cuadrados Generalizados Factibles.

En el tema cuatro se relaja la hip´otesis b´asica sobre la matriz de regresores. Se aborda el escenario en que la matriz de datos es estoc´astica analizando los diferentes estadios de relaci´on entre los regresores estoc´asticos y la perturbaci´on aleatoria. Se deriva el estimador de Variables Instrumentales y se muestra la utilidad del contraste de Hausman. En el quinto tema se intenta relacionar todos los temas anteriores para lo cual se abordan modelos con din´amica en la parte sistem´atica y/o din´amica en la perturbaci´on.

En cada tema se muestran ejemplos que ilustran los diferentes escenarios de trabajo as´ı como se recomienda la realizaci´on de ejercicios. Se incluye tambi´en preguntas evaluativas de los contenidos desarrollados. Al t´ermino de cada tema se muestra la bibliograf´ıa correspondiente. Al final del documento aparece la bibliograf´ıa completa.

v

SARRIKO-ON 04/10 An´alisis de datos

El Espacio Europeo de Educaci´on Superior. Los cr´editos ECTS y los

distintos tipos de docencia

El dise˜no de este curso y la organizaci´on de sus contenidos cumple con los criterios de la declaraci´on de Bolonia, que tiene como ejes fundamentales el proceso de ense˜nanza-aprendizaje y la adquisici´on no s´olo de conocimientos, sino tambi´en, y fundamentalmente, de destrezas. Esta adaptaci´on al Espacio Europeo de Educaci´on Superior (EEES) ha permitido basar la metodolog´ıa docente del curso en clases magistrales (CM), las clases pr´acticas de aula (PA), las clases pr´acticas del Centro de C´alculo (PO), los seminarios (S) y los talleres (TA). Cada una de estas clases conlleva una hora de trabajo presencial. Con respecto a las horas no presenciales por cada clase recibida, es decir de tiempo de trabajo no presencial del alumno, las equivalencias son las siguientes: cada clase magistral implica una hora de trabajo no presencial del alumno, mientras que cada clase pr´actica de aula, pr´actica de laboratorio inform´atico, de taller o de seminario implica dos horas de trabajo no presencial del alumno. Este curso conlleva 50 horas de trabajo presencial y 70 horas de trabajo no presencial. Tiene asignados 5 cr´editos ECTS. En este curso cada tipo de docencia tiene las siguientes caracter´ısticas:

  • Clases Magistrales: se utilizan para transmitir conocimientos te´oricos a grupos numerosos de alumnos. En estas clases el protagonista es el profesor y en ellas se exponen los contenidos te´oricos junto a ilustraciones pr´acticas en pizarra o utilizando el ordenador.
  • Pr´acticas de Aula: en estas clases se aborda el componente pr´actico de la asignatura. Son clases participativas en las que esperamos que el alumno acuda con los ejercicios realizados en tiempo no presencial. Con antelaci´on se proporciona al alumno los enunciados de los ejercicios o casos a resolver y en la clase pr´actica se solucionan las dudas o escollos encontrados por los alumnos a la hora de resolver el ejercicio. El n´umero de alumnos en estas pr´acticas de aula es la mitad que en las clases magistrales. Por ello, es f´acil hacer que el alumno participe resolviendo parte del ejercicio en la misma clase consultando dudas directamente al profesor.
  • Pr´acticas de Ordenador: son sesiones docentes en las que, en un aula inform´atica, un grupo de alumnos, bajo la direcci´on de un profesor, realiza una actividad pr´actica programada que requiere el uso del ordenador. Dependiendo de la disponibilidad de ordenadores y de la natu- raleza de las pr´acticas el grupo se encontrar´a subdividido. El software inform´atico constituye en este tipo de pr´actica la herramienta de trabajo fundamental. Las pr´acticas de ordenador permiten al alumno un afianzamiento de los contenidos te´oricos del curso de Econometr´ıa como la puesta en pr´actica de casos reales con la utilizaci´on del software gretl^1. gretl es software libre especialmente dirigido hacia la pr´actica de la econometr´ıa y la estad´ısti- ca, muy f´acil de utilizar. Ha sido elaborado por Allin Cottrell (Universidad Wake Forest) y existen versiones en ingl´es, castellano y euskera, adem´as de en otros idiomas. Junto con el programa se pueden cargar los datos utilizados como ejemplos de aplicaciones econom´etricas en los siguientes libros de texto Davidson y Mackinnon (2004), Greene (2008), Gujarati (1997), Ramanathan (2002), Stock y Watson (2003), Verbeek (2004), Wooldridge (2003). Al instalar (^1) Acr´onimo de Gnu Regression, Econometric and Time Series (Biblioteca Gnu de Regresi´on Econometr´ıa y Series Temporales)

vi

SARRIKO-ON 04/10 An´alisis de datos

Las competencias espec´ıficas de la asignatura y la evaluaci´on

“Lo que escucho olvido, lo que veo recuerdo, lo que hago entiendo” (Proverbio Chino)

Toda la organizaci´on de la metodolog´ıa docente junto con el dise˜no de los contenidos de los temas del curso van dirigidos a que los alumnos alcancen las siguientes competencias espec´ıficas de la asignatura:

  1. Comprender la importancia de los supuestos empleados en la especificaci´on de un modelo econom´etrico b´asico para poder proponer y emplear supuestos m´as realistas.
  2. Diferenciar distintos m´etodos de estimaci´on y evaluar su uso de acuerdo a las caracter´ısticas de las variables econ´omicas de inter´es para obtener resultados fiables.
  3. Utilizar diversas fuentes estad´ısticas y adquirir destreza en el uso de un software econom´etrico para analizar relaciones entre variables econ´omicas.
  4. Elaborar en grupos de trabajo y exponer en p´ublico, un proyecto emp´ırico donde se valore adecuadamente los resultados obtenidos del an´alisis de un modelo econom´etrico.

El sistema actual de docencia dentro del EEES tiene como ejes fundamentales el proceso de en- se˜nanza-aprendizaje y la adquisici´on no s´olo de conocimientos, sino tambi´en, y fundamentalmente, de destrezas implica directamente la valoraci´on del trabajo diario del alumno y su evoluci´on en la adquisici´on de las competencias. La utilizaci´on de la evaluaci´on continua en la evaluaci´on de los alumnos implica la realizaci´on en clase, en general con componente de sorpresa, es decir sin previo aviso, de test r´apidos o de preguntas cortas en relaci´on a todo lo visto en las clases, conceptos te´ori- cos y ejercicios pr´acticos tanto de pr´actica de aula como de pr´actica de ordenador que permitan evaluar individualmente al alumno y saber si han aprendido los procedimientos adecuados y ver si han alcanzado as´ı las competencias espec´ıficas, en nuestro caso las competencias (1), (2) y (3). La evaluaci´on del proyecto permitir´a juzgar la competencia (4). Por ello en estas notas se incluye al final de cada tema ejemplos de preguntas cortas evaluativas de los contenidos de las CM, PA y PO a modo de ejemplo de lo que el alumno podr´ıa encontrarse en su propia evaluaci´on.

Como se indicaba anteriormente estas notas sirven de apoyo al estudio. Analizan los problemas en profundidad y permiten al alumno profundizar en los temas que conforman el contenido del curso. As´ı mismo tienen una fuerte vertiente pr´actica que permitir´a al alumno no solo saber sino tambi´en saber hacer. En ning´un caso deben utilizarse como sustituto de los libros incluidos en la bibliograf´ıa. De igual manera se recomienda la realizaci´on de ejercicios tanto los recomendados en clase como los que aparecen en la bibliograf´ıa. La uni´on del estudio de los conceptos y la utilizaci´on de los mismos en los ejercicios permite adquirir la agilidad necesaria para el dominio de la asignatura y alcanzar las competencias espec´ıficas de la misma.

Las notas tienen como objetivo servir de apoyo al proceso de aprendizaje de los estudiantes de la asignatura Econometr´ıa de los Grados en Econom´ıa, Administraci´on y Direcci´on de Empresas, Marketing, Fiscalidad y Administraci´on P´ublica, y Finanzas y Seguros as´ı como de las Licenciaturas en Econom´ıa y Administraci´on y Direcci´on de Empresas, ambas en extinci´on. As´ı mismo sirven de apoyo a estudiantes de master por ejemplo el Master Universitario en Econom´ıa: Instrumentos del An´alisis econ´omico o el M´aster Universitario en Banca y Finanzas Cuantitativas.

viii

Contenido

    1. Introducci´on y Contextualizaci´on
    • 0.1. Introducci´on
    • 0.2. Propiedades de un estimador. Muestras finitas versus muestras grandes
      • (MCO) 0.3. El Modelo de Regresi´on Lineal General. Estimador M´ınimo Cuadr´atico Ordinario
    • 0.4. Contraste de hip´otesis
    • 0.5. ¿Qu´e vamos a aprender en este curso?
    • 0.6. Ejercicios para practicar
    • 0.7. Anexo: Demostraci´on de la consistencia del estimador MCO
    1. M´ınimos Cuadrados Generalizados
    • 1.1. Modelo de regresi´on con perturbaciones no esf´ericas
    • 1.2. Propiedades del estimador de MCO
      • 1.2.1. Estimador de la matriz de varianzas y covarianzas de βˆM CO
    • 1.3. M´etodo de M´ınimos Cuadrados Generalizados (MCG)
      • 1.3.1. Propiedades del estimador de MCG
      • 1.3.2. Estimador de la matriz de varianzas y covarianzas de βˆM CG
    • 1.4. M´etodo de M´ınimos Cuadrados Generalizados Factibles (MCGF)
      • 1.4.1. Propiedades del estimador de MCGF
      • 1.4.2. Estimador de la matriz de varianzas y covarianzas de βˆM CGF
    • 1.5. Contrastes de restricciones lineales
    • 1.6. Ejemplo: Sistemas de Ecuaciones
      • 1.6.1. Ecuaciones no relacionadas con varianza com´un
      • 1.6.2. Ecuaciones no relacionadas con varianzas distintas
      • 1.6.3. Ecuaciones aparentemente no relacionadas
    • 1.7. Ejercicios a resolver SARRIKO-ON 04/10 An´alisis de datos
    • 1.8. Bibliograf´ıa del tema
    1. Heterocedasticidad
    • 2.1. Concepto de heterocedasticidad. Naturaleza y consecuencias. Ejemplos
    • 2.2. Contrastes de heterocedasticidad
      • 2.2.1. Detecci´on gr´afica.
      • 2.2.2. Test de contraste para heterocedasticidad
    • 2.3. El estimador MCG bajo heterocedasticidad. M´ınimos Cuadrados Ponderados
      • delo para la heterocedasticidad 2.4. Estimador de M´ınimos Cuadrados Generalizados Factibles. Especificaci´on de un mo-
    • 2.5. MCO: Estimador de V ( βˆM CO) robusto a heterocedasticidad
    • 2.6. Contraste de restricciones lineales
    • 2.7. Resumen de los resultados obtenidos en el ejercicio magistral
    • 2.8. Ejercicios a resolver
    • 2.9. Pr´acticas de Aula
    • 2.10. Pr´acticas de Ordenador
    • 2.11. Taller sobre todo lo trabajado en el tema
    • 2.12. Evaluativas - Preguntas Cortas
    • 2.13. Bibliograf´ıa del tema
    • 2.14. Anexo 1.1: Resultados de gretl utilizados en las clases magistrales
    • 2.15. Anexo 1.2: Instrucciones b´asicas de gretl para heterocedasticidad
    1. Autocorrelaci´on
    • 3.1. El concepto de autocorrelaci´on y su modelizaci´on
      • 3.1.1. Introducci´on
      • 3.1.2. Procesos Autorregresivos y de Medias M´oviles
    • 3.2. Contrastes de autocorrelaci´on y an´alisis de residuos
      • 3.2.1. Contraste de Durbin y Watson
      • 3.2.2. Contraste de Breusch y Godfrey
      • 3.2.3. An´alisis de los residuos y contrastes: ejemplos
    • 3.3. Consecuencias de la detecci´on de autocorrelaci´on
    • 3.4. Estimaci´on por MCGF bajo un AR(1)
  • An´alisis de datos SARRIKO-ON 04/ - 3.4.1. M´etodo de Hildreth y Lu: Red de b´usqueda - 3.4.2. M´etodo de Cochrane-Orcutt
    • 3.5. Inferencia utilizando el estimador MCO con autocorrelaci´on
    • 3.6. Inferencia con MCGF
    • 3.7. Ejercicios a resolver
    • 3.8. Pr´acticas de Aula
    • 3.9. Pr´acticas de Ordenador
    • 3.10. Taller sobre todo lo trabajado en el tema
    • 3.11. Evaluativas - Preguntas cortas
    • 3.12. Bibliograf´ıa del tema
    • 3.13. Anexo: Instrucciones b´asicas de gretl para autocorrelaci´on
    1. Regresores Estoc´asticos
    • 4.1. Introducci´on
    • 4.2. Propiedades del estimador MCO
      • 4.2.1. Independencia entre regresor y error
      • 4.2.2. Incorrelaci´on contempor´anea entre regresores y error
      • 4.2.3. Correlaci´on entre regresores y error
    • 4.3. Estimador de Variables Instrumentales
      • 4.3.1. Propiedades del estimador de Variables Instrumentales
      • 4.3.2. C´omo buscar los instrumentos
      • 4.3.3. Contraste de hip´otesis con el estimador de VI
    • 4.4. Contraste de Hausman
    • 4.5. Ejercicios a resolver
    • 4.6. Pr´acticas de Aula
    • 4.7. Pr´acticas de Ordenador
    • 4.8. Evaluativas - Preguntas cortas
    • 4.9. Bibliograf´ıa del tema
    • 4.10. Anexo 4.1: Instrucciones b´asicas de gretl para regresores estoc´asticos
    • 4.11. Anexo 4.2. Errores de medida en las variables
      • 4.11.1. Variable end´ogena medida con error
      • 4.11.2. Variable ex´ogena y variable end´ogena medidas con error
    • 4.12. Anexo 4.3. Estimador de Variables Instrumentales SARRIKO-ON 04/10 An´alisis de datos
    • 4.13. Anexo 4.4. Estimador de M´ınimos Cuadrados en dos etapas
    1. Modelos Din´amicos
    • 5.1. Introducci´on
    • 5.2. Especificaci´on y estimaci´on de modelos din´amicos
      • 5.2.1. Din´amica solamente en la parte sistem´atica
      • 5.2.2. Din´amica en la parte sistem´atica y en la perturbaci´on
    • 5.3. Ejemplo magistral: hacia una modelizaci´on din´amica
    • 5.4. Ejercicios a resolver
    • 5.5. Pr´acticas de Aula
    • 5.6. Pr´acticas de Ordenador
    • 5.7. Taller sobre todo lo trabajado en el tema
    • 5.8. Evaluativas - Preguntas cortas
    • 5.9. Bibliograf´ıa del tema
    • 5.10. Anexo: Instrucciones b´asicas de gretl para modelos din´amicos
    1. Gu´ıa para el desarrollo de un proyecto emp´ırico
    • 6.1. Caracter´ısticas b´asicas del proyecto
  • Bibliograf´ıa
  • Ap´endice
  • 2.1. Perturbaciones homoced´asticas versus heteroced´asticas Figuras
  • 2.2. Residuos MCO versus P OP
  • 2.3. Residuos MCO versus P OP
  • 2.4. Residuos MCO y sus cuadrados versus SEN
  • 2.5. Perturbaciones homoced´asticas
  • 2.6. Residuos MCO frente a una variable ficticia
  • 2.7. Consumo versus Renta
  • 2.8. Residuos MCO versus Renta
  • 2.9. CSSi versus residuos MCO
  • 2.10. Variables y Residuos MCO del modelo
  • 2.11. Variables y residuos MCO del modelo transformado
  • 2.12. Residuos MCO frente a Renta Agregada
  • 2.13. Gr´afico de residuos MCO sobre las observaciones i = 1, , 224 y sobre la variable sqft
  • 2.14. Gr´afico de residuos MCO sobre la variable Income y sobre la variable age
  • 2.15. Residuos MCO versus variables independientes
  • 3.1. Ruido blanco ρ =
  • 3.2. Proceso AR(1) con ρ = 0,
  • 3.3. Proceso AR(1) con ρ = − 0 ,
  • 3.4. Proceso MA(1) con θ = 0,
  • 3.5. Proceso MA(1) con θ = − 0 ,
  • 3.6. Gr´afico de la serie de Inversi´on observada y estimada
  • 3.7. Gr´afico de la serie temporal de los residuos MCO
  • 3.8. Gr´afico de la serie de Inversi´on observada y estimada
  • 3.9. Gr´afico de la serie temporal de los residuos MCO
  • 3.10. Gr´afico de la serie observada y ajustada con especificaci´on lineal SARRIKO-ON 04/10 An´alisis de datos
  • 3.11. Gr´afico de residuos MCO de la especificaci´on lineal
  • 3.12. Gr´afico de la serie observada y ajustada con especificaci´on cuadr´atica
  • 3.13. Gr´afico de residuos MCO de la especificaci´on cuadr´atica
  • 3.14. Gr´afico de la serie observada y ajustada con el Modelo (3.7)
  • 3.15. Gr´afico de residuos MCO del Modelo (3.7)
  • 3.16. Gr´afico de la serie observada y ajustada con el Modelo (3.8)
  • 3.17. Gr´afico de residuos MCO del Modelo (3.8)
  • 3.18. Evoluci´on temporal de las variables INVERR y TIREAL
  • 3.19. Serie INVERR observada y ajustada: Modelo sin PNBR
  • 3.20. Serie de residuos MCO: Modelo sin PNBR
  • 3.21. Serie INVERR observada y ajustada: Modelo con PNBR
  • 3.22. Serie de residuos MCO: Modelo con PNBR
  • 3.23. Funci´on de Suma de Cuadrados Residual del modelo transformado
  • 4.1. Serie sin tendencia versus serie con tendencia
  • 5.1. Gr´aficos de las series de fertilidad y de las exenciones fiscales
  • 5.2. Gr´afico de residuos MCO
  • 5.3. Gr´afico de la serie gfr observada y ajustada
  • 5.4. Gr´afico de residuos MCO y de la serie gfr observada y ajustada
  • 5.5. Gr´aficos de residuos y de la serie gfr observada y ajustada
  • 5.6. Gr´afico de residuos MCO y de la serie gfr observada y ajustada
  • 5.7. Gr´afico de residuos y de la serie gfr observada y ajustada
  • 5.8. Gr´afico de residuos y de la serie INVENTARIOS observada y ajustada

Tablas

6.1. Modelos estimados para el precio de la vivienda P RICE............... 268 6.2. Funci´on de Salarios..................................... 268

A.3. Observaciones de Consumo y Renta........................... 271 A.4. Datos de la empresa Lydia Pinkham (1907-1960).................... 272

xv

Tema 0

Introducci´on y Contextualizaci´on

0.1. Introducci´on

La asignatura de Econometr´ıa avanza en el estudio de la materia profundizando en t´opicos como: la relajaci´on de las hip´otesis b´asicas sobre la perturbaci´on, los regresores estoc´asticos y los modelos din´amicos. Todos ellos conceptos con dificultad relativa. Es por ello, que merece la pena dedicar un tiempo a contextualizar los conceptos que van a estudiarse en esta asignatura recordando algunos vistos en clases de estad´ıstica o en econometr´ıa no tan avanzada en relaci´on a la estimaci´on e inferencia del modelo de regresi´on lineal. Este tema introductorio pretende situarnos en los nuevos marcos a trabajar en el resto del curso. Le dedicaremos tres clases magistrales en las que recordamos los conceptos te´oricos y los ilustraremos con ejemplos para su mejor comprensi´on. Al final del tema se proponen algunos ejercicios que ser´ıa interesante resolver para fijar los conceptos.

La inferencia estad´ıstica es el ´area que trata sobre los procedimientos que permiten utilizar la in- formaci´on contenida en los datos muestrales de forma eficaz, para obtener informaci´on sobre la poblaci´on de la que provienen o sobre el proceso que los ha generado. Supongamos que existe un proceso desconocido que ha generado los datos muestrales descrito mediante una funci´on de distri- buci´on que se caracteriza por un conjunto de par´ametros. Sea una muestra de T variables aleatorias Z = (Z 1 , Z 2 ,... , ZT ), cuya funci´on de densidad conjunta f (Z; θ) depende de un vector de par´ame- tros θ = (θ 1 , θ 2 ,... , θk) ∈ Θ. Es habitual suponer que tanto la forma matem´atica de la funci´on de densidad f como el espacio de par´ametros Θ son conocidos, por lo que queda perfectamente determinado el modelo estad´ıstico generador de las variables aleatorias Z. La inferencia estad´ıstica consiste en usar los datos muestrales de Z para inferir el valor del vector de par´ametros θ. Para ello utilizaremos un estimador o regla.

Un estimador por punto es un estad´ıstico calculado a partir de la muestra que nos proporciona un ´unico valor para cada par´ametro desconocido del vector de par´ametros. Un estimador por intervalo proporciona un rango de valores que contiene el verdadero par´ametro con una proba- bilidad determinada. Un estimador es una variable aleatoria ya que es una funci´on de variables aleatorias. Sustituidos los valores muestrales en el estad´ıstico obtenemos una estimaci´on, o valor en la muestra del estimador. Es importante distinguir entre estimador, una funci´on luego variable aleatoria y estimaci´on, un n´umero o realizaci´on en la muestra del estimador.

1

SARRIKO-ON 04/10 An´alisis de datos

0.2. Propiedades de un estimador. Muestras finitas versus muestras

grandes

Estimadores de los par´ametros desconocidos contenidos en θ podemos encontrar muchos, pero solo algunos ser´an estimadores adecuados por lo que necesitaremos criterios de comparaci´on entre ellos. En general compararemos estimadores a partir de una variedad de atributos. Las propiedades en muestras finitas de los estimadores son aquellos atributos que pueden ser comparados inde- pendientemente del tama˜no de muestra y por tanto se cumplen independientemente de ´este. En ocasiones algunas caracter´ısticas de los estimadores no ser´an conocidas para muestras de tama˜no finito, en esta situaci´on compararemos los estimadores mediante sus propiedades asint´oticas, es decir cuando el tama˜no de muestra crece y tiende a infinito.

¿Qu´e estimadores nos interesan? En principio querremos estimadores que con alta probabilidad proporcionen estimaciones que est´en cerca del verdadero valor del par´ametro. Las propiedades en muestras finitas que en general se desean en un estimador son: que sea insesgado, es decir que en media coincida con el verdadero valor del par´ametro y que tenga varianza m´ınima.

  • Insesgadez: Se dice que un estimador θˆ es insesgado si E(θˆ) = θ.
  • Eficiencia: Un estimador θˆ es eficiente dentro de la clase de estimadores insesgados si su varianza es la menor entre todas las varianzas de los estimadores insesgados.

Al reconocer la eficiencia como una propiedad deseable en un estimador estamos dejando excluidos a estimadores sesgados incluso cuando su varianza sea muy peque˜na y en ocasiones podr´ıamos tolerar un cierto sesgo a cambio de una varianza reducida. Un criterio que nos permite tener en cuenta estas situaciones de un sesgo tolerable unido a varianza peque˜na es el criterio del Error Cuadr´atico Medio (ECM).

  • El ECM de un estimador se define:

ECM (θˆ) = E(ˆθ − θ)^2 = V (θˆ) + [Sesgo(θˆ)]^2

y elegimos el estimador que lo minimice. Utilizando el ECM vemos que entre dos estimadores insesgados preferimos aquel con menor varianza. Sin embargo, no es cierto que entre un estimador insesgado y otro sesgado tenga que ser mejor el insesgado. El sesgado puede tener menor ECM y ser el preferido si el criterio elegido es el de minimizar el ECM. El ECM permite comparar entre s´ı estimadores insesgados, sesgados o sesgados con insesgados.

La distribuci´on de un estimador puede cambiar con el tama˜no muestral. En ocasiones no es posible obtener cuantitativamente el valor medio de un estimador para saber si es insesgado o no. Lo mismo puede ocurrir con su varianza para un tama˜no de muestra dado. En estas situaciones determinar las propiedades anal´ıticas del estimador en muestras finitas es muy complicado y se pasa a estudiar las propiedades asint´oticas. El conocimiento del comportamiento en el l´ımite de la distribuci´on de un estimador, puede utilizarse para inferir una distribuci´on aproximada para el estimador obtenido en una muestra finita. Para ello necesitaremos conceptos de teor´ıa asint´otica.

2

SARRIKO-ON 04/10 An´alisis de datos

Es importante notar que consistencia no implica insesgadez asint´otica ni viceversa, un estimador consistente no tiene porqu´e ser insesgado asint´oticamente. De igual forma un estimador insesgado asint´oticamente no tiene porque ser consistente. Sin embargo, si un estimador es insesgado asint´oti- camente y adem´as su varianza en el l´ımite es cero el estimador es consistente. La uni´on de estas dos condiciones, insesgadez asint´otica y varianza asint´otica que tienda a cero cuando el tama˜no de muestra tiende a infinito conforman las condiciones suficientes, aunque no necesarias, de consisten- cia:

  • Condiciones suficientes de consistencia: Sea {E(ˆθT )} una sucesi´on del momento de pri- mer orden de θˆT cuando el tama˜no muestral T aumenta hasta infinito. Sea {V ar(θˆT )} una sucesi´on del momento centrado de orden dos de ˆθT cuando el tama˜no muestral T aumenta hasta infinito. Entonces si: (1) (^) lim T → ∞

E(θˆT ) = θ (2) (^) lim T → ∞

V ar(θˆT ) = 0

θˆT −→p θ =⇒ plimθˆT = θ

Estas condiciones se corresponden con la Proposici´on 2.9 Novales pp.38.

En ocasiones demostrar la consistencia de un estimador mediante la definici´on formal es complicado y resulta m´as sencillo utilizar las condiciones suficientes de consistencia. Es importante notar que para que un estimador sea consistente no necesitamos conocer los momentos de θˆT , es decir E(θˆT ) ´o E(θˆ^2 T ), ´o E[θˆ^2 T − E(θˆT )] etc... ni necesitamos que existan para cada tama˜no muestral. Sin embargo, si decidimos probar la consistencia de un estimador mediante las condiciones suficientes de consistencia si necesitamos conocer E(θˆT ) y V ar(θˆT ).

  • Eficiencia Asint´otica dentro de una clase: Si nos limitamos a la clase de estimadores consistentes y asint´oticamente normales, diremos que un estimador de esa clase es eficiente asint´oticamente, si y s´olo si su varianza asint´otica es la menor de todas las varianzas asint´oticas de los estimadores de esa clase.

Distribuci´on Asint´otica: La distribuci´on asint´otica es una distribuci´on que se utiliza para apro- ximar la verdadera distribuci´on muestral de una variable aleatoria, que puede ser perfectamente un estimador. Cuando es dif´ıcil o imposible derivar la distribuci´on muestral de un estimador o estad´ısti- co estudiaremos su distribuci´on de probabilidad cuando la muestra tiende a infinito. Si a medida que el tama˜no de muestra aumenta la distribuci´on del estimador se aproxima a una distribuci´on espec´ıfica conocida, para tama˜nos de muestra grandes podemos usar esta distribuci´on como una aproximaci´on a la verdadera distribuci´on del estimador. Esta es la idea que transmite la siguiente definici´on de convergencia:

  • Convergencia en Distribuci´on: Sea Z 1 , Z 2 , Z 3... , ZT una sucesi´on de variables aleatorias definidas conjuntamente con sus respectivas funciones de distribuci´on F 1 (Z 1 ), F 2 (Z 2 ), F 3 (Z 3 ) ... , FT (ZT ). Supongamos FT (z) → F (z) en todos los puntos de continuidad de la funci´on F (z) y que en ellos, F (z) es una funci´on de distribuci´on. Entonces se dice que la sucesi´on de variables

4

An´alisis de datos SARRIKO-ON 04/

aleatorias ZT converge en distribuci´on a Z, donde Z es una variable aleatoria con funci´on de distribuci´on F , y se representa por ZT −→d Z (o tambi´en como ZT ∼a F (z)). La distribuci´on F (z) se conoce como Distribuci´on Asint´otica o Distribuci´on L´ımite. Estas condiciones se corresponden con la Definici´on 2.3 Novales pp.40.

A continuaci´on se van a enunciar dos teoremas de gran utilidad para demostrar las propiedades asint´oticas de un estimador: El Teorema de Mann y el teorema de Cramer. Ambos teoremas ser´an de utilidada en el marco del MRLG para derivar propiedades asint´oticas de ciertos estimadores, en particular consistencia y distribuci´on asint´otica.

  • Teorema de Mann y Wald: Sean X una matriz de orden T × K y u un vector de dimensi´on T × 1 tales que:

i) E(u) = 0, E(uu′) = σ^2 uIT ii) E(X i′u) = 0 i = 1, 2 ,... , K, donde Xi es la columna i-´esima de la matriz X. (⇒ E(X′u) = 0) iii) plim X ′X T =^ Q^ matriz finita, sim´etrica y definida positiva. Si i), ii) y iii) se verifican, entonces tenemos dos resultados:

a) plim X

′u T = 0 b) X

′u √ T

−→^ d N ( 0 , σ^2 uQ

Este teorema aparece en Novales pp. 43.

  • Teorema de Cramer: Sea YT una matriz aleatoria de dimensi´on fija p × q y sea XT un vector aleatorio de dimensi´on q × 1. Entonces, si:

(1) YT p −→ A (matriz de constantes) (2) XT −→d X

se tiene que YT XT −→d AX

Este teorema se corresponde con la Proposici´on 2.16 Novales pp. 41.

0.3. El Modelo de Regresi´on Lineal General. Estimador M´ınimo Cua-

dr´atico Ordinario (MCO)

Escribimos el Modelo de Regresi´on Lineal General:

Yt = β 1 X 1 t + β 2 X 2 t +... + βK XKt + ut t = 1, 2 ,... , T ⇐⇒ Yt = X t′β + ut (1)

donde explicamos el comportamiento de la variable end´ogena Y con un conjunto de K variables ex´ogenas o independientes, X 1 t, X 2 t, X 3 t,... , XKT donde X 1 t = 1 ∀t, con lo que el modelo tiene

5