Prepara tus exámenes
Consigue puntos
Orientación Universidad
Vende en Docsity
Docsity AI

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Orientación Universidad

Vende en Docsity

Docsity AI

Inicia sesión Regístrate

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Busca documentos

Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity

Busca tu universidad

Encuentra los documentos específicos para los exámenes de tu universidad

Video Cursos

Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades

Quiz

Responde a preguntas de exámenes reales y pon a prueba tu preparación

Docsity AINEW

Resume tus documentos, hazles preguntas, conviértelos en quiz y mapas conceptuales

Ver preguntas

Despeja tus dudas leyendo las respuestas a las preguntas que realizaron otros estudiantes como tú

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Compartir documentos

20 Puntos

Por cada documento subido

Responde a las preguntas

5 Puntos

por cada respuesta dada (máx. 1 al día)

Todos los modos para conseguir puntos gratis

Consigue puntos de inmediato

Elige un plan Premium con todos los puntos que necesitas.

Oportunidades de estudio

Elige tu próximo programa de estudio

Ponte en contacto inmediatamente con las mejores universidades del mundo. Busca entre miles de universidades en todo el mundo. Busca entre miles de universidades partner oficiales

Comunidad

Pregúntale a la comunidad

Pide ayuda a la comunidad y resuelve tus dudas de estudio

Ebooks gratuitos

¡Nuestros e-books salva-estudiantes!

Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity

Propiedades del Estimador de Mínimos Cuadrados Ordinarios, Traducciones de Matemáticas

Universidad Peruana de Ciencias Aplicadas (UPC)Matemáticas

Las propiedades del estimador de mínimos cuadrados ordinarios (MCO) en un modelo lineal de regresión. Se discuten las igualdades análogas, la obtención de los residuos y su relación con el modelo original, las propiedades del estimador MCO y su relación con el término de perturbación del modelo. Se incluyen ejemplos de modelos con variables en desviaciones respecto a la media y se contrasta la cointegración entre dos variables I(1).

Tipo: Traducciones

2019/2020

Subido el 17/11/2022

lu-ci-4 🇵🇪

1 documento

1 / 88

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

Manual de Econometría

Alfonso Novales

April 29, 2003

C ont ent s

1 Introducción................................. 5

2 Algunosconceptosestadísticosbásicos .................. 5

2.1 Medidasdeposiciónymedidasdedispersión............ 5

2.1.1 Lamediamuestralcomopredictor.............. 5

2.1.2 La desviación típica como indicador de volatilidad ..... 7

2.2 Medidasdeasociación ........................ 9

3 Contrastacióndehipótesisestadísticas .................. 9

3.1 ContrastesdeNormalidad ...................... 14

3.2 Contratesdeasociación........................ 14

4 Tratamientodedatos............................ 15

4.1 Ajusteestacional ........................... 15

4.2 Tasasdevariación........................... 15

4.3 Estimacióndecomponentes ..................... 15

5 Elmodelolinealsimplederegresión.................... 15

5.1 Descripcióndelmodelo........................ 15

5.1.1 Nubedepuntos........................ 15

5.2 Estimaciónpormínimoscuadrados(ordinarios) .......... 15

5.2.1 Represent ación gráfica de la recta de regresión estimada . 15

5.3 Propiedades del estimador de mínimos cuadrados ordinarios . . . 15

5.4 Residuos del modelo. Gráficosderesiduos ............. 16

5.4.1 Estimación de la varianza del término de pert urbación . . 17

5.5 Cuando los coeficientes del modelo de regresión cambian a lo largo

delamuestra ............................. 17

5.5.1 Cambio estructural en los coeficientes del modelo de regresión 18

Descubre Traducciones de Matemáticas Universidad Peruana de Ciencias Aplicadas (UPC)

Documentos relacionados

Propiedades del estimador MCO

Tema 3 propiedades del estimador mco

Estimación Estimadores: Concepto de Estimador Máxim-Versemblant

Estimación de la desviación estándar poblacional: estimador 'cuasidesviación estándar'

Distinción técnica entre estimador y estimación

Apuntes de Econometría II: Estimador de Aitken y sus propiedades

Estadística: Concepto de Estimador, Estimación, Nivel y Intervalo de Confianza

Solución de Conjunto de Ejercicios 4: Distribución Asintótica del Estimador Ridge

Estimación de Parámetros Estadísticos: Estimador, Estimación y Contrast de Hipótesis - Pro

Análisis de la regresión lineal multiple con colinealidad

(1)

Año Bicentenario del Perú: 200 Años de Independencia - Estimador Suficiente - Prof. Pachec

MODELO DE REGRESION LINEAL CON REGRESION UNICA

Vista previa parcial del texto

¡Descarga Propiedades del Estimador de Mínimos Cuadrados Ordinarios y más Traducciones en PDF de Matemáticas solo en Docsity!

Manual de Econometría

 - April 29, Alfonso Novales

1 Introducción Cont ent s
2 Algunos conceptos estadísticos básicos
- 2.1 Medidas de posición y medidas de dispersión
  - 2.1.1 La media muestral como predictor
  - 2.1.2 La desviación t ípica como indicador de volatilidad
- 2.2 Medidas de asociación
3 Contrastación de hipótesis estadísticas
- 3.1 Contrastes de Normalidad
- 3.2 Contrates de asociación
4 Tratamiento de datos
- 4.1 Ajuste estacional
- 4.2 Tasas de variación
- 4.3 Estimación de componentes
5 El modelo lineal simple de regresión
- 5.1 Descripción del modelo
  - 5.1.1 Nube de puntos
- 5.2 Estimación por mínimos cuadrados (ordinarios)
  - 5.2.1 Representación gráfica de la recta de regresión estimada
- 5.3 Propiedades del estimador de mínimos cuadrados ordinarios
- 5.4 Residuos del modelo. Gráficos de residuos
  - 5.4.1 Estimación de la varianza del término de perturbación
  - de la muestra 5.5 Cuando los coeficientes del modelo de regresión cambian a lo largo
  - 5.5.1 Cambio estructural en los coeficientes del modelo de regresión
  - 5.5.2 Variación gradual en los coeficientes del modelo
- 5.6 Algunos modelos de regresión sencillos
  - 5.6.1 El modelo constante
  - 5.6.2 El modelo con variables en desviaciones respecto a la media
  - 5.6.3 El modelo con t endencia det erminist a lineal y cuadrática
  - 5.6.4 Modelos no lineales en las variables
- 5.7 ¿Cómo especificar un modelo de regresión?
  - 5.7.1 ¿Debe incluirse una constante en el modelo de regresión?
    - las variables? 5.7.2 ¿Debemos estimar en valores originales o en logarit mos de
    - diferencias? 5.7.3 ¿Debe estimarse el modelo con variables en niveles o en
  - 5.7.4 La frecuencia de observación de las variables
6 Contrastes de hipótesis en el modelo de regresión lineal simple
- 6.1 Significación estadística versus precisión
  - 6.1.1 ¿Se hace una variable más o menos significativa?
    - una regresión? 6.1.2 ¿Cómo puede discutirse qué variable es más relevante en
7 Correlación versus causalidad
8 Variables no estacionarias
- 8.1 Características de una variable estacionaria
- 8.2 Tendencias deterministas y tendencias estocásticas
- 8.3 Regresión espúrea
  - 8.3.1 Regresión espúrea bajo tendencias deterministas
  - 8.3.2 Regresión espúrea bajo tendencias estocásticas
- 8.4 Tratamiento de tendencias deterministas
- 8.5 Ejercicios de simulación
- 8.6 Tendencias estocásticas y raíces unitarias
- 8.7 Contrastes de raíz unitaria
- 8.8 Cointegración
  - 8.8.1 Contraste de cointegración
    - timada por mínimos cuadrados 8.8.2 Contraste de hipótesis sobre la relación de cointegración es-
  - 8.8.3 Correlación y cointegración
  - 8.8.4 Variables cointegradas: un ejemplo
  - 8.8.5 El modelo de corrección de error
  - 8.8.6 El contraste de cointegración de Johansen
    - comunes, volat ilidad común. 8.8.7 Aspectos comunes a varias variables temporales: tendencias
    - ticas (raíces unitarias)? 8.8.8 ¿Qué hacer en presencia de variables con tendencias estocás-
9 Matrices de covarianzas no escalares
- 9.1 Detección de la autocorrelación
- 9.2 Tratamiento de la autocorrelación.
- 9.3 El estimador de mínimos cuadrados generalizados
- 9.4 Detección de la heteroscedasticidad
- 9.5 Contraste de igualdad de varianza entre submuestras
- 9.6 Tratamiento de la heteroscedasticidad
10 El modelo de regresión lineal múltiple
- 10.1 Estimación por mínimos cuadrados
11 Propiedades del estimador de mínimos cuadrados.
12 Bondad de ajuste del modelo
13 Contrastes de hipótesis
14 Matrices de covarianzas no escalares - simple 14.1 Comparación de estimadores de la regresión múltiple y la regresión
- 14.2 Regresión particionada
15 Grado de ajuste del modelo de regresión múltiple
- 15.1 Coeficientes de correlación parcial y de determinación parcial
16 Colinealidad entre variables explicat ivas en un modelo de regresión
- 16.1 Efectos de la colinealidad entre variables explicativas
- 16.2 Detección de la colinealidad
- 16.3 Tratamiento de la colinealidad
  - 16.3.1 Regresión ortogonalizada
  - 16.3.2 Otros tratamientos
17 Predicción
18 Modelos univariantes de series temporales
- 18.1 Primeros conceptos
  - 18.1.1 Procesos estocásticos
  - 18.1.2 Funciones de autocorrelación simple y parcial
- 18.2 Procesos autoregresivos, AR(p)
  - 18.2.1 El modelo AR(1)
  - 18.2.2 El modelo AR(2)
- 18.3 Procesos de medias móviles, MA(q)
- 18.4 Procesos mixtos, ARMA(p,q)
- 18.5 Procesos integrados ARIMA(p,d,q)
- 18.6 Predicción con modelos univariantes
  - 18.6.1 Predicción con modelos AR(p)
  - 18.6.2 Predicción con modelos MA(q)
  - 18.6.3 Predicción con modelos ARMA(p,q)
  - 18.6.4 Predicción con modelos ARIMA(p,d,q)
- 18.7 Estimación de modelos univariantes de series temporales
  - 18.7.1 Estimación de modelos autoregresivos
  - 18.7.2 Est imación de modelos de medias móviles
  - 18.7.3 Est imación de modelos ARMA(p,q) y ARIMA(p,d,q)
19 El procedimiento de variables instrumentales
- 19.1 Correlación entre variables explicativas y término de error
- 19.2 Errores de medida
20 Modelos dinámicos
- 20.1 Colinealidad entre variables explicativas
- 20.2 Estimación
  - 20.2.1 Perturbación sin autocorrelación
  - 20.2.2 Perturbación con autocorrelación
21 Simultaneidad
- 21.1 Identificación
- 21.2 Estimación de una ecuación del sistema

1. I nt r oducción

Ha sido tradicional dejar muchas decisiones a los métodos estadísticos. La discusión importante es si el investigador debe plantear su investigación incorporando sus creencias a priori o, por el contrario, la investigación ha de ser aséptica en ese sentido, no debiendo estar condicionada en ningún aspecto por las creencias iniciales del investigador.

2. A lgunos concept os est adíst icos básicos

2.1. M edidas de posición y m edidas de disper sión

Media, media ponderada, mediana, moda, varianza, desviación típica. Medidas alternativas de volatilidad. La media, muestral o poblacional, es la constante con respecto a la cual el error cuadrát ico medio de la variable aleat oria es menor. Conveniencia de su utilización.

2.1.1. L a media muest r al como pr edict or

La esperanza matemática de una variable tiene una propiedad de gran impor- tancia: es la constante alrededor de la cual la variable aleatoria experimenta fluctuaciones de menor tamaño. Análogamente, dada una determinada muestra, la media muestral es la constante con respecto a la cual la variable experimenta unas menores desviaciones. Es decir, si nos plantemos resolver el probelma,

M in a F (a) ≡M in a

E

(X − a)^2

donde la incógnita es la constante a, la solución es a = μ. El valor mínimo de la función objetivo es: F (μ) = V ar(X). Dada una determinada muestra de tamaño n, la solución al problema,

M in a F (a) ≡

X^ n

(Xi − a)^2

viene dada por a = Øx. El valor mínimo de la función objetivo es: F (Øx) = V ar(X), varianza muestral de X. Quizá sorprendentement e, est a propiedad t iene implicaciones en relación con la predicción: un ejercicio de predicción consiste en anticipar un valor de una

M in x ˆt 0

E | xt 0 − àxt 0 | (2.2)

entonces la predicción debe ser la Mediana poblacional, o la mediana muestral, si se dispone de dicha información, àxt 0 = M ediana(x). Hay que resalt ar, sin embargo, que, con más información que simplemente la media muestral, el investigador puede aspirar a obtener una predicción mejor que la proprcionada por la media muest ral; para ello, deberá sust it uir el promedio muestral por la esperanza condicional ET xt 0. Si por ejemplo, el investigador cree que la variable que pretende predecir obedece una estructura AR(1), entonces la predicción que minimiza el Error Cuadrático Condicional Medio vendrá dada por ET xt 0 = ρ(t^0 −T^ )^ xT , como vimos al examinar este tipo de procesos. La varianza condicional no es nunca superior a la varianza incondicional y es, en la mayoría de los casos, muy inferior. La media muestral minimiza la varianza incondicional, mientras que ET xt 0 minimiza la varianza condicional, alcanzando un resultado menor de este criterio y, por tanto, preferible. El modo en que puede utilizarse la información muest ral detallada disponible para obtener el valor numérico dela varianza condicional ET xt 0 es el objeto de XXX.

2.1.2. L a desviación t ípica como indicador de volat ilidad

Ha sido t radicional en el análisis de dat os económicos ut ilizar la desviación t ípica como medida de volat ilidad de una variable. Esto es especialment e ciert o en el analisis de datos financieros, donde, aunque recientemente se han introducido ot ras medidas de volat ilidad, el uso de la desviación t ípica es t odavía habitual. Est a práct ica se deriva de la int erpret ación directa de la desviación típica,como la desviación promedio entre los valores que toma una determinada variable aleato- ria, y su valor medio. Sin embargo, existen múltiples situaciones en las que tal caracterización de la volatilidad puede proporcionar una imagen engañosa de lo que el investigader pretende medir. Tomamos como punto de partida la idea de que, al medir volatilidad, el inves- tigador pretende cuantificar el tamaño medio de las fluctuaciones que experimenta una determinada variable aleatoria. La simple lectura de esta afirmación debería sugerir al lector que, como posible definición de volat ilidad, result a fundamen- t alment e incomplet a. Las fluctucaioens que experimenta una variable aleatoria no pueden estudiarse si no se define previamente el valor que sirve de referencia respecto al cual medir dichas fluctuaciones.

En una primera lectura, podría pensarse que es evidente que la pretensión es la de cuantificar las fluctuaciones que experimenta una variable aleatoria respecto a su nivel medio. Esta es la idea que subyace al uso de la desviación típica como medida de volatilidad; sin embargo, es fácil ver que existen situaciones en que dicha ut ilización no está tot almente just ificada:

ï Cambio estructural en media: supongamos una variable X que es constante a lo largo de cada una de las dos submuestras enque podemos dividir el período muestral. Es decir, X= μ 1 en la primera part e de la muest ra, y X= μ 2 en la segunda parte de la muestra. En muchos sentidos, podríamos decir que est a variable es const ante, y ha experimenat do una volat ilidad nula a lo largo del intervalo muestral, si bien es verdad que en el instante t 0 se produjo un cambio estructural, de carácter permanente, en el nivel medio de la variable. Si no se tiene en cuenta dicho cambio en la media, la varianza de X resulta ser no nula, mientras que si tenemos en cuenta el cambio en media, la varianza que calculemos será cero.

ï Presencia de una tendencia determinista: supongamos una variable X que crece a una tasa media de γ, a la vez que experimenta fluct uaciones alrede- dor de dicha tasa media de crecimiento. En este caso, la varianza muestral de la variables, así como su desviación típica, serán import antes, y t anto más elevadas cuanto mayor sea la tendencia o tasa de crecimiento γ. Esta situación es muy frecuente en Economía en general y en Finanzas en par- t icular, y se ut iliza la desviación t ípica como indicador de volat ilidad. Hay dos dificultades que suelen ignorarse: una, que, en presencia de endencia, carecemos de valor central de referencia. En presencia de una tendencia o crecimiento constant e γ, el valor medio t enderá a ser el valor que tomó la variable hacia el período central de la muestra, pero no es representativo de los valores muestrales de la variable: la primera parte de la muestra tenderá a estar por debajo de la media, estando la segunda parte de la muestra por encima de la media muest ral; en t al sit uación la media muest ral no es un valor representativo de la variable y, en consecuencia, no tiene mucho sentido calcular el tamaño de las fluctuaciones alrededor de dicha media. En este contexto, el tamaño medio de las fluctuaciones alrededor de la media será, en realidad, un indicativo de la magnitud de γ, la tasa media de crecimiento o tendencia determinista.

Este es un caso donde debemos distinguir entre corto y largo plazo: a largo plazo, el uso de la desviación típica podría estar justificado, si entendemos que la

probabilidad poblacional es conocido, por ejemplo, Normal. Est e t ipo de con- trastes son contrastes paramétricos, puesto que se basan en la estimación de al- gunos parámetros de la distribución de probabilidad poblacional. El investigador no debe olvidar nunca que las propiedades de est os cont rast es dependen de que sea correcta la hipót esis que se haya establecido acerca del tipo de dist ribución poblacional de la que se extrajo la muestra disponible, así como del carácter de dicha muestra (muestra aleatoria simple). Un contraste que tiene muy buenas propiedades XXXX Existen contrastes no paramétricos, queno precisan dela estimación deparámet- ros poblaiconales, ni descansan en ningún supuesto acerca de la distribución de probabilidad poblacional, que son de un enorme int erés en el análisis de datos económicos, a pesar de ser poco habituales. Son contrastes cuyas propiedades son muy robustas (es decir, continúan siendo válidas total o aproximadamente) con in- dependencia del tipo de distribución poblacional. Una segunda razón que confiere enorme interés a los contrates no paramétricos es que nos permiten discernir el grado en que son válidas hipótesis que no pueden representarse en térmios de val- ores numéricos para los parámet ros de la distribución de probabilidad poblaiconal. Así, en el primero de los ejemplos mantes mencionados, queremos contrastar la hipótesis de que la población de la que se extrajo la muestra sigue una distribu- ción Normal. Por supuesto, que también podría contrastarse la hipótesis nula de que obedecve una distribución t de Student, o chi-cuadrao, o cualquier otra. Asimismo, podemos contrastar la hipótesis de que dos muestra proceden de igual dist ribución de probabilidad, sin necesidad de especficar de qué tipo es ninguna de ellas. Un t ipo de contraste de gran interés para las cuest iones examinadas en el trabajo específico econométrico estriba en el grado de asociacin entre variables. Precisamente la Econometría consiste en el cnojunto de métodos estadísticos que permiten asignar valores numéricos a los coeficientes de un modelo que trata de representar la relación existente entre un conjunto de variables económicas. Es, por tanto, un análisis de tipo paramétrico; una vez asigndaos valores numéricos a los parámetros del modelo, generalmente se llevarán a cabo contrastes paramét ri- cos de hipót esis, ut ilizando los valores numéricos est imados. Exist en, asimismo, contrates no paramétricos que, sin necesidad de pasar por una fase de estimación, permiten discutir si la evidencia muestral es consistente con la hipótesis de que dos variables determinadas están relacionadas entre sí. Es tan fácil llevar a cabo este tipo de contrastes que deberían formar parte, como paso previo a la estimación de todo modelo econmétrico. No sería razonable que las conclusiones de tales

contrastes dictaminen la relación de variables que deben incluirse en un modelo econométrico, pero es sumament e iliust rat ivo compement ar la información pro- porcionada por ambos tipos de contrastes. En definitivia, como proponíamos en la Int roducción a este texto, precisamente por su naturaleza probabilíst ica, los métodos estadísticos no deben utilizarse de manera dogmática. En definitiva, se trata de examinar la cuestión que está siendo objeto de análisis en un determinado estudio, a la luz de la información muestral disponible, desde diversas ópticas, con el objeto de proporcionar distintos tipos de evidencia. Por supuesto que en la gen- eralidad de los casos, esas dist intas perspectivas no serán todas consistentes ent re sí. Debe esperarse del investigador que proporcione toda la informcaion gener- ada en relación con la cuestión que definía la investigación, para que cada lector pueda extraer sus propias conclusiones. En un cont ext o probabilíst ico no exist en las verdades absolutas, y un detemrinado análisis puede conducir a conclusiones diferentes. En un contraste paramétrico se establece, como confrontación a la hipótesis nula, una hipótesis alternativa. La forma que adopte dicha hipótesis no es ir- relevante en cuanto a la resolución del contraste de hipótesis. Como ejemplo, t omando como un hecho ciert o que la distribución de probabilidad poblacional es Normal, y qeu la varianza de dicha dist ribución es conocida, un investigador puede desear contrastar la hipótesis nula H 0 : μ = 10, frente a la hipótesis al- ternativa H 1 : μ 6 = 10. En est e caso, la hipótesis nula es simple, por cuanto que incluye un único valor posible para la esperanza mat emát ica poblaiconal, mientras que la hipótesis alt ernativa es compuesta, por cuanto que incluye todo un rango de valores, todos los distintos del incluido en la hipótesis nula. Este contraste tiene, por tanto, otra característica, y es que el conjunto de valores incluidos en ambas hipótesis cubre todo el espacio paramét rico. Un contrast e diferent e, con la misma hipótesis nula, sería aquél que considerase como hipót esis alternat iva, H 10 : μ < 10. Esta es la hipótesis que debería especificar un investigador que sabe que, dada la naturaleza del problema con el que trata, existen razones teóricas para creer que el valor numérico de μ no puede exceder de 10. Cuando se dispone de dicha información, el último contraste descrito, que restringe el rango de valores numéricos en la hipótesis alt ernativa fijando 10 como cot a superior, tiene mejores propiedades que el primero de los contrastes, que no establecía tal relación. En la mayoría de las aplicaciones económicas, se dispone de información de este tipo, por lo que el investigador debe especificar cuidadosamente no sólo la hipótesis nual que contrasta, sino también la hipótesis que considera como alternativa, de modo que su contraste de hipótesis tenga las mejores propiedades posibles.

que la dist ribución de probabilidad del estadíst ico àθ (x 1 , x 2 , ..., xn) dependa del parámet ro o parámet ros incluidos en la hipót esis nula. Por ejemplo,.... A su vez, el contraste de hipótesis tendrá buenas propiedades si: i) ambas hipótesis están correctamente establecidas, ii) los supuestos sobre los que se condi- ciona el contraste, que pueden referirse al tipo de distribución poblacional, así como al valor numérico de alunos parámetros que no aparecen explícitamente en el contrast e, sean correct os, iii) el est adíst ico ut ilizado en la resolución del contraste tenga buenas propiedades estadísticas. Cuando la hipótesis nula es simple, es decir, incluye un único valor numérico, y la hipótesis alternativa es del tipo H 10 , la resolución del contraste se lleva a cabo mediante la construcción de un intervalo de confianza alrededor del valor numérico del estimador, ut ilizando la dist ribución de probabilidad del mismo. Así, llegamos a una afirmación del tipo,

α = P

h a ≤ g

àθ (X) , θ

≤ b

i (3.1)

donde α, un número positivo próximo a 1, es el nivel de confianza del contraste. El contraste se resuelve despejando el valor teórico del parámetro desconocido θ dentro de la expresión anterior, para obtener una igualdad del tipo,

α = P

h h 1 (àθ (X)) ≤ f (θ) ≤ h 2 (àθ (X))

i (3.2)

donde h 1 (àθ (X)), h 2 (àθ (X)) son números reales que dependen de: i) el valor numérico del estimador àθ (x 1 , x 2 , ..., xn) en la muestra disponible, ii) el supuesto acerca de la distribución poblacional, iii) el nivel de confianza (o el nivel de sig- nifcación) escogidos para el contraste. En esta expresión, dada una determinada muestra, el valor numérico del esti- mador àθ (X) es conocido, por lo que puede comprobarse si se satisfacen o no las desigualdades,

h 1 (àθ (X)) ≤ f

θ^0

≤ h 2 (àθ (X)) (3.3)

donde hemos sustituido el valor desconocido de θ por el valor numérico incluido en la hipótesis nula, θ^0. S Bajo el supuest o que se ha hecho acerca de la dist ribución de probabilidad poblacional, y de los valores numéricos de los parámetros que se han supuesto conocidos (si haya alguno), la probabilidad de que el valor numérico de la función f (θ) caiga fuera del intervalo (3.3) es de 1-α y, por tanto, pequeña. Es decir,

éste sería un suceso poco probable; si para θ = θ 0 , la función f (θ) incumple las cotas definidas en (3.3) diremos que dicho valor del parámetro θ es poco verosímil, rechazando, en consecuencia, la hipótesis nula. A modo de ejemplo, recordemos cómo se lleva a cabo un contraste de hipótresis acerca del valor numérico de la esperanza matemática de una población Normal cuya varianza se supone conocida. El punto de partida es la propiedad de la media muestral de tal población, que sigue una distribución asimismo Normal, con la misma esperanza matemática que la población, y con una varianza igual a la varianza poblacional dividida por el tamaño muestral. Así, si la población es X ∼ N (μ, 25), la media muestral es una variable aleatoria con distribución x Ø ∼ N (μ, (^25) n ). Por tanto, si se trabaja a un nivel del confianza del 95%, por ejemplo, tendremos,

0 , 95 = P

xØ − μ 5 /

donde hemos utilizado el hecho de que xØ − μ ∼ N (0, (^25) n ) y √x¯− 25 μ/n ∼ N(0, 1).

Est a igualdad es la correspondiente a (3.1) , donde el parámetro poblacional sobre el que se establece el contraste es la esperanza matemática, θ = μ; el estimador àθ (x 1 , x 2 , ..., xn) = Øx = 1 n

P (^) n i= 1 xi^ es la media muestral,^ α^ = 0,^95 ,^ y^ a^ =^ −^1 ,^ 96;^ b^ = 1 , 96. De est a igualdad, obtenemos,

0 , 95 = P

− xØ ≤ −μ ≤ 1 , 96

− Øx

= P

x Ø − 1 , 96

≤ μ ≤ xØ + 1, 96

que es una igualdad análoga a (3.2) , con h 1 (Øx) = Øx − 1 , 96 √^5 n , h 2 (Øx) = Øx +

1 , 96 √^5 n , f (μ) = μ. En definitiva, nos queda comprobar si cuando se introduce en esta última igualdad el valor de μ que define la hipótesis nula, la cadena de desigualdades se satisface o no. Supongamos que en la muestra disponible, de tamaño 400, se ha calculado para la variable X una media muestral xØ = 7, 5;en consecuencia, el int ervalo anterior es: 0 , 95 = P [7, 0 ≤ μ ≤ 8 , 0].

3.1. Cont r ast es de N or m alidad

3.2. Cont r at es de asociación

Antes de proceder a la estimación de un modelo específico que establezca una relación paramétrica entre dos variables, conviene explorar la posible existencia

utilizar, son aleat orias, pues son función de la muest ra que ut ilicemos, que es aleatoria. Si el modelo que estamos estimando es correcto, como hemos de suponer, la perturbación aleatoria del mismo, ut, otorga naturaleza asimismo aleatoria a la variable dependiente, yt. Esto significa que si cambiamos por ejem- plo el período muest ral que ut ilizamos en la est imación, la realización de dicha perturbación, es decir, sus valores numéricos, serán diferentes, con lo que las ob- servaciones de yt t ambién los erán, y la est imación de los parámetros diferirá de la obtenida con otro período muestral. Asimismo, si cambiamos la frecuencia de observación de los datos, de diaria a mensual, por ejemplo tomando el último dato de cada mes, la muestra cambia, y con ella, las estiamciones de los coeficientes de las variables explicativas en el modelo. Siendo variables aleatorias, nos interesa que los estimadores t engan ciert as propiedades deseables, lo cual dependerá del procedimiento de estimación uti- lizado, y de lasc aracteríst icas del modelo que est amos est imando. Las principales propiedades en que podemos estar interesados son: insesgo, eficiencia y consis- tencia. El insesgo consiste en que la esperanza matemática del estimador coincida con el verdadero valor numérico del coeficiente que estamos estimando. Un esti- mador eficient e es un est imador de mínima varianza. El procedimiento de mínimos cuadrados proporciona el est imador lineal de mínima varianza, si bien pueden ex- ist ir ot ros est imadores no lineales de varianza todavía menor. Un est imador es consistente si, al aument ar el tamaño muestral, converge en probabilidad al ver- dadero valor del parámetro desconocido que se está estimando. Se dice entonces que su límit e en probabilidad es dicho parámetro. Bien podría ocurrir que el est i- mador fuese sesgado en muestra pequeñas, pero si es consistente, dicho sesgo irá reduciéndose si ampliamos el tamaño muestral. El estimador de mínimos cuadra- dos no es siempre consist ente. El est imador de máxima verosimilit ud lo es, pero siempre que la hipót esis acerca de la dist ribución de probabilidad en que se basa, sea correcta, sobre lo que no se puede tener seguridad.

5.4. R esiduos del modelo. G r áfi cos de r esiduos

Los residuos del modelo, a veces denominados los errores del modelo de regresión, son aquél component e de la variable dependient e que no está explicado por los valores que t oma la variable independiente o explicat iva. En consecuencia, los residuos uàt se calculan a partir de la expresión,

yt = βà 0 + βà 1 xt + àut

de la que se obt iene,

u àt = yt − βà 0 − àβ 1 xt

en el caso de datos de serie temporal, y

àui = yi − βà 0 − àβ 1 xi

en el caso de datos de sección cruzada. Gráficamente, si volvemos a la nube de puntos que representa la posible relación entre x e y, y dibujamos sobre ella la recta de regresió n, el residuo no es sino la distancia vertical entre la altura (ordenada) de cada punto de la nube, y la altura que le correspondería de acuerdo con la recta de regresión esti- mada. Dicha altura debe tomarse con signo, de modo que el residuo es positivo cuando el punto de la nube está por encima de la recta de regresión estimada, y negativo cuando el punto queda por debajo de la recta de regresión estimada.

5.4.1. Est im ación de la var ianza del t ér m ino de p er t ur bación

5.5. Cuando los coefi cient es del m odelo de r egr esión cambian a lo lar go de la muest r a

Supongamos que se dispne de datos de serie temporal, y que el coficiente que mide la relación entre las variables x e y, es decir, la pendiente del modelo, ha variado a lo largo del t iempo. Es claro que un procedimient o de est imación como mínimos cuadrados nos proporcina un único valor numérico de dicho coeficiente y, por tanto, cobra pleno interés únicamente bajo el supuesto de que dicho valor nmérico ha permanecido constante a lo largo del período muestral. Sin embargo, en la mayoría de las aplicaciones económicas que pueden consid- erarse, tal supuesto parece demasiado restrictivo pues, más bien, el valor numérico de dicha elasticida habrá variado a lo largo de la muestra. ¿Qué proporciona en tal caso el método de mínimos cuadrados? Lo primero que debemos entender es que el investigador no observa en ningún caso si el coeficiente ha variado en el tiempo o no, dado que no observa el valor numérico de dicho coeficiente. Esta es, precisament e, la razón que le mueve a estimar su valor numérico. En muchas situaciones, sin embargo, el investigador puede tener fundadas creencias acerca de que se han producido variaciones en el mismo. Por ejemplo, muchas veces se afirma que la capacidad de la política monetaria para controlar la inflación se ha reducido significativamente recientemente; tal afirmación se debe

Ej er cicios de simulación

ï Ejercicio 1: Simule 300 observaciones de un camino aleatorio N(10,25) como datos muestrales de la variable explicativa x. Ut ilizando un valor numerico de -1,0 para la pendiente, e ignorando el término de preturbación del mod- elo, simule los 100 primeros datos para la variable dependiente y. Luego, utilice un valor igual a 1,0 para la pendient e y genere los dat os ficticios correspondientes a las observaciones 101 a 300 de la variable dependiente. Estime el modelo de regresión simple con dichos datos. Comentario: Al ejecutar el programa XXX, el lector comprobará que la esti- mación de la pendiente del modelo se comporta de acuerdo con lo comentado en la sección previa. Es recomendable ejecutar el programa varias veces, para obtener así un con- junto de estimaciones numéricas de dicho parámetro. En ningún caso se obtendrá estimaciones próximas al verdadero valor de la pendiente, que es de + 1,0 en una parte de la muestra, y de -1,0 en la otra, sino más bien un promedio, ponderado de acuerdo con el número de datos u observaciones en el que la pendiente ha tomado uno u otro valor numérico. El lector puede comprobar que, si aumenta la longitud muestral, las estima- ciones que obtiene al ejecutar repetidas veces el programa, se aproximan aún más al promedio que cabría esperar, dado el porcentaje de datos con pendiente igual a + 1,0 ó -1,0. Los estadísticos resultantes de la estimación presentan toda la apariencia de proceder de un problema estadístico de relación entre dos variables aleatorias. Sin embargo, es muy importante observar que el problema que acabamos de estimar es, en realidad, puramente determinista. No hay en el mismo ningún componente est ocást ico o aleat orio pues, no hemos ut ilizado un lement o de pert urbación. En nuestra simulación, la relación entre las variables x e y es, en todos los perídos exacta, no faltando ninguna otra variable, ni estando sujeta a ningún elemento de error impredecible. Es precisamente el hecho de tratar como constante un coeficiente del mod- elo que no lo es, lo que produce la apariencia de ser un problema de naturaleza estocástica. Considerar tal supuesto (erróneo, aunque no lo sabíamos), es com- parable a introducir una perturbación estocástica en el verdadero modelo, que incorporaría la variación temporal en la pendiente. En dicha estimación, aparentemente estadística, obtenemos un R-cuadrado reducido, junto con una pendiente estimada que resulta estadísticamente signi- ficativa, si juzgamos por su estadístico tipo-t.

Exist e asimismo evidencia de autocorrelación en los residuos, como sugiere el estadístico Durbin-Watson. La presencia de autocorrelación es, en principio, sorprendete, pues hemos generado una variable x con estructura de ruido blanco y, por tant o, sin aut ocorrelación y la variable y presenta una dependencia ex- acta y estrictamente contemporánea con ella. Por tanto, no hay ni estructuras de autocorrelación, ni estructuras dinámicas que pudieran producirla. Los in- dicios de autocorrelación provienen del cambio estructural que se produce en el valor numérico de la pendient e. En el programa se calculan las funciones de aut ocorrelación simple de ambas variables del modelo; mientras que la variable independiente (explicat iva) no present a aut ocorrelación, como corresponde a su est ruct ura de ruido blanco que hemos ut ilizado en su generación, la función de au- tocorrelación de la variable dependiente sugiere indicios claros de autocorrelación. En realidad, esta variable, por construcción, carece de autocorrelación, lo que sugiere una llamada de atención al uso indiscriminado de las funciones de auto- correlación para detectar autocorrelación serial en una variable o en los residuos de una regresión. El gráfico XX que representa las observaciones de la variable dependiente junto con los residuos dela regresión muestra la similitud entre ambas variables, loque es, evidentemente, sinónimo de una relación estimada pobre, a pesar de la signifi- cación estadística de la pendiente del modelo. De hecho, puede observarse que la desviación t ípica de los residuos es similar a la desviación t ípica dela variable dependiente, lo que significa, como ya discutimos en la Sección XX, que el modelo no tiene una capacidad explicativa importante. Nuevamente, es importante apre- ciar que ello ocurre junto con una valor claramente significativo del estadístico F (F = T.R^2 ) de significación conjunta de la regresión estimada. Esta aparien- cia de validez del modelo, de acuerdo con los estadísticos habituales es, en este caso, falsa, lo que constituye una impoirtante llamada de atención sobre el uso indiscutido de cont rast es de hipót esis.. De modo análogo, el gráfico XX, que presenta los valores observados de la variable dependiente, junto con sus valores ajustados, muestra que el ajuste no se adecúa en modo alguno al comportamiento de la variable que pretendíamos explicar con el modelo, y que ha experiemntado un cambio estructural entre la primera y la segunda submuestras. Por el contrario, precisamente porque hemos impuesto una pendiente constante a lo largo de toda la muestra, los valores ajus- t ados, que ut ilizan dicho valor const ante de la pendient e, dibujan un compor- tamiento constante, promedio, durante toda la muestra, que no representa ade- cuadamente ninguna de las dos submuestras.