Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


EJERCICIOS ECONOMETRIA, Ejercicios de Econometría

Asignatura: ECONOMETRIA, Profesor: , Carrera: Administración y Dirección de Empresas, Universidad: UNED

Tipo: Ejercicios

2013/2014

Subido el 10/04/2014

kerenvg
kerenvg 🇪🇸

3.5

(64)

10 documentos

1 / 31

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Material de
ECONOMETRIA I
CURSO 2009/2010
PROFESORA: SONIA SOTOCA LÓPEZ
Tfno. 91 394 23 03/ 23 04
Despacho: Pabellón Central (Decanato, Primera Planta, Despacho 3)
Horario de tutorías: Martes y Jueves de 12.30 a 14 horas
Material disponible en: www.ucm.es/info/ecocuan/ectr1
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f

Vista previa parcial del texto

¡Descarga EJERCICIOS ECONOMETRIA y más Ejercicios en PDF de Econometría solo en Docsity!

Material de

ECONOMETRIA I

CURSO 2009/

PROFESORA: SONIA SOTOCA LÓPEZ

e-mail: [email protected] Tfno. 91 394 23 03/ 23 04 Despacho: Pabellón Central (Decanato, Primera Planta, Despacho 3) Horario de tutorías: Martes y Jueves de 12.30 a 14 horas Material disponible en: www.ucm.es/info/ecocuan/ectr

INTRODUCCION

  • Econometría: este vocablo procede del griego y significa “ medida de la economía
  • Esta definición no caracteriza completamente el contenido de la materia, pero pone de manifiesto su carácter necesariamente cuantitativo.
  • (^) A lo largo del tiempo, la Econometría ha ido ampliando su contenido debido fundamentalmente a 4 aspectos: - El desarrollo de la Teoría Económica - Los avances en la Teoría Estadística - El desarrollo de la Informática y la creciente disponibilidad y fácil acceso a grandes bases de datos (tanto a nivel macro como micro).
  • Por tanto, el continuo avance de esta disciplina hace que no haya una definición generalmente aceptada.
  • Intriligator (1978) define Econometría como aquella rama de la Economía que se ocupa de medir desde el punto de vista empírico cualquier relación entre variables económicas.
  • De acuerdo con esta definición, los dos ingredientes básicos de la Econometría son: 1) La Teoría Económica y 2) Los datos.
  • La característica fundamental de esta disciplina es que debe saber conjugar perfectamente ambos ingredientes. En otras palabras, un económetra no puede defender la medición sin teoría, pero tampoco la teoría sin datos.
  • Saber conjugar perfectamente teoría, datos y técnicas estadísticas es lo más difícil, pero también lo más atractivo de la Econometría. Alguien dijo que “la Econometría sería más fácil sin datos”.
  • En definitiva, la Econometría debe complementar a la Teoría Económica, para validar determinadas relaciones que postula usando datos. En este sentido, el económetra no puede prescindir de la Teoría, ni el teórico de lo que “dicen los datos”.

Relaciones entre la Teoría Económica y la Econometría

(1) La Econometría necesita primero de la Teoría Económica para que le proporcione un marco conceptual concreto. Por ejemplo, la teoría de Keynes proporciona un marco en el que se relacionan dos variables económicas: Consumo () y Renta (), en donde, además se postula que el es una función de la : y no a la inversa. En ocasiones, el económetra puede partir no de una teoría, sino del sentido común o de la intuición de que exista una relación entre un conjunto de variables. Por ejemplo, puede preguntarse si un tipo de interés a corto plazo depende de su propia historia pasada o no.

En general, recogerá “todos los fallos del modelo”. Las hipótesis que hagamos sobre estas variables aleatorias son fundamentales para decidir qué técnica econométrica usar.

c) El tamaño. El modelo debe ser pequeño, escueto. Esto quiere decir que tiene que tener pocos parámetros que le caracterizen. Muchas veces, el tamaño está condicionado por la información estadística disponible. En nuestro ejemplo, hay dos parámetros que caracterizan la función de consumo Keynesiana ( y).

(2) Una vez que se ha especificado el modelo econométrico, se trata de buscar los datos apropiados. Es decir, se necesitan datos de cada una de las variables que entran en el modelo. En nuestro ejemplo, podríamos usar distintos tipos de datos.

Datos de series temporales: miden una variable en períodos de tiempo sucesivos. La frecuencia puede ser el año, el mes, el trimestre, la semana, el día e incluso podemos trabajar con datos intrahorarios (Bolsa). Disponer de datos temporales hace que podamos poner un subíndice t (tiempo) a las variables:

Fuentes fundamentales de datos temporales son la Contabilidad Nacional, la EPA (Encuesta de Población Activa), el INE (Instituto Nacional de Estadística), Eurostat, Datos de Bolsa o el Banco de España. Normalmente, son gratuitos.

Datos de sección cruzada: miden una variable en un momento determinado del tiempo para distintas entidades. Estas entidades pueden ser individuos, familias, países, empresas, Comunidades Autónomas, sectores empresariales, etc. Por ejemplo, podemos tener una función de consumo familiar: , donde el subíndice i hace referencia a la familia.

Estos datos fundamentalmente se obtienen a partir de entrevistas o encuestas hechas a las entidades correspondientes. Las dos fuentes más importantes de este tipo de datos son: la EPF (Encuesta de Presupuestos Familiares) y la CB (Central de Balances).

Datos de panel: surgen al cruzar una sección cruzada con una serie temporal. En nuestro ejemplo, tendríamos el dato de consumo de una familia a lo largo de una serie de años. Un panel supone disponer de mucha más información que en una sección cruzada, ya que tenemos distintas observaciones de una misma variable

(consumo) para una misma unidad (familia). Esto es difícil conseguir en una ciencia no experimental como es la Economía.

En un panel se pueden analizar o contrastar hipótesis que no es posible con una sección cruzada. Por ejemplo, contrastar si ha habido diferencias en el comportamiento del consumo de las familias después de un cambio de política económica (impuestos) en un momento determinado del tiempo.

Tanto las secciones cruzadas como los paneles no suele ser información gratuita.

(3) Una vez que se ha especificado el modelo y que se dispone de los datos adecuados de todas las variables, se pasa a la etapa de estimación del mismo. Consiste en medir empíricamente los parámetros que caracterizan el modelo y aquí entra la estadística, sobre todo la inferencia estadística (que usa la información muestral disponible para inferir características de toda una población). (4) Una vez que el modelo ha sido estimado usando las técnicas econométricas adecuadas, llegamos al paso de la verificación o validación del modelo. Se establecen criterios (gráficos y estadísticos) para rechazar o aceptar el modelo. Aquí comienza un proceso iterativo en la modelización, ya que si no aceptamos un modelo, no lo usamos, sino que reformulamos el modelo teórico, o bien, tratamos de una forma más adecuada los datos. A veces, es fácil teorizar sobre relaciones entre variables que están definidas de forma precisa, pero otra cosa es obtener datos seguros de estas variables. Por ejemplo, es difícil siempre obtener datos razonables de los beneficios de una empresa, de un tipo de interés o del stock de capital de una economía. En algunos casos, no existe contrapartida observable para una variable teórica.

Usos de un modelo econométrico estimado: Pueden ser varios:

(1) (^) Análisis estructural. Se usa el modelo estimado para medir la relación entre variables económicas. Algunos ejemplos, son la medición de la propensión marginal a consumir de un país, de la elasticidad demanda-precio de un bien, de la elasticidad de la producción-input de una empresa, de la curva de Phillips (inflación y paro), de la relación entre ventas y publicidad de un producto en una empresa, de la relación entre el rendimiento y riesgo de un activo financiero, de la relación entre el salario y el nivel de educación de un individuo, etc.

TEMA 1. EL MODELO DE REGRESIÓN LINEAL SIMPLE Y

GENERAL

El objetivo es especificar, estimar y contrastar relaciones entre variables económicas usando datos.

Para ello, es necesario hacer una serie de hipótesis simplificatorias

(1) Hipótesis de linealidad en los parámetros. Establece la linealidad en los parámetros en la relación entre la variable endógena y las exógenas. Es decir, en la función de consumo tendremos.

donde y son los parámetros de esta relación. No hay que confundir esta hipótesis de linealidad con la linealidad entre las variables. Por ejemplo, en las relaciones entre y que se dan a continuación, sólo la primera es formalmente lineal. Sin embargo, cumplen la hipótesis de linealidad en los parámetros las tres:

En determinadas relaciones económicas no se cumple la hipótesis de linealidad en los coeficientes. Un ejemplo sencillo es la función de producción de tipo Cobb-Douglas, donde representa el output de la empresa, es trabajo y es el stock de capital:

Los parámetros desconocidos de esta función son (parámetro de eficiencia), (elasticidad del output con respecto al capital) y (elasticidad del output con respecto al trabajo). Una simple transformación logarítmica en los datos, hace que esta relación cumpla la linealidad en los parámetros. Es decir:

Ejemplos de relaciones entre variables económicas no lineales en los parámetros hay muchos, por ejemplo, en una función de Consumo no lineal como:

donde a , b y c son los parámetros que caracterizan esta relación. En este caso, habría que estimar estos tres parámetros dada una muestra de C y Y.

Contrastar una relación lineal entre C y Y , equivale a contrastar si el parámetro c es unitario o no.

(2) Hipótesis de especificación correcta. Esta hipótesis supone que las variables explicativas del modelo son aquellas variables relevantes que explican el comportamiento de la endógena. Y que están todas. No existe ninguna variable que no explique nada de la. Es decir, el modelo está bien planteado o especificado.

Esta hipótesis supone aceptar en la práctica dos cosas no siempre ciertas: (2).()a Aceptar que siempre hay una teoría detrás que me permite saber cúales son las variables relevantes en cada modelo. (2).()b Aceptar que sobre estas variables dispongo siempre de información muestral adecuada.

El incumplimiento de esta hipótesis se da en muchos casos. Ejemplo: Si uno quiere estimar con datos de sección cruzada una función de consumo keynesiana, además de la renta familiar, existen otras muchas variables que explican el comportamiento del consumo de una familia. Por ejemplo, el número de hijos, la edad del cabeza de familia, si la mujer trabaja o no, si se vive en el campo o en la ciudad, etc. Sin embargo, nunca será posible incluir todas y cada una de las variables que determinan el consumo de una familia.

(3) (^) Hipótesis de grados de libertad positivos. Los grados de libertad de un modelo se definen como la diferencia entre el número de datos () y el número de variables explicativas (). Es decir,.

Esta hipótesis supone que, como mínimo, es necesario disponer de tantos datos como parámetros a estimar. No obstante, es preferible siempre disponer de más datos que parámetros a estimar. En el ejemplo de la función de consumo keynesiana hay que estimar dos parámetros ( a y b ). Con un único dato, no sería posible estimar de forma única ambos parámetros. Con dos datos, sería posible obtener una única estimación de a y b, pero para que la estimación sea estable, es mejor tener una nube de datos y pocos parámetros a estimar.

(4) Hipótesis de parámetros constantes. Esta hipótesis supone que los parámetros son constantes en el tiempo.

Si trabajamos con n datos en la función de consumo keynesiana, suponer que la propensión marginal a consumir es constante en el tiempo, implica que se obtiene una estimación que ha de interpretarse

donde el propio modelo indica que el consumo retardado es un regresor estocástico al depender un error aleatorio,. Es decir:

(6.3) Modelos con errores de medida en las variables explicativas. Bajo la hipótesis de renta permanente de Friedman, el consumo sólo depende del componente permanente de la renta ():

donde el componente transitorio () o las desviaciones aleatorias alrededor de la renta media de un agente no es observable. Por tanto, la renta permanente () es un regresor estocástico, ya que.

De hecho, estos 3 incumplimientos dan lugar a 3 temas de econometría.

(7) Hipótesis referentes a las perturbaciones aleatorias del modelo. El término de error satisface las siguientes hipótesis:

(7.1) Esperanza nula en todo instante de tiempo:. Ya que es tratado como la suma de muchos efectos individuales sobre la endógena, donde el signo de cada uno es desconocido, no existe ninguna razón para esperar cualquier valor distinto de cero. Supongamos que , entonces el modelo es el mismo que , donde el nuevo término de error:, es tal que la.

Una situación en la que se incumple esta hipótesis, es cuando a su vez, se incumple otra, como es omitir en el modelo una variable relevante. Si la verdadera función de consumo es

donde es un tipo de interés y se trabaja con un modelo que omite esta variable:

donde es el término de error de esta ecuación y además, se sabe que. Es fácil comprobar que , aunque tenga esperanza nula. Se usan las hipótesis de parámetros constantes y regresores no estocásticos.

(7.2) Varianza constante (Homocedasticidad). Supone que al cumplirse (7.1), la. Si la variabilidad (o dispersión alrededor de la media) de las perturbaciones cambia con el tiempo hablamos de heterocedasticidad.

Es muy frecuente la heterocedasticidad en modelos donde se usan datos de sección cruzada. Si tenemos la función de consumo familiar utilizada hasta ahora, es fácil comprender que aquellas familias con mayor nivel de renta tengan mayor variabilidad en su consumo (además de satisfacer necesidades básicas, pueden consumir otras cosas). Puesto que el error del modelo está relacionado con el consumo, lo que ocurrirá es que a mayor renta, mayor varianza en el consumo y por tanto, mayor varianza en el error.

(7.3) Ausencia de autocorrelación en todo instante de tiempo. Implica que la. Si hay autocorrelación, el error en un momento del tiempo ayudaría a predecir el error en un momento posterior y los errores tendrían inercia. Si no hay autocorrelación, la historia pasada no ayuda a predecir el comportamiento futuro y los errores son completamente aleatorios e imprevisibles.

Es muy frecuente el incumplimiento de esta hipótesis en modelos donde se usan datos de series temporales.

Estas restricciones se imponen para exigir “un buen comportamiento” a las variables , aunque también hay razones técnicas que nos obligan a hacer estas hipótesis. Puesto que tenemos n variables aleatorias , su caracterización exige hablar, al menos, de sus dos primeros momentos (media y varianza):

Media: Sería un vector de n medias,.

E=

Matriz de varianzas y covarianzas: Sería una matriz que recoge las varianzas de cada variable en la diagonal principal y las covarianzas entre una perturbación y otra diferente fuera de la diagonal. Es simétrica, definida positiva y de tamaño.

Los elementos diferentes de dicha matriz son. No obstante, si la muestra disponible es de tamaño , ya no tenemos grados de libertad para caracterizar el término de error, ya que habría que estimar medias y varianzas y covarianzas distintas. Las hipótesis (7) hacen que el vector de medias sea nulo y la matriz de var-cov una matriz diagonal, en donde sólo habría que estimar la varianza constante , ya que por ausencia de autocorrelación todas las covarianzas son cero.

NOTACIÓN MATRICIAL DEL MODELO LINEAL GENERAL

Gráfico: Nube de puntos real y recta de ajuste

Si suponemos un modelo lineal entre ambas variables, dada la nube de puntos, una estimación del modelo viene dada por una recta llamada RECTA DE AJUSTE definida por:

donde representa una estimación del consumo autónomo y una estimación de la propensión marginal a consumir. Para cada valor de , la recta de ajuste genera un valor de consumo que denotamos por , que no tiene por qué coincidir con el consumo real. Si dado un valor de la , el modelo predice un valor de consumo tal que , en ese instante de tiempo el modelo ajusta perfectamente. Si dado un valor de la , el modelo genera un valor del consumo tal que , el modelo infraestima el verdadero valor del consumo en ese año y comete un error. Este error es medible y se denomina RESIDUO, es decir. El residuo puede ser nulo, positivo o negativo, si el modelo acierta, infraestima o sobrestima el verdadero valor de consumo. En general, en todos los puntos de la nube real por encima de la recta de ajuste, el verdadero valor de consumo está por encima de lo que predice la recta; en los puntos sobre la recta de ajuste el modelo no se equivoca y en los puntos de la nube real por debajo de la recta, el verdadero valor de consumo está por debajo de lo que ajusta el modelo (la recta).

El objetivo ahora es conseguir una estimación de a y b de manera que se cumpla algún criterio de optimalidad. Por ejemplo, un criterio sería minimizar la suma de los residuos cometidos en toda la muestra:

Este no es un buen criterio, ya que los errores individuales que comete el modelo pueden ser muy grandes, pero al tener signo los errores grandes y positivos se pueden compensar con los grandes y negativos.

La solución obvia es eliminar en este criterio el signo de los residuos, tomando por ejemplo el valor absoluto:

En este caso, el problema es la dificultad analítica de obtener una solución para y. No obstante, otra forma de eliminar el signo de una variable es elevarla al cuadrado. El criterio de optimalidad sería obterner una expresión de y que minimize la suma de los cuadrados de los residuos:

que tiene las ventajas de (1) eliminar la compensación de errores por el signo, (2) penalizar más los errores grandes que los pequeños y (3) llevar a una solución analítica sencilla. Este criterio de estimación es el más conocido en Econometría y se denomina MCO (Mínimos Cuadrados Ordinarios).

Ejemplo: Obtener la expresión MCO para y en la función de Consumo Keynesiana:

Solución: Condiciones de primer orden:

Este es un sistema de dos ecuaciones con dos incógnitas. De la primera condición, se obtiene que:

donde e representan las medias muestrales de Consumo y Renta, respectivamente. Usando la segunda condición de primer orden y la solución para , se obtiene:

y operando:

Ejercicio para el estudiante: Comprobar que la solución obtenida es un mínimo.

Propiedades estadísticas del estimador MCO de :

Linealidad: El estimador MCO de es lineal. La linealidad consiste en poder escribir el estimador como una combinación lineal fija de los valores de la variable endógena.

Prueba: Denotando por , el estimador MCO de se puede escribir como, donde por la hipótesis de regresores fijos sabemos que cada estimador se puede escribir como una combinación lineal fija de los valores de la variable endógena.

Insesgadez: El estimador MCO de es insesgado. Es decir, la media de la distribución muestral de coincide con el verdadero. Si la , las estimaciones que conseguimos con el estimador no son iguales al verdadero vector de parámetros ni siquiera en media. A la diferencia se le denomina sesgo. La insesgadez es una propiedad deseable, pero no a toda costa. Por ejemplo, podemos tener dos estimadores alternativos de , uno insesgado y otro sesgado. Si los valores que toma el estimador sesgado oscilan menos alrededor de que el insesgado, el primero tendría menos varianza que el segundo. Es decir, a veces un pequeño sesgo compensa por la menor varianza.

Prueba: La expresión del estimador MCO de , , se puede escribir como , sin más que sustituir el valor de por el modelo. Por tanto:

donde se han usado las hipótesis de (1) parámetros constantes, (2) regresores fijos e independientes linealmente y (3) esperanza nula del término de error.

Eficiencia: El estimador MCO de es eficiente. Es decir, tiene varianza mínima dentro de la familia de estimadores lineales e insesgados de. Esto es lo que demuestra el Teorema de Gauss-Markov. Pero antes, hay que derivar la expresión de la matriz de varianzas-covarianzas del estimador MCO de.

Sabiendo que por hipótesis los regresores son fijos:

y, finalmente, aplicando las hipótesis de que las pertubaciones tienen esperanza nula, varianza constante y ausencia de autocorrelación:

Esta es la expresión de la mínima varianza de un estimador lineal e insesgado de (ver Apéndice 1).

Estimador MCO de la varianza residual

Dada una muestra de y , con la expresión del estimador MCO, es posible calcular una estimación puntual de los parámetros, pero no es posible calcular una medida de la incertidumbre asociada a dicha estimación (varianza), porque es constante pero desconocido.

Un estimador intuitivo de la varianza de las perturbaciones consiste en dividir la suma de cuadrados de los residuos MCO por n. No obstante, para que dicho estimador sea insesgado, hay que ponderar la suma de cuadrados de los residuos por los grados de libertad. Es decir:

Este estimador es insesgado, es decir, la , ya que la.

Prueba: El vector de residuos MCO se puede escribir como:

donde la matriz de tamaño es la llamada matriz de proyección que tiene propiedades importantes: (1) es simétrica, (2) idempotente ,(3) no tiene inversa y (4) es ortogonal a la matriz , es decir,.

Ejercicio para el estudiante: Probar estas cuatro propiedades de la matriz.

A partir de la relación anterior y de las propiedades de la matriz , se obtiene:. Por tanto, siempre que se desee la suma de cuadrados de los residuos se puede escribir como una forma cuadrática:

Finalmente, la esperanza de esa suma es igual a:

y la traza de la matriz :

sistema de ecuaciones normales para un modelo con término constante tiene la siguiente estructura:

o bien:

donde la primera columna de la matriz es determinista y vale siempre uno (es el llamado término constante del modelo). Operando en el sistema anterior, se obtiene:

La primera ecuación del sistema de ecuaciones normales de un modelo con término constante es:

o bien, en términos matriciales:

donde es un vector fila unitario de tamaño ;. A partir de esta primera ecuación que cumple el criterio MCO es fácil derivar algunas propiedades algebraicas:

Propiedad 1. En el MLG con término constante estimado por MCO, la media muestral de los residuos es nula, es decir,.

Prueba: A partir de la primera ecuación normal de un modelo con constante:

Propiedad 2. En el MLG con término constante estimado por MCO, la media muestral de la variable endógena coincide con la media muestral de la variable ajustada por el modelo, es decir:.

Prueba: A partir de la primera ecuación normal de un modelo con constante:

Propiedad 3. En el MLG con o sin término constante estimado por MCO, los residuos son ortogonales a las variables explicativas, es decir:

. En términos escalares,.

Prueba: A partir del sistema de ecuaciones normales MCO:

Propiedad 4. En el MLG con o sin término constante estimado por MCO, los residuos son ortogonales a la variable endógena ajustada, es decir:. En términos escalares,.

Prueba: A partir de la misma condición de ortogonalidad:

teniendo en cuenta la propiedad 3 de ortogonalidad entre los residuos y los regresores.

Propiedad 5. En el MLG con o sin término constante estimado por MCO, la suma de cuadrados de la variable endógena real es igual a la suma de cuadrados de la variable ajustada más la suma de cuadrados de residuos, es decir:. O bien, escrita en términos escalares, .

Prueba: La suma de cuadrados de residuos MCO se puede escribir como:

Sustituyendo en el último sumando la expresión analítica del estimador MCO de :

Finalmente:

Ejercicio para el estudiante: Probar de una manera diferente esta propiedad haciendo uso de la propiedad 4.

Propiedad 6. En el MLG con término constante estimado por MCO, la propiedad 5 se cumple cuando las variables se expresan en desviaciones con respecto a sus medias, es decir:

donde es una columna unitaria de tamaño n.

Prueba : Aplicando las propiedades algebraicas 1 y 2, la expresión anterior en términos escalares queda reducida a: