Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


econometria, Apuntes de Econometría

Asignatura: econometria, Profesor: , Carrera: Administración y Dirección de Empresas, Universidad: US

Tipo: Apuntes

2013/2014

Subido el 11/01/2014

lvr-9
lvr-9 🇪🇸

5

(3)

2 documentos

1 / 18

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
RELACIÓN DE EJERCICIOS DE EXAMEN
ECONOMETRÍA
GADE (Grupos 1, 2, 3, 4 y 6) y GADED
CURSO 2013-2014
PROBLEMA 1
En un conjunto de 25 pares de observaciones (Xi, Yi), relativas al modelo Yi=β1+β2 Xi+εi, donde εi cumple las
condiciones del modelo de regresión lineal, se obtiene F=37’3. Determinar:
A) El coeficiente de determinación R2.
B) El nivel crítico del coeficiente de determinación, R 2, correspondiente al valor crítico de F, para un nivel de
significación del 5%.
C) Comparar los resultados de los dos apartados anteriores y extraer conclusiones.
PROBLEMA 2
Con datos relativos a la producción (P), horas trabajadas (L) y horas máquinas empleadas (K) relativas a 15
empresas de la industria química se ha estimado la función de producción de Cobb-Douglas de dicho sector.
Esta función, en su forma original,
presenta el inconveniente de su no linealidad. Por ello, previo a su estimación, se ha procedido a linealizarla
mediante la aplicación de la función logarítmica.
Así, siendo: Y = ln P ; X1 = ln L ; X2 = ln K, la función de producción estimada queda :
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12

Vista previa parcial del texto

¡Descarga econometria y más Apuntes en PDF de Econometría solo en Docsity!

RELACIÓN DE EJERCICIOS DE EXAMEN

ECONOMETRÍA

GADE (Grupos 1, 2, 3, 4 y 6) y GADED

CURSO 2013-

PROBLEMA 1

En un conjunto de 25 pares de observaciones (X (^) i , Yi), relativas al modelo Y (^) i=β 1 +β 2 X (^) i+ε (^) i, donde εi cumple las condiciones del modelo de regresión lineal, se obtiene F=37’3. Determinar: A) El coeficiente de determinación R 2.

B) El nivel crítico del coeficiente de determinación, R 2 , correspondiente al valor crítico de F, para un nivel de significación del 5%. C) Comparar los resultados de los dos apartados anteriores y extraer conclusiones.

PROBLEMA 2

Con datos relativos a la producción (P), horas trabajadas (L) y horas máquinas empleadas (K) relativas a 15 empresas de la industria química se ha estimado la función de producción de Cobb-Douglas de dicho sector. Esta función, en su forma original,

presenta el inconveniente de su no linealidad. Por ello, previo a su estimación, se ha procedido a linealizarla mediante la aplicación de la función logarítmica.

Así, siendo: Y = ln P ; X 1 = ln L ; X 2 = ln K , la función de producción estimada queda :

a) Explique el significado de los coeficientes de pendiente estimados y obtenga para ellos estimaciones por intervalos del 95% de confianza. Contraste la significatividad de dichos coeficientes de pendiente al 5% y al 1%. Contraste, para ambos niveles, la significatividad del modelo. b) ¿Encuentra indicios de multicolinealidad en el modelo tras los resultados del apartado anterior?. Explíquelos. Confirme su respuesta mediante otros procedimientos, con ayuda de los siguientes datos:

c) Con los datos del modelo estimado y conociendo que la covariancia estimada entre los estimadores de los coeficientes de pendiente es - 0'134, ¿podríamos aceptar la hipótesis que en la industria química se produce con rendimientos constantes a escala (b 1 +b 2 =1). Contrástelo. d) Dada la especialización de los trabajos en la industria química, una mayor experiencia de los trabajadores afecta positivamente la elasticidad del factor trabajo. Así, las empresas con alto porcentaje (más del 50%) de trabajadores fijos obtienen mejores resultados. ¿Sabría introducir, tanto en el modelo en forma logarítmica como en el modelo original, una variable ficticia que recogiese este efecto?. Exprese, en forma teórica, las nuevas ecuaciones del modelo en sus dos versiones. Plantee el contraste adecuado para verificar la influencia de la experiencia en el empleo sobre la elasticidad del factor trabajo, para un nivel de significación del 1%. e) En los datos muestrales se observa un fuerte incremento de la variabilidad de la producción a medida que el número de horas trabajadas en las empresas es mayor lo que hace conjeturar la existencia de heterocedasticidad. ¿ En que modo afectaría a ésta la linealización del modelo mediante la aplicación de la función logarítmica?. Presumiendo la persistencia de la heterocedasticidad en el modelo linealizado, se eliminan las tres observaciones centrales tras haberlas ordenado en orden creciente de la variable X 1. Se ha obtenido que la suma de los cuadrados de los residuos de la regresión efectuada con las primeras seis observaciones es 0'1128, ¿ cuanto deberá ser, como mínimo, la suma de los cuadrados de los residuos de la regresión efectuada con las seis últimas observaciones, para rechazar la homocedasticidad del modelo a un nivel de significación del 5%?. ¿Y para un nivel de significación del 1%?. Comente los resultados obtenidos. f) Por los datos muestrales conocemos que el total producido por las 15 empresas seleccionadas es de 5.340 miles de toneladas ( F 0 5 3P=5.340), empleando 24.680 horas de trabajo ( F 0 5 3L=24680) y 9.520 horas de

maquinas ( F 0 5 3K=9.520). Con esta información, es obvio, que sabrá estimar las productividades medias de capital y trabajo en el sector químico. Confírmelo. Pero, ¿sabría realizar estimaciones de las productividades marginales medias (productividades marginales en el "punto medio") de ambos factores? Confírmelo.

PROBLEMA 3

A tres estudiantes de la licenciatura de A. y D. de Empresas se les ha propuesto realizar un determinado estudio econométrico. Uno de ellos, con las n observaciones que han de ser utilizadas para la estimación de un determinado modelo econométrico ha obtenido los siguientes valores:

Var(Y)=48 Var(X 2 )=625 Var(X 3 )=1296 Cov(X 2 ,X 3 )=

Presumiendo la existencia de heterocedastidad, ordena las n observaciones según los valores crecientes de X 2. Realiza las correspondientes regresiones con los dos grupos de observaciones (de igual tamaño), anteriores y posteriores a las 6 observaciones centrales omitidas, y obtiene dos estimaciones de la variancia de las perturbaciones a partir de los residuos de ambas regresiones. Los valores de estas estimaciones son 5'4 y 1'2 para el primero y segundo grupo, respectivamente. En las tablas estadísticas, para un nivel de significación del 5%, encuentra que el valor crítico del estadístico de esta prueba es 3'179. Otro de los estudiantes realiza la estimación del modelo, pero debido a un virus informático el ordenador sólo le ofrece la siguiente información, fragmentada e incompleta, en la pantalla de resultados:

Al tercer estudiante de este grupo, se le pide que haciendo uso de toda la información obtenida por sus compañeros y de sus amplios conocimientos de Econometría: A) Realice los cálculos necesarios para obtener la información completa de la anterior pantalla de resultados de la estimación del modelo. B) Compruebe, por los métodos oportunos, la presencia de multicolinealidad en el modelo. Posteriormente, haciendo uso de una estimación externa o a priori (ß 3 =0'5), obtenida para el parámetro que acompaña a la

variable X 3 del modelo, proceda a la reformulación teórica del mismo.

C) El patrón de heterocedasticidad supuesto es E( F 0 6 5^2 i )= F 0 7 3^2 /X 2. Proceda a contrastar la presencia de la misma y obtenga la matriz omega, la matriz de transformación y el teórico modelo transformado ( a partir del modelo original).

X 2 ,X 3 , X 4 0.974 1.

¿?

El gerente analiza esta matriz y, para la elección del modelo adecuado, ejecuta las siguientes regresiones:

b).- Complete los datos del cuadro resumen de las regresiones efectuadas. c).- ¿Cuáles son las características de una buena variable explicativa? ¿El ingreso personal es una buena variable explicativa? ¿Qué porcentaje de la variabilidad de las ventas se explicaría si hacemos uso únicamente del ingreso personal como variable explicativa? d).- ¿Qué porcentaje de variancia de las ventas se explicaría utilizando las 3 variables exógenas? Para F 0 3 8=0'05, ¿Son significativas las estimaciones de los coeficientes de regresión de dicho modelo? ¿Es significativo el modelo?. e).- ¿Por qué el gerente no ha creído conveniente realizar la regresión utilizando como variables explicativas sólo X 2 y X 3? f).- Finalmente, el modelo elegido por el gerente fué:

¿Qué razones puede aducir el gerente para esta elección?. Interprete el significado de los coeficientes de regresión estimados para este modelo. ¿Son fiables estos coeficientes estimados?. Presente un cuadro resumen con toda la información posible del modelo estimado.

PROBLEMA 6

Florencio Verde Limón, director de una empresa de productos de jardinería, desea conocer si las ventas semanales de su empresa se relacionan con alguna otra variable para elaborar un modelo de regresión que le permita explicar y predecir su volumen semanal de ventas. Selecciona al azar 8 semanas de los dos últimos años y anota sus volúmenes de ventas expresados en miles de euros. Decide que el tiempo de emisión en T.V. de publicidad de sus productos cada semana se puede correlacionar con el volumen de ventas de la semana siguiente, por lo que también registra, para cada semana de la muestra, el minutaje publicitario de la semana anterior. La información obtenida se resume en los siguientes datos:

a).- Justifican los datos muestrales la correlación supuesta por el director de la empresa. Coméntelo razonadamente e indique, en que forma, dicha correlación establece cual ha de ser la variable endógena y la variable explicativa en el modelo de regresión a elaborar. b).- Obtenga dicho modelo de regresión, interprete los valores estimados de los parámetros del modelo y justifique, para F 0 3 8=0'01, la validez del mismo mediante las pruebas t y F. c).- Una de las parejas de datos muestrales indica que con 6 minutos de publicidad, se alcanza un volumen de ventas de 163.000 euros en la semana siguiente. Si desconociésemos dicho volumen de ventas, ¿Cuál sería nuestra mejor predicción del mismo sin utilizar el modelo de regresión estimado? ¿Cuál sería nuestra predicción haciendo uso del modelo de regresión estimado?. Puesto que, por la información muestral, conocemos el valor real de las ventas, ¿Cuál sería nuestro error de predicción en cada caso? ¿Encuentra alguna relación entre ambos errores de predicción y la capacidad explicativa del modelo. Coméntelo razonadamente. d).- El director desea realizar predicciones por intervalos para el valor medio y el valor real del volumen semanal de ventas. ¿Cómo afectaría a la amplitud de los intervalos de predicción que en la semana precedente el minutaje publicitario fuese 6 u 8 minutos? ¿Para qué minutaje publicitario de la semana anterior serían mínimas las amplitudes de los intervalos de predicción del valor medio y el valor real? ¿Por qué? Obtenga dichos intervalos de amplitud mínima para F 0 6 1=0'05.

e).- Actualmente son 6 minutos de publicidad semanal lo que tiene contratada la empresa con las cadenas de T.V. Ante la llegada de la primavera, la empresa prevé incrementarlo un 10% para la 1ª semana de Abril y un nuevo incremento adicional del 10% la 2ª semana de dicho mes. ¿Cuales serían los incrementos porcentuales estimados del valor medio del volumen de ventas de la 2ª y 3ª semanas de Abril ¿Son también iguales dichos incrementos? ¿Por qué?

PROBLEMA 7

La industria minera de un determinado país desea estimar la producción de carbón (Y), expresada en millones de Tms, en función del número de trabajadores (X), expresado en miles de trabajadores, dado que su equipamiento de capital permanece constante. Para ello utiliza los datos correspondientes a los diez últimos ejercicios, que ofrecen un valor medio para la producción de carbón de 200’56 millones de Tms , con los que estima el siguiente modelo:

1º) Interprete el valor del coeficiente de regresión del modelo estimado y contraste la significatividad ( F 0 6 1 =0’05) del modelo mediante las pruebas t y F. Señale la diferencia entre ambas pruebas 2º) Indique que proporción de la variabilidad de la producción de carbón no es explicada por el modelo estimado. Obtenga una estimación de la variancia de las perturbaciones ¿Es insesgado el estimador de la variancia de las perturbaciones? 3º) Obtenga una estimación por intervalo del 95% de confianza para la pendiente del modelo y explique su significado. 4º) Estime los valores de la productividad media y la productividad marginal de los trabajadores de la industria del carbón y la elasticidad media de la producción de carbón respecto al número de trabajadores. 5º) Conociendo que la variancia muestral del nº de trabajadores es 3151’67 , calcule la estimación puntual y por intervalo (95%) de la producción media y real de carbón del próximo año para el que se espera contratar 750.000 trabajadores ¿Serían más precisas las estimaciones si el nº de contratados fuese 700.000? ¿Por qué?

PROBLEMA 8

Un trabajador de una determinada empresa conoce que la evolución temporal de su salario nominal (S), expresado en euros, se rige por un modelo matemático análogo al del interés compuesto, es decir, S (^) t = So

(1+ r) t^ donde r, la tasa de crecimiento compuesta de su salario, representa el incremento medio anual acumulativo negociado en convenio. Dado el carácter no lineal del modelo original lo “linealiza” tomando logaritmos, y con los salarios de los 20 años trabajados en la empresa estima el siguiente modelo:

1º) Describa brevemente las transformaciones realizadas al modelo original para obtener el modelo econométrico, lineal en los parámetros, que el trabajador ha estimado a partir de los datos. Indique el nombre de dicho modelo y comente sus características. 2º) Interprete el valor estimado para la pendiente de regresión y contraste la significatividad del modelo estimado. 3º) Interprete el coeficiente de determinación

del modelo. Si el modelo econométrico estimado hubiese sido de la forma S (^) t = F 0 6 1+ F 0 6 2t + F 06 5t ¿qué

interpretación tendría el valor estimado de F 0 6 2? ¿Cuál sería el significado del R 2 de este modelo? ¿Es alguno de estos dos modelos de elasticidad constante? Justifíquelo. 4º) Estime el sueldo de dicho trabajador el primer año que trabajó en la empresa (S (^) o ) 5º) Distinga entre la tasa de crecimiento instantánea y la compuesta y calcule esta última.

PROBLEMA 9

En un informe sobre el sector agrícola de un determinado país se ofrece el siguiente modelo de regresión lineal del PIB agrícola real (Y (^) t : millones de euros) respecto a la cantidad de trabajo empleado (X (^) 2t : en

millones de jornadas laborales anuales) y el consumo de capital real (X (^) 3t : millones de euros), obtenido con datos de los últimos 15 años:

a) Interprete el significado económico de los valores estimados para los parámetros que acompañan a las variables explicativas. Para un nivel de significación del 1%, ¿considera significativas dichas estimaciones? Justifíquelo. b) Obtenga el coeficiente de determinación del modelo y explique su significado. Contraste la significatividad del modelo para un nivel de significación del 1%.

3.- Defina la multicolinealidad y analice su posible presencia en el modelo. Exprese brevemente las consecuencias prácticas de la existencia de multicolinealidad y señale algunas formas de corrección de dichas consecuencias. 4.- ¿Cómo afecta la variable Dt a las pendientes de regresión de este modelo? ¿Por qué? ¿Qué es una variable ficticia? Interprete el valor estimado del coeficiente de D (^) t. 5.- El coeficiente de correlación entre residuos consecutivos es 0’42. Señale algunos modelos de generación de las perturbaciones. Exprese el modelo supuesto de generación de las perturbaciones para poder aplicar el contraste “d” de Durbin-Watson. 6.- Con la información disponible, ¿podemos aplicar dicho contraste para estudiar la posible presencia de autocorrelación en el modelo? ¿Por qué? En caso afirmativo, realice dicho contraste. En caso negativo, sugiera el contraste adecuado. 7.- La regresión de los cuadrados de los residuos del modelo frente a los valores de la variable Y (^) t ofrece un valor “t” para la pendiente de dicha regresión de 2’4. La regresión de los cuadrados de los residuos del modelo frente a los inversos de los valores de la variable Y (^) t ofrece un coeficiente determinación de 0’2. ¿Considera posible la presencia de heterocedasticidad en el modelo provocada por la variable Y (^) t ?¿Qué patrón de heterocedasticidad juzga más adecuado? 8.- ¿Cómo afecta a los estimadores de los parámetros del modelo la presencia de heterocedasticidad? Para el patrón de heterocedasticidad que ha juzgado más adecuado en el anterior apartado, ¿Qué transformación ha de realizar en el modelo original para corregir la heterocedasticidad? Realícela y justifíquela. 9.- Se estima que para el año 2012 la inversión en publicidad será un millón de euros y la renta disponible alcanzará la cifra de 50 millones de euros. Bajo estas condiciones, el modelo predice, para dicho año, un decremento de las ventas respecto al año anterior de 134.000 euros. ¿Cuáles son las predicciones de venta del modelo para 2011 y 2012? 10.- ¿En que porcentaje hay que aumentar los gastos de publicidad para compensar el efecto predicho por el modelo sobre las ventas del incremento de renta del apartado a)? Si, a partir de su valor muestral medio, incrementamos los gastos de publicidad en 10.000 euros, ¿cuál sería su efecto sobre las ventas?

PROBLEMA 12

¿En cuáles de los casos que se relacionan a continuación los datos que se ofrecen son compatibles entre sí? Justifique razonadamente sus respuestas.

PROBLEMA 13

  1. Exprese, de forma retórica y analítica, las definiciones empleadas en Econometría de Multicolinealidad, Heterocedasticidad y Autocorrelación. De los anteriores conceptos (problemas) econométricos, ¿cuál hace referencia a la muestra y cuál a la población? ¿Cuál ocasiona estimadores ineficientes de los parámetros del modelo de regresión lineal?¿Cómo averiguaría, a partir de la matriz de correlación de un modelo de regresión múltiple, si: (a) existe colinealidad perfecta (b) no existe colinelidad? ¿Para que tipo de datos es más probable la presencia de autocorrelación en el modelo?

  2. Se desea conocer el efecto producido por una reforma fiscal implementada en un determinado país en 1992 en la relación existente entre ingresos públicos y ahorro privado. Con datos anuales del período 1980-2003 referentes a los ingresos del sector público (INGPUB), Producto Interior Bruto (PIB), ahorro privado (AHORRO), junto a una variable ficticia (F) para evaluar dicho efecto, se ha estimado el modelo que se ofrece en la tabla adjunta. La variable ficticia (F) toma el valor 0 para antes de 1992 y el valor 1 para 1992 y años posteriores.

Variable dependiente: INGPUB Método: MCO Nº de observaciones: 24 Variable Coeficiente E. S t Valor-p C 44’5378 4’0371 11’0320 0’ PIB 0’0002 2’11E-5 12’6214 0’ AHORRO -0’9564 0’1816 -5’2658 0’ F -18’6448 7’2326 -2’5778 0’ F•AHORRO 1’0144 0’3409 2’9751 0’ R 2 0’9847 Media variable dependiente 31’ E.S. de la regresión 0’9389 D.S. variable dependiente 6’ Suma cuadrado residuos 16’7522 Estadístico F 307’ Estadístico de D-W 1’3607 Valor-p (estadístico F) 0’

a) Exprese analíticamente el modelo teórico implícito en la tabla. Interprete los valores estimados para la constante de regresión del modelo (C) y los coeficientes de las variables PIB y AHORRO ¿Cómo se denominan las formas empleadas para introducir la variable ficticia en el modelo? ¿Qué diferencia hay entre ellas?

b) Para un nivel de significación del 1%, contraste si las variaciones del ahorro provocan variaciones diferentes en los ingresos públicos antes y después de 1992. Para dicho nivel de significación, ¿son significativos los valores estimados para todos los parámetros del modelo? ¿y el modelo? Explíquelo brevemente.

c) Obtenga estimaciones por intervalos del 95% de confianza, para la pendiente de la variable AHORRO para años anteriores y posteriores a 1992 ¿Cómo afectaría a dichos intervalos la presencia de multicolinealidad en el modelo? ¿Cree razonable suponer dicha presencia?

d) Obtenga el valor del R 2 corregido y contraste la posible presencia de autocorrelación en el modelo para un nivel de significación del 1% ¿Qué tipo de modelo ha de suponer que genera las perturbaciones para poder aplicar el contraste de D-W? Obtenga una estimación del coeficiente de autocorrelación de dicho modelo en el caso en estudio.

  1. ¿Es necesario suponer que las distribuciones de las perturbaciones aleatorias condicionadas a los diversos valores de las variables explicativas son distribuciones Normales de media nula para poder obtener las estimaciones minimocuadráticas de los parámetros del modelo? ¿Qué sucede si las medias de dichas distribuciones son no nulas? El estadístico de Jarque-Bera pertenece a una prueba asintótica basada en la distribución de los residuos MCO ¿qué se contrasta en dicha prueba? ¿qué significa una prueba asintótica? ¿Qué coeficientes de la distribución de los residuos MCO se emplean para calcular el valor de dicho estadístico?

4º) Con datos de 18 Comunidades Autónomas correspondientes a 1992, se ha estimado un modelo de regresión lineal para conocer la relación existente entre el consumo final de las familias (variable Y) y la renta familiar disponible de las mismas (variable X). Presumiendo que la variabilidad del consumo de las familias crece cuando lo hace la renta, se desea contrastarlo mediante la prueba de Golfeld y Quandt. Previa ordenación de los datos en orden creciente según los valores de la variable explicativa, se obtienen las dos siguientes regresiones:

Tabla 1

Variable dependiente: Y Método: MCO Nº de observaciones: 7 primeras observaciones

Variable Coeficiente E. S t Valor-p C -8483’22 26038’5 -0’3257 0’ X 1’08281 0’04856 22’2962 0’

R^2 0’9900 Media variable dependiente 518170’ E.S. de la regresión ****** D.S. variable dependiente 265205’ Suma cuadrado residuos ****** Estadístico F 497’ Estadístico de D-W 1’5550 Valor-p (estadístico F) 0’

Tabla 2

Variable dependiente: Y Método: MCO Nº de observaciones: 7 últimas observaciones

Variable Coeficiente E. S t Valor-p

1º) Interprete el significado de los valores estimados de los coeficientes de las variables explicativas del modelo ¿Considera significativos dichos valores? ¿Considera significativo el modelo en su conjunto? Coméntelo brevemente. 2º) Obtenga el R 2 y el R 2 corregido. Comente sus diferencias. 3º) Obtenga las estimaciones MCO y MV de la variancia de las perturbaciones. Señale sus diferencias. 4º) Si el nº medio de vehículos en circulación es 30 millones, obtenga las elasticidades medias del nº de accidentes respecto a cada una de las variables explicativas. 5º) Supongamos que el modelo estimado fuese el verdadero modelo poblacional , calcule una estimación por intervalo del 95% para el nº real de accidentes si el nº de vehículos es 40 millones y el nº de turistas entrados por carretera es 10 millones.

PROBLEMA 16

Para tratar de explicar las variaciones del nivel de inventario (variable Y, en millones de euros) en función de las ventas (variable X, en millones de euros) y las tasas de endeudamiento (variable R) se estima el siguiente modelo con datos de 35 empresas de un determinado sector:

Con anterioridad a la estimación de este modelo se esperaba que el nivel de inventarios tuviese una relación directa con las ventas e inversa con la tasa de endeudamiento. 1º) Contraste, para un nivel de significación del 1%, la significatividad de los parámetros de pendiente estimados y explique si dichos valores estimados satisfacen las expectativas previas. Contraste la significatividad del modelo. ¿Es presumible la presencia de multicolinealidad en el modelo? Explíquelo brevemente. 2º) Ordenados los datos muestrales en un determinado sentido según los valores de la variable X, las sumas de cuadrados residuales de las regresiones efectuadas con las catorce primeras y catorce últimas observaciones son, respectivamente, 0’908 y 5’114. Contraste para un nivel de significación del 1% la posible presencia de heterocedasticidad en el modelo. Caso de “aceptar” la hipótesis de heterocedasticidad, ¿podría indicar el patrón que sigue la misma?. 3º) La estimación del modelo de regresión transformado queda:

Indique cual ha sido el patrón de heterocedasticidad supuesto para transformar el modelo. Exprese la matriz de información (Ω) y la de transformación (T). Interprete el coeficiente de determinación de esta nueva regresión. 4º) Exprese el modelo estimado en el apartado anterior en función de las variables originales. ¿Cuál de los dos coeficientes de regresión parcial ha experimentado mayor cambio como consecuencia de la transformación del modelo para corregir la heterocedasticidad? Cuantifíquelo. 5º) Se define una variable ficticia que se anula cuando las ventas de la empresa son inferiores a 120 millones de euros. Introdúzcala en el modelo teórico original para recoger el efecto en términos absolutos y sobre el coeficiente regresión parcial de las ventas, para las empresas cuyas ventas superan los 120 millones de euros. Diseñe y realice la prueba adecuada para contrastar dichos efectos, conociendo que la suma de los cuadrados de los residuos del modelo estimado con la incorporación de la variable ficticia es 9. PROBLEMA 17

En una región agrícola se ha realizado un estudio sobre el efecto de un nuevo fertilizante sobre la producción de trigo. Se ha elegido un determinado número de parcelas de terreno de igual superficie y se ha estimado el siguiente modelo sobre la producción (Y) en función de la cantidad de fertilizante (X):

Con los residuos de esta regresión se ha estimado el modelo expresado a continuación:

Reordenando todas las variables de la regresión original de menor a mayor de acuerdo a la variable cantidad de fertilizantes y tras eliminar las 8 observaciones centrales, se ha realizado dos regresiones con igual número de datos con el siguiente resultado:

Se conoce también que el valor crítico encontrado en las tablas, para un nivel de significación del 5%, en la contrastación realizada con estas dos regresiones es 5’050.

a) A partir de toda la información disponible: 1º) realice las contrastaciones pertinentes sobre la presencia de heterocedasticidad en el modelo original 2º) Tras la realización de ambas contrastaciones, ¿consideraría

que la cantidad de fertilizante influye de forma significativa en la explicación de la variabilidad de la producción?

Un nuevo estudio ha dado como resultado las siguientes regresiones adicionales:

b) Con esta nueva información y para el nivel de significación antes señalado. 1º) ¿considera que existen problemas de heterocedasticidad en el modelo original? 2º) En caso afirmativo, explique y justifique, teóricamente, la transformación a realizar en dicho modelo para estimar los parámetros de forma eficiente. 3º) ¿Hubiésemos podido realizar dicha transformación sólo con la información obtenida en el apartado a)? Coméntelo brevemente.

c) Si supusiésemos que el modelo original cumple los supuestos del MCRL, 1º) El alto valor de su coeficiente de determinación ¿indica una fuerte correlación lineal entre los valores muestrales de las variables X e Y? Justifíquelo. 2º) En caso afirmativo, ¿podría acarrear problemas de multicolinealidad en dicho modelo? Razónelo brevemente.

PROBLEMA 18

Para explicar la tasa de participación laboral de la población femenina (variable Y) en un determinado país, un equipo técnico de la OIT, empleando datos anuales de un período de 22 años, estima los siguientes modelos:

a).- Interprete el valor estimado para la pendiente del modelo 1. Obtenga para la misma un intervalo de confianza del 95% ¿Qué nombre recibe este modelo donde la variable explicativa es el tiempo? b).- Para un nivel de significación del 5%, ¿existe problema de autocorrelación en alguno de los modelos? Justifíquelo. Si se le indicase que se ha descubierto, mediante la representación gráfica, un residuo atípico en la primera regresión y se decidió eliminar la observación correspondiente para realizar la regresión 2 ¿podría aplicar el test de Durbin-Watson en esta regresión?, ¿por qué? c).- Se presume que la variable t 2 de la segunda regresión es irrelevante, es decir, que su coeficiente β 3 = 0. Contrástelo, para un nivel de significación del 5%, mediante el test general de restricciones lineales ¿Cuáles son las consecuencias de introducir variables irrelevantes en el modelo? ¿Es más grave omitir variables relevantes? Explíquelo brevemente d).- Razone brevemente la posible presencia de multicolinealidad en ambos modelos.

PROBLEMA 19

Con datos anuales del período 1960-99, se pretende explicar el comportamiento de los beneficios de una empresa (variable Y) mediante su masa salarial (variable X 1 ) y sus inversiones en capital (variable X 2 ). Para ello se propone el siguiente modelo:

a).- Indique la distribución que ha de seguir la perturbación aleatoria de dicho modelo para poder ser estimado por MCO. Interprete los coeficientes de regresión de dicho modelo. b).- El p-valor asociado al valor del estadístico experimental de la prueba de White es 0’0283. Para un nivel de significación del 5%, ¿considera que existe heterocedasticidad en el modelo propuesto? Señale la hipótesis nula, la hipótesis alternativa, el estadístico experimental y la distribución que sigue dicho estadístico experimental en la prueba aplicada. c) Tras la realización de la prueba de White, y en caso de señalar la presencia de heterocedasticidad, ¿cuál cree que sería el patrón de heterocedasticidad adecuado para transformar el modelo? ¿Por qué se considera la prueba empleada un contraste no constructivo? d).- Tras aplicar la prueba de Glejser, se confirma el resultado obtenido con la prueba anterior. Por ello, se decide trasformar el modelo para su estimación por MCO quedando en la forma:

¿Cuál ha sido el patrón de heterocedasticidad supuesto para realizar dicha transformación? ¿Son homocedásticas las perturbaciones del modelo transformado? Justifíquelo. ¿Qué ventaja ofrece la prueba de Glejser sobre la efectuada anteriormente para detectar la heterocedasticidad?

PROBLEMA 20

Con datos referentes a las rentas (variable X 1 , en miles de euros) y las dotaciones de ahorro (variable Y, en euros) de 100 familias se ha estimado la siguiente función de ahorro:

Variable dependiente: Y. Método: MCO. Nº de observaciones: 10 Variable Coeficiente E. S t Valor-p C 51’369667 4’2172691 12’1807890 0’ X 2 6’8162575 3’2684653 2’0854612 0’ X 3 0’2498558 1’0056857 0’2484432 0’ R^2 0’920046 Media variable dependiente 81’ R^2 corregido 0’897202 S. D. variable dependiente 10’ E.S. de la regresión 3’324376 Estadístico F 40’ Suma cuadrado residuos 77’36031 Valor-p 0’

1º) Interprete el significado de los valores estimados de los coeficientes de regresión ¿Considera significativos dichos valores? ¿Considera significativo el modelo en su conjunto? Coméntelo brevemente. 2º) Obtenga el R 2 y el R 2 corregido. Comente sus diferencias.3º) Obtenga las estimaciones MCO y MV de la variancia de las perturbaciones. Señale sus diferencias. ¿Garantiza el teorema de Gauss-Markov la eficiencia de la estimación MCO de la variancia de las estimaciones. 4º) El nº medio de trabajadores es 30.000, obtenga las elasticidades medias del nº de accidentes respecto a cada variable explicativa, interprete el significado de dichas elasticidades medias y justifique brevemente el porqué de su cálculo. PROBLEMA 23

Con datos de los últimos 18 años se ha estimado el siguiente modelo de regresión lineal del PIB del sector comercio (Y), expresado en millones de euros constantes, respecto al empleo (X 2 , millones de horas de trabajo anuales) y la inversión (X 3 , en millones de euros constantes)

a) Interprete el significado de las estimaciones obtenidas para los coeficientes de regresión parcial de dicho modelo. Interprete el significado del coeficiente de determinación. Para un nivel de confianza del 99%, obtenga estimaciones por intervalos de ambos coeficientes de regresión. El coeficiente de correlación entre empleo e inversión en el sector comercio es de sólo 0’05, ¿garantiza dicho valor la ausencia de multicolinealidad en el modelo estimado? Explíquelo breve y razonadamente. b) Contraste la presencia de autocorrelación o correlación serial en el modelo y estime el modelo supuesto de generación de las perturbaciones. En caso de que existiese correlación serial o autocorrelación ¿cómo podríamos corregir las consecuencias derivadas de su presencia en el modelo? ¿cuáles son dichas consecuencias? c) El p-valor asociado a la prueba de White es 0’0235. Para un nivel de significación del 5%, ¿considera que existe heterocedasticidad en el modelo propuesto? Señale la hipótesis nula, hipótesis alternativa, estadístico experimental o de prueba y distribución que sigue dicho estadístico experimental bajo el supuesto de certeza de la hipótesis nula. Si se detectara existencia de heterocedasticidad en el modelo y se supusiese un patrón de heterocedasticidad consistente en que la variancia de las perturbaciones fuese inversamente proporcional a la variable ln X 2 , exprese de forma teórica la corrección que corresponde hacer al modelo y justifíquela. d) Asumiendo todos los supuestos habituales del modelo clásico de regresión lineal normal, se realiza una prueba de hipótesis, mediante el test general de restricciones lineales o prueba de Wald, para comprobar si en el sector comercio se produce con rendimientos constantes a escala. Dicha prueba ofrece un p-valor de 0’015. Exprese formalmente este contraste e indique la decisión correspondiente para α=0’05. Para este nivel de significación, confirme el resultado del contraste anterior mediante un procedimiento alternativo conociendo que la covariancia entre los estimadores de los coeficientes de regresión parcial es –0’2. e) Aceptando que los términos de error o perturbaciones del modelo son estadísticamente independientes y están idénticamente distribuidos, se realiza la prueba de normalidad de Jarque-Bera, obteniéndose un p- valor de 0’025 para el estadístico asociado a dicha prueba. Para un nivel de significación del 5%, ¿rechazaría la hipótesis nula de dicho contraste? ¿y para un nivel de significación del 1%? ¿Cuál es la hipótesis nula de dicho contraste? ¿Es necesario que se cumpla dicha hipótesis nula para poder estimar el modelo por MCO?

PROBLEMA 24

Con datos de la economía española de los últimos 15 años se ha estimado el siguiente modelo de regresión lineal del consumo público (variable Y, en millones de euros) en función del PIB a precios de mercado (variable X, en millones de euros):

Dada la naturaleza de los datos se presume la existencia de autocorrelación en dicho modelo. Por ello se ha

supuesto un modelo de generación de las perturbaciones cuyo valor estimado es:

a) Contraste mediante el test de Durbin-Watson la presumible presencia de autocorrelación en el modelo para niveles de significación del 1% y del 5% ¿Podríamos aplicar este contraste si el modelo supuesto de generación de las perturbaciones fuese un esquema autoregresivo de segundo orden? ¿Y si fuese un esquema de media móvil? ¿Qué otras condiciones son necesarias para poder aplicar este contraste? b) Exprese la ecuación en diferencia generalizada resultante de la transformación del modelo original para eliminar la presencia de autocorrelación suponiendo que el esquema de autocorrelación supuesto es adecuado. ¿Cómo serán los estimadores de los parámetros del modelo transformado? c) Indique brevemente que otros procedimientos conoce para detectar la presencia de autocorrelación en un modelo ¿Cuáles son las consecuencias de la presencia de autocorrelación? Si no deseamos transformar el modelo original en la forma señalada en el apartado anterior, ¿qué otro procedimiento podemos emplear para obtener estimaciones eficientes de los parámetros del modelo? Coméntelo brevemente.

d) Se espera que valores de crecimiento anual del IPC superiores al 4% y/o tasas de paro superiores al 10% tenga un efecto individual y conjunto (efecto interacción) sobre la propensión marginal del consumo público. Exprese, de forma teórica, un modelo que incluya las variables ficticias precisas para recoger dichos efectos. El coeficiente de determinación de este modelo es 0’65. Para un nivel de significación del 5%, ¿podemos señalar que tasas de inflación y/o paro superiores al 4% y 10%, respectivamente, no ejercen influencia individual y conjuntamente sobre la propensión marginal del consumo público? Justifíquelo. e) El valor-p correspondiente al estadístico experimental del contraste de Jarque-Bera es 0’015 ¿Para que niveles de significación podemos señalar que es improbable que se cumpla, (es decir, rechazar) el supuesto de Normalidad de las perturbaciones? ¿Qué coeficientes de la distribución de los residuos se emplean para construir el estadístico experimental de este contraste.

PROBLEMA 25

Con datos de los últimos años, se estima el siguiente modelo para explicar el ahorro generado (S (^) t , en 10^6

euros) en función del tipo de interés (r (^) t ):

a) Obtenga una estimación por intervalos del 95% para la pendiente del modelo y, para un nivel de significación del 5%, contraste la significatividad del modelo mediante los diversos procedimientos que permita la información disponible. b) Conociendo que el valor de la variancia muestral de S (^) t es 100, calcule el ahorro anual medio del período considerado y las estimaciones MCO y MV de la variancia de las perturbaciones ¿Son insesgados ambos estimadores? Coméntelo brevemente. c) Para estimar el modelo con mayor precisión, si pudieras elegir los años a que corresponden los datos muestrales, ¿elegirías un período en el cual los tipos de interés fuesen fluctuantes o un período en el que los tipos de interés fueran relativamente constantes? Justifique razonadamente su respuesta. d) El valor del estadístico t, para el contraste con un nivel de significación del 5% del término independiente, nos lleva a no rechazar la hipótesis nula. Justifíquelo. Por ello, se formula y estima el siguiente modelo:

Dado el mayor valor de su coeficiente de determinación, se opta por elegir este último modelo ¿Le parece adecuada esta decisión? Razone su respuesta.

PROBLEMA 26

La empresa A ha estimado los siguientes modelos con datos de los últimos 9 años del nº de unidades vendidas (Y) así como de su precio (X 1 ) y el precio de la competencia (X 2 ) expresado en euros.

a) ¿Son razonables los signos de los coeficientes de regresión estimados en ambos modelos? Razónelo. Para un nivel de significación del 1% ¿Son ambos modelos significativos? Justifíquelo. b) Interprete las estimaciones obtenidas para los coeficientes de regresión en ambos modelos. c) El precio actual del artículo de la competencia es de 20 euros. De forma unilateral la empresa competidora decide rebajar en 2 euros el precio de su producto. Cuantifique la variación promedio estimada sobre el nº medio estimado de unidades vendidas por la empresa A con ambos modelos. d) Obtenga para ambos modelos sus coeficientes de determinación corregidos ¿Podemos elegir entre ambos modelos atendiendo a los valores de sus R 2? Razónelo

4.- Realizadas las pruebas de RESET y Chow de estabilidad estructural, con respecto al modelo original, se obtuvieron los siguientes resultados:

Ramsey RESET Test Equation: E Specification: Y X 1 X 2 X 3 C Omitted Variables: Squares of fitted values

Value df Probability t-statistic 2.985360 31 0. F-statistic 8.912372 (¿?, ¿?) 0.

Chow Breakpoint Test: 2001 Null Hypothesis: No breaks at specified breakpoints Varying regressors: All equation variables Equation Sample: 1970 2005

F-statistic 4.288219 Prob. F(¿?, ¿?) 0. Log likelihood ratio 17.20258 Prob. Chi-Square(4) 0. Wald Statistic 17.15287 Prob. Chi-Square(4) 0.

Analice por separado ambas pruebas. Interprete los resultados. ¿A cuáles de los supuestos establecidos en el MCRL hacemos referencia con estas pruebas? Defina la hipótesis nula y alternativa en ambos test. Determine los grados de libertad del estadístico F en ambos casos. ¿Qué se puede concluir? Explique brevemente sus respuestas.

PROBLEMA 28

Se desea analizar la relación entre el número de tratamientos recetados el último año contra la gripe (variable Yi , en miles) en las 50 provincias españolas y las ciudades autónomas de Ceuta y Melilla, en relación con el número de habitantes que constituyen el grupo de riesgo (variable X (^) 1i, en miles), el total de habitantes (variable X (^) 2i, en miles), y la renta familiar neta disponible (variable X (^) 3i, en miles de euros).

A continuación se ofrece el modelo estimado (modelo 1) y los datos del histograma.

1ª) Indique qué supuestos o hipótesis ha de cumplir la perturbación aleatoria de un MCRL para la validez (exacta) de las estimaciones y contrastes de su estimación por MCO.

2ª) Interprete el valor estimado para el coeficiente de la variable X (^) 1i. Obtenga para dicho coeficiente una estimación por intervalo del 95% confianza.

3ª) A partir de los datos del histograma de residuos, ¿a qué conclusiones llegaría acerca de la Normalidad de la distribución de la perturbación aleatoria? Plantee el contraste e indique si los datos de que dispone le inducen a deducir si la distribución es o no Normal. ¿Qué consecuencias acarrea el rechazo de la hipótesis nula de este contraste?

4ª) Defina la multicolinealidad y analice su posible presencia en el modelo estimado. Señale las consecuencias prácticas de la presencia de multicolinealidad en un modelo.

5ª) Para analizar la presencia de autocorrelación en el modelo estimado y, suponiendo que se cumplen los requisitos necesarios para su aplicación, ¿Qué método podría utilizar con la información dada? Aplíquelo. Indique las condiciones necesarias para su aplicación y estime el modelo supuesto de generación de las perturbaciones. ¿Es congruente el resultado de este contraste con la naturaleza de los datos empleados en la estimación del modelo? Explíquelo brevemente.

6ª) Se ha decidido estimar nuevamente el modelo eliminando la variable X (^) 3i (Renta familiar neta disponible), obteniéndose el siguiente modelo (modelo 2). Señale las consecuencias para los estimadores de los parámetros del modelo de la eliminación de una variable relevante.

7ª) Para estudiar la existencia de heterocedasticidad en este nuevo modelo (modelo 2) se ha realizado el contraste de White, siendo el valor de la R 2 en la correspondiente regresión auxiliar de 0,340297. Plantee las hipótesis del contraste, señale y calcule el valor de su estadístico experimental y, haciendo uso de toda la información de la que dispone, presente y justifique la correspondiente conclusión.

8ª) Para no excluir totalmente la renta familiar como variable explicativa, se ha pensado en incluirla en el modelo (modelo 2) de la siguiente forma: Se supone que sólo si la renta familiar neta disponible es superior a los 1.000 € tiene un efecto directo o absoluto en el número medio de tratamientos recetados, así como una incidencia relativa cada vez que aumenta la población del grupo de riesgo. ¿Qué tipo de variable podría recoger estos efectos? ¿Cómo se introduciría en el modelo? Exprese, de forma teórica, este nuevo modelo (modelo 3), planteado para recoger la influencia de dicha variable sobre el valor medio de Y.

9ª) Una vez introducida la variable especificada en el apartado anterior, se plantea la duda de si realmente la renta tiene alguna incidencia sobre el valor medio del número de tratamientos. Plantee y resuelva el contraste adecuado para solventar esta duda, teniendo en cuenta que el R 2 de la estimación del modelo donde se ha incluido la nueva variable es 0,9803.

10ª) Por otro lado, tenemos la siguiente información sobre la realización, por medios informáticos, del contraste planteado en el apartado anterior. ¿Qué test se ha aplicado? ¿Obtiene idénticas conclusiones que el realizado por usted? Explíquelo brevemente.

PROBLEMA 29

Se desea analizar el comportamiento de las importaciones de bienes y servicios (variable Y (^) i, en 10^9

euros) en España, en período comprendido entre 1975 y 2012, en relación con el Producto Interior Bruto (variable X (^) 1i, en 10 9 euros), expresados en valores constantes del año 2005, y el Índice de

Tasa de Cambio Real Efectiva (variable X (^) 2i, base 2005=100). Se ofrece el modelo estimado con dichas variables en valores absolutos (modelo 1) y el modelo exponencial linealizado aplicando logaritmo (modelo 2).

Modelo 1 Modelo 2