Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Econometría I: Análisis de Variables Independientes en Economía - Prof. de Arce, Exámenes de Econometría

Documento de apuntes de una clase de econometría i del grupo 53 (dade) del 25 de enero de 2011. Contiene preguntas relacionadas con el análisis de variables independientes en economía, como la regresión lineal, el sesgo en la estimación y la multicolinealidad. Además, incluye ejercicios resueltos sobre el análisis de datos de precios de casas y bajas fraudulentas en la sanidad.

Tipo: Exámenes

2010/2011

Subido el 31/12/2010

cristinacc96
cristinacc96 🇪🇸

2 documentos

1 / 5

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ECONOMETRÍA I
GRUPO 53 (DADE)
25 de enero de 2011
NOMBRE: ____________________________________________________
DNI: _____________
1. ¿Qué variable parece adecuado utilizar en un modelo de regresión para explicar el
porcentaje de abandono escolar de los estudiantes a nivel nacional en España entre
1995 y 2010?:
Género de los estudiantes
Edad de los estudiantes
Presupuesto destinado a educación
Distribución de inmigrantes por CCAA
2. Si deseamos medir las variables que explican la mayor o menor afluencia anual de
espectadores al cine en España en los últimos 10 años, conviene considerar:
La mayor o menor oferta de películas y capacidad de los cines
La temperatura media y en general las condiciones climatológicas
La mayor o menor cantidad de días de fiesta
Todas las anteriores
3.
En el marco del modelo básico de regresión lineal, la expresión
lim
n
ˆ
β
=
β
Expresa genéricamente la propiedad de consistencia del estimador
Expresa la propiedad de consistencia sólo para los estimadores insesgados
Expresa genéricamente la propiedad de insesgadez del un estimador
Ninguna de las anteriores
4. Los parámetros estimados en el marco de un MBRL aleatoria siguen una distribución:
N0,
σ
2
[
]
N
β
,
σ
u
2
[
]
t
β
,˜
σ
u
2
(X'X)
1
[
]
[
]
12
)'(
~
,
XXN
u
σβ
5. Imagine que utiliza, para una muestra con blancos, negros y asiáticos, DOS variables
exógenas dicotómicas (0,1) para representar la raza NEGRA (Black=1) y la raza
BLANCA (WHITE=1) y analizar así el efecto de estas dos razas sobre los salarios (W):
i
=
β
0
+
β
1
BLACK
i
+
β
2
WHITE
i
+
U
i
6. ¿Qué cree que representará el parámetro estimado para la exógena WHITE (0,1)?:
El salario medio diferencial de los blancos respecto a los negros
El salario medio diferencial de los blancos respecto a los asiáticos
El salario medio diferencial de los blancos respecto a la media de los asiáticos y negros
El salario medio diferencial de los blancos respecto a la media global
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Econometría I: Análisis de Variables Independientes en Economía - Prof. de Arce y más Exámenes en PDF de Econometría solo en Docsity!

ECONOMETRÍA I

GRUPO 53 (DADE)

25 de enero de 2011

NOMBRE: ____________________________________________________

DNI: _____________

  1. ¿Qué variable parece adecuado utilizar en un modelo de regresión para explicar el porcentaje de abandono escolar de los estudiantes a nivel nacional en España entre 1995 y 2010?:  Género de los estudiantes  Edad de los estudiantes  Presupuesto destinado a educación  Distribución de inmigrantes por CCAA
  2. Si deseamos medir las variables que explican la mayor o menor afluencia anual de espectadores al cine en España en los últimos 10 años, conviene considerar:

 La mayor o menor oferta de películas y capacidad de los cines  La temperatura media y en general las condiciones climatológicas  La mayor o menor cantidad de días de fiesta  Todas las anteriores

3. En el marco del modelo básico de regresión lineal, la expresión lim

n →∞

β^ ˆ = β

 Expresa genéricamente la propiedad de consistencia del estimador  Expresa la propiedad de consistencia sólo para los estimadores insesgados  Expresa genéricamente la propiedad de insesgadez del un estimador  Ninguna de las anteriores

  1. Los parámetros estimados en el marco de un MBRL aleatoria siguen una distribución:

 (^) N (^) [0, σ (^2) ]  (^) N [ β , σ (^) u^2 ]  (^) t [ β , ˜ σ (^) u^2 ( X ' X )−^1 ]   (^) N [β , σ~u^2 (X' X)−^1 ]

  1. Imagine que utiliza, para una muestra con blancos, negros y asiáticos, DOS variables exógenas dicotómicas (0,1) para representar la raza NEGRA (Black=1) y la raza BLANCA (WHITE=1) y analizar así el efecto de estas dos razas sobre los salarios (W):

Wi = β 0 + β 1 ⋅ BLACKi + β 2 ⋅ WHITEi + Ui

  1. ¿Qué cree que representará el parámetro estimado para la exógena WHITE (0,1)?:

 El salario medio diferencial de los blancos respecto a los negros  El salario medio diferencial de los blancos respecto a los asiáticos  El salario medio diferencial de los blancos respecto a la media de los asiáticos y negros  El salario medio diferencial de los blancos respecto a la media global

  1. Parece claro que el sesgo en la estimación MCO de un parámetro depende de

introducir o eliminar en la especificación otras variables más o menos relevantes. En este sentido, ¿cuál de estas situaciones se asocia con un mayor riesgo de sesgo?:

 Omitir una variable muy relevante pero sin conexión con las incluidas  Omitir una variable poco relevante pero altamente relacionada con las incluidas  Omitir una variable muy relevante y altamente relacionada con las incluidas  Omitir una variable poco relevante y sin conexión con las incluidas

  1. Volvemos a plantear la pregunta que hicimos más arriba, (pero ahora con las

varianzas, …ojo). Parece que la varianza de un parámetro estimado puede cambiar al introducir o eliminar en la especificación otras variables más o menos relevantes. En este sentido, ¿cuál de estas situaciones se asocia con un mayor incremento de la varianza?

 El enunciado no es correcto, no hay una relación evidente entre omisión y varianza  Lo importante es no omitir una variable muy relevante (si tiene o no relación con las incluidas no está en relación con el asunto de la varianza)  El aumento se produce al omitir una variable muy relevante y sin conexión con las incluidas  El aumento se produce al omitir una variable muy relevante y, además, altamente relacionada con las incluidas

  1. ¿Cómo se distribuye la suma cuadrática de los errores del modelo dividida por las varianza de las perturbaciones aleatorias? ¿Qué trascendencia tiene esta distribución para la validación del MBRL?

σ σ σ^ σ

2 2

U

M

e e UMU U

ya que se trata de la suma de (n-k) normales (0,1) al cuadrado independientes. Recuérdese que por hipótesis inicial, habíamos asumido que la U se distribuía como una normal (0, σ 2 ).

Esta distribución es trascendente para la determinación de la función de distribución empírica de los parámetros estimados, para la determinación del contraste de significación conjunta F-Snedecor y para el contraste del predictor.

  1. Un determinado modelo estima la relación entre el precio de las casas (PRICE) en

dólares y algunas de sus características: los metros cuadrados (SQRFT), las habitaciones (BDRMS) y si es de arquitectura Colonial (1) o no (0). Los resultados básicos obtenidos son los siguientes:

Dependent Variable: PRICE Method: Least Squares Sample: 1 88 Variable Coefficient Std. Error t-Statistic Prob. C -1784252. 232155.3 -7.685597 0. BDRMS 18950.19 10537.26 1.798398 0. LOG(SQRFT) 240000.0 30000.00 - 0.

EDAD - 4.182195 2.380640 - 1.756753 0.

EDUC 0.023432 0.045867 0.510876 0.

MESES_EMP 2.109676 1.191958 1.769924 0.

SEXO 1.128607 0.367181 3.073704 0.

C 2.194078 0.739191 2.968216 0.

R-squared 0.665707 Mean dependent var 3. Adjusted R-squared 0.636383 S.D. dependent var 2. S.E. of regression 1.265304 Akaike info criterion 3. Sum squared resid 91.25661 Schwarz criterion 3. Log likelihood - 101.0652 F-statistic 22. Durbin-Watson stat 2 .068349 Prob(F-statistic) 0. Matriz de correlaciones BAJAS_FRAUDE CAT_LAB EDAD EDUC MESES_EMP SEXO BAJAS_FRAUDE 1 - 0,7006 0,5314 0,1904 0,5316 0, CAT_LAB - 0,7006 1 - 0,3510 - 0,2247 - 0,3502 - 0, EDAD 0,5314 - 0,3510 1 0,0627 0,8654 0,421 3 EDUC 0,1904 - 0,2247 0,0627 1 0,0625 0, MESES_EMP 0,7316 - 0,3502 0,8654 0,0625 1 0, SEXO 0,5613 - 0,3491 0,4213 0,0745 0,4215 1

− Con la información que se suministra ¿incluiría alguna/s modificación/es en la especificación del modelo para mejorar los resultados del mismo? Justifique su respuesta. ¿Cuáles son los resultados que son previsibles obtener con la/s modificación/es adoptada/s?

A la vista de los resultados, sorprende la presencia de varios parámetros no significativamente distintos de cero a pesar de que el modelo explica más 66% de las causas de variación de la endógena. Esto suele ser un claro síntoma de multicolinealidad, que queda probada al observar la alta correlación existente entre las variables “edad” y “meses empleado” (0.8654).

Probablemente, la solución al modelo pasaría por hacer una variable compuesta con estas dos anteriores (un ratio de experiencia años_empleado/edad, por ejemplo) o bien suprimir una de ellas.

Previsiblemente, esta solución cambiará radicalmente la significatividad individual de los parámetros del modelo (al reducir su desviación típica y aumentar el valor de su “t-stastistic”). Es probable que también cambien los signos de algunas de ellas (en la regresión anterior, incorrectos).

− Una vez finalizado el proceso de estimación se ha recibido información de dos nuevos clientes, cuyos datos figuran en la siguiente tabla. ¿Cómo utilizaría esta información recibida para valorar la capacidad predictiva del modelo?

BAJAS_FRAUDE CAT_LAB EDAD EDUC MESES_EMP SEXO

BAJAS_

EXTR_EST ERROR_EXTRM

4 0 32 12 56 1 - 12.084515^ 16.

3 0 26 6 14 0 - 76.866936^ 79.

Podríamos calcular el contraste de Janus:

=

=−

= n j

i

i

n

i n j

i

e

n j

j e

J

1

2

2

J = = La conclusión es que el modelo haría una predicción francamente

mala.

− ¿Podría indicar entre qué valores se moverá el número de bajas fraudulentas que solicitará un cliente medio?

Utilizando el contraste del predictor para los valores de la media (estándar):

ε σ ε σ = −^ ε

+ −^ − + < + < + + − + )^1

Pr ˆ ˆ ( 1

2 2 n

y y t

n

y nh tnk nh nh n k

ε ε = −^ ε

− −^ + < + < + − + ) 1

Pr 3 , 98 1 , 26 ( 1 635

2

635 2

t ynh t