



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Documento de apuntes de una clase de econometría i del grupo 53 (dade) del 25 de enero de 2011. Contiene preguntas relacionadas con el análisis de variables independientes en economía, como la regresión lineal, el sesgo en la estimación y la multicolinealidad. Además, incluye ejercicios resueltos sobre el análisis de datos de precios de casas y bajas fraudulentas en la sanidad.
Tipo: Exámenes
1 / 5
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




25 de enero de 2011
La mayor o menor oferta de películas y capacidad de los cines La temperatura media y en general las condiciones climatológicas La mayor o menor cantidad de días de fiesta Todas las anteriores
n →∞
β^ ˆ = β
Expresa genéricamente la propiedad de consistencia del estimador Expresa la propiedad de consistencia sólo para los estimadores insesgados Expresa genéricamente la propiedad de insesgadez del un estimador Ninguna de las anteriores
(^) N (^) [0, σ (^2) ] (^) N [ β , σ (^) u^2 ] (^) t [ β , ˜ σ (^) u^2 ( X ' X )−^1 ] (^) N [β , σ~u^2 (X' X)−^1 ]
Wi = β 0 + β 1 ⋅ BLACKi + β 2 ⋅ WHITEi + Ui
El salario medio diferencial de los blancos respecto a los negros El salario medio diferencial de los blancos respecto a los asiáticos El salario medio diferencial de los blancos respecto a la media de los asiáticos y negros El salario medio diferencial de los blancos respecto a la media global
introducir o eliminar en la especificación otras variables más o menos relevantes. En este sentido, ¿cuál de estas situaciones se asocia con un mayor riesgo de sesgo?:
Omitir una variable muy relevante pero sin conexión con las incluidas Omitir una variable poco relevante pero altamente relacionada con las incluidas Omitir una variable muy relevante y altamente relacionada con las incluidas Omitir una variable poco relevante y sin conexión con las incluidas
varianzas, …ojo). Parece que la varianza de un parámetro estimado puede cambiar al introducir o eliminar en la especificación otras variables más o menos relevantes. En este sentido, ¿cuál de estas situaciones se asocia con un mayor incremento de la varianza?
El enunciado no es correcto, no hay una relación evidente entre omisión y varianza Lo importante es no omitir una variable muy relevante (si tiene o no relación con las incluidas no está en relación con el asunto de la varianza) El aumento se produce al omitir una variable muy relevante y sin conexión con las incluidas El aumento se produce al omitir una variable muy relevante y, además, altamente relacionada con las incluidas
σ σ σ^ σ
2 2
ya que se trata de la suma de (n-k) normales (0,1) al cuadrado independientes. Recuérdese que por hipótesis inicial, habíamos asumido que la U se distribuía como una normal (0, σ 2 ).
Esta distribución es trascendente para la determinación de la función de distribución empírica de los parámetros estimados, para la determinación del contraste de significación conjunta F-Snedecor y para el contraste del predictor.
dólares y algunas de sus características: los metros cuadrados (SQRFT), las habitaciones (BDRMS) y si es de arquitectura Colonial (1) o no (0). Los resultados básicos obtenidos son los siguientes:
Dependent Variable: PRICE Method: Least Squares Sample: 1 88 Variable Coefficient Std. Error t-Statistic Prob. C -1784252. 232155.3 -7.685597 0. BDRMS 18950.19 10537.26 1.798398 0. LOG(SQRFT) 240000.0 30000.00 - 0.
R-squared 0.665707 Mean dependent var 3. Adjusted R-squared 0.636383 S.D. dependent var 2. S.E. of regression 1.265304 Akaike info criterion 3. Sum squared resid 91.25661 Schwarz criterion 3. Log likelihood - 101.0652 F-statistic 22. Durbin-Watson stat 2 .068349 Prob(F-statistic) 0. Matriz de correlaciones BAJAS_FRAUDE CAT_LAB EDAD EDUC MESES_EMP SEXO BAJAS_FRAUDE 1 - 0,7006 0,5314 0,1904 0,5316 0, CAT_LAB - 0,7006 1 - 0,3510 - 0,2247 - 0,3502 - 0, EDAD 0,5314 - 0,3510 1 0,0627 0,8654 0,421 3 EDUC 0,1904 - 0,2247 0,0627 1 0,0625 0, MESES_EMP 0,7316 - 0,3502 0,8654 0,0625 1 0, SEXO 0,5613 - 0,3491 0,4213 0,0745 0,4215 1
− Con la información que se suministra ¿incluiría alguna/s modificación/es en la especificación del modelo para mejorar los resultados del mismo? Justifique su respuesta. ¿Cuáles son los resultados que son previsibles obtener con la/s modificación/es adoptada/s?
A la vista de los resultados, sorprende la presencia de varios parámetros no significativamente distintos de cero a pesar de que el modelo explica más 66% de las causas de variación de la endógena. Esto suele ser un claro síntoma de multicolinealidad, que queda probada al observar la alta correlación existente entre las variables “edad” y “meses empleado” (0.8654).
Probablemente, la solución al modelo pasaría por hacer una variable compuesta con estas dos anteriores (un ratio de experiencia años_empleado/edad, por ejemplo) o bien suprimir una de ellas.
Previsiblemente, esta solución cambiará radicalmente la significatividad individual de los parámetros del modelo (al reducir su desviación típica y aumentar el valor de su “t-stastistic”). Es probable que también cambien los signos de algunas de ellas (en la regresión anterior, incorrectos).
− Una vez finalizado el proceso de estimación se ha recibido información de dos nuevos clientes, cuyos datos figuran en la siguiente tabla. ¿Cómo utilizaría esta información recibida para valorar la capacidad predictiva del modelo?
Podríamos calcular el contraste de Janus:
−
=
=−
i
i
n
i n j
i
1
2
2
mala.
− ¿Podría indicar entre qué valores se moverá el número de bajas fraudulentas que solicitará un cliente medio?
Utilizando el contraste del predictor para los valores de la media (estándar):
2
635 2