






Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Estadística i introducció a l'econometria, Profesor: Anna Sanz, Carrera: Dret + ADE, Universidad: UA
Tipo: Ejercicios
1 / 12
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!







EstadÌstica e IntroducciÛn a la EconometrÌa Curso 2012- Ejercicios del Tema 7
Soluciones
1.- Utilizando los datos del Öchero GPA2 del libro de Wooldridge sobre 4137 alumnos universitarios, se estima la siguiente ecuaciÛn
colgpa^ \ = 1 : 392 0 : 0135 hsperc + 0: 00148 sat n = 4137 ; R^2 = 0: 273
donde colgpa es la nota media de la universidad medida sobre una escala de cuatro puntos, hsperc es el percentil que ocupa en la distribuciÛn de caliÖcaciones de los alumnos del instituto que se graduaron el mismo aÒo (deÖnido de forma que, por ejemplo, hsperc = 5 se reÖere al cinco por ciento de los mejores alumnos que se grad˙an), y sat equivale a los resultados conjuntos en matem·ticas y lengua en el test de aptitud escolar. a) øPor quÈ tiene sentido que el coeÖciente de hsperc sea negativo? b) øQuÈ nota media universitaria (colgpa) podemos predecir si hsperc = 20 y sat = 1050? c) Supongamos que dos alumnos, A y B, se grad˙an en el instituto dentro del mismo percentil, pero que el resultado de A en el test SAT de aptitud escolar es 140 puntos m·s alto que el de B (aproximadamente una desviaciÛn est·ndar en la muestra) øQuÈ diferencia podemos predecir entre la nota media universitaria de ambos alumnos? øEs una diferencia importante? d) Si mantenemos hsperc Öjo, øquÈ diferencia en los resultados SAT nos llevarÌa a predecir una diferencia de 0 : 50 (medio punto) en colgpa? Razone la respuesta.
SoluciÛn: a) Tal como esta deÖnido hsperc, cuanto mayor sea el valor de hsperc, peor es la nota del instituto y por tanto, si los restantes factores permanecen constantes, peor cabe esperar que sea la nota de la universidad. b) Utilizando la ecuaciÛn estimada
colgpa^ \ = 1: 392 0 : 0135 20 + 0: 00148 1050 = 2: 676
se predice una nota media de 2 : 676 puntos. c) El modelo estimado predice una diferencia de 0 : 00148 140 = 0: 2072 puntos en la nota media entre de ambos alumnos. La diferencia no es muy importante ya que es menos de un tercio de la desviaciÛn est·ndar de colgpa: d) Para predecir una diferencia de medio punto en la nota de la universidad,
4 colgpa\ = 0:5 = 0: 001484 SAT;
4 SAT =
la diferencia en SAT tendrÌa que ser de 337 : 8 puntos. La diferencia en SAT es muy grande ya que la desviaciÛn est·ndar de SAT en la muestra es 139 : 40.
2.- En base a una muestra de 722 trabajadores (Öchero WAGE2 del libro de Wooldridge) para los que se observa los aÒos de formaciÛn (educ), el n˙mero de hermanos (sibs), los aÒos de formaciÛn del padre (f educ) y los aÒos de formaciÛn de la madre (meduc) se ha obtenido el siguiente modelo estimado:
educ^ d = 10 : 36 0 : 094 sibs + 0: 131 meduc + 0: 210 f educ n = 722 ; R^2 = 0: 214
a) øTiene sibs el efecto esperado? øPor quÈ? Si mantenemos meduc y f educ Öjos, cu·nto tiene que aumentar sibs para reducir en un aÒo el n˙mero medio de aÒos de educaciÛn estimado?. b) Interprete los coeÖcientes estimados de meduc y f educ: c) Supongamos que el individuo A no tiene hermanos y que tanto su padre como su madre tienen 12 aÒos de educaciÛn. El individuo B tampoco tiene hermanos y su padre y su madre tienen 16 aÒos de educaciÛn. øCu·l es la diferencia estimada entre A y B en aÒos de educaciÛn?.
SoluciÛn: a) SÌ, el signo es negativo lo que implica que para un nivel de educaciÛn del padre y la madre Öjos, el tener m·s hermanos disminuye el nivel de educaciÛn. Este hecho puede deberse a que cuantos m·s hermanos haya, menos recursos econÛmicos y menos tiempo podr·n dedicar los padres a cada hijo. Seg˙n el modelo estimado, si mantenemos meduc y f educ Öjos y aumentamos en 10 : 6 el n˙mero de hermanos, los aÒos de educaciÛn disminuirÌan en 0 : 094 10 : 6 ' 1 aÒo, y por tanto el efecto es pequeÒo. b) Cuando el nivel de educaciÛn de la madre aumenta en 1 aÒo (manteniendo constante los aÒos de educaciÛn del padre y el n˙mero de hermanos) el nivel de educaciÛn del hijo aumenta en 0.131 aÒos, 48 dÌas aproximadamente. Cuando el nivel de educaciÛn del padre aumenta en 1 aÒo (manteniendo constante los aÒos de educaciÛn de la madre y el n˙mero de hermanos) el nivel de educaciÛn del hijo aumenta en 0.21 aÒos, 77 dÌas aproximadamente. Seg˙n este resultado, un aumento en el n˙mero de aÒos de educaciÛn del padre tiene mayor efecto que el mismo aumento en el n˙mero de aÒos de educaciÛn de la madre. c) El modelo predice que el individuo A tendr· 1 : 36 ( 0 : 131 4+0: 210 4 = 1 : 364 ) aÒos de educaciÛn menos que el individuo B.
3.- Considere el siguiente modelo que relaciona el tiempo dedicado a dormir y el dedicado a trabajar, junto a otros factores que afectan el sueÒo:
sleep = 0 + 1 torwrk + 2 educ + 3 age + u
donde el tiempo dedicado a dormir (sleep) y el tiempo total de trabajo (totwrk) se miden en minutos por semana y el nivel de educaciÛn (educ) y la edad (age) se miden en aÒos.
4.- El salario inicial mediano de los reciÈn titulados en derecho en universidades de Estados Unidos se determina por:
log(salary) = 0 + 1 LSAT + 2 GP A + 3 log(libvol) + 4 log(cost) + 5 rank + u
donde salary es salario inicial mediano de los alumnos que se grad˙an ese aÒo, LSAT es la mediana de los resultados de un test y GP A la nota media en la universidad para ese mismo grupo de alumnos, libvol es el n˙mero de vol˙menes de la biblioteca de la facultad de derecho, cost es el coste anual de estudiar en la facultad de derecho y rank es la posiciÛn que la facultad de derecho ocupa en el ranking de facultades de derecho de Estados Unidos (siendo rank = 1 la mejor). a) Explique por quÈ cabe esperar que 5 0 : b) øQuÈ signo cabe esperar para los dem·s par·metros de pendiente?. Razone la respuesta. c) Utilizando los datos del Öchero LAWSCH85 del libro de Wooldridge, la ecuaciÛn estimada es
log(^ \salary) = 8 :34 + 0: 0047 LSAT + 0: 248 GP A + 0:095 log(libvol) +0:38 log(cost) 0 : 0033 rank n = 136 ; R^2 = 0: 842
øCu·l es la diferencia salarial estimada entre facultades en las que la nota mediana GP A diÖere en un punto siendo iguales el resto de las caracterÌsticas incluidas en el modelo?. d) Interprete el coeÖciente de log(libvol): e) øSerÌa m·s recomendable ir a una facultad de derecho con un ranking mejor? øEn cu·nto se ve afectado el salario inicial mediano por una diferencia de 20 puestos en el ranking?.
SoluciÛn: a) Cabe esperar que cuanto mejor sea la facultad mayor sea el salario inicial de los licenciados por esa facultad. Por tanto como cuanto mejor es la facultad menor es el valor de la variable rank, cabe esperar que el signo de su coeÖciente sea negativo. b) Cabe esperar que los signos de las pendientes restantes sean positivos. El motivo es que la restantes variables est·n relacionadas positivamente con la calidad de la facultad o de sus estudiantes y por tanto todas ellas tendr·n un efecto positivo en el salario mediano de los titulados. c) La diferencia salarial estimada entre facultades en las que la nota mediana GP A diÖere en un punto siendo iguales el resto de las caracterÌsticas incluidas en el modelo es un 24 :8%: d) Es una elasticidad y por tanto si el volumen de libros de la biblioteca aumenta un 1%; el salario mediano de los titulados aumenta un 0 :095%:
e) SÌ, serÌa recomendable ir a una facultad de derecho con un ranking mejor, ya que cuanto mejor es el ranking menor es el valor de la variable rank y por tanto mayor es el salario. Si dos facultades se diferenciaran en 20 puestos en el ranking siendo el resto de los factores iguales, el salario mediano de la que ocupa la mejor posiciÛn serÌa un 6 :6% mayor ( 100 20 0 :0033 = 6: 6 ).
5.- En un estudio que relaciona la nota media universitaria con el tiempo dedicado a diversas actividades, se distribuye una encuesta entre un grupo de estudiantes en la que se les pregunta cu·ntas horas a la semana emplean en cuatro actividades: estudiar, dormir, trabajar y ocio. Cualquier actividad debe incluirse en una de las cuatro categorÌas, de forma que las cuatro actividades suman 168 horas para cada estudiante: a) En el modelo
GP A = 0 + 1 study + 2 sleep + 3 work + 4 leisure + u
øtiene sentido mantener Öjos sleep (sueÒo), work (trabajo) y leisure (ocio), y modiÖcar study (estudio)? b) Explique por quÈ este modelo viola el supuesto RLM.4. c) øCÛmo se podrÌa reformular el modelo para que los par·metros tengan una interpretaciÛn ˙til y se satisfaga el supuesto RML.4?.
SoluciÛn: a) No tiene sentido mantener Öjos sleep, work y leisure, y modiÖcar study, ya que sleep + work + leisure + study = 168; y por tanto, si el tiempo dedicado a una de las actividades cambia, al menos tiene que cambiar el tiempo dedicado a una de las otras actividades de forma que la suma sea 168. b) Hay colinealidad perfecta ya que podemos escribir una de las variables, por ejemplo study; como funciÛn lineal de las restantes variables: study = 168 sleep work leisure c) PodrÌamos eliminar una de las actividades (por ejemplo las horas dedicadas al sueÒo) de la ecuaciÛn y considerar el modelo
GP A = 0 + 1 study + 2 work + 3 leisure + u
AsÌ el par·metro 1 medirÌa el aumento esperado en la nota media ante un aumento de una hora en las horas de estudio manteniendo constante las horas de trabajo y ocio, asÌ como los dem·s factores que ináuyen en la nota media y que est·n recogidos en u. Al mantener constante las horas de trabajo y ocio, el aumento en las horas de estudio debe ser a costa de disminuir las horas de sueÒo.
6.- Supongamos que la productividad media de los trabajadores en una f·brica (avgprod) depende de dos factores, el n˙mero medio de horas de participaciÛn de los trabajadores en un programa de formaciÛn (avgtrain) y la habilidad media de los trabajadores (avgabil):
avgprod = 0 + 1 avgtrain + 2 avgabil + u
b) nox y rooms pueden estar negativamente correlacionadas ya que cuantas m·s habitaciones tengan las casas mejores ser·n en general y por tanto los sistemas de calefacciÛn probablemente contaminar·n menos. TambiÈn cuantas m·s habitaciones tengan las casas es m·s probable que estÈn m·s separadas entre sÌ y por tanto la contaminaciÛn debida al tr·Öco tambiÈn ser· menor. Si nox y rooms est·n correlacionadas negativamente, puesto que el signo de rooms ser· positivo, la regresiÛn simple de log(price) sobre log(nox) producir· un estimador de 1 con sesgo negativo. NÛtese que puesto que 1 es negativo y el sesgo es negativo, la regresiÛn simple de log(price) sobre log(nox) sobreestimar· el efecto negativo de la contaminaciÛn
c) Efectivamente obtenemos lo que cabÌa esperar, el coeÖciente estimado de la regresiÛn m˙ltiple es negativo, 0 : 718 , y el de la regresiÛn simple es todavÌa m·s negativo, 1 : 043.
8.- Un problema que interesa a las autoridades sanitarias (entre otros) es el de determinar los efectos que tiene la costumbre de fumar durante el embarazo sobre la salud del reciÈn nacido. Una medida de la salud del reciÈn nacido es su peso: si un reciÈn nacido pesa poco al nacer aumenta el riesgo de que contraiga diversas enfermedades. Como existen otros factores, adem·s del tabaco, que pueden afectar el peso del reciÈn nacido, y Èstos suelen estar correlacionados con el tabaco, deberÌamos tenerlos en cuenta. Por ejemplo, una renta m·s alta se traduce generalmente en un mejor acceso a los cuidados prenatales, asÌ como en una mejor alimentaciÛn de la madre. Consider entonces la siguiente ecuaciÛn
bwght = 0 + 1 cigs + 2 f aminc + u;
donde bwght es el peso al nacer del bebÈ, f aminc es la renta familiar y cigs mide el consumo de tabaco de la madre durante el embarazo. a) øCu·l podemos esperar que sea el signo m·s probable de 2? b) øEs probable que cigs y f aminc estÈn correlacionados? Explique por quÈ la correlaciÛn puede ser positiva o negativa. c) Estime ahora la ecuaciÛn con y sin f aminc, utilizando los datos del Öchero de BWGHT del libro de Wooldridge. Presente los resultados en forma de ecuaciÛn, incluyendo los errores est·ndar, el tamaÒo de la muestra y el R-cuadrado. Comente los resultados, centr·ndose en si el aÒadir f aminc cambia de manera sustancial el efecto estimado de cigs sobre bwght (nÛtese que bwght est· medido en onzas (1 onza es aproximadamente 28.35 gramos), cigs en cigarrillos al dÌa y f aminc es la renta anual en miles de dÛlares).
SoluciÛn: a) Cabe esperar que 2 sea positivo ya que una renta m·s alta se traduce generalmente en un mejor acceso a los cuidados prenatales, asÌ como en una mejor alimentaciÛn de la madre y por tanto en un mayor peso del bebÈ. b) cigs y f aminc puede que estÈn correlacionados. Si el consumo de cigarrillos es un bien normal cabrÌa esperar que a mayor renta mayor consumo y
por tanto que la correlaciÛn fuese positiva. Por otra parte, a mayor renta mayor nivel de educaciÛn y por tanto cabe esperar que mejor informada estÈ la madre sobre el peligro que conlleva fumar durante el embarazo, lo que implicarÌa una correlaciÛn negativa. c)
Model 1: OLS, using observations 1- 1388 Dependent variable: bwght
const 116.974 1.04898 111.5 0.0 000 *** cigs - 0.463408 0.0915768 - 5.060 4.75e-07 *** faminc 0.0927647 0.0291879 3.178 0.0015 ***
Mean dependent var 118.6996 S.D. dependent var 0. Sum squared resid 557485.5 S.E. of regression 20. R-squared 0.029805 Adjusted R-squared 0. F(2, 1385) 21.27392 P-value(F) 7.94e- 10
Model 2: OLS, using observations 1- 1388 Dependent variable: bwght
const 119.772 0.572341 209.3 0.0000 *** cigs - 0.513772 0.0904909 - 5.678 1.66e-08 ***
Mean dependent var 118.6996 S.D. dependent var 20. Sum squared resid 561551.3 S.E. of regression 20. R-squared 0.022729 Adjusted R-squared 0. F(1, 1386) 32.23524 P-value(F) 1.66e- 08
bwght^ \ = 116 : 97 (1:049)
(0:092)
cigs + 0: 093 (0:029)
f aminc
n = 1388 ; R^2 = 0: 030
bwght^ \ = 119 : 77 (0:572)
(0:090)
cigs
n = 1388 ; R^2 = 0: 023
price[ = 19 : 32 (31:05)
(0:014)
sqrf t + 15: 20 (9:48)
bdrms
n = 88 ; R^2 = 0: 632
b) El aumento estimado en el precio de una vivienda de un dormitorio adicional, si mantenemos Öja la superÖcie de la vivienda es 15200 dÛlares. c) El aumento estimado en el precio de una vivienda de un dormitorio adicional de una superÖcie aproximada de 140 pies cuadrados es 33120 dÛlares ( 0 : 128 140 + 15:20 = 33:12), m·s del doble que en el apartado b. El motivo por el que el efecto es mayor es que en el apartado anterior el tamaÒo de la vivienda permanecÌa constante y en este apartado aumenta. d) La superÖcie y el n˙mero de dormitorios explican un 63 :2% de la variaciÛn en el precio. e)
price^ [ = 19 :32 + 0: 128 2438 + 15: 20 4 = 353: 544
El precio de venta estimado para esta vivienda es 353 ; 544 dÛlares. f) El residuo para esta vivienda es price price[ = 300 353 :544 = 53 : 544 ; lo que sugiere que el comprador pagÛ un precio demasiado bajo por la vivienda.
10.- El Öchero CEOSAL2 del libro de Wooldridge contiene datos sobre 177 directores generales que pueden usarse para examinar el efecto que tiene el rendimiento empresarial sobre el salario de los directores generales. a) Estime un modelo que relacione el salario (salary) con las ventas de la compaÒÌa (sales) y el valor de mercado (mktval). EspeciÖque el modelo para que sea un modelo de elasticidad constante para ambas variables independientes y presente los resultados en forma de ecuaciÛn. b) AÒada prof its al modelo del apartado a. øPor quÈ no se puede incluir esta variable en logaritmos? øExplican estas variables del rendimiento empresarial la mayor parte de la variaciÛn en los salarios de los directores generales? c) AÒada la variable ceoten (aÒos como director general en la empresa) al modelo del apartado b. øCu·l es el porcentaje de rendimiento estimado para cada aÒo extra de permanencia en la empresa del director general, si mantenemos Öjos el resto de los factores? d) Calcule el coeÖciente de correlaciÛn muestral entre las variables log(mktual) y prof its. øEst·n estas variables estrechamente relacionadas? øQuÈ nos dice esto acerca de los estimadores MCO?
SoluciÛn: a)
Model 1: OLS, using observations 1- 177 Dependent variable: l_salary
const 4.62092 0.254408 18.16 4.95e-042 *** l_sales 0.162128 0.0396703 4.087 6.67e-05 *** l_mktval 0.106708 0.0501240 2.129 0.0347 **
Mean dependent var 6.582848 S.D. dependent var 0. Sum squared resid 45.30965 S.E. of regression 0. R-squared 0.299114 Adjusted R-squared 0. F(2, 174) 37.12853 P-value(F) 3.73e- 14
log(\salary) = 4 : 62 (0:254)
(0:040)
log(sales) + 0: 107 (0:050)
log(mktval)
n = 177 ; R^2 = 0: 299
b)
Model 2: OLS, using observations 1- 177 Dependent variable: l_salary
const 4.68692 0.379729 12.34 1.65e-025 *** l_sales 0.161368 0.0399101 4.043 7.92e-05 *** l_mktval 0.0975286 0.0636886 1.531 0. profits 3.56601e- 05 0.000151960 0.2347 0.
Mean dependent var 6.582848 S.D. dependent var 0. Sum squared resid 45.29524 S.E. of regression 0. R-squared 0.299337 Adjusted R-squared 0. F(3, 173) 24.63629 P-value(F) 2.53e- 13
log(^ \salary) = 4 : 69 (0:380)
(0:040)
log(sales) + 0: 098 (0:064)
log(mktval) + 0: 000036 (0:00015)
prof its
n = 177 ; R^2 = 0: 299
No se puede incluir prof its en logaritmos ya que esta variable toma valores negativos. El efecto de prof its sobre el salario es muy pequeÒo, ya que, manteniendo