Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis de heterocedasticidad en un modelo de regresión, Ejercicios de Administración de Empresas

La práctica 6 de la asignatura de econometría de 2º de grado en la que se estudia la heterocedasticidad en un modelo de regresión de gasto en alimentación en función de renta, estudios y número de hijos en una muestra de 100 hogares españoles. Se realiza un análisis gráfico y formal de la heterocedasticidad, se prueba la existencia de heterocedasticidad multiplicativa y se estima el modelo teniendo en cuenta la existencia de heterocedasticidad.

Tipo: Ejercicios

2012/2013

Subido el 13/12/2013

noelia3791
noelia3791 🇪🇸

2 documentos

1 / 7

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ECONOMETRÍA – 2º GADE
Prof.: Begoña Álvarez García (despacho 337)
Práctica 6: Heterocedasticidad
En el fichero alim.shd tenemos una muestra de 100 hogares españoles para los cuales observamos las
siguientes variables: galim, gasto semestral en alimentación (euros); renta, renta semestral del hogar
(euros); estudios, nivel de estudios del cabeza de familia (toma valores de 1 a 8); nhijos, número de
hijos (toma valores de 1 a 3).
1. Estima el siguiente modelo por MCO y guarda los residuos y los valores predichos. Crea una nueva
variable que contenga los residuos al cuadrado.
galimi = β0 + β1 rentai + β2 estudiosi + β3 nhijosi + εi t=1,…, 100
ols galim renta estudios nhijos / resid=e predict=ye
genr resid2=resid**2
REQUIRED MEMORY IS PAR 10
CURRENT PAR 22480
OLS ESTIMATION
100 OBSERVATIONS DEPENDENT VARIABLE GALIM
...NOTE..SAMPLE RANGE SET TO: 1, 100
R-SQUARE 0.3782
R-SQUARE ADJUSTED 0.3587
VARIANCE OF THE ESTIMATE-SIGMA**2 0.41971E+06
STANDARD ERROR OF THE ESTIMATE-SIGMA 647.85
SUM OF SQUARED ERRORS-SSE 0.40292E+08
MEAN OF DEPENDENT VARIABLE 1639.6
LOG OF THE LIKELIHOOD FUNCTION -787.218
MODEL SELECTION TESTS - SEE JUDGE ET AL. (1985,P.242)
AKAIKE (1969) FINAL PREDICTION ERROR - FPE 0.43649E+06
(FPE IS ALSO KNOWN AS AMEMIYA PREDICTION CRITERION - PC)
AKAIKE (1973) INFORMATION CRITERION - LOG AIC 12.986
SCHWARZ (1978) CRITERION - LOG SC 13.091
MODEL SELECTION TESTS - SEE RAMANATHAN (1998,P.165)
CRAVEN-WAHBA (1979)
GENERALIZED CROSS VALIDATION - GCV 0.43719E+06
HANNAN AND QUINN (1979) CRITERION 0.45528E+06
RICE (1984) CRITERION 0.43795E+06
SHIBATA (1981) CRITERION 0.43515E+06
SCHWARZ (1978) CRITERION - SC 0.48441E+06
AKAIKE (1974) INFORMATION CRITERION - AIC 0.43648E+06
ANALYSIS OF VARIANCE - FROM MEAN
SS DF MS F
REGRESSION 0.24505E+08 3. 0.81682E+07 19.462
ERROR 0.40292E+08 96. 0.41971E+06
P-VALUE
TOTAL 0.64797E+08 99. 0.65451E+06 0.000
ANALYSIS OF VARIANCE - FROM ZERO
SS DF MS F
REGRESSION 0.29332E+09 4. 0.73330E+08 174.718
ERROR 0.40292E+08 96. 0.41971E+06
P-VALUE
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Análisis de heterocedasticidad en un modelo de regresión y más Ejercicios en PDF de Administración de Empresas solo en Docsity!

ECONOMETRÍA – 2º GADE

Prof.: Begoña Álvarez García (despacho 337)

Práctica 6: Heterocedasticidad

En el fichero alim.shd tenemos una muestra de 100 hogares españoles para los cuales observamos las

siguientes variables: galim , gasto semestral en alimentación (euros); renta , renta semestral del hogar

(euros); estudios , nivel de estudios del cabeza de familia (toma valores de 1 a 8); nhijos, número de

hijos (toma valores de 1 a 3).

1. Estima el siguiente modelo por MCO y guarda los residuos y los valores predichos. Crea una nueva

variable que contenga los residuos al cuadrado.

galimi = β 0 + β 1 renta (^) i + β 2 estudios (^) i + β 3 nhijos (^) i + εi t=1,…, 100

ols galim renta estudios nhijos / resid=e predict=ye

genr resid2=resid**

REQUIRED MEMORY IS PAR 10

CURRENT PAR 22480

OLS ESTIMATION

100 OBSERVATIONS DEPENDENT VARIABLE GALIM

...NOTE..SAMPLE RANGE SET TO: 1, 100

R-SQUARE 0.

R-SQUARE ADJUSTED 0.

VARIANCE OF THE ESTIMATE-SIGMA**2 0.41971E+

STANDARD ERROR OF THE ESTIMATE-SIGMA 647.

SUM OF SQUARED ERRORS-SSE 0.40292E+

MEAN OF DEPENDENT VARIABLE 1639.

LOG OF THE LIKELIHOOD FUNCTION -787.

MODEL SELECTION TESTS - SEE JUDGE ET AL. (1985,P.242)

AKAIKE (1969) FINAL PREDICTION ERROR - FPE 0.43649E+

(FPE IS ALSO KNOWN AS AMEMIYA PREDICTION CRITERION - PC)

AKAIKE (1973) INFORMATION CRITERION - LOG AIC 12.

SCHWARZ (1978) CRITERION - LOG SC 13.

MODEL SELECTION TESTS - SEE RAMANATHAN (1998,P.165)

CRAVEN-WAHBA (1979)

GENERALIZED CROSS VALIDATION - GCV 0.43719E+

HANNAN AND QUINN (1979) CRITERION 0.45528E+

RICE (1984) CRITERION 0.43795E+

SHIBATA (1981) CRITERION 0.43515E+

SCHWARZ (1978) CRITERION - SC 0.48441E+

AKAIKE (1974) INFORMATION CRITERION - AIC 0.43648E+

ANALYSIS OF VARIANCE - FROM MEAN

SS DF MS F

REGRESSION 0.24505E+08 3. 0.81682E+07 19.

ERROR 0.40292E+08 96. 0.41971E+06 P-VALUE

TOTAL 0.64797E+08 99. 0.65451E+06 0.

ANALYSIS OF VARIANCE - FROM ZERO

SS DF MS F

REGRESSION 0.29332E+09 4. 0.73330E+08 174.

ERROR 0.40292E+08 96. 0.41971E+06 P-VALUE

ANALYSIS OF VARIANCE - FROM ZERO

SS DF MS F

TOTAL 0.33361E+09 100. 0.33361E+07 0.

Variable Name

Estimated Coefficient

Standard Error T-Ratio

p- Value ( 96 DF)

Partial Correlation

Standardised Coefficient

Elasticity at Means

RENTA 0.12984 0.1887E-01 6.881 0.000 0.575 0.5828 0.

ESTUDIOS -2.7384 56.14 -0.4878E-01 0.961 -0.005 -0.0041 -0.

NHIJOS 197.25 93.27 2.115 0.037 0.211 0.1711 0.

CONSTANT 568.07 247.3 2.297 0.024 0.228 0.0000 0.

2. A continuación, vamos a hacer la diagnosis gráfica del modelo para tratar de detectar evidencias sobre

la existencia de heterocedasticidad. Para ello, haz los siguientes gráficos:

  • Gráfico de los residuos frente a los valores predichos
  • Gráfico de residuos al cuadrado frente a los valores predichos
    • Gráfico de residuos al cuadrado frente a la renta.

Estadístico de contraste que calcula SHAZAM:

1 (^02) 2 2

/ n

bajoH sedistribuyeFn

SCE n

SCE n

F =

Donde n 1 es el número de observaciones de la primera submuestra y n 2 las observaciones de la segunda

submuestra. En este caso, como hemos dividido la muestra original en dos partes iguales y le hemos

quitado las 20 observaciones del medio (repartidas entre ambas submuestras), n 1 =n 2 =36.

El valor empírico del estadístico es F*=0.1866 y el p-valor=0.000, por tanto rechazamos la hipótesis de

homocedasticidad y, por tanto, tenemos evidencia de que existe heterocedasticidad que depende de la

renta.

*NOTA: Aunque el estadístico de contraste G-Q que habéis visto en clase tiene la expresión anterior, si

consultáis manuales de econometría veréis lo siguiente. Cuando hay sospecha de que la varianza de las

perturbaciones crece con los valores de una variable x, la expresión del estadístico que se utiliza es

2 (^01) 1 1

/ n

bajoH sedistribuyeFn

SCE n

SCE n

F =

De modo que, si existe heterocedasticidad creciente con los valores de x, el valor empírico del estadístico

de contraste será muy grande (porque la suma de cuadrados de los residuos de la segunda submuestra

será mayor que el correspondiente a la primera submuestra), lo cual nos conduce al rechazo de H0. Este

sería el caso del ejercicio. De hecho, cuando SHAZAM calcula el p-valor del contraste, utiliza esta

expresión del estadístico.

Cuando se sospecha que la heterocedasticidad decrece con los valores de la x, se utiliza

1 (^02) 2 2

/ n

bajoH sedistribuyeFn

SCE n

SCE n

F =

De modo que, si existe heterocedasticidad decreciente con los valores de x, el valor empírico del

estadístico de contraste será muy grande, lo cual nos conduce al rechazo de H0.

Es decir, el estadístico G-Q siempre se calcula para que, si hay heterocedasticidad, el estadístico de

contraste me dé valores grandes.

b) ¿Existe un modelo de heterocedasticidad multiplicativo en las variables explicativas? Escribe la

hipótesis nula, la alternativa y el estadístico de contrastes.

H0: σt

2

2

para todo t

H1: σt

2

=exp(α 0 + α 1 x1t + α 1 x2t +…+ α 1 xkt)

Por tanto, la regresión auxiliar que se utiliza para calcular el estadístico de contraste será la siguiente:

log(e t

2

) = α 0 + α 1 x1t + α 1 x2t +…+ α 1 xkt + νt

log(e t

2

) = α 0 + α 1 renta t + α 1 estudios t +…+ α 1 nhijos t + νt

donde e t

2

sustituye a σt

2

(que es inobservable). Además, hemos linealizado el modelo tomando

logaritmos en ambos miembros de la expresión, para que podamos estimarlo por OLS y hemos añadido

un término de error νt que es ruido blanco. De esta regresión, sólo nos interesa el R

2

El estadístico de contraste será

nR

2 ,

que, bajo H0, se distribuye χp

2

, siendo p el número de variables explicativas de la regresión auxiliar

(=3 en este ejercicio)

diagnos / het

diagnos / het REQUIRED MEMORY IS PAR= 26 CURRENT PAR= 22480 DEPENDENT VARIABLE = GALIM 100 OBSERVATIONS REGRESSION COEFFICIENTS 0.129839855238 -2.73837791468 197.253527571 568. HETEROSKEDASTICITY TESTS CHI-SQUARE D.F. P-VALUE TEST STATISTIC LOG(E**2) ON X (HARVEY) TEST: 12.117 3 0.

El valor empírico del estadístico es 12.11, y el p-valor=0.00699, por tanto rechazo H0, es decir, rechazo

homocedasticidad frente a la alternativa de un modelo de heterocedasticidad multiplicativo en las

variables explicativas.

4. ¿Qué consecuencias tiene la heterocedasticidad sobre los estimadores MCO?

Ver apuntes de clase.

5. Volver a estimar el modelo teniendo en cuenta la existencia de heterocedasticidad. Al igual que en el

caso de autocorrelación, podemos seguir dos estrategias:

a) Estimar por OLS corrigiendo las varianzas de los estimadores de modo que podamos hacer

contrastes válidos asintóticamente, es decir, en muestras grandes.

ols galim renta estudios nhijos / hetcov

ols galim renta estudios nhijos / hetcov

REQUIRED MEMORY IS PAR 12

CURRENT PAR 22480

OLS ESTIMATION

100 OBSERVATIONS DEPENDENT VARIABLE GALIM

...NOTE..SAMPLE RANGE SET TO: 1, 100

USING HETEROSKEDASTICITY-CONSISTENT COVARIANCE MATRIX

R-SQUARE 0.

R-SQUARE ADJUSTED 0.

VARIANCE OF THE ESTIMATE-SIGMA**2 0.41971E+

STANDARD ERROR OF THE ESTIMATE-SIGMA 647.

SUM OF SQUARED ERRORS-SSE 0.40292E+

MEAN OF DEPENDENT VARIABLE 1639.

LOG OF THE LIKELIHOOD FUNCTION -787.

MODEL SELECTION TESTS - SEE JUDGE ET AL. (1985,P.242)

AKAIKE (1969) FINAL PREDICTION ERROR - FPE 0.43649E+

(FPE IS ALSO KNOWN AS AMEMIYA PREDICTION CRITERION - PC)

AKAIKE (1973) INFORMATION CRITERION - LOG AIC 12.

SCHWARZ (1978) CRITERION - LOG SC 13.

MODEL SELECTION TESTS - SEE RAMANATHAN (1998,P.165)

CRAVEN-WAHBA (1979)

LOG-LIKELIHOOD FUNCTION= -770.

COEFFICIENTS

0.1913789 -11.48442 145.2864 447.3563 0.2756786E-

GRADIENT

-0.1325896 -0.6320149E-04 -0.3227488E-04 -0.2001147E-04 -20.

-0.1364758E-01 -0.6784720E-02 -0.3590335E-

SQUARED CORR. COEF. BETWEEN OBSERVED AND PREDICTED 0.

ASY. COVARIANCE MATRIX OF PARAMETER ESTIMATES IS ESTIMATED USING

THE INFORMATION MATRIX

LOG OF THE LIKELIHOOD FUNCTION = -770.

ASYMPTOTIC

VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY

NAME COEFFICIENT ERROR -------- P-VALUE CORR. COEFFICIENT AT MEANS

MEAN EQUATION:

RENTA 0.19138 0.2697E-01 7.095 0.000 0.595 0.8591 0.

ESTUDIOS -11.484 39.30 -0.2922 0.770-0.030 -0.0174 -0.

NHIJOS 145.29 67.54 2.151 0.031 0.219 0.1260 0.

CONSTANT 447.36 163.9 2.730 0.006 0.274 0.0000 0.

VARIANCE EQUATION:

RENTA 0.27568E-03 0.4119E-04 6.692 0.000 0.

ESTUDIOS -0.19836 0.1226 -1.619 0.106-0.

NHIJOS 0.33748 0.2036 1.658 0.097 0.

CONSTANT 11.031 0.5399 20.43 0.000 0.

Este método de estimación MCGF nos aproxima a la estimación eficiente que de Mínimos Cuadrados

Generalizados. Estaremos tanto más próximos a la misma, cuando más próximos a cero estén los

gradientes que aparecen en la estimación (en amarillo).

En cuando a los resultados, fijaos que ahora tanto los parámetros estimados, como los errores estándar

(en rosa) son distintos a los de MCO. Si no nos hemos equivocado con la forma funcional de la

heterocedasticidad, los parámetros tendrán una interpretación válida y los errores estándar serán válidos

para hacer contrastes. Además, tendremos estimaciones más eficientes que con MCO.

En la parte azul de la salida, tenéis la estimación de la ecuación de la varianza que, por el supuesto de

heterocedasticidad que hemos hecho (multiplicativo en las variables explicativas), depende de la renta ,

estudios y nhijos. Pero fijaos que sólo la renta es significativa al 5% para explicar la varianza (t-

ratio=6.692, p-valor=0.000), esto podría sugerir que tal vez deberíamos haber supuesto que la

heterocedasticidad depende sólo de la variable renta, y no en el resto de variables explicativas. De hecho,

esto es algo que nos sugería tanto el tercer gráfico del residuos que hicimos, como el contraste G-Q.