Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


practica 2, Ejercicios de Econometría

Asignatura: Econometria, Profesor: , Carrera: Administració i Direcció d'Empreses (Elx), Universidad: UMH

Tipo: Ejercicios

2012/2013

Subido el 01/05/2013

guillermo17390
guillermo17390 🇪🇸

4

(16)

10 documentos

1 / 26

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
PRÁCTICAS DE ECONOMETRÍA
GRADO DE ESTADÍSTICA EMPRESARIAL
GRADO EN ADMINISTRACIÓN Y DIRECCIÓN DE EMPRESAS (ELCHE)
Pctica 2:
Diagnosis y predicción en el modelo de regresión lineal simple
Curso 2011/2012
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a

Vista previa parcial del texto

¡Descarga practica 2 y más Ejercicios en PDF de Econometría solo en Docsity!

PR¡CTICAS DE ECONOMETRÕA

GRADO DE ESTADÕSTICA EMPRESARIAL

GRADO EN ADMINISTRACI”N Y DIRECCI”N DE EMPRESAS (ELCHE)

Pr·ctica 2:

Diagnosis y predicciÛn en el modelo de regresiÛn lineal simple

Curso 2011/

Õndice General

  • 1 IntroducciÛn
  • 2 Resumen de la teorÌa - normalidad e independencia 2.1 Diagnosis del modelo mediante los residuos: linealidad, homocedasticidad,
    • 2.2 Observaciones atÌpicas
    • 2.3 Transformaciones para linealizar y conseguir homocedasticidad
    • 2.4 PredicciÛn
    • normalidad e independencia 3 Diagnosis del modelo con R Commander: linealidad, homocedasticidad,
  • 4 DetecciÛn de observaciones atÌpicas con R Commander
  • 5 Transformaciones con R commander
  • 6 PredicciÛn con R Commader
  • 7 Ejercicios
  • 8 Apendice

2 Resumen de la teorÌa

2.1 Diagnosis del modelo mediante los residuos: linealidad, homocedastici-

dad, normalidad e independencia

Linealidad. Para una inspecciÛn gr·Öca de la linealidad obtendremos los gr·Öcos de dispersiÛn de Y sobre X y tambiÈn el de residuos (bei = ybi yi; i = 1; :::; k) frente a valores estimados. Seguidamente recordamos tres situaciones: (a) y (b) corresponden con situaciones en las que, intuitivamente, se aprecian relaciones no lineales, y (c) donde se aprecida buena relaciÛn lineal.

Homocedasticidad. El an·lisis de la homocedasticidad lo haremos de forma gr·Öca y mediante el contraste de hipÛtesis de Breusch-Pagan (1979). A nivel intuitivo, observaremos dos gr·Öcos de dispersiÛn:

 El de los residuos (bei) frente a valores estimados (byi);

 El de los residuos (bei) frente a valores de la variable explicativa (xi):

Mediante estos gr·Öcos tratamos de observar si se aprecia alguna tendencia en particular tanto en los pares (byi; bei) como en los (xi; bei).

A continuaciÛn recordamos tres situaciones tÌpicas que pueden presentarse al observar el gr·Öco de residuos frente a valores estimados (de forma an·loga se interpretarÌan las correspondientes situaciones en el caso de residuos frente a valores de la variable explicativa): en las situaciones (a) y (b) se aprecia cierta heterocedasticidad, mientras que en (c) no se aprecia

un patrÛn sistem·tico en los residuos, lo que nos lleva a pensar que sÌ se veriÖca la hipÛtesis b·sica de homocedasticidad.

El contraste que emplearemos en nuestro estudio de la homocedastcidad es el de Breusch- Pagan (vÈase el apÈndice de esta pr·ctica para detalles). Este contraste, aplicado a nuestro modelo de regresiÛn simple,

yi = b^0 + b^1 xi + ei; i = 1; :::; k;

analiza si puede considerarse que la varianza de ei; denotada por ^2 i ; i = 1; :::; k; depende funcionalmente de ciertas variables Zj ; j = 1; :::; p; en la pr·ctica la variables Zj coinciden con las variables explicativas del modelo. AsÌ pues, en nuestro caso particular, estarÌamos analizando si existe una cierta relaciÛn funcional de la forma

^2 i = h ( 0 + 1 xi) ;

donde h es una funciÛn no especiÖcada. Con esta notaciÛn el contraste de Breush-Pagan se formula de la siguiente manera:

H 0 : 1 = 0 (homocedasticidad) H 1 : 1 6 = 0 (heterocedasticidad).

Como en ocasiones anteriores, el contraste se lleva a cabo directamente con el p-valor que proporciona el programa R, tal y como veremos a continuaciÛn.

Normalidad. El an·lisis de la hipÛtesis de normalidad tambiÈn se realizar· mediante gr·Öcos apropiados y el contraste de hipÛtesis de Shapiro-Wilk. Respecto de los gr·Öcos, resulta de interÈs observar:

 El histograma de los residuos

sigue:

H 0 :  = 0 H 1 :  6 = 0 (tambiÈn puede plantearse de forma unilateral).

2.2 Observaciones atÌpicas

En ocasiones hay alg˙n dato en particular que ináuye desproporcionadamente en el ajuste del modelo propuesto, con lo cual las estimaciones y predicciones dependen mucho de Èl. Es interesante siempre, localizar este tipo de datos, si existen, y evaluar su impacto en el modelo. En ocasiones estos datos muy ináuentes proceden de errores en la mediciÛn, o de condiciones de experimentaciÛn diferentes, etc., y serÌa aconsejable excluirlos del ajuste. Los elementos destacados en la detecciÛn de observaciones atÌpicas son:

 El efecto palanca (en inglÈs, leverage). Como medida del efecto palanca que produce cada observaciÛn de la muestra obtendremos:

hj =^1 k

  • (xj^ ^ x)

2 Pk i=1 (xi^ ^ x) 2 (hat values);

que se demuestra que se sit˙a entre (^1) k y 1. Se consideran observaciones con alto efecto palanca aquellas para las que hj > 6 k

Los puntos de alto efecto palanca son potencialmente ináuyentes.

 Como medida de la ináuencia de una obervaciÛn determinada se emplear· la denominada distancia de Cook que viene dada por:

Di =

byi byi(i)

2 Sb "^2 hi

donde recordemos que Sb "^2 =

X^ k i=

(yiybi)^2 k 2 y donde^ ybi(i)^ es el valor estimado por la recta de regresiÛn que obtendrÌamos al eliminar el punto (xi; yi) en la determinaciÛn de los par·metros del modelo de regresiÛn. Se considera que un punto es ináuente si

Di > 1 :

 Una vez localizados los puntos ináuentes, si no es posible identiÖcar el origen de su car·cter atÌpico, queda la incertidumbre de quÈ hacer. Un opciÛn es resolver esta cuestiÛn mediante

un contraste de hipÛtesis utilizando los llamados residuos estudentizados que vienen dados por bti = bei S^ b"(i)^ p 1 hi^ : Si el modelo es correcto, bti sigue una distribuciÛn t de Student con k 3 grados de libertad. Si el valor empÌrico del estadÌstico bti es mayor que correspondiente valor en la tabla de la t de Student, se recomienda eliminar ese valor. En esta pr·ctica, la decisiÛn de eliminar o no estos puntos la tomaremos con ayuda del llamado test de Bonferrani.

2.3 Transformaciones para linealizar y conseguir homocedasticidad

Existen modelos que se pueden transformar en un modelo lineal mediante una transformaciÛn sencilla. La tabla de transformaciones habituales es la siguiente:

TransformaciÛn RegresiÛn simple log (y)  log (x) y = x ; > 0 log (y)  x y = exp ( x) ; > 0 y  log (x) y = + log (x) 1 =y  1 =x y = (^) xx+ 1 =y  x y = (^) +^1 x y  1 =x y = + (^1) x

A continuaciÛn presentamos las gr·Öcas de algunos de estos modelos.

 La transformaciÛn log (y)  log (x) se corresponde con el modelo:

log (y) = 0 + 1 log (x) ;

tomando exponenciales en ambos miembros este modelo puede representarse en el formato y = x (donde y son constantes; por ejemplo en este caso = e 0 y = 1 ): Con el Ön de intuir cuando se aplicarÌa este modelo, seguidamente se representan las gr·Öcas, para x e y entre 0 y 1 ; de y = x (en color negro), de y = x^2 ; y = x^3 ; y = x^4 y y = x^5 (en color rojo), y de y = x^1 =^2 ; y = x^1 =^3 ; y = x^1 =^4 (en color verde).

 La transformaciÛn 1 =y  1 =x se corresponde con el modelo: 1 y =^ +^

x ,^ y^ =^

x x + : Mostramos las gr·Öcas de y = (^) xx+1 (color negro; tiene una asÌntota vertical en x = 1); y = (^) xx 1 (color rojo; tiene una asÌntota vertical en x = 1); y = (^) xx+1 (color verde; tiene una asÌntota vertical en x = 1)

0 0.5 1 1.5 2 2.5 3

3

2

1

0 x

y

x

y

 La transformaciÛn y  1 =x representa a

y = + 1 x

Algunas gr·Öcas: y = 1 + (^1) x en color negro, y = (^1) x en color rojo y y = 1 (^) x^1 en color verde

1.25 2.5 3.75 5

5

x

y

x

y

2.4 PredicciÛn

Una vez diagnosticado el modelo y admitiendo que se veriÖcan las cuatro hipÛtesis b·sicas del modelo, podemos utilizar el modelo de regresiÛn para realizar estimaciones (poblacionales) de la media de y para un valor dado de x y predicciones (poblacionales) de un valor puntual de y para x dado. Concretamente estas estimaciones y predicciones poblaciones la haremos mediante los correspondientes intervalos de conÖanza. Recordemos que vienen de la siguiente forma: dado un valor Öjo de x = x 0 ; denotemos la estimaciÛn puntual de y por byx 0 = b^0 + b^1 x 0 ; se tiene que el intervalo de conÖanza para la estimaciÛn de la media de y sabiendo que x = x 0 viene dado por y bx 0  t (^) = 2 ;k 2 Sb"

p hx 0 ;

y el intervalo de conÖanza para la predicciÛn de y:

y bx 0  t (^) = 2 ;k 2 Sb "^2

p 1 + hx 0 ;

donde hx 0 = (x^0 x)

2 P(xix) 2 + (^) k^1 es la medida del efecto palanca del punto Öjo x 0.

3 Diagnosis del modelo con R Commander: linealidad, homo-

cedasticidad, normalidad e independencia

Iustraremos nuestra diagnosis del modelo mediante el siguiente ejemplo.

Ejemplo 3.1 (ContinuaciÛn del ejemplo 2.1 de la pr·ctica 1) La siguiente tabla mues- tra las rentas per c·pita en cientos de dolares (Y = Renta) y los porcentajes de la economÌa que representa la agricultura (X = PorcentAgric) correspondientes a 15 paises latinoamericanos en el aÒo 1999 (datos extraÌdos de los Indicadores de Desarrollo Mundial del Banco Mundial).

PaÌs* 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Y 76 10 44 47 23 19 13 19 8 44 4 31 24 59 37 X 6 16 9 8 14 11 12 10 18 5 26 8 8 9 5 (*) 1: Argentina, 2: Bolivia, 3: Brasil, 4: Chile, 5: Colombia, 6: Rep˙blica Dominicana, 7: Ecuador, 8: El Salvador, 9: Honduras, 10: MÈxico, 11: Nicaragua, 12: Panam·, 13: Per˙, 14: Uruguay, 15; Venezuela

En la pr·ctica 1 realizamos el ajuste por mÌnimos cuiadrados obteniendo el modelo

Renta = 59: 1289 2 : 5995 PorcentAgric;

siendo el coeÖciente de determinaciÛn R^2 = 0: 5097 : A continuaciÛn complementamos el estudio de regresiÛn con la diagnosis del modelo.

Concretamente, se pide:

 Los indices de las observaciones indican la posiciÛn de cada uno de los datos dentro de nuestra muestra.

Recordemos que podemos ver los valores que toman estas variables a traves de la opciÛn:

Visualizar datos

Veamos los gr·Öcos de Y sobre X y de residuos frente a valores estimados para el ejemplo actual. En primer lugar mostramos el gr·Öco de dispersiÛn de Y sobre X (estudiado ya en la pr·ctica 1):

5 10 15 20 25

10

20

30

40

50

60

70

PorcentAgric

Renta

A continuaciÛn mostramos el gr·Öco de residuos frente a valores estimados:

-10 0 10 20 30 40

-^

0

10

20

30

fitted.RegModel.

residuals.RegModel.

De forma gr·Öca, se aprecia que quiz·s un modelo no lineal explique mejor la situaciÛn. Sobre este punto volveremos en la secciÛn 5. Antes de buscar modelo alternativos, realizaremos una diagnosis m·s completa del modelo.

b) Estudio de la homocedasticidad. En el caso de nuestro ejemplo, atendiendo al diagrama de dispersiÛn de residuos frente a valores estimados, no se aprecia con claridad la hipÛtesis de homocedasticidad, pues se aprecia cierto aumento en la dispersiÛn de los residuos para valores altos de los valores estimados. A continuaciÛn aplicamos el test de Breusch Pagan^1. Para ello, en primer lugar, hemos de tener ajustado el modelo (tal y como lo hicimos en la pr·ctica 1) y seguidamente accedemos al contraste de Breusch Pagan a travÈs de la opciÛn siguiente:

Modelos > diagnÛsticos numÈricos > test de Breusch Pagan (^1) En rigor, este contraste es apropiado para muestras grandes (n  30 ). No obstante, a efectos ilustrativos lo aplicamos sobre el ejemplo actual.

Agricultura$residuals.RegModel.

frequency

-20 -10 0 10 20 30 40

0

1

2

3

4

5

En general, los gr·Öcos QQ puede utilizarse para analizar el ajuste a diferentes modelos probabilÌsticos. Encontraremos este gr·Öco en la opciÛn:

Gr·ficas > Gr·fica de comparaciÛn de cuantiles...

-1 0 1

-^

0

10

20

30

norm quantiles

Agricultura$residuals.RegModel.

En este caso, aunque se aprecia que existen puntos relativamente alejados de la diagonal, estos se encuentran dentro de los lÌmites tolerables. Para concretar realizaremos el test de Shapiro- Wilk, en el que la hipÛtesis nula, H 0 ; representa la hipÛtesis de normalidad en los errores del modelo y la alternativa H 1 indica que no se veriÖca tal hipÛtesis de normalidad.

Nota: Los gr·Öcos de residuos frente a valores estimados y los gr·Öcos QQ de residuos en relaciÛn con la distribuciÛn normal puede verse, alternativamente a travÈs de la opciÛn: Modelos > Gr·ficas > Gr·ficas b·sicas de diagnÛstico

El contraste de normalidad de Shapiro-Wilk se encuentra a travÈs de la opciÛn:

EstadÌsticos > Res˙menes > Test de normalidad de Shapiro-Wilk

Obtenemos los resultados:

Con un pvalor de 0.06507 aceptamos H 0 de normalidad al nivel de signiÖcaciÛn del 5% (nÛtese que el pvalor se encuentra cercano al nivel de signiÖcaciÛn, luego, informalmente hablando, la decisiÛn del contraste no se hace con gran contundencia).

d) Estudio de la independencia. Realizaremos el contraste de autocorrelaciÛn (lo que implica dependencia) de Durbin-Watson a travÈs de la opciÛn:

Modelos > diagnÛsticos numÈrico > test de Durbin Watson de autocorrelaciÛn

Copiamos de nuevo las salidas:

En esta tabla localizamos las observaciones para los que los efectos palanca son mayores que 6 =k = 6=15 = 0: 4 (la observaciÛn n˙mero 11) y las distancias de Cook mayores que 1 (la observaciÛn n˙mero 11). AsÌ pues, consideramos la observaciÛn n˙mero 11 como el ˙nico punto palanca y el ˙nico punto ináuyente.

c) Realizamos el test de Bonferonni para determinar si eliminamos alg˙n valor. Para ellos entramos en la opciÛn

Modelos > diagnÛsticos numÈrico > test de valores atÌpicos de Bonferonni

No descartamos ning˙n valor (pues Bonferroni p =0.18593 > 0.05).

5 Transformaciones con R commander

Ejemplo 5.1 En relaciÛn con el ejemplo 3.1, deseamos analizar los modelos resultantes de algunas transformaciones que podrÌan ser apropiadas. A la vista del diagrama de dispersiÛn analizaremos algunas transformaciones inversas.

 Modelo 1 =y  1 =x. El ajuste puede llevarse a cabo, o bien deÖniendo las nuevas variables (con la opciÛn de calcular nuevas variables, como vimos en la pr·ctica anterior) o bien directamente mediante la opciÛn:

EstadÌsticos > Ajuste de Modelos > Modelo Lineal

Nota importante: obsÈrvese la sintaxis en R Commander y concretamente el empleo de I (); concretamente ha de escribirse: I (1=y)  I (1=x) :

De este modo obtenemos la salida: