


















Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Econometria, Profesor: , Carrera: Administració i Direcció d'Empreses (Elx), Universidad: UMH
Tipo: Ejercicios
1 / 26
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!



















2 Resumen de la teorÌa
Linealidad. Para una inspecciÛn gr·Öca de la linealidad obtendremos los gr·Öcos de dispersiÛn de Y sobre X y tambiÈn el de residuos (bei = ybi yi; i = 1; :::; k) frente a valores estimados. Seguidamente recordamos tres situaciones: (a) y (b) corresponden con situaciones en las que, intuitivamente, se aprecian relaciones no lineales, y (c) donde se aprecida buena relaciÛn lineal.
Homocedasticidad. El an·lisis de la homocedasticidad lo haremos de forma gr·Öca y mediante el contraste de hipÛtesis de Breusch-Pagan (1979). A nivel intuitivo, observaremos dos gr·Öcos de dispersiÛn:
El de los residuos (bei) frente a valores estimados (byi);
El de los residuos (bei) frente a valores de la variable explicativa (xi):
Mediante estos gr·Öcos tratamos de observar si se aprecia alguna tendencia en particular tanto en los pares (byi; bei) como en los (xi; bei).
A continuaciÛn recordamos tres situaciones tÌpicas que pueden presentarse al observar el gr·Öco de residuos frente a valores estimados (de forma an·loga se interpretarÌan las correspondientes situaciones en el caso de residuos frente a valores de la variable explicativa): en las situaciones (a) y (b) se aprecia cierta heterocedasticidad, mientras que en (c) no se aprecia
un patrÛn sistem·tico en los residuos, lo que nos lleva a pensar que sÌ se veriÖca la hipÛtesis b·sica de homocedasticidad.
El contraste que emplearemos en nuestro estudio de la homocedastcidad es el de Breusch- Pagan (vÈase el apÈndice de esta pr·ctica para detalles). Este contraste, aplicado a nuestro modelo de regresiÛn simple,
yi = b^0 + b^1 xi + ei; i = 1; :::; k;
analiza si puede considerarse que la varianza de ei; denotada por ^2 i ; i = 1; :::; k; depende funcionalmente de ciertas variables Zj ; j = 1; :::; p; en la pr·ctica la variables Zj coinciden con las variables explicativas del modelo. AsÌ pues, en nuestro caso particular, estarÌamos analizando si existe una cierta relaciÛn funcional de la forma
^2 i = h ( 0 + 1 xi) ;
donde h es una funciÛn no especiÖcada. Con esta notaciÛn el contraste de Breush-Pagan se formula de la siguiente manera:
H 0 : 1 = 0 (homocedasticidad) H 1 : 1 6 = 0 (heterocedasticidad).
Como en ocasiones anteriores, el contraste se lleva a cabo directamente con el p-valor que proporciona el programa R, tal y como veremos a continuaciÛn.
Normalidad. El an·lisis de la hipÛtesis de normalidad tambiÈn se realizar· mediante gr·Öcos apropiados y el contraste de hipÛtesis de Shapiro-Wilk. Respecto de los gr·Öcos, resulta de interÈs observar:
El histograma de los residuos
sigue:
H 0 : = 0 H 1 : 6 = 0 (tambiÈn puede plantearse de forma unilateral).
En ocasiones hay alg˙n dato en particular que ináuye desproporcionadamente en el ajuste del modelo propuesto, con lo cual las estimaciones y predicciones dependen mucho de Èl. Es interesante siempre, localizar este tipo de datos, si existen, y evaluar su impacto en el modelo. En ocasiones estos datos muy ináuentes proceden de errores en la mediciÛn, o de condiciones de experimentaciÛn diferentes, etc., y serÌa aconsejable excluirlos del ajuste. Los elementos destacados en la detecciÛn de observaciones atÌpicas son:
El efecto palanca (en inglÈs, leverage). Como medida del efecto palanca que produce cada observaciÛn de la muestra obtendremos:
hj =^1 k
2 Pk i=1 (xi^ ^ x) 2 (hat values);
que se demuestra que se sit˙a entre (^1) k y 1. Se consideran observaciones con alto efecto palanca aquellas para las que hj > 6 k
Los puntos de alto efecto palanca son potencialmente ináuyentes.
Como medida de la ináuencia de una obervaciÛn determinada se emplear· la denominada distancia de Cook que viene dada por:
Di =
byi byi(i)
2 Sb "^2 hi
donde recordemos que Sb "^2 =
X^ k i=
(yi ybi)^2 k 2 y donde^ ybi(i)^ es el valor estimado por la recta de regresiÛn que obtendrÌamos al eliminar el punto (xi; yi) en la determinaciÛn de los par·metros del modelo de regresiÛn. Se considera que un punto es ináuente si
Di > 1 :
Una vez localizados los puntos ináuentes, si no es posible identiÖcar el origen de su car·cter atÌpico, queda la incertidumbre de quÈ hacer. Un opciÛn es resolver esta cuestiÛn mediante
un contraste de hipÛtesis utilizando los llamados residuos estudentizados que vienen dados por bti = bei S^ b"(i)^ p 1 hi^ : Si el modelo es correcto, bti sigue una distribuciÛn t de Student con k 3 grados de libertad. Si el valor empÌrico del estadÌstico bti es mayor que correspondiente valor en la tabla de la t de Student, se recomienda eliminar ese valor. En esta pr·ctica, la decisiÛn de eliminar o no estos puntos la tomaremos con ayuda del llamado test de Bonferrani.
Existen modelos que se pueden transformar en un modelo lineal mediante una transformaciÛn sencilla. La tabla de transformaciones habituales es la siguiente:
TransformaciÛn RegresiÛn simple log (y) log (x) y = x ; > 0 log (y) x y = exp ( x) ; > 0 y log (x) y = + log (x) 1 =y 1 =x y = (^) xx+ 1 =y x y = (^) +^1 x y 1 =x y = + (^1) x
A continuaciÛn presentamos las gr·Öcas de algunos de estos modelos.
La transformaciÛn log (y) log (x) se corresponde con el modelo:
log (y) = 0 + 1 log (x) ;
tomando exponenciales en ambos miembros este modelo puede representarse en el formato y = x (donde y son constantes; por ejemplo en este caso = e 0 y = 1 ): Con el Ön de intuir cuando se aplicarÌa este modelo, seguidamente se representan las gr·Öcas, para x e y entre 0 y 1 ; de y = x (en color negro), de y = x^2 ; y = x^3 ; y = x^4 y y = x^5 (en color rojo), y de y = x^1 =^2 ; y = x^1 =^3 ; y = x^1 =^4 (en color verde).
La transformaciÛn 1 =y 1 =x se corresponde con el modelo: 1 y =^ +^
x ,^ y^ =^
x x + : Mostramos las gr·Öcas de y = (^) xx+1 (color negro; tiene una asÌntota vertical en x = 1); y = (^) x x 1 (color rojo; tiene una asÌntota vertical en x = 1); y = (^) xx+1 (color verde; tiene una asÌntota vertical en x = 1)
0 0.5 1 1.5 2 2.5 3
3
2
1
0 x
y
x
y
La transformaciÛn y 1 =x representa a
y = + 1 x
Algunas gr·Öcas: y = 1 + (^1) x en color negro, y = (^1) x en color rojo y y = 1 (^) x^1 en color verde
1.25 2.5 3.75 5
5
x
y
x
y
Una vez diagnosticado el modelo y admitiendo que se veriÖcan las cuatro hipÛtesis b·sicas del modelo, podemos utilizar el modelo de regresiÛn para realizar estimaciones (poblacionales) de la media de y para un valor dado de x y predicciones (poblacionales) de un valor puntual de y para x dado. Concretamente estas estimaciones y predicciones poblaciones la haremos mediante los correspondientes intervalos de conÖanza. Recordemos que vienen de la siguiente forma: dado un valor Öjo de x = x 0 ; denotemos la estimaciÛn puntual de y por byx 0 = b^0 + b^1 x 0 ; se tiene que el intervalo de conÖanza para la estimaciÛn de la media de y sabiendo que x = x 0 viene dado por y bx 0 t (^) = 2 ;k 2 Sb"
p hx 0 ;
y el intervalo de conÖanza para la predicciÛn de y:
y bx 0 t (^) = 2 ;k 2 Sb "^2
p 1 + hx 0 ;
donde hx 0 = (x^0 x)
2 P(xi x) 2 + (^) k^1 es la medida del efecto palanca del punto Öjo x 0.
3 Diagnosis del modelo con R Commander: linealidad, homo-
cedasticidad, normalidad e independencia
Iustraremos nuestra diagnosis del modelo mediante el siguiente ejemplo.
Ejemplo 3.1 (ContinuaciÛn del ejemplo 2.1 de la pr·ctica 1) La siguiente tabla mues- tra las rentas per c·pita en cientos de dolares (Y = Renta) y los porcentajes de la economÌa que representa la agricultura (X = PorcentAgric) correspondientes a 15 paises latinoamericanos en el aÒo 1999 (datos extraÌdos de los Indicadores de Desarrollo Mundial del Banco Mundial).
PaÌs* 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Y 76 10 44 47 23 19 13 19 8 44 4 31 24 59 37 X 6 16 9 8 14 11 12 10 18 5 26 8 8 9 5 (*) 1: Argentina, 2: Bolivia, 3: Brasil, 4: Chile, 5: Colombia, 6: Rep˙blica Dominicana, 7: Ecuador, 8: El Salvador, 9: Honduras, 10: MÈxico, 11: Nicaragua, 12: Panam·, 13: Per˙, 14: Uruguay, 15; Venezuela
En la pr·ctica 1 realizamos el ajuste por mÌnimos cuiadrados obteniendo el modelo
Renta = 59: 1289 2 : 5995 PorcentAgric;
siendo el coeÖciente de determinaciÛn R^2 = 0: 5097 : A continuaciÛn complementamos el estudio de regresiÛn con la diagnosis del modelo.
Concretamente, se pide:
Los indices de las observaciones indican la posiciÛn de cada uno de los datos dentro de nuestra muestra.
Recordemos que podemos ver los valores que toman estas variables a traves de la opciÛn:
Visualizar datos
Veamos los gr·Öcos de Y sobre X y de residuos frente a valores estimados para el ejemplo actual. En primer lugar mostramos el gr·Öco de dispersiÛn de Y sobre X (estudiado ya en la pr·ctica 1):
5 10 15 20 25
10
20
30
40
50
60
70
PorcentAgric
Renta
A continuaciÛn mostramos el gr·Öco de residuos frente a valores estimados:
-10 0 10 20 30 40
-^
0
10
20
30
fitted.RegModel.
residuals.RegModel.
De forma gr·Öca, se aprecia que quiz·s un modelo no lineal explique mejor la situaciÛn. Sobre este punto volveremos en la secciÛn 5. Antes de buscar modelo alternativos, realizaremos una diagnosis m·s completa del modelo.
b) Estudio de la homocedasticidad. En el caso de nuestro ejemplo, atendiendo al diagrama de dispersiÛn de residuos frente a valores estimados, no se aprecia con claridad la hipÛtesis de homocedasticidad, pues se aprecia cierto aumento en la dispersiÛn de los residuos para valores altos de los valores estimados. A continuaciÛn aplicamos el test de Breusch Pagan^1. Para ello, en primer lugar, hemos de tener ajustado el modelo (tal y como lo hicimos en la pr·ctica 1) y seguidamente accedemos al contraste de Breusch Pagan a travÈs de la opciÛn siguiente:
Modelos > diagnÛsticos numÈricos > test de Breusch Pagan (^1) En rigor, este contraste es apropiado para muestras grandes (n 30 ). No obstante, a efectos ilustrativos lo aplicamos sobre el ejemplo actual.
Agricultura$residuals.RegModel.
frequency
-20 -10 0 10 20 30 40
0
1
2
3
4
5
En general, los gr·Öcos QQ puede utilizarse para analizar el ajuste a diferentes modelos probabilÌsticos. Encontraremos este gr·Öco en la opciÛn:
Gr·ficas > Gr·fica de comparaciÛn de cuantiles...
-1 0 1
-^
0
10
20
30
norm quantiles
Agricultura$residuals.RegModel.
En este caso, aunque se aprecia que existen puntos relativamente alejados de la diagonal, estos se encuentran dentro de los lÌmites tolerables. Para concretar realizaremos el test de Shapiro- Wilk, en el que la hipÛtesis nula, H 0 ; representa la hipÛtesis de normalidad en los errores del modelo y la alternativa H 1 indica que no se veriÖca tal hipÛtesis de normalidad.
Nota: Los gr·Öcos de residuos frente a valores estimados y los gr·Öcos QQ de residuos en relaciÛn con la distribuciÛn normal puede verse, alternativamente a travÈs de la opciÛn: Modelos > Gr·ficas > Gr·ficas b·sicas de diagnÛstico
El contraste de normalidad de Shapiro-Wilk se encuentra a travÈs de la opciÛn:
EstadÌsticos > Res˙menes > Test de normalidad de Shapiro-Wilk
Obtenemos los resultados:
Con un p valor de 0.06507 aceptamos H 0 de normalidad al nivel de signiÖcaciÛn del 5% (nÛtese que el p valor se encuentra cercano al nivel de signiÖcaciÛn, luego, informalmente hablando, la decisiÛn del contraste no se hace con gran contundencia).
d) Estudio de la independencia. Realizaremos el contraste de autocorrelaciÛn (lo que implica dependencia) de Durbin-Watson a travÈs de la opciÛn:
Modelos > diagnÛsticos numÈrico > test de Durbin Watson de autocorrelaciÛn
Copiamos de nuevo las salidas:
En esta tabla localizamos las observaciones para los que los efectos palanca son mayores que 6 =k = 6=15 = 0: 4 (la observaciÛn n˙mero 11) y las distancias de Cook mayores que 1 (la observaciÛn n˙mero 11). AsÌ pues, consideramos la observaciÛn n˙mero 11 como el ˙nico punto palanca y el ˙nico punto ináuyente.
c) Realizamos el test de Bonferonni para determinar si eliminamos alg˙n valor. Para ellos entramos en la opciÛn
Modelos > diagnÛsticos numÈrico > test de valores atÌpicos de Bonferonni
No descartamos ning˙n valor (pues Bonferroni p =0.18593 > 0.05).
5 Transformaciones con R commander
Ejemplo 5.1 En relaciÛn con el ejemplo 3.1, deseamos analizar los modelos resultantes de algunas transformaciones que podrÌan ser apropiadas. A la vista del diagrama de dispersiÛn analizaremos algunas transformaciones inversas.
Modelo 1 =y 1 =x. El ajuste puede llevarse a cabo, o bien deÖniendo las nuevas variables (con la opciÛn de calcular nuevas variables, como vimos en la pr·ctica anterior) o bien directamente mediante la opciÛn:
EstadÌsticos > Ajuste de Modelos > Modelo Lineal
Nota importante: obsÈrvese la sintaxis en R Commander y concretamente el empleo de I (); concretamente ha de escribirse: I (1=y) I (1=x) :
De este modo obtenemos la salida: