¡Descarga Práctica guiada gretl y más Guías, Proyectos, Investigaciones en PDF de Administración de Empresas solo en Docsity!
PRÀCTICA GUIADA 2: MODELS UNIVARIANTS DE SÈRIES TEMPORALS
AMB GRETL
Professors O. Claveria i E. Vayá
L’ objectiu d’aquesta pràctica és veure com es pot aplicar la metodologia Box-Jenkins
mitjançant el programa Gretl.
Per tal de realitzar aquesta pràctica es fa servir la sèrie mensual del nombre de
visitants estrangers arribats a les illes Balears des de gener de 1999 fins al desembre
de 2013 (font: www.ine.es). Aquesta sèrie es troba disponible al fitxer excel
Practica_Guiada_2_Dades.xls.
- DESENVOLUPAMENT DE LA PRÀCTICA
1er pas) Importació de les dades d’excel a gretl.
Com a primer pas, un cop obert el Gretl, cal importar les dades d’Excel:
File/Open data/Import/Excel
A continuació s’ha d’especificar la ubicació del fitxer de dades. Seguidament s’obre un
quadre de diàleg que demana la cel·la de l’Excel des d’on s’ha de començar a
importar. Donat que el fitxer Excel conté informació des de la primera cel·la, es valida
l’opció del Gretl per defecte (column:1 row:1):
Seguidament es selecciona la interpretació de les dades com a sèrie temporal. A
continuació el programa realitza un seguit de preguntes relatives a l’estructura de la
base de dades, la freqüència i la primera observació, a les que cal respondre
respectivament:
- Time-Series
- Monthly
- 1995:
Si es valida ( Apply), el programa haurà importat el fitxer de dades automàticament,
apareixent així la variable BAL i una constant per defecte. Pitjant dos cops damunt la
variable es desplega una nova finestra amb les dades importades. Addicionalment, si
s’obre el menú contextual mitjançant el botó dret del ratolí, es poden veure totes les
opcions disponibles directament sense necessitat de treballar a través de la barra de
menús (fer gràfics temporals, correlogrames, aplicar logaritmes, etc.)
Per tal de no tornar a repetir tot el procés d’importació cada vegada que es vulgui
treballar amb aquesta sèrie, es pot guardar aquest fitxer directament en format Gretl
(*.gdt):
File/Save data as/Standard format
2on pas) Aplicació de la metodologia Box-Jenkins
La metodologia Box-Jenkins d’anàlisi de sèries temporals es basa en quatre fases:
identificació del procés generador de la sèrie, estimació, validació del model estimat, i
predicció de la sèrie per períodes futurs.
2.a) IDENTIFICACIÓ del procés generador de la sèrie
Una de les condicions bàsiques per poder identificar el procés generador de dades
d’una sèrie temporal és que aquesta sigui estacionària. És per això que en primer lloc
caldrà comprovar si la sèrie és estacionària, tant a la seva part regular (en mitjana i en
variància) com a la seva part estacional.
Un dels instruments per tal de saber si la sèrie és o no estacionària és el gràfic
temporal de la mateixa. Així, si la sèrie presenta una marcada tendència temporal
probablement no serà estacionària en mitjana, i caldrà aplicar diferències regulars.
El gràfic s’executa a través del menú contextual o de la barra de menús:
View/Graph specified vars/Time series plot
-0,
0
0,
1
0 10 20 30 40 50 60 lag
ACF for l_BAL
+- 1,96/T^0,
-0,
0
0,
1
0 10 20 30 40 50 60 lag
PACF for l_BAL
+- 1,96/T^0,
Gràfic 2. Correlogrames de la FAS i la FAP de la sèrie amb logaritmes
Autocorrelation function for l_BAL
LAG ACF PACF Q-stat. [p-value]
1 0,7887 *** 0,7887 *** 113,8520 [0,000] 2 0,3933 *** -0,6054 *** 142,3203 [0,000] 3 -0,0501 -0,2948 *** 142,7842 [0,000] 4 -0,4445 *** -0,3029 *** 179,5562 [0,000] 5 -0,7222 *** -0,3441 *** 277,1990 [0,000] 6 -0,8467 *** -0,4462 *** 412,1831 [0,000] 7 -0,7170 *** -0,0377 509,5409 [0,000] 8 -0,4314 *** -0,4346 *** 544,9862 [0,000] 9 -0,0365 -0,1411 * 545,2414 [0,000] 10 0,4013 *** 0,1417 * 576,2785 [0,000] 11 0,7544 *** 0,2457 *** 686,6013 [0,000] 12 0,9213 *** 0,3731 *** 852,1207 [0,000] 13 0,7261 *** -0,4741 *** 955,5355 [0,000] 14 0,3591 *** 0,1553 ** 980,9831 [0,000] 15 -0,0503 0,0018 981,4857 [0,000] 16 -0,4142 *** 0,1982 *** 1015,7571 [0,000] 17 -0,6705 *** 0,0202 1106,1202 [0,000] 18 -0,7854 *** 0,1468 ** 1230,8459 [0,000] 19 -0,6642 *** 0,0151 1320,6171 [0,000] 20 -0,3980 *** -0,0529 1353,0429 [0,000] 21 -0,0339 -0,0525 1353,2803 [0,000] 22 0,3661 *** -0,1167 1381,0698 [0,000] 23 0,6912 *** 0,2269 *** 1480,7548 [0,000] 24 0,8448 *** 0,0416 1630,6252 [0,000] 25 0,6638 *** -0,1509 ** 1723,7608 [0,000] 26 0,3285 *** 0,0571 1746,7113 [0,000] 27 -0,0462 -0,1122 1747,1685 [0,000]
28 -0,3796 *** 0,0319 1778,2230 [0,000]
29 -0,6150 *** -0,0459 1860,2747 [0,000]
30 -0,7218 *** 0,0889 1974,0699 [0,000]
31 -0,6122 *** -0,0699 2056,4861 [0,000]
32 -0,3687 *** 0,0410 2086,5841 [0,000]
33 -0,0360 -0,1250 * 2086,8723 [0,000]
34 0,3310 *** -0,0733 2111,4599 [0,000]
35 0,6273 *** 0,0354 2200,3574 [0,000]
36 0,7676 *** -0,0444 2334,3914 [0,000]
37 0,6036 *** -0,0193 2417,8588 [0,000]
38 0,2984 *** -0,0398 2438,3982 [0,000]
39 -0,0414 -0,0489 2438,7961 [0,000]
40 -0,3482 *** -0,1377 * 2467,1728 [0,000]
41 -0,5644 *** -0,0080 2542,2444 [0,000]
42 -0,6620 *** -0,0405 2646,2855 [0,000]
43 -0,5602 *** -0,0126 2721,3256 [0,000]
44 -0,3380 *** -0,0316 2748,8378 [0,000]
45 -0,0363 -0,1012 2749,1577 [0,000]
46 0,2991 *** -0,0529 2771,0362 [0,000]
47 0,5710 *** -0,0454 2851,3411 [0,000]
48 0,6973 *** -0,0825 2972,0224 [0,000]
49 0,5497 *** 0,0032 3047,5972 [0,000]
50 0,2742 *** -0,0021 3066,5481 [0,000]
51 -0,0342 -0,0571 3066,8460 [0,000]
52 -0,3124 *** -0,0115 3091,8316 [0,000]
53 -0,5100 *** -0,0554 3158,9217 [0,000]
54 -0,5996 *** -0,0131 3252,4055 [0,000]
55 -0,5075 *** 0,0092 3319,8940 [0,000]
56 -0,3065 *** 0,0150 3344,7154 [0,000]
57 -0,0315 0,0299 3344,9792 [0,000]
58 0,2717 *** -0,0380 3364,8062 [0,000]
59 0,5162 *** -0,0113 3436,9544 [0,000]
60 0,6323 *** -0,0009 3546,1118 [0,000]
Taula 1. Correlogrames de la FAS i la FAP de la sèrie l_Aeri_tot
Atès el decreixement ràpid dels primers retards de la FAS, semblaria que la sèrie ja és
estacionària a la seva part regular, pel que no caldria diferenciar-la regularment. En
canvi, es pot observar com la FAS de la sèrie mostra un decreixement lent pels
retards de la part estacional (retards 12, 24, 36, 48,...), la qual cosa indica que molt
possiblement la sèrie no sigui estacionària en mitjana en la seva part estacional, pel
que caldria aplicar una diferència estacional. Per fer-ho, un cop damunt de la variable
amb logaritmes ( l_BAL ) s’executa:
Add/ Seasonal differences of selected variables
En fer-ho, es genera automàticament una nova variable: sd_l_BAL que resulta
d’aplicar una diferencia estacional a la sèrie l_BAL :
sd_l_BAL=(1-L
12
)l_BAL
Per tal de saber si la sèrie diferenciada estacionalment una vegada ja és estacionaria
en mitjana, caldrà fer el gràfic temporal de la sèrie sd_l_BAL (Gràfic 3) i de la seva
FAS i FAP (Gràfic 4 i Taula 2).
Autocorrelation function for sd_l_BAL
LAG ACF PACF Q-stat. [p-value]
1 0,5077 *** 0,5077 *** 44,0895 [0,000]
2 0,4100 *** 0,2051 *** 73,0160 [0,000]
3 0,2397 *** -0,0421 82,9606 [0,000]
4 0,1696 ** 0,0016 87,9708 [0,000]
5 0,0949 -0,0161 89,5495 [0,000]
6 0,0558 -0,0094 90,0984 [0,000]
7 0,0415 0,0162 90,4039 [0,000]
8 0,0328 0,0104 90,5959 [0,000]
9 0,0506 0,0365 91,0562 [0,000]
10 0,0934 0,0750 92,6336 [0,000]
11 0,1259 0,0614 95,5164 [0,000]
12 -0,0250 -0,2004 *** 95,6306 [0,000]
13 0,1106 0,1799 ** 97,8827 [0,000]
14 0,0027 -0,0808 97,8841 [0,000]
15 0,0597 0,0406 98,5491 [0,000]
16 -0,0617 -0,1269 99,2639 [0,000]
17 0,0104 0,0879 99,2841 [0,000]
18 -0,0247 -0,0245 99,4002 [0,000]
19 -0,0473 -0,0544 99,8297 [0,000]
20 -0,0820 -0,0708 101,1275 [0,000]
21 -0,0217 0,0842 101,2192 [0,000]
22 0,0396 0,1110 101,5256 [0,000]
23 0,1379 * 0,1513 ** 105,2709 [0,000]
24 0,0384 -0,2487 *** 105,5638 [0,000]
25 -0,0097 0,0020 105,5825 [0,000]
26 0,0220 0,0382 105,6795 [0,000]
27 -0,0925 -0,0750 107,4139 [0,000]
28 -0,0071 -0,0045 107,4241 [0,000]
29 -0,1261 -0,0575 110,6889 [0,000]
30 -0,1114 -0,0367 113,2584 [0,000]
31 -0,1676 ** -0,0465 119,1151 [0,000]
32 -0,1010 -0,0211 121,2565 [0,000]
33 -0,0535 0,0676 121,8612 [0,000]
34 0,0167 0,0895 121,9210 [0,000]
35 -0,0715 -0,0913 123,0197 [0,000]
36 0,0217 -0,0187 123,1220 [0,000]
37 -0,0661 -0,0776 124,0754 [0,000]
38 -0,1221 -0,0701 127,3515 [0,000]
39 -0,0975 0,0206 129,4572 [0,000]
40 -0,1871 ** -0,1249 137,2684 [0,000]
41 -0,1311 * 0,0150 141,1360 [0,000]
42 -0,1751 ** 0,0558 148,0828 [0,000]
43 -0,1314 * -0,0765 152,0290 [0,000]
44 -0,1391 * -0,0463 156,4882 [0,000]
45 -0,1853 ** -0,2055 *** 164,4611 [0,000]
46 -0,1832 ** 0,0140 172,3156 [0,000]
47 -0,1254 0,0489 176,0257 [0,000]
48 -0,2140 *** -0,1183 186,9217 [0,000]
49 -0,1529 ** -0,0508 192,5338 [0,000]
50 -0,1650 ** 0,0272 199,1241 [0,000]
51 -0,0658 0,0757 200,1814 [0,000]
52 -0,0540 0,0132 200,9006 [0,000]
53 -0,0137 0,0660 200,9471 [0,000]
54 -0,0318 -0,0716 201,1997 [0,000]
55 -0,0450 0,0394 201,7108 [0,000]
56 0,0133 0,0120 201,7556 [0,000]
57 0,0317 -0,0472 202,0146 [0,000]
58 0,0181 0,0138 202,0999 [0,000]
59 -0,0195 -0,0490 202,2000 [0,000]
60 -0,0318 -0,0450 202,4670 [0,000]
Taula 2. Correlograma de la FAS i la FAP de sd_l_BAL
Com es pot observar, un cop aplicada la diferenciació estacional desapareix el
decreixement lent a la FAS als retards estacionals, fet que mostraria com ara la sèrie
ja és estacionaria en mitjana a la seva part estacional. En conseqüència, aquesta
primera fase d’anàlisi porta a concloure que la sèrie original no és estacionària en
variància i, un cop transformada en termes logarítmics, la nova sèrie no ho és en
mitjana en la seva part estacional, fet que ens ha portat a haver-la de diferenciar una
vegada la seva part estacional.
Arribat aquest punt, es pot afirmar que la sèrie l_ BAL segueix un esquema
ARIMA(p,0,q)x(P,1,Q) 12. El següent pas serà doncs tractar d’identificar el procés
ARMA de la part regular i estacional de la sèrie ja estacionaria. Per fer-ho, caldrà
analitzar els correlogrames de la FAS i la FAP de la sèrie sd_l_BAL (Gràfic 4 i Taula
Per tal de veure el procés generador de la part regular cal fixar-se en el comportament
dels primers retards (especialment, dels sis primers retards). En aquest cas s’observa
que tant la FAS com la FAP presenten un esquema coincident amb el d’un procés
AR(2).
En quant al component estacional, cal fixar-se en els coeficients múltiples de “ s ” (12,
24, 36, 48, ...). S’observa que els retards 12 i 24 de la FAP són significatius, per la qual
cosa el més probable és que segueixi un esquema MA(1) 12.
D’aquesta manera, al final d’aquesta primera etapa de la metodologia Box-Jenkins es
proposa el següent model a estimar:
Opció identificada : l_BAL∼ARIMA(2,0,0)x(0,1,1) 12
( 1 φ L φL )( 1 L ) Ln _ BALt δ ( 1 L ) ut
2.b) ESTIMACIÓ
A la segona fase de la metodologia Box-Jenkins es realitza l’estimació dels models
proposats. Per tal d’estimar la primera proposta, és a dir, un procés
ARIMA(2,0,0)x(0,1,1) 12, cal executar:
Model/Times series/Arima
A continuació s’especifica el model ARIMA que es vol estimar:
Dependent variable: (1-Ls) l_BAL
D’una altra banda, mostra l’estimació de tots els coeficients del model. Així, presenta el
valor de la constant (-0,0206451), dels coeficient de l’esquema AR de la part regular
(phi_1=0,471181) i (phi_2=0,18152), i del coeficient estimat de l’esquema MA(1) de la
part estacional (Theta_1=-0,201666). Com es pot observar, tot i disposar de dades des
de gener de 1999, el model s’estima emprant les dades des de gener de 2000 (s’ha de
tenir en compte en aplicar la diferenciació estacional es perden 12 observacions). Al
final de la taula, presenta un conjunt d’estadístics.
2.c) VALIDACIÓ
A la tercera etapa de la metodologia Box-Jenkins es porta a terme la validació del
model estimat. En aquesta fase s’analitzen tres punts bàsics:
⇒ La significació dels coeficients estimats
⇒ El compliment de les condicions d’estacionarietat i invertibilitat
⇒ El comportament dels residus de l’estimació
Opció 1: ARIMA(2,0,0)x(0,1,1) 12.
( 1 φ L φL )( 1 L ) Ln _ BALt δ ( 1 L ) ut
Pel que fa a la significació dels coeficients estimats del primer model, la significació
individual es pot analitzar a partir de la probabilitat associada al contrast individual que
mostra el programa. Així, amb l’excepció de la constant, la resta dels coeficients són
estadísticament significatius al 5%. Això porta a reestimar el model excloent el terme
constant (Taula 5).
Model 3: ARIMA, using observations 2000:01-2013:12 (T = 168)
Dependent variable: (1-Ls) l_BAL
Standard errors based on Hessian
Coefficient Std. Error z p-value
phi_1 0,475922 0,0824746 5,7705 <0,00001 ***
phi_2 0,185229 0,0805468 2,2996 0,02147 **
Theta_1 -0,199202 0,0836546 -2,3812 0,01725 **
Mean dependent var -0,017607 S.D. dependent var 0,
Mean of innovations -0,008180 S.D. of innovations 0,
Log-likelihood 119,6878 Akaike criterion -231,
Schwarz criterion -218,8797 Hannan-Quinn -226,
Taula 5. Estimació del model ARIMA(2,0,0)x(0,1,1) 12 sense terme constant
Un cop treta la constant, tots els coeficients estimats es poden considerar
significativament diferents de zero per un nivell de significació del 5%, per la qual cosa
cal mantenir-los al model.
Seguidament, es passa a analitzar el compliment de les condicions d’estacionarietat i
invertibilitat dels coeficients estimats:
- A la part regular s’ha estimat un esquema AR(2). L’esquema AR(2) sempre
serà invertible, i estacionari en la mesura que
o El sumatori dels dos paràmetres autoregressius sigui inferior a la unitat.
Així 0,475922+0,185229 donen una xifra inferior a la unitat
o El resultat de restar ambdós paràmetres autoregressius sigui inferior a
la unitat. Es pot observar que 0,185229-0,475922 dóna una xifra inferior
a 1, per la qual cosa es compleix la segona condició d’estacionarietat
o el coeficient phi_2 sigui menor a 1 en valor absolut. En aquest cas, i
donat que el coeficient estimat val 0,185229, es pot concloure que la
part regular compleix les condicions d’estacionarietat i invertibilitat.
- A la part estacional s’ha estimat un esquema MA(1). L’esquema MA(1) és
estacionari per definició, i serà invertible sempre que el seu coeficient sigui
menor a 1 en valor absolut. En aquest cas, i donat que el coeficient estimat val
-0,199202, es pot concloure que la part regular compleix les condicions
d’estacionarietat i invertibilitat.
Finalment caldrà analitzar si els residus de l’estimació es comporten segons un soroll
blanc mitjançant dos instruments: el gràfic dels residus i dels seus correlogrames. Per
fer un gràfic dels residus, cal executar la següent comanda al menú de la finestra
d’output de l’estimació:
Graphs/Residual plot/against time
-0,
-0,
-0,
-0,
0
0,
0,
0,
0,
2000 2002 2004 2006 2008 2010 2012 2014
residual
Regression residuals (= observed - fitted l_BAL)
Gràfic 5. Gràfic temporal dels residus de l’estimació del model
ARIMA(2,0,0)x(0,1,1) 12
52 -0,0069 0,0056 71,1970 [0,040]
53 0,0425 0,0756 71,6451 [0,045]
54 -0,0297 -0,0634 71,8666 [0,052]
55 -0,0799 0,0216 73,4794 [0,049]
56 0,0251 0,0284 73,6406 [0,057]
57 0,0533 0,0168 74,3725 [0,061]
58 0,0389 0,0628 74,7660 [0,068]
59 -0,0305 -0,0318 75,0099 [0,078]
60 -0,0477 -0,0303 75,6109 [0,084]
Taula 6. Correlograma de la FAS i la FAP dels residus de l’estimació del model
ARIMA(2,0,0)x(0,1,1) 12
-0,
-0,
-0,
0
0,
0,
0,
0 10 20 30 40 50 60 lag
Residual ACF
+- 1,96/T^0,
-0,
-0,
-0,
0
0,
0,
0,
0 10 20 30 40 50 60 lag
Residual PACF
+- 1,96/T^0,
Gràfic 6. Correlograma de la FAS i la FAP dels residus de l’estimació del model
ARIMA(2,0,0)x(0,1,1) 12
El resultat es mostra al Gràfic 6 i a la Taula 6. Es pot observar com cap de les
primeres autocorrelacions dels residus es pot considerar significativament diferent de
zero. Pel que fa a la part estacional, a cap dels retards múltiples de “ s ” les
autocorrelacions resulten significatives, indicant que els residus es comporten com un
soroll blanc. En conseqüència, el logaritme de la sèrie turistes estrangers arribats a
Balears segueix un esquema ARIMA(2,0,0)x(0,1,1) 12.
2.d) PREDICCIÓ
L’objectiu fonamental de la metodologia Box-Jenkins és obtenir prediccions per
períodes de fora de la mostra disponible. Si es volgués fer prediccions pels dotze
mesos següents a la darrera observació disponible (és a dir, pel període entre gener i
desembre de 2014), des de la finestra d’estimació del model caldria executar:
Analysis/Forecast
indicant que es volen predir les 12 observacions següents. Automàticament el
programa grafica la sèrie real (l_BAL) i la predita (Gràfic 8) i genera una taula amb les
prediccions puntuals i per interval per les dotze observacions demanades (Taula 8).
Les prediccions per interval es calculen assumint un grau de confiança del 95%.
10
10,
11
11,
12
12,
13
13,
14
14,
2007 2008 2009 2010 2011 2012 2013 2014 2015
l_BAL forecast 95 percent interval
Gràfic 8. Sèrie observada (l_BAL) i sèrie predita.
For 95% confidence intervals, z(0.025) = 1.
Obs l_BAL Prediction std. error 95% interval
Taula 8. Prediccions puntuals i per interval de la sèrie l_BAL