Materiały do wykładów i ćwiczeń z ekonometrii - Notatki - Ekonometria, Notatki'z Ekonometria
hermiona80
hermiona8031 May 2013

Materiały do wykładów i ćwiczeń z ekonometrii - Notatki - Ekonometria, Notatki'z Ekonometria

PDF (399 KB)
73 strony
1Liczba pobrań
522Liczba odwiedzin
Opis
Ekonomia: notatki z zakresu ekonometrii przedstawiające materiały do wykładów i ćwiczeń z ekonometrii.
20punkty
Punkty pobierania niezbędne do pobrania
tego dokumentu
Pobierz dokument
Podgląd3 strony / 73
To jest jedynie podgląd.
3 shown on 73 pages
Pobierz dokument
To jest jedynie podgląd.
3 shown on 73 pages
Pobierz dokument
To jest jedynie podgląd.
3 shown on 73 pages
Pobierz dokument
To jest jedynie podgląd.
3 shown on 73 pages
Pobierz dokument
EKONOMETRIA

Mikołaj Rybaczuk

Wydział Zarządzania Politechniki Białostockiej Katedra Informatyki i Logistyki

MATERIAŁY DO WYKŁADÓW I ĆWICZEŃ Z EKONOMETRII

Białystok 2001

2

Definicja

Ekonometria jest nauką o metodach badania ilościowych prawidłowości występujących w zjawiskach ekonomicznych za pomocą aparatu matematyczno-statystycznego. Stara się znaleźć ilościowe relacje, w jakich zmiana jednych wielkości (odgrywających rolę przyczyn) prowadzi do zmiany innych wielkości (skutków) przy jednoczesnym wyeliminowaniu wpływu na skutki innych, ubocznych, czynników.

Warunki wstępne, które muszą być spełnione, by prawidło- wości ekonomiczne mogły być przedmiotem analizy ekono- metrycznej: a) prawidłowość ekonomiczna musi być stała w czasie lub

ulegać nieznacznym i powolnym zmianom, b) wszystkie zjawiska uwzględniane w analizie ekonome-

trycznej muszą być mierzalne, c) musi istnieć grupa czynników, których wpływ na badane

zjawiska jest dominujący. Celem analizy jest szczegółowe wyodrębnienie wpływu każdego spośród czynników domi- nujących, podczas gdy wpływ czynników ubocznych (przypadkowych) jest ujmowany sumarycznie i interesuje nas jedynie rząd wielkości tego wpływu,

d) dostępne są dane statystyczne dotyczące kształtowania się wyróżnionych czynników. Badania ekonometryczne opie- rają się zasadniczo na dwóch rodzajach danych: - szeregach czasowych wartości poszczególnych zmien-

nych; - danych przekrojowych (ilustrujących kształtowanie się

pewnych zmiennych u różnych jednostek interesującej nas zbiorowości w tym samym momencie czasu).

3

Model ekonometryczny Model ekonometryczny jest to konstrukcja formalna, która za pomocą jednego równania lub układu równań przedstawia zasadnicze powiązania występujące pomiędzy rozpatrywany- mi zjawiskami ekonomicznymi. Model ekonometryczny powinien uwzględniać jedynie te związki między rozpatrywanymi zjawiskami, które są trwałe, i w których siła oddziaływania jednego zjawiska na drugie jest duża.

Model ekonometryczny przedstawia za pomocą równań zależności występujące pomiędzy zmiennymi.

Y=f(X1,X2,...,Xk,ε)

Zmienna endogeniczna (Y) – zmienna bieżąca lub opóźniona, która jest wyjaśniana przez model. Zmienne objaśniające (X1,X2,...,Xk) – zmienne (mierzalne lub niemierzalne), które w modelu występują jako zmienne, za pomocą których wyjaśnić chcemy prawidłowości w zakresie kształtowania się zmiennej endogenicznej. Zmienne egzogeniczne – zmienne, które występują w modelu dla przedstawienia mechanizmu wahań określonej zmiennej endogenicznej, jednak same nie są wyjaśniane przez model ekonometryczny. f – symbol oznaczający postać analityczną funkcji. Składnik losowy ε – łączny efekt oddziaływania na zmienną endogeniczną tych wszystkich czynników, które nie zostały uwzględnione jako zmienne objaśniające w modelu.

Składnik losowy ε jest zmienną losową. Na ogół zakłada się, że E(ε)=0. Istotne jest poznanie wariancji D2(ε), gdyż od jej war- tości zależy dokładność wnioskowania na podstawie modelu.

4

W modelach ekonometrycznych występują dwa rodzaje para- metrów: – parametry strukturalne modelu – zależy od nich wartość

funkcji f ; – parametry rozkładu składnika losowego ε modelu.

Etapy budowy modelu 1. Sprecyzowanie zakresu badania

– prawidłowy dobór zmiennych endogenicznych i objaśnia- jących, Trzy sposoby podejścia: a) opieramy się na istniejącej teorii ekonomicznej; b) gdy teoria nie jest dostatecznie rozwinięta i szczegóło-

wa – wychodzimy od materiału empirycznego. Szuka- my zmiennych, które są skorelowane ze zmiennymi endogenicznymi i są podstawy do przypuszczeń, że pozostają one ze zmiennymi endogenicznymi w związ- ku przyczynowo-skutkowym;

c) gdy teoria nie wskazuje na zmienne, które odgrywają rolę przyczyn w stosunku do zmiennych endogenicz- nych – jako zmienne objaśniające wybiera się te, które silnie korelują ze zmiennymi endogenicznymi,

– wybór analitycznej postaci równań modelu. 2. Zebranie danych statystycznych (w postaci szeregów czaso-

wych i danych przekrojowych), na podstawie których można będzie oszacować parametry strukturalne modelu i parame- try składnika losowego. Problem danych niedostępnych.

3. Estymacja parametrów modelu. 4. Weryfikacja modelu – ocena sensowności parametrów

strukturalnych i ocena, czy model z dostateczną dokładnoś- cią opisuje wahania zmiennych endogenicznych.

5. Praktyczne wykorzystanie modelu – ocena prawidłowości ilościowych w przeszłości lub wnioskowanie w przyszłość (predykcja).

5

Klasyfikacja modeli ekonometrycznych Z punktu widzenia walorów poznawczych: 1) modele przyczynowo-opisowe – między zmienną endoge-

niczną a zmiennymi objaśniającymi (przyczynami) każdego równania zachodzą związki przyczynowo-skutkowe (np. Y – dochód narodowy, X – zatrudnienie w sferze produkcji materialnej),

2) modele symptomatyczne – równania (ewentualnie niektóre z nich) nie mają interpretacji przyczynowo-skutkowej, rolę zmiennych objaśniających odgrywają zmienne silnie skore- lowane ze zmiennymi endogenicznymi (np. Y – dochód narodowy, X – liczba ludności w wieku produkcyjnym),

3) modele tendencji rozwojowych – opisują wahania zmien- nych endogenicznych w czasie z wyróżnieniem takich elementów jak trend, wahania periodyczne i przypadkowe.

Ze względu na czynnik czasu: 1) modele statyczne – zmienne występują bez opóźnień czaso-

wych (wszystkie odnoszą się do tego samego okresu lub momentu czasu), w zbiorze zmiennych objaśniających nie występuje zmienna czasowa t,

2) modele dynamiczne – pokazują rozwój zmiennych endoge- nicznych w czasie (model trendu, model autoregresyjny).

Ze względu na złożone powiązania między zmiennymi endo- genicznymi modelu: 1) modele proste, 2) modele rekurencyjne, 3) modele o równaniach współzależnych.

Ze względu na postać analityczną modelu: 1) modele liniowe, 2) modele nieliniowe.

6

Konstrukcja jednorównaniowego liniowego modelu ekono- metrycznego Dobór zmiennych do modelu – podstawowe kryterium: zmien- ne silnie skorelowane ze zmienną objaśnianą i słabo skorelo- wane między sobą:

- metoda Hellwiga Dana jest zmienna endogeniczna (objaśniana) Y oraz zbiór X={X1,X2,...,Xm} m kandydatek na zmienne objaśniające do jednorównaniowego modelu ekonome- trycznego. Dane są współczynniki korelacji liniowej Pearsona (R0 – cechy Y ze zmiennymi objaśniającymi,

R – cech objaśniających między sobą): Niepustych kombinacji zmiennych ze zbioru X jest 2m-1. Przez Cs oznaczymy zbiór numerów zmiennych wcho- dzących w skład s-tej kombinacji.

Określamy indywidualną pojemność informacyjną zmiennej Xj wchodzącej w skład s-tej kombinacji: Określamy integralną pojemność informacyjną s-tej kom- binacji:

Miary indywidualna jak i integralna przyjmują wartości z przedziału [0,1]. Najlepszy jest ten zestaw zmiennych objaśniających, dla którego pojemność integralna Hs jest największa, czyli:

     

     

=

     

     

=

1

1 1

1

321

33231

22321

11312

3

2

1

0 RR

!

"#"""

!

!

!

"

rrr

rrr rrr rrr

r

r r r

mmm

m

m

m

m

∑ ∈

=

C si ij

j sj r

rh 2

∑ ∈

= Csj

sjs hH

}12...,,2,1:max{: −== msopt sopt HHC

7

Przykład: Y – liczba studentów studiów dziennych w tys. osób

(w latach 1965-89), X1 – dynamika dochodu narodowego (ceny stałe –

1950=100), X2 – liczba miejsc w domach studenckich w tys., X3 – liczba ludności w wieku 20-24 lata w tys. osób, X4 – dynamika płac realnych (ceny stałe, 1950=100), X5 – liczba ludności z wykształceniem wyższym w tys. Wybrać optymalny podzbiór zmiennych.

Y Lata X1 X2 X3 X4 X5 Y 1,000 0,750 0,941 0,933 0,701 0,928 0,710

LATA 0,750 1,000 0,850 0,917 0,129* 0,674 0,992 X1 0,941 0,850 1,000 0,932 0,511 0,897 0,818 X2 0,933 0,917 0,932 1,000 0,454 0,834 0,899 X3 0,701 0,129* 0,511 0,454 1,000 0,602 0,047* X4 0,928 0,674 0,897 0,834 0,602 1,000 0,648 X5 0,710 0,992 0,818 0,899 0,047* 0,648 1,000

Podzbiory (zawęzimy do X1-X3): C1:{X1}; C2:{X2}; C3: {X3}; C4:{X1,X2}; C5:{X1,X3}; C6:{X2,X3}; C7:{X1,X2,X3} h11=0,9412/1=0,885; H1=0,885 h22=0,9332/1=0,870; H2=0,870 h33=0,7012/1=0,491; H3=0,491 h41=0,9412/(1+0,932)=0,458; h42=0,9332/(1+0,932)=0,451; H4=0,909 h51=0,9412/(1+0,511)=0,576; h53=0,7012/(1+0,511)=0,325; H5=0,901 h62=0,9332/(1+0,454)=0,599; h63=0,7012/(1+0,454)=0,338; H6=0,937 h71=0,9412/(1+0,932+0,511)=0,362; h72=0,9332/(1+0,932+0,511)=0,356; h73=0,7012/(1+0,932+0,511)=0,201; H7=0,919

8

Wniosek: najlepszy podzbiór spośród X1, X2, X3: X2, X3. - metoda analizy grafów

Testujemy testem t-Studenta dla współczynników korela- cji H0: rij≠0 dla ij – można obliczyć wartość krytyczną współczynnika korelacji r* według wzoru:

W macierzy R zerujemy wszystkie współczynniki kore- lacji nie różniące się istotnie od zera, a następnie budu- jemy graf powiązań między zmiennymi. Wierzchołkami grafu są zmienne, a łączącymi je krawędziami – istotnie różne od zera współczynniki korelacji. Do modelu wybieramy po jednej zmiennej z każdej gru- py – tą, która jest najsilniej skorelowana ze zmienną endogeniczną. Przykład: Metodą grafów wybrać optymalny podzbiór zmiennych objaśniających, gdy dany jest krytyczny współczynnik korelacji r*=0,4 oraz macierze współczynników korelacji:

Zerujemy współczynniki nie różniące się istotnie od zera (r≤r*):

t tr n 2

2 *

2 α

α

+− =

    

    

− −

−−− −− −

=

        

        

− −

=

00,1 12,000,1 07,015,000,1

25,030,010,000,1 45,010,040,030,000,1

43,050,020,015,060,000,1 17,006,040,050,007,012,000,1

oraz

15,0 20,0 15,0 50,0 70,0 25,0

85,0

0 RR

[ ]

    

    

− −

=

00,1 00,1

00,1 00,1

45,000,1 43,050,060,000,1

50,000,1 7654321

R

9

Uzyskujemy 3 grafy:

Wybieramy X5, X1 – jako silniej skorelowaną z Y niż X4 oraz X2 – gdyż X2 stanowi wierzchołek o najwyższym stopniu (r(X2)=3).

Szacowanie parametrów jednorównaniowego modelu liniowego

Y=α0+ α1X1 + α2X2 +...+αkXk

Zakładamy, że dysponujemy - wartościami zmiennej endogenicznej yt w okresie

t=1,2,...,n; - wartościami n-elementowych szeregów czasowych, które

zapisujemy jako xjt – wartość j-tej zmiennej w okresie t=1,2,...,n lub wartościami zmiennej objaśniającej na n obiektach w przypadku danych przekrojowych.

W ujęciu macierzowym:

- wektor obserwacji zmiennej objaśnianej,

5 1 4

23 6

7

   

   

=

× y

y y

y

n n

" 2

1

1

10

- macierz zaobserwowanych wartości zmiennych objaś- niających

- wektor składników losowych,

- wektor nieznanych parametrów modelu.

Uzyskujemy dwa warianty zapisu:

yt=α0+α1x1t+α2x2t+...+αkxktt, t=1,2,...,n

lub macierzowo

y=Xα+ε.

   

   

=

xxx

xxx xxx

knnn

k

k

kn!

"#"""

!

!

21

22212

12111

)1(1

1 1

X

   

   

=

×ε

ε ε

ε

n n

"

2

1

1

    

    

=

×+α

α α α

α

k k

"

2

1

0

1)1(

11

Założenia klasycznej metody najmniejszych kwadratów: 1) zmienne objaśniające Xj są nielosowe i nieskorelowane ze

składnikiem losowym ε; 2) rz(X) = k+1 ≤ n; 3) E(ε)=0; 4) D2(ε) = E(εεT) = σ2I, σ2 < ∞; 5) εt: N(0,σ2) dla t=1,2,..., n.

Metoda najmniejszych kwadratów (MNK): Celem jest wyznaczenie ocen nieznanych parametrów α mo- delu za pomocą ich estymatorów a.

Wartości zmiennej objaśnianej obliczonej ze wzoru = a0 + a1x1t + a2x2t + ... + akxkt, t=1, 2, ..., n nazywamy wartościami teoretycznymi (oczekiwanymi). W za- pisie macierzowym możemy zapisać:

Różnicę między wartościami empirycznymi yt a teoretycznymi nazywamy resztą dla okresu t, co w zapisie macierzowym ma postać:

yt̂ yt̂

aX

a

a a

1

1 1

ˆ

ˆ ˆ

ˆ

n

2

1

21

22212

12111

=

   

   

=

   

   

=

       

       

"

!

"#"""

!

!

"

xxx

xxx xxx

y

y y

y

knnn

k

k

n

2

1

yt̂

aX

a

a a

1

1 1

ˆ

ˆ ˆ

n

2

1

21

22212

12111

−=

   

   

−===

       

       

       

       

       

       

       

       

       

       

y

xxx

xxx xxx

y

y y

y

y y

y

y y

e

e e

e

knnn

k

k

n

2

1

n

2

1

n

2

1

n

2

1

"

!

"#"""

!

!

""""

12

Metoda najmniejszych kwadratów służy do wyznaczenia ta- kiego wektora a oszacowań parametrów α, przy którym suma kwadratów odchyleń wartości teoretycznych od empirycznych zmiennej objaśniającej y osiągnie minimum:

S(a) = eTe = (y-Xa)T(y-Xa)=yTy – 2aTXTy+aTXTXa. Warunkiem koniecznym istnienia ekstremum funkcji S(a) jest Kolejne przekształcenia prowadzą do układu równań:

-2XTy+2XTXa = 0 i następnie do układu Cramera XTXa = XTy. Jeżeli rz(X)=k+1 (spełnione założenie 2) powyższy układ rów- nań ma jedyne rozwiązanie dane wzorem:

a = (XTX)-1XTy. Wektor a jest liniowym (każda jego składowa jest liniową funkcją składowych wektora y), zgodnym (zbieżnym stocha- stycznie do α), nieobciążonym (E(a)=α) i najefektywniejszym (mającym najmniejszą wariancję) estymatorem wektora α. Przykład Oszacować parametry strukturalne modelu opisującego współ- zależność między Yi – wydajnością pracy wyrażoną w sztu- kach/miesiąc a X1i – stażem pracy w latach i X2i – zmienną ze- ro-jedynkową wyrażającą poziom kwalifikacji (0 – bez wyksz- tałcenia zawodowego; 1 – posiada wykształcenie zawodowe).

yi - wydajność x1i x2i 155 1 0 171 2 1 172 3 0 207 5 1 201 4 1 210 5 1

0 a

S(a) = ∂

13

  

  

 =

       

       

= 111010 545321 111111

X

151 141 151 031 121 011

X T

( )     

    

= −

    

    

=

− −−

25.125.000.0 25.0125.025.0

00.025.01

XX 4164 168020 4206

XX T 1T

( )   

  

 ⋅

− −−

    

    

= −

111010 545321 111111

25.125.000.0 25.0125.025.0

00.025.01

XXX TT 1

( )

  

  

 =

      

      

  

  

−− −−

−−

= =−

75.10 5.11 5.140

210 201 207 172 171 155

025.0075.075.025.0 125.00125.0125.025.0125.0

25.0025.025.05.075.0 yXXXa TT

1

14

WERYFIKACJA JEDNORÓWNANIOWEGO MODELU EKONOMETRYCZNEGO

A. Weryfikacja merytoryczna

1. Bada się zgodność znaków ocen parametrów z wiedzą ekonomiczną o modelowanym zjawisku. Ocena aj para- metru strukturalnego αj mówi, o ile zmieni się wartość zmiennej Xj, przy której znajduje się parametr.

2. Jeżeli wiedza ekonomiczna nie wyjaśnia wystarczająco modelowanego zjawiska, wówczas sprawdzamy, czy model ekonometryczny jest koincydentny. Mówimy, że model jest koincydentny, gdy dla każdej zmiennej objaśniającej Xi spełniony jest warunek

sgn ri = sgn ai. 3. Miarami dokładności dopasowania modelu do danych

empirycznych jest współczynnik zbieżności ϕ2

lub współczynnik determinacji R2 określający, jaka część zmienności zmiennej objaśnianej Y jest wyjaśniona przez model:

R2 jest liczbą z przedziału [0, 1]. Odpowiednią interpretację współczynnikowi R2 można nadać tylko wtedy, gdy: – model jest liniowy, – model zawiera wyraz wolny, – parametry modelu oszacowano metodą najmniejszych

kwadratów.

ϕ 22 1R −=

( ) ( ) yyy

yXayy yyy

eeˆ 2T

TTT

2T

T

1

2 1

2

2

nn −

− =

− ==

∑ −

∑ −

=

= n

t

n

t

yy

yy

t

ttϕ

15

Jeżeli k+1 – liczba szacowanych parametrów modelu jest niewiele mniejsza od liczby obserwacji n, to stosujemy skorygowany współczynnik determinacji

Skorygowany współczynnik determinacji nie jest unor- mowany (może przyjmować wartości ujemne). Gdy model ekonometryczny nie ma wyrazu wolnego do mierzenia dopasowania modelu do danych empirycznych stosuje się niescentrowany współczynnik determinacji:

4. Efekt katalizy – niosą zmienne zwane katalizatorami – polega na uzyskiwaniu zbyt wysokiej wartości współ- czynnika determinacji R2, mimo że zmienne objaśniają- ce i objaśniana nie uzasadniają tego. Mając dane macierze współczynników korelacji:

uporządkujmy zmienne Xi tak, że współczynniki kore- lacji z wektora R0 będą spełniały warunek:

0< r1 ≤ r2 ≤ ... ≤ rk By uzyskać tylko dodatnie współczynniki korelacji, mnożymy ujemnie korelujące zmienne przez –1. Przy tak uporządkowanych zmiennych objaśniających z pary zmiennych (Xi, Xj) zmienna Xi będzie katalizato- rem, gdy

( ) RRR-1RR 22222 ,)1( ≤+−−= kn k

]1,0[1 Ryy eeR 2NT

T 2

N ∈−=

     

     

=

     

     

=

1

1 1

1

321

33231

22321

11312

3

2

1

0 RR

!

"#"""

!

!

!

"

rrr

rrr rrr rrr

r

r r r

kkk

k

k

k

k

.lub0 r rrr

j

i ijij ><

16

Natężenie efektu katalizy mierzymy za pomocą miary: η = R2 – H,

gdzie H jest integralną pojemnością informacyjną zesta- wu zmiennych objaśniających modelu z metody Hellwi- ga doboru zmiennych do modelu. Spełniona jest nierówność 0 ≤ η ≤ 1. Do porównywania różnych modeli wygodne jest względne natężenie efektu katalizy:

B. Weryfikacja statystyczna

1. Analiza błędów oszacowań parametrów Estymatorem obciążonym wariancji składnika resztowe- go (losowego) S2 jest:

lub nieobciążonym

Macierz kowariancji estymatora wektora parametrów a dana jest wzorem:

Szczególne znaczenie mają pierwiastki elementów z głównej przekątnej macierzy D2(a)

nazywane średnimi błędami oszacowań parametrów mo- delu (odchyleniami standardowymi) oraz średnie względ- ne błędy oszacowań parametrów

%.100ç

RW 2ç ⋅=

( ) )TT(11 XayyyˆS 1

222 −∑ − −=−=≈ = knttkn n

t yyσ

( ) )TT( 1

1 1

1 XayyyˆŜ 1

222 −∑ − −−=−−=≈ = knttkn n

t yyσ

[ ]dX)X(ŜX)X(ó(a)D )1)(1(1212 TT2 ij kk ++−− =≈=

kjjja jS ...,,1,0,d ==

kj j

a j

a S

...,,1,0%100 =⋅

17

cd. przykładu ze str. 11

Błędy średnie (odchylenia standardowe) oszacowań parametrów:

[ ] =

   

  

   

  

       

       

− −−

=

= −−

= −

75.208 25.197 75.208

175 25.174

152

210201207172171155210200 126

1

)TT( 1

1 XayyyŜ 2

kn

( )

    

    

    

    

= −

− −−

− =

= −

−− −

=

69.1994.300.0 94.397.194.3

00.094.375.15

25.125.000.0 25.0125.025.0

00.025.01 75.15XXŜ)a(D T

22 1

44.469,19)D(40.197,1)D(97.375,15)D( aaa 210 ======

{ }

8125.11

75.1575.210152210200 3 1

S2 = =−=

18

2. Ocena istotności parametrów modelu ekonometrycznego

a) test t-Studenta Przyjmując, że spełnione jest założenie 5) klasycznej metody najmniejszych kwadratów ze str. 10 dotyczące normalności składnika resztowego, to zmienna losowa

ma rozkład t-Studenta z n-k-1 stopniami swobody. Wykorzystywana jest ona jako sprawdzian testu do weryfikacji hipotezy H0: αj=0 przy hipotezie alterna- tywnej H1: αj≠0.

b) Uogólniony test Walda Jeżeli zbudowany jest model ekonometryczny z k zmiennymi objaśniającymi i chcemy go rozbudować przez wprowadzenie m nowych zmiennych objaśnia- jących, to do oceny czy łączny efekt wprowadzanego zestawu zmiennych jest istotny służy test Walda. Weryfikuje on hipotezę H0: αk+1= αk+2= ... = αk+m=0 przy hipotezie alternatywnej H1: co najmniej jeden z testowanych parametrów jest różny od zera. Test można zastosować po oszacowaniu parametrów modeli podstawowego i rozszerzonego o ile można przyjąć, że spełnione jest założenie 5) klasycznej me- tody najmniejszych kwadratów ze str. 10 dotyczące normalności składnika resztowego. Sprawdzianem testu jest statystyka

gdzie e – wektor składników resztowych modelu pod- stawowego i r – wektor składników resztowych mode- lu rozszerzonego. Zmienna losowa F ma rozkład F- Snedecora z r1=m i r2=n-k-1-m stopniami swobody.

kj S at

a j

j ...,,1==

( ) , m)-1-k-r/(nr

/rr-eeF T

TT m=

19

Do zweryfikowania hipotezy o istotności wszystkich zmiennych objaśniających w modelu podstawowym, czyli: H0: α1= α2= ... = αk=0 przy hipotezie alterna- tywnej H1: przynajmniej jeden z parametrów jest róż- ny od zera, stosujemy sprawdzian

gdzie R2 – scentrowany współczynnik determinacji zbudowanego modelu. Zmienna losowa F ma rozkład F-Snedecora z r1=k i r2=n-k-1 stopniami swobody.

Test ten może być wykorzystany do oceny istotności współczynnika determinacji modelu, czyli H0: R2=0 przy konkurencyjnej hipotezie H1: R2≠0.

c) test mnożnika Lagrange’a Jeżeli nie można przyjąć, że spełnione jest założenie 5) klasycznej metody najmniejszych kwadratów ze str. 10 dotyczące normalności składnika resztowego, to stosowany jest ten test do zweryfikowania hipotezy o istotności zestawu m zmiennych objaśniających rozszerzających model podstawowy, w którym już jest k zmiennych, czyli analogicznie jak w teście Walda H0: αk+1= αk+2= ... = αk+m=0 przy hipotezie alternatyw- nej H1: co najmniej jeden z testowanych parametrów jest różny od zera. By zastosować ten test szacujemy parametry modelu podstawowego, obliczamy wektor składników reszto- wych, następnie szacujemy parametry i współczynnik determinacji R2 modelu:

, 1)-k-)/(nR-(1

/RF 2

2 k=

nttjt mk

j j ...,,2,1,hxââe

1 0t =+∑+=

+

=

20

Dla n>30 statystyka n⋅R2 ma rozkład χ2 z m stopniami swobody. Jeżeli odrzucimy H0, to co najmniej jedna ze zmiennych rozszerzających powinna być włączona do modelu podstawowego.

3. Ocena liniowości modelu ekonometrycznego Do zweryfikowania hipotezy H0: oszacowany model ekonometryczny jest liniowy przy hipotezie alternatyw- nej H1: model nie jest liniowy, stosowany jest test serii Walda-Wolfowitza omówiony w ramach wykładu ze statystyki. Zasada: po uporządkowaniu ciągu reszt według wybra- nej zmiennej objaśniającej określamy stopień przemie- szania znaków dodatnich i ujemnych reszt. Resztom ujemnym przyporządkowujemy A, dodatnim – B i usta- lamy liczbę serii:

ABBBABAAAABAABAAAABBBBBBAA Niech r oznacza liczbę serii, n1 i n2 – liczbę symboli A i B. Jeżeli liczebności prób są mniejsze lub równe 20, musi- my skorzystać ze specjalnych tabel lub pakietów sta- tystycznych. Jeżeli n1 i n2 są większe niż 20, to rozkład liczby serii można przybliżyć rozkładem normalnym:

Sprawdzianem hipotezy H0 jest statystyka

gdzie r oznacza liczbę serii. Z tablic rozkładu N(0,1) lub t-Studenta z ∞ liczbą stopni swobody odczytujemy wartość krytyczną uα.

) )1()( )2(2

, 2

1N( 2121

2 212121

21

21

$$$$ %$$$$ &'$%$&' σ rmr

nnnn nnnnnn

nn nn

−++ −−

+ +

σ r rmu r −=obl

21

5. Ocena autokorelacji składnika losowego modelu ekono- metrycznego

a) test Durbina-Watsona Sprawdzenia wymaga spełnienie założenia 4) klasycznej metody najmniejszych kwadratów ze str. 11:

D2(ε) = E(εεT) = σ2I, którego niespełnienie powoduje że estymator a ma duże wariancje. Niech εt=ρεt-1+ηt , ρ <1 (ρ nazywamy współczynni- kiem autokorelacji) – opis procesu autokorelacji I rzędu. Niech ηt będzie zmienną losową spełniającą warunki: E(η)=0 i D2(η)=σ02I. Zachodzą następujące równości:

Nieobciążonym estymatorem współczynnika autokore- lacji jest:

By sprawdzić, czy składniki losowe modelu są skutkiem autokorelacji I rzędu stosowany jest test Durbina-Watso- na do zweryfikowania hipotezy H0: ρ=0 (nieskorelowa- nie składników losowych). Sprawdzianem jest statystyka

    

    

= −

=

1

1

1

)(oraz 1

1

ñññ

ñññ ñññ

Dñ ñ

3-n2-n1-n

2-n

1-n2

222

02 2

!

!!#!!

!

!

σεσ

∑∑

= −

=

= −

= n

t t

n

t t

n

t tt

ee

ee

2

2

1 2

2

2 1ρ̂

∑ −

∑ −

∑ −

= −

=

=

=

=

= −

≈ −

≈ −

= n

t t

n

t n

t t

n

t n

t t

n

t

e

ee

e

ee

e

ee tttttt

2

2

1

2

2

2

2

2

2

1

2

2

2 )()()( d

111

22

Z zapisu wynika, że d ≈ 2(1 - ) należy do przedziału [0, 4]. Tablice zawierające graniczne wartości d dla α=0.05 znaleźć można w zbiorze zadań Edwarda Nowa- ka Zarys metod ekonometrii. Zbiór zadań, PWN, War- szawa 1997. Przy weryfikacji H1: ρ>0 podane tam wartości dL i dU mają następującą interpretację: d≤ dL – H0 odrzucamy; d≥ dU – brak podstaw do odrzucenia H0; dL< d < dU – nie podejmujemy żadnej decyzji. Przy weryfikacji H1: ρ<0 podane tam wartości dL i dU mają następującą interpretację: d≥ 4-dL – H0 odrzuca- my; d≤ 4-dU – brak podstaw do odrzucenia H0; 4-dU< d < 4-dL – nie podejmujemy żadnej decyzji.

b) test mnożnika Lagrange’a W przypadku nie podjęcia żadnej decyzji testem Dur- bina-Watsona H0: ρ=0 przy H1: ρ≠0 stosujemy test, którego kroki mają postać: 1) szacujemy parametry interesującego nas modelu, 2) obliczamy składniki resztowe et, t=1, 2, ..., n, 3) szacujemy parametru modelu pomocniczego:

i obliczamy współczynnik determinacji R2 dla tego modelu,

4) Dla n>30 statystyka (n-1)⋅R2 ma rozkład χ2 z 1 stop- niem swobody.

ñ̂

ntttjt k

j j k ...,,2,1,heâxââe 110t 1

=+++= −∑ = +

23

6. Heteroskedastyczność składnika losowego modelu eko- nometrycznego Heteroskedastyczność składnika losowego – składniki losowe wzajemnie nieskorelowane, ale mają różne wa- riancje. Macierz kowariancji ma postać:

Sprawdzenie równości wariancji polega na zweryfiko- waniu hipotez: H0: const, t=1, 2, ..., n (składnik losowy homoske- dastyczny); H1: const, t=1, 2, ..., n (składnik losowy heteroske- dastyczny).

W przypadku normalności składnika losowego liniowego modelu ekonometrycznego do zweryfikowania powyż- szych hipotez można zastosować test Harrisona- McCabe’a.

a) test Harrisona-McCabe’a 1) Szacujemy parametry modelu y=Xα + ε. 2) Obliczamy reszty et, t=1, 2, ..., n. 3) Obliczamy wartość statystyki b ze wzoru:

m musi spełniać warunki: 1<m<n, m>k+1, n-m>k+1 i jest wyznaczane według zasady:

ntt

n

...,,2,1,,

00

00 00

)( ó

ó

ó ó

åD 2 2

2

2

2

1

2 =+∞<

    

    

=

!

!!!!

!

!

=ó 2

t

≠ó 2

t

∑ =

∑ == n

t t

m

t t

e

e

1 2

1 2

b

24

, n parzyste, reszty monotoniczne,

, n nieparzyste, reszty monotoniczne,

numer obserwacji, której odpowiada najwięk- sza (najmniejsza) co do modułu wartość resz- ty, jeżeli reszty najpierw rosną – później ma- leją.

4) Wyznaczamy wartości krytyczne:

gdzie F1 jest wartością krytyczną rozkładu F-Snede- cora dla poziomu istotności α z r1=n-m, r2=m-k-1 stopniami swobody, F2 – wartością krytyczną roz- kładu F-Snedecora dla poziomu istotności α z r1=n- m-k-1, r2=m stopniami swobody.

5) Decyzję podejmujemy następująco: b≤bL H0 odrzucamy, bL<b<bU nie podejmujemy żadnej decyzji, b≥bU brak podstaw do odrzucenia H0.

b) test White’a Stosujemy gdy n>30. 1) Szacujemy parametry modelu

yt=α0+α1x1t+α2x2t+...+εt, t=1, 2, ..., n i obliczamy reszty et i ich kwadraty. Przyjmujemy, że .

2) Szacujemy parametry pomocniczego modelu

   

   

− = 2

1 2 n

n

m

m kmn

km mn FbFb 2U1L )1(1

1

1 )(

1

1 ⋅−−−

+ =

−− ⋅−

+ =

≈ó 2

t e 2

t

hââ âââââó

...3122k2112k...

...222k 2 11k...22110

2

ttttt

ttttt

xxxx xxxx

++++++

++++++++=

25

3) Obliczamy współczynnik determinacji R2 dla mode- lu pomocniczego. Statystyka n⋅R2 ma rozkład χ2 z tyloma stopniami swobody, ile jest składników z x- em w modelu pomocniczym.

4) Na poziomie istotności α weryfikujemy H0: β1=β2=...=βk+1=βk+2=...=β2k+1=β2k+2=...=0

przy H1, że co najmniej jeden parametr jest różny od 0. Jeśli H0 nie zostanie odrzucona, składnik losowy mo- delu można uznać za homoskedastyczny.

7. Ocena normalności składnika losowego modelu ekono- metrycznego W celu zweryfikowania hipotez

H0: składnik losowy modelu liniowego ma rozkład normalny;

H1: składnik losowy modelu liniowego nie ma roz- kładu normalnego

możemy zastosować jeden z poniższych testów. a) test Jarque-Bera 1) Szacujemy parametry modelu y=Xα + ε. 2) Obliczamy reszty et, t=1, 2, ..., n. 3) Szacujemy wartość nieobciążonego estymatora od-

chylenia standardowego składnika losowego:

4) Szacujemy wartość miary asymetrii rozkładu reszt związanej z trzecim momentem (dla rozkładów symetrycznych równa się 0):

∑= =

n

t ten 1 21S

∑= =

n

t

te n 1 3

3

1 S

1 B

komentarze (0)
Brak komentarzy
Bądź autorem pierwszego komentarza!
To jest jedynie podgląd.
3 shown on 73 pages
Pobierz dokument