Docsity
Docsity

Przygotuj się do egzaminów
Przygotuj się do egzaminów

Studiuj dzięki licznym zasobom udostępnionym na Docsity


Otrzymaj punkty, aby pobrać
Otrzymaj punkty, aby pobrać

Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium


Informacje i wskazówki
Informacje i wskazówki

analiza danych panelowych, Streszczenia z Analiza danych

Analiza panelowa pozwala połączyć te dwa rodzaje badań - w jednym badaniu określa sie ... 2.1 Regresja standardowa a badania panelowe.

Typologia: Streszczenia

2022/2023

Załadowany 24.02.2023

blondie85
blondie85 🇵🇱

2.8

(4)

122 dokumenty

1 / 7

Toggle sidebar

Ta strona nie jest widoczna w podglądzie

Nie przegap ważnych części!

bg1
analiza danych panelowych
Joanna Tyrowicz
14 kwietnia 2007r.
Dotychczas analizowaliśmy dwa rodzaje danych. Pierwszym z nich było obserwowanie wielu
obiektów w tym samym czasie (np. gospodarstwa domowe, kraje, respondenci). Na tej pod-
stawie wyciągaliśmy wnioski na temat charakteru jakiegoś zjawiska i jego uwarunkowań. Drugim
rodzajem analizy było obserwowanie zmiennej (jednej lub kilku) w zmieniającym sie czasie (np.
stopy procentowe, inflacja, stopy bezrobocia). Rodzaj relacji, jaki obserwowaliśmy pomiedzy
tymi poszczegolnymi szeregami czasowymi określaliśmy mianem kointegracji.
Analiza panelowa pozwala połączyć te dwa rodzaje badań - w jednym badaniu określa sie
zarówno wymiar podmiotów, jak i wymiar czasu. W tym materiale zrobimy to na podstawie au-
tentycznych danych przygotowanych przez Jeffrey Frankel i Andrew K. Rose i opublikowanych
pod tytułem Estimating The Effect of Currency Union On Trade And Output (NBER Working
Paper No. 7875, 2002)1.
Rodzaj analizy, który zostanie tu przeprowadzony nosi miano modelu grawitacyjnego i jest
to technika bardzo popularna w badaniu handlu miedzynarodowego. Jej pionierem jest James
Anderson, który w 1978 przedstawił teoretyczne podstawy tego podejścia. Ogólnie rzecz biorąc
analizujemy model w którym z założenia:
Obroty H andlowei,j,t =P K Bi,t ·P KBj,t
Odleglosci,j
(1)
Jak widać z powyższego równania, mamy zarówno wymiar czasu (określony przez t) oraz
obiektu (i, j). Zlograrytmowanie obu stron równania daje postać testowalną empirycznie:
obroty handlowei,j,t =α+β1(pkbi,t +pkbj,t) + β2odleglosci,j +i,j,t (2)
Ta postać testowalna została rozszerzona przez Frankel’a i Rose (2002) i nią bedziemy sie
zajmować w dalszej cześci.
1Ścieżka dostepu do artykułu znajduje sie na stronie www.ekonometria.icm.edu.pl Materiały
1
pf3
pf4
pf5

Podgląd częściowego tekstu

Pobierz analiza danych panelowych i więcej Streszczenia w PDF z Analiza danych tylko na Docsity!

analiza danych panelowych

Joanna Tyrowicz

14 kwietnia 2007r.

Dotychczas analizowaliśmy dwa rodzaje danych. Pierwszym z nich było obserwowanie wielu obiektów w tym samym czasie (np. gospodarstwa domowe, kraje, respondenci). Na tej pod- stawie wyciągaliśmy wnioski na temat charakteru jakiegoś zjawiska i jego uwarunkowań. Drugim rodzajem analizy było obserwowanie zmiennej (jednej lub kilku) w zmieniającym sie czasie (np. stopy procentowe, inflacja, stopy bezrobocia). Rodzaj relacji, jaki obserwowaliśmy pomiedzy tymi poszczegolnymi szeregami czasowymi określaliśmy mianem kointegracji. Analiza panelowa pozwala połączyć te dwa rodzaje badań - w jednym badaniu określa sie zarówno wymiar podmiotów, jak i wymiar czasu. W tym materiale zrobimy to na podstawie au- tentycznych danych przygotowanych przez Jeffrey Frankel i Andrew K. Rose i opublikowanych pod tytułem Estimating The Effect of Currency Union On Trade And Output (NBER Working Paper No. 7875, 2002)^1. Rodzaj analizy, który zostanie tu przeprowadzony nosi miano modelu grawitacyjnego i jest to technika bardzo popularna w badaniu handlu miedzynarodowego. Jej pionierem jest James Anderson, który w 1978 przedstawił teoretyczne podstawy tego podejścia. Ogólnie rzecz biorąc analizujemy model w którym z założenia:

Obroty Handlowei,j,t = P KB Odleglosci,t^ ·^ P KBj,t i,j

Jak widać z powyższego równania, mamy zarówno wymiar czasu (określony przez t) oraz obiektu (i, j). Zlograrytmowanie obu stron równania daje postać testowalną empirycznie:

obroty handlowei,j,t = α + β 1 (pkbi,t + pkbj,t) + β 2 odleglosci,j + i,j,t (2)

Ta postać testowalna została rozszerzona przez Frankel’a i Rose (2002) i nią bedziemy sie zajmować w dalszej cześci. (^1) Ścieżka dostepu do artykułu znajduje sie na stronie www.ekonometria.icm.edu.pl −→ Materiały

1 Dane

Zbiór zawiera dane dotyczące obrotów handlowych miedzy niemal wszystkimi krajami świata. Dane pochodzą z różnorodnych źródeł. Uporządkowane są w nastepujący sposób:

  • Zmienną określającą rok dokonania obserwacji jest year. Obserwacje pochodzą z piecio- letnich przedziałów (od 1970 do 1995)
  • W tych latach dokonano pomiarów dla niemal 8000 ’par’ krajów określonych w zbiorze jako pairid. Stanowi to próbke relacji handlowych około 180 krajów świata.
  • Zmienną objaśnianą jest całkowity obrót handlowy w danym roku w obrebie danej pary (ltrade). Wielkości zostały zlogarytmowane, ponieważ tak podpowiada teoria.
  • Zmienne objaśniające to po kolei: - Logartym sumy realnych PKB w obu krajach w danej parze w danym roku (lrgdp). - Logartym sumy populacji w obu krajach a danej parze w danym roku (lpop). - Logartym odległości miedzy dwoma krajmi w danej parze (ldist) - Zmienną zerojedynkową cu określającą przynależność dwóch danych krajów do jed- nego wspólnego obszaru walutowego (np. 12 krajów EMU). - Zmienną zerojedynkową comlang określającą, czy dane dwa kraje posługują sie tym samym jezykiem, jako jezykiem oficjalnym (np. Belgia ma jezyk wspolny z krajami francuskojezycznymi, flamandzkojezycznymi oraz niemieckojezycznymi). - Zmienną zerojedynkową border określającą, czy dane dwa kraje mają wspólną granice lądową (np. Polska z Niemcami, Czechami, Słowacją, Ukrainą, Białorusią, Litwą i Rosją). - Zmienną bedącą sumą dwóch zmiennych zerojedynkowych colonial określającą, czy dane dwa kraje miały w ogóle przeszłość kolonialną (np. Polska i Austria razem nie) - Zmienną zerojedynkową comcol określającą, czy dane dwa kraje miały w przeszłości wspólnego kolonizatora (np. Australia i Kanada tak, a Australia i Japonia nie). - Zmienną zerojedynkową comctry o ile dane dwa kraje tworzyły kiedyś jeden kraj (np. Ghana i Rwanda).

serwacji, dla ilu lat mamy dla tej pary dane. Gdyby zrobić odwrotnie, STATA stworzyłaby grupe w danym roku dla wszystkich dostepnych par krajów. Nie ma zasady, która mówi, że należy postepować tak, a nie inaczej. Trzeba mieć jednak świadomość, że to zdefiniowanie bedzie miało wpływ na nasze wyniki - zdefiniowanie tych kryteriów grupowania określa rodzaj odpowiedzi, który dostaniemy w wyniku regresji panelowej. Określiwszy wymiary, możemy wykonać regresje panelową. Robimy to komendą:

. xtreg ltrade lrgdp lpop ldist Najpierw porównajmy wyniki obu estymacji. Jak widać, przedziały ufności nawet sie na siebie nie na chodza (poza zmienna ldist). Oznacza to, ze estymacja danych panelowych przy uzyciu standardowej regresji jest po prostu niepoprawna.

2.2 Interpretacja analizy panelowej

Aby zinterpretować wyniki regresji panelowej, wykonajmy całą regresje zaproponowaną przez Frankela i Rose’a^2.

. xtreg ltrade lrgdp lpop ldist cu comlang border comcol comctry colonial ll regional Interpretując po kolei wyniki estymacji należy zwrócić uwage na tytuł nadany przez STATA tej analizie, czyli stwierdzenie Random-effects GLS regression. Określenie Random-effects wynika z tego, iż STATA regresje z efektami zmiennymi wykonuje domyślnie. Gdybyśmy chcieli wykonać regresje z efektami stałymi ( fixed effect ) należy powyższą komedne zmodyfikować dodając na jej końcu opcje , fe^3. Prawy panel podsumowania wyników podaje nam liczbe grup (7 961) oraz obserwacji ( 226). Podaje również liczbe obserwacji w grupie: minimalną (1, inaczej nie byloby grupy), maksymalną (6, mamy tylko 25 lat obserwacji, które grupujemy sobie w okresy piecioletnie, aby pozbyc sie efektów związanych z oczywistą cyklicznością handlu i PKB) oraz średnią liczbe obserwacji w grupie (3.9). Na końcu podaje wyniki testu na łączną nieistotność parametrów (statystyka Walda). Lewy panel po pierwsze raportuje która ze zmiennych została określona za grupującą. Po drugie raportuje wielkości R^2. Dostaliśmy R^2 within, R^2 between oraz R^2 overall. Każda z tych statystyk ma inną interpretacje. Jeśli chodzi o R^2 within związane ono jest z wariancją wewnątrz grupy. W naszym przypadku grupy są bardzo małe i nic dziwnego, że dopasowanie w tym zakresie jest niewielkie. Statystyka R^2 between opisuje relacje wariancji w przestrzeni (^2) Zmienna island jest nieistotna, wiec nie bedziemy jej dalej rozpatrywac. (^3) Do kwestii wyboru efektów stałych czy zmiennych jeszcze wrócimy

pomiedzy grupami. W przypadku tych badań, to właśnie R^2 between jest tą statystyką, która nas interesuje najbardziej. Odpowiada nam ona na pytanie, jak dobrze przy użyciu modelu grawitacyjnego umiemy wyjaśnić schematy w handlu miedzynarodowym i okazuje sie, że w około 63%. Statystyka R^2 overall jest ważonym uśrednieniem tych dwóch statystyk i nie bardzo poddaje sie interpretacji innej niż intuicyjna. Poniżej statystk R^2 znajduje sie informacja o tym, ze załozono rozkład normalny dla efektów zmiennych oraz, że założono zerową korelacje miedzy tymi efektami a macierzą zmiennych objaśniających. Wyjaśnieniu tej kwestii poświecony jest nastepny podrozdział.

2.3 Efekty stałe, czy zmienne?

Wybór efektów stałych lub zmiennych może być podyktowany przez teorie, co nie wyklucza przetestowania słuszności tego wyboru na danym zbiorze danych. Wracając do równania (2) ze wstepu do tych materiałów, kwestie efektów w modelu można przedstawić jako wybór miedzy nastepującymi alternatywami:

obroty handlowei,j,t = α + β 1 (pkbi,t + pkbj,t) + β 2 odleglosci,j + i,j,t (3)

oraz

obroty handlowei,j,t = αi,j + β 1 (pkbi,t + pkbj,t) + β 2 odleglosci,j + i,j,t (4)

Dodanie indeksów do parametru α równoznaczne jest z zezwoleniem na efekty na efekty nieob- serwowalne (indywidualne). Intuicyjnie, oznacza to, iż pozwalamy by handel autonomiczny, to jest część handlu, która nie zmienia się w czasie była rózna dla poszczególnych par krajów. Jeśli użaywamy estymatora efektów losowych, że to oznaczać będzie, że zakładamy, że handel autonomiczny nie jest skorelowane ze zmiennymi objaśniającymi. Wybór estymatora efektów stałych oznacza iz uwazamy, że handel autonomiczny może być skorelowany ze zmienhnymi objaśniającymi. Oznacza zatem iż uważamy, że jest on taki sam dla pary Ghana-Polska jak dla pary Holandia-Belgia. Choć już na pierwszy rzut oka wydaje sie, że w tym modelu powinniśmy zezwolić na efekty zmienne, aby mieć pewność słuszności wyboru, powinniśmy przeprowadzić testy weryfikujące. Do określenia tego możemy skorzystać z dwóch rodzajów testów wbudowanych w STATA na podstawie wyników testów weryfikujących założenie o braku korelacji między efektami indy- widualnymi a zmiennymi objażniającymi. Oba mają podobną interpretacje choć nieco inne

2.4 Efekty stałe a efekt roku?

Do tej pory analizowaliśmy cały czas jakiś specyficzny efekt stały związany z obserwowaniem konkretnej pary krajów. Nie sprawdzaliśmy natomiast, czy przypadkiem nie wystepuje również stały i specyficzny efekt związany z momentem obserwacji. STATA jest bardzo dobrze wyposażona do analizowania tego typu efektów - korzystając z komendy xi możemy zarządać zweryfikowa- nia hipotezy o istotności tego typu efektów. xi:xtreg ltrade lrgdp lpop ldist cu ... i.year Jak widać, estymatory przy wszystkich latach są istotne, wiec pominiecie tego efektu mogło prowadzić do obciążoności estymatorów w poprzednich badaniach. Warto również zwrócić uwage iż regresja xi:xtreg ltrade lrgdp lpop ldist cu ... i.pairid jest równoznaczna z wyestymowaniem explicite wszystkich efektów stałych w modelu. Prosze jednak spróbować to zrobić - w wiekszości przypadków po dłuższej chwili namysłu STATA poda komunikat iż nie jest w stanie przeprowadzić tej operacji ze wzgledu na ograniczenia pamieci. Jak zauważycie w literaturze, w przypadku analiz danych panelowych bardzo czesto uwz- glednia sie ten element w regresji, natomiast nieczesto raportuje w wynikach badań (widać to na przykład w uwagach pod tabelami w artykule Frankela i Rose’a).