Analiza podregionów Polski - Notatki - Statystyka - Część 2, Notatki'z Statystyka. Opole University
Aleksy
Aleksy21 March 2013

Analiza podregionów Polski - Notatki - Statystyka - Część 2, Notatki'z Statystyka. Opole University

PDF (288.6 KB)
9 strona
469Liczba odwiedzin
Opis
W notatkach wyeksponowane są tematy z zakresu statystyki: analiza podregionów Polski. Część 2.
20punkty
Punkty pobierania niezbędne do pobrania
tego dokumentu
Pobierz dokument
Podgląd3 strony / 9
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.

- 10 -

Przegląd aglomeracji

Etap

Połączone skupienia

Współczynniki

Etap, na którym po raz pierwszy pojawia się

skupienie

Następny etap Skupienie 1 Skupienie 2 Skupienie 1 Skupienie 2

1 1 3 1,708 0 0 4 2 7 8 3,527 0 0 8 3 5 9 6,062 0 0 5 4 1 6 10,772 1 0 7 5 5 11 17,609 3 0 8 6 4 10 24,902 0 0 7 7 1 4 34,004 4 6 9 8 5 7 44,291 5 2 11 9 1 12 59,213 7 0 10 10 1 2 79,285 9 0 11 11 1 5 110,000 10 8 0

W pierwszej kolumnie znajdują się numery kroków, a w dwóch kolejnych numery skupień,

które w danym kroku zostały połączone. Czwarta kolumna pokazuje odległości euklidesowe

pomiędzy łączonymi skupieniami. Dwie kolejne kolumny pokazują numery kroków

grupowania, w których skupienia te pojawiają się po raz pierwszy. Ostatnia kolumna

pokazuje nr następnego kroku grupowania.

Wykres sopelkowy

Wykresy sopelkowe zawierają informacje o sposobie łączenia obserwacji w skupienia przy

każdej iteracji analizy. W mojej analizie jako pierwsze zostały połączone podregiony łódzki i

radomski( do których później został dołączony lubelski potem nowosądecki i olsztyński),

zielonogórski i gorzowski oraz wrocławski i częstochowski.

- 11 -

Pionowy wykres sopelkowy

Liczba skupień

Obiekt

8:zi elo nog

7:g orz ows

k

11:ł om żyń sk

9:w rocł aws

5:cz ęst och

2:w ars zaw

s

12: słup ski

10: olsz tyńs

4:n owo sąd e

6:lu bels ki

3:ra do

msk i

1:łó dzki

1 X X X X X X X X X X X X X X X X X X X X X X X 2 X X X X X X X X X X X X X X X X X X X X X X 3 X X X X X X X X X X X X X X X X X X X X X 4 X X X X X X X X X X X X X X X X X X X X 5 X X X X X X X X X X X X X X X X X X X 6 X X X X X X X X X X X X X X X X X X 7 X X X X X X X X X X X X X X X X X 8 X X X X X X X X X X X X X X X X 9 X X X X X X X X X X X X X X X 10 X X X X X X X X X X X X X X 11 X X X X X X X X X X X X X

- 12 -

Dendrogram Graficzna reprezentacja etapów grupowania danych w hierarchicznej analizie skupień,

pokazująca łączone w kolejnych krokach skupienia wraz z wartościami współczynników

odległości na każdym etapie grupowania. Pionowe linie reprezentują łączone obserwacje.

Odległości na dendrogramie są przeskalowane na liczby z przedziału od 0 do 25 tak, aby

stosunek odległości pomiędzy kolejnymi krokami nie uległ zmianie.

Metoda, która została zastosowana przy obliczaniu odległości między skupieniami to metoda

Warda, w której odległości między poszczególnymi obiektami definiuje się jako średnia

kwadratu odległości środków ciężkości klas

* * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ łódzki 1 radomski 3 lubelski 6 nowosąde 4 olsztyńs 10 słupski 12 warszaws 2 gorzowsk 7 zielono 8 częstoch 5 wrocławs 9 łomżyńsk 11

- 13 -

ANALIZA CZYNNIKOWA

Analiza czynnikowa służy identyfikacji zmiennych zwanych czynnikami, wyjaśniającymi

wzory korelacji występujące w ramach zbiorów obserwowanych zmiennych. Analiza

czynnikowa jest często wykorzystywana w redukcji danych w celu identyfikacji niewielkiej

liczby czynników, wyjaśniających większą część wariancji obserwowanej w dużej liczbie

zmiennych. Analiza czynnikowa może być również wykorzystywana do ustalania hipotez

dotyczących mechanizmów przyczynowo-skutkowych lub klasyfikowania zmiennych do

dalszych analiz (na przykład do identyfikowania współliniowości przed rozpoczęciem analizy

regresji liniowej).

Testy Kaisera-Mayera-Olkina i Bartletta Miara KMO adekwatności doboru próby

,284

Test sferyczności Bartletta Przybliżone chi-kwadrat 80,230 df 45 Istotność ,001

Wartość KMO jest to miara oceny adekwatności macierzy korelacji. Powinna być większa od

0,7. Tam, gdzie wartości są mniejsze należy wykluczyć daną zmienną.

1

Macierze przeciwobrazów

a Miary adekwatności doboru próby.

POW LUDNOSC ZG_NIEM SAL_MIGR PRZESTEP PRACUJAC BEZROBOT MIESZKAN MSC_NOCL PKB Macierz przeciwobrazów kowariancji

POW ,158 ,032 -,083 ,010 ,068 -,039 -,050 -,038 -,061 -,106 LUDNOSC ,032 ,012 -,024 -,005 ,023 -,015 -,014 -,008 -,022 -,037 ZG_NIEM -,083 -,024 ,117 -,025 -,104 ,012 ,053 ,050 ,051 ,098 SAL_MIGR ,010 -,005 -,025 ,065 ,044 ,018 -,013 -,037 ,009 -,004 PRZESTEP ,068 ,023 -,104 ,044 ,142 -,006 -,054 -,059 -,046 -,097 PRACUJAC -,039 -,015 ,012 ,018 -,006 ,028 ,007 ,000 ,026 ,037 BEZROBOT -,050 -,014 ,053 -,013 -,054 ,007 ,030 ,026 ,026 ,052 MIESZKAN -,038 -,008 ,050 -,037 -,059 ,000 ,026 ,036 ,016 ,038 MSC_NOCL -,061 -,022 ,051 ,009 -,046 ,026 ,026 ,016 ,044 ,079 PKB -,106 -,037 ,098 -,004 -,097 ,037 ,052 ,038 ,079 ,203

Macierz przeciwobrazów korelacji

POW ,293(a) ,752 -,611 ,098 ,457 -,587 -,723 -,511 -,734 -,596 LUDNOSC ,752 ,343(a) -,655 -,179 ,559 -,821 -,716 -,411 -,944 -,753 ZG_NIEM -,611 -,655 ,163(a) -,291 -,811 ,218 ,884 ,778 ,709 ,636 SAL_MIGR ,098 -,179 -,291 ,538(a) ,463 ,419 -,302 -,761 ,166 -,038 PRZESTEP ,457 ,559 -,811 ,463 ,089(a) -,094 -,830 -,838 -,588 -,575 PRACUJAC -,587 -,821 ,218 ,419 -,094 ,488(a) ,230 -,010 ,747 ,497 BEZROBOT -,723 -,716 ,884 -,302 -,830 ,230 ,325(a) ,784 ,701 ,663 MIESZKAN -,511 -,411 ,778 -,761 -,838 -,010 ,784 ,284(a) ,413 ,445 MSC_NOCL -,734 -,944 ,709 ,166 -,588 ,747 ,701 ,413 ,186(a) ,833 PKB -,596 -,753 ,636 -,038 -,575 ,497 ,663 ,445 ,833 ,191(a)

15

Całkowita wyjaśniona wariancja

Składowa

Początkowe wartości własne Sumy kwadratów ładunków po

wyodrębnieniu

Ogółem % wariancji %

skumulowany Ogółem % wariancji %

skumulowany 1 3,599 35,987 35,987 3,599 35,987 35,987 2 2,390 23,898 59,885 2,390 23,898 59,885 3 1,690 16,897 76,782 1,690 16,897 76,782 4 1,014 10,142 86,924 1,014 10,142 86,924 5 ,548 5,476 92,400 6 ,371 3,713 96,113 7 ,269 2,691 98,804 8 ,096 ,965 99,769 9 ,017 ,171 99,940 10 ,006 ,060 100,000

Metoda wyodrębniania czynników - Głównych składowych.

Wartości własne

W drugiej kolumnie powyższego arkusza wyników znajdujemy wariancję nowych kolejno

wyodrębnionych czynników. W trzeciej kolumnie wartości te są wyrażone jako procent

całkowitej wariancji (w tym przykładzie 10). Jak widać, czynnik 1 wyjaśnia 35,9 procent

wariancji, czynnik 2 23,8 procent itd.. Trzecia kolumna zawiera wyodrębnioną wariancję

skumulowaną. Wariancje wyodrębnione przez czynniki nazywają się wartościami własnymi.

16

Wykres osypiska

Numer składowej

10987654321

W ar

to ść

w ła

sn a

4

3

2

1

0

Wykres osypiska Jest metodą graficzną. Na prostym wykresie liniowym możemy przedstawić wartości własne z

powyższego arkusza wyników. Należy znaleźć miejsce, od którego na prawo występuje łagodny

spadek wartości własnych. Zgodnie z tym kryterium pozostawilibyśmy w naszym przykładzie

powyżej prawdopodobnie 4 lub 5 czynniki.

17

Macierz składowych Pokazuje jakie składowe najsilniej definiują poszczególne czynniki. Macierz składowych(a)

Składowa

1 2 3 4 POW ,677 -,429 -,059 ,385 LUDNOSC ,916 ,006 -,234 -,149 ZG_NIEM -,497 ,016 -,581 ,399 SAL_MIGR ,488 ,751 ,319 -,076 PRZESTEP ,079 -,314 ,568 ,713 PRACUJAC ,854 ,041 -,469 ,005 BEZROBOT ,854 -,328 -,249 ,056 MIESZKAN ,487 ,593 ,588 ,069 MSC_NOCL ,298 -,710 ,432 -,264 PKB ,158 ,759 -,236 ,304

Metoda wyodrębniania czynników - Głównych składowych. a 4 - liczba wyodrębnionych składowych. Pierwszy czynnik:

- ludność

Drugi czynnik

-PKB

Trzeci czynnik

-Mieszkania

Czwarty czynnik

-Przestępczość

18

Bibliografia: 1. Eugeniusz Gatnar „ Klasyfikacja danych za pomocą pakietu statystycznego SPSS for

Windows” 2. Internetowy Podręcznik Statystyki http://www.statsoft.pl/textbook 3. Pomoc pakietu SPSS 4. Wykłady z przedmiotu.

komentarze (0)
Brak komentarzy
Bądź autorem pierwszego komentarza!
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
Docsity is not optimized for the browser you're using. In order to have a better experience we suggest you to use Internet Explorer 9+, Chrome, Firefox or Safari! Download Google Chrome