Docsity
Docsity

Przygotuj się do egzaminów
Przygotuj się do egzaminów

Studiuj dzięki licznym zasobom udostępnionym na Docsity


Otrzymaj punkty, aby pobrać
Otrzymaj punkty, aby pobrać

Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium


Informacje i wskazówki
Informacje i wskazówki

Badanie statystyczne - Notatki - Statystyka - Część 2, Notatki z Statystyka, statystyka opisowa

W notatkach wyeksponowane są tematy z zakresu statystyki: badanie,populacja,jednostka statystyczne. Część 2.

Typologia: Notatki

2012/2013

Załadowany 21.03.2013

Aleksy
Aleksy 🇵🇱

4.8

(36)

437 dokumenty

1 / 9

Toggle sidebar

Pobierz cały dokument

poprzez zakup abonamentu Premium

i zdobądź brakujące punkty w ciągu 48 godzin

bg1
11
rk
si
1
1
Dzięki tablicy korelacyjnej możemy badać cechy mierzalne i niemierzalne.
Sposoby badania współzależności między cechami
Jeżeli rozpatrujemy w pewnej zbiorowości dwie cechy mierzalne, to związek między tymi
cechami może być związkiem funkcyjnym, gdy poszczególnym wartością jednej cechy
odpowiadają ściśle określone wartości drugiej cechy np. cena i wartość towaru.
Innego rodzaju związkiem jest zależność stochastyczna (probalistyczna), gdy
prawdopodobieństwo przyjęcia przez cechę X pewnej wartości wpływa na
prawdopodobieństwo przejęcia przez cechę Y określonej wartości.
Szczególnym przypadkiem zależności stochastycznej jest zależność korelacyjna.
Zależność korelacyjna między cechami polega na tym, że wzrostowi wartości jednej cechy
odpowiada wzrost lub spadek średnich wartości drugiej cechy.
Jeżeli wzrostowi wartości cechy X odpowiada wzrost średniej wartości cechy Y mówimy o
korelacji dodatniej.
Jeżeli natomiast wzrostowi wartości cechy X odpowiada spadek średnich wartości cechy Y
mówimy o korelacji ujemnej.
Jeżeli badane cechy opisane są szeregiem szczegółowym to:
- Na korelację dodatnią wskazuje fakt, że przy wzroście wartości pierwszej i drugiej cechy
mają tendencję wzrostową.
- Jeżeli wzrostowi wartości pierwszej cechy towarzyszy tendencja spadkowa w wartościach
drugiej cechy to wskazuje to na korelację ujemną.
Związek korelacyjny między cechami badamy tylko wówczas, gdy między tymi cechami
istnieje logicznie uzasadniony związek przyczynowo – skutkowy.
Miary ścisłości związku między cechami
Współczynnik zbieżności Czuprowa stosujemy go wyłącznie do tablicy korelacyjnej dla
dowolnych cech (mierzalnych i niemierzalnych)
Współczynnik korelacji Rang Spearmana stosujemy go wyłącznie do szeregu
szczegółowego dla cech mierzalnych lub niemierzalnych.
Stosunki korelacyjne stosuje się je wyłącznie do tablicy korelacyjnej dla cech
niemierzalnych.
Współczynnik korelacji liniowej Pearsona stosuje się go w szeregu szczegółowym i
tablicy korelacyjnej dla cech niemierzalnych.
Przykład:
Sześć firm zajmuje się usługami porządkowymi porównując ich wydatki na reklamę i
dochody.
Lp. Wydatki na reklamę
i
X
Dochody
i
Y
Ranga
i
X
Ranga
i
Y i
d 2
i
d
1 1,5 10 1 1 0 0
2 2,0 20 2 3,5 -1,5 2,25
3 2,5 20 3,5 3,5 0 0
4 2,5 15 3,5 2 1,5 2,25
5 4,5 25 5 5 0 0
6 5,0 30 6 6 0 0
18,00 120 4,50
pf3
pf4
pf5
pf8
pf9

Podgląd częściowego tekstu

Pobierz Badanie statystyczne - Notatki - Statystyka - Część 2 i więcej Notatki w PDF z Statystyka, statystyka opisowa tylko na Docsity!

k r

i s  

Dzięki tablicy korelacyjnej możemy badać cechy mierzalne i niemierzalne. Sposoby badania współzależności między cechami Jeżeli rozpatrujemy w pewnej zbiorowości dwie cechy mierzalne, to związek między tymi cechami może być związkiem funkcyjnym , gdy poszczególnym wartością jednej cechy odpowiadają ściśle określone wartości drugiej cechy np. cena i wartość towaru. Innego rodzaju związkiem jest zależność stochastyczna (probalistyczna), gdy prawdopodobieństwo przyjęcia przez cechę X pewnej wartości wpływa na prawdopodobieństwo przejęcia przez cechę Y określonej wartości. Szczególnym przypadkiem zależności stochastycznej jest zależność korelacyjna. Zależność korelacyjna między cechami polega na tym, że wzrostowi wartości jednej cechy odpowiada wzrost lub spadek średnich wartości drugiej cechy. Jeżeli wzrostowi wartości cechy X odpowiada wzrost średniej wartości cechy Y mówimy o korelacji dodatniej. Jeżeli natomiast wzrostowi wartości cechy X odpowiada spadek średnich wartości cechy Y mówimy o korelacji ujemnej. Jeżeli badane cechy opisane są szeregiem szczegółowym to:

  • Na korelację dodatnią wskazuje fakt, że przy wzroście wartości pierwszej i drugiej cechy mają tendencję wzrostową.
  • Jeżeli wzrostowi wartości pierwszej cechy towarzyszy tendencja spadkowa w wartościach drugiej cechy to wskazuje to na korelację ujemną.

Związek korelacyjny między cechami badamy tylko wówczas, gdy między tymi cechami istnieje logicznie uzasadniony związek przyczynowo – skutkowy. Miary ścisłości związku między cechami

  • Współczynnik zbieżności Czuprowa stosujemy go wyłącznie do tablicy korelacyjnej dla dowolnych cech (mierzalnych i niemierzalnych)
  • Współczynnik korelacji Rang Spearmana stosujemy go wyłącznie do szeregu szczegółowego dla cech mierzalnych lub niemierzalnych.
  • Stosunki korelacyjne stosuje się je wyłącznie do tablicy korelacyjnej dla cech niemierzalnych.
  • Współczynnik korelacji liniowej Pearsona stosuje się go w szeregu szczegółowym i tablicy korelacyjnej dla cech niemierzalnych.

Przykład: Sześć firm zajmuje się usługami porządkowymi porównując ich wydatki na reklamę i dochody.

Lp.

Wydatki na reklamę X i

Dochody Y i

Ranga X i

Ranga Y i d (^) i 2 d i

1 1,5 10 1 1 0 0 2 2,0 20 2 3,5 -1,5 2, 3 2,5 20 3,5 3,5 0 0 4 2,5 15 3,5 2 1,5 2, 5 4,5 25 5 5 0 0 6 5,0 30 6 6 0 0 18,00 120 4,

Współczynnik korelacji RANG SPEARMANA

2

n n

d r

n

n

i s

d (^) i - różnica rangi X (^) i i rangi Yi

RANGA – numer miejsca, na którym stoi uporządkowana w szeregu rosnąco wartość cechy.

s

s

r

r

Ujemna wartość współczynnika rang wskazuje na ujemną korelację liniową między cechami. r s - mówi nam o sile tej zależności. Im bliższy 1 tym silniejsza zależność między cechami w

przykładzie między wydatkami na reklamę a dochodami firmy zachodzi znacząca korelacja liniowa. Współczynnik korelacji rang jest symetryczny tzn. przy jego obliczaniu nie ma znaczenia, która z cech jest niezależna a która zależna. Ten wybór cechy niezależnej i zależnej dokonywany jest przy interpretacji w oparciu o logiczne przesłanki. Uznajmy, że X zależy od Y. Znacząca dodatnia korelacja liniowa oznacza, że wraz z wydatkami na reklamę rosną średnie dochody firmy. rs^2  100 %- pokazuje, w jakim % zmiany jednej cechy wpływają na zmiany średniej wartości

drugiej cechy.

2

2

  

s

s r

r

Wzrost dochodów firmy zależy 76% od wydatków na reklamę.

Kowariancje Kierunek związku korelacyjnego między cechami możemy określić wyznaczając kowariancję:

n

i

x y n xi x yi y 1

cov( , )

x   y

x (^) ix y (^) iy ( x (^) ix )( yiy ) ( x (^) ix )^2 ( y (^) iy )^2 -1,5 -10 15 2,25 100 -1 0 0 1,1 0 -0,5 0 0 0,25 0 -0,5 -5 2,5 0,25 25 1,5 5 7,5 2,25 25 2 10 20 4 100 45 10 250

Współczynnik regresji a (^) x , ay informuje o ile jednostek zmieni się zmienna zależna, gdy

zmienna niezależna wzrośnie o 1 jednostkę. y ˆ^  4 , 5 x  6 , 5 Znaczy to, że jeśli na reklamę przeznaczymy o 1 tyś zł. miesięcznie więcej to

dochody firmy wzrosną średnio o 4,5 tyś zł. Zależność a (^) xay

Oba współczynniki mają zawsze taki sam znak.

Ponadto: a (^) xayrxy^2 ; rxyaxay

Przy czym rxy ma taki sam znak jak wspólny znak współczynników regresji:

x y xy

x y xy a a r

a a r

Metody analizowania zmian zjawiska w czasie Szereg czasowy Szeregiem czasowym nazywamy ciąg wyników obserwacji uporządkowanych w czasie (t, y (^) t )

t – kolejne jednostki czasu y (^) t - wielkość badanego zjawiska w czasie t.

Czas w szeregach czasowych może być pojmowany dwojako:

  • Jako krótsze lub dłuższe okresy np.: lata, miesiące, dni; otrzymujemy wówczas szereg czasowy okresów.
  • Jako ściśle ustalone momenty w pewnym przedziale czasowym np.: określony dzień roku, miesiąca, ustalona godzina dnia; otrzymujemy wówczas szereg czasowy momentu.

Przykład:

Badano liczbę słuchaczy pewnej szkoły językowej i otrzymano następujące dane:

t lata

Liczba osób, które ukończyły kurs w danym roku yt

1 1996 465

2 1997 490

3 1998 480

4 1999 525

5 2000 560

Razem 2520

Kolejność t może być od 0. W roku 1996 ukończyło kurs 465 osób. Jest to przykład szeregu czasowego okresów w kolejnych latach. Przeciętny poziom zjawiska dla szeregu czasowego okresów mierzy średnia arytmetyczna.

y 504 osoby 5

Przeciętnie kurs w danym roku kończyło 504 słuchaczy. Szereg czasowy momentu ( wybrany moment z danego okresu czasu)

t lata

Liczba słuchaczy w dniu 31.XII. yt

1 1996 490 2 1997 505 3 1998 515 4 1999 550 5 2000 570

W szeregu czasowym momentu przeciętny poziom zjawiska określa średnia chronologiczna:

1 2 2 3 1 1

n

y y y y

y

n

y y y y y y

y

n n

n n

ch

Jeżeli okresy są numerowane od 0 to będzie w mianowniku n.

y (^) ch 525 osób 4

W dniu 31.XII było przeciętnie 525 słuchaczy na przestrzeni lat 1996 – 2000.

Miary dynamiki zmian szeregu czasowego:

  • Przyrosty
    • Absolutne Jedno podstawowe łańcuchowe
    • Względne Jedno podstawowe łańcuchowe
  • Indeksy
    • Indywidualne Jedno podstawowe łańcuchowe
    • Zespołowe Przykład:

t lata

liczba słuchaczy yt t^1 |

  (^) t | 3  (^) t | t  1 d (^) t | 1 d (^) t | t  1 it (^) | 1 it | t  1

Jak badamy średnie tempo zmian zjawiska w czasie? Średnie tempo zmian zjawiska w czasie określa się średnią geometryczną indeksów łańcuchowych.

iGn^ ^1 in | n  1  in  1 | n  2 ... i 2 | 1

Stopień √ = liczba badanych czynników.

G

G i

i

Przy czym do interpretacji wyznacza się różnicę między obliczaną średnią w % - 100% i nazywa się ją średniookresowe tempo zmian :

TniG %  100 % Tn  4 , 77 %tzn. w latach 1996 – 2000 liczba słuchaczy kursów jednocześnie wzrastała z roku

na rok przeciętnie o 4,77%.

1 | 1 1

2 2

3 2

1 1

| 1 1 | 2 ...^2 | 1 ... n

n n

n n

n n n n n y i

y y

y y

y y

y y

y ii   i        

 

  

Indeksy cen, ilości, wartości Indywidualne indeksy:

I. Indeks cen - o

n p (^) p

p i

II. Indeks ilości - o

n q (^) q

q i

III. Indeks wartości - o

n w (^) w

w i

p q o o

n n w i i p q

p q i

w p q

  

indeks wartości;

równość indeksowa dla indeksów indywidualnych t = 0 okres bazowy, podstawowy t = n okres badany p (^) o , qo , w o - cena, ilość, wartość w okresie bazowym p (^) n , qn , w n - cena, ilość, wartość w okresie badanym

Przykład: Przedsiębiorstwo produkuje czajniki elektryczne trzech typów dane dotyczące cen, ilości i wartości poszczególnych typów czajników z lat 1996 i 1999 przedstawia poniższa tabela. Ocenić przy pomocy indeksów dynamikę zmian cen, ilości, wartości produkcji dla każdego typu czajnika. Ocenić dynamikę zmian wartości, cen, ilości dla wszystkich typów czajników łącznie.

Typ czajnika

Produkcja (w tyś. szt.)

Cena ( w zł.)

Wartość (w tyś. zł.) Indeks indywidualny

Obliczenia pomocnicze 1996 1999 1996 1999 1996 1999

j q^ jo q^ jn p^ jo p^ jn w^ jo w^ jn i^ q i^ p i^ w pn^ ^ qo q^ opo

I 1,2 1,5 100 90 120 135 1,25 0,9 1,125 108 150

II 1,5 1,4 65 70 97,5 98 0,93 1,08 1,005 105 91

III 0,8 1,2 50 58 40 69,6 1,5 1,16 1,74 46,4 60

poq o pnqn 259,4 301 257,5 302,

Zespołowe indeksy dla wszystkich absolutnych: I. Indeks wartości:

w

o o

n n o

n jo

jn w

I

p q

p q w

w w

w I

I (^) w  117 , 5 % łączna wartość produkcji czajników w roku 1999 była o 17,5% wyższa od

łącznej produkcji tych czajników w roku 1996.

II. Indeks cen:

  1. Indeks Laspeyresa:

L p

o o

n o jo jo

jn jo L p

I

p q

p q p q

p q I

L I^ p ^100 ,^74 % gdyby wielkość^ produkcji była cały czas na poziomie roku 1996 to ceny wszystkich typów czajników łącznie w roku 1999 byłyby o 0,74% wyższe w porównaniu z cenami z roku 1999; gdyby wielkość produkcji była na poziomie 1996 roku to łączna wartość produkcji w roku 1999 byłaby o 0,74% wyższa od łącznej wartości produkcji w roku 1996 tylko na skutek zmiany cen.

  1. Indeks Paaschego:

P p

o o

n n jo jn

jn jn P p

I

p q

p q p q

p q I

P I^ p ^100 ,^53 % gdyby wielkość^ produkcji była cały czas na poziomie roku 1999 to ceny wszystkich typów czajników łącznie w roku 1999 byłyby o 0,53% wyższe niż w roku 1996; gdyby wielkość produkcji była na poziomie roku 1999 to łączna wartość produkcji w roku 1999 byłaby o 0,53% wyższa od łącznej wartości produkcji w roku 1996 tylko na skutek zmiany cen. III. Indeks ilości

  1. Indeks Laspeyresa