Statystyka matematyczna - Notatki - Statystyka - Część 2, Notatki'z Statystyka. Opole University
Aleksy
Aleksy21 March 2013

Statystyka matematyczna - Notatki - Statystyka - Część 2, Notatki'z Statystyka. Opole University

PDF (193.7 KB)
8 strona
693Liczba odwiedzin
Opis
W notatkach wyeksponowane są tematy z zakresu statystyki: statystyka matematyczna. Część 2.
20punkty
Punkty pobierania niezbędne do pobrania
tego dokumentu
Pobierz dokument
Podgląd3 strony / 8
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.

10

α/2 = 0,05/2 = 0,025 K1 = K α/2 = 0,025 =3 n1 = 7 K2 =K1 - α/2 = 0,975 =10 n2 = 6 d) K1 = 3 < K =8 < K2 = 10 nie mamy podstaw do odrzucenia hipotezy Przykład 2 (test z serii z dwustronnym obszarem krytycznym) W kolejce po świadectwa udziałowe zaobserwowano mężczyzn i kobiety według następującego porządku M K M K M M M K K M K M K M K M M M M K M K M K M M K K K M Na poziomie istotności 0,05 sprawdzić hipotezę głoszącą że ciąg ten jest losowy. Rozwiązanie a) układ hipotez H0 ciąg losowy H1 ciąg nielosowy b) statystyką sprawdzającą jest liczba serii: M K M K M M M K K M K M K M K M M M M K M K M K M M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 K K K M 20 21 Ustalamy liczbę serii K = 21 c) α ,K1 P{K ≤ K1 } = α/2 K2 P{K ≤ K2 } = 1- α/2 K1 = K α/2 = 0,025 = 8 n1 = 17 K2 = K1- α/2 = 0,975 = 19 n2 = 13 d) K=21 > K2 = 19 Decyzja odrzucamy hipotezę H0 ODP Na poziomie istotności 0,05 możemy twierdzić że ciąg ten jest nie losowy, układ kolejnych kolejkowiczów był tendencyjny. Rozkład normalny zmiennej standaryzowanej N(0,1) H1 : A ≠ B P { |u| ≥ uα } α obszar dwustronny F{ (uα) = 1 – α/2 uα dystrybuanta obszar krytyczny H1 : A > B P { u ≥ uα } α obszar prawostronny F{ (uα) = 1 – α uα H1 : A < B P { u ≤ uα } α obszar prawostronny F{ (-uα) = α uα

11

Testy zgodności Jest to obszerna grupa testów do badania rozkładów. Badanie zgodności dowolnego rozkładu :

a) empirycznego z zakładanym rozkładem teoretycznym (trzeba patrzeć jakiej zmiennej on dotyczy , zmienna losowa może być dowolna lub tylko ciągła)

b) Testy służące do badania zgodności dwóch lub więcej rozkładów empirycznych ( czy nasze próby pochodzą z populacji o tym samym rozkładzie, jeśli tak to próby możemy łączyć w większe)

Testy możemy podzielić na klasyczne, podstawowe, i nowoczesne. Testy możemy także ze względu na wielkość próby czyli związane z małą lub z dużą próbą. Klasyczne testy zgodności rozkładu empirycznego z rozkładem teoretycznym:

1. test zgodności χ2 do badania normalności rozkładu ( uniwersalny test dla dowolnej zmiennej losowej

2. test zgodności λ Kołmogorowa ( służy do badania zgodności dwóch rozkładów empirycznych dla zmiennej losowej ciągłej)

3. test zgodności Kołmogorowa - Smiernowa Nieparametryczne testy zgodności Test klasyczny - test zgodności χ2 Założenia:

1. Dowolna zmienna losowa 2. Duża próba n>30 ( grubo powyżej) 3. Każdej klasie ( wariantowi ) musi być przyporządkowane ni ≥ 8, jeśli tak nie jest to

należy łączyć liczebności z sąsiednich klas

1) układ hipotez H0 : F(x) = F0 (x)

H1 : F(x) ≠ F0 (x) Gdzie: F0 (x) dystrybuanta rozkładu teoretycznego w punkcie x

2) Statystyka sprawdzająca test zgodności χ2

Postać testu  

 

r

1i i

2 ii2

n̂ )n̂n(

Gdzie ii p*nn̂  liczebność teoretyczna ni ≥ 8

3) α,χ2 P{ χ2 > χ2 ≥ 2 }=α u = r – l –1 gdzie l- liczba szacowanych parametrów rozkładu teoretycznego

4) Obszar krytyczny określa nierówność χ2 ≥ 2 gdzie 2  jest wartością krytyczną

odczytana z tablic rozkładu χ2 dla z góry ustalonego poziomu istotności. Gdy χ2 ≥ 2

odrzucamy hipotezę H0 gdy χ2 < 2  przyjmujemy hipotezę zerową

12

Przykład Koszty materiałowe w pewnej gałęzi gospodarki narodowej przy produkcji pewnego wyrobu były w wylosowanych 120 zakładach następujące ( w zł)

Koszt materiałowy Liczba zakładów 150 – 250 7 250 - 350 10 350 - 450 21 450 - 550 30 550 – 650 19 650 – 750 15 750 – 850 10 850 – 950 6 950 – 1050 2

Σ 120 Na poziomie istotności 0,10 zweryfikować hipotezę głoszącą że rozkład kosztów materiałowych przy produkcji tego wyrobu jest normalny N(540, 200) Rozwiązanie: Dane: n = 120 α = 0,10 N(540,120) E(x) = 540 (wartość oczekiwana) δ (x) = 120 ( odchylenie standardowe

1. układ hipotez H0 : F(x) = FN (x)

H1 : F(x) ≠ FN (x) Gdzie: F0 (x) dystrybuanta rozkładu normalnego w punkcie x

2. Statystyka sprawdzająca test zgodności χ2

Postać testu  

 

r

1i i

2 ii2

n̂ )n̂n(

ii p*nn̂ pi = F(ui) - F(ui-1) Wyjątek p1 = F( u1)

)x( )x(Exu i11

 

Uwaga przy znanych parametrach rozkładu normalnego możemy łączyć klasy już od początku by ni ≥ 8

LP

1 350 17 -0,95 0,171 0,171 20,50 0,598 2 450 21 -0,45 0,326 0,155 18,60 0,310 3 550 30 0,05 0,52 0,194 23,30 1,927 4 650 19 0,55 0,709 0,189 22,70 0,603 5 750 15 1,05 0,853 0,144 17,30 0,306 6 950 10 2,05 0,939 0,086 10,30 0,009 7 1050 8 x 1 0,061 7,30 0,067

x 120 x x 1 120,0 3,819 1 skąd 3 4 5

i1x in ipiu )u(F i i

2 ii

n̂ )n̂n(

in̂

13

Klasy które zostały połączone

1. 95,0 200

540350u1  

2. 3.. p2 = (F(u3) - F(u2) = 0,326 – 0,171 = 0,155 4. Liczymy liczebności teoretyczne

5,20czylimiejscajednegodozaokrglamy52,20171,0*120p*nn̂ ii  5. Liczymy cząstkowe wartości statystyki

598,0 5,20

)5,2017( n̂

)n̂n( 2r

1i i

2 ii2

 

   

3. α,χ2 P{ χ2 ≥ 2 }=α u = r-l – 1 = 7 – 0 – 1 = 6 7- bo siedem pozycji, l nie występuje gdyż ten typ statystyki ma jeden stopień swobody 4. Otrzymyjemy: χ2 = 3,82 α = 0,10 2 = 10,645 5. χ2 = 3,82 ≥ 2 = 10,645 Decyzja niema podstaw do odrzucenia hipotezy H0 ODP Na poziomie istotności 0,10 nie mamy podstaw do odrzucenia hipotezy głoszącej że rozkład kosztów materiałowych przy produkcji tego wyrobu jest normalny. Przykład Treść jak wyżej ale nie znamy parametrów rozkładu normalnego 1. układ hipotez H0 : F(x) = FN (x)

H1 : F(x) ≠ FN (x) Gdzie: F0 (x) dystrybuanta rozkładu normalnego w punkcie x

2. Statystyka sprawdzająca test zgodności χ2

Postać testu  

 

r

1i i

2 ii2

n̂ )n̂n(

ii p*nn̂ pi = F(ui) - F(ui-1) p1 = F(u1)

S xxu i

0

i

14

Lp S ui moje 1 150 - 250 7 200 1400 11,67 4,15 -342,5 117306,25 821143,75 -1,83656 -1,57 0,058 0,058 7 2 250 - 350 10 300 3000 25 7,25 -242,5 58806,25 588062,5 -1,300338 -1,03 0,152 0,094 11,3 0,09235 3 350 - 450 21 400 8400 70 12,60 -142,50 20306,25 426431,25 -0,764116 -0,5 0,309 0,157 18,8 0,257447 4 450 - 550 30 500 15000 125 17,12 -42,50 1806,25 54187,5 -0,227894 0,04 0,516 0,207 24,8 1,090323 5 550 - 650 19 600 11400 95 18,34 57,50 3306,25 62818,75 0,308328 0,58 0,719 0,203 24,3 1,155967 6 650 - 750 15 700 10500 87,5 19,77 157,50 24806,25 372093,75 0,844549 1,11 0,867 0,148 17,8 0,440449 7 750 - 850 10 800 8000 66,67 19,33 257,50 66306,25 663062,5 1,380771 1,65 0,951 0,084 10,1 0,00099 8 850 - 950 6 900 5400 45 17,45 357,50 127806,25 766837,5 1,916993 2,19 0,986 0,035 4,2 0,747458 9 950 - 1050 2 1000 2000 16,67 11,59 457,50 209306,25 418612,5 2,453215 x 1 0,014 1,7

120 x 65100 542,5 127,60 x x 4173250 x x x 1 120 3,784983 skąd skąd

i1i0 xx in i 0 x ii

0

n*x x xx i 0

2

i

0 )xx( i

2

i

0 n*)xx( ip)u(F i in̂

i

2 ii

n̂ )n̂n(

iu

Obliczam wartość średniej

5,542 120

65100 n

n*x x

k

1i i

0

i

  

Obliczam odchylenie standardowe

49,186486,186083,34777 120

4173250 n

n*)xx( S

k

1i i

2 0

 

  

Statystyka χ2 =3,783

3. α,χ2 P{ χ2 ≥ 2 }=α Obliczam liczbę stopni swobody u = r – l – 1 = 7 – 2 – 1 = 4 7 bo złączyłem dwie klasy , 2 bo szukam dwóch parametrów χ2 = 7,779

15

4. Otrzymujemy χ2 = 7,779 α = 0,10 2 = 7,779

Decyzja nie ma podstaw do odrzucenia hipotezy H0 5. Odp Przy poziomie istotności 0,10 nie mamy podstaw do odrzucenia hipotezy głoszącej, że rozkład kosztów materiałowych przy produkcji tego wyrobu jest rozkładem normalny.

Można przeliczyć to samo zadanie dla N( E(x),200) lub N(540,δ(x)) Wykład dodatkowy zadania Zad 1 Estymacja wskaźnika struktury W pewnym mieście wylosowano 500 mieszkań. Stwierdzono że 200 spośród nich było wyposażonych w telefon . Czy na tej podstawie można coś powiedzieć o odsetku mieszkań wyposażonych w telefon w tym mieście? Przyjmij współczynnik ufności na poziomie 0,99. Rozwiązanie: n = 500 m = 200 1-α = 0,99 Wersje rozwiązań

a) bezkrytyczna - sprawdzamy czy n > 100 b) krytyczna

- sprawdzamy czy n > 100 - sprawdzamy czy m jest wystarczające - sprawdzamy czy próba jest losowa - o jaki telefon chodzi

Wniosek : Wobec braku możliwości rozstrzygnięć wątpliwości poza formalnie wymaganą wielkością próby zadanie rozwiązujemy tak jak w wersji bezkrytycznej. Obliczam wartość wskaźnika struktury: 0,05 < wi < 0,95

40,0 500 200

n m

n nw ii 

Obliczam wartość u

 

 

  1}n )w1(wuwp

n )w1(wuw{P iiiiii

)strukturywsknaszego(estymatoraszacynkubladylndopuszczaylnmaksyma

056,002191,0*58,200048,058,2 500

24,058,2 500

)4,01(4,058,2 n

)w1(wu

58,2u

0995,0005,01 2 01,01

2 1)u(F

ii

01,0



 

 



  



16

wi –Δ = 0,4 – 0,057 = 0,343 wi –Δ = 0,4 + 0,057 = 0,457 0,343 < p < 0,457 34,3 % < p % < 45,7 % Odp Z ufnością 0,99 przedział o końcach 34,3 % oraz 45,7% pokryje odsetek mieszkań wyposażonych w telefony w tym mieście. Zad 2 Test dla wskaźnika struktury w populacji W jednej z politechnik wylosowano niezależnie próbę 150 studentów, z których jedynie 45 zdało wszystkie egzaminy w pierwszym terminie. Na poziomie istotności 0,05 zweryfikuj hipotezę głoszącą że mniej niż jedna trzecia część studentów zdaje egzaminy za pierwszym podejściem. Rozwiązanie: n = 150 m = 45 α = 0,05 p0 = 1/3 = 0,333 Uwaga sprawdzam czy n > 100 Obliczam wartość wskaźnika struktury

30,0 150 45

n mw i 

Sprawdzam czy wi < p0 0,300 < 0,333 1. układ hipotez

H0 : p = p0 H1 : p ≠ p 2. Statystyka sprawdzająca

86,0 0385,0

033,0 00148074,0

033,0

150 222111,0

033,0

150 667,0*333,0

333,03,0u

667,0333,01p1q n qp pwu

00

00

0i

  

 

 

 



 

3. α, uα , p{u ≤ uα}= α F(-uα) = α = 0,05 uα = 0,05 = -1,64 4. u > uα u = - 0,86 > uα = 0,05 = -1,64 Decyzja nie ma podstaw do odrzucenia hipotezy H0 5. Odp Przy poziomie istotności 0,05 nie mamy podstaw do odrzucenia hipotezy głoszącej że jedna trzecia studentów zdaje egzaminy za pierwszym razem Zad 3 Test dla dwóch wskaźników struktury Na 150 wypadków samochodowych w jednym województwie 118 spowodowanych było nadużyciem przez kierowców alkoholu. W drugim województwie liczba wypadków spowodowanych przez tę samą przyczynę wyniosła 130 na 185 zgłoszonych. Na poziomie istotności 0,05 zweryfikuj hipotezę, że odsetek wypadków drogowych spowodowanych nadużyciem alkoholu w obydwu województwach jest identyczny.

17

Dane n1 = 150 m1 = 118 n2 = 185 m2 = 130 α = 0,05 Uwaga sprawdzamy czy n1 >100 n2 > 100 1. układ hipotez H0 : p1 = p2 H1 : p1 ≠ p2 2. Statystyka sprawdzająca

*

21

n )w1(w

wwu

 

74,1 048196,0

084,0 00232282,0

084,0

83,82 1924,0 084,0

83,82 )740,01(740,0

703,0787,0u

83,82 335

27750 nn

nnn

740,0 335 248

185150 130118

nn mmw

703,0 185 130

n mw

787,0 150 118

n mw

21

21*

21

21

2

2 2

1

1 1

  

 

  

  





4. 3. α, uα , p{|u | ≥ uα}= α F(uα) = 1 – α/2 = 1- 0,05/2 = 0,975 uα = 0,05 = 1,96 5. |u | = 1,74 < uα= 1,96 Decyzja: nie ma podstaw do odrzucenia H0 Odp Przy poziomie istotności 0,05 brak podstaw do odrzucenia hipotezy głoszącej że odsetek wypadków spowodowanych nadużyciem alkoholu jest w obydwu województwach jednakowy

komentarze (0)
Brak komentarzy
Bądź autorem pierwszego komentarza!
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
Docsity is not optimized for the browser you're using. In order to have a better experience we suggest you to use Internet Explorer 9+, Chrome, Firefox or Safari! Download Google Chrome