Pobierz Badanie zgodności rozkładu empirycznego z teoretycznym i więcej Prezentacje w PDF z Matematyka tylko na Docsity! Badanie zgodności rozkładu empirycznego z teoretycznym Anna Rajfura, Matematyka i statystyka matematyczna 2 Przypomnienie. Wnioskowanie Populacja generalna Próba cecha X w populacji parametry populacyjne: średnia μ odch. standardowe σ frakcja p x1, x2, ..., xn cecha X w próbie parametry próby: średnia x odch. standardowe s frakcja ?̅? Metody wnioskowania:estymacja punktowa, przedziałowa, testowanie hipotez. losowanie wnioskowanie Anna Rajfura, Matematyka i statystyka matematyczna 5 Badanie normalności rozkładu-przykład Podczas eksperymentu oceniano wartość pewnego parametru biochemicznego (PB) u 192 zwierząt laboratoryjnych. Wyniki zestawiono w szeregu rozdzielczym. Zakres wartości Liczebność [5; 6] 6 (6; 7] 11 (7; 8] 18 (8; 9] 27 (9; 10] 32 (10; 11] 35 (11; 12] 24 (12; 13] 20 (13; 14] 13 (14; 15] 6 Razem 192 Anna Rajfura, Matematyka i statystyka matematyczna 6 Przykład Rysunek przedstawia histogram dla próby w porównaniu z przebiegiem krzywej normalnej. Anna Rajfura, Matematyka i statystyka matematyczna 7 Test chi-kwadrat zgodności Populacja: zwierzęta laboratoryjne Cecha X - wartość określonego parametru biochemicznego PB Sprawdzimy, czy cecha X ma rozkład normalny. Hipoteza zerowa H0: cecha X ma rozkład normalny Hipoteza alternatywna H1: cecha X nie ma rozkładu normalnego α – poziom istotności, np. α = 0,05 Anna Rajfura, Matematyka i statystyka matematyczna 10 Obliczanie wartości χ2 emp Zakres wartości Liczebność empiryczna ni P-stwo pi [5; 6] 6 (6; 7] 11 (7; 8] 18 (8; 9] 27 (9; 10] 32 (10; 11] 35 (11; 12] 24 (12; 13] 20 (13; 14] 13 (14; 15] 6 Razem 192 Anna Rajfura, Matematyka i statystyka matematyczna 11 Obliczanie pi Obliczanie p-stwa zdarzenia: )baX ; z rozkładu normalnego X~N(μ; σ2) Można wykonać ze wzoru: ) ( ) ( )aFbFbaXP XX −= ; Po zestandaryzowaniu dystrybuanty, wartości można przeczytać z tablic statystycznych: ) ( ) ( ) − − − =−= σ μa F σ μb FaFbFbaXP ZZXX; Anna Rajfura, Matematyka i statystyka matematyczna 12 Test chi-kwadrat zgodności cd. W omawianym przykładzie nie znamy parametrów rozkładu X~N(?; ?) zatem szacujemy je na podstawie próby: 916,4ˆ,044,10ˆ 22 ==== sσxμ i dopiero obliczamy p-stwa potrzebne w szeregu rozdzielczym. Uwaga. Trzeba było oszacować dwa parametry. Anna Rajfura, Matematyka i statystyka matematyczna 15 Test chi-kwadrat zgodności cd. Zakres wartości Liczebność empiryczna ni P- stwo pi Liczebność teoretyczna nit=pi·192 Składnik funkcji testowej [5; 6] 6 0,034 6,541 0,0448 (6; 7] 11 0,051 9,754 0,1591 (7; 8] 18 0,093 17,933 0,0003 (8; 9] 27 0,141 26,992 0,0000 (9; 10] 32 0,173 33,260 0,0477 (10; 11] 35 0,175 33,554 0,0623 (11; 12] 24 0,144 27,714 0,4976 (12; 13] 20 0,098 18,740 0,0847 (13; 14] 13 0,054 10,374 0,6647 (14; 15] 6 0,037 7,139 0,1816 Razem 192 1,000 1,7429 Anna Rajfura, Matematyka i statystyka matematyczna 16 Wartość krytyczna Odczytujemy z tablic: χ2 kryt = χ2 α, ν gdzie ν = k-u-1, k jest liczbą klas w szeregu rozdzielczym, u liczbą parametrów rozkładu szacowanych na podstawie próby. W przykładzie k = 10 u = 2 (średnia i wariancja z próby) więc ν = k-u-1= 10-2-1 = 7
(Wartości krytyczne rozkładu chi-kwadrat
Ya,v - Wartość krytyczna - liczba taka, że PX>ggv)5a
a. - poziom istotności,
X=qyx- X zmienna losowa o rozkładzie chi-kwadrat z liczbą stopni swobody v,
vVa_ 0,995 | 0,990 | 0,975 | 0,950 | 0,900 | 0,100 0,025 | 0,010 | 0,005
1 _0.0*393 | 0.0002 | 0.0010 | 0.0039 | 0.0158 | 2.7055 [SS 5.0239 | 6.6349 | 7.8794
2 __ 00100 | 0.0261 | 0.0506 | 0.1026 | 0.2107 | 4.6052 | 5.9915 | 7.3778 | 9.2104 | 10.5965
3 00717 | 0.1148 | 0,2158 | 0.3518 | 0.5844 | 6,2514 | 7.8147 | 9,3484 | 11.3449 | 12,838]
4 0.2070 | 0.2971 | 0,4844 | 0,7107 | 1.0636 | 7,7794 | 9.4877 | 11.1433 | 13,2767 | 14,8602
5 0,5543 | 0,8312 | 1.1455 | 1.6103 | 9,2363 | 11.0705 | 12.8325 | 15.0863 | 16,7496
0.8721 | 1.2373 | 1.6354 | 2.2041 | 10,644 Qkómi 1 4,4494 | 16,8119 | 18,5475
1.2390 | 1.6899 | 2,1673 | 2.8331 | 12,01 Error] 16,0128 | 18.4753 | 20,2777
1.6465 | 2,1797 | 2,7326 | 3,4895 | 13.36l6ef=ttre"wef | 7,5345 | 20,0902 | 21,9549
2.0879 | 2.7004 | 3,3251 | 4,1682 | 14,6837 | 16,9190 | 19.0228 | 21.6660 | 23.5893
3.2470 | 3.9403 | 4.8652 | 15.9872 | 18.3070 | 20.4832 | 23.2093 | 25.1881
3.8157 | 4,5748 | 5,5778 | 17.2750 | 19,6752 | 21,9200 | 24,7250 | 26,7569
4.4038 | 5,2260 | 6.3038 | 18,5493 | 21,0261 | 23,3367 | 26.2170 | 28,2997
5,0087 | 5,8919 | 7,0415 | 19,8119 | 22,3620 | 24,7356 | 27.6882 | 29,8193
WZYTNWYTYPNKYTTYNWTWYTTWKTWZYTWKYZECYWIEYCWTEWIEYWYTYY!
Anna Rajfura, Matematyka i statystyka matematyczna
17
Anna Rajfura, Matematyka i statystyka matematyczna 20 Obliczenia w pakiecie STATISTICA Z menu głównego wybieramy opcję Statystyka, z podmenu Dopasowanie rozkładów. Anna Rajfura, Matematyka i statystyka matematyczna 21 Obliczenia w pakiecie STATISTICA W okienku Dopasowanie rozkładu z listy Rozkłady ciągłe wybieramy nazwę Normalny, OK. Anna Rajfura, Matematyka i statystyka matematyczna 22 Obliczenia w pakiecie STATISTICA W okienku Dopasowanie rozkładu ciągłego przyciskamy Zmienne i wprowadzamy nazwę kolumny z danymi, OK. Anna Rajfura, Matematyka i statystyka matematyczna 25 Obliczenia w pakiecie STATISTICA Na karcie Podstawowe przyciskamy Podsum.: rozkład obserwowany i oczekiwany .... Anna Rajfura, Matematyka i statystyka matematyczna 26 Obliczenia w pakiecie STATISTICA ... i otrzymujemy szereg rozdzielczy, a w tytule jest wynik testu chi-kwadrat. Ponownie otwieramy okienko naszej analizy klikając na wizytówkę ... Anna Rajfura, Matematyka i statystyka matematyczna 27 Obliczenia w pakiecie STATISTICA ... i na karcie Podstawowe przyciskamy Wykres rozkładu obserw. i oczekiwanego .... Anna Rajfura, Matematyka i statystyka matematyczna 30 Badanie normalności rozkładu Testy do badania normalności rozkładu w pakiecie STATISTICA: • test chi-kwadrat zgodności • test W Shapiro-Wilka • test Kołmogorowa-Smirnowa (K-S test) • test Lillieforsa Anna Rajfura, Matematyka i statystyka matematyczna 31 Test chi-kwadrat zgodności • bada zgodność rozkładu empirycznego z wybranym rozkładem teoretycznym • stosowany jest do danych w postaci szeregu rozdzielczego • wymaga, aby liczebność próby przekraczała 50 elementów, a liczebności oczekiwane były większe niż 5 (jeśli ten warunek nie jest spełniony, należy łączyć klasy) W pakiecie STATISTICA: menu Statystyka/Dopasowanie rozkładów. Anna Rajfura, Matematyka i statystyka matematyczna 32 Liczba klas w szeregu rozdzielczym Liczba klas k zależy od liczebności próby n i można ją przybliżeniu ustalić w oparciu o wzory: nk nk nk ln322,31 ln5 + n k 30-60 6 - 8 60-100 7 - 10 100-200 9 - 12 200-500 11 - 17 500-1500 16 – 25 przeważnie najwyżej 30