Weryfikacja - Notatki - Statystyka, Notatki'z Statystyka. Opole University
Aleksy
Aleksy21 March 2013

Weryfikacja - Notatki - Statystyka, Notatki'z Statystyka. Opole University

PDF (224.3 KB)
6 strona
364Liczba odwiedzin
Opis
W notatkach wyeksponowane są tematy z zakresu statystyki: weryfikacja.
20punkty
Punkty pobierania niezbędne do pobrania
tego dokumentu
Pobierz dokument
Podgląd3 strony / 6
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.

1

Zadanie Ustalono na podstawie analizy kosztów, że będzie się opłacać się wybudowanie motelu przy trasie komunikacyjnej, jeśli będzie przejeżdżać tą trasą więcej niż 800 samochodów dziennie. W losowe wybrane dni roku liczono ilość przejeżdżających samochodów. Otrzymano następujące rezultaty: 792, 810, 820, 886, 910, 840, 1025, 790, 972, 830, 810, 780, 815, 954, 810, 930, 820. Na poziomie istotności 0,05 zweryfikuj hipotezę o opłacalności podejmowanej inwestycji. Trochę teorii: Zadanie jest ze statystki matematycznej. Statystyka matematyczna zajmuje się metodami wnioskowania statystycznego, które polegają na tym, że na podstawie wyników uzyskanych z próby (nasz próba to te losowo wybrane dni w których badamy ilość przejeżdżających samochodów) formułujemy wnioski o całej zbiorowości. Wnioskowanie statystyczne obejmuje estymację i weryfikację hipotez statystycznych. Nas interesuje weryfikacja hipotez statystycznych, która polega na tym, że sprawdzamy pewne założenia wysunięte w odniesieniu do parametrów lub rozkładów populacji generalnej na podstawie wyników próby – w naszym przypadku to hipoteza o opłacalności inwestycji. Gdybyś jeszcze nie rozróżnił populacji od próby to dam Ci przykład: Mamy wszystkich uczniów w jednej szkole – to jest populacja. Natomiast uczniowie jednej konkretnej klasy to próbka. Obserwując naszą klasę będziemy się starać wyniki z tej obserwacji przenieść na uczniów całej szkoły. Tak to wygląda z grubsza. Weryfikację hipotez statystycznych przeprowadza się stosując testy istotności. Testy istotności - jest to taki rodzaj testów, w których na podstawie wyników próby losowej podejmuje się jedynie decyzje odrzucenia hipotezy sprawdzanej lub stwierdza się, że brak jest podstaw do jej odrzucenia. Wyróżniamy: - parametryczne testy istotności (dotyczące wartości parametrów rozkładu) - nieparametryczne testy istotności (pozostałe testy) Nas będą interesować parametryczne testy istotności (jeden z poniższych):test dla wartości średniej populacji generalnej, test dla dwóch średnich, test dla wskaźnika struktury (procentu), test dla dwóch wskaźników struktury, test dla wariancji, test dla dwóch wariancji. Przechodzimy już konkretnie do zadania: Mamy naszą próbę: 792, 810, 820, 886, 910, 840, 1025, 790, 972, 830, 810, 780, 815, 954, 810, 930, 820 jest w niej 17 elementów (wystarczy policzyć)

2

Jesteśmy w stanie obliczyć podstawowe parametry tej próbki (dlatego stosujemy później parametryczne testy istotności) czyli średnią arytmetyczną ( x ) i odchylenie standardowe (s).

Średnia arytmetyczna:x = n

x n

i i

1 czyli „po ludzku” dodajemy do siebie wartości tych

danych i dzielimy przez ilość danych (tak samo się liczy średnią ocen w szkole)

17 820930 810 954815780 810830 9727901025840 910 886 820 810 792 

= 17

14594 = 858,4705882

Ten wynik oznacza, że średnio 1 dnia przejeżdża tą trasą 858,4705882 samochodów (wiem, że samochód nie może być ułamkiem, ale w średniej tak może być), oczywiście ta średnia dotyczy tylko tej 17-elementowej próbki. Odchylenie standardowe (s) (nasza próbka jest mało liczna - 17 elementów) dla takich stosuje się wzór:

s2 = 1

)( 1

2

 

n

xx n

i i

s2 to wariancja, natomiast odchylenie standardowe to s = 2s

Obliczę to w tabeli i będzie to wtedy widoczne: 1. Najpierw wypisuję wartości 17 próbek – kolumna xi 2. Później od każdej z nich odejmuję wyliczoną wcześniej średnią – kolumna (xi - x ), czyli:  dla próbki 1 wygląda to następująco: 792 - 858,4705882 = -66,47058824  dla próbki 2 wygląda to następująco: 810 - 858,4705882 = -48,47058824  dla próbki 3 wygląda to następująco: 820 - 858,4705882 = -38,47058824 i tak liczmy dla wszystkich 17 wartości wyniki w tabeli.

3. teraz każdą z wyliczonych wartości podnoszę w kolumnie(xi - x )2 do kwadratu:  dla próbki 1 wygląda to następująco: (-66,47058824)2 = 4418,3391  dla próbki 2 wygląda to następująco: (-48,47058824)2 = 2349,397924  dla próbki 3 wygląda to następująco: (-38,47058824)2 = 1479,986159 i tak liczmy dla wszystkich 17 wartości wyniki w tabeli.

Kolumna

xi Kolumna (xi - x )

Kolumna (xi - x )2

1 792 -66,47058824 4418,3391 2 810 -48,47058824 2349,397924 3 820 -38,47058824 1479,986159 4 886 27,52941176 757,8685121

x =

3

5 910 51,52941176 2655,280277 6 840 -18,47058824 341,1626298 7 1025 166,5294118 27732,04498 8 790 -68,47058824 4688,221453 9 972 113,5294118 12888,92734 10 830 -28,47058824 810,5743945 11 810 -48,47058824 2349,397924 12 780 -78,47058824 6157,633218 13 815 -43,47058824 1889,692042 14 954 95,52941176 9125,868512 15 810 -48,47058824 2349,397924 16 930 71,52941176 5116,456747 17 820 -38,47058824 1479,986159

Suma: 14594 86590,23529 4. Interesuje nas suma ostatniej kolumny czyli 86590,23529 (czyli wszystkie elementy z tej kolumny dodaliśmy do siebie)

otrzymaliśmy  

n

i i xx

1

2)( = 86590,23529 ( znak  oznacza sumę) jeśli podzielimy to przez ilość próbek czyli n - 1 = 17 –1 = 16 to otrzymamy wariancję:

s2 = 1

)( 1

2

 

n

xx n

i i

= 16

986590,2352 = 5411,889706

odchylenie standardowe to pierwiastek z wariancji: s = 2s = 65411,88970 = 73,5655547 – ten wynik oznacza, że ilość przejeżdżających samochodów odchyla się przeciętnie od średniej o 73,5655547. Dane dla naszej próbki: Średnia arytmetyczna: x = 858,4705882, Odchylenie standardowe: s = 73,5655547, Liczebność próbki: n = 17, Poziom istotności jest to prawdopodobieństwo odrzucenia hipotezy prawdziwej: = 0,05Na wstępie trzeba sformułować hipotezę zerową (H0) i hipotezę alternatywną (H1). W zadaniu mamy, że trasą musi przejeżdżać codziennie więcej niż 800 samochodów, czyli właściwie średnio codziennie powinno tam przejeżdżać 800 samochodów. Zatem średnia dla naszej populacji musi wynieść ponad 800. Ważne, aby nie mylić średniej naszej 17-elemetowej próbki ze średnią całej populacji, dlatego nie wolno zapisywać H0 : x = 800 !!!

4

Średnią naszej całej populacji oznaczymy jako m. H0 : m = 800 (w hipotezie zerowej zawsze musi być równość) Zatem w hipotezie zerowej przyjmujemy założenie, że codziennie tą trasą będzie przejeżdżać średnio 800 samochodów, czyli mniej niż żądano, bo ma przejeżdżać więcej niż 800. H1 : m > 800 (w hipotezie alternatywnej:  ,< , >) Znak w hipotezie alternatywnej zależy od treści zadania. Jeżeli w treści zadania nie jest sprecyzowane, czy dany parametr ma być większy lub mniejszy od określonej wartości, to stawiamy zawsze znak  . U nas ilość przejeżdżających samochodów ma być większa od 800, dlatego stosujemy znak >. Ten wariant oznacza, że trasą będzie przejeżdżać ponad 800 samochodów, czyli budowanie motelu opłaci się. Teraz musimy zweryfikować nasze hipotezy (czyli jedną z nich odrzucić, zawsze jedna z nich odpadnie) stosując testy istotności. Obliczamy w tym celu statystykę t (obliczona) ze wzoru:

t = n s mx 0 nasze m0 = 800

podstawiamy nasze wcześniej wyliczone wartości i otrzymujemy:

t = 17 73,5655547

8002858,470588  = 3,277083106

Teraz trzeba odczytać wartość t* (teoretyczna inaczej wartość krytyczna) z tablic. Musimy to określić też tzw. stopnie swobodystopnie swobody = n -1 czyli w naszym przypadku mamy 17 –1 = 16 stopni swobody Jeżeli ilość stopni swobody 120 i określamy nasze hipotezy dla średniej z całej populacji to korzystamy przy odczytywaniu z tablic z rozkładu t – Studenta. (Są różne rozkłady tak dla informacji, np. rozkład F, rozkład chi – kwadrat dla innych danych, ale nie będę tu wnikać, w naszym zadaniu korzystamy z tego co wymieniłam wyżej) Odczytujemy wartość dla= 0,05 i 16 stopni swobody t* = 2,120 Rozkład t – Studenta (wklejam Ci bo pewnie nie masz)

Wartość α Stopnie swobody 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,05 0,04 0,02 0,01 0,001

1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 15,894 31,821 63,656 636,578 2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 4,849 6,965 9,925 31,600 3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 3,482 4,541 5,841 12,924 4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 2,999 3,747 4,604 8,610 5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 2,757 3,365 4,032 6,869

5

6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 2,612 3,143 3,707 5,959 7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,517 2,998 3,499 5,408 8 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,449 2,896 3,355 5,041 9 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,398 2,821 3,250 4,781

10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,359 2,764 3,169 4,587 11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,328 2,718 3,106 4,437 12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,303 2,681 3,055 4,318 13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,282 2,650 3,012 4,221 14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,264 2,624 2,977 4,140 15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,249 2,602 2,947 4,073 16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,235 2,583 2,921 4,015 17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,224 2,567 2,898 3,965 18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,214 2,552 2,878 3,922 19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,205 2,539 2,861 3,883 20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,197 2,528 2,845 3,850 21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,189 2,518 2,831 3,819 22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,183 2,508 2,819 3,792 23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,177 2,500 2,807 3,768 24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,172 2,492 2,797 3,745 25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,167 2,485 2,787 3,725 26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,162 2,479 2,779 3,707 27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,158 2,473 2,771 3,689 28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,154 2,467 2,763 3,674 29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,150 2,462 2,756 3,660 30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,147 2,457 2,750 3,646 31 0,127 0,256 0,389 0,530 0,682 0,853 1,054 1,309 1,696 2,040 2,144 2,453 2,744 3,633 32 0,127 0,255 0,389 0,530 0,682 0,853 1,054 1,309 1,694 2,037 2,141 2,449 2,738 3,622 33 0,127 0,255 0,389 0,530 0,682 0,853 1,053 1,308 1,692 2,035 2,138 2,445 2,733 3,611 34 0,127 0,255 0,389 0,529 0,682 0,852 1,052 1,307 1,691 2,032 2,136 2,441 2,728 3,601 35 0,127 0,255 0,388 0,529 0,682 0,852 1,052 1,306 1,690 2,030 2,133 2,438 2,724 3,591 36 0,127 0,255 0,388 0,529 0,681 0,852 1,052 1,306 1,688 2,028 2,131 2,434 2,719 3,582 37 0,127 0,255 0,388 0,529 0,681 0,851 1,051 1,305 1,687 2,026 2,129 2,431 2,715 3,574 38 0,127 0,255 0,388 0,529 0,681 0,851 1,051 1,304 1,686 2,024 2,127 2,429 2,712 3,566 39 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,304 1,685 2,023 2,125 2,426 2,708 3,558 40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,123 2,423 2,704 3,551 50 0,126 0,255 0,388 0,528 0,679 0,849 1,047 1,299 1,676 2,009 2,109 2,403 2,678 3,496 60 0,126 0,254 0,387 0,527 0,679 0,848 1,045 1,296 1,671 2,000 2,099 2,390 2,660 3,460

120 0,126 0,254 0,386 0,526 0,677 0,845 1,041 1,289 1,658 1,980 2,076 2,358 2,617 3,373 0,126 0,253 0,385 0,524 0,674 0,842 1,036 1,282 1,645 1,960 2,054 2,326 2,576 3,291

i teraz najważniejsze: Jeżeli: | t (obliczona) | > t* (teoretyczna) to odrzucamy H0 na korzyść hipotezy alternatywnej Jeżeli: | t (obliczona) | < t* (teoretyczna) to nie ma podstaw do odrzucenia hipotezy H0. (te pionowe kreski przy t to wartość bezwzględna, czyli gdyby t (obliczone) wyszło ujemne to porównujemy liczbę bez minusa)

6

= 0,05t* = 2,120t (obliczone) = 3,277083106 > 2,120 = t* (teoretyczne) zatem odrzucamy H0 na rzecz hipotezy alternatywnej Interpretacja wyniku: 0,05 = 5% oznaczaprawdopodobieństwo odrzucenia hipotezy prawdziwej 1 -  - czyli to prawdopodobieństwo przyjęcia hipotezy prawdziwej wynosi 0,95 (suma prawdopodobieństw zawsze jest równa 1 !!!) Odrzuciliśmy hipotezę zerową mówiącą, że trasą będzie przejeżdżać średnio 800 samochodów dziennie na rzecz hipotezy alternatywnej, która mówi, że przejeżdżać tamtędy będzie ponad 800 samochodów dziennie. Z pewnością 95% trasą będzie codziennie przejeżdżać ponad 800 samochodów, zatem inwestycja polegająca na budowie motelu będzie opłacalna.

komentarze (0)
Brak komentarzy
Bądź autorem pierwszego komentarza!
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
Docsity is not optimized for the browser you're using. In order to have a better experience we suggest you to use Internet Explorer 9+, Chrome, Firefox or Safari! Download Google Chrome