Statystyka matematyczna - Notatki - Statystyka - Część 1, Notatki'z Statystyka. Opole University
Aleksy
Aleksy21 March 2013

Statystyka matematyczna - Notatki - Statystyka - Część 1, Notatki'z Statystyka. Opole University

PDF (194.1 KB)
9 strona
1000+Liczba odwiedzin
Opis
W notatkach wyeksponowane są tematy z zakresu statystyki: statystyka matematyczna. Część 1.
20punkty
Punkty pobierania niezbędne do pobrania
tego dokumentu
Pobierz dokument
Podgląd3 strony / 9
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.

1

Statystyka matematyczna Zestaw pytań teoretycznych + zadanie (3,4,5,) Plan zajęć Powtórzyć zmienną losową i rozkład normalny

1. Elementy rachunku prawdopodobieństwa. Zmienne losowe ciągłe i skokowe oraz ich rozkłady (normalny). Własności parametrów rozkładów teoretycznych. 2. Wprowadzenie do statystyki matematycznej (wnioskowania statystycznego). Estymacja punktowa. Estymator i jego własności. Estymacja przedziałowa. Ogólna zasada budowy przedziałów ufności. 3. Dokładne i graniczne rozkłady statystyk z próby. Zastosowanie w estymacji parametrów populacji generalnej. 4. Wprowadzenie do teorii weryfikacji hipotez statystycznych. Podstawowe pojęcia i definicje. Testy istotności dla podstawowych parametrów populacji generalnej jednowymiarowej i dwuwymiarowej. 5. Nieparametryczne testy istotności. Test zgodności. Test losowości. Test niezależności. 6. Podsumowanie wykładanej treści. Literatura podstawowa: 1. M. Sobczyk, Statystyka 2. Cz. Domańska, Metody statystyczne teoria i zadania, Uniwersytet Łódzki wyd. 6,

2001 3. K. Kukuła, Elementy statystyki w zadaniach PWN, wyd 2 , Warszawa 2003 4. S. Ostasiewicz , Z. Roszak, U. Siedlwecka, Statystyka. Elementy teorii i zadania.

Akademia Ekonomiczna, Wrocław 1998 Literatura uzupełniająca: 1. J. Jóźwiak, J. Podgórski, Statystyka od podstaw. Wyd. 5, PWE, Warszawa 1997 2. M.H. Aczel , Statystyka w zarządzaniu, PWN, Warszawa 2005 3. A. Zeljaś, Metody statystyczne, PWE, Warszawa 2002 4. J. Greń, Statystyka matematyczna modele i zadania. Warszawa, 1982 5. R. Zieliński, Tablice matematyczne, Wyd. 2, PWN, Warszawa

2

Wnioskowanie statystyczne związane jest z próbą losową a zatem korzystamy z metod wnioskowania statystycznego. Próbę losową pozyskujemy w wyniku zastosowania mechanizmu losowego doboru jednostek, musi być ona odpowiednio liczna, aby można było ją uznać za reprezentatywną. n- liczebność próby N- liczba jednostek w populacji generalnej Sposób jednostek do próby: -losowanie zależne (wylosowana jednostka nie wraca do puli), -losowanie zależne (wylosowana jednostka wraca do puli), -losowanie indywidualne (wybieramy do próby pojedyncze jednostki) -losowanie zespołowe (wybieramy grupy jednostek) Bazą z której dokonuje się doboru jednostek do próby jest operat losowania. Operat losowania to wykaz wszystkich jednostek wchodzących w skład populacji generalnej. Poszczególne jednostki – elementy losowania – zostają najczęściej ponumerowane. Wyboru poszczególnych elementów do próby dokonujemy najczęściej za pomocą specjalnie skonstruowanych tablic liczb losowych. Rozkład z próby – podstawowe pojęcia. Przestrzeń prób losowych jest to zbiór n elementowych prób utworzonych z populacji generalnej liczącej N jednostek( zazwyczaj jest to zbiór nieskończony). Statystyka z próby jest to wielkość charakteryzująca próbę (np. średnia, mediana dominanta). Statystyka z próby jest zmienną losową. Np. 1 2 3x1 x2 x3 Zmienna losowa to zmienna, która może przybierać różne wartości z określonym prawdopodobieństwem. Rozkład statystyki jest to teoretyczny rozkład prawdopodobieństwa zmiennej losowej będącej statystyką. Rozkład ten zależy od rozkłady zmiennej losowej w populacji, z której pochodzi próba, oraz od wielkości próby.

Klasyczny podział próby Mała próba duża próba n< 30 n >30

Rozkład graniczny statystyki jest to rozkład, który otrzymuje się przy założeniu nieograniczenie dużej próby n  . Jest to rozkład, do którego przybliża się rozkład danej statystyki, gdy n  . Rozkład graniczny nazywany jest także rozkładem asymptotycznym. ( np. rozkład normalny jest rozkładem granicznym rozkładu t- studenta).

3

Rozkłady z dużych prób. Jeżeli rozkład zmiennej losowej X jest opisany za pomocą rozkładu normalnego to najczęściej mamy doczynienia z rozkładami normalnymi z prób opisywanych statystyk lub z rozkładami asymptotycznie normalnymi Przykład Jeżeli interesuje nas parametr średnia arytmetyczna z populacji generalnej to rozkład

średniej z prób dużych jest opisany rozkładem normalnym  = 

x . Naszą statystyką jest 

x .

Rozkład średniej z próby 

x 11 

x 21 

x 31

Rozkład normalny N[ E( 

x ), D ( 

x )]

E( 

x )- wartość oczekiwana

D( 

x ) odchylenie standardowe zmiennej losowej Gdzie

E( 

x ) = E(X)

n )X()x(D 

n – wielkość próby

Rozkład normalny przyjmuje postać N[E(X), D( n

)X()]

Rozkład z małych prób. W zależności od parametru  rozkład z próby danej statystyki może być opisany za pomocą różnych rozkładów teoretycznych. Przykład Jeżeli zmienna losowa x jest opisana z pomocą rozkładu normalnego o znanej wartości oczekiwanej E(X) ale o nie znanych odchyleniach standardowych (X) to średnia arytmetyczna z prób losowych ma rozkład : 1. Normalny w przypadku dużej próby o parametrach

N[E(X), n

S )]

S - odchylenie standardowe dla próby losowej Gdzie

E( 

x ) = E(X)

n S)x(D

2. rozkład t- studenta w przypadku małej próby o parametrach

N[E(X), 1n

S

)]

S - odchylenie standardowe dla próby losowej Gdzie

4

E( 

x ) = E(X)

1n S)x(D

 

Inne rozkłady statystyk z próby:

1. Rozkład wariancji z próby opisywany jest rozkładem chi2 (2). 2. Rozkład ilorazu wariancji opisywany był by rozkładem F-Snedecora

Wnioskowanie statystyczne Teoria estymacji(szacowania) Teoria weryfikacji hipotez statystycznych Założenia Próba powinna być reprezentatywna tzn uzyskana zgodnie z wymogami metody reprezentatywnej. Próbę uznajemy za reprezentatywną, gdy jest:

1. Losowa. 2. Dostatecznie liczna.

Wymogi:

1. Rozkład badanej próby jest normalny N[E(X),(X)]. 2. Próba jest prosta tzn. uzyskana w wyniku korzystania z mechanizmu losowania

zwanego losowaniem prostym. Losowaniem prostym nazywamy losowanie indywidualne nieograniczone i niezależne( ze zwracaniem) Losowaniem systemtycznym

Podstawy teorii estymacji. Estymacja jest to podstawowy rodzaj wnioskowania statystycznego polegający na szacowaniu parametrów populacji generalnej bądź postaci funkcyjnej rozkładu populacji na podstawie wyników próby losowej. Rodzaje estymacji: a) parametryczna b) nieparametryczna Techniki estymacji: a) estymacja punktowa polega na podaniu wielkości szacowanego parametru, która jest równa wartości estymatora  = T. Ponieważ z reguły wielkość estymatora różni się od wartości parametru populacji generalnej , podaje się jednocześnie średni błąd szacunku, czyli odchylenie standardowe estymatora Tn  = T + D(Tn) gdzie: T- ocena parametru( wartość estymatora dla danej próby) Tn – estymator D(Tn) – błąd szacunku estymatora (odchylenie standardowe estymatora) Dzięki temu uzyskujemy konkretna wartość. b) estymacja przedziałowa polega na skonstruowaniu pewnego przedziału liczbowego, zwanego przedziałem ufności, który z określonym prawdopodobieństwem pokryje

5

estymowany parametr. Jeśli granice tego przedziału oznaczymy przez kd i kg wówczas możemy zapisać go następująco: P{kd < <kg} = 1-kd – dolna granica przedziału ( kres dolny) kg – górna granica przedziału ( kres górny) 1-α –współczynnik ufności ( to prawdopodobieństwo z jakim parametr Θ pokryty jest tym przedziałem) może on przybrać wartości 0,90 0,95 0,99 Jeżeli rozkład estymatora opisywany jest za pomocą rozkładu normalnego to przedział ufności zapisujemy następująco: P{T - uαD(Tn) < Θ < T + uαD(Tn)}= 1 - α uα – wartość zmiennej standaryzowanej rozkładu normalnego dla danego α (α ≤ 0,10) Estymator jest to funkcja wyników z próby lub inaczej statystyka służąca do oszacowania nieznanej wartości parametru Θ. Wartość estymatora dla próby losowej jest zmienną losową. Rozkład estymatora zależy od:

1. Rozkładu badanej zmiennej losowej. 2. Schematu losowania. 3. Wielkości próby.

Własności estymatora: 1. Nieobciążoność – estymator jest nieobciążony jeżeli wartość oczekiwana jego

rozkładu jest równa nieznanemu parametrowi populacji generalnej E (Tn) = Θ Wyrażenie B(Tn) = E(Tn) – Θ nazywamy obciążeniem estymatora. Estymator jest asymptotycznie nieobciążony gdy 0)Tn(Blim

n

 jeżeli jego obciążenie

maleje wraz ze wzrostem próby. 2. Zgodność estymatora oznacza że wraz ze wzrostem liczebności próby ,z której go

wyznaczamy, jego wartość będzie zbliżała się do wartość będzie zbliżała się do wartości nieznanego parametru zbiorowości całkowitej.

1})T{(Plim 1n 

ε- dowolnie mała stała 3. Efektywność – estymator jest tym efektywniejszy, im jego zróżnicowanie , które

możemy mierzyć wariancją , jest mniejsze. Im mniejsze będzie zróżnicowanie estymatora tym nasze sądy o populacji generalnej na jego podstawie będą bardziej trafne.

)Tn(D )Tn(D)Tn( i2

*2



D2 (Tn*) – wariancja najefektywniejszego estymatora ( wtedy gdy dany jest zamknięty zbiór estymatorów) D2 (Tni) – wariancja i – tego estymatora 0< ε(Tn) Jeżeli efektywność naszego estymatora zmierza do jedności to możemy powiedzieć że estymator jest najefektywniejszy asymptotyczne

1)Tn(Elim n

 

4. Dostateczna wystarczalność – estymator parametru Θ jest dostatecznie wystarczalny

jeżeli zawiera wszystkie informacje jakie na temat parametru Θ występują w próbie.

6

(najlepszym estymatorem jest średnia ) Estymacja wybranych parametrów 1. Przedział ufności dla średniej. Założenia - rozkład zmiennej losowej jest rozkładem normalnym, próba jest prosta.

Rozkład estymatora

. δ(X)- znane δ(X)- nieznane próba dowolna, rozkład normalny trzeba skorzystać z odchylenia standardowego estymatora dla dużej próby (n>30) dla małej próby (n ≤ 30) Rozkład normalny (S) Rozkład t- studenta (S Ŝ)

Parametr: Θ =

x = E(X) = m

Estymator Tn =

x =

Z

1i i

Z

1i ii

g

gx

Ocena parametru Tn = 

x = a – policzalna wartość średniej

Konstrukcja przedziału ufności przy znanym odchyleniu standardowym dla zmiennej losowej. Wartość funkcji gęstości dla u P { - u α < u < u α } 1- α Definicja

)X( )X(Exu

 

 dla zmiennej losowej

n*mxu  

dla rozkładu struktury

n *uxm 

Przedział Po uwzględnieniu znaku stojącego przy uα otrzymujemy ostatecznie

 

 

  

1} n

uxm n

ux{P

7

Metody znajdowania estymatorów: a) metoda momentów, b) metoda największej wiarygodności, c) metoda najmniejszych kwadratów, d) metoda Bayesa

Rodzaje estymatorów:

a) liniowy b) ilorazowy c) regresyjny d) bayesowski

Wykład 2 (estymacja średniej, wsk struktury, testy istotności) Test dla dwóch wskaźników struktury. Przykład W pewnym roku na egzaminie wstępnym z matematyki na wyższą uczelnię spośród 560 absolwentów techników 240 nie rozwiązało pewnego zadania, natomiast na 1040 zdających absolwentów liceów ogólnokształcących nie rozwiązało tego zadania 380 kandydatów. Na poziomie istotności α = 0,05 zweryfikować hipotezę o jednakowym stopniu opanowania tej partii matematyki której dotyczyło to zadanie przez absolwentów obu typów szkół. Dane: Technikum Liceum n1 = 560 n2 = 1040 m1 = 240 m2 = 380 α = 0,05 1.Układ hipotez H0 : p1 ≠ p2 H1 : p1 = p2 2. Duża próba n > 30

*

21

n )w1(w

wwu



  429,0

560 240

n mw

1

1 1  365,01040

380 n mw

2

2 2 

51,2 025,0 064,0

364 237,0

064,0

364 612,0*388,0

064,0

364 )388,01(*388,0

365,0429,0u

364 1600

582400 1040560 1040*560

nn n*nn

388,0 1600 620

1040560 380240

nn mmw

21

21*

21

21

  

 

 

  

  

3. Określenie poziomu istotności Dla pewnego α = 0,05 szukamy wartości krytycznych dla w taki sposób by prawdopodobieństwo P {׀u׀ ≥ uα } = α.

8

Obszar krytyczny jest dwustronny, rozkład statystyki musi być symetryczny F- dystrybuanta

975,0 2 05,01

2 1)u(F 

uα = 0,05=1,96 Obszar krytyczny ( )96,1;()96,1;(  Jeżeli wystąpi ׀u׀ ≥ uα to H0 odrzucamy na korzyść H1 Jeżeli ׀u׀< uα to brak podstaw do odrzucenia hipotezy H0 uα H0 odrzucamy na korzyść H1 ≤ ׀u׀ uα =1,96 ׀ = u2,51׀ Przy poziomie istotności α = 0,05 możemy twierdzić że stopień opanowania pewnej partii matematyki jest różny. Absolwenci liceów opanowali tę partię materiału lepiej bo dla nich wskaźnik struktury jest niższy. A) Zweryfikować hipotezę że absolwenci liceów lepiej opanowali pewną matematyki niż absolwenci techników H0 = p1 =P2 H1 = p1 =P2 Nieparametryczne testy istotności Test losowości służy do badania losowego charakteru próby tzn czy można uznać daną próbę za losową czy nie. Przykład Zbadano grupę 15 studentów pod względem wzrostu: 165,180,180,175,177,195,170,182,187,173,178,190,188,175,182 czy jest to próba losowa ? Przyjąć poziom istotności 0,05 Rozwiązanie: a) układ hipotez H0 próba losowa H1 próba nielosowa b) statystyką sprawdzającą jest liczba serii:

- wyznaczam pozycję mediany

8 2

115 2

1nPMe  

 

- wyznaczamy medianę Porządkuję szereg rosnąco 165 180 180 175 177 195 170 182 187 173 178 190 188 175 182 165 170 173 175 175 177 178 180 180 182 182 187 188 190 195 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 A A A B A B B A A B B A B

1 2 3 4 5 6 7 8

A gdy xi < Me B gdy xi > Me

Uwaga: xi = Me pomijamy Seria jest to ciąg jednakowych liter ( sytuacji). Seria może być jednoelementowa

9

Me = X8 = 180 n = 13 bo 15-2 = gdyż pomijamy wartości równe medianie k = 8 c) α, kα, P{k ≤ kα }= α odczytujemy z tablic rozkładu serii dla α, oraz n1 i n2 n1 liczba sytuacji oznaczonych literą A n2 liczba sytuacji oznaczonych literą B Ostatecznie mamy n1 = 7 n2 = 6 k0,05 = 3d) k ≤ kα k=8 > k0,05 =3 Decyzja nie ma podstaw do odrzucenia hipotezy H0 ODP Przy poziomie istotności α = 0,05 nie mamy podstaw do odrzucenia hipotezy głoszącej że próba jest losowa. Test medianowy z dwustronnym obszarem krytycznym jest lepszy od poprzedniej wersji bowiem reaguje na obserwowalną powtarzalność czyli tendencję Przykład treść jw a) układ hipotez H0 próba losowa H1 próba nielosowa b) statystyką sprawdzającą jest liczba serii:

- wyznaczamy medianę - tworzymy ciąg złożony z liter A i B gdzie A gdy xi < Me B gdy xi > Me

Uwaga: xi = Me pomijamy Me = X8 = 180 n = 13 bo 15-2 = gdyż pomijamy wartości równe medianie k = 8

Uwaga: xi = Me pomijamy Seria jest to ciąg jednakowych liter ( sytuacji). Seria może być jednoelementowa c) α ,K1 P{K ≤ K1 } = α/2 K2 P{K ≤ K2 } = 1- α/2 Rozkład serii nie jest rozkładem symetrycznym, dlatego należy odczytać dwie wartości krytyczne dla lewostronnego obszaru krytycznego przy n1 i n2 d) jeżeli K ≤ K1 lub K > K2 to odrzucamy hipotezę H0 K1 < K ≤ K2 to nie mamy podstaw do odrzucenia -α/2 α/2 K1 K2

komentarze (0)
Brak komentarzy
Bądź autorem pierwszego komentarza!
To jest jedynie podgląd.
Zobacz i pobierz cały dokument.
Docsity is not optimized for the browser you're using. In order to have a better experience we suggest you to use Internet Explorer 9+, Chrome, Firefox or Safari! Download Google Chrome