Docsity
Docsity

Przygotuj się do egzaminów
Przygotuj się do egzaminów

Studiuj dzięki licznym zasobom udostępnionym na Docsity


Otrzymaj punkty, aby pobrać
Otrzymaj punkty, aby pobrać

Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium


Informacje i wskazówki
Informacje i wskazówki

Testowanie Hipotez: Zadania i Rozwiązania, Zadania z Statystyka stosowana

Zestaw przykładowych zadań z rozwiązaniami

Typologia: Zadania

2019/2020

Załadowany 16.07.2020

mellow_99
mellow_99 🇵🇱

4.3

(26)

170 dokumenty

1 / 11

Toggle sidebar

Ta strona nie jest widoczna w podglądzie

Nie przegap ważnych części!

bg1
1 Testowanie hipotez
W tej części rozwiązane zostaną zadania dotyczące testowania hipotez. Wymagana jest wiedza z zakresu
najmocniejszych testów, ilorazu wiarygodności, parametrów testów statystycznych.
1. (Eg 52/1) Niech X1, X2, ..., X8będzie próbką z rozkładu prawdopodobieństwa Pareto o dystrybu-
ancie
Fθ(x) = 1 1
xθdla x61oraz Fθ(x)=0 dla x < 1,
gdzie θ > 0jest nieznanym parametrem. Rozpatrzmy zadanie testowania hipotezy H0:θ= 2
przeciwko alternatywie H1:θ= 4. Zbudowano taki test, dla którego suma prawdopodobieństw
błędów I i II rodzaju, oznaczanych odpowiednio przez αiβ, jest najmniejsza. Oblicz najmniejszą
wartość α+β.
Odp: B-> 0,3336.
Rozwiązanie. Niech fθ(x) = θxθ+1 będzie gęstością rozkładu Pareto. Testem który dla ustalonego
błędu pierwszego rodzaju (równego α) minimalizuje błąd drugiego rodza ju jest test Neymana-
Pearsona, którego obszar krytyczny ma postać
K={(x1, .., x8) : Q8
i=1 f4(xi)
Q8
i=1 f2(xi)> C},
gdzie Cjest dobrane tak aby Pθ=2(X K) = α. Nietrudno zauważyć, że K={(x1, .., x8) :
P8
i=1 log xi<¯
C}dla pewnego ¯
C. Zauważmy, że log Xima rozkład Exp(θ)zatem P8
i=1 log Xima
rozkład Gamma(8, θ). Stąd ¯
Cmusi być tak dobrane, że
Pθ=2(
8
X
i=1
log Xi<¯
C) = Z¯
C
0
28
7! x7e2xdx =α(¯
C).
Z kolei błąd drugiego rodzaju to
Pθ=4(
8
X
i=1
log Xi6¯
C) = Z
¯
C
48
7! x7e4xdx =β(¯
C).
Wystarczy znaleźć punkt minimum funkcji α(¯
C) + β(¯
C). Zauważmy, że α0(¯
C) + β0(¯
C)=0jeśli
28e2¯
C+ 48e4¯
C= 0
stąd ¯
C= 4 log 2. Pozostaje albo skorzystać z tablic rozkładu χ2, wtedy dostajemy 0,3336. Z
przybliżenia rozkładem normalnym. Niech Zbędzie z rozkładu N(0,1)
α(¯
C) = Pθ=2(P8
i=1 log Xi4
2<¯
C4
2)'P(Z < (4 log 2) 4
2)'0,1927.
oraz
β(¯
C) = Pθ=4(P8
i=1 log Xi2
p1/26¯
C2
p1/2)'P(Z > (8 log 2) 4
2)'0,1373.
Zatem α(¯
C) + β(¯
C)'0,330.
2. (Eg 53/3) Niech X1, X2, ..., Xnbędą niezależnymi zmiennymi losowymi z rozkładu normalnego
N(m+θ, 1),Y1, Y2, ..., Ynbędą niezależnymi zmiennymi losowymi z rozkładu normalnego N(m
θ, 1). Wszystkie zmienne niezależne. Parametry miθ nieznane. Weryfikujemy hipotezę
H0:θ= 0 przy alternatywie H1:θ= 0,5za pomocą testu opartego na ilorazie wiarogodności na
1
pf3
pf4
pf5
pf8
pf9
pfa

Podgląd częściowego tekstu

Pobierz Testowanie Hipotez: Zadania i Rozwiązania i więcej Zadania w PDF z Statystyka stosowana tylko na Docsity!

1 Testowanie hipotez

W tej części rozwiązane zostaną zadania dotyczące testowania hipotez. Wymagana jest wiedza z zakresu najmocniejszych testów, ilorazu wiarygodności, parametrów testów statystycznych.

  1. (Eg 52/1) Niech X 1 , X 2 , ..., X 8 będzie próbką z rozkładu prawdopodobieństwa Pareto o dystrybu- ancie Fθ (x) = 1 −

xθ^

dla x 6 1 oraz Fθ (x) = 0 dla x < 1 ,

gdzie θ > 0 jest nieznanym parametrem. Rozpatrzmy zadanie testowania hipotezy H 0 : θ = 2 przeciwko alternatywie H 1 : θ = 4. Zbudowano taki test, dla którego suma prawdopodobieństw błędów I i II rodzaju, oznaczanych odpowiednio przez α i β, jest najmniejsza. Oblicz tę najmniejszą wartość α + β. Odp: B-> 0 , 3336. Rozwiązanie. Niech fθ (x) = θxθ+1^ będzie gęstością rozkładu Pareto. Testem który dla ustalonego błędu pierwszego rodzaju (równego α) minimalizuje błąd drugiego rodzaju jest test Neymana- Pearsona, którego obszar krytyczny ma postać

K = {(x 1 , .., x 8 ) :

∏^ i=1^ f^4 (xi) 8 i=1 f^2 (xi)^

> C},

gdzie ∑ C jest dobrane tak aby Pθ=2(X ∈ K) = α. Nietrudno zauważyć, że K = {(x 1 , .., x 8 ) : 8 i=1 log^ xi^ <^ C¯}^ dla pewnego^ C¯. Zauważmy, że^ log^ Xi^ ma rozkład^ Exp(θ)^ zatem^

i=1 log^ Xi^ ma rozkład Gamma(8, θ). Stąd C¯ musi być tak dobrane, że

Pθ=2(

∑^8

i=

log Xi < C¯) =

∫ C¯

0

x^7 e−^2 xdx = α( C¯).

Z kolei błąd drugiego rodzaju to

Pθ=4(

∑^8

i=

log Xi 6 C¯) =

C^ ¯

x^7 e−^4 xdx = β( C¯).

Wystarczy znaleźć punkt minimum funkcji α( C¯) + β( C¯). Zauważmy, że α′( C¯) + β′( C¯) = 0 jeśli

− 28 e−^2 C¯^ + 4^8 e−^4 C¯^ = 0

stąd C¯ = 4 log 2. Pozostaje albo skorzystać z tablic rozkładu χ 2 , wtedy dostajemy 0 , 3336. Z przybliżenia rozkładem normalnym. Niech Z będzie z rozkładu N (0, 1)

α( C¯) = Pθ=2(

i=1 log √^ Xi^ −^4 2

C¯ − 4

) ' P(Z <

(4 log 2) − 4 √ 2

oraz β( C¯) = Pθ=4(

i=1 √ log^ Xi^ −^2 1 / 2

C¯ − 2

) ' P(Z >

(8 log 2) − 4 √ 2

Zatem α( C¯) + β( C¯) ' 0 , 330. 

  1. (Eg 53/3) Niech X 1 , X 2 , ..., Xn będą niezależnymi zmiennymi losowymi z rozkładu normalnego N (m + θ, 1), Y 1 , Y 2 , ..., Yn będą niezależnymi zmiennymi losowymi z rozkładu normalnego N (m − θ, 1). Wszystkie zmienne są niezależne. Parametry m i θ są nieznane. Weryfikujemy hipotezę H 0 : θ = 0 przy alternatywie H 1 : θ = 0, 5 za pomocą testu opartego na ilorazie wiarogodności na

poziomie istotności 0 , 05. Moc tego testu przy n = 18 jest równa:? Odp: C-> 0 , 913. Rozwiązanie. Testy oparte na ilorazie i wiarygodności polegają na tym, że porównuje się LK (x) = supθ∈ΘK L(θ, x z LH (x) = supθ∈ΘH L(θ, x). Obszar krytyczny ma zatem postać

K = {x ∈ Rn^ :

LK (x) LH (x)

λ 0 }

dla pewnego λ 0 > 1 spełniającego warunek

Pθ (

LK (X)

LH (X)

λ 0 ) 6 α, gdy θ ∈ ΘH ,

dla zadanej istotności α. W przypadku tego zadania są tylko dwie hipotezy i dlatego test oparty na ilorazie wiarygodności redukuje się do testu Neymana Pearsona. Najlepiej zapamiętać, że w przypadku rozwiązywanego zadania obszar krytyczny będzie miał postać∑ K = {(x, y) ∈ Rn^ × Rn^ : n i=1(xi^ −^ yi)^ > C}. Oczywiście wynik ten można potwierdzić rachunkiem zauważmy, że

LK (x, y) LH (x, y)

exp(− 12 (

∑n i=1[(xi^ −^ m^ −^

1 2 ))

(^2) + (yi − m + 1 2 )

2 ])

exp(− 12 (

∑n i=1[(xi^ −^ m)) (^2) + (yi − m) (^2) ]) =

= exp(

∑^ n

i=

[(xi − yi) −

])).

Stąd natychmiast szukana postać obszaru krytycznego. Znajdujemy właściwe C ze wzoru

Pθ=0(K) = P(

∑^ n

i=

(Xi − Yi) > C) = 0, 05.

Niech Z będzie z rozkładu N (0, 1) oczywiście w sensie rozkładu

∑n i=1(Xi^ −^ Yi)^ (przy założeniu θ = 0) ma postać

2 nZ. Stad C = 6 · 1 , 64 nadto dla θ = 12 w sensie rozkładu

∑n i=1(Xi^ −^ Yi)^ ma postać n +

2 nZ

Pθ= 12 (K) = P(n +

2 nZ >

2 n 1 , 64) = P(Z > 1 , 64 − n √ 2 n

Dla n = 18 dostajemy P(Z > 1 , 64 − 3) = P(Z > − 1 , 36) ' 0 , 913. 

  1. (Eg 54/10) Niech X 1 , X 2 , X 3 , X 4 , X 5 będą niezależnymi zmiennymi losowymi z rozkładu o gęstości

pλ(x) = λe−λx, gdy x > 0 , oraz pλ(x) = 0 gdyx < 0 ,

gdzie λ > 0 jest nieznanym parametrem. Niestety nie obserwujemy zmiennych X 1 , X 2 , X 3 , X 4 , X 5 ale zmienne Yi = [Xi], i = 1, 2 , 3 , 4 , 5 , gdzie symbol [x] oznacza część całkowitą liczby x. Dyspo- nując próbą Y 1 , Y 2 , Y 3 , Y 4 , Y 5 weryfikujemy hipotezę H 0 : λ = 1, przy alternatywie H 1 : λ = 3 za pomocą testu o obszarze krytycznym

K = {ˆλ > 1 , 79 },

gdzie λˆ oznacza estymator największej wiarygodności parametru λ otrzymany na podstawie próby losowej Y 1 , Y 2 , Y 3 , Y 4 , Y 5. Rozmiar tego testu jest równy (wybierz najlepsze przybliżenie). Odp: C-> 0 , 286. Rozwiązanie. Rozkład zmiennych Yk ma postać

Pλ(Yk = n) = Pλ(Xk ∈ [k, k + 1)) = e−λk^ − e−λ(k+1)^ = (1 − e−λ)e−λk, dla k > 0 ,

Warunek jest równoważny temu, że |x|(1− 2 |x|) 6 (8C)−^1. Niech d =

1 − C−^1 czyli |x| 6 1 − 4 d= a lub |x| > 1+ 4 d= b. Zauważmy, że

Pθ (X 6 t) = 1 − 12 [θ − 2 |x|]^2 0 < t 6 θ 2 1 2 [θ^ −^2 |x|]

(^2) − θ 2 < t^6

Stąd Pθ (|X| 6 a) = 1− [θ−^2 |a|]

2 θ^2 , jeśli^ |a|^6

θ 2 , a w przeciwnym razie^1 nadto^ Pθ^ (|X|^ > b) =^

[θ− 2 |b|]^2 θ^2 jeśli |b| 6 θ 2 , a w przeciwnym razie 0. Zatem

Pθ=1(X ∈ K) = 1 − [1 − 2 |b|]^2 + [1 − 2 |a|]^2 = 1 + 2d − 2 d(1/2) = 0, 2.

Pozostaje zauważyć, że b − a =

1 − 8 C¯ 2 nadto^ b

(^2) − a (^2) =

1 − 8 C¯

  1. Niech^ d^ =^

1 − 8 C¯. Zachodzi

Pθ=1(X ∈ K) = 1 − [1 − 2 |a|]^2 + [1 − 2 |b|]^2 = 1 − 2 d + d = 1 − d

Stąd d = 45 a dalej a = 201 , b = 209. Obliczamy moc testu dla θ = 6

Pθ=6(|x| 6 a, |x| > b) = 1 −

(6 − 101 )^2

(6 − 109 )^2

  1. (Eg 56/5) Obserwujemy niezależne zmienne losowe X 1 , X 2 , X 3 , X 4 , Y 1 , Y 2 , Y 3 , Y 4 , Y 5. Zmienne lo- sowe X 1 , X 2 , X 3 , X 4 mają ten sam rozkład o dystrybuancie Fμ 1. Dystrybuanta Fμ spełnia warunek

Fμ(x) = F (x − μ)

dla pewnej ustalonej, nieznanej, ciągłej, ściśle rosnącej dystrybuanty F. Weryfikujemy hipotezę H 0 : μ 1 = μ 2 przy alternatywie H 1 : μ 1 < μ 2 stosując test o obszarze krytycznym

K = {S : S < 16 },

gdzie S jest sumą rang zmiennych losowych X 1 , X 2 , X 3 , X 4 w próbce złożonej ze wszystkich ob- serwacji ustawionych w ciąg rosnący. Wyznaczyć rozmiar testu. Odp: A-> 12618. Rozwiązanie. Test rangi oparty jest o spostrzeżenie, że gdyby μ 1 = μ 2 wtedy zmienne X i Y powinny być losowo wymieszane. W związku z tym wystarczy obliczyć prawdopodobieństwo wszystkich układów sprzyjających temu że S < 16 przy założeniu losowego położenia zmiennych X 1 , ..., X 4 po ustawieniu w ciąg rosnący w całej próbce. Sprawdzamy, że jest dokładnie 18 moż- liwych układów nadto wyborów zbiorów 4 elementowych w 9 elementowym jest

4

= 126. Stąd rozmiar testu wynosi 12618. 

  1. (Eg 56/10) Niech X 1 , X 2 , X 3 , X 4 będą niezależnymi zmiennymi losowymi o identycznym rozkładzie geometrycznym postaci P(X = k) = p(1 − p)k^ gdy k = 0, 1 , 2 , ..., gdzie p ∈ (0, 1) jest nieznanym parametrem. Hipotezę H 0 : p = 12 przy alternatywie H 1 : p > (^12) weryfikujemy testem jednostajnie najmocniejszym na poziomie istotności 0 , 1875. Moc tego testu przy alternatywie p = 45 jest równa:? Odp: E-> 0 , 73728.

Rozwiązanie. Test jednostajnie najmocniejszy oparty jest o statystykę T (x) przy której dla dowolnego p′^ > p funkcja L(p

′,k) L(p,k) jest rosnącą funkcją^ T^ (k). Obliczamy

L(p′, k) L(p, k)

(1 − p′)k^1 +...+k^4 (1 − p)k^1 +...+k^4

1 − p′ 1 − p

)k 1 +...+k 4 .

Zatem szukaną statystyką jest T (k) = −(k 1 + ... + k 4 ). W przypadku rozkładów zawsze trzeba liczyć się z problemem randomizacji testu. To znaczy test ma postać

ϕ(k) =

1 gdy T (k) > C γ gdy T (k) = C 0 gdy T (k) < C

Stałe C i γ wyznacza się z warunku Ep= 12 ϕ(X) = 0, 1875. Zauważmy, że przy p = 12 , X 1 + ... + X 4 ma rozkład ujemny dwumianowy B−(4, 12 ). Należy znaleźć C ∈ N takie, że Pp= 12 (X 1 + ... + X 4 < C) 6 0 , 1875 oraz P(X 1 + ... + X 4 ) > 0 , 1875. Okazuje się, że C = 2, a test szczęśliwie nie jest zrandomizowany. Obliczamy moc testu dla p = 45.

Pp= 45 (X 1 + ... + X 4 < 2) = 0, 7328.



  1. (Eg 57/6) Niech X 1 , X 2 , ..., X 8 będzie próbką z rozkładu prawdopodobieństwa Pareto o dystrybu- ancie Fθ (x) = 1 −

xθ^

dla x 6 1 oraz Fθ (x) = 0 dla x < 1 ,

gdzie θ > 0 jest nieznanym parametrem. Rozpatrzmy zadanie testowania hipotezy H 0 : θ = 4 przeciwko alternatywie H 1 : θ = 2. Zbudowano taki test, dla którego suma prawdopodobieństw błędów I i II rodzaju, oznaczanych odpowiednio przez α i β, jest najmniejsza. Oblicz tę najmniejszą wartość α + β. Odp: B-> 0 , 3336. Rozwiązanie. Zauważmy, że gęstość ma postać fθ (x) = θ^8

i=

1 xi

θ+

. Stosujemy test Neymana Pearsona, w tym obliczy iloraz wiarygodności

L(2, x) L(4, x)

= 2−^8

∏^8

i=

x^2 i = 2−^8 exp(

∑^8

i=

log xi).

Zatem obszar krytyczny K = {x ∈ R^8 : L L(2(4,x,x)) > C} można zapisać jako

K = {x ∈ R^8 :

∑^8

i=

log xi > C¯}

Należy zauważyć, że log Xi ma rozkład Exp(θ) stąd

i=1 log^ Xi^ ma przy zadanym^ θ^ rozkład Γ(8, θ). Stąd

α( C¯) + β( C¯) = Pθ=4(K) + 1 − Pθ=2(K) =

C^ ¯

exp(− 4 x)dx +

∫ C¯

0

exp(− 2 x)dx = f ( C¯).

Poszukujemy C¯ takiego, że f ′( C¯) = 0 Równanie f ′( C¯) = 0 jest równoważna

e−^2 C¯ = 2^8 e−^4 C¯ .

Czyli C¯ = 4 log 2. Pozostaje obliczyć α( C¯)+β( C¯). Można skorzystać z tablic rozkładu chi-kwadrat, wtedy odpowiedzią jest 0 , 3336. Alternatywnie korzystając z rozkładu normalnego dla zmiennej Z z rozkładu N (0, 1)

α( C¯) = Pθ=4(

i=1 √ log^ Xi^ −^2 1 / 2

C¯ − 2

) ' P(Z >

(8 log 2) − 4 √ 2

  1. (Eg 58/3) Niech X 1 , X 2 , ..., X 10 będą niezależnymi zmiennymi losowymi o tym samym rozkładzie. Weryfikowano hipotezę H 0 : VarX = 4 przy alternatywie H 1 : VarX > 4. Zakładając, że zmienne losowe X, mają rozkład normalny o wartości oczekiwanej 0 wykorzystano test jednostajnie naj- mocniejszy na poziomie 0 , 05. W rzeczywistości zmienne losowe X, mają rozkład o gęstości

fc(x) = c|x| exp(−cx^2 ),

gdzie c > 0 jest nieznanym parametrem. Wyznacz rzeczywisty rozmiar wykorzystanego testu (wybierz najlepsze przybliżenie). Odp: B-> 0 , 013. Rozwiązanie. Korzystamy z testu Neymana Pearsona dla gaussowskich zmiennych losowych. Iloraz wiarygodności dla θ > 4 ma postać

L(θ, x) L(4, x)

(2π4)^5 (2πθ)^5 exp(−

θ

∑^10

i=

x^2 i )

co jest rosnącą funkcją

i=1 x

2 i. Zatem obszar krytyczny ma postać

K = {x ∈ R^10 :

∑^10

i=

x^2 i > C}

dla C takiego, że PVarX=4(

i=1 X

2 i > C) = 0,^05. Oczywiście przy^ VarX^ = 4^ rozkład^

i=1 X

2 i to rozkład zmiennej 4 Z, gdzie Z ma rozkład χ^2 z 10 stopniami swobody. Z tablic otrzymujemy, że C/4 = 18, 307. Pozostaje obliczyć

α(c) = Pc(

∑^10

i=

X i^2 > C)

dla Xi o rozkładzie z gęstością fc(x). Zauważmy najpierw, że X i^2 ma rozkład o dystrybuancie

P(X^2 i 6 t) = 2P(0 6 Xi 6

t)

skąd wyznaczamy gęstość c exp(−ct)1t> 0 , czyli X i^2 ma rozkład wykładniczy z parametrem c Pa- rametr c obliczamy z warunku, że EX i^2 = VarXi = 4. Stąd c = 1/ 4. Zatem

i=1 X 2 i ma rozkład Γ(10, 14 ). Ostatecznie

i=1 X

2 i ma rozkład jak^2 Z, gdzie^ Z^ pochodzi z rozkładu^ Γ(^ 20 2 ,^

1 2 )^ czyli χ^2 (20). Z tablic odczytujemy, że P(Z > C/2) ' 0 , 013. 

  1. (Eg 59/9) Zakładając, że zmienne losowe X 1 , X 2 , ..., X 5 , Y 1 , Y 2 , , ..., Y 5 są niezależnymi zmien- nymi losowymi, przy czym Xi, i = 1, 2 , ..., 5 mają rozkłady normalne N (μX , 1), a zmienne Yi, i = 1, 2 , ..., 5 mają rozkłady normalne N (μY , 22 ), zbudowano test najmocniejszy dla weryfikacji hipotezy : H 0 : μX = μY = 0 przy alternatywie H 1 : μX = 1 i μY = − 1 na poziomie istotno- ści 0 , 05. W rzeczywistości zmienne losowe (Xi, Yi), i = 1, 2 , ..., 5 są niezależne i mają rozkłady normalne o parametrach EXi = μX , EYi = μY , VarXi = 1, VarYi = 4, współczynnik korelacji ρ(Xi, Yi) = 0, 5. Przy tych warunkach moc zbudowanego testu jest równa:? Odp: E-> 0 , 87. Rozwiązanie. Stosujemy test Neymana-Pearsona, obliczamy iloraz wiarygodności

L((1, −1), (x, y)) L((0, 0), (x, y))

= exp(

∑^5

i=

(xi −

yi 4

Zatem obszar krytyczny ma postać K = {(x, y) ∈ R^5 × R^5 :

i=1(xi^ −^

yi 4 )^ > C;^ }, gdzie^ C^ jest tak dobrane aby

P(μX ,μY )=(0,0)(

∑^5

i=

(Xi −

Yi 4

) > C).

Niech Z będzie z rozkładu N (0, 1). Przy założeniu μX = μY = 0 rozkład

i=1(Xi^ −^

Yi 4 )^ ma postać 5 2 Z. Stąd^

2 5 C^ '^1 ,^64. Należy więc sprawdzić rozkład^

i=1(Xi^ −^

Yi 4 )^ przy założeniu korelacji oraz μX = 1, μY = − 1. Obliczamy wartość oczekiwaną E

i=1(Xi^ −^

Yi 4 ) =^

25

  1. Obliczamy kowariancję Cov(Xi, Yi) = 1 i wreszcie wariancję

Var(

∑^5

i=

(Xi − Yi 4

Zatem

i=1(Xi^ −^

Yi 4 )^ ma rozkład^

25 4 +^

√ 15 2 Z, gdzie^ Z^ ma rozkład^ N^ (0,^ 1). Stąd

P(μX ,μY )=(1,−1)(

∑^5

i=

(Xi −

Yi 4

) 6 C) = P(

Z >

  1. (Eg 60/5) Obserwujemy niezależne zmienne losowe X 1 , X 2 , X 3 , Y 1 , Y 2 , Y 3 , Y 4 , Y 5. Zmienne losowe X 1 , X 2 , X 3 mają ten sam rozkład o dystrybuancie Fμ 1 , a zmienne Y 1 , Y 2 , Y 3 , Y 4 , Y 5 mają ten sam rozkład o dystrybuancie Fμ 2. Dystrybuanta Fμ warunek

Fμ(x) = F (x − μ)

dla pewnej ustalonej, nieznanej, ciągłej, ściśle rosnącej dystrybuanty F. Weryfikujemy hipotezę H 0 : μ 1 = μ 2 przy alternatywie H 1 : μ 1 6 = μ 2 stosując test o obszarze krytycznym

K = {S : S < 10 ∨ S > 17 },

gdzie S jest sumą rang zmiennych losowych X 1 , X 2 , X 3 w próbce złożonej ze wszystkich obserwacji ustawionych w ciąg rosnący. Wyznaczyć rozmiar testu. Odp: B-> 0 , 250. Rozwiązanie. Korzystamy z testu rangi. Wszystkich możliwych rozmieszczeń 3 elementów wśród 8 jest

3

= 56. Obliczamy teraz liczbę rozmieszczeń dla zbioru krytycznego to znaczy spełniającą warunki S < 10 lub S > 17. Dla S < 10 jest ich tyle samo co dla S > 17 czyli 7. Zatem rozmiar testu wynosi 1456 = 0, 25. 

  1. (Eg 60/8) Zakładając, że zmienne losowe X 1 , X 2 , X 3 są niezależne i mają jednakowy rozkład jednostajny na przedziale (−θ, θ), gdzie θ > 0 jest nieznanym parametrem, weryfikujemy hipotezę H 0 : θ = 1 przy alternatywie H 1 : θ 6 = 1 za pomocą testu jednostajnie najmocniejszego na poziomie istotności 0 , 2. W rzeczywistości zmienne losowe X 1 , X 2 , X 3 są niezależne o tym samym rozkładzie o gęstości p(x) =

|x|, gdy x ∈ (− 2 , 2), oraz p(x) = 0 gdy |x| > 2.

Prawdopodobieństwo zbioru krytycznego rozważanego testu przy tym rozkładzie zmiennych X 1 , X 2 , X 3 jest równe:? Odp: B-> 0 , 9850. Rozwiązanie. Zazwyczaj testy najmocniejsze są jednostronne. Znajdźmy strukturę testu Ney- mana Pearsona dla θ > 1 opartą o iloraz wiarygodności

L(θ, x) L(1, x)

i=1 1 |xi|^6 θ θ^3

i=1 1 |xi|^61

  1. (Eg 62/1) Każda ze zmiennych losowych X 1 , X 2 , ..., X 9 ma rozkład normalny z nieznaną wartością oczekiwaną m 1 i wariancją 1 , a każda ze zmiennych losowych Y 1 , Y 2 , ..., Y 9 rozkład normalny z nie- znaną wartością oczekiwaną m 2 i wariancją 4. Założono, że wszystkie zmienne losowe są niezależne i wyznaczono, przy tych założeniach, test oparty na ilorazie wiarogodności dla testowania hipotezy H 0 : m 1 = m 2 przy alternatywie H 1 : m 1 6 = m 2 na poziomie istotności 0 , 05. W rzeczywistości założenie to nie jest spełnione:
    • co prawda pary zmiennych (X 1 , Y 1 ), (X 2 , Y 2 ), ..., (Xn, Yn) są niezależne i mają rozkłady nor- malne, ale
    • dla i = 1, 2 , ..., 6 , Xi, Yi są zależne i współczynnik korelacji Corr(Xi, Yi) = − 12.

Moc testu przy alternatywie m 1 = m 2 + 1 jest równa:? Odp: B-> 0 , 293. Rozwiązanie. Stosujemy test oparty na ilorazie wiarygodności

LK (x) LH (x)

sup(m 1 ,m 2 )∈K L((m 1 , m 2 ), x) supθ∈H L((m 1 , m 2 ), x)

Obliczamy

sup (μ 1 ,μ 2 )∈K

L((m 1 , m 2 ), x) = sup (m 1 ,m 2 )

(2π)

9 (^2) (8π) 9 (^2) exp(−

∑^9

i=

[

(xi − m 1 )^2 2

(yi − m 2 )^2 8

]) =

= sup m 1 ,m 2

(2π)

(^92) (8π)

(^92) exp(−

∑^9

i=

[

(xi − ¯x)^2 2

(yi − ¯y)^2 8

]),

gdyż maksimum jest osiągane dla m 1 = ¯x = (^1) n (x 1 + ... + xn), m 2 = ¯y = (^1) n (y 1 + ... + yn). Z drugiej strony

sup (m 1 ,m 2 )∈H

L((m 1 , m 2 ), x) = sup m 1

(2π)

(^92) (8π)

(^92) exp(−

∑^9

i=

[

(xi − m 1 )^2 2

(yi − m 1 )^2 8

]) =

= sup m 1

(2π) (^92) (8π) (^92) exp(−

∑^9

i=

[

x^2 i 2

y^2 i 8

n(¯x + y¯ 4

)^2 ]).

Stąd

exp(−

∑^9

i=

[n(

x¯^2 2

y¯^2 8

(¯x +

y¯ 4

)^2 )]) = exp(n

∑^9

i=

(¯x − ¯y)^2 10

Zatem obszar krytyczny ma postać

K = {(x, y) : |¯x − y¯| > C}

co warto zapamiętać jako fakt pomocniczy. Obliczamy wartość C

Pm 1 =m 2 (| X¯ − Y¯ | > C) = 0, 05.

Przy założeniu X¯ − Y¯ ma rozkład N (0, 59 ) czyli dla Z z rozkładu N (0, 1)

Pm 1 =m 2 (| X¯ − Y¯ | > C) = P(

|Z| > C) = 0, 05.

Zatem √^35 C = 1, 96 , C =

√ 5 3 ·^1 ,^96. Dla^ m^1 =^ m^2 + 1^ rozkład^ X¯ − Y¯ ma wartość średnią 1. Nadto przy założeniach o korelacji dla i = 1, 2 , ..., 6 zachodzi Cov(Xi, Yi) = − 1. Zatem

Var( X¯ − Y¯ ) =

Obliczamy

Pm 1 =m 2 +1(| X¯ − Y¯ | > C) = P(|1 +

Z| > C) ' 0 , 293.

  1. (Eg 62/3) Załóżmy, że dysponujemy pojedynczą obserwacją X z rozkładu Laplace’a o gęstości

fμ,λ(x) =

λ 2

e−λ|x−μ|,

gdzie λ > 0 i μ ∈ R są parametrami. Rozważamy zadanie testowania hipotezy

H 0 : μ = − 1 i λ = 0, 5

przy alternatywie H 1 : μ = 0 i λ = 1. Obszar krytyczny najmocniejszego testu na poziomie istotności α jest postaci

K = {x : x ∈ (b, 2)}.

Moc testu jest równa Odp: C-> 0 , 676. Rozwiązanie. Najmocniejszy test ma konstrukcję testu Neymana-Pearsona czyli powinniśmy wyznaczyć iloraz wiarygodności

L((− 1 , 12 ), x) L((0, 1), x)

= 2 exp(−|x| +

|x + 1|).

Zatem obszar krytyczny ma postać K = {x ∈ R : −|x| + 12 |x + 1| > C}. Stąd C = − 12 oraz b = − 23. Pozostaje obliczyć moc testu

Pμ=0,λ=1(X ∈ K) =

− (^23)

e−|x|dx =

(1 − e−^2 ) +

(1 − e−^ (^23) ) ' 0 , 676.