






Studiuj dzięki licznym zasobom udostępnionym na Docsity
Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium
Przygotuj się do egzaminów
Studiuj dzięki licznym zasobom udostępnionym na Docsity
Otrzymaj punkty, aby pobrać
Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium
Społeczność
Odkryj najlepsze uniwersytety w twoim kraju, według użytkowników Docsity
Bezpłatne poradniki
Pobierz bezpłatnie nasze przewodniki na temat technik studiowania, metod panowania nad stresem, wskazówki do przygotowania do prac magisterskich opracowane przez wykładowców Docsity
Zestaw przykładowych zadań z rozwiązaniami
Typologia: Zadania
1 / 11
Ta strona nie jest widoczna w podglądzie
Nie przegap ważnych części!
W tej części rozwiązane zostaną zadania dotyczące testowania hipotez. Wymagana jest wiedza z zakresu najmocniejszych testów, ilorazu wiarygodności, parametrów testów statystycznych.
xθ^
dla x 6 1 oraz Fθ (x) = 0 dla x < 1 ,
gdzie θ > 0 jest nieznanym parametrem. Rozpatrzmy zadanie testowania hipotezy H 0 : θ = 2 przeciwko alternatywie H 1 : θ = 4. Zbudowano taki test, dla którego suma prawdopodobieństw błędów I i II rodzaju, oznaczanych odpowiednio przez α i β, jest najmniejsza. Oblicz tę najmniejszą wartość α + β. Odp: B-> 0 , 3336. Rozwiązanie. Niech fθ (x) = θxθ+1^ będzie gęstością rozkładu Pareto. Testem który dla ustalonego błędu pierwszego rodzaju (równego α) minimalizuje błąd drugiego rodzaju jest test Neymana- Pearsona, którego obszar krytyczny ma postać
K = {(x 1 , .., x 8 ) :
∏^ i=1^ f^4 (xi) 8 i=1 f^2 (xi)^
gdzie ∑ C jest dobrane tak aby Pθ=2(X ∈ K) = α. Nietrudno zauważyć, że K = {(x 1 , .., x 8 ) : 8 i=1 log^ xi^ <^ C¯}^ dla pewnego^ C¯. Zauważmy, że^ log^ Xi^ ma rozkład^ Exp(θ)^ zatem^
i=1 log^ Xi^ ma rozkład Gamma(8, θ). Stąd C¯ musi być tak dobrane, że
Pθ=2(
i=
log Xi < C¯) =
0
x^7 e−^2 xdx = α( C¯).
Z kolei błąd drugiego rodzaju to
Pθ=4(
i=
log Xi 6 C¯) =
C^ ¯
x^7 e−^4 xdx = β( C¯).
Wystarczy znaleźć punkt minimum funkcji α( C¯) + β( C¯). Zauważmy, że α′( C¯) + β′( C¯) = 0 jeśli
− 28 e−^2 C¯^ + 4^8 e−^4 C¯^ = 0
stąd C¯ = 4 log 2. Pozostaje albo skorzystać z tablic rozkładu χ 2 , wtedy dostajemy 0 , 3336. Z przybliżenia rozkładem normalnym. Niech Z będzie z rozkładu N (0, 1)
α( C¯) = Pθ=2(
i=1 log √^ Xi^ −^4 2
(4 log 2) − 4 √ 2
oraz β( C¯) = Pθ=4(
i=1 √ log^ Xi^ −^2 1 / 2
(8 log 2) − 4 √ 2
Zatem α( C¯) + β( C¯) ' 0 , 330.
poziomie istotności 0 , 05. Moc tego testu przy n = 18 jest równa:? Odp: C-> 0 , 913. Rozwiązanie. Testy oparte na ilorazie i wiarygodności polegają na tym, że porównuje się LK (x) = supθ∈ΘK L(θ, x z LH (x) = supθ∈ΘH L(θ, x). Obszar krytyczny ma zatem postać
K = {x ∈ Rn^ :
LK (x) LH (x)
λ 0 }
dla pewnego λ 0 > 1 spełniającego warunek
Pθ (
λ 0 ) 6 α, gdy θ ∈ ΘH ,
dla zadanej istotności α. W przypadku tego zadania są tylko dwie hipotezy i dlatego test oparty na ilorazie wiarygodności redukuje się do testu Neymana Pearsona. Najlepiej zapamiętać, że w przypadku rozwiązywanego zadania obszar krytyczny będzie miał postać∑ K = {(x, y) ∈ Rn^ × Rn^ : n i=1(xi^ −^ yi)^ > C}. Oczywiście wynik ten można potwierdzić rachunkiem zauważmy, że
LK (x, y) LH (x, y)
exp(− 12 (
∑n i=1[(xi^ −^ m^ −^
1 2 ))
(^2) + (yi − m + 1 2 )
exp(− 12 (
∑n i=1[(xi^ −^ m)) (^2) + (yi − m) (^2) ]) =
= exp(
∑^ n
i=
[(xi − yi) −
Stąd natychmiast szukana postać obszaru krytycznego. Znajdujemy właściwe C ze wzoru
Pθ=0(K) = P(
∑^ n
i=
(Xi − Yi) > C) = 0, 05.
Niech Z będzie z rozkładu N (0, 1) oczywiście w sensie rozkładu
∑n i=1(Xi^ −^ Yi)^ (przy założeniu θ = 0) ma postać
2 nZ. Stad C = 6 · 1 , 64 nadto dla θ = 12 w sensie rozkładu
∑n i=1(Xi^ −^ Yi)^ ma postać n +
2 nZ
Pθ= 12 (K) = P(n +
2 nZ >
2 n 1 , 64) = P(Z > 1 , 64 − n √ 2 n
Dla n = 18 dostajemy P(Z > 1 , 64 − 3) = P(Z > − 1 , 36) ' 0 , 913.
pλ(x) = λe−λx, gdy x > 0 , oraz pλ(x) = 0 gdyx < 0 ,
gdzie λ > 0 jest nieznanym parametrem. Niestety nie obserwujemy zmiennych X 1 , X 2 , X 3 , X 4 , X 5 ale zmienne Yi = [Xi], i = 1, 2 , 3 , 4 , 5 , gdzie symbol [x] oznacza część całkowitą liczby x. Dyspo- nując próbą Y 1 , Y 2 , Y 3 , Y 4 , Y 5 weryfikujemy hipotezę H 0 : λ = 1, przy alternatywie H 1 : λ = 3 za pomocą testu o obszarze krytycznym
K = {ˆλ > 1 , 79 },
gdzie λˆ oznacza estymator największej wiarygodności parametru λ otrzymany na podstawie próby losowej Y 1 , Y 2 , Y 3 , Y 4 , Y 5. Rozmiar tego testu jest równy (wybierz najlepsze przybliżenie). Odp: C-> 0 , 286. Rozwiązanie. Rozkład zmiennych Yk ma postać
Pλ(Yk = n) = Pλ(Xk ∈ [k, k + 1)) = e−λk^ − e−λ(k+1)^ = (1 − e−λ)e−λk, dla k > 0 ,
Warunek jest równoważny temu, że |x|(1− 2 |x|) 6 (8C)−^1. Niech d =
1 − C−^1 czyli |x| 6 1 − 4 d= a lub |x| > 1+ 4 d= b. Zauważmy, że
Pθ (X 6 t) = 1 − 12 [θ − 2 |x|]^2 0 < t 6 θ 2 1 2 [θ^ −^2 |x|]
(^2) − θ 2 < t^6
Stąd Pθ (|X| 6 a) = 1− [θ−^2 |a|]
2 θ^2 , jeśli^ |a|^6
θ 2 , a w przeciwnym razie^1 nadto^ Pθ^ (|X|^ > b) =^
[θ− 2 |b|]^2 θ^2 jeśli |b| 6 θ 2 , a w przeciwnym razie 0. Zatem
Pθ=1(X ∈ K) = 1 − [1 − 2 |b|]^2 + [1 − 2 |a|]^2 = 1 + 2d − 2 d(1/2) = 0, 2.
Pozostaje zauważyć, że b − a =
1 − 8 C¯ 2 nadto^ b
(^2) − a (^2) =
1 − 8 C¯
1 − 8 C¯. Zachodzi
Pθ=1(X ∈ K) = 1 − [1 − 2 |a|]^2 + [1 − 2 |b|]^2 = 1 − 2 d + d = 1 − d
Stąd d = 45 a dalej a = 201 , b = 209. Obliczamy moc testu dla θ = 6
Pθ=6(|x| 6 a, |x| > b) = 1 −
Fμ(x) = F (x − μ)
dla pewnej ustalonej, nieznanej, ciągłej, ściśle rosnącej dystrybuanty F. Weryfikujemy hipotezę H 0 : μ 1 = μ 2 przy alternatywie H 1 : μ 1 < μ 2 stosując test o obszarze krytycznym
K = {S : S < 16 },
gdzie S jest sumą rang zmiennych losowych X 1 , X 2 , X 3 , X 4 w próbce złożonej ze wszystkich ob- serwacji ustawionych w ciąg rosnący. Wyznaczyć rozmiar testu. Odp: A-> 12618. Rozwiązanie. Test rangi oparty jest o spostrzeżenie, że gdyby μ 1 = μ 2 wtedy zmienne X i Y powinny być losowo wymieszane. W związku z tym wystarczy obliczyć prawdopodobieństwo wszystkich układów sprzyjających temu że S < 16 przy założeniu losowego położenia zmiennych X 1 , ..., X 4 po ustawieniu w ciąg rosnący w całej próbce. Sprawdzamy, że jest dokładnie 18 moż- liwych układów nadto wyborów zbiorów 4 elementowych w 9 elementowym jest
4
= 126. Stąd rozmiar testu wynosi 12618.
Rozwiązanie. Test jednostajnie najmocniejszy oparty jest o statystykę T (x) przy której dla dowolnego p′^ > p funkcja L(p
′,k) L(p,k) jest rosnącą funkcją^ T^ (k). Obliczamy
L(p′, k) L(p, k)
(1 − p′)k^1 +...+k^4 (1 − p)k^1 +...+k^4
1 − p′ 1 − p
)k 1 +...+k 4 .
Zatem szukaną statystyką jest T (k) = −(k 1 + ... + k 4 ). W przypadku rozkładów zawsze trzeba liczyć się z problemem randomizacji testu. To znaczy test ma postać
ϕ(k) =
1 gdy T (k) > C γ gdy T (k) = C 0 gdy T (k) < C
Stałe C i γ wyznacza się z warunku Ep= 12 ϕ(X) = 0, 1875. Zauważmy, że przy p = 12 , X 1 + ... + X 4 ma rozkład ujemny dwumianowy B−(4, 12 ). Należy znaleźć C ∈ N takie, że Pp= 12 (X 1 + ... + X 4 < C) 6 0 , 1875 oraz P(X 1 + ... + X 4 ) > 0 , 1875. Okazuje się, że C = 2, a test szczęśliwie nie jest zrandomizowany. Obliczamy moc testu dla p = 45.
Pp= 45 (X 1 + ... + X 4 < 2) = 0, 7328.
xθ^
dla x 6 1 oraz Fθ (x) = 0 dla x < 1 ,
gdzie θ > 0 jest nieznanym parametrem. Rozpatrzmy zadanie testowania hipotezy H 0 : θ = 4 przeciwko alternatywie H 1 : θ = 2. Zbudowano taki test, dla którego suma prawdopodobieństw błędów I i II rodzaju, oznaczanych odpowiednio przez α i β, jest najmniejsza. Oblicz tę najmniejszą wartość α + β. Odp: B-> 0 , 3336. Rozwiązanie. Zauważmy, że gęstość ma postać fθ (x) = θ^8
i=
1 xi
θ+
. Stosujemy test Neymana Pearsona, w tym obliczy iloraz wiarygodności
L(2, x) L(4, x)
i=
x^2 i = 2−^8 exp(
i=
log xi).
Zatem obszar krytyczny K = {x ∈ R^8 : L L(2(4,x,x)) > C} można zapisać jako
K = {x ∈ R^8 :
i=
log xi > C¯}
Należy zauważyć, że log Xi ma rozkład Exp(θ) stąd
i=1 log^ Xi^ ma przy zadanym^ θ^ rozkład Γ(8, θ). Stąd
α( C¯) + β( C¯) = Pθ=4(K) + 1 − Pθ=2(K) =
C^ ¯
exp(− 4 x)dx +
0
exp(− 2 x)dx = f ( C¯).
Poszukujemy C¯ takiego, że f ′( C¯) = 0 Równanie f ′( C¯) = 0 jest równoważna
e−^2 C¯ = 2^8 e−^4 C¯ .
Czyli C¯ = 4 log 2. Pozostaje obliczyć α( C¯)+β( C¯). Można skorzystać z tablic rozkładu chi-kwadrat, wtedy odpowiedzią jest 0 , 3336. Alternatywnie korzystając z rozkładu normalnego dla zmiennej Z z rozkładu N (0, 1)
α( C¯) = Pθ=4(
i=1 √ log^ Xi^ −^2 1 / 2
(8 log 2) − 4 √ 2
fc(x) = c|x| exp(−cx^2 ),
gdzie c > 0 jest nieznanym parametrem. Wyznacz rzeczywisty rozmiar wykorzystanego testu (wybierz najlepsze przybliżenie). Odp: B-> 0 , 013. Rozwiązanie. Korzystamy z testu Neymana Pearsona dla gaussowskich zmiennych losowych. Iloraz wiarygodności dla θ > 4 ma postać
L(θ, x) L(4, x)
(2π4)^5 (2πθ)^5 exp(−
θ
i=
x^2 i )
co jest rosnącą funkcją
i=1 x
2 i. Zatem obszar krytyczny ma postać
K = {x ∈ R^10 :
i=
x^2 i > C}
dla C takiego, że PVarX=4(
i=1 X
2 i > C) = 0,^05. Oczywiście przy^ VarX^ = 4^ rozkład^
i=1 X
2 i to rozkład zmiennej 4 Z, gdzie Z ma rozkład χ^2 z 10 stopniami swobody. Z tablic otrzymujemy, że C/4 = 18, 307. Pozostaje obliczyć
α(c) = Pc(
i=
X i^2 > C)
dla Xi o rozkładzie z gęstością fc(x). Zauważmy najpierw, że X i^2 ma rozkład o dystrybuancie
P(X^2 i 6 t) = 2P(0 6 Xi 6
t)
skąd wyznaczamy gęstość c exp(−ct)1t> 0 , czyli X i^2 ma rozkład wykładniczy z parametrem c Pa- rametr c obliczamy z warunku, że EX i^2 = VarXi = 4. Stąd c = 1/ 4. Zatem
i=1 X 2 i ma rozkład Γ(10, 14 ). Ostatecznie
i=1 X
2 i ma rozkład jak^2 Z, gdzie^ Z^ pochodzi z rozkładu^ Γ(^ 20 2 ,^
1 2 )^ czyli χ^2 (20). Z tablic odczytujemy, że P(Z > C/2) ' 0 , 013.
L((1, −1), (x, y)) L((0, 0), (x, y))
= exp(
i=
(xi −
yi 4
Zatem obszar krytyczny ma postać K = {(x, y) ∈ R^5 × R^5 :
i=1(xi^ −^
yi 4 )^ > C;^ }, gdzie^ C^ jest tak dobrane aby
P(μX ,μY )=(0,0)(
i=
(Xi −
Yi 4
Niech Z będzie z rozkładu N (0, 1). Przy założeniu μX = μY = 0 rozkład
i=1(Xi^ −^
Yi 4 )^ ma postać 5 2 Z. Stąd^
2 5 C^ '^1 ,^64. Należy więc sprawdzić rozkład^
i=1(Xi^ −^
Yi 4 )^ przy założeniu korelacji oraz μX = 1, μY = − 1. Obliczamy wartość oczekiwaną E
i=1(Xi^ −^
Yi 4 ) =^
25
Var(
i=
(Xi − Yi 4
Zatem
i=1(Xi^ −^
Yi 4 )^ ma rozkład^
25 4 +^
√ 15 2 Z, gdzie^ Z^ ma rozkład^ N^ (0,^ 1). Stąd
P(μX ,μY )=(1,−1)(
i=
(Xi −
Yi 4
Fμ(x) = F (x − μ)
dla pewnej ustalonej, nieznanej, ciągłej, ściśle rosnącej dystrybuanty F. Weryfikujemy hipotezę H 0 : μ 1 = μ 2 przy alternatywie H 1 : μ 1 6 = μ 2 stosując test o obszarze krytycznym
K = {S : S < 10 ∨ S > 17 },
gdzie S jest sumą rang zmiennych losowych X 1 , X 2 , X 3 w próbce złożonej ze wszystkich obserwacji ustawionych w ciąg rosnący. Wyznaczyć rozmiar testu. Odp: B-> 0 , 250. Rozwiązanie. Korzystamy z testu rangi. Wszystkich możliwych rozmieszczeń 3 elementów wśród 8 jest
3
= 56. Obliczamy teraz liczbę rozmieszczeń dla zbioru krytycznego to znaczy spełniającą warunki S < 10 lub S > 17. Dla S < 10 jest ich tyle samo co dla S > 17 czyli 7. Zatem rozmiar testu wynosi 1456 = 0, 25.
|x|, gdy x ∈ (− 2 , 2), oraz p(x) = 0 gdy |x| > 2.
Prawdopodobieństwo zbioru krytycznego rozważanego testu przy tym rozkładzie zmiennych X 1 , X 2 , X 3 jest równe:? Odp: B-> 0 , 9850. Rozwiązanie. Zazwyczaj testy najmocniejsze są jednostronne. Znajdźmy strukturę testu Ney- mana Pearsona dla θ > 1 opartą o iloraz wiarygodności
L(θ, x) L(1, x)
i=1 1 |xi|^6 θ θ^3
i=1 1 |xi|^61
Moc testu przy alternatywie m 1 = m 2 + 1 jest równa:? Odp: B-> 0 , 293. Rozwiązanie. Stosujemy test oparty na ilorazie wiarygodności
LK (x) LH (x)
sup(m 1 ,m 2 )∈K L((m 1 , m 2 ), x) supθ∈H L((m 1 , m 2 ), x)
Obliczamy
sup (μ 1 ,μ 2 )∈K
L((m 1 , m 2 ), x) = sup (m 1 ,m 2 )
(2π)
9 (^2) (8π) 9 (^2) exp(−
i=
(xi − m 1 )^2 2
(yi − m 2 )^2 8
= sup m 1 ,m 2
(2π)
(^92) (8π)
(^92) exp(−
i=
(xi − ¯x)^2 2
(yi − ¯y)^2 8
gdyż maksimum jest osiągane dla m 1 = ¯x = (^1) n (x 1 + ... + xn), m 2 = ¯y = (^1) n (y 1 + ... + yn). Z drugiej strony
sup (m 1 ,m 2 )∈H
L((m 1 , m 2 ), x) = sup m 1
(2π)
(^92) (8π)
(^92) exp(−
i=
(xi − m 1 )^2 2
(yi − m 1 )^2 8
= sup m 1
(2π) (^92) (8π) (^92) exp(−
i=
x^2 i 2
y^2 i 8
n(¯x + y¯ 4
Stąd
exp(−
i=
[n(
x¯^2 2
y¯^2 8
(¯x +
y¯ 4
)^2 )]) = exp(n
i=
(¯x − ¯y)^2 10
Zatem obszar krytyczny ma postać
K = {(x, y) : |¯x − y¯| > C}
co warto zapamiętać jako fakt pomocniczy. Obliczamy wartość C
Pm 1 =m 2 (| X¯ − Y¯ | > C) = 0, 05.
Przy założeniu X¯ − Y¯ ma rozkład N (0, 59 ) czyli dla Z z rozkładu N (0, 1)
Pm 1 =m 2 (| X¯ − Y¯ | > C) = P(
Zatem √^35 C = 1, 96 , C =
√ 5 3 ·^1 ,^96. Dla^ m^1 =^ m^2 + 1^ rozkład^ X¯ − Y¯ ma wartość średnią 1. Nadto przy założeniach o korelacji dla i = 1, 2 , ..., 6 zachodzi Cov(Xi, Yi) = − 1. Zatem
Var( X¯ − Y¯ ) =
Obliczamy
Pm 1 =m 2 +1(| X¯ − Y¯ | > C) = P(|1 +
fμ,λ(x) =
λ 2
e−λ|x−μ|,
gdzie λ > 0 i μ ∈ R są parametrami. Rozważamy zadanie testowania hipotezy
H 0 : μ = − 1 i λ = 0, 5
przy alternatywie H 1 : μ = 0 i λ = 1. Obszar krytyczny najmocniejszego testu na poziomie istotności α jest postaci
K = {x : x ∈ (b, 2)}.
Moc testu jest równa Odp: C-> 0 , 676. Rozwiązanie. Najmocniejszy test ma konstrukcję testu Neymana-Pearsona czyli powinniśmy wyznaczyć iloraz wiarygodności
L((− 1 , 12 ), x) L((0, 1), x)
= 2 exp(−|x| +
|x + 1|).
Zatem obszar krytyczny ma postać K = {x ∈ R : −|x| + 12 |x + 1| > C}. Stąd C = − 12 oraz b = − 23. Pozostaje obliczyć moc testu
Pμ=0,λ=1(X ∈ K) =
− (^23)
e−|x|dx =
(1 − e−^2 ) +
(1 − e−^ (^23) ) ' 0 , 676.