Docsity
Docsity

Przygotuj się do egzaminów
Przygotuj się do egzaminów

Studiuj dzięki licznym zasobom udostępnionym na Docsity


Otrzymaj punkty, aby pobrać
Otrzymaj punkty, aby pobrać

Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium


Informacje i wskazówki
Informacje i wskazówki

Materiały do ćwiczeń laboratoryjnych ze Statystyki ..., Egzaminy z Analiza regresji

laboratoryjnych ze. Statystyki matematycznej I. - zadania ... f) Wyznacz i zinterpretuj podstawowe statystyki prَbkowe dla danych opisujących.

Typologia: Egzaminy

2022/2023

Załadowany 23.02.2023

Lady_Pank
Lady_Pank 🇵🇱

4.7

(136)

375 dokumenty

1 / 23

Toggle sidebar

Ta strona nie jest widoczna w podglądzie

Nie przegap ważnych części!

bg1
Wydział Matematyki i Nauk Informacyjnych
Politechnika Warszawska
Materiały do ćwiczeń
laboratoryjnych ze
Statystyki matematycznej I
- zadania
Przemysław Grzegorzewski
Konstancja Bobecka
Marek Gągolewski
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17

Podgląd częściowego tekstu

Pobierz Materiały do ćwiczeń laboratoryjnych ze Statystyki ... i więcej Egzaminy w PDF z Analiza regresji tylko na Docsity!

Wydział Matematyki i Nauk Informacyjnych

Politechnika Warszawska

Materiały do ćwiczeń

laboratoryjnych ze

Statystyki matematycznej I

- zadania

Przemysław Grzegorzewski

Konstancja Bobecka

Marek Gągolewski

SM-I: Wprowadzenie do języka R

Zadanie 1.1. Na czym polega reguła zawijania dla wektorów?

Zadanie 1.2. Utwórz tabelkę działań dla podstawowych operatorów logicznych dla wszyst- kich kombinacji wartości TRUE, FALSE oraz NA.

Zadanie 1.3. Wspomnieliśmy, iż w jezyku R dostępne są operatory && oraz ||. Na jakiej zasadzie działają? Spróbuj ją odkryć testując operacje na różnych wektorach logicznych.

Zadanie 1.4. Indeksem Hirscha dla uporządkowanego nierosnąco ciągu C = ( c 1 , c 2 ,... , cn ), ci cj dla i ¬ j , c 1 > 0 , nazywamy wartość

h ( C ) = max {i : ci i} =

∑^ n

i =

1 ( ci i ) , (1)

gdzie 1 ( w ) oznacza tzw. funkcję indykatorową, przyjmującą wartość 1 , jeżeli warunek w jest spełniony, oraz 0 — w przeciwnym przypadku. Wyznacz za pomocą R-a wartość indeksu Hirscha np. dla następujących wektorów: (43 , 12 , 9 , 4 , 3 , 2 , 0 , 0), (1 , 1 , 1 , 1 , 1 , 1), (32 , 74 , 24 , 64 , 123 , 6 , 0 , 35 , 1 , 1 , 1 , 3 , 64 , 0 , 0).

Zadanie 1.5. Indeksem Egghego dla uporządkowanego nierosnąco ciągu C = ( c 1 , c 2 ,... , cn ), ci cj dla i ¬ j , c 1 > 0 , nazywamy wartość

g ( C ) = max

   i^ :

∑^ i

j =

cj i^2

   =

∑^ n

i =

 

∑^ i

j =

cj i^2

  (^). (2)

Wyznacz za pomocą R-a wartość indeksu g dla różnych wektorów.

SM-I, s. 1.

a) Wprowadź dane do programu R. b) Utwórz tabelę liczności i częstości liczby urodzeń w zależności od wieku matki. c) Narysuj wykres kołowy. d) Narysuj wykres słupkowy. e) Zinterpretuj uzyskane wyniki.

Zadanie 2.7. Koncern paliwowy planuje otworzyć nową stację benzynową w pewnym mieście. Rozważane są cztery możliwe lokalizacje stacji — w południowej (S), północnej (N), zachodniej (W) i wschodniej (E) dzielnicy miasta. W ramach badania opinii społecznej odnośnie preferowanej lokalizacji stacji zapytano o to tysiąc kierowców. Ich odpowiedzi znajdują się w pliku stacje.csv. Utworzyć wykres słupkowy i wykres kołowy dla bada- nych preferencji.

Zadanie 2.8. Badania demograficzne przeprowadzone w 1988 roku w USA wykazały, że wśród kobiet (mających 18 i więcej lat) było: 17364 tyś. panien, 56128 tyś. mężatek, 11239 tyś. wdów i 8170 tyś. rozwódek.

a) Utwórz wykres kołowy dla stanu cywilnego danej grupy kobiet. Porównaj różne formy opisu wykresu. b) Utwórz wykres słupkowy dla stanu cywilnego danej grupy kobiet. Porównaj różne rodzaje wykresów i formy ich opisu.

Zadanie 2.9. Uważa się, że oko ludzkie dobrze rozpoznaje różnice stosunków długości, lecz nie najlepiej sobie radzi ze stosunkami pól. Dlatego, w przypadku danych typu jako- ściowego, odradza się używania wykresu kołowego, na korzyść np. wykresu słupkowego.

a) Podaj przykład danych, dla których trudno jest ocenić, które kategorie mogą być reprezentowane liczniej od innych. b) W dowolnym czasopiśmie poruszającym tematykę życia społeczno-politycznego (np. Polityka, Wprost), znajdź przykłady wykresów dla danych typu jakościowego. Któ- rych jest najwięcej?

Zadanie 2.10. Zanalizuj dane dotyczące liczby małżeństw w ostatnim roku według mie- siąca zawarcia ślubu. Skorzystaj z aktualnego Rocznika Demograficznego publikowanego przez GUS (http://www.stat.gov.pl). Jak wyjaśnisz uzyskane wyniki?

Zadanie 2.11. Wytrzymałość na ciśnienie wewnętrzne szkła butelek jest ich ważną cha- rakterystyką jakościową. W celu zbadania wytrzymałości butelek umieszcza się je w ma- szynie hydrostatycznej, po czym zwiększa się ciśnienie aż do zniszczenia butelki. Plik butelki.csv zawiera dane opisujące graniczną wytrzymałość na ciśnienie wewnętrzne szkła badanej partii butelek (mierzone w psi — funtach na cal kwadratowy).

a) Utwórz zmienną o nazwie cisnienie, opisującą wytrzymałość na ciśnienie we- wnętrzne szkła butelek mierzone w MPa. Wskazówka: 1 psi = 6 894,757 Pa b) Utwórz histogram dla danych opisujących wytrzymałość butelek. Prześledź wpływ liczby klas na kształt histogramu. Porównaj różne rodzaje histogramów. c) Utwórz wykres łamanej liczności i nałóż go na wykres histogramu. d) Utwórz wykres łodygowo-liściowy. e) Utwórz i zinterpretuj wykres skrzynkowy dla wytrzymałości butelek. f) Wyznacz i zinterpretuj podstawowe statystyki próbkowe dla danych opisujących wytrzymałość butelek.

SM-II, s. 2.

g) Oblicz i zinterpretuj 5, 10, 25, 50, 75, 90 i 95 percentyl dla rozważanych danych. h) Wyznacz 10% średnią uciętą dla danych opisujących wytrzymałość butelek. Porów- naj średnią uciętą ze średnią arytmetyczną i medianą. Prześledzić, jak zmienia się wartość średniej wraz ze zmianą stopnia ucięcia próbki.

Zadanie 2.12. Zamieszczone poniżej dane przedstawiają wysokość czynszu płaconego w pewnej spółdzielni mieszkaniowej przez 30 losowo wybranych lokatorów.

334, 436, 425, 398, 424, 429, 392, 428, 339, 389 352, 405, 392, 403, 344, 400, 424, 443, 378, 387 384, 498, 374, 389, 367, 457, 409, 454, 345, 422.

Przeprowadź wstępną analizę statystyczną powyższych danych.

Zadanie 2.13. Przeprowadź wstępną analizę statystyczną danych dotyczących przyspie- szenia (zmienna przysp) pojazdów z bazy samochody.csv, ważących mniej niż 2500 fun- tów (zmienna waga).

Zadanie 2.14. Przeprowadź wstępną analizę statystyczną danych dotyczących przyspie- szenia (zmienna przysp) pojazdów z bazy samochody.csv, oddzielnie dla aut z Ameryki, Europy i Japonii.

Zadanie 2.15. Porównaj dane dotyczące mocy (zmienna moc) samochodów posiadają- cych różną liczbę cylindrów (zmienna cylindry). Wykorzystaj informacje zawarte w bazie samochody.csv.

Zadanie 2.16. Pani Janina bardzo się nudzi, od czasu gdy jej pociechy założyły własne rodziny. Całe dnie spędza siedząc na ławce, obserwując życie swojej małej wioski. Jedną z najbardziej fascynujących pozycji jej dziennego harmonogramu robót i robótek jest przybycie listonosza, pana Sławomira. Gdy przejeżdża obok płota, zdejmuje czapkę na widok staruszki, nie zsiadając z roweru. Janina dowiedziała się od naczelnika poczty, że powinien on pojawiać się u niej ok. godziny 10:25. Niestety, różnego rodzaju okoliczności zewnętrzne wpływają na fluktuację czasu przyjazdu. Postanowiła więc zbadać „szkiełkiem i okiem” frapujący ją problem nie do końca punk- tualnego listonosza i zdać szczegółową sprawę jego pracodawcy. Zanotowała czasy przy- jazdów (w minutach po godz. 10-tej) w kolejnych 33 dniach roboczych. Potem jednak okazało się, że 3 wartości są nieczytelne z powodu pisania nienaostrzonym ołówkiem.

26, 22, 26, 20, 25, ??, 21, 20, 28, 27, 26, 38, 23, 30, 21, 25, 26, 23, 25, 27, 27, ??, 25, 22, 23, 31, 19, ??, 25, 25, 23, 25, 24.

Po wsi swego czasu krążyły plotki o wyższości R-a nad innymi programami w swojej klasie. Poprosiła więc Ciebie, wielce pilnego studenta, o pomoc. Przeprowadź wstępną analizę tego zbioru używając wszystkich znanych Ci sposobów.

Zadanie 2.17. Z danych z poprzedniego zadania usuń obserwacje odstające i braki da- nych. Następnie przyporządkuj każdej obserwacji jedną z pięciu kategorii:

SM-II, s. 3.

SM-III: Rozkłady prawdopodobieństwa i podstawy symulacji

Zadanie 3.1. Utwórz wykresy gęstości, dystrybuanty i funkcji przeżycia dla zmiennych losowych z rozkładów normalnych o parametrach N(0 , 1), N(1 , 1), N(2 , 1).

Zadanie 3.2. Sprawdź tzw. regułę 3-sigmową dla rozkładu normalnego. Utwórz graficzną ilustrację tej reguły.

Zadanie 3.3. Wzrost pewnej grupy osób opisany jest rozkładem normalnym o wartości oczekiwanej 173 cm i odchyleniu standardowym 6 cm.

a) Jakie jest prawdopodobieństwo, że losowo wybrana osoba ma nie więcej niż 179 cm wzrostu?

b) Jaka jest frakcja osób mających wzrost pomiędzy 167 i 180 cm?

c) Jakie jest prawdopodobieństwo, że losowo wybrana osoba ma więcej niż 181 cm wzrostu?

d) Wyznacz wartość wzrostu, której nie przekracza 60% badanej populacji osób.

Zadanie 3.4. Utwórz tablicę wartości dystrybuanty rozkładu standardowego normalnego.

Zadanie 3.5. Wygeneruj n -elementową ( n = 100) próbę losową z rozkładu normalnego standardowego. Utwórz histogram oraz estymator jądrowy dla tej próby. Nałóż na uzy- skany obraz wykres gęstości teoretycznej rozkładu normalnego.

Zadanie 3.6. Sporządź wykres funkcji masy prawdopodobieństwa rozkładów dwumiano- wych: Bin(10 , 0 , 5) , Bin(10 , 0 , 25) , Bin(50 , 0 , 25).

Zadanie 3.7. Korzystając z generatora liczb losowych o rozkładzie jednostajnym na przedziale [0 , 1], wygeneruj próbkę losową z rozkładu Pareto z parametrem a = 2.

Zadanie 3.8. Posługując się metodą Monte Carlo, oblicz pole powierzchni obszaru A = { ( x, y ) R^2 : 0 < x < 1; 0 < y < x^2 }. Porównaj uzyskane w ten sposób wyniki z dokładnymi rezultatami otrzymanymi na drodze analitycznej.

Zadanie 3.9. Utwórz wykresy gęstości, dystrybuanty i funkcji przeżycia dla zmiennych losowych z rozkładów normalnych o parametrach N(0 , 1), N(0 , 0 , 5), N(0 , 2).

Zadanie 3.10. Utwórz tablicę podstawowych kwantyli (tzn. rzędu 0 , 9 , 0 , 95 , 0 , 975 , 0 , 99 , 0 , 995 ) rozkładu standardowego normalnego.

Zadanie 3.11. Utwórz wykresy gęstości zmiennych losowych o rozkładzie chi-kwadrat o 5, 10 oraz 40 stopniach swobody. Przeanalizuj, jak zmienia się gęstość rozkładu χ^2 wraz ze wzrostem liczby stopni swobody.

Zadanie 3.12. Utwórz tablicę podstawowych kwantyli rozkładu chi-kwadrat o różnych stopniach swobody (tzn. kwantyli rzędu 0 , 005 , 0 , 01 , 0 , 025 , 0 , 05 , 0 , 1 , 0 , 9 , 0 , 95 , 0 , 975 , 0 , 99 , 0 , 995 ).

SM-III, s. 1.

Zadanie 3.13. Przeprowadź eksperyment symulacyjny pokazujący, że rozkład chi- kwadrat, wraz ze wzrostem liczby stopni swobody, zbiega do rozkładu normalnego.

Zadanie 3.14. Utwórz tablicę podstawowych kwantyli (tzn. rzędu 0 , 9 , 0 , 95 , 0 , 975 , 0 , 99 , 0 , 995 ) rozkładu t -Studenta o różnych stopniach swobody.

Zadanie 3.15. Utwórz wykresy gęstości zmiennych losowych o rozkładzie t -Studenta z 1, 5 i 30 stopniami swobody. Porównaj otrzymane wykresy z wykresem gęstości zmiennej losowej o rozkładzie normalnym.

Zadanie 3.16. W wielu tablicach statystycznych sugeruje się, że rozkład t -Studenta już od 30 stopni swobody można dobrze przybliżać rozkładem normalnym standardowym. Niech Φ oznacza dystrybuantę rozkładu N(0 , 1), a Fd — dystrybuantę rozkładu t[ d ]. Dla różnych liczb stopni swobody d zbadaj wartości funkcji błędu:

e ( d ) = sup x∈ R

|Fd ( x ) Φ( x ) |,

którą można aproksymować za pomocą wyrażenia

e ( d ) max x = −λ,−λ + δ,...,λ |Fd ( x ) Φ( x ) |,

gdzie np. λ = 5 oraz δ = 0 , 001.

Zadanie 3.17. Utwórz wykresy gęstości zmiennych losowych o rozkładzie gamma z pa- rametrami:

a) Γ(1 , 1) , Γ(0 , 5 , 1) , Γ(2 , 1) , Γ(3 , 1),

b) Γ(2 , 1) , Γ(2 , 2) , Γ(2 , 3).

Sformułuj wnioski dotyczące wpływu obu parametrów rozkładu na kształt wykresu gę- stości.

Zadanie 3.18. Utwórz wykresy gęstości zmiennych losowych o rozkładzie beta: B (1 , 1) , B (2 , 2) , B (5 , 2) i B (2 , 5). Sformułuj wnioski dotyczące wpływu obu parametrów rozkładu na kształt wykresu gęstości.

Zadanie 3.19. Utwórz wykresy gęstości zmiennych losowych o rozkładzie F-Snedecora: F[10 , 5] , F[10 , 10] , F[10 , 20].

Zadanie 3.20. Średnio jedna na dziesięć osób mijających pewien sklep wchodzi do tego sklepu. Niech X oznacza numer pierwszej osoby, która weszła do sklepu, podczas gdy X − 1 osób, które wcześniej mijały ów sklep, nie weszło do środka. Oblicz prawdopodobieństwa P ( X = 1) , P ( X = 2) , P ( X = 3) , P ( X = 4) oraz P ( X > 11).

Zadanie 3.21. W partii towaru liczącej 200 sztuk znajduje się 5 sztuk niespełniających wymagań jakościowych. Jakie jest prawdopodobieństwo, że w losowej próbie 10 sztuk pobranych z tej partii nie znajdzie się ani jedna sztuka wadliwa?

Zadanie 3.22. Czas poprawnej pracy aparatu telefonicznego ma rozkład wykładniczy o intensywności awarii 0 , 0001 [1/h].

a) Oblicz prawdopodobieństwo, że aparat ten nie uszkodzi się w ciągu: 1000, 10000, 30000 godzin pracy.

SM-III, s. 2.

Zadanie 3.36. Niech X oznacza zmienną losową o rozkładzie normalnym standardowym. Empiryczna weryfikacja reguły 3-sigmowej

Oblicz wartości następujących prawdopodobieństw:

a) P ( 1 < X < 1),

b) P ( 2 < X < 2),

c) P ( 3 < X < 3).

Wygeneruj n = 10000 elementową próbę ( X 1 ,... , Xn ) z rozkładu normalnego stan- dardowego. Porównaj częstości wystąpienia zdarzeń: A : Xi ∈ ( 1 , 1), B : Xi ∈ ( 2 , 2), C : Xi ∈ ( 3 , 3) z wartościami odpowiednich prawdopodobieństw wyznaczonych powyżej.

Zadanie 3.37. Wygeneruj m = 100 próbek n = 200 elementowych ( U 1 ,... , Un ) z roz- Empiryczna weryfikacja kładu jednostajnego na przedziale [0 , 1]. Utwórz histogramy dla zmiennych ( Z 1 ,... , Zm ), CTG gdzie

Zk =

k i =1 √ Ui^ ^ k/^2 k/ 12

dla k = 1 ,... , m. Nałóż na histogram wykres gęstości rozkładu normalnego standar- dowego. Sformułuj wnioski odnośnie zmiany kształtu histogramu zmiennej Zk wraz ze wzrostem k.

Zadanie 3.38. Niech X oznacza zmienną losową o rozkładzie dwumianowym Bin( n, p ). Empiryczne badanie jakości aproksymacji

Wyznacz tablice prawdopodobieństw P ( X ¬ k ) dla kilku wybranych wartości k. Porów- naj te prawdopodobieństwa z wartościami prawdopodobieństw otrzymanymi za pomocą aproksymacji

a) rozkładem Poissona,

b) rozkładem normalnym (tw. Moivre’a-Laplace’a),

c) rozkładem normalnym z korektą ciągłości.

Porównaj również wykres dystrybuanty zmiennej losowej X z wykresami dystrybuant rozkładów użytych do aproksymacji X. Sformułuj wnioski dotyczące jakości aproksy- macji, biorąc pod uwagę różne wartości parametrów n oraz p np. n = 20 , 30 , 50 oraz p = 0 , 1 , 0 , 2 , 0 , 3 , 0 , 5.

SM-III, s. 4.

SM-IV: Estymacja punktowa i przedziałowa

Zadanie 4.1. Wygeneruj dwie próby losowe z rozkładu standardowego normalnego: 20 i 100 elementową. Narysuj dla obu prób dystrybuanty empiryczne i porównaj je z odpo- wiednią dystrybuantą teoretyczną.

Zadanie 4.2. Wygeneruj n = 500-elementową próbę ( Y 1 ,... , Yn ) z rozkładu standardo- wego Cauchy’ego (z parametrem położenia a = 0 i parametrem rozproszenia b = 1).

a) Dla każdej podpróbki zawierającej i początkowych elementów próbki wyjściowej, tzn. dla X i = ( Y 1 ,... , Yi ), gdzie i = 1 ,... , n , oblicz średnią X ¯ i oraz medianę Med i Następnie przedstaw na wspólnym wykresie zbiory

{ X ¯ i : i = 1 ,... , n

} oraz { Med i : i = 1 ,... , n}. Przeanalizuj wpływ liczności próby na zachowanie się średniej oraz mediany z próby. Czy statystyki te wydają się być sensownymi estymatorami parametru położenia a w tym modelu?

b) Dla każdej podpróbki zawierającej i = 2 ,... , n początkowych elementów próbki wyj- ściowej oblicz odchylenie standardowe si oraz odchylenie ćwiartkowe ri = IQR( X i ) / 2 (czyli rozstęp międzykwartylowy podzielony przez 2). Następnie przedstaw na wspól- nym wykresie zbiory {si : i = 2 ,... , n} oraz {ri : i = 2 ,... , n}. Przeanalizuj wpływ liczności próby na zachowanie się si oraz ri. Czy statystyki te wydają się być sen- sownymi estymatorami parametru rozproszenia b w tym modelu?

Zadanie 4.3. Wygeneruj m = 10000 n -elementowych próbek ( n = 20) z rozkładu jed- nostajnego na odcinku jednostkowym. Porównaj empirycznie obciążenie i błąd średnio- kwadratowy estymatora momentów i estymatora największej wiarogodności parametru θ w rozkładzie jednostajnym U ([0 , θ ]).

Zadanie 4.4. Wygeneruj m = 50 n -elementowych próbek ( n = 10) z rozkładu normal- nego N (1 , 2). Przedstaw na jednym wykresie przedziały ufności dla wartości oczekiwanej μ na poziomie ufności 0 , 95. Ile z nich powinno zawierać wartość μ = 1?

Zadanie 4.5. Wygeneruj m = 10000 próbek n -elementowych ( n = 10) z rozkładu normal- nego. Następnie zakładając, iż o próbkach wiemy tylko tyle, że pochodzą one z rozkładu normalnego o nieznanych parametrach, wyznacz dla każdej próbki przedział ufności dla wartości oczekiwanej na poziomie ufności 0 , 95. Porównaj frakcję pokryć przez przedział ufności faktycznej wartości oczekiwanej z założonym poziomem ufności.

Zadanie 4.6. Średnia cena 50 losowo wybranych podręczników akademickich wyniosła 28 , 40 zł. Wiadomo, że odchylenie standardowe cen podręczników wynosi 4 , 75 zł. Wyznacz 95% przedział ufności dla średniej ceny podręcznika akademickiego zakładając, że rozkład cen jest rozkładem normalnym.

Zadanie 4.7. Przeprowadzono 18 niezależnych pomiarów temperatury topnienia ołowiu i otrzymano następujące wyniki (w stopniach Celsjusza):

330_._ 0 , 322_._ 0 , 345_._ 0 , 328_._ 6 , 331_._ 0 , 342_._ 0 , 342_._ 4 , 340_._ 4 , 329_._ 7 , 334_._ 0 , 326_._ 5 , 325_._ 8 , 337_._ 5 , 327_._ 3 , 322_._ 6 , 341_._ 0 , 340_._ 0 , 333_._ 0_._

Zakładamy, że temperatura topnienia ołowiu ma rozkład normalny. Wyznacz dwustronny przedział ufności dla wartości oczekiwanej i odchylenia standardowego temperatury top- nienia ołowiu na poziomie ufności 0 , 95.

SM-IV, s. 1.

obserwowane w sposób ciągły, lecz kontrola dokonywana jest w dyskretnych chwilach 1 , 2 ,... , k. Stąd też, de facto, obserwujemy jedynie Y 1 ,... , Yn , gdzie

Yj =

{ i gdy i − 1 < Xj ¬ i, dla pewnego i = 1 ,... , k, k + 1 gdy Xj > k,

przy czym j = 1 ,... , n. Niech Ni = # {j : Yj = i} , i = 1 ,... , k + 1_._ Wyznacz estymator największej wiarogodności parametru θ. Dokonaj obliczeń dla przypadku, gdy n = 10, k = 2 oraz N 1 = 5, N 2 = 2 i N 3 = 3.

SM-IV, s. 3.

SM-V: Weryfikacja hipotez, cz. I

Zadanie 5.1. Wytrzymałość na ciśnienie wewnętrzne jest ważną charakterystyką jako- ściową szkła butelek. Pewna rozlewnia chce stosować butelki, których średnia wytrzyma- łość przewyższa 1 , 20 N/mm^2. Na podstawie dotychczasowych doświadczeń wiadomo, że rozkład ciśnienia jest normalny z odchyleniem standardowym 0 , 07 N/mm^2. Pobrano próbę losową 20 butelek, które następnie umieszczono w maszynie hydrostatycznej, zwiększając ciśnienie aż do zniszczenia butelki. Otrzymano następujące wyniki (w N/mm^2 ):

1.36, 1.14, 1.27, 1.15, 1.20, 1.29, 1.27, 1.18, 1.23, 1.36, 1.38, 1.37, 1.30, 1.21, 1.33, 1.28, 1.32, 1.29, 1.33, 1.25.

Na poziomie istotności 0 , 04 stwierdzić, czy dana partia butelek spełnia postawione wy- magania jakościowe.

Zadanie 5.2. Nominalna waga netto kawy sprzedawanej w opakowaniu szklanym winna wynosić 150 g. Występuje jednakże duża zmienność wagi. Istotnie, próba losowa sied- miu słoiczków kawy konkretnej marki sprzedawanej w sieci handlowej Żuczek wykazała następujące wagi netto (w gramach): 142, 151, 148, 151, 145, 150, 141. Zakładając nor- malność rozkładu wagi, przetestuj hipotezę głoszącą, że waga netto tej marki kawy wynosi faktycznie 150 g. Przyjmij poziom istotności α = 0 , 05.

Zadanie 5.3. Wylosowana niezależnie z partii żarówek 12-elementowa próba dała na- stępujące wyniki pomiarów czasu świecenia (w godzinach): 2852, 3060, 2631, 2819, 2805, 2835, 2955, 2595, 2690, 2723, 2815, 2914.

a) Wyznacz 97% przedział ufności dla maksymalnego średniego czasu świecenia żaró- wek.

b) Czy średni czas świecenia żarówek jest istotnie krótszy od 2900 godzin? Przyjmij poziom istotności α = 0 , 05.

Zadanie 5.4. W stopie metalicznym pewnego typu zastosowano dwa różne pierwiastki utwardzające. Wyniki pomiarów twardości stopów utwardzanych obiema metodami wy- glądają następująco:

Metoda I 145 , 150 , 153 , 148 , 141 , 152 , 146 , 154 , 139 , 148 Metoda II 152 , 150 , 147 , 155 , 140 , 146 , 158 , 152 , 151 , 143 , 153

Przyjmuje się, że twardość ma rozkład normalny oraz że odchylenia standardowe dla obu metod są równe. Czy na podstawie przeprowadzonych pomiarów można stwierdzić, że średnia twardość stopu utwardzanego drugą metodą przewyższa średnią twardość stopu utwardzanego pierwszą metodą? Przyjmij poziom istotności α = 0 , 05.

Zadanie 5.5. Spośród pracowników pewnego przedsiębiorstwa wylosowano niezależnie 15 pracowników fizycznych i 9 pracowników umysłowych. Otrzymano następujące dane dotyczące stażu pracy (w latach):

Umysłowi 14 , 17 , 7 , 33 , 2 , 24 , 26 , 22 , 12 Fizyczni 13 , 15 , 3 , 2 , 25 , 4 , 1 , 18 , 6 , 9 , 20 , 11 , 5 , 1 , 7

SM-V, s. 1.

Kraj Długość życia Argentyna 70 , 5 Etiopia 51 , 5 Niemcy 76 Indie 57 , 5 Iran 64 , 5 Włochy 78 , 5

Kraj Długość życia Japonia 79 Kenia 61 Meksyk 72 Maroko 64 , 5 RPA 64 Hiszpania 78 , 5

Kraj Długość życia Sudan 53 Tajwan 75 Tajlandia 68 , 5 Turcja 70 Ukraina 70 , 5 USA 75 , 5

Czy na podstawie tych danych możemy twierdzić, że średnia długość życia przekracza 62 lata? Przyjmij poziom istotności 0 , 05.

Zadanie 5.13. Na podstawie danych dotyczących parametrów kilku wybranych marek samochodów (plik samochody.csv) stwierdź, czy występuje statystycznie istotna różnica w przyspieszeniu samochodów produkowanych w USA i w Japonii. Przyjmij poziom istot- ności α = 0 , 05.

Zadanie 5.14. Badano wytrzymałość 20 losowo wybranych wsporników betonowych, przy czym 10 z nich wykonano metodą tradycyjną, a pozostałe niedawno opatentowaną, nową metodą. Wyniki pomiarów (w MPa) podano w poniższej tabeli:

Metoda tradycyjna 53 , 51 , 62 , 55 , 59 , 56 , 61 , 54 , 47 , 57 Nowa metoda 62 , 55 , 61 , 58 , 54 , 49 , 56 , 60 , 52 , 63

Czy na podstawie tych danych można stwierdzić, że wytrzymałość wsporników wykona- nych nową metodą przewyższa istotnie wytrzymałość wsporników wykonanych metodą tradycyjną? Przyjmij poziom istotności 0 , 04.

Zadanie 5.15. Badano liczbę recept wypisywanych w ciągu 14 losowo wybranych dni przez pewnych dwóch lekarzy. Otrzymano następujące wyniki:

Lekarz I 19 , 21 , 15 , 17 , 24 , 12 , 19 , 14 , 20 , 18 , 23 , 21 , 17 , 12 Lekarz II 17 , 15 , 12 , 12 , 16 , 15 , 11 , 13 , 14 , 21 , 19 , 15 , 11 , 10

Zakładając, że badana cecha ma rozkład normalny, zweryfikuj przypuszczenie, że le- karz I wypisuje średnio więcej recept niż lekarz II. Przyjmij poziom istotności 0 , 05.

Zadanie 5.16. Badano przeciętną długość filmów produkowanych przez dwie konkurujące ze sobą firmy. W tym celu wylosowano do badania kilka filmów i otrzymano następujące dane (w minutach):

Długości filmów produkcji A 102 , 86 , 98 , 109 , 92 , 102 , 95 , 120 Długości filmów produkcji B 81 , 165 , 97 , 134 , 92 , 87 , 114 , 120 , 95 , 136 , 170

Czy można twierdzić, że przeciętna długość filmów produkcji A przewyższa przeciętną długość filmów produkcji B? Zweryfikuj stosowną hipotezę na poziomie istotności 0 , 01.

Zadanie 5.17. Badano wpływ nowego leku na zmianę poziomu pewnej substancji we krwi (w mg/ml). W tym celu zmierzono poziom tej substancji u 8 losowo wybranych osób, a następnie, po upływie 30 minut od podania owego leku, powtórzono badanie na tej samej grupie osób. Otrzymano następujące wyniki:

Pacjent 1 2 3 4 5 6 7 8 Poziom przed 2_._ 76 , 5_._ 18 , 2_._ 68 , 3_._ 05 , 4_._ 10 , 7_._ 05 , 6_._ 60 , 4_._ 79 Poziom po 7_._ 02 , 3_._ 10 , 5_._ 44 , 3_._ 99 , 5_._ 21 , 10_._ 26 , 13_._ 91 , 14_._ 53

SM-V, s. 3.

Czy na podstawie powyższych danych można stwierdzić, że nowy lek powoduje istotne podwyższenie poziomu owej substancji we krwi? Przyjmij poziom istotności α = 0 , 05 oraz założenie o normalności rozkładu badanej cechy.

Zadanie 5.18. Badano wagę (w kilogramach) losowo wybranych palaczek przed i 5 ty- godni po rzuceniu przez nich palenia papierosów. Otrzymano następujące wyniki:

Palaczka 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Waga przed 67 , 65 , 62 , 62 , 66 , 65 , 61 , 63 , 64 , 71 , 69 , 65 , 61 , 60 , Waga po 69 , 71 , 65 , 67 , 74 , 62 , 69 , 64 , 70 , 68 , 73 , 71 , 67 , 62 ,

Czy na podstawie powyższych danych można stwierdzić, że rzucenie palenia wpływa na wzrost wagi palącej papierosy kobiety? Przyjmij poziom istotności α = 0 , 05.

Zadanie 5.19. Wśród pracowników naukowych pewnej uczelni przeprowadzono ankietę dotyczącą stażu pracy i stanu cywilnego. Otrzymano następujące wyniki liczby osób wedle stanu i stażu (w latach):

Staż pracy Panna/kawaler Mężatka/żonaty 0–5 6 20 5–10 8 20 10–15 3 60 15–20 2 25 20–25 1 15

Zweryfikuj hipotezę, że w grupie mężatek i żonatych, odsetek osób pracujących na owej uczelni dłużej niż 15 lat wynosi 0 , 3. Przyjmij poziom istotności α = 0 , 05.

Zadanie 5.20. Na podstawie danych zawartych w pliku samochody.csv:

a) Podaj przedział ufności dla odsetka samochodów mających moc większą niż 80 KM (wykorzystaj zmienną moc). Przyjmij poziom ufności 0 , 95.

b) Zweryfikuj hipotezę, że ponad 50% samochodów ma moc większą niż 80 KM. Przyj- mij poziom istotności 0 , 06.

c) Rozpatrz te problemy ponownie, tym razem ograniczając się do samochodów pro- dukowanych tylko w Ameryce i Japonii (wykorzystaj nadto zmienne producent i legenda).

SM-V, s. 4.

Zadanie 6.9. W elu zbadania, zy nowy ro dza j paliwa lotni zego ma istotny wpªyw na

zasig lotu p ewnego samolotu sp ortowego, wykonano 10 p omiarów zasigu dla samolotów

nap dzany h stosowanym dot¡d paliwem oraz 10 p omiarów dla samolotów zasilany h

nowym paliwem. Otrzymano nastpuj¡ e wyniki (w km):

Stosowane dot¡d paliwo 1039 , 1168 , 1008 , 1035 , 1035 , 1025 , 1059 , 1012 , 1212 , 1039

Nowy ro dza j paliwa 1096 , 1161 , 1210 , 1088 , 1154 , 1111 , 1103 , 1094 , 1059 , 1177

Czy na p o dstawie ty h dany h mo»na stwierdzi¢, »e nowy ro dza j paliwa lotni zego ma

istotny wpªyw na wzrost prze itnego zasigu samolotu? Przyjmij p oziom istotno± i 0 , 05.

Zadanie 6.10. W elu p orównania trze h meto d nauki stenograi, przeprowadzono spraw-

dzian na losowy h próba h osób szkolony h p osz zególnymi meto dami. Otrzymano nast-

puj¡ e wyniki:

Meto da A 147 , 188 , 162 , 144 , 157 , 179 , 165 , 180

Meto da B 153 , 161 , 157 , 155 , 163 , 160 , 154

Meto da C 173 , 152 , 194 , 186 , 166 , 194 , 178 , 192 , 186

Zbada j, zy te trzy meto dy s¡ tak samo efektywne. Przyjmij p oziom istotno± i α = 0 , 05.

Zadanie 6.11. W elu zbadania, zy istnieje zwi¡zek p omidzy do ho dem i p osiadanym

wyksztaª eniem, przeprowadzono badanie na 450 osob owej próbie losowej i otrzymano

nastpuj¡ e wyniki:

Ro zny do hó d (tys. zª.)

< 120 120 250 > 250

Wyksztaª enie wy»sze 80 115 55

Brak uko« zony h studiów 95 70 35

Zwerykuj o dp owiedni¡ hip otez na p oziomie istotno± i α = 0 , 01.

Zadanie 6.12. Na p o dstawie dany h doty z¡ y h parametrów kilku wybrany h marek

samo ho dów (plik samo hody. sv) stwierd¹, zy istniej¡ istotne ró»ni e w mo y silników

samo ho dów pro dukowany h w USA, w Europie i w Jap onii (wykorzysta j zmienne mo

i pro du ent). Przyjmij p oziom istotno± i α = 0 , 05.

Zadanie 6.13. Sp o±ró d studentów ztere h wydziaªów, na który h pan Iksi«ski wykªada

na j iekawszy przedmiot ±wiata^1 , p obrano próbki losowe i zli zono studentów (zwany h

dalej sz z±liw ami), którym udaªo si zda¢ egzamin z tego przedmiotu. Wyniki za-

miesz zono w p oni»szej tab eli:

Wydziaª Li zno±¢ próbki Li zba sz z±liw ów

Nauk niep otrzebny h 206 61

Mniemanologii stosowanej 164 34

Nauk iekawy h 98 38

Nauk przydatny h 102 35

Czy w ±wietle zebrany h dany h mo»na stwierdzi¢, »e wystpuj¡ istotne ró»ni e midzy

o dsetkami osób na p osz zególny h wydziaªa h, które zdaªy statystyk? Przyjmij p oziom

istotno± i α = 0 , 05.

1 Osob om niezorientowanym w sprawa h tego ±wiata wyja±niamy, »e mowa tu o zywi± ie o statysty e

matematy znej.

SM-VI, s. 2.

Zadanie 6.14. Dla 200 prób ek b etonu przeprowadzono badanie wytrzymaªo± i na ± i-

skanie i otrzymano wyniki (w MPa):

Wytrzymaªo±¢ Li zba prób ek

Zwerykuj hip otez gªosz¡ ¡, »e wytrzymaªo±¢ na ± iskanie ma rozkªad normalny. Przyjmij

p oziom istotno± i α = 0 , 05.

Zadanie 6.15. Na p o dstawie dany h zawarty h w pliku samo hody. sv, zwerykuj przy-

pusz zenie, »e rozkªad przyspieszenia samo ho dów o wadze 25003000 funtów jest nor-

malny (wykorzysta j zmienne przysp i waga). Czy mo»na twierdzi¢, »e prze itne przy-

spieszenie ty h samo ho dów przekra za 15? Przyjmij p oziom istotno± i 0 , 01.

Zadanie 6.16. Psy holog pra uj¡ y w p oradni ro dzinnej zebraª dane doty z¡ e p owo dów

kryzysów maª»e«ski h, które wymieniane byªy przez przy ho dz¡ e do p oradni pary. Dane

te, zamiesz zone w p oni»szej tab eli, p okazuj¡ ¹ró dªa kryzysu p ostrzegane przez ka»de

z maª»onków.

›ona \ M¡» Pieni¡dze Dzie i Zainteresowania Inne

Pieni¡dze 86 31 132 19

Dzie i 17 64 43 13

Zainteresowania 54 39 132 33

Inne 30 17 37 54

Czy na p o dstawie zebrany h dany h mo»na stwierdzi¢, »e istnieje zale»no±¢ p ogl¡dów

m»ów i »on o do przy zyn kryzysu w i h maª»e«stwa h? Przyjmij p oziom istotno± i

Zadanie 6.17. Badano istnienie zwi¡zku midzy i±nieniem krwi a nadwag¡. W p oni»szej

tab eli zebano dane na temat losowo wybranej grupy osób:

Ci±n. ++ Ci±n. OK

Nadwaga 57 18

Brak nadwagi 24 91

Czy na p o dstawie ty h dany h mo»na stwierdzi¢ istnienie takiej zale»no± i? Przyjmij

p oziom istotno± i 0 , 05.

Zadanie 6.18. Badano, zy istnieje zale»no±¢ midzy zawo dami o j ów i i h dorosªy h

synów. W tym elu zbadano losowo wybran¡ grup  o j ów i synów. Otrzymano nastpuj¡ e

wyniki:

Oj ie \ Syn Polityk Prawnik Lekarz

Polityk 33 48 17

Prawnik 21 38 12

Lekarz 7 8 68

Na p o dstawie p owy»szy h dany h stwierdzi¢, zy istnieje taka zale»no±¢. Przyjmij p oziom

istotno± i testu 0 , 01.

SM-VI, s. 3.