Docsity
Docsity

Przygotuj się do egzaminów
Przygotuj się do egzaminów

Studiuj dzięki licznym zasobom udostępnionym na Docsity


Otrzymaj punkty, aby pobrać
Otrzymaj punkty, aby pobrać

Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium


Informacje i wskazówki
Informacje i wskazówki

Ćwiczenia ze statystyki, Egzaminy z Logika

Help on MATLAB command syntax. support. - Open MathWorks Technical Support Web Page. demo. - Run demonstrations. ver - MATLAB, SIMULINK ...

Typologia: Egzaminy

2022/2023

Załadowany 24.02.2023

Aleksy
Aleksy 🇵🇱

4.8

(36)

437 dokumenty

1 / 87

Toggle sidebar

Ta strona nie jest widoczna w podglądzie

Nie przegap ważnych części!

bg1
Ćwiczenia ze statystyki
Jarosław Żygierewicz
10 listopada 2009
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57

Podgląd częściowego tekstu

Pobierz Ćwiczenia ze statystyki i więcej Egzaminy w PDF z Logika tylko na Docsity!

Ćwiczenia ze statystyki

Jarosław Żygierewicz

10 listopada 2009

Spis treści

  • 1 Programowanie w Matlabie
    • 1.1 Wstęp
    • 1.2 Gdzie jest help?
    • 1.3 Zmienne - wektory, macierze
    • 1.4 Funkcje i skrypty
    • 1.5 Przydatne funkcje
    • 1.6 Instrukcje sterujące
  • 2 Generatory liczb pseudolosowych
    • 2.1 Wstęp
    • 2.2 Generatory
      • 2.2.1 Generator
      • 2.2.2 Generator
      • 2.2.3 Generator
      • 2.2.4 Generator
      • 2.2.5 Generator
    • 2.3 Testy jakości
  • 3 Rozkłady prawdopodobieństwa
    • 3.1 Kilka użytecznych rozkładów prawdopodobieństwa
      • 3.1.1 Rozkład dwumianowy
      • 3.1.2 Rozkład Poissona
      • 3.1.3 Rozkład Gaussa — rozkład normalny
  • 4 Przedziały ufności
    • 4.1 Przedział ufności dla średniej
      • 4.1.1 Przykład
      • 4.1.2 Zadanie
      • 4.1.3 Przykład
      • 4.1.4 Zadanie
    • 4.2 Przedział ufności dla wariancji
      • 4.2.1 Zadanie
    • 4.3 Rozmiar próby
      • 4.3.1 Zadanie
    • 4.4 Przykład z bootstrapem
    • 4.5 Zadania
      • 4.5.1 Przyrost masy w nowej diecie
      • 4.5.2 Średnica drzew
      • 4.5.3 Zawartość aluminium w Tebańskich naczyniach.
      • 4.5.4 Przedział ufności dla różnicy dwóch średnich
      • 4.5.5 Przedział ufności dla proporcji
      • 4.5.6 Bezrobotni
      • 4.5.7 Żywotność baterii
      • 4.5.8 Pomiary
  • 5 Testowanie hipotez dotyczących jednej lub dwóch populacji
    • 5.1 Wstęp
      • 5.1.1 Hipoteza zerowa i alternatywna
      • 5.1.2 Różne podejścia do tego samego problemu
      • 5.1.3 Poziom p
    • 5.2 Formułowanie hipotez
      • 5.2.1 Przykład: Napromieniowywanie muszek owocowych
    • 5.3 Testowanie hipotez na temat średniej
    • 5.4 Testowanie hipotez na temat wariancji
      • 5.4.1 Przykład
    • 5.5 Błąd drugiego rodzaju. Moc testu.
      • 5.5.1 Przykład
    • 5.6 Porównanie dwóch populacji
      • 5.6.1 Przykład
      • 5.6.2 Do testowania równości wariancji w dwóch populacjach stosuje się test F :
      • 5.6.3 Karma dla świń
    • 5.7 Założenie normalności rozkładu
      • 5.7.1 Przykład
      • 5.7.2 Przykład
    • 5.8 Przykłady różne
      • 5.8.1 Linie lotnicze
      • 5.8.2 Agencja nieruchomości
      • 5.8.3 Czy zabiegi bio-inżynieryjne zwiększają częstość narodzin krów?
      • 5.8.4 Porównanie lekarstwa na raka i placebo
      • 5.8.5 Lek przeciwdepresyjny
    • 5.9 Zadania
      • 5.9.1 Zanieczyszczenie środowiska
      • 5.9.2 Wzrost mocy turbiny
      • 5.9.3 Sonda
      • 5.9.4 Wybory prezydenckie
      • 5.9.5 Czy stosunek do marihuany się zmienił?
      • 5.9.6 Zawały serca i cholesterol
      • 5.9.7 Czy gęstości planet się różnią?
  • 6 Porównywanie więcej niż dwóch grup
    • 6.1 Problem wielokrotności testów
    • 6.2 ANOVA
      • 6.2.1 Przykład
      • 6.2.2 Które średnie są różne?
      • 6.2.3 Przykład
    • 6.3 Dwu czynnikowa analiza wariancji
      • 6.3.1 Przykład
    • 6.4 Nieparametryczne odpowiedniki ANOVY
      • 6.4.1 Test Kruskala-Wallisa
      • 6.4.2 Test Friedmana
    • 6.5 Jeszcze inaczej: repróbkowanie
      • 6.5.1 Przykład: Napromieniowywanie muszek owocowych, ciąg dalszy
    • 6.6 Zadania
      • 6.6.1 Tymidyna a rak
      • 6.6.2 Czy metody resocjalizacyjne różnią się?
      • 6.6.3 Efekty łączenia firm: porównywanie danych parowanych
      • 6.6.4 Czy lekarstwo działa?
      • 6.6.5 Karma dla świń raz jeszcze
  • 7 Modele liniowe
    • 7.1 Efekty jednego czynnika w różnych grupach
      • 7.1.1 Przykład
      • 7.1.2 Przykład: Rozmiary żołędzi
    • 7.2 Efekty różnych czynników na pewną wielkość w jednej grupie
    • 7.2.1 Przykład: Smak cheddar’a
  • 8 Analiza czynników głównych
    • 8.0.1 Przykład
  • 9 Analiza czynnikowa — Factor Analysis

General purpose commands. MATLAB Version 6.5 (R13) 20-Jun-

General information helpbrowser - Bring up the help browser. doc - Complete on-line help, displayed in the help browser.

help - M-file help, displayed at the command line.

helpwin - M-file help, displayed in the help browser. lookfor - Search all M-files for keyword. syntax - Help on MATLAB command syntax. support - Open MathWorks Technical Support Web Page. demo - Run demonstrations.

ver - MATLAB, SIMULINK, and toolbox version information.

version - MATLAB version information. whatsnew - Access Release Notes.

Managing the workspace.

who - List current variables.

whos - List current variables, long form.

workspace - Display Workspace Browser, a GUI for managing the workspace. pack - Consolidate workspace memory.

clear - Clear variables and functions from memory.

load - Load workspace variables from disk

save - Save workspace variables to disk

quit - Quit MATLAB session.

Managing commands and functions. what - List MATLAB-specific files in directory.

type - List M-file.

edit - Edit M-file. open - Open files by extension. which - Locate functions and files. pcode - Create pre-parsed pseudo-code file (P-file). inmem - List functions in memory. mex - Compile MEX-function.

Managing the search path path - Get/set search path. addpath - Add directory to search path. rmpath - Remove directory from search path. pathtool - Modify search path. rehash - Refresh function and file system caches. import - Import Java packages into the current scope.

Controlling the command window. echo - Echo commands in M-files. more - Control paged output in command window. diary - Save text of MATLAB session. format - Set output format. beep - Produce beep sound.

Operating system commands

cd - Change current working directory.

copyfile - Copy a file or directory. movefile - Move a file or directory. delete - Delete file. pwd - Show (print) current working directory. dir - List directory. fileattrib - Get or set attributes of files and directories. isdir - True if argument is a directory. mkdir - Make directory. rmdir - Remove directory. getenv - Get environment variable. ! - Execute operating system command (see PUNCT). dos - Execute DOS command and return result.

whos

Spis podstawowych operacji na macierzach otrzymamy wpisując

help matlab/elmat

Najczęściej przeze mnie używane to:

zeros - produkuje macierz wypełnioną zerami.

ones - produkuje macierz wypełnioną jedynkami.

eye - macierz jednostkowa.

repmat - tworzy macierz złożoną z kopii podanej macierzy.

rand - macierz wypełniona liczbami z rozkładu płaskiego (0,1).

randn -macierz wypełniona liczbami z rozkładu normalnego o średniej 0 i wariancji 1.

linspace - Linearly spaced vector. logspace - Logarithmically spaced vector. meshgrid - X and Y arrays for 3-D plots.

Basic array information.

size - Size of array.

length - Length of vector.

ndims - Number of dimensions.

disp - Display matrix or text. isempty - True for empty array.

Matrix manipulation. cat - Concatenate arrays. reshape - Change size.

diag - Diagonal matrices and diagonals of matrix.

fliplr - Flip matrix in left/right direction. flipud - Flip matrix in up/down direction. flipdim - Flip matrix along specified dimension. rot90 - Rotate matrix 90 degrees.

: - operator zasięgu (służy do robienie wektorów z równo odległymi elemen- tami lub indeksowania fragmentów macierzy)

find - znajduje indeksy niezerowych elementów

end - indeks ostatniego elementu.

Special variables and constants. ans - Most recent answer. eps - Floating point relative accuracy. pi - 3.1415926535897.... i, j - Imaginary unit.

Macierze możemy wpisywać ”z palca”:

A=[1 2 3 4; 5 6 7 8; 8 9 1 2]; A

A =

disp(A) 1 2 3 4 5 6 7 8 8 9 1 2

Działają też zwykłe operatory +

B=[1 2;3 4]

B =

>> B+B

ans =

>> B-B

ans =

Operatory * / ^ działają na ”całych” macierzach

B/B

ans =

>> B*B

ans =

>> B./B

ans =

1 1 1 1

>> B.*B

ans =

Do elementu macierzy dostajemy się tak:

B(1,2)

ans =

Teraz zmieniamy jego wartość:

B(1,2)=4; B

B =

Zwróćmy uwagę, że przy modyfikowaniu elementów macierzy jej rozmiar do- stosowuje się automatycznie i może się zmienić!:

B(1,3)=4; B

>> C=[1 2 3 4;5 6 7 8; 9 10 11 12; 13 14 15 16]

C(2,:)=[]

Do analizy danych statystycznych MATLAB używa danych zorientowa- nych kolumnowo. Każda kolumna w zestawie danych reprezentuje zmienną a wiersz obserwację (pomiar) tej zmiennej. Element (i,j) jest więc i-tą obserwa- cją j-tej zmiennej. Jako przykład rozważmy dane z trzema zmiennymi: Rytm serca, waga, ilość godzin ćwiczeń na tydzień. Dla pięciu obserwacji macierz z danymi wygląda np. tak:

D = 72 134 3. 81 201 3. 69 156 7. 82 148 2. 75 170 1.

Pierwszy wiersz zawiera rytm serca, wagę, ilość godzin ćwiczeń na tydzień dla pacjenta 1, drugi wiersz to samo dla pacjenta 2 itd. Możemy do tak przy- gotowanych danych zastosować jedną z licznych funkcji do analizy danych np. policzmy średnią i odchylenie standardowe poszczególnych zmiennych

mu = mean(D) sigma = std(D)

1.4 Funkcje i skrypty

Kawałek kodu matlabowego zapisany w pliku tekstowym (z rozszerzeniem .m) to skrypt. Można go wykonać wpisując nazwę pliku (bez rozszerzenia). Skrypt ma dostęp do wszystkich zmiennych znajdujących się w workspace, zmienne wytworzone w skrypcie są widoczne w workspace. Większość poleceń Matlaba to funkcje, niektóre są wbudowane i działają bardzo szybko, ale znaczna część jest napisana w plikach tekstowych, które są interpretowane w czasie wykonywania (działają wolniej). Ma to jednak tą zaletę, że możemy do takiej funkcji zajrzeć i dużo się nauczyć, albo ją zmodyfikować! :-) W matlabie można też tworzyć własne funkcje — zbudowane z już ist- niejących. Plik zawierający funkcję musi nazywać się tak jak ta funkcja z roszerzeniem ”.m” Pierwsza linia definiuje składnię wywołania funkcji np:

function [mean,stdev] = stat(x) %STAT Interesting statistics. n = length(x); mean = sum(x) / n; stdev = sqrt(sum((x - mean).^2)/n);

Powyższy kod definiuje funkcję stat (powinna być zapisana w pliku stat.m). Funkcja ta przyjmuje jako argument wektor x i zwraca dwie wartości mean,stdev zmienne używane wewnątrz funkcji są lokalne tzn. nie są widoczne w work- space. Przykład wywołania tej funkcji:

x=1:10;

[m,s]=stat(x) m =

s =

W jednym pliku możemy mieć zdefiniowanych więcej funkcji, z tym, że są one widoczne tylko dla funkcji zawartych w tym samym pliku np. powyższą funkcję stat można zaimplementować tak:

function [mean,stdev] = stat(x) %STAT Interesting statistics. n = length(x); mean = avg(x,n); stdev = sqrt(sum((x-avg(x,n)).^2)/n);

function mean = avg(x,n) %MEAN subfunction mean = sum(x)/n; Powrót z funkcji następuje po osiągnięciu końca ciała funkcji. Wcześniej- szy powrót warunkowy można uzyskać dzięki poleceniu return

1.5 Przydatne funkcje

plot

title(’oto nasz wektor z liniowo rozmieszczonymi elementami od 1 do 128’) % mieszamy indeksy wektora x y=x(ceil(length(x)rand(size(x)))); % po kolei: % size(x) - zwraca nam rozmiar x % rand(size(x)) - robimy wektor o takim samym rozmiarze jak x złożony % z liczb losowych z przedziału (0,1) % length(x)rand(size(x))) - z przedziału (0,1) robimy przedział (0, długość(x) % na koniec zaokrąglamy do góry dzięki temu uzyskujemy liczby naturalne % [1,długość(x)] - czyli prawidłowe indeksy matlaba plot(y)

boxplot przydatny do zgrubnego obejrzenia rozkładu boxplot(X,NOTCH,SYM,VERT,WHIS)

produces a box and whisker plot for each column of X. The box has lines at the lower quartile (25 percentyl), median, and upper quartile (75 percentyl) values. The whiskers are lines extending from each end of the box to show the extent of the rest of the data. Outliers (wartości odstające) are data with values beyond the ends of the whiskers.

NOTCH = 1 produces a notched-box plot. Notches represent a robust estimate of the uncertainty about the medians for box to box comparison.

n1 = med + 1.57(q3-q1)/sqrt(length(x)); n2 = med - 1.57(q3-q1)/sqrt(length(x));

NOTCH = 0 (default) produces a rectangular box plot. SYM sets the symbol for the outlier values if any (default=’+’). VERT = 0 makes the boxes horizontal (default: VERT = 1, for vertical). WHIS defines the maximum length of the whiskers as a function of the IQR (inter quartile range odległość między 25 a 75 percentylem)(default = 1.5). The whisker extends to the most extreme data value within WHIS*IQR of the box. If WHIS = 0 then BOXPLOT displays all data values outside the box using the plotting symbol, SYM.

BOXPLOT(X,G,NOTCH,...) produces a box and whisker plot for the vector

X grouped by G. G is a grouping variable defined as a vector, string matrix, or cell array of strings. G can also be a cell array of several grouping variables (such as {G1 G2 G3}) to group the values in X by each unique combination of grouping variable values.

−10 1 2

0

2

4

6

Boxploty

Values

Column Number

−10^0 −8 −6 −4 −2 0 2 4 6 8

5

10

15

20

25

30

35 histogramy

mediana

3−ci kwartyl

1−szy kwartyl

Rysunek 1.1: Porównanie histogramu i boxplotów

x1=2(randn(100,1)+1); x2=3(randn(100,1)-1); z=[x1 x2]; subplot(211) boxplot(z,1) subplot(212) hist(z)