Studiuj dzięki licznym zasobom udostępnionym na Docsity
Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium
Przygotuj się do egzaminów
Studiuj dzięki licznym zasobom udostępnionym na Docsity
Otrzymaj punkty, aby pobrać
Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium
Społeczność
Odkryj najlepsze uniwersytety w twoim kraju, według użytkowników Docsity
Bezpłatne poradniki
Pobierz bezpłatnie nasze przewodniki na temat technik studiowania, metod panowania nad stresem, wskazówki do przygotowania do prac magisterskich opracowane przez wykładowców Docsity
W notatkach wyeksponowane są tematy z zakresu statystyki: badanie,populacja,jednostka statystyczne. Część 1.
Typologia: Notatki
1 / 10
Statystyka – nauka o metodach ilościowych, badania zjawisk masowych. Zajmuje się badaniem procesów, jakie zachodzą w zbiorowościach statystycznych.
Zjawisko masowe – występują w przyrodzie, społeczeństwie, badane dla większej liczby przypadków, wykazują pewną prawidłowość.
Badanie statystyczne – ogół prac mających na celu: o Poznanie struktury badanej zbiorowości ze względu na określone cechy o Ocenę współzależności zjawisk o Poznanie dynamiki zmian zjawiska w czasie i przyczyn wywołujących zmienność tego zjawiska.
Populacja statystyczna (zbiorowość statystyczna) – zbiór osób, przedmiotów, zjawisk podobnych do siebie, ale nie identycznych, poddanych badaniom statystycznym. Każdy element populacji statystycznej to jednostka statystyczna.
Jednostka statystyczna – element zbiorowości statystycznej, posiada ona cechy wspólne lub przynajmniej jedną cechę wspólną z innymi jednostkami oraz różnice w stosunku do innych jednostek.
Przy określaniu populacji statystycznej określamy :
Badanie statystyczne ma dwojaki charakter :
Cechy statystyczne - własności jednostek statystycznych podlegające badaniom. Jednocześnie cecha statystyczna jest kryterium podziału całej zbiorowości statystycznej, czyli wszystkich jednostek na mniejsze części. Podział cech statystycznych: mierzalne – ilościowe – wartości otrzymujemy w wyniku pomiaru lub policzenia, i które w naturalny sposób wyrażają się liczbami i występują w określony w określonych jednostkach. Dzielą się na:
niemierzalne – jakościowe – warianty opisujemy słowami np. zawód, wykształcenie. Dzielimy je na:
Etapy badania statystycznego:
Charakterystyki liczbowe struktury zbiorowości Parametry statystyczne – są to liczby, które w systematyczny sposób opisują strukturę zbiorowości ze względu na badaną cechę mierzalną. Parametry statystyczne dzielą się na następujące grupy: 1 Miary położenia 2 Miary zmienności 3 Miary asymetrii 4 Miary koncentracji
Miary położenia mogą być: I. Klasyczne ♪ Średnia arytmetyczna ♪ Średnia harmoniczna ♪ Średnia geometryczna ♪ Inne średnie II. Pozycyjne ♪ Dominanta (moda, wartość modalna) ♪ Kwantyle:
Miary klasyczne: Średnia arytmetyczna określana jest wzorami:
n
i
x n
x 1
1
♪ Średnia arytmetyczna jest dobrą miarą przeciętną tylko dla zbiorowości jednorodnych nie daje się natomiast obrazu przeciętnego poziomu cechy, gdy badana zbiorowość nie jest jednorodna np. gdy liczymy średnią płacę łącząc pracowników z różnych grup uposażenia ♪ Średnia arytmetyczna jest większa od najmniejszej, zaś mniejsza od największej
wartości w grupie (^) max
_ X (^) min X X
♪ Suma odchyleń wartości cech od średniej arytmetycznej jest =0.
n
i
Xi X 1
_ ( ) 0
k
i
Xi X 1
_ ( ) 0
Omówienie miar pozycyjnych Dominanta – nie istnieje w każdym szeregu, posiada ją najliczniejsza grupa
Wyznaczanie dominanty w sposób przybliżony: GRAFICZNIE:
Przybliżony
0 0 1 0 1
0 1 0 * ( ) ( )
h n n n n
n n D X m m
m
gdzie: x 0 – początek przedziału dominanty n 0 – liczebność przedziału dominanty n (^) m-1 – liczebność przedziału stojącego nad przedziałem dominanty n (^) m+1 – liczebność przedziału stojącego za przedziałem dominanty h 0 – rozpiętość przedziału dominanty
Średnia arytmetyczna, dominanta i mediana traktowane są jako miary przeciętnego poziomu zjawiska.
{ x (^) n 1 gdy „n” jest nieparzyste
xn xn gdy „n” jest parzyste
Kwartyle Wyznaczanie: Dla szeregów bez przedziałów klasowych Aby wyznaczyć Q 1 w szeregach bez przedziałów klasowych, bierzemy pod uwagę wszystkie wartości cechy stojące przez Me. A jeśli M (^) e jest elementem szeregu, to razem z tą M (^) e i Q 1 wyznaczamy tak jakby to była mediana dla tej części szeregu. Aby wyznaczyć Q 3 w szeregu bez przedziałów klasowych, bierzemy pod uwagę wszystkie wartości cechy stojące za Me. A jeśli M (^) e jest elementem szeregu, to razem z tą M (^) e i Q 3 wyznaczamy tak jakby to była mediana dla tej części szeregu.
Wyznaczanie mediany i kwartyli w szeregu z przedziałami klasowymi: Wyznaczamy medianę, liczebność skumulowaną
Obliczamy numer mediany 2
n N (^) Me i sprawdzamy, w którym przedziale się mieści
Miary zmienności Dzielą się na:
Szereg punktowy: 90 1 , 8 50
1
k
i
X n Xi ni
Średnio mieszkańcy tego bloku kupowali 1,8 czasopisma. Dominanta: D = 2
M (^) e X 25 X 26
3
1
d
Liczba czasopism kupowanych przez mieszkańców bloku różniła się od średniej przeciętnej o 0,92 czasopisma.
s =1,
Liczba czasopism kupowanych przez mieszkańców bloku odchyla się od średniej o 1, czasopisma.
d
s
Stopień zróżnicowania mieszkańców bloku ze względu na liczbę kupowanych czasopism jest dość wysoki. Q 0 , 5
Przeciętna liczba kupowanych czasopism różniła się od mediany o 0,5.
Przykład: Badano oszczędności mieszkańców pewnego osiedla i otrzymane wyniki przedstawiono w tabeli:
Lp. Oszczędności tys. zł.
Liczba osób n i
X (^) i X (^) i ni nis X (^) i X X (^) i Xni
2 X (^) i X X (^) i X ni
2
Szereg z przedziałami klasowymi: 220 4 , 4 50
1
k
i
X n Xi ni
Najliczniejsza grupa osób mająca oszczędności ok. 4,4 tys. zł.
Dominanta:
d
Oszczędności mieszkańców osiedla różniły się przeciętnie średnio o 2,04 tyś. zł.
s =2,408 tyś. zł.
Oszczędności mieszkańców osiedla odchylają się od średniej przeciętnie o 2408 zł.
3
1
M (^) e
Oszczędności mieszkańców osiedla różniły się od mediany o 1798 tyś. zł.
d
s
Stopień zróżnicowania mieszkańców osiedla ze względu na oszczędności jest dość wysoki.
Przykład: Badano zarobki pracowników w trzech zakładach ABC i otrzymano dane: A B C X 0,9 tyś^ zł^ 0,9 tyś^ zł^ 0,9 tyś^ zł M (^) e 0,9 tyś zł 0,88 tyś zł 0,92 tyś zł D 0,9 tyś^ zł^ 0,75 tyś^ zł^ 1,05 tyś^ zł X D M e X Me D X Me D X Me D - jest to szereg statystyczny, gdzie zachodzi równość tych miar jest to szereg
symetryczny. Szereg symetryczny przedstawia grupę jednostek statystycznych mających takie same wartości cechy jak średnia.
X Me D - asymetria prawostronna dodatnia przy tej asymetrii najliczniejsza grupa
jednostek mająca wartości cechy poniżej średniej.
X Me D - asymetria lewostronna ujemna najliczniejsza grupa jednostek statystycznych
mająca wartości cechy większe niż średnia.
Wskaźniki skośności Kierunek asymetrii mierzy wskaźnik skośności: W (^) s X D
A. Szereg symetryczny - Ws 0 B. Asymetria prawostronna - Ws 0 C. Asymetria lewostronna - Ws 0
Badanie zbiorowości ze względu na dwie cechy Przy badaniu zbiorowości ze względu na dwie cechy dane dotyczące tych cech porządkujemy w następujący sposób: gdy liczba obserwacji jest mała budujemy szereg szczegółowy. Np.: przebadano 6 firm zajmujących się usługami porządkowymi, porównując ich miesięczne wydatki na reklamę. X – wydatki na reklamę ( w tyś zł) Y – dochody (w tyś zł)
Lp. Wydatki na reklamę Dochody 1 1,5 10 2 2 20 3 2,5 20 4 2,5 15 5 4,5 25 6 5 30
Przykład: W grupie 50 studentów badano oceny z matematyki X i statystyki Y (2,2) – 10 osób, (2,3) – 5 osób, (3,2) – 12 osób, (3,3) – 8 osób (4,3) - , (4,4) – 5 osób, (4,5) – 6 osób, (5,5) – 4 osoby
Budujemy tabelę korelacyjną Oceny z matematyki
Oceny ze statystyki 2 3 4 5 ni 2 10 5 15 3 12 8 20 4 5 6 11 5 4 4 n j 22 13 5 10 X (^) i , ni - rozkład brzegowy cechy X, Y (^) j , n j - rozkład brzegowy cechy Y
Ogólna postać tabeli korelacyjnej
X Y
r
i
nik 1 ni
y 1 y (^) 2 ...^ yr
x 1 n 11 n 12 n 1 r n 1 x 2 n 21 n 22 n 2 r n 2
x s ns (^) 1 ns (^) 2 ns
s
i
ik
k
n
n
1
n (^) 1 n (^) 2 n r n
n ik - liczba jednostek o wartościach ( X (^) i , Yk ) badanych cech.