Docsity
Docsity

Przygotuj się do egzaminów
Przygotuj się do egzaminów

Studiuj dzięki licznym zasobom udostępnionym na Docsity


Otrzymaj punkty, aby pobrać
Otrzymaj punkty, aby pobrać

Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium


Informacje i wskazówki
Informacje i wskazówki

Statystyka: analiza współzależności zjawisk, Prezentacje z Statistica Per L'impresa

Opracowanie z zakresu tematu

Typologia: Prezentacje

2019/2020

Załadowany 21.10.2020

stevie_k
stevie_k 🇵🇱

4.5

(110)

325 dokumenty

1 / 31

Toggle sidebar

Ta strona nie jest widoczna w podglądzie

Nie przegap ważnych części!

bg1
Statystyka
Wykład 8
Magdalena Alama-Bu´
cko
10 kwietnia 2017
Magdalena Alama-Bu´
cko Statystyka 10 kwietnia 2017 1 / 31
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f

Podgląd częściowego tekstu

Pobierz Statystyka: analiza współzależności zjawisk i więcej Prezentacje w PDF z Statistica Per L'impresa tylko na Docsity!

Statystyka

Wykład 8

Magdalena Alama-Bu´cko

10 kwietnia 2017

Tematyka zaj ˛e´c:

Wprowadzenie do statystyki. Analiza struktury zbiorowo´sci miary poło˙zenia miary zmienno´sci miary asymetrii miary koncentracji. Analiza współzale˙zno´sci zjawisk. Analiza dynamiki zjawisk.

Poznali´smy ostatnio nast ˛epuj ˛ace współczynniki okre´slaj ˛ace sił ˛e i kierunek zale˙zno´sci:

współczynnik korelacji liniowej Pearsona dwie cechy ilo´sciowe (mierzalne)

współczynnik korelacji rang Spearmana dwie cechy ilo´sciowe (mierzalne) jedna cecha ilo´sciowa i jedna cecha jako´sciowa (porz ˛adkowa)

skorygowanego współczynnika kontyngencji współczynnika Czuprowa współczynnika zbie˙zno´sci V-Cramera dwie cechy jako´sciowe jedna cecha ilo´sciowa i jedna cecha jako´sciowa

Współczynnik determinacji

Dla współczynnika korelacji liniowej Pearsona okre´slamy współczynnik determinacji liniowej

r 2 = r (^) xy^2

podaje, jak ˛a cz˛e´s´c zmienno´sci cechy zale˙znej jest wyja´sniona zmienno´sci ˛a cechy niezale˙znej.

jaka posta´c funkcji regresji?

W przypadku, gdy po wykonaniu wykresu rozrzutu obserwujemy, ze ”chmura” punktów (xi , yi ), i = 1 , 2 , ..., n układa si ˛e wzdłu˙z pewnej funkcji liniowej, kwadratowej, logarytmicznej, itd. mo˙zemy spróbowa´c wyznaczy´c jej posta´c.

czasami posta´c funkcji regresji mo˙ze wynika´c z pewnych wzgl ˛edów merytorycznych (tzn. wiemy, jak ˛a funkcj ˛a opisuje si ˛e jakie´s zjawisko)

zaobserwowane warto´sci yi odchylaj ˛a si ˛e od funkcji regresji yˆi o pewn ˛a warto´s´c ei , czyli

yi = ˆyi + ei.

Wyra˙zenia ei nazywamy resztami, a pojawiaj ˛a si ˛e w tej reprezentacji na skutek czynników losowych pod wpływem cech nie uwzgl ˛ednionych w badaniu.

funkcja regresji moze przybra´c posta´c liniow ˛a lub krzywoliniow ˛a

Przykłady

chmura punktów układa si ˛e wzdłu˙z prostej

chmura punktów układa si ˛e wzdłu˙z pewnego wielomianu

w jaki sposób dopasowa´c funkcj ˛e do danych?

dane: (xi , yi ), i = 1 , 2 , ..., n szukana funkcja y = f (x) "najlepiej" dopasowana do danych

Metoda najmniejszych kwadratów

parametry odpowiedniej funkcji regresji okre´sla si ˛e w taki sposób, by suma kwadratów odchyle ´n odległo´sci zaobserowanych wartosci yi od warto´sci teoretycznych yˆi była najmniejsza, tzn. ∑

i

(yi − yˆi )^2 → min

Regresja liniowa

W przypadku, gdy po wykonaniu wykresu rozrzutu obserwujemy, ze ”chmura” punktów (xi , yi ) układa si ˛e wzdłu˙z prostej, mo˙zemy spróbowa´c wyznaczy´c jej równanie.

z metody najmniejszych kwadratów, parametry a i b powinny spełnia´c warunek ∑

i

(yi − ˆyi )^2 = ∑

i

(yi − a − bxi )^2 → min

Uwaga

je˙zeli znamy współczynnik korelacji liniowej Pearsona oraz srednie i odchylenia stadardowe, to współczynniki regresji mo˙´ zna obliczy´c ze wzorów:

b = rxy ·

sy sx

a = y − b · x.

Interpretacja b (yˆ = a + bx, b −współczynnik kierunkowy)

Je˙zeli współczynnik b jest dodatni, to mówimy, ˙ze wzrost o jednostk˛e cechy X skutkuje wzrostem cechy Y o b jednostek. Je˙zeli współczynnik b jest ujemny, to mówimy, ˙ze wzrost o jednostk˛e cechy X skutkuje spadkiem cechy Y o b jednostek.

Zadania z Wykładu 6

Zadanie 1 Zaobserwowano nast ˛epuj ˛ace warto´sci wieku m ˛e˙zczyzn (X) i kobiet (Y) zawieraj ˛acych zwi ˛azek mał˙ze ´nski (w latach).

X 22 21 30 18 28 Y 26 22 29 22 25

rxy = 0. 8239 wysoka dodatnia korelacja mi ˛edzy wiekiem kobiet i m ˛e˙zczyzn

zmienna niezale˙zna: wiek m ˛e˙zczyzny, zmienna zale˙zna : wiek kobiety (ale odwrotnie te˙z mo˙ze by´c)

r = r (^) xy^2 = 0. 82392 = 0. 6788 zatem 68% zmian wieku m ˛e˙zczyzn bior ˛acych ´slub jest wyja´sniane przez zmian ˛e wieku kobiety zatem 68% zmian wieku kobiet bior ˛acych ´slub jest wyja´sniane przez zmian ˛e wieku m ˛e˙zczyzny

prosta korelacji wyznaczona na podstawie naszych danych ma posta´c : yˆ = 0 , 48 x + 13 , 28 ,

x- wiek m ˛e˙zczyzny ˆy- ´sredni wiek kobiety

wraz ze wzrostem wieku m ˛e˙zczyzny o 1 rok, ´srednio wiek kobiety wzrasta o 0, 48 ≡ 0 , 5 roku. wiek ˙zony 35- letniego m ˛e˙zczyzny: (´srednio ) 30 lat m ˛e˙zczyzna w wieku 25, 5 lat bierze ´slub z kobiet ˛a (´srednio) w swoim wieku

a = 13 , 3 b = 0. 48 prosta regresji: ˆy = bx + a = 0 , 48 x + 13 , 28

Drugi sposób wyznaczenia prostej regresji

przy zało˙zeniu, ˙ze znamy rxy , x, y, sx , sy z poprzedniego wykładu mamy:

rxy = 0. 8239 , x = 23 , 8 , y = 24 , 8 , sx = 4 , 5 , sy = 2 , 6.

b = rxy ·

sy sx

a = y − b · x = 24. 8 − 0. 48 · 23. 8 = 13. 376 ...

Drugi sposób wyznaczenia współczynników prostej regresji

przy zało˙zeniu ˙ze znamy rxy , x, y, sx , sy z poprzedniego wykładu mamy: rxy = 0 , 802 , x = 4 , 6 , y = 29 , 5 , sx = 2 , 65 , sy = 10 , 71.

b = rxy ·

sy sx

a = y − b · x = 29. 5 − 3 , 24 · 4 , 6 = 14 , 6 wzór: x− sta˙z pracy, y- wydajno´s´c y = 3 , 24 · x + 14 , 6

Ocena dopasowania regresji

Dane (xi , yi ), i = 1 , 2 , ..., n Dla ka˙zdego xi , i = 1 , 2 , ..., n mo˙zemy wyznaczy´c warto´s´c yˆi znajduj ˛ac ˛a si ˛e na prostej regresji liniowej, tzn.

ˆyi = bxi + a

wprowadzamy wyra˙zenia

ei = yi − yˆi ,

mówi ˛ace o odległo´sci od siebie punktów (xi , yi ) i (xi , ˆyi ).