























Studiuj dzięki licznym zasobom udostępnionym na Docsity
Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium
Przygotuj się do egzaminów
Studiuj dzięki licznym zasobom udostępnionym na Docsity
Otrzymaj punkty, aby pobrać
Zdobywaj punkty, pomagając innym studentom lub wykup je w ramach planu Premium
Społeczność
Odkryj najlepsze uniwersytety w twoim kraju, według użytkowników Docsity
Bezpłatne poradniki
Pobierz bezpłatnie nasze przewodniki na temat technik studiowania, metod panowania nad stresem, wskazówki do przygotowania do prac magisterskich opracowane przez wykładowców Docsity
Opracowanie z zakresu tematu
Typologia: Prezentacje
1 / 31
Ta strona nie jest widoczna w podglądzie
Nie przegap ważnych części!
Wykład 8
Magdalena Alama-Bu´cko
10 kwietnia 2017
Tematyka zaj ˛e´c:
Wprowadzenie do statystyki. Analiza struktury zbiorowo´sci miary poło˙zenia miary zmienno´sci miary asymetrii miary koncentracji. Analiza współzale˙zno´sci zjawisk. Analiza dynamiki zjawisk.
Poznali´smy ostatnio nast ˛epuj ˛ace współczynniki okre´slaj ˛ace sił ˛e i kierunek zale˙zno´sci:
współczynnik korelacji liniowej Pearsona dwie cechy ilo´sciowe (mierzalne)
współczynnik korelacji rang Spearmana dwie cechy ilo´sciowe (mierzalne) jedna cecha ilo´sciowa i jedna cecha jako´sciowa (porz ˛adkowa)
skorygowanego współczynnika kontyngencji współczynnika Czuprowa współczynnika zbie˙zno´sci V-Cramera dwie cechy jako´sciowe jedna cecha ilo´sciowa i jedna cecha jako´sciowa
Dla współczynnika korelacji liniowej Pearsona okre´slamy współczynnik determinacji liniowej
r 2 = r (^) xy^2
podaje, jak ˛a cz˛e´s´c zmienno´sci cechy zale˙znej jest wyja´sniona zmienno´sci ˛a cechy niezale˙znej.
jaka posta´c funkcji regresji?
W przypadku, gdy po wykonaniu wykresu rozrzutu obserwujemy, ze ”chmura” punktów (xi , yi ), i = 1 , 2 , ..., n układa si ˛e wzdłu˙z pewnej funkcji liniowej, kwadratowej, logarytmicznej, itd. mo˙zemy spróbowa´c wyznaczy´c jej posta´c.
czasami posta´c funkcji regresji mo˙ze wynika´c z pewnych wzgl ˛edów merytorycznych (tzn. wiemy, jak ˛a funkcj ˛a opisuje si ˛e jakie´s zjawisko)
zaobserwowane warto´sci yi odchylaj ˛a si ˛e od funkcji regresji yˆi o pewn ˛a warto´s´c ei , czyli
yi = ˆyi + ei.
Wyra˙zenia ei nazywamy resztami, a pojawiaj ˛a si ˛e w tej reprezentacji na skutek czynników losowych pod wpływem cech nie uwzgl ˛ednionych w badaniu.
funkcja regresji moze przybra´c posta´c liniow ˛a lub krzywoliniow ˛a
Przykłady
chmura punktów układa si ˛e wzdłu˙z prostej
chmura punktów układa si ˛e wzdłu˙z pewnego wielomianu
w jaki sposób dopasowa´c funkcj ˛e do danych?
dane: (xi , yi ), i = 1 , 2 , ..., n szukana funkcja y = f (x) "najlepiej" dopasowana do danych
Metoda najmniejszych kwadratów
parametry odpowiedniej funkcji regresji okre´sla si ˛e w taki sposób, by suma kwadratów odchyle ´n odległo´sci zaobserowanych wartosci yi od warto´sci teoretycznych yˆi była najmniejsza, tzn. ∑
i
(yi − yˆi )^2 → min
W przypadku, gdy po wykonaniu wykresu rozrzutu obserwujemy, ze ”chmura” punktów (xi , yi ) układa si ˛e wzdłu˙z prostej, mo˙zemy spróbowa´c wyznaczy´c jej równanie.
z metody najmniejszych kwadratów, parametry a i b powinny spełnia´c warunek ∑
i
(yi − ˆyi )^2 = ∑
i
(yi − a − bxi )^2 → min
Uwaga
je˙zeli znamy współczynnik korelacji liniowej Pearsona oraz srednie i odchylenia stadardowe, to współczynniki regresji mo˙´ zna obliczy´c ze wzorów:
b = rxy ·
sy sx
a = y − b · x.
Interpretacja b (yˆ = a + bx, b −współczynnik kierunkowy)
Je˙zeli współczynnik b jest dodatni, to mówimy, ˙ze wzrost o jednostk˛e cechy X skutkuje wzrostem cechy Y o b jednostek. Je˙zeli współczynnik b jest ujemny, to mówimy, ˙ze wzrost o jednostk˛e cechy X skutkuje spadkiem cechy Y o b jednostek.
Zadanie 1 Zaobserwowano nast ˛epuj ˛ace warto´sci wieku m ˛e˙zczyzn (X) i kobiet (Y) zawieraj ˛acych zwi ˛azek mał˙ze ´nski (w latach).
X 22 21 30 18 28 Y 26 22 29 22 25
rxy = 0. 8239 wysoka dodatnia korelacja mi ˛edzy wiekiem kobiet i m ˛e˙zczyzn
zmienna niezale˙zna: wiek m ˛e˙zczyzny, zmienna zale˙zna : wiek kobiety (ale odwrotnie te˙z mo˙ze by´c)
r = r (^) xy^2 = 0. 82392 = 0. 6788 zatem 68% zmian wieku m ˛e˙zczyzn bior ˛acych ´slub jest wyja´sniane przez zmian ˛e wieku kobiety zatem 68% zmian wieku kobiet bior ˛acych ´slub jest wyja´sniane przez zmian ˛e wieku m ˛e˙zczyzny
prosta korelacji wyznaczona na podstawie naszych danych ma posta´c : yˆ = 0 , 48 x + 13 , 28 ,
x- wiek m ˛e˙zczyzny ˆy- ´sredni wiek kobiety
wraz ze wzrostem wieku m ˛e˙zczyzny o 1 rok, ´srednio wiek kobiety wzrasta o 0, 48 ≡ 0 , 5 roku. wiek ˙zony 35- letniego m ˛e˙zczyzny: (´srednio ) 30 lat m ˛e˙zczyzna w wieku 25, 5 lat bierze ´slub z kobiet ˛a (´srednio) w swoim wieku
a = 13 , 3 b = 0. 48 prosta regresji: ˆy = bx + a = 0 , 48 x + 13 , 28
Drugi sposób wyznaczenia prostej regresji
przy zało˙zeniu, ˙ze znamy rxy , x, y, sx , sy z poprzedniego wykładu mamy:
rxy = 0. 8239 , x = 23 , 8 , y = 24 , 8 , sx = 4 , 5 , sy = 2 , 6.
b = rxy ·
sy sx
a = y − b · x = 24. 8 − 0. 48 · 23. 8 = 13. 376 ...
Drugi sposób wyznaczenia współczynników prostej regresji
przy zało˙zeniu ˙ze znamy rxy , x, y, sx , sy z poprzedniego wykładu mamy: rxy = 0 , 802 , x = 4 , 6 , y = 29 , 5 , sx = 2 , 65 , sy = 10 , 71.
b = rxy ·
sy sx
a = y − b · x = 29. 5 − 3 , 24 · 4 , 6 = 14 , 6 wzór: x− sta˙z pracy, y- wydajno´s´c y = 3 , 24 · x + 14 , 6
Ocena dopasowania regresji
Dane (xi , yi ), i = 1 , 2 , ..., n Dla ka˙zdego xi , i = 1 , 2 , ..., n mo˙zemy wyznaczy´c warto´s´c yˆi znajduj ˛ac ˛a si ˛e na prostej regresji liniowej, tzn.
ˆyi = bxi + a
wprowadzamy wyra˙zenia
ei = yi − yˆi ,
mówi ˛ace o odległo´sci od siebie punktów (xi , yi ) i (xi , ˆyi ).