Pobierz Analiza danych pomiarowych i więcej Ćwiczenia w PDF z Analiza danych tylko na Docsity! Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych 1 Instrukcja do laboratorium LaboratoriumV: Podstawy korelacji i regresji Spis treści Laboratorium V: Podstawy korelacji i regresji ......................................................................................1 Wiadomości ogólne ............................................................................................................................2 1. Wstęp teoretyczny. .................................................................................................................2 1.1 Korelacja. ..............................................................................................................................2 1.2 Funkcja regresji. ....................................................................................................................5 2. Korelacja i regresja w STATISTICE ............................................................................................6 2.1 Macierz korelacji wszystkich zmiennych. ...............................................................................6 2.2 Macierz korelacji dla wybranych zmiennych. .........................................................................8 2.3 Test istotności związku pomiędzy zmiennymi. .......................................................................9 2.4 Kolorowa mapa korelacji ..................................................................................................... 10 2.5 Wykresy rozrzutu dla korelacji liniowej. ............................................................................... 10 2.6 Dopasowanie krzywej regresji do zależności liniowych i nieliniowych. ................................. 11 Ćwiczenia.......................................................................................................................................... 13 Częśd I ....................................................................................................................................... 13 Częśd II ...................................................................................................................................... 14 Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych 2 Instrukcja do laboratorium Wiadomości ogólne 1. Wstęp teoretyczny. 1.1 Korelacja. Korelacja to narzędzie matematyczne służące do dokładnego określenia stopnia, w jakim dwie zmienne są ze sobą powiązane. W badaniach korelacji określa się siłę, kształt oraz kierunek takiego powiązania. Jeśli chodzi o postad, można mówid o dwóch rodzajach zależności (rys.1): Liniowej; Krzywoliniowej; Rys.1 Wykresy rozrzutu obrazujące zależności pomiędzy zmiennymi X i Y: liniową i przykładową krzywoliniową. Istnieją też dwa rodzaje związku pomiędzy zmiennymi: funkcyjny i statystyczny. Funkcyjny ma miejsce wtedy, gdy każdej wartości zmiennej niezależnej X odpowiada dokładnie jedna wartośd zmiennej zależnej Y. Związek statystyczny polega na tym, że określonym wartościom jednej zmiennej odpowiadają ściśle określone wartości drugiej zmiennej. Można zatem obliczyd wartośd zmiennej zależnej Y w zależności od wartości zmiennej niezależnej X. Na rys.1 związki pomiędzy zmiennymi mają charaktery statystyczny. Wykresy ilustrujące związki pomiędzy zmiennymi to wykresy rozrzutu. Na osi pionowej zaznacza się zmienną zależną, natomiast na poziomej – niezależną. Najczęściej punkty odpowiadające poszczególnym wartościom cech leżą mniej więcej wzdłuż linii korelacji. Korelacja dodatnia występuje wtedy, gdy wraz ze wzrostem wartości jednej cechy, wzrastają wartości drugiej. Korelacja ujemna – gdy wraz ze wzrostem wartości jednej cechy maleją wartości drugiej. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych 5 Instrukcja do laboratorium 1.2 Funkcja regresji. Funkcja regresji jest z kolei narzędziem do badania mechanizmu powiązania pomiędzy zmiennymi. Wybór postaci funkcji regresji dokonuje się po wstępnej analizie materiału statystycznego, na podstawie wykresu rozrzutu lub źródeł literaturowych opisujących zależności, jakich dla danych zmiennych można się spodziewad. Najprostszymi, a jednocześnie najczęściej spotykanymi zależnościami są te, które mają postad liniową. Krzywe regresji dla postaci liniowej to proste regresji, mające następującą postad: y = ax +b Gdzie: x oraz y to wartości cech odpowiednio dla zmiennej X oraz Y. Parametry równania dla prostej regresji szacuje się metodą najmniejszych kwadratów. Parametr a nosi nazwę parametru regresji, natomiast parametr b to wyraz wolny równania regresji. Parametr jest estymatorem współczynnika regresji liniowej. Określa o ile jednostek zmieni się (wzrośnie lub zmaleje) wartośd zmiennej zależnej, podczas gdy wartośd zmiennej niezależnej zmieni się (wzrośnie lub zmaleje) o jedną jednostkę. Współczynnik ten ma duże znaczenie przy interpretacji zależności. Na wykresach rozrzutu sporządzanych w STATISTICE obok prostej zaznaczane są przerywane linie określające 95% przedział ufności dla prostej. Daje to pełniejszą informację o linii regresji. Wyznaczone granice ufności są różne dla różnych wartości zmiennej X, ulegają rozszerzeniu wraz z oddalaniem się od wartości średniej dla tej zmiennej. Obszar pomiędzy tymi krzywymi to przedział ufności. Rys.3 Prosta regresji wraz z 95% przedziałem ufności, którego granice wyznaczają przerywane linie. W wyniku dopasowywania prostej regresji pakiet STATISTICA wylicza również współczynnik determinacji R2. Współczynnik ten jest jedną z podstawowych miar jakości dopasowania modelu. Współczynnik determinacji wyliczamy jako iloraz: Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych 6 Instrukcja do laboratorium Współczynnik ten określa jaka częśd zmienności całkowitej zmiennej losowej Y została wyjaśniona regresją liniową względem zmiennej X. Gdzie sumy kwadratów odchyleo spełniają równanie: Równośd ta wyraża podział całkowitej sumy kwadratów odchyleo dla zmiennej Y na dwa składniki: – sumę kwadratów odchyleo wyjaśnioną efektem regresji oraz – resztową sumę kwadratów odchyleo nie wyjaśnioną regresją. Czyli biorąc pod uwagę odchylenia od średniej wszystkich punktów zmiennej Y: 2. Korelacja i regresja w STATISTICE 2.1 Macierz korelacji wszystkich zmiennych. Z poziomu menu głównego można też wejśd do okna służącego do analizy regresji: Statystyka/Regresja wieloraka: Rys.4 Okno regresji wielorakiej. W oknie tym naciskając na przycisk Zmienne, dokonuje się wyboru zmiennych do analizy. Jako zmienną niezależną należy wskazad Czas, natomiast jako zmienne zależne, pozostałe zmienne. W tym samym oknie, ale w zakładce Więcej można zaznaczyd dodatkowo opcję Przeglądaj statystyki opisowe, macierze korelacji. Można tu wybrad także działanie dla sytuacji, w której brakuje danych – najczęściej zaznacza się usuwanie przypadkami. Po wciśnięciu przycisku OK pojawia się okno: Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych 7 Instrukcja do laboratorium Rys.5. Przegląd statystyk opisowych. W oknie tym w poszczególnych zakładkach znajdują się różne przyciski, najwięcej w zakładce Więcej. Aby uzyskad wykresy rozrzutu dla wszystkich poszczególnych zmiennych ze sobą należy kliknąd na przycisk Macierzowy wykres korelacji. Rys.6 Macierz korelacji dla wszystkich zmiennych. Analiza tych wykresów, pozwala stwierdzid pomiędzy którymi zmiennymi będzie występowała korelacja, jaka jest też jej postad. W dwiczeniu najbardziej interesuje nas wpływ Czasu na rozwój komórek w poszczególnych środowiskach (wykresy rozrzutu, w których czas jest na osi poziomej). Na podstawie analizy Macierzowego wykresu korelacji można stwierdzid w których środowiskach komórki mają sprzyjające warunki wzrostu, w których nie. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych 10 Instrukcja do laboratorium Aby przeprowadzid test, należy wcisnąd przycisk Podsumowanie dostępny w prawym górnym rogu okna, a następnie wskazad zmienne dla których zostaną jednocześnie wyliczone współczynniki korelacji liniowej Pearsona oraz zostanie przeprowadzony test. W jednej liście zmiennych należy wskazad wszystkie zmienne zależne, a w osobnej zmienną niezależną. W wyniku tego działania wyświetli się tabela zawierająca wartości współczynnika korelacji liniowej Pearsona wszystkich wybranych zmiennych zależnych ze zmienną niezależną. Rys.11 Wynik testu, współczynniki korelacji. Podświetlone na czerwono wartości wskazują, gdzie na zadanym poziomie istotności (jeśli został ustawiony dla podświetlenia) należy odrzucid hipotezę zerową mówiąca o braku korelacji między zmiennymi. Na podstawie znaku oraz wartości tego parametru można określid siłę związku. 2.4 Kolorowa mapa korelacji W zakładce Kolory można jeszcze wybrad, jakie parametry zostaną wyświetlone w macierzy korelacji – najlepiej wybrad Prostą macierz (wartości r). Dostępny w tej zakładce przycisk mapa kolorowa pozwala uzyskad macierz korelacji pokolorowaną w zależności od wielkości i znaku współczynnika r. Rys.12 Kolorowa mapa korelacji. 2.5 Wykresy rozrzutu dla korelacji liniowej. Przy pozostawieniu takiego samego wyboru zmiennych, zmieniając zakładkę w oknie Korelacji (rys.13) na zakładkę Więcej, można sporządzid osobne wykresy rozrzutu dla każdej zmiennej względem czasu. Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych 11 Instrukcja do laboratorium Rys.13 Okno korelacji, zakładka Więcej. Wystarczy kliknąd przycisk 2W Rozrzutu i w skoroszycie pojawią się wszystkie potrzebne wykresy. Nad każdym wykresem widoczne jest również równanie prostej regresji. 2.6 Dopasowanie krzywej regresji do zależności liniowych i nieliniowych. W przypadku widocznego związku nieliniowego do rozrzutu punktów można dopasowad odpowiednią krzywą wchodząc przez menu główne Wykresy/Wykresy 2W/Wykresy rozrzutu. Rys.14 Dostęp do ogólnych modeli regresji. W oknie które pojawi się na ekranie w wyniku tego działania należy wybrad zakładkę Więcej, a w niej odpowiednią krzywą do dopasowania: Inżynieria biomedyczna, I rok, semestr letni 2014/2015 Analiza danych pomiarowych 12 Instrukcja do laboratorium Rys.15 Wykresy rozrzutu 2W. Dopasowując w tym samym oknie prostą regresji dla zależności liniowej, można wyliczyd także parametry: R2, współczynnik korelacji liniowej oraz wyznaczyd równanie prostej regresji. Rys.16 Wykresy rozrzutu 2W. Dopasowanie funkcji liniowej z wyliczeniem statystyk i pasem ufności.