




























































































Besser lernen dank der zahlreichen Ressourcen auf Docsity
Heimse Punkte ein, indem du anderen Studierenden hilfst oder erwirb Punkte mit einem Premium-Abo
Prüfungen vorbereiten
Besser lernen dank der zahlreichen Ressourcen auf Docsity
Download-Punkte bekommen.
Heimse Punkte ein, indem du anderen Studierenden hilfst oder erwirb Punkte mit einem Premium-Abo
Dabei bezeichnet ε eine zufällige Störgröße. Diese Modell bezeichnet man als Lineare Regression. 19 / 130. Page 20 ...
Art: Prüfungen
1 / 130
Diese Seite wird in der Vorschau nicht angezeigt
Lass dir nichts Wichtiges entgehen!





























































































Regression und multiple Regression
2.1 Korrelation
2.2 Lineare Regression
2.3 Multiple lineare Regression
2.4 Nichtlineare Zusammenh¨ange
Regression und multiple Regression
Regression und multiple Regression
x 20 30 15 39 5 6 12 0 35 y 32 14 12 27 20 13 17 8 22 x 8 34 26 32 26 12 36 27 26 y 19 25 23 17 22 19 27 26 20 x 13 19 25 30 18 21 11 y 11 24 19 19 22 24 17
Regression und multiple Regression
I (^) Daten (x 1 , y 1 ),... , (xn, yn) I (^) Maß f¨ur die (lineare) Abh¨angigkeit zwischen x und y : Korrelationskoeffizient von Pearson
ˆρX ,Y =
sx,y sx,x sy ,y
∑n √ i=1(xi^ −^ x·)(yi^ −^ y^ ·) ∑n i=1(xi^ −^ x·) 2 ∑n i=1(yi^ −^ y^ ·) 2
I (^) Dabei ist: I (^) x· = (^1) n ∑n i=1 xi^ :^ Mittelwert der Daten^ xi I (^) y· = (^1) n ∑n i=1 yi^ :^ Mittelwert der Daten^ yi I (^) s x^2 ,x = (^1) n ∑n i=1(xi^ −^ x·)
(^2) : Varianz der Daten xi
I (^) s y^2 ,y = (^1) n^ ∑ni=1(yi − y·)^2 : Varianz der Daten yi I (^) s x^2 ,y = (^1) n^ ∑ni=1(xi − x·)(yi − y·) : Kovarianz zwischen den Daten xi , yi
Regression und multiple Regression
I (^) Variablen x: Leistungsstreben y : Motivation I (^) Korrelationskoeffizient von Pearson
ρˆx,y = 0. 5592
I (^) Fragen: I (^) Wie genau ist diese Sch¨atzung? I (^) Ist die Korrelation von 0 verschieden (Unkorreliertheit zwischen den Merkmalen Leistungsstreben und Motivation)?
Regression und multiple Regression
I (^) ρ bezeichne die Korrelation des Merkmals X mit dem Merkmal Y einer Population I (^) (x 1 , y 1 ),... , (xn, yn) ist eine Stichprobe (unabh¨angige Beobachtungen) aus einer (bivariat) normalverteilten Grundgesamtheit I (^) Ein Test zum Niveau α f¨ur die Hypothese “die Merkmale sind unkorreliert” H 0 : ρ = 0 lehnt die Nullhypothese zu Gunsten der Alternative H 1 : ρ 6 = 0 ab, falls ∣ ∣ ∣ ∣
n − 2ˆρx,y √ 1 − ρˆ^2 x,y
∣ >^ tn−^2 ,^1 −α/^2
gilt.
Regression und multiple Regression
Motivation Leistungsstreben Korrelation nach Pearson Signifikanz (2-seitig) N Korrelation nach Pearson Signifikanz (2-seitig) N
Motivation
Leistungsstreben
25 25
,
,559 ** 1,
25 25
,
1,000 ,559 **
Korrelationen
**. Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant.
Regression und multiple Regression
I (^) ρ: Korrelation zwischen Merkmal x und Merkmal y einer Population I (^) (x 1 , y 1 ),... , (xn, yn): Stichprobe (unabh¨angige Beobacht- ungen) aus einer (bivariat) normalverteilten Grundgesamt- heit I (^) Mathematische Statistik: ˆρx,y ist “n¨aherungsweise” (d.h. bei großem Stichprobenumfang) normalverteilt mit Erwartungswert ρ und Varianz
γ^2 = Var (ˆρx,y ) ≈ (1 − ρ^2 )^2 /n
I (^) (1 − α)-Konfidenzintervall f¨ur den Korrelationskoeffizienten ( ρˆx,y − γˆz 1 −α/ 2 , ρˆx,y + ˆγz 1 −α/ 2
Hier bezeichnet ˆγ = (1 − ρˆ^2 x,y )/
n einen Sch¨atzer f¨ur die Standardabweichung von ˆρx,y und z 1 −α/ 2 das (1 − α/2) Quantil der Standardnormalverteilung (Tabelle, Software)
Regression und multiple Regression
I (^) Annahme: man hat eine signifikante Korrelation zwischen dem Variablen x und y gefunden I (^) Folgende Interpretationen sind m¨oglich (1) x beeinflusst y kausal (2) y beeinflusst x kausal (3) x und y werden von weiteren Variablen kausal beeinflusst (4) x und y beeinflussen sich wechselseitig kausal I (^) Die Korrelation zwischen zwei Variablen ist eine not- wendige aber keine hinreichende Voraussetzung f¨ur einen kausalen Zusammenhang I (^) Der Korrelationskoeffizient gibt keine Information welche der vier Interpretationen zutrifft (in “vielen” F¨allen wird das der Typ (3) sein) I (^) Korrelationen sollten ohne Zusatzinformation nicht interpretiert werden!
Regression und multiple Regression
I (^) Annahme: man hat eine signifikante Korrelation zwischen den Merkmalen ”Ehrlichkeit” und ”H¨aufigkeit des Kirch- gangs” gefunden I (^) Folgende Interpretationen sind m¨oglich I (^) Die in der Kirche vermittelten Werte haben einen positiven Einfluß auf das Merkmal ”Ehrlichkeit” I (^) ”Ehrliche” Menschen f¨uhlen sich durch die in der Kirche vermittelten Inhalte eher angesprochen und gehen aus diesem Grund h¨aufiger zur Kirche I (^) Die allgemeine famili¨are und außerfamili¨are Sozialisation beeinflußt beide Merkmale
Regression und multiple Regression
I (^) Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern I (^) 25 Personen werden zuf¨allig ausgew¨ahlt und verschiedene Variablen gemessen. I (^) y : Motivation (Einsch¨atzung durch Experten) x: Leistungsstreben (Fragebogen)
I (^) Kann man y aus x “vorhersagen”?
Regression und multiple Regression
Leistungsstreben
0 10 20 30 40
Motivation
35
30
25
20
15
10
5
Regression und multiple Regression
I (^) Ausgangslage: Von Interesse ist der Zusammenhang zwischen verschiedenen Variablen. Im einfachsten Fall betrachtet man, wie im Beispiel der Arbeitsmotivation, den Zusammenhang zwischen zwei Variablen. I (^) Daten: (x 1 , y 1 ), (x 2 , y 2 ),... , (xn, yn) I (^) Annahme: Es existiert ein kausaler Zusammenhang der Form y = f (x) zwischen der abh¨angigen Variablen y und der Pr¨a- diktorvariablen x. Weitere Annahme: Die Funktion f hat eine bestimmte Form. Beispiele: I (^) Lineare Regression (der Zusammenhang ist also durch eine Gerade beschreibbar): y = b 0 + b 1 x I (^) Quadratische Regression (der Zusammenhang ist also durch eine Parabel beschreibbar): y = b 0 + b 1 x + b 2 x^2 I (^) usw. I (^) Beachte: Der Zusammenhang ist in der Regel nicht exakt zu beobachten. Mathematisches Modell Y = b 0 + b 1 x + ε Dabei bezeichnet ε eine zuf¨allige St¨orgr¨oße. Diese Modell bezeichnet man als Lineare Regression. (^) 19 / 130
Regression und multiple Regression
I (^) Daten (x 1 , y 1 ),... , (xn, yn)
I (^) yi ist Realisation einer Zufallsvariablen Yi (unter der Bedingung xi ). F¨ur den Zusammenhang zwischen den Variablen Yi und xi gilt:
Yi = b 0 + b 1 xi + εi i = 1,... , n
I (^) εi bezeichnet hier eine zuf¨allige “St¨orung” und es wird angenommen, dass die St¨orungen unabh¨angig und normalverteilt sind mit Erwartungswert 0 und Varianz σ^2 > 0
I (^) Deutung: es wird ein linearer Zusammenhang zwischen x und y postuliert, der noch zuf¨alligen St¨orungen unterliegt