2. Korrelation, Linear Regression und multiple Regression, Prüfungen von Mathematische Statistik

Dabei bezeichnet ε eine zufällige Störgröße. Diese Modell bezeichnet man als Lineare Regression. 19 / 130. Page 20 ...

Art: Prüfungen

2021/2022

Hochgeladen am 09.08.2022

mustafa_n.
mustafa_n. 🇩🇪

4.3

(28)

1 / 130

Toggle sidebar

Diese Seite wird in der Vorschau nicht angezeigt

Lass dir nichts Wichtiges entgehen!

bg1
2. Korrelation, Linear
Regression und
multiple Regression
2. Korrelation, lineare
Regression und
multiple Regression
2.1 Korrelation
2.2 Lineare Regression
2.3 Multiple lineare
Regression
2.4 Nichtlineare
Zusammenh¨
ange
2. Korrelation, lineare Regression und multiple
Regression
2.1 Korrelation
2.2 Lineare Regression
2.3 Multiple lineare Regression
2.4 Nichtlineare Zusammenh¨
ange
1/ 130
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Unvollständige Textvorschau

Nur auf Docsity: Lade 2. Korrelation, Linear Regression und multiple Regression und mehr Prüfungen als PDF für Mathematische Statistik herunter!

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

2. Korrelation, lineare Regression und multiple

Regression

2.1 Korrelation

2.2 Lineare Regression

2.3 Multiple lineare Regression

2.4 Nichtlineare Zusammenh¨ange

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

2.1 Korrelation

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

Daten

x 20 30 15 39 5 6 12 0 35 y 32 14 12 27 20 13 17 8 22 x 8 34 26 32 26 12 36 27 26 y 19 25 23 17 22 19 27 26 20 x 13 19 25 30 18 21 11 y 11 24 19 19 22 24 17

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

2.2 Der Korrelationskoeffizient von Pearson

I (^) Daten (x 1 , y 1 ),... , (xn, yn) I (^) Maß f¨ur die (lineare) Abh¨angigkeit zwischen x und y : Korrelationskoeffizient von Pearson

ˆρX ,Y =

sx,y sx,x sy ,y

∑n √ i=1(xi^ −^ x·)(yi^ −^ y^ ·) ∑n i=1(xi^ −^ x·) 2 ∑n i=1(yi^ −^ y^ ·) 2

I (^) Dabei ist: I (^) x· = (^1) n ∑n i=1 xi^ :^ Mittelwert der Daten^ xi I (^) y· = (^1) n ∑n i=1 yi^ :^ Mittelwert der Daten^ yi I (^) s x^2 ,x = (^1) n ∑n i=1(xi^ −^ x·)

(^2) : Varianz der Daten xi

I (^) s y^2 ,y = (^1) n^ ∑ni=1(yi − y·)^2 : Varianz der Daten yi I (^) s x^2 ,y = (^1) n^ ∑ni=1(xi − x·)(yi − y·) : Kovarianz zwischen den Daten xi , yi

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

2.4 Beispiel: Korrelationskoeffizient f¨ur die Daten

aus Beispiel 2.

I (^) Variablen x: Leistungsstreben y : Motivation I (^) Korrelationskoeffizient von Pearson

ρˆx,y = 0. 5592

I (^) Fragen: I (^) Wie genau ist diese Sch¨atzung? I (^) Ist die Korrelation von 0 verschieden (Unkorreliertheit zwischen den Merkmalen Leistungsstreben und Motivation)?

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

2.5 Signifikanztest f¨ur Korrelation

I (^) ρ bezeichne die Korrelation des Merkmals X mit dem Merkmal Y einer Population I (^) (x 1 , y 1 ),... , (xn, yn) ist eine Stichprobe (unabh¨angige Beobachtungen) aus einer (bivariat) normalverteilten Grundgesamtheit I (^) Ein Test zum Niveau α f¨ur die Hypothese “die Merkmale sind unkorreliert” H 0 : ρ = 0 lehnt die Nullhypothese zu Gunsten der Alternative H 1 : ρ 6 = 0 ab, falls ∣ ∣ ∣ ∣

n − 2ˆρx,y √ 1 − ρˆ^2 x,y

∣ >^ tn−^2 ,^1 −α/^2

gilt.

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

SPSS Output f¨ur Korrelationskoeffizient

Motivation Leistungsstreben Korrelation nach Pearson Signifikanz (2-seitig) N Korrelation nach Pearson Signifikanz (2-seitig) N

Motivation

Leistungsstreben

25 25

,

,559 ** 1,

25 25

,

1,000 ,559 **

Korrelationen

**. Die Korrelation ist auf dem Niveau von 0,01 (2-seitig) signifikant.

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

2.7 Konfidenzintervall f¨ur Korrelation

I (^) ρ: Korrelation zwischen Merkmal x und Merkmal y einer Population I (^) (x 1 , y 1 ),... , (xn, yn): Stichprobe (unabh¨angige Beobacht- ungen) aus einer (bivariat) normalverteilten Grundgesamt- heit I (^) Mathematische Statistik: ˆρx,y ist “n¨aherungsweise” (d.h. bei großem Stichprobenumfang) normalverteilt mit Erwartungswert ρ und Varianz

γ^2 = Var (ˆρx,y ) ≈ (1 − ρ^2 )^2 /n

I (^) (1 − α)-Konfidenzintervall f¨ur den Korrelationskoeffizienten ( ρˆx,y − γˆz 1 −α/ 2 , ρˆx,y + ˆγz 1 −α/ 2

Hier bezeichnet ˆγ = (1 − ρˆ^2 x,y )/

n einen Sch¨atzer f¨ur die Standardabweichung von ˆρx,y und z 1 −α/ 2 das (1 − α/2) Quantil der Standardnormalverteilung (Tabelle, Software)

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

2.8 Hinweise zur Interpretation von Korrelationen

I (^) Annahme: man hat eine signifikante Korrelation zwischen dem Variablen x und y gefunden I (^) Folgende Interpretationen sind m¨oglich (1) x beeinflusst y kausal (2) y beeinflusst x kausal (3) x und y werden von weiteren Variablen kausal beeinflusst (4) x und y beeinflussen sich wechselseitig kausal I (^) Die Korrelation zwischen zwei Variablen ist eine not- wendige aber keine hinreichende Voraussetzung f¨ur einen kausalen Zusammenhang I (^) Der Korrelationskoeffizient gibt keine Information welche der vier Interpretationen zutrifft (in “vielen” F¨allen wird das der Typ (3) sein) I (^) Korrelationen sollten ohne Zusatzinformation nicht interpretiert werden!

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

Beispiel

I (^) Annahme: man hat eine signifikante Korrelation zwischen den Merkmalen ”Ehrlichkeit” und ”H¨aufigkeit des Kirch- gangs” gefunden I (^) Folgende Interpretationen sind m¨oglich I (^) Die in der Kirche vermittelten Werte haben einen positiven Einfluß auf das Merkmal ”Ehrlichkeit” I (^) ”Ehrliche” Menschen f¨uhlen sich durch die in der Kirche vermittelten Inhalte eher angesprochen und gehen aus diesem Grund h¨aufiger zur Kirche I (^) Die allgemeine famili¨are und außerfamili¨are Sozialisation beeinflußt beide Merkmale

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

2.9 Beispiel: (Fortsetzung von Beispiel 2.1)

I (^) Untersuchung zur Motivation am Arbeitsplatz in einem Chemie-Konzern I (^) 25 Personen werden zuf¨allig ausgew¨ahlt und verschiedene Variablen gemessen. I (^) y : Motivation (Einsch¨atzung durch Experten) x: Leistungsstreben (Fragebogen)

I (^) Kann man y aus x “vorhersagen”?

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

Streudiagramm f¨ur die Daten aus Beispiel 2.

Leistungsstreben

0 10 20 30 40

Motivation

35

30

25

20

15

10

5

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

Regression

I (^) Ausgangslage: Von Interesse ist der Zusammenhang zwischen verschiedenen Variablen. Im einfachsten Fall betrachtet man, wie im Beispiel der Arbeitsmotivation, den Zusammenhang zwischen zwei Variablen. I (^) Daten: (x 1 , y 1 ), (x 2 , y 2 ),... , (xn, yn) I (^) Annahme: Es existiert ein kausaler Zusammenhang der Form y = f (x) zwischen der abh¨angigen Variablen y und der Pr¨a- diktorvariablen x. Weitere Annahme: Die Funktion f hat eine bestimmte Form. Beispiele: I (^) Lineare Regression (der Zusammenhang ist also durch eine Gerade beschreibbar): y = b 0 + b 1 x I (^) Quadratische Regression (der Zusammenhang ist also durch eine Parabel beschreibbar): y = b 0 + b 1 x + b 2 x^2 I (^) usw. I (^) Beachte: Der Zusammenhang ist in der Regel nicht exakt zu beobachten. Mathematisches Modell Y = b 0 + b 1 x + ε Dabei bezeichnet ε eine zuf¨allige St¨orgr¨oße. Diese Modell bezeichnet man als Lineare Regression. (^) 19 / 130

Regression und multiple Regression

  1. Korrelation, lineare Regression und multiple Regression 2.1 Korrelation 2.2 Lineare Regression 2.3 Multiple lineareRegression 2.4 NichtlineareZusammenh¨ange

2.10 Das Modell der linearen Regression

I (^) Daten (x 1 , y 1 ),... , (xn, yn)

I (^) yi ist Realisation einer Zufallsvariablen Yi (unter der Bedingung xi ). F¨ur den Zusammenhang zwischen den Variablen Yi und xi gilt:

Yi = b 0 + b 1 xi + εi i = 1,... , n

I (^) εi bezeichnet hier eine zuf¨allige “St¨orung” und es wird angenommen, dass die St¨orungen unabh¨angig und normalverteilt sind mit Erwartungswert 0 und Varianz σ^2 > 0

I (^) Deutung: es wird ein linearer Zusammenhang zwischen x und y postuliert, der noch zuf¨alligen St¨orungen unterliegt