Allgemeines lineares Modell, Grafiken und Mindmaps von Statistik

Alle Informationen zum allgemeinen linearen Modell (ALM) mit Beispielen

Art: Grafiken und Mindmaps

2022/2023

Zum Verkauf seit 22.07.2023

lynn.schmidt
lynn.schmidt 🇩🇪

13 dokumente

1 / 3

Toggle sidebar

Diese Seite wird in der Vorschau nicht angezeigt

Lass dir nichts Wichtiges entgehen!

bg1
Allgemeines lineares Modell (ALM)
Y = 0 + 1*X + … + k*Xk + e
oYx ist eine Zufallsvariable für jeden festen Wert für X
oe (Fehlerterm) ist eine normalverteilte Zufallsvariable mit dem
Erwartungswert Null und einer Varianz
ok = Anzahl der Prädiktoren
oY = AV/Kriterium
oX = UV/Prädiktor
o0 = Intercept
ok = Regressionsgewicht (Steigung/Einfluss)
k entspricht dem Regressionsgewicht, dies legt fest, wie groß der Einfluss einer
Variablen auf die Vorhersage von Y ist (damit kann man steuern, dass z.B. der IQ
stärker gewichtet wird und das Geschlecht weniger gewichtet wird, da IQ einen
größeren Einfluss auf die Abiturnote hat als das Geschlecht)
oBei metrischen Prädiktoren entsprechen die Regressionsgewichte den
Korrelationen bzw. Semipartialkorrelationen zwischen AV & UV
oSteigung = Korrelation
oBei kategorialen Prädiktoren entsprechen die Regressionsgewichte den
Mittelwerten der AV in den verschiedenen Gruppen (Gruppen definiert
durch Faktorstufen der UV, z.B. Therapiemaßnahme A und
Therapiemaßnahme B)
odas Produkt k*X verbessert somit die Vorhersage/macht sie genauer
o1 * X1 steht z.B. für den IQ; 2*X2 steht für das Geschlecht; 3*X3 steht für das
Alter usw.
oIQ, Geschlecht, Alter, … sind die Prädiktoren
oWir können alle möglichen Prädiktoren aufnehmen, die Vorhersage würde
sich dann immer mehr verbessern
oEs werden nie alle möglichen Prädiktoren in der Praxis gefunden
oIch möchte die AV Abiturnote vorhersagen für jede Person, wenn ich nur den
IQ als Prädiktor aufnehme, dann wird dieser zwar einen Teil der Abiturnote
erklären, aber die Vorhersage ist noch recht ungenau, also nehme ich noch
Geschlecht & Alter als Prädiktoren mit auf, somit verbessert sich meine
Vorhersage, die Abiturnote ist von ganz viele Prädiktoren abhängig, aber ihr
Einfluss ist sehr gering, daher können wir diese hier vernachlässigen, nun kann
man für jede beliebige Person X die Abiturnote Y vorhersagen, jede Person
wird ihren individuellen Wert erhalten
Zusammenhang zwischen beliebig vielen Variablen auf unterschiedlichen
Skalenniveaus
Bestimmung der AV & UV
Einfluss der UVs auf AVs erfassen
UVs können durch den Versuchsleiter manipuliert werden
Es existiert für jede Person ein konkreter Messwert Y
Ziele:
oVorhersage bezüglich einer AV (z.B. Je höher dein IQ, desto besser wird dein
Abitur) -> Regressionsanalyse
pf3

Unvollständige Textvorschau

Nur auf Docsity: Lade Allgemeines lineares Modell und mehr Grafiken und Mindmaps als PDF für Statistik herunter!

Allgemeines lineares Modell (ALM)

 Y =  0 +  1 X + … + kXk + e o Yx ist eine Zufallsvariable für jeden festen Wert für X o e (Fehlerterm) ist eine normalverteilte Zufallsvariable mit dem Erwartungswert Null und einer Varianz o k = Anzahl der Prädiktoren o Y = AV/Kriterium o X = UV/Prädiktor o  0 = Intercept o k = Regressionsgewicht (Steigung/Einfluss)   k entspricht dem Regressionsgewicht, dies legt fest, wie groß der Einfluss einer Variablen auf die Vorhersage von Y ist (damit kann man steuern, dass z.B. der IQ stärker gewichtet wird und das Geschlecht weniger gewichtet wird, da IQ einen größeren Einfluss auf die Abiturnote hat als das Geschlecht) o Bei metrischen Prädiktoren entsprechen die Regressionsgewichte den Korrelationen bzw. Semipartialkorrelationen zwischen AV & UV o Steigung = Korrelation o Bei kategorialen Prädiktoren entsprechen die Regressionsgewichte den Mittelwerten der AV in den verschiedenen Gruppen (Gruppen definiert durch Faktorstufen der UV, z.B. Therapiemaßnahme A und Therapiemaßnahme B) o das Produkt k*X verbessert somit die Vorhersage/macht sie genauer o  1 * X 1 steht z.B. für den IQ;  2 *X 2 steht für das Geschlecht;  3 *X 3 steht für das Alter usw. o IQ, Geschlecht, Alter, … sind die Prädiktoren o Wir können alle möglichen Prädiktoren aufnehmen, die Vorhersage würde sich dann immer mehr verbessern o Es werden nie alle möglichen Prädiktoren in der Praxis gefunden o Ich möchte die AV Abiturnote vorhersagen für jede Person, wenn ich nur den IQ als Prädiktor aufnehme, dann wird dieser zwar einen Teil der Abiturnote erklären, aber die Vorhersage ist noch recht ungenau, also nehme ich noch Geschlecht & Alter als Prädiktoren mit auf, somit verbessert sich meine Vorhersage, die Abiturnote ist von ganz viele Prädiktoren abhängig, aber ihr Einfluss ist sehr gering, daher können wir diese hier vernachlässigen, nun kann man für jede beliebige Person X die Abiturnote Y vorhersagen, jede Person wird ihren individuellen Wert erhalten  Zusammenhang zwischen beliebig vielen Variablen auf unterschiedlichen Skalenniveaus  Bestimmung der AV & UV  Einfluss der UVs auf AVs erfassen  UVs können durch den Versuchsleiter manipuliert werden  Es existiert für jede Person ein konkreter Messwert Y  Ziele: o Vorhersage bezüglich einer AV (z.B. Je höher dein IQ, desto besser wird dein Abitur) -> Regressionsanalyse

o Einfluss der Zugehörigkeit zu einer bestimmten Treatmentgruppe (z.B. Therapie A schlägt besser an als Thearpie B) -> VarianzanalyseRegressionsanalyse: Untersuchung von korrelativen Zusammenhängen o Steigung k = Korrelation o Beziehungen o Vorhersage  Varianzanalyse: Untersuchung von Mittelwertsunterschieden o Steigung k = Mittelwerte o Variation o Unterschiede; Vergleiche  Nominalskalierte UVs: Varianzanalyse o Oder durch Dummy-Kodierung Regressionsanalyse  Intervallskalierte Variablen: Regressionsanalyse o Oder Varianzanalyse für zufällige Effekte  Nachteile: o Man wird nie alle Prädiktoren/Einflussfaktoren berücksichtigen können o Messfehler sind unvermeidbar o Der Wert von Y kann aufgrund der Messfehler & der unbekannten Variablen nie exakt vorhergesagt werden o Deswegen enthält die Gleichung den Fehlerterm e, um eine nahezu exakte Vorhersage zu erhalten o Wir kennen jedoch e nicht, wir können ihn nur schätzen, daher werden wir Y nie exakt bestimmen können  Experiment Vergleich Kontrollgruppe & Experimentalgruppe o Der Wert einer Person auf der AV (die Abiturnote von Person x) kann durch die Gruppenzugehörigkeit vorhergesagt werden  Voraussetzungen: o Residuen sind unabhängig  Häufig bei Messwiederholungen abhängig  Bei VPN mit ähnlichen Merkmalen kommt es zu ähnlichen Beobachtungen, es entsteht eine Abhängigkeit o Residuen sind normalverteilt  Prüfen mit NQ-Plot sowie Shapiro-Wilk-Test o Homoskedastizität / Varianzhomogenität der Fehler, d.h. die Varianzen der Fehler müssen identisch sein  Bei Verletzung der Homoskedastizität hält der Test nicht mehr das Signifikanzniveau  Die Varianz der Schätzer der Parameter kann nicht mehr korrekt geschätzt werden  White-Korrektur berechnet eine Varianz-Kovarianzmatrix der Schätzer, die unverzerrt ist, somit erhalten wir adäquate Varianzen für die Schätzer der Parameter  Nach der Korrektur kann der F-Test normal durchgeführt werden  Vorgehen: o Schätzen der Modellparameter durch die Kleinste Quadrate Schätzung o Inferenzstatistik anwenden, Konfidenzintervalle für Schätzer & Hypothesentests