Docsity
Docsity

Prüfungen vorbereiten
Prüfungen vorbereiten

Besser lernen dank der zahlreichen Ressourcen auf Docsity


Download-Punkte bekommen.
Download-Punkte bekommen.

Heimse Punkte ein, indem du anderen Studierenden hilfst oder erwirb Punkte mit einem Premium-Abo


Leitfäden und Tipps
Leitfäden und Tipps

Formelsammlung Biostatistik, Formelsammlungen von Biostatistik

Themen: Grundlagen, Häufigkeitsverteilungen, Lageparameter, Streuungsmaße, Box-Plot Diagramm, Schätzung unbekannter Parameter, Messunsicherheiten, Graphen, Testtheorie, Korrelation, Regression in Klammern (=....) die Formeln, die in Excel eingegeben werden müssen

Art: Formelsammlungen

2023/2024

Zum Verkauf seit 17.03.2024

bbbbbbea_
bbbbbbea_ 🇦🇹

19 dokumente

1 / 2

Toggle sidebar

Diese Seite wird in der Vorschau nicht angezeigt

Lass dir nichts Wichtiges entgehen!

bg1
Grundgesamtheit: Gesamtheit aller Merkmalsträger
Stichprobe: tatsächlich untersuchte Merkmalträger
Merkmal/Variable: untersuchte Eigenschaft eines
Merklmalträgers
Merkmalausprägung: ermittelter Wert eines Merkmals
Messwert = wahrer Wert + systematische Abweichung
+ statistische Abweichung
Genauigkeit = Richtigkeit + Präzision
qualitative Skalen
binär: 0/1, mann/frau, ja/nein
nominal: Farben, Formen, Spezies
ordinal: Schmerz, Lebensqualität, Noten mit
Reihenfolge
quantitative Skalen
diskret: Anzahl Individuen binär-/nominalskala
kontinuierlich: Größe, Gewicht, Zeit, Temperatur
Statistische Kennzahlen repräsentieren Daten mit wenigen Kennwerten
Beschreibung der Lage ( zentrale Tendenz) der Verteilung
arithmetisches Mittel Durchschnitt (=MITTELWERT)
Modalwert D häufigster Wert (= MODALWERT)
Median Z liegt in der Mitte (50% darunter, 50% darüber) zuerst nach Größe
ordnen (= MEDIAN)
unteres Quartil Q1 0,25 Quantil (=QUARTILE.EXKL(zahlen;1))
oberes Quartil Q3 0,75 Quantil (=QUARTILE.EXKL(zahlen;3))
Beschreibung Variabilität um Lageparameter (Breite der Verteilung)
Spannweite V 100% aller Messwerte liegen innerhalb (=MAX-MIN)
Interquartilabstand I50 50% aller Messwerte liegen innerhalb (= Q3-Q1)
Varianz Beschreibung durchschnittlichen Schwankung (=VAR.S)
Standardabweichung s Beschreibung durchschnittlichen Schwankung (=STABW.S)
oder (=WURZEL( ))
Homogenitätsindex E Diversität einer nominal skalierten Verteilung
Variationskoeffizient Standardabweichung/Mittelwert
Textdateien importieren
neue Excel-Dokument
Daten
aus Text
Datei aussuchen
importieren
Daten transformieren
schließen und laden
diskrete Merkmale endlich viele Werte; bestimmte Werte, nichts dazwischen Zählvorgang
stetige Merkmale alle Werte innerhalb eines Intervalls Messvorgang
Häufigkeit absolut/relativ
absolute Häufigkeit wie oft kommt die Ausprägung (im Intervall) vor (=HÄUFIGKEIT(alle zahlen;obere Grenze des Intervalls))
relative Häufigkeit wie oft kommt die Ausprägung (im Intervall) relativ zur Stichprobe vor (=hi/Summe alle hi)
zuerst immer zuordnen
(=V/(1+3,32*LOG10(n))) für die Hilfstabelle absolute und
relative Häufigkeit
Hilfstabelle neue Spalte (z.B. Größe)
Text mit Textkette schreiben
( =TEXTKETTE(“(“;erste zahl;;;zweite
zahl;“]”) )
Punktschätzung: Schätzwerte für unbekannte Populationsparameter
Mittelwert
Varianz , Standardabweichung
Methoden: Methode der kleinsten Quadrate oder Maximum-Likelihood-Methode
Bereichsschätzung: Aussage über die Genauigkeit dieser Schätzung
Standardfehler des Mittelwertes
Quantile t-Verteilung t-Wert, kritischer Wert
Konfidenzintervall
1) Berechnung Standardabweichung und Fehler des Mittelwertes
2) Bestimmung t-Wert aus t-Tabelle t(FG; ) (=T.INV.2S(alpha;FG))
3) Das (1- ) Konfidenzintervall lautet
Signifikante Stellen
1) Zahlenwerten: 34,1 (3) 42,567 (5) 21 (2) 21,0 (3)
2) Ziffer Null: 88,00 (4) 0,00022 (2)
3) Exponentielle Darstellung: 2,5*10^3 (2)
4) Logarithmus: log 1,05 (3) = 0,021 (3)
5) Exponentialrechnung: e^1,884 (3) = 6,56 (3)
bei Multiplikation und Division genau so viele sign. Stellen
wie der Ausgangswert mit kleinsten Zahl an sign. Stellen; bei
Konstante machen sie kein Unterschied auf Ergebnis
bei Addition und Subtraktion genau so viele Dezimalstellen
wie der Ausgangswert mit kleinsten Anzahl an Dezimalstellen
Standardabweichung max 2
Konfidenzintervall max 2
Mittelwert gleiche Anzahl wie Einzelgrößen oder +- 1
hängt von Standardabweichung ab
Klassifikation inhaltlicher Hypothesen
Unterschiedshyp. zum Nachweis unterschiedlicher Verteilungen
Zusammenhangshyp. zum Nachweis eines Zusammenhang von 2 oder mehrere
Merkmalausprägungen
ungerichtete Hyp. es gibt ein Unterschied, aber keine Richtung gegeben
gerichtete Hyp. Richtung des Unterschied kann durch Überlegungen beschreibt
werden
unspezifische Hyp. keine Angaben von Effektgrößen
spezifische Hyp. Stärke des Unterschieds mit Effektgröße spezifiziert
Effenktgröße Unterschiedsgröße/Zusammenhangsstärke absolute Differenz
oder standardisiert (abs. Diff./Standardabw.)
Nullhypothese H0: kein Effekt
Alternativhypothese H1: Effekt
Klassifikation Fragestellungen
einseitig Abweichung nur in eine Richtung interessant
zweiseitig keine Richtung der Änderung angegeben
Ablauf statistischer Tests
Ziel bestimmte Fragestellung zu beantworten (inhaltliche Hypothese)
Voraussetzungen vorliegende Daten (Skalenniveau, Stichprobengröße, Verteilung)
statistische Hypothesen Alternativhypothese aus inhaltlicher Hypothese
(Nullhypothese folgt komplementär)
Signifikanzniveau Kompromiss zwischen Fehler 1. Art und 2.Art
Auswahl geeigneter Tests passend zur Fragestellung und Testsituation
Berechnung der relevanten Prüfstatistik ts oder p-Wert aus der Stichprobe
Vergleich der Prüfstatistik mit kritischem Wert oder p-Wert mit Signifikanzniveau
Beibehaltung oder Verwerfung der Nullhypothese
Interpretation des Testergebnisses
p-Wert wie wahrscheinlich (oder nicht) sind die
Ergebnisse der Stichprobe, wenn man H0 annimmt
I
&
+
3
.
j
-
S
&
*
Si
O
Si
·
·
S
·
J
&
*
&
O
J
I
&
*
I
&
s
S
·
·
&
·
aX
S
X
I
&
S
·
I
&
i
&
a
S
-
-
&
A
·
·
3
-
&
-
"
·
·
T
i
i
&
Ö
Il
&
&
·
·
&
o
a
8
B
Gr
&
a
&
-
3
·
I
·
d
-
3
&
XI
T
&
O
5
&
&
&
3
·
s
-
&
j
·
&
3
&
·
0
:
·
s
&
O
s
·
·
:
*
Et
&
6
&
·
&
XI
:
"
i
i
5
!
·
·
&
·
3
.
g
S
i
o
&
DURCH
TESTTHEORIE
·
·
·
s
o
of
·
S
8
&
-
.
se
s
·
I
I
s
I
I
-
·
i
!
I
g
·
&
11
·
&
!
t
·
·
i
,
I
I
3
·
!
I
S
I
·
-d
5
S
pf2

Unvollständige Textvorschau

Nur auf Docsity: Lade Formelsammlung Biostatistik und mehr Formelsammlungen als PDF für Biostatistik herunter!

  • Grundgesamtheit: Gesamtheit aller Merkmalsträger
  • Stichprobe: tatsächlich untersuchte Merkmalträger
  • Merkmal/Variable: untersuchte Eigenschaft eines Merklmalträgers
  • Merkmalausprägung: ermittelter Wert eines Merkmals Messwert = wahrer Wert + systematische Abweichung
  • statistische Abweichung Genauigkeit = Richtigkeit + Präzision qualitative Skalen
  • binär: 0/1, mann/frau, ja/nein
  • nominal: Farben, Formen, Spezies
  • ordinal: Schmerz, Lebensqualität, Noten → mit Reihenfolge quantitative Skalen
  • diskret: Anzahl Individuen → binär-/nominalskala
  • kontinuierlich: Größe, Gewicht, Zeit, Temperatur Statistische Kennzahlen → repräsentieren Daten mit wenigen Kennwerten Beschreibung der Lage ( zentrale Tendenz) der Verteilung
    • arithmetisches Mittel → Durchschnitt (=MITTELWERT)
    • Modalwert D → häufigster Wert (= MODALWERT)
    • Median Z → liegt in der Mitte ( 50 % darunter, 50% darüber) zuerst nach Größe ordnen (= MEDIAN)
    • unteres Quartil Q1 → 0,25 Quantil (=QUARTILE.EXKL(zahlen;1))
    • oberes Quartil Q3 → 0,75 Quantil (=QUARTILE.EXKL(zahlen;3)) Beschreibung Variabilität um Lageparameter (Breite der Verteilung)
    • Spannweite V → 100 % aller Messwerte liegen innerhalb (=MAX-MIN)
    • Interquartilabstand I50 → 50 % aller Messwerte liegen innerhalb (= Q3-Q1)
    • Varianz → Beschreibung durchschnittlichen Schwankung (=VAR.S)
    • Standardabweichung s → Beschreibung durchschnittlichen Schwankung (=STABW.S) oder (=WURZEL( ))
    • Homogenitätsindex E^ →^ Diversität einer nominal skalierten Verteilung
    • Variationskoeffizient → Standardabweichung/Mittelwert Textdateien importieren
      • neue Excel-Dokument
      • Daten
      • aus Text
      • Datei aussuchen
      • importieren
      • Daten transformieren
      • schließen und laden
  • diskrete Merkmale → endlich viele Werte; bestimmte Werte, nichts dazwischen^ →^ Zählvorgang
  • stetige Merkmale → alle Werte innerhalb eines Intervalls → Messvorgang Häufigkeit → absolut/relativ
  • absolute Häufigkeit → wie oft kommt die Ausprägung (im Intervall) vor (=HÄUFIGKEIT(alle zahlen;obere Grenze des Intervalls))
  • relative Häufigkeit → wie oft kommt die Ausprägung (im Intervall) relativ zur Stichprobe vor (=hi/Summe alle hi) zuerst immer zuordnen (=V/( 1 +3,32*LOG10(n))) für die Hilfstabelle^ →^ absolute und relative Häufigkeit Hilfstabelle → neue Spalte (z.B. Größe) → Text mit Textkette schreiben ( =TEXTKETTE(“(“;erste zahl;“;“;zweite zahl;“]”) )
  • Punktschätzung: Schätzwerte für unbekannte Populationsparameter Mittelwert Varianz , Standardabweichung Methoden: Methode der kleinsten Quadrate oder Maximum-Likelihood-Methode
  • Bereichsschätzung: Aussage über die Genauigkeit dieser Schätzung Standardfehler des Mittelwertes Quantile t-Verteilung^ →^ t-Wert, kritischer Wert Konfidenzintervall 1 ) Berechnung Standardabweichung und Fehler des Mittelwertes 2 ) Bestimmung t-Wert aus t-Tabelle → t(FG; ) (=T.INV.2S(alpha;FG)) 3 ) Das ( 1 - ) Konfidenzintervall lautet
  • Signifikante Stellen 1 ) Zahlenwerten: 34,1 ( 3 ) 42,567 ( 5 ) 21 ( 2 ) 21,0 ( 3 ) 2 ) Ziffer Null: 88,00 ( 4 ) 0,00022 ( 2 ) 3 ) Exponentielle Darstellung: 2,5* 10 ^ 3 ( 2 ) 4 ) Logarithmus: log 1,05 ( 3 ) = 0,021 ( 3 ) 5 ) Exponentialrechnung: e^1,884 ( 3 ) = 6,56 ( 3 )
  • bei Multiplikation und Division genau so viele sign. Stellen wie der Ausgangswert mit kleinsten Zahl an sign. Stellen; bei Konstante machen sie kein Unterschied auf Ergebnis
  • bei Addition und Subtraktion genau so viele Dezimalstellen wie der Ausgangswert mit kleinsten Anzahl an Dezimalstellen
  • Standardabweichung → max 2
  • Konfidenzintervall → max 2
  • Mittelwert → gleiche Anzahl wie Einzelgrößen oder +- 1 → hängt von Standardabweichung ab Klassifikation inhaltlicher Hypothesen
  • Unterschiedshyp. → zum Nachweis unterschiedlicher Verteilungen
  • Zusammenhangshyp. → zum Nachweis eines Zusammenhang von 2 oder mehrere Merkmalausprägungen
  • ungerichtete Hyp. → es gibt ein Unterschied, aber keine Richtung gegeben
  • gerichtete Hyp. → Richtung des Unterschied kann durch Überlegungen beschreibt werden
  • unspezifische Hyp. → keine Angaben von Effektgrößen
  • spezifische Hyp. → Stärke des Unterschieds mit Effektgröße spezifiziert
  • Effenktgröße → Unterschiedsgröße/Zusammenhangsstärke → absolute Differenz oder standardisiert^ (abs. Diff./Standardabw.) Nullhypothese H0: kein Effekt Alternativhypothese H1: Effekt Klassifikation Fragestellungen
  • einseitig → Abweichung nur in eine Richtung interessant
  • zweiseitig → keine Richtung der Änderung angegeben Ablauf statistischer Tests
  • Ziel → bestimmte Fragestellung zu beantworten (inhaltliche Hypothese)
  • Voraussetzungen → vorliegende Daten (Skalenniveau, Stichprobengröße, Verteilung)
  • statistische Hypothesen → Alternativhypothese aus inhaltlicher Hypothese (Nullhypothese folgt komplementär)
  • Signifikanzniveau → Kompromiss zwischen Fehler 1. Art und 2.Art
  • Auswahl geeigneter Tests → passend zur Fragestellung und Testsituation
  • Berechnung der relevanten Prüfstatistik ts oder p-Wert aus der Stichprobe
  • Vergleich der Prüfstatistik mit kritischem Wert oder p-Wert mit Signifikanzniveau
  • Beibehaltung oder Verwerfung der Nullhypothese
  • Interpretation des Testergebnisses p-Wert → wie wahrscheinlich (oder nicht) sind die Ergebnisse der Stichprobe, wenn man H0 annimmt I

& +^3.^ j

  • S^ &^ * Si O

Si

· · S^ · ① J^ &^

& O J^ I &^

I &^ s

S

· · & aX^ · S X I & S · I^ & i & a S

&^ A · ·

&

  • " · · ⑧ T i i

& Ö Il^ & &

· & o a 8 B Gr^ & a &^

3 · I ·

d

3 & XI

T

&^ O

& & &

·^ s- &^ j · &^3 & · : 0 · s &^ O s · · :

Et

& 6 & ·^ & XI : " i i 5 ⑤ ! · · & ·

g

S i o ⑤ &^ DURCH TESTTHEORIE · · · s o of · S^ 8 &

-. se s^ ·^

I^

I^

s

I

I
  • · i^ ! I ↓^

g↓

·^ & 11 · & ! t · · i

I I 3 · !^

I

S^ I · -d 5 S

  • Untersuchung des Zusammenhangs zwischen 2 Merkmalen X,Y
  • Grafisch: Streudiagramm
  • Qualitativ: Korrelationskoeffizient
  • für Stichproben: Pearson’sche Korrelationskoeffizient
  • Nachweis → Konfidenzintervalle und Tests Ist der ermittelten Korrelationskoeffizient signifikant verschieden von null? - Bestimmung Art des Zusammenhangs

zwischen 2 Merkmalen X,Y

  • lineare Regression → lineare

Zusammenhang

  • Schätzung der linearen Regressionsfunktion
  • Nachweis → Konfidenzintervalle und Tests & 5 it & &^ -

at

(^5) S 5 ·

XI

↓^

5 5 5

z &

5 I & et & 5 & & & a & 3

t 5 5 5 i S & I

i

65 5

5 I 5

5 I & 5 it & 5 &

T

A

i a & 23 a

H it^ 5 s S 5 5 -^ H -

s

-9. g

↓^

3 5 3 &

·

  • E & S
M

· h o e I· ·

mi

m

mamm

s i

  • · s i #^ · . d

3 & &

i