Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Formulario di Statistica - Esercizi e Formule, Formulari di Statistica

formulario statistica 1 Statistica descrittiva Media • per distribuzioni unitarie o serie dati: ¯ xn = 1 nPn i=1 xi • per distribuzioni di frequenze assolute ¯ xn = 1 nPk i=1 xini, dove ni sono le frequenze assolute ecc..

Tipologia: Formulari

2019/2020

Caricato il 27/05/2020

karolina-diurczak
karolina-diurczak 🇮🇹

3

(2)

7 documenti

1 / 5

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Formulario di Statistica (Lagona-Cucina)
Corso di Statistica - a.a. 2019/20 (Lagona-Cucina)
May 6, 2020
1 Statistica descrittiva
Media
per distribuzioni unitarie o serie dati:
¯xn=1
nPn
i=1 xi
per distribuzioni di frequenze assolute
¯xn=1
nPk
i=1 xini
, dove
ni
sono le frequenze assolute
per distribuzioni di frequenze relative
¯xn=Pk
i=1 xifi
dove
fi
sono le frequenze relative
Varianza (la deviazione standard
sn
è la radice della varianza)
per distribuzioni unitarie:
s2
n=1
n1Pn
i=1(xixn)2
per distribuzioni di frequenza:
s2
n=1
n1Pk
i=1(xixn)2ni
per distribuzioni di frequenza (relative):
s2
n=n
n1Pk
i=1(xixn)2fi
Varianza (formula alternativa)
per distribuzioni unitarie o serie dati:
=n
n11
nPn
i=1 x2
i(xn)2
per distribuzioni di frequenza:
=n
n1h1
nPk
i=1 x2
ini(xn)2i
per distribuzioni di frequenza (relative):
=n
n1Pn
i=1 x2
ifi(xn)2
Mediana
per distribuzioni di frequenza:
x0.50 =min(xi)
tale che
Fi0.5
dove
Fi
è la frequenza
relativa cumulata.
Primo Quartile
per distribuzioni di frequenza:
x0.25 =min(xi)
tale che
Fi0.25
dove
Fi
è la frequenza
relativa cumulata.
Terzo Quartile
per distribuzioni di frequenza:
x0.75 =min(xi)
tale che
Fi0.75
dove
Fi
è la frequenza
relativa cumulata.
2 Dipendenza per due variabili qualitative (
χ2
)
Consideriamo una distribuzione di frequenze
y1y2y3
x1n11 n12 n13 n1·
x2n21 n22 n23 n2·
x3n31 n32 n33 n3·
n·1n·2n·3n
Y e X sono indipendenti se:
nhk =nh·n·k
nfhk =fh·f·kh, k
1
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Formulario di Statistica - Esercizi e Formule e più Formulari in PDF di Statistica solo su Docsity!

Formulario di Statistica (Lagona-Cucina)

Corso di Statistica - a.a. 2019/20 (Lagona-Cucina)

May 6, 2020

1 Statistica descrittiva

Media

  • per distribuzioni unitarie o serie dati: ¯xn = (^) n^1

∑n i=1 xi

  • per distribuzioni di frequenze assolute x¯n = (^1) n

∑k i=1 xini, dove^ ni^ sono le frequenze assolute

  • per distribuzioni di frequenze relative ¯xn =

∑k i=1 xifi^ dove^ fi^ sono le frequenze relative Varianza (la deviazione standard sn è la radice della varianza)

  • per distribuzioni unitarie: s^2 n = (^) n^1 − 1

∑n i=1(xi^ −^ xn) 2

  • per distribuzioni di frequenza: s^2 n = (^) n−^11

∑k i=1(xi^ −^ xn)

(^2) ni

  • per distribuzioni di frequenza (relative): s^2 n = (^) nn− 1

∑k i=1(xi^ −^ xn) (^2) fi

Varianza (formula alternativa)

  • per distribuzioni unitarie o serie dati: = (^) n−n 1

[ 1

n

∑n i=1 x

2 i −^ (xn)

2 ]

  • per distribuzioni di frequenza: = (^) nn− 1

[

1 n

∑k i=1 x

2 i ni^ −^ (xn) 2

]

  • per distribuzioni di frequenza (relative): = (^) n−n 1

[∑n i=1 x 2 i fi^ −^ (xn)

2 ]

Mediana

  • per distribuzioni di frequenza: x 0. 50 = min(xi) tale che Fi ≥ 0. 5 dove Fi è la frequenza relativa cumulata. Primo Quartile
  • per distribuzioni di frequenza: x 0. 25 = min(xi) tale che Fi ≥ 0. 25 dove Fi è la frequenza relativa cumulata.

Terzo Quartile

  • per distribuzioni di frequenza: x 0. 75 = min(xi) tale che Fi ≥ 0. 75 dove Fi è la frequenza relativa cumulata.

2 Dipendenza per due variabili qualitative (χ^2 )

Consideriamo una distribuzione di frequenze y 1 y 2 y 3 x 1 n 11 n 12 n 13 n 1 · x 2 n 21 n 22 n 23 n 2 · x 3 n 31 n 32 n 33 n 3 · n· 1 n· 2 n· 3 n

  • Y e X sono indipendenti se:

nhk = nh·n·k n

⇔ fhk = fh·f·k ∀h, k

  • la statistica Chi Quadrato è data da

χ^2 =

∑^ H

h=

∑^ K

k=

nhk − nh· nn·k

nh·n·k n

  • una formula più conveniente è data da

χ^2 = n

( H

h=

∑^ K

k=

n^2 hk nh·n·k

3 Dipendenza per una variabile qualitativa (X) e una quan-

titativa Y (η^2 )

  • Ipotizziamo che la variabile qualitativa X abbia K modalità (il campione è suddiviso in K gruppi)
  • Determinare la media di un gruppo signica calcolare una media condizionata di Y
  • Determinare la devianza di un gruppo signica calcolare una devianza condizionata di Y
  • la devianza totale(la devianza totale si calcola considerando la distribuzione marginale della variabile quantitativa Y)

DT =

(yi − y¯)^2

la devianza within (o residua)

DW =

∑^ n^1

i=

(y 1 i − ¯y 1 )^2 +

∑^ n^2

i=

(y 2 i − y¯ 1 )^2 +...

∑^ nK

i=

(yKi − y¯K )^2

dove y 1 i sono le osservazioni del primo grupppo, y 2 i le osservazioni del secondo gruppo e yKi le osservazioni del K gruppo. la devianza between (o spiegata)

DB = n 1 (¯y 1 − ¯y)^2 + n 2 (¯y 2 − y¯)^2 +... + nK (¯yK − y¯)^2

dove y¯ 1 è la media del primo gruppo, y¯ 2 è la media del secondo gruppo e y¯K è la media del K− gruppo.

  • vale la seguente decomposizione DT = DB + DW
  • una misura della capacità esplicativa del genere rispetto al punteggio è data dal rapporto di correlazione

η^2 =

DB

DT

DB

DB + DW

  • l'indice varia tra 0 (indipendenza in media) e 1 (massima dipendenza in media)

Covarianza

  • per distribuzioni doppie unitarie:

sxy =

n − 1

∑^ n

i=

(xi − xn)(yi − yn)

  • per distribuzioni doppie unitarie (formula alternativa):

sxy = n n − 1

[

n

∑^ n

i=

xiyi − xnyn

]

6 Regressione

  • Stimatori: ˆb = s sxy (^2) x , aˆ = ¯y − ˆb¯x
  • Retta di regressione stimata: yˆi = ˆa + ˆbxi
  • Residuo stimato o errore: ei = yi − ˆyi
  • Decomposizione della varianza:

DT = Devianza Totale =

∑^ n

i=

(yi − ¯y)^2

DReg = Devianza Spiegata =

∑^ n

i=

(ˆyi − y¯)^2

DRes = Devianza Residua =

∑^ n

i=

(yi − yˆi)^2 =

∑^ n

i=

e^2 i

  • Intervalli di condenza sui parametri della retta di regressione

(ˆb − tn− 2 , α 2 sˆb; ˆb + tn− 2 , α 2 ˆsb)

(ˆa − tn− 2 , α 2 sˆa; ˆa + tn− 2 , α 2 ˆsa)

  • Test delle ipotesi su coef. angolare con H 0 : b = b 0 :
    1. Statistica test: tb = ˆb− ˆsbb 0 ∼ tn− 2
    2. Se H 1 : b < b 0 p-value = P (tn− 2 < tb); Riuto H 0 se tb < −tn− 2 ,α
    3. Se H 1 : b > b 0 p-value = P (tn− 2 > tb); Riuto H 0 se tb > tn− 2 ,α
    4. Se H 1 : b 6 = b 0 p-value = 2P (tn− 2 > |tb|); Riuto H 0 se tb > tn− 2 ,α/ 2 o tb < −tn− 2 ,α/ 2
  • Test delle ipotesi su intercetta con H 0 : a = a 0 :
    1. Statistica test: ta = ˆa− ˆsaa 0 ∼ tn− 2
    2. Se H 1 : b < a 0 p-value = P (tn− 2 < ta); Riuto H 0 se ta < −tn− 2 ,α
    3. Se H 1 : a > a 0 p-value = P (tn− 2 > ta); Riuto H 0 se ta > tn− 2 ,α
    4. Se H 1 : a 6 = a 0 p-value = 2P (tn− 2 > |ta|) Riuto H 0 se ta > tn− 2 ,α/ 2 o ta < −tn− 2 ,α/ 2
  • Coeciente di determinazione (formule alternative):

 R^2 = r xy^2

 R^2 = 1 −

Dres DT  R^2 = Dreg DT

  • Devianza residua e Devianza spiegata (o di regressione) (formule alternative):

 Dreg = r xy^2 DT

 Dres = (1 − r^2 xy )DT

7 Test Anova per la regressione

 ipotesi nulla del test H 0 : b = 0  statistica test: Foss =

Dreg/greg Dres/gres

∼ Fgreg,gres

 Dres = Devianza residua  Dreg = Devianza spiegata o di regressione  indichiamo con greg e gres rispettivamente i gdl (gradi di libertà) della devianza spie- gata e della devianza residua  greg = 1  gres = n − 2  D gregreg è la varianza spiegata  D gresres è la varianza residua  p-value = P (Fgreg ,gres > Foss)  regola basata sulla regione di riuto e accettazione: Riuto H 0 se Foss > Fgreg ,gres,α

8 Test Anova

  • ipotesi nulla H 0 : le medie dei gruppi sono uguali
  • Statistica Test: Foss =

DB /gB DW /gW

∼ FgB ,gW

  • gb sono i gradi di libertà della devianza between ed è pari a K − 1 , dove K indica il numero di modalità della variabili qualitativa
  • gW sono i gradi di libertà della devianza within ed è pari n − K, dove n indica l'ampiezza del campione
  • con FgB ,gW inchiamo la distribuzione della variabile aleatoria F di Fisher con gB e gW gradi di libertà
  • D gBB rappresenta la varianza between (numeratore di Foss)
  • D gWW rappresenta la varianza within (denominatore di Foss)
  • p-value = P (FgB ,gW > Foss)
  • regola basata sulla regione di riuto e accettazione: Riuto H 0 se Foss > FgB ,gW ,α

9 Test di indipendenza del χ^2

  • ipotesi nulla H 0 : X e Y sono indipendenti
  • la statistica test

χ^2 oss =

∑^ H

h=

∑^ K

k=

nhk − nh· nn·k

nh·n·k n

∼ χ^2 (H−1)∗(K−1)

  • gradi di libertà: gl = (H − 1) ∗ (K − 1) dove H sono il numero di modalità del carattere X e K il numero di modalità del carattere Y
  • p-value =P (χ^2 (H−1)∗(K−1) > χ^2 oss)
  • regola basata sulla regione di riuto e accettazione: Riuto H 0 se χ^2 oss > χ^2 (H−1)∗(K−1),α