






Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Formulario per sostenere esame statistica
Tipologia: Formulari
1 / 12
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!







Frequenze relative: Sia n il numero di osservazioni e ni la frequenza assoluta, con
n = n 1 + n 2 + · · · + nk =
∑^ k
i=
ni.
Allora
ni n i = 1, 2 ,... , k
∑^ k
i=
fi = 1
Moda (dati in serie): Osservazione che si verifica il maggior numero di volte (cio`e con maggiore frequenza).
Moda (dati in classi): La classe modale `e la classe in cui cade il maggior numero di osservazioni.
Mediana: 50-esimo percentile di una serie di osservazioni. Per calcolarlo:
e disparie il valore centrale (cioe nella posizione n+1 2 ) 2b. se ne pari e la media dei due valori centrali (cioe nelle posizioni n 2 e n 2 + 1)Media campionaria (dati in serie): Se n `e il numero di osservazioni,
x =
∑n i=1 xi n
Media campionaria (dati in classi): Se mi `e il punto centrale dell’i-esima classe e k il numero delle classi,
x =
∑^ k
i=
mifi, fi =
ni n , n =
∑^ k
i=
ni,
dove ni `e la frequenza assoluta dell’i-esima classe.
Varianza campionaria (dati in serie):
s^2 =
n − 1
∑^ n
i=
(xi − x)^2.
Varianza campionaria (dati in classi):
s^2 =
n − 1
∑^ k
i=
ni(mi − x)^2 ,
dove ni `e la frequenza assoluta dell’i-esima classe e k il numero delle classi.
Deviazione standard: s =
s^2.
A, B eventi P (A) = probabilit`a dell’evento A
La probabiltae un numero reale tale che 0 6 P (A) 6 1 Evento impossibile: P (A) = 0 Evento certo: P (A) = 1 Evento complementare A : P (A) = 1 − P (A) Unione di eventi: P (A ∪ B) = P (A) + P (B) − P (A ∩ B) Unione di eventi mutualmente esclusivi: P (A ∪ B) = P (A) + P (B) Eventi condizionati: P (B|A) = P (A ∩ B)/P (A) Intersezione di eventi: P (A ∩ B) = P (A) · P (B|A) = P (B) · P (A|B) Intersezione di eventi indipendenti: P (A ∩ B) = P (A) · P (B)
Distribuzione normale o gaussiana Distribuzione di probabilit`a continua teorica di equazione
f (x) =
σ
2 π
e−^
(x−μ)^2 2 σ^2.
L’area sotto la curva e pari a 1. E definita da due parametri: media ( μ) e deviazione standard (σ). La distribuzione e unimodale, a forma di campana (si veda la Figura 1) e simmetrica rispetto a x = μ. La variabile casuale normale x ammette tutti i valori reali fra −∞ e +∞. La curva normale standardizzatae definita da μ = 0 e σ^2 = 1. Variabile normale standardizzata: z = x− σ μ.
μ^ x
1 σ √ 2 π e
− (x 2 −σμ 2 )^2
Figura 1: Distribuzione normale
Distribuzione campionaria della media Consideriamo la variabile casuale media campionaria x per campioni di di- mensione n estratti da una popolazione con media μ e deviazione standard σ;
la media di x coincide con la media μ della popolazione;
la varianza di x ´e σ 2 n e la deviazione standard^ √σ n si chiama^ errore standard (ES);
anche se la popolazione non segue la distribuzione normale, la dis- tribuzione di x tende alla normale - al crescere di n - con parametri μ e √σn.
La variabile Z = x − μ √^ σ n
segue la distribuzione normale standardizzata con parametri 0 e 1.
Se α ´e il livello di significativit´a, allora i valori critici saranno ±z α 2 , dove
x − μ ES(x) , ES(x) =
σ √ n
L’intervallo di confidenza (IC) bilaterale ´e quindi
IC(μ) =
x − z α 2 ES(x) , x + z α 2 ES(x)
Se α ´e il livello di significativit´a, allora il valore critico sar´a −zα. Dunque l’intervallo di confidenza ´e
IC(μ) =
− ∞ , x + zαES(x)
Se α ´e il livello di significativit´a, allora il valore critico sar´a zα. Dunque l’intervallo di confidenza ´e
IC(μ) =
x − zαES(x) , ∞
Intervallo di confidenza per la differenza di medie di due campioni appaiati:
IC(μ 1 − μ 2 ) =
d − tn− 1 , α 2 · ES(d) , d + tn− 1 , α 2 · ES(d)
H 0 : μ 1 = μ 2 HA : μ 1 6 = μ 2
z =
(x 1 − x 2 ) − (μ 1 − μ 2 ) ES(x 1 − x 2 )
x 1 − x 2 ES(x 1 − x 2 ) , ES(x 1 − x 2 ) =
σ^21 n 1
σ^22 n 2
Intervallo di confidenza per la differenza di medie di due campioni indipen- denti:
IC(μ 1 − μ 2 ) =
x 1 − x 2 − z α 2 · ES(x 1 − x 2 ) , x 1 − x 2 + z α 2 · ES(x 1 − x 2 )
z =
(x 1 − x 2 ) − (μ 1 − μ 2 ) ES(x 1 − x 2 )
x 1 − x 2 ES(x 1 − x 2 ) , ES(x 1 −x 2 ) =
σ^2
n 1
n 2
Intervallo di confidenza per la differenza di medie di due campioni indipen- denti:
IC(μ 1 − μ 2 ) =
x 1 − x 2 − z α 2 · ES(x 1 − x 2 ) , x 1 − x 2 + z α 2 · ES(x 1 − x 2 )
tn 1 +n 2 − 2 =
(x 1 − x 2 ) − (μ 1 − μ 2 ) ES(x 1 − x 2 )
x 1 − x 2 ES(x 1 − x 2 )
ES(x 1 − x 2 ) =
s^2 p
n 1
n 2
, s^2 p =
s^21 (n 1 − 1) + s^22 (n 2 − 1) n 1 + n 2 − 2
dove
s^21 =
n 1 − 1
∑^ n^1
i=
(x 1 i − x 1 )^2 , s^22 =
n 2 − 1
∑^ n^2
i=
(x 2 i − x 2 )^2
Intervallo di confidenza per la differenza di medie di due campioni indipen- denti:
IC(μ 1 − μ 2 ) = ( x 1 − x 2 − tn 1 +n 2 − 2 , α 2 · ES(x 1 − x 2 ) , x 1 − x 2 + tn 1 +n 2 − 2 , α 2 · ES(x 1 − x 2 )
Confronto di medie di k > 3 campioni indipendenti (σ^21 = σ^22 = · · · = σ^2 k = σ ignota). { H 0 : μ 1 = μ 2 = · · · = μk = μ HA : non tutti i μi sono uguali a μ.
Siano
ni, i = 1,... , k dimensione dell’i-esimo campione; s^2 i , i = 1,... , k varianza campionaria dell’i-esimo campione; xi, i = 1,... , k media campionaria dell’i-esimo campione.
Calcoliamo due diverse stime della varianza σ^2 :
s^2 W =
(n 1 − 1)s^21 + (n 2 − 1)s^22 + · · · + (nk − 1)s^2 k n 1 + n 2 + · · · + nk − k
s^2 B = n 1 (x 1 − x)^2 + n 2 (x 2 − x)^2 + · · · + nk(xk − x)^2 k − 1
dove x ´e la media globale definita da
x =
n 1 x 1 + n 2 x 2 + · · · + nkxk n 1 + n 2 + · · · + nk
Tabella 2 × 2 - Frequenze attese:
Var 2 (risultato) Var 1 (trattamento) R 1 R 2 Tot.
T 1 (a+b)( na+c)^ (a+b)( n b+d) a+b
T 2 (c+d)( na+c)^ (c+d)( n b+d) c+d
Tot. a+c b+d n
Test χ^2
H 0 : la proporzione relativa al risultato R 1 ´e la stessa per i trattamenti T 1 e T 2. Definiamo
χ^21 =
i=
(Oi − Ei)^2 Ei
dove:
Oi : frequenza osservata nella i-esima cella
Ei : frequenza attesa nella i-esima cella
1: gradi di libert´a nel caso di una tabella 2 × 2
dato α livello di significativit´a, χ^21 ,α ´e il valore critico del test
Il test χ^2 ´e sempre unilaterale.
Correzione di Yates
χ^21 =
i=
(|Oi − Ei| − 0 .5)^2 Ei
Tabelle di contingenza r × c
Siano r il numero di righe e c il numero di colonne; allora
χ^2 (r−1)(c−1) =
∑^ r·c
i=
(Oi − Ei)^2 Ei
´e il test χ^2 per il confronto di 3 o pi´u proporzioni.
Coefficiente di correlazione di Pearson
r =
∑n √∑ i=1(xi^ −^ x)(yi^ −^ y) n i=1(xi^ −^ x)^2
√∑n i=1(yi^ −^ y)^2
, − 1 6 r 6 1.
Test di significativit´a del coefficiente di correlazione ρ: { H 0 : ρ = 0 HA : ρ 6 = 0
ES(r) =
1 − r^2 n − 2
, tn− 2 = r ES(r)
= r
n − 2 1 − r^2
Intervallo di confidenza del coefficiente di correlazione ρ:
IC(ρ) =
r − tn− 2 , α 2 · ES(r) , r + tn− 2 , α 2 · ES(r)
Coefficiente di determinazione
R^2 = r^2 , 0 6 R^2 6 .
Retta di regressione: μy|x = α + βx.
Retta di regressione campionaria:
yˆ = a + bx
Pendenza della retta di regressione campionaria:
b =
∑n i=1 ∑(xi^ −^ x)(yi^ −^ y) n i=1(xi^ −^ x)^2
Intercetta della retta di regressione campionaria:
a = y − bx.