Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Formulario Statistica, Formulari di Statistica

Formulario per sostenere esame statistica

Tipologia: Formulari

2014/2015

Caricato il 19/05/2015

edoardozen
edoardozen 🇮🇹

4.6

(5)

3 documenti

1 / 12

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
FORMULARIO DI STATISTICA
Statistica descrittiva
Frequenze relative:
Sia nil numero di osservazioni e nila frequenza assoluta, con
n=n1+n2+···+nk=
k
X
i=1
ni.
Allora
fi=ni
ni= 1,2,...,k
fi>0i= 1,2,...,k
k
X
i=1
fi= 1
Moda (dati in serie):
Osservazione che si verifica il maggior numero di volte (cio`e con maggiore
frequenza).
Moda (dati in classi):
La classe modale `e la classe in cui cade il maggior numero di osservazioni.
Mediana:
50-esimo percentile di una serie di osservazioni. Per calcolarlo:
1. ordinare le osservazioni in ordine crescente
2a. se n`e dispari `e il valore centrale (cio`e nella posizione n+1
2)
2b. se n`e pari `e la media dei due valori centrali (cio`e nelle posizioni n
2e
n
2+ 1)
Media campionaria (dati in serie):
Se n`e il numero di osservazioni,
x=Pn
i=1 xi
n.
1
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica Formulario Statistica e più Formulari in PDF di Statistica solo su Docsity!

FORMULARIO DI STATISTICA

Statistica descrittiva

Frequenze relative: Sia n il numero di osservazioni e ni la frequenza assoluta, con

n = n 1 + n 2 + · · · + nk =

∑^ k

i=

ni.

Allora

  • fi =

ni n i = 1, 2 ,... , k

  • fi > 0 i = 1, 2 ,... , k

∑^ k

i=

fi = 1

Moda (dati in serie): Osservazione che si verifica il maggior numero di volte (cio`e con maggiore frequenza).

Moda (dati in classi): La classe modale `e la classe in cui cade il maggior numero di osservazioni.

Mediana: 50-esimo percentile di una serie di osservazioni. Per calcolarlo:

  1. ordinare le osservazioni in ordine crescente 2a. se n e disparie il valore centrale (cioe nella posizione n+1 2 ) 2b. se ne pari e la media dei due valori centrali (cioe nelle posizioni n 2 e n 2 + 1)

Media campionaria (dati in serie): Se n `e il numero di osservazioni,

x =

∑n i=1 xi n

Media campionaria (dati in classi): Se mi `e il punto centrale dell’i-esima classe e k il numero delle classi,

x =

∑^ k

i=

mifi, fi =

ni n , n =

∑^ k

i=

ni,

dove ni `e la frequenza assoluta dell’i-esima classe.

Varianza campionaria (dati in serie):

s^2 =

n − 1

∑^ n

i=

(xi − x)^2.

Varianza campionaria (dati in classi):

s^2 =

n − 1

∑^ k

i=

ni(mi − x)^2 ,

dove ni `e la frequenza assoluta dell’i-esima classe e k il numero delle classi.

Deviazione standard: s =

s^2.

Calcolo delle probabilit`a

A, B eventi P (A) = probabilit`a dell’evento A

La probabiltae un numero reale tale che 0 6 P (A) 6 1 Evento impossibile: P (A) = 0 Evento certo: P (A) = 1 Evento complementare A : P (A) = 1 − P (A) Unione di eventi: P (A ∪ B) = P (A) + P (B) − P (A ∩ B) Unione di eventi mutualmente esclusivi: P (A ∪ B) = P (A) + P (B) Eventi condizionati: P (B|A) = P (A ∩ B)/P (A) Intersezione di eventi: P (A ∩ B) = P (A) · P (B|A) = P (B) · P (A|B) Intersezione di eventi indipendenti: P (A ∩ B) = P (A) · P (B)

Distribuzione normale o gaussiana Distribuzione di probabilit`a continua teorica di equazione

f (x) =

σ

2 π

e−^

(x−μ)^2 2 σ^2.

L’area sotto la curva e pari a 1. E definita da due parametri: media ( μ) e deviazione standard (σ). La distribuzione e unimodale, a forma di campana (si veda la Figura 1) e simmetrica rispetto a x = μ. La variabile casuale normale x ammette tutti i valori reali fra −∞ e +∞. La curva normale standardizzatae definita da μ = 0 e σ^2 = 1. Variabile normale standardizzata: z = x− σ μ.

μ^ x

1 σ √ 2 π e

− (x 2 −σμ 2 )^2

Figura 1: Distribuzione normale

Distribuzione campionaria della media Consideriamo la variabile casuale media campionaria x per campioni di di- mensione n estratti da una popolazione con media μ e deviazione standard σ;

  1. la media di x coincide con la media μ della popolazione;

  2. la varianza di x ´e σ 2 n e la deviazione standard^ √σ n si chiama^ errore standard (ES);

  3. anche se la popolazione non segue la distribuzione normale, la dis- tribuzione di x tende alla normale - al crescere di n - con parametri μ e √σn.

La variabile Z = x − μ √^ σ n

segue la distribuzione normale standardizzata con parametri 0 e 1.

Inferenza sulla media

  1. σ nota
  • Test di ipotesi bilaterale { H 0 : μ = μ 0 HA : μ 6 = μ 0

Se α ´e il livello di significativit´a, allora i valori critici saranno ±z α 2 , dove

Z =

x − μ ES(x) , ES(x) =

σ √ n

L’intervallo di confidenza (IC) bilaterale ´e quindi

IC(μ) =

x − z α 2 ES(x) , x + z α 2 ES(x)

  • Test di ipotesi unilaterale (valori minori di μ 0 ) { H 0 : μ = μ 0 HA : μ < μ 0

Se α ´e il livello di significativit´a, allora il valore critico sar´a −zα. Dunque l’intervallo di confidenza ´e

IC(μ) =

− ∞ , x + zαES(x)

  • Test di ipotesi unilaterale (valori maggiori di μ 0 ) { H 0 : μ = μ 0 HA : μ > μ 0

Se α ´e il livello di significativit´a, allora il valore critico sar´a zα. Dunque l’intervallo di confidenza ´e

IC(μ) =

x − zαES(x) , ∞

  1. σ ignota
  • Test di ipotesi bilaterale { H 0 : μ = μ 0 HA : μ 6 = μ 0

Intervallo di confidenza per la differenza di medie di due campioni appaiati:

IC(μ 1 − μ 2 ) =

d − tn− 1 , α 2 · ES(d) , d + tn− 1 , α 2 · ES(d)

  • Confronto di medie di due campioni campioni indipendenti (σ 1 , σ 2 note) (^) {

H 0 : μ 1 = μ 2 HA : μ 1 6 = μ 2

z =

(x 1 − x 2 ) − (μ 1 − μ 2 ) ES(x 1 − x 2 )

x 1 − x 2 ES(x 1 − x 2 ) , ES(x 1 − x 2 ) =

σ^21 n 1

σ^22 n 2

Intervallo di confidenza per la differenza di medie di due campioni indipen- denti:

IC(μ 1 − μ 2 ) =

x 1 − x 2 − z α 2 · ES(x 1 − x 2 ) , x 1 − x 2 + z α 2 · ES(x 1 − x 2 )

  • Confronto di medie di due campioni campioni indipendenti (σ 1 = σ 2 = σ nota) (^) { H 0 : μ 1 = μ 2 HA : μ 1 6 = μ 2

z =

(x 1 − x 2 ) − (μ 1 − μ 2 ) ES(x 1 − x 2 )

x 1 − x 2 ES(x 1 − x 2 ) , ES(x 1 −x 2 ) =

σ^2

n 1

n 2

Intervallo di confidenza per la differenza di medie di due campioni indipen- denti:

IC(μ 1 − μ 2 ) =

x 1 − x 2 − z α 2 · ES(x 1 − x 2 ) , x 1 − x 2 + z α 2 · ES(x 1 − x 2 )

  • Confronto di medie di due campioni campioni indipendenti (σ 1 = σ 2 = σ ignota, assumendo che le deviazioni standard campi- onarie s 1 ed s 2 siano stime indipendenti di una stessa σ) { H 0 : μ 1 = μ 2 HA : μ 1 6 = μ 2

tn 1 +n 2 − 2 =

(x 1 − x 2 ) − (μ 1 − μ 2 ) ES(x 1 − x 2 )

x 1 − x 2 ES(x 1 − x 2 )

ES(x 1 − x 2 ) =

s^2 p

n 1

n 2

, s^2 p =

s^21 (n 1 − 1) + s^22 (n 2 − 1) n 1 + n 2 − 2

dove

s^21 =

n 1 − 1

∑^ n^1

i=

(x 1 i − x 1 )^2 , s^22 =

n 2 − 1

∑^ n^2

i=

(x 2 i − x 2 )^2

Intervallo di confidenza per la differenza di medie di due campioni indipen- denti:

IC(μ 1 − μ 2 ) = ( x 1 − x 2 − tn 1 +n 2 − 2 , α 2 · ES(x 1 − x 2 ) , x 1 − x 2 + tn 1 +n 2 − 2 , α 2 · ES(x 1 − x 2 )

Analisi della varianza ad un criterio

di classificazione

Confronto di medie di k > 3 campioni indipendenti (σ^21 = σ^22 = · · · = σ^2 k = σ ignota). { H 0 : μ 1 = μ 2 = · · · = μk = μ HA : non tutti i μi sono uguali a μ.

Siano

ni, i = 1,... , k dimensione dell’i-esimo campione; s^2 i , i = 1,... , k varianza campionaria dell’i-esimo campione; xi, i = 1,... , k media campionaria dell’i-esimo campione.

Calcoliamo due diverse stime della varianza σ^2 :

  • varianza entro gruppi

s^2 W =

(n 1 − 1)s^21 + (n 2 − 1)s^22 + · · · + (nk − 1)s^2 k n 1 + n 2 + · · · + nk − k

  • varianza tra gruppi

s^2 B = n 1 (x 1 − x)^2 + n 2 (x 2 − x)^2 + · · · + nk(xk − x)^2 k − 1

dove x ´e la media globale definita da

x =

n 1 x 1 + n 2 x 2 + · · · + nkxk n 1 + n 2 + · · · + nk

Tabella 2 × 2 - Frequenze attese:

Var 2 (risultato) Var 1 (trattamento) R 1 R 2 Tot.

T 1 (a+b)( na+c)^ (a+b)( n b+d) a+b

T 2 (c+d)( na+c)^ (c+d)( n b+d) c+d

Tot. a+c b+d n

Test χ^2

H 0 : la proporzione relativa al risultato R 1 ´e la stessa per i trattamenti T 1 e T 2. Definiamo

χ^21 =

∑^2 ·^2

i=

(Oi − Ei)^2 Ei

dove:

Oi : frequenza osservata nella i-esima cella

Ei : frequenza attesa nella i-esima cella

1: gradi di libert´a nel caso di una tabella 2 × 2

dato α livello di significativit´a, χ^21 ,α ´e il valore critico del test

Il test χ^2 ´e sempre unilaterale.

Correzione di Yates

χ^21 =

∑^2 ·^2

i=

(|Oi − Ei| − 0 .5)^2 Ei

Tabelle di contingenza r × c

Siano r il numero di righe e c il numero di colonne; allora

χ^2 (r−1)(c−1) =

∑^ r·c

i=

(Oi − Ei)^2 Ei

´e il test χ^2 per il confronto di 3 o pi´u proporzioni.

Correlazione

Coefficiente di correlazione di Pearson

r =

∑n √∑ i=1(xi^ −^ x)(yi^ −^ y) n i=1(xi^ −^ x)^2

√∑n i=1(yi^ −^ y)^2

, − 1 6 r 6 1.

Test di significativit´a del coefficiente di correlazione ρ: { H 0 : ρ = 0 HA : ρ 6 = 0

ES(r) =

1 − r^2 n − 2

, tn− 2 = r ES(r)

= r

n − 2 1 − r^2

Intervallo di confidenza del coefficiente di correlazione ρ:

IC(ρ) =

r − tn− 2 , α 2 · ES(r) , r + tn− 2 , α 2 · ES(r)

Coefficiente di determinazione

R^2 = r^2 , 0 6 R^2 6 .

Regressione lineare

Retta di regressione: μy|x = α + βx.

Retta di regressione campionaria:

yˆ = a + bx

Pendenza della retta di regressione campionaria:

b =

∑n i=1 ∑(xi^ −^ x)(yi^ −^ y) n i=1(xi^ −^ x)^2

Intercetta della retta di regressione campionaria:

a = y − bx.