Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Formulario statistica II, Formulari di Statistica

Formulario statistica II, formule

Tipologia: Formulari

2020/2021

Caricato il 16/04/2021

diana.lucchini2000
diana.lucchini2000 🇮🇹

4.3

(23)

42 documenti

1 / 8

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Formulario Statistica II
Paolo Berta, Marta Angelici
Dipartimento di Statistica e Metodi Quantitativi
Università degli Studi Milano-Bicocca
31 gennaio 2020
Indicazioni
Il presente documento contiene il formulario per l’esame di Statistica II. E’
inoltre consentito l’utilizzo delle tavole statistiche per le distribuzioni: Normale
Standard, T di Student, Chi-Quadrato e F. In ultimo, si potrà utilizzare una
calcolatrice non programmabile per eseguire i calcoli necessari.
Media o valore atteso
La media di una v.a. discreta X si calcola come:
µX=E(X)=PixipX(xi)
Quando la v.a. è continua, invece:
µX=E(X)=RitfX(t)dt
Le principali proprietà sono:
E(aX +b)=aE(X)+b
E(X1+X2+...+Xn)=E(X1)+E(X2)+...+E(Xn)
E(g(X)) = Rig(t)fX(t)dt,perg:IR!IR eperXv.a. continua
1
pf3
pf4
pf5
pf8

Anteprima parziale del testo

Scarica Formulario statistica II e più Formulari in PDF di Statistica solo su Docsity!

Formulario Statistica II

Paolo Berta, Marta Angelici

Dipartimento di Statistica e Metodi Quantitativi

Università degli Studi Milano-Bicocca

email: [email protected], [email protected]

31 gennaio 2020

Indicazioni

Il presente documento contiene il formulario per l’esame di Statistica II. E’

inoltre consentito l’utilizzo delle tavole statistiche per le distribuzioni: Normale

Standard, T di Student, Chi-Quadrato e F. In ultimo, si potrà utilizzare una

calcolatrice non programmabile per eseguire i calcoli necessari.

Media o valore atteso

La media di una v.a. discreta X si calcola come:

μX = E(X) =

P

i

xipX (xi)

Quando la v.a. è continua, invece:

μ X

= E(X) =

R

i

tf X

(t)dt

Le principali proprietà sono:

E(aX + b) = aE(X) + b

E(X 1 + X 2 +... + Xn) = E(X 1 ) + E(X 2 ) +... + E(Xn)

E(g(X)) =

R

i

g(t)f X

(t)dt, per g : IR! IR e per X v.a. continua

Varianza

La varianza di una v.a. discreta X si calcola come:

2

X

= V ar(X) = E(X E(X))

2 = E(X

2 ) E(X)

2

Quando la v.a. è continua, invece:

2

X

= V ar(X) = E(X

2 ) E(X)

2

R

i

t

2 f X

(t)dt (

R

i

tf X

(t)dt)

2

Le principali proprietà sono: V ar(X) 0

V ar(aX + b) = a

2 V ar(X)

Processo di Bernoulli

Consiste in una sequenza di esperimenti aleatori con probabilità di successo p

e di insuccesso 1 p.

Sia X ⇠ Be(p) dove P (1) = p e P (0) = 1 p,

allora E(X) = p e V ar(X) = p(1 p).

La probabilità di ottenere, in n prove, una particolare sequenza di k successi

e (n k) insuccessi è: p

k (1 p)

(nk) .

Date n prove indipendenti, il numero complessivo di k successi è dato da:

p X

(k) =

n

k

p

k (1 p)

(nk) , per k = 0, 1 , 2 ,... , n.

Il valore atteso E(X) = np mentre la V ar(X) = np(1 p).

Poisson di parametro

Sia X ⇠ P oi(), con > 0 , la funzione di probabilità legata a X di osservare

k eventi è data da:

pX (k) =

k

k!

e

, per k = 0, 1 , 2 ,.. ..

Il valore atteso E(X) = , la V ar(X) = .

Modello Normale

Sia X i

⇠ N (μ,

2 ) allora la funzione di densità è data da:

f (x) =

1 p

2 ⇡

2

e

(xμ)

2

2

2 .

Il valore atteso E(X) = μ mentre la V ar(X) =

2 .

Se la Normale è standarizzata allora possiede media nulla e varianza unitaria

e si indica con la lettera Z.

La relazione tra legge Normale e legge Normale standard è la seguente:

Z ⇠ N (0, 1) ) Z + μ ⇠ N (μ,

2

)

X ⇠ N (μ,

2 ) )

⇠ N (0, 1)

Verifica di ipotesi

Realtà H 0 vera H 0 falsa

Decisione

Rifiuto ↵ 1-

α = P (

rifiutare H 0

/ H

0

è vera )

β = P (

NON rifiutare H 0

/ H

1

è vera )

La relazione tra legge Normale e legge Normale standard è la seguente:

Z ⇠ N (0, 1) ) Z + μ ⇠ N (μ,

2 )

X ⇠ N (μ,

2 ) )

⇠ N (0, 1)

Verifica di ipotesi

Realtà H 0

vera H 0

falsa

Decisione

Rifiuto ↵ 1-

Errore di I tipo potenza del test

Non Rifiuto 1- ↵

Significatività Errore di II tipo

La relazione tra queste probabilità è indicata in figura:

Test sulla media di una popolazione Normale di varianza nota:

H 0 H 1 Rifiutare H 0 se

μ = μ 0 μ 6 = μ 0 |z| > z 1

2

μ  μ 0

μ > μ 0

z > z 1 ↵

μ μ 0

μ < μ 0

z < z 1 ↵

Medie incognite, varianze uguali (NON NOTE). Utilizzo T-TEST:

t oss

x 1

x 2

Sc

n 1

n 2

S

1 , 2

2

=

x i

x )

2

n − 1

Confronto tra popolazioni

Caso: due popolazioni Normali, due campioni di numerosità n 1

e n 2

  • Media ignota e Varianza nota ⇠ Z, utilizzo le regole di rifiuto della Z,

devo calcolare la varianza della differenza:

2

¯ X 1

¯ X 2

2

1

n 1

2

2

n 2

  • Media e Varianza ignote, grandi campioni, ⇠ Z.

Per la varianza della differenza:

2

¯ X 1

¯ X 2

S

2

1

n 1

S

2

2

n 2

  • Media e Varianza ignote, varianze supposte uguali, piccoli campioni, ⇠ t.

Per la varianza devo usare:

2

¯ X 1

¯ X 2

= S

2

c

1

n 1

1

n 2

dove S

2

c

S

2

1

(n 1 1)+S

2

2

(n 2 1)

n 1 +n 2 2

H

0

H

1

Rifiutare H 0

se

μ x

= μ y

μ x

= μ y

|t| > t 1

2

,n 1 +n 2 2

μx  μy μx > μy t > t 1 ↵,n 1 +n 2 ^2

μx μy μX < μy t < t 1 ↵,n 1 +n 2 ^2

  • Media e Varianza ignote, varianze non supposte uguali, piccoli campioni,

⇠ t con v gradi di libertà dove v =

(a+b)

2

(a

2 )/(n 1 1)+(b

2 )/(n 2 1)

dove a = s

2

1

/n 1

e b allo stesso modo per la seconda popolazione.

Per la varianza devo usare:

2

¯ X 1

¯ X 2

S

2

1

n 1

S

2

2

n 2

  • Medie ignote, voglio confrontare le due varianze ⇠ F =

S

2

X

S

2

Y

In linea con le tavole disponibili di seguito la tabella con le diverse ipotesi

a confronto:

H

0

H

1

Rifiutare H 0

se

2

x

2

y

2

x

2

y

F F

↵,(nx1),(ny 1)

2

x

2

y

2

x

2

y

F  F

1 ↵,(nx1),(ny 1)

2

x

2

y

2

x

2

y

F F

↵/ 2 ,(nx1),(ny 1)

F  F

1 ↵/ 2 ,(nx1),(ny 1)

Caso: due popolazioni bernoulliane

  • con n 1 e n 2 sufficientemente grandi allora:

2

¯ X 1

¯ X 2

= ˆpc(1 pˆc)

1

n 1

1

n 2

dove pˆ c

pˆ 1 ⇤n 1 + ˆp 2 ⇤n 2

n 1 +n 2

Caso: dati appaiati

Confronto tra popolazioni

Caso: due popolazioni Normali, due campioni di numerosità n 1

e n 2

  • Media ignota e Varianza nota ⇠ Z, utilizzo le regole di rifiuto della Z,

devo calcolare la varianza della differenza:

2

¯ X 1

¯ X 2

2

1

n 1

2

2

n 2

  • Media e Varianza ignote, grandi campioni, ⇠ Z.

Per la varianza della differenza:

2

¯ X 1

¯ X 2

S

2

1

n 1

S

2

2

n 2

  • Media e Varianza ignote, varianze supposte uguali, piccoli campioni, ⇠ t.

Per la varianza devo usare:

2

¯ X 1

¯ X 2

= S

2

c

1

n 1

1

n 2

dove S

2

c

S

2

1

(n 1 1)+S

2

2

(n 2 1)

n 1 +n 2 2

H

0

H

1

Rifiutare H 0

se

μ x

= μ y

μ x

= μ y

|t| > t 1

2

,n 1 +n 2 2

μ x

 μ y

μ x

> μ y

t > t 1 ↵,n 1 +n 2 2

μx μy μX < μy t < t 1 ↵,n 1 +n 2 ^2

  • Media e Varianza ignote, varianze non supposte uguali, piccoli campioni,

⇠ t con v gradi di libertà dove v =

(a+b)

2

(a

2 )/(n 1 1)+(b

2 )/(n 2 1)

dove a = s

2

1

/n 1

e b allo stesso modo per la seconda popolazione.

Per la varianza devo usare:

2

¯ X 1

¯ X 2

S

2

1

n 1

S

2

2

n 2

  • Medie ignote, voglio confrontare le due varianze ⇠ F =

S

2

X

S

2

Y

In linea con le tavole disponibili di seguito la tabella con le diverse ipotesi

a confronto:

H

0

H

1

Rifiutare H 0

se

2

x

2

y

2

x

2

y

F F

↵,(nx1),(ny 1)

2

x

2

y

2

x

2

y

F  F

1 ↵,(nx1),(ny 1)

2

x

2

y

2

x

2

y

F F

↵/ 2 ,(nx1),(ny 1)

F  F

1 ↵/ 2 ,(nx1),(ny 1)

Caso: due popolazioni bernoulliane

  • con n 1 e n 2 sufficientemente grandi allora:

2

¯ X 1

¯ X 2

= ˆpc(1 pˆc)

1

n 1

1

n 2

dove pˆ c

pˆ 1 ⇤n 1 + ˆp 2 ⇤n 2

n 1 +n 2

Caso: dati appaiati

F

1 − α ; n A − 1 ; nB − 1

Test del Lemma di Neyman-Pearson

Test più potente di ampiezza

Qualunque sia l’ipotesi alternativa, con , il test di Neyman

presenta una regione critica della forma .

c costante da determinare è il rapporto di verosimiglianze.

Es: faccio derivata e ottengo , approssimo a normale.

Disuguaglianza di Rao-Cramer

α = 0 , 05

H 1

: p = p 1

p 1

> 0 , 25

(

x : Δ > c )

= (

x : x > k )

= (

x : zk ′ )

∆ =

L 1 (

0 , 8 ; x )

L 2 (

0 , 8 ; x )

c xk

Var

T

n I ( σ )

I σ = − E

2

log f x ( x ; σ )

σ )

2

SS A =

X

1

− X

tot )

· n 1

+.... MS A =

SS A

p − 1

SSE =

Var. ca m ·

(

n 1

+... MSE =

SSE

np

SS

tot

y ij

y

)

2

T =

¯ DμD

SD /

p

n

⇠ t n 1

Test Chi-Quadrato

H

0

: X e Y sono due caratteri indipendenti

H

1

: X e Y non sono due caratteri indipendenti

Calcoliamo la statistica test sotto H 0

2

P

h

i=

P

k

j=

(Oij Eij )

2

Eij

2

↵;(h1)⇤(k1)

E

ij

n i.

⇤n .j

n..

dove i=righe e j=colonne.

Analisi della Varianza - ANOVA

Test di Ipotesi

(

H

0

: μ 0

= μ 1

= μ 2

,... , = μ h

H

1

: Almeno una delle medie risulta diversa

Test F:

M SA

M SE

⇠ F

↵;(p1)(np)

Dove MSA rappresenta il Mean Square Error del trattamento, mentre MSE

rappresenta il Mean Square Error dell’errore casuale.

Teoria dei Campioni

Campionameno Casuale Semplice:

Stima del totale

Y =

N

P

n

i

y i

n

N y

n

La varianza della media campionaria è espressa da:

V ar(¯y) =

2

y

n

N n

N 1

  • Utilizzo una nuova variabile ottenuta come differenza tra i campioni, e

sapendo che:

T =

¯ DμD

SD /

p

n

⇠ t n 1

Test Chi-Quadrato

H 0 : X e Y sono due caratteri indipendenti

H 1 : X e Y non sono due caratteri indipendenti

Calcoliamo la statistica test sotto H 0 :

2

=

P

h

i=

P

k

j=

(O ij

E ij

)

2

Eij

2

↵;(h1)⇤(k1)

E

ij

ni.⇤n.j

n..

dove i=righe e j=colonne.

Analisi della Varianza - ANOVA

Test di Ipotesi

(

H

0

: μ 0

= μ 1

= μ 2

,... , = μ h

H

1

: Almeno una delle medie risulta diversa

Test F:

M SA

M SE

⇠ F

↵;(p1)(np)

Dove MSA rappresenta il Mean Square Error del trattamento, mentre MSE

rappresenta il Mean Square Error dell’errore casuale.

Teoria dei Campioni

Campionameno Casuale Semplice:

Stima del totale

Y =

N

P

n

i

yi

n

N y

n

La varianza della media campionaria è espressa da:

V ar(¯y) =

2

y

n

N n

N 1

Teoria dei Campioni

Campionameno Casuale Semplice:

Stima del totale

Y =

N

P

n

i

y i

n

N y

n

La varianza della media campionaria è espressa da:

V ar(¯y) =

2

y

n

N n

N 1

La varianza del totale campionario

Y è:

V ar(ˆy) = N

2

V ar(¯y)

Campionameno Casuale Stratificato:

Nel caso di allocazione proporzionale la numerosità dello strato è data da:

n h

n ⇤ N h

N

= n ⇤ W h

Nel caso di allocazione ottimale la numerosità dello strato è data da:

n h

= n

W

h

⇤ S

h

P

H

h

W

h

⇤ S

h

La media μ è correttamente stimata dalla media aritmetica opportunamente

corretta per il peso degli strati.

Se si denota con y¯ h

la media dello strato h risulta:

y ¯ h

n h X

i

y hi

/n h

[h = 1,... , H]

e la media del campione è data data:

y ¯ =

H X

h

W

h

y¯ h

H X

h

N

h

¯y h

/N

La varianza di ¯y si ottiene come media aritmetica ponderata delle varianze

delle stime dei singoli strati:

V ar(¯y) =

H X

h

W

2

h

V ar(¯y h

Il valore totale Y è correttamente stimato da:

Y =

H X

h

Y

h

dove

Y

h

è dato da N h

y¯ h

, la cui varianza è correttamente stimata da:

V ar(

Y ) =

H X

h

V ar(

Yh) = N

2

V ar(¯y)