Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


8) verifica delle ipotesi 2016, Dispense di Statistica

verifica ipotesi statistica

Tipologia: Dispense

2015/2016

Caricato il 03/08/2016

ILBAGGIO92
ILBAGGIO92 🇮🇹

5

(2)

2 documenti

1 / 10

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
Verifica delle ipotesi 2016
Elisabetta Busignani
Verifica delle ipotesi
Nell’inferenza statistica si formulano delle assunzioni sulla distribuzione di probabilità di una
variabile casuale associata ad un fenomeno reale; tali assunzioni, dette ipotesi, riguardano, di
regola, il valore di un parametro incognito quale una media, una misura della variabilità o della
relazione tra due variabili.
La verifica statistica delle ipotesi vaglia il grado d’attendibilità che può essere loro attribuito;
essa appura se le stesse possono ritenersi o no, compatibili con l’evidenza empirica rappresentata
dalle osservazioni campionarie disponibili.
Nella prova di ipotesi si distingue tra ipotesi nulla che generalmente rispecchia la situazione
acquisita prima dell’osservazione campionaria ed è indicata con
0
H
eipotesi alternativa che ne
attesta una diversa specificazione ed è indicata con
1
H
.
La verifica di ipotesi, che comporta la sua accettazione o il suo rifiuto ad un prestabilito livello di
probabilità è effettuata utilizzando una statistica test che implica una suddivisione dello spazio
campionario in due regioni esclusive.
una regione di accettazione che indica l’insieme dei valori campionari che
implicano l’accettazione dell’ipotesi nulla;
una regione di rifiuto o critica che indica l’insieme dei valori campionari che
implicano il rifiuto dell’ipotesi nulla.
La regola di decisione consiste nello stabilire se la differenza tra il valore stimato del
parametro,specificato nell’ipotesi nulla e quello ottenuto dall’osservazione campionaria sia o meno
significativa; stabilito quindi un livello di significatività α,rappresentante l’ampiezza della regione
di rifiuto, si fissa il valore o i valori critici del test (che si desumono da apposite tavole) e si rifiuta
l’ipotesi nulla se il valore sperimentale del test ricade nella regione di rifiuto.
Essendo fondata su un risultato campionario, la regola deve presupporre di commettere degli
errori che si distinguono in due tipologie:
errore di primo tipo(o prima specie) quando rifiuto l’ipotesi nulla
0
H
, ma essa è vera e
quindi non dovrebbe essere rifiutata: La probabilità che si verifichi errore di I Tipo si indica
con α;
errore di secondi tipo (o seconda specie) quando non si rifiuta l’ipotesi nulla
0
H
, ma
essa è falsa e quindi andrebbe rifiutata. La probabilità che si verifichi un errore di II Tipo si
indica con β.
p- value: E’ il livello di significatività al quale l’ipotesi nulla può essere rifiutata, dato il valore della
statistica campionaria osservata. Rifiuto cioè l’ipotesi nulla se il p-value è minore della probabilità
di commettere un errore di prima specie, ossia: rifiuto
0
H
se p-value < α
E’ una probabilità osservata, diversa quindi per ogni valore della statistica campionaria ottenuta.
E’ la probabilità sotto
0
H
di ottenere un valore campionario più lontano dall’ipotesi principale e più
vicino all’alternativa di quello ottenuto effettivamente nel campione
X
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica 8) verifica delle ipotesi 2016 e più Dispense in PDF di Statistica solo su Docsity!

Verifica delle ipotesi 2016 Elisabetta Busignani

Verifica delle ipotesi

Nell’inferenza statistica si formulano delle assunzioni sulla distribuzione di probabilità di una variabile casuale associata ad un fenomeno reale; tali assunzioni, dette ipotesi, riguardano, di regola, il valore di un parametro incognito quale una media, una misura della variabilità o della relazione tra due variabili. La verifica statistica delle ipotesi vaglia il grado d’attendibilità che può essere loro attribuito; essa appura se le stesse possono ritenersi o no, compatibili con l’evidenza empirica rappresentata dalle osservazioni campionarie disponibili. Nella prova di ipotesi si distingue tra ipotesi nulla che generalmente rispecchia la situazione

acquisita prima dell’osservazione campionaria ed è indicata con H^ 0 e ipotesi alternativa che ne

attesta una diversa specificazione ed è indicata con H 1^.

La verifica di ipotesi, che comporta la sua accettazione o il suo rifiuto ad un prestabilito livello di probabilità è effettuata utilizzando una statistica test che implica una suddivisione dello spazio campionario in due regioni esclusive.  una regione di accettazione che indica l’insieme dei valori campionari che implicano l’accettazione dell’ipotesi nulla;  una regione di rifiuto o critica che indica l’insieme dei valori campionari che implicano il rifiuto dell’ipotesi nulla. La regola di decisione consiste nello stabilire se la differenza tra il valore stimato del parametro,specificato nell’ipotesi nulla e quello ottenuto dall’osservazione campionaria sia o meno significativa; stabilito quindi un livello di significatività α , rappresentante l’ampiezza della regione di rifiuto , si fissa il valore o i valori critici del test (che si desumono da apposite tavole) e si rifiuta l’ipotesi nulla se il valore sperimentale del test ricade nella regione di rifiuto. Essendo fondata su un risultato campionario, la regola deve presupporre di commettere degli errori che si distinguono in due tipologie:

 errore di primo tipo (o prima specie) quando rifiuto l’ipotesi nulla H^ 0 , ma essa è vera e

quindi non dovrebbe essere rifiutata: La probabilità che si verifichi errore di I Tipo si indica con α;

 errore di secondi tipo (o seconda specie) quando non si rifiuta l’ipotesi nulla H^ 0 , ma

essa è falsa e quindi andrebbe rifiutata. La probabilità che si verifichi un errore di II Tipo si indica con β. p- value: E’ il livello di significatività al quale l’ipotesi nulla può essere rifiutata, dato il valore della statistica campionaria osservata. Rifiuto cioè l’ipotesi nulla se il p-value è minore della probabilità

di commettere un errore di prima specie, ossia: rifiuto H^ 0 se p-value < α

E’ una probabilità osservata, diversa quindi per ogni valore della statistica campionaria ottenuta.

E’ la probabilità sotto H^ 0 di ottenere un valore campionario più lontano dall’ipotesi principale e più

vicino all’alternativa di quello ottenuto effettivamente nel campione 

X

Verifica di ipotesi sulla media di una popolazione distribuita normalmente: varianza della popolazione nota

In un campione di numerosità n e media X la statistica test da utilizzare è:

n

X

Z

_

Le ipotesi a confronto sono del tipo:

 H^ 0 : μ = ^ 0 contro H 1^ : μ >  0^ oppure

H 0 : μ ≤  0 contro H 1 : μ >  0 unilaterale a destra (test ad una coda)

la regola di decisone che riguarda la regione critica (coda di destra della distribuzione):

rifiuto H^ 0 se

n

X

_

≥ z^ ossia se X ≥ ^ 0 + z^

n

e se p-value < α

 H^ 0 : μ = ^ 0 contro H 1^ : μ <  0^ oppure

H 0 : μ ≥  0 contro H 1 : μ <  0 unilaterale a sinistra (test ad una coda)

la regola di decisone che riguarda la regione critica (coda di sinistra della distribuzione):

rifiuto H^ 0 se

n

X

_

≤ - z^ ossia se X ≤ ^ 0 - z^

n

e se p-value < α

 H^ 0 : μ = ^ 0 contro H 1^ : μ ≠ ^ 0 bilaterale (test a due code)

la regola di decisone che riguarda la regione critica (entrambe le code ):

rifiuto H^ 0 se

n

X

_

2

z  o

n

X

_

2

z  ossia se X ≥

n

z

2

0 ^ o^ X^ ≤^

n

z

2

e se p-value < α Es : Il tempo di vita medio di un campione di 100 lampadine fluorescenti prodotte da una fabbrica è calcolato nella misura di 1570 h, mentre lo scarto quadratico medio è di 120 h. Se μ è il tempo di vita medio di tutte le lampadine prodotte dalla fabbrica, provate l’ipotesi μ = 1600 h contro l’ipotesi alternativa μ ≠ 1600 h, usando un livello di significatività pari a^ a) 0,05, b) 0,01. Verificare tale ipotesi costruendo anche gli intervalli di confidenza con gli stessi livelli di significatività. Se il p- value è 0,024, rifiuto l’ipotesi ad un livello 0.05? E ad un livello 0,01? Dobbiamo decidere tra due ipotesi:

H 0 : μ = 1600 h

H 1 : μ ≠ 1600 h

Il test da utilizzare è a due code  per α = 0,05 →

= 0,025 (sulle tavole cerco il valore 1-0,025=0,975F(z) a cui corrisponde il valore z = 1,96)

rifiutiamo H^ 0 se il valore z della media campionaria standardizzata è al di fuori dagli estremi

- 1,96 e + 1 ,96;

accettiamo H^ 0 (o, meglio, non prendiamo alcuna decisione) in caso contrario.

Es.: In un piccolo mobilificio si deve decidere sull’opportunità d’introdurre un sistema di assemblamento automatico; lo si introduce solo se si riesce a risparmiare almeno 50 € ad operazione. Per valutare la convenienza del sistema si effettuano 64 operazioni ottenendo un risparmio medio di 48€ ad operazione. Sapendo che la varianza del processo di assemblamento è σ²=100 decidere se il risparmio medio è significativamente inferiore a 50€ ad un livello α=0,03. le ipotesi in questione da valutare sono:

H 0 : μ = 50 ; H 1 : μ < 50

per α = 0,03 (cerco sulle tavole il valore corrispondente a 1-0,03=0,97F(z) a cui corrisponde z = - 1,

Rifiuto H^ 0 se

n

X

Z

_

= - 1,6 → visto che - 1,6 > - 1,88, accetto H 0

Per cui, si può attribuire la differenza tra il valore medio teorico 50 e il valore osservato 48 a semplici fluttuazioni campionarie. Es.: Le resistenze alla rottura delle funi prodotte da una fabbrica hanno una media pari a 1800N ed uno scarto quadratico medio di 100 N. Immettendo una nuova tecnica nel processo produttivo, si pensa che la resistenza alla rottura possa essere accresciuta. Per provare ciò, si prende un campione di 50 funi e si trova che la resistenza media alla rottura è di 1850 N. Possiamo quindi pensare che ci sia stato un reale miglioramento, al livello di significatività dello 0,01? Le ipotesi a confronto sono:

H 0 : μ = 1800 N (non c’è in realtà alcun miglioramento nella resistenza alla rottura)

H 1 : μ > 1800 N ( e c’è un reale miglioramento nella resistenza alla rottura.)

rifiuto H^ 0 se

n

X

_

> z

Utilizziamo il test ad una coda, per α = 0,01 cerco sulle tavole il valore corrispondente a 1 - 0,01 = 0,99(F(z)) → 2,33 per cui:

= 3,55 che è quindi > di 2,33 per cui rifiuto H 0

per cui il risultato è altamente significativo :c’è un reale miglioramento nella resistenza dei cavi alla rottura

Verifica di ipotesi sulla media di una popolazione distribuita normalmente: varianza della popolazione non nota La statistica test da utilizzare è:

n

S

X

T^0

_

~ t(n-1) che al variare del campione si distribuisce, se l’ipotesi nulla è vera, come una v.c. t di Student con n-1 gradi di libertà Le ipotesi a confronto sono del tipo:

I. H^ 0 : μ = ^ 0 oppure H^ 0 : μ ≤ ^ 0 contro H^ 1 : μ >  0

rifiuto H^ 0 se

n

S

X 0

_

≥ tn  1 , 

II. H^ 0 : μ =  0^ oppure H^ 0 : μ ≥  0^ contro H^ 1 : μ <  0

rifiuto H^ 0 se

n

S

X 0

_

≤ - tn  1 , 

III. H^ 0 : μ = ^ 0 contro H 1^ : μ ≠ ^ 0 bilaterale (test a due code)

rifiuto H^ 0 se

n

S

X 0

_

2 n  1 ,

t

o se

n

S

X 0

_

2 n  1 ,

t

Es.: Nel passato una macchina ha prodotto rondelle aventi uno spessore di 0,050 pollici. Per determinare se la macchina sia ancora a punto, viene estratto un campione di 10 rondelle, il cui spessore medio è di 0,053 pollici ed il cui scarto quadratico medio è di 0,003 pollici. Provate l’ipotesi che la macchina sia a punto usando un livello di significatività a) dello 0,05 , b) dello 0,01. le ipotesi sono:

H 0 : μ = 0,050 la macchina è a punto

H 1 : μ ≠ 0,050 la macchina non è a punto

n = 10 S = 0,003 X = 0,053 μ = 0,

Così che bisogna ricorrere ad un test a due code.

Sotto l’ipotesi H^ 0 abbiamo:

n

S

X

T^0

_

rifiuto H^ 0 se T ≤ -

2 n  1 ,

t

o se T ≥ 2 n  1 ,

t

Verifica di ipotesi su una proporzione La statistica test da utilizzare è:

n

p p

P p

0 (^1 0 )

0 ^

Le ipotesi a confronto sono del tipo:

I. H^ 0 : p = p 0 oppure H^ 0 : p ≤ p 0 contro H^ 1 : p > p 0

rifiuto H^ 0 se

n

p p

P p

0 (^1 0 )

0 ^

> z

II. H^ 0 : p = p 0 oppure H^ 0 : p ≥ p 0 contro H^ 1 : p < p 0

rifiuto H^ 0 se

n

p p

P p

0 (^1 0 )

0 ^

< - z

III. H^ 0 : p = p 0 contro H^ 1 : p ≠ p 0

rifiuto H^ 0 se

n

p p

P p

0 (^1 0 )

0 ^

2

z  o se

n

p p

P p

0 (^1 0 )

0 ^

2

z 

Es.: Una catena di fast food ha sviluppato un metodo affinché la preparazione dei menu previsti per i clienti avvenga in maniera più corretta. Prima che tale metodo venisse introdotto, il processo di preparazione dei menu avveniva correttamente nell’85% dei casi. Da una rilevazione effettuata su 100 clienti è stato riscontrato che, con il nuovo metodo, 94 ordinazioni sono state preparate correttamente. Con un livello di significatività di 0,01 si può affermare che il nuovo metodo ha incrementato la proporzione di ordini preparati correttamente? Se il p-value è 0,0059, rifiuto l’ipotesi ad un livello 0.01? le ipotesi a confronto sono: H 0 : p ≤ 0,85 (ovvero la proporzione dei menu preparati correttamente usando il nuovo metodo risulta minore o uguale a 0,85) H 1 : p > 0,85 (ovvero la proporzione dei menu preparati correttamente usando il nuovo metodo risulta maggiore di 0,85)

rifiuto H^ 0 se

n

p p

P p

0 (^1 0 )

0 ^

> z

►a)Utilizziamo il test ad una coda, per α = 0,01 sulle tavole cerco il valore (1- 0,01)=0,99 F(z) → z = 2,

n

X

P 

^

= 0,94 ; p 0 = 0,85 (1-p 0 ) = 0,

= 2,52 che è > di 2,33 per cui rifiuto H^ 0 al livello di significatività dello 0,

►b) rifiuto H^ 0 se p-value < α → con p-value = 0,0059 che è < di 0,01 rifiuto H^ 0 ;

ovvero vi è sufficiente evidenza che il nuovo metodo abbia incrementato la proporzione dei menu corretti

Es.: Un tema d’esame è stato dato a due classi composte rispettivamente da 40 e 50 studenti. Il voto medio della prima classe è stato 74 e lo scarto quadratico medio 8. Nella seconda classe, il voto medio è stato 78 e lo scarto quadratico 7. C’è una differenza significativa tra le due classi al livello di significatività a) dello 0,05, b) dello 0,01? Sol:

classe X : n 1 = 40  1 = 74  1 = 8

classe Y : n 2 = 50  2 = 78  2 = 7

Ipotesi:

H 0 :  1 =  2 la differenza è puramente dovuta al caso

H 1.  1 ≠  2 c’è differenza significativa tra le due classi

Test a due code:

Rifiuto H^ 0 se Z >

2

z  o se Z <-

2

z 

usiamo gli scarti quadratici medi campionari come stime di  1 e di  2 ; quindi:

2 2

Z  = - 2,

► a) per α = 0,05 →

= 0,025 sulle tavole cerco il valore 1-0,025=0,975F(z) a cui corrisponde il

valore z = 1,96 che cade al di fuori degli estremi - 1,96 e+1,96: rifiuto H 0

Quindi concludiamo che, al livello dello 0,05, c’è una differenza significativa tra le due classi e che la seconda classe è probabilmente migliore. ►b) per α = 0,01 →

= 0,005 (sulle tavole cerco il valore 1-0,005=0,995F(z) a cui corrisponde il

valore z = 2,5 8 che è all’interno dell’intervallo di accettazione: accetto H 0

Quindi concludiamo che, al livello dello 0,01, la differenza tra le due classi non è significativa