Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Test di verifica d'ipotesi nella statistica inferenziale, Dispense di Statistica Medica

Il processo di verifica d'ipotesi statistica, utilizzando come esempio un test di verifica per determinare se uno studente risponde a caso o è preparato in un esame a risposta multipla. Il documento illustra la logica del test, la formulazione delle ipotesi, la distribuzione campionaria di X, la zona di rifiuto e di accettazione, il livello di significatività, il p-value e gli errori di I e II tipo.

Tipologia: Dispense

2019/2020

Caricato il 24/03/2020

mourinho98
mourinho98 🇮🇹

6 documenti

1 / 23

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
VERIFICA DI IPOTESI
STATISTICA INFERENZA
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17

Anteprima parziale del testo

Scarica Test di verifica d'ipotesi nella statistica inferenziale e più Dispense in PDF di Statistica Medica solo su Docsity!

VERIFICA DI IPOTESI

STATISTICA – INFERENZA

Sperimentazione dell’orario flessibile per ridurre l’assenteismo: in un

campione di dipendenti il numero medio di giorni di assenza è di 5,5 contro

6,3 in passato  la sperimentazione ha effetti positivi?

Standard di produzione = confezioni di 200 g: in un campione il peso medio

è 207,75 g  il processo è fuori controllo?

Obiettivo di mercato = 10%: quota stimata in un campione di consumatori =

9,3%  l’obiettivo è stato mancato?

Parametro ignoto dell’universo ( , )

Informazioni campionarie  l’obiettivo non è una stima numerica del

parametro ma la verifica di una congettura su di esso (ad es. se è variato

rispetto al passato)  test

Verifica d’ipotesi

PROVA DA EFFETTUARE

 quali valori di X (numero di risposte esatte) conducono a ritenere che lo studente sia effettivamente preparato? Distribuzione campionaria di X Se X ~ B(10, 0,25) (risposte a caso):

 E(X) = 2,5: in media ci possiamo aspettare 2 o 3 risposte esatte per il solo effetto del caso

 Riteniamo lo studente preparato se X è “sufficientemente maggiore” di 2,5 (ad es: X  6) : o si è verificato un evento raro (lo studente, pur impreparato, è molto fortunato), o lo studente è effettivamente preparato

 Cosa si intende per "sufficientemente maggiore" di 2,5? Probabilità di errore nota dalla distribuzione campionaria di X: nell’esempio P(X  6) = 1,98%

FORMALIZZAZIONE DI UN TEST STATISTICO

  = parametro ignoto dell’universo (ad es.: ,  )

 T = indice campionario (ad es: , P)  statistica test

 Prima dell’ estrazione: T è una variabile aleatoria

 H 0 = ipotesi nulla ipotesi da sottoporre a verifica

H 0 :  =  0

  0 = valore fissato a priori in base al problema (non dipende dai dati)

 Esempio: ipotesi nulla = lo studente risponde a caso H 0 :  = 0,

X

Distribuzione campionaria di T  suddivisa in 2 zone:  zona di rifiuto di H 0 ( "regione critica" ) = insieme di valori di T a cui è associata una piccola probabilità di verificarsi se H 0 è vera;  zona di accettazione di H 0 = comprende i restanti valori di T. Esempio: T = X =n. di risposte esatte

0.

0.

0.

0.

0.

0.

0.

0 1 2 3 4 5 6 7 8 9 10 X = numero di risposte esatte

P(X = s)

Zona di rifiuto:

X  6

In pratica si osserva lo specifico valore T = t

Se:

 t cade nella zona di rifiuto  si ritiene H 0 falsa (e H 1 vera)

 t cade nella zona di accettazione  non si può ritenere H 0 falsa ( accetto H 0 )

Esempio:

 Almeno 6 risposte esatte  si ritiene lo studente preparato

 (rifiuto H 0 : lo studente risponde a caso

cioè rifiuto H 0 :  = 0,25)

 Meno di 6 risposte esatte  non si può ritenere lo studente preparato

(accetto H 0 )

Obiettivo del test: attraverso un campione di osservazioni stabilire, con un certo

grado di attendibilità, se poter rifiutare o meno l’ipotesi nulla a favore

dell’ipotesi alternativa.

RIASSUMENDO:

Ipotesi statistica : una congettura riguardante un parametro della popolazione.

Si distinguono due ipotesi contrapposte:

  • ipotesi nulla, indicata con H 0
  • ipotesi alternativa, indicata con H 1

L’ipotesi nulla è pre-esistente all’osservazione dei dati campionari, ritenuta vera

fino a prova contraria.

Esempio:

Secondo il costruttore di un certo tipo di batterie per autovetture, la durata media è di 3400 ore. Un cliente, per verificarne la durata, osserva un campione di 30 batterie:

H 0 : le batterie hanno durata media di almeno 3400 ore H 1 : le batterie hanno durata media inferiore a 3400 ore

è lo spazio parametrico, ossia l’insieme di tutti i possibili valori che può assumere e sono i sottospazi che formano una partizione dello spazio parametrico. Indichiamo le due ipotesi con il seguente sistema:

   0  1

Formulazione delle ipotesi

1 1

0 0 

H :

H :

1

0 

H :

H :

Un test statistico è una regola che permette di discriminare i campioni che

portano all’accettazione dell’ipotesi nulla da quelli che portano al suo rifiuto.

Il test si basa sul valore assunto da una statistica test.

La statistica test è una statistica campionaria la cui distribuzione deve essere

completamente nota sotto l’ipotesi nulla.

L’insieme dei valori della statistica test che portano all’accettazione dell’ipotesi

nulla è chiamata regione di accettazione.

L’insieme dei valori della statistica test che portano al rifiuto dell’ipotesi nulla è

chiamata regione di rifiuto.

REGIONE DI ACCETTAZIONE E DI RIFIUTO

I DUE POSSIBILI ERRORI IN UN TEST

Realtà

Conclusioni

Accetto H 0 Rifiuto H 0

H 0 è vera Decisione corretta prima specieErrore di

H 0 è falsa seconda specieErrore di Decisione corretta

Esempio: Supponiamo che la popolazione sia Normale con media incognita e varianza nota. Si vuole verificare:

Considerando come statistica test la media campionaria sappiamo che sotto l’ipotesi nulla questa si distribuisce come una Normale con media e varianza

1 0

0 0

H :

H :

^2

X

   0

^2 n

Dalla figura si può vedere che i valori critici definiscono la zona di accettazione e che dipendono dal livello di significatività  : maggiore è il suo valore, più ampia sarà la regione di rifiuto

P-VALUE (APPROCCIO INVERSO)

 Livello di significatività osservato ( P - value) = probabilità che la v.a. T assuma valori più estremi di quello osservato nel campione ( t ) quando H 0 è vera.

t

Area sottesa = P ( T  t )

  • E’ una quantità che misura l’evidenza fornita dai dati contro l’ipotesi nulla: minore è il valore del p-value, più è forte l’evidenza contro l’ipotesi nulla.
  • In pratica: se il p-value è <  rifiuto H 0

H 1 unilaterale destra: P-value = P {T  t, dato  =  0 }

errore del I tipo: si rifiuta l’ipotesi nulla mentre questa è vera.

errore del II tipo: si accetta l’ipotesi nulla mentre questa è falsa

ERRORI DI I E II TIPO

Decisione Accetto H 0 Rifiuto H 0 H 0 è vera Corretta 1 - 

Errore del I tipo  H 0 è falsa Errore del II tipo 

Corretta 1 - 

  •  è la probabilità di commettere l’errore del I tipo. E’ detto livello del test.
  • 1 -  è detto coefficiente di confidenza del test.
  •  è la probabilità di commettere l’errore del II tipo.
  • 1 -  viene detto potenza del test e corrisponde alla probabilità di rifiutare l’ipotesi nulla quando questa è falsa.