









Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
appunti del capitolo 10 del corso di statistica: verifica di ipotesi su una singola popolazione
Tipologia: Appunti
1 / 15
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!










Nell’inferenza statistica l’oggetto di interesse è un parametro (= quantità definita su una certa popolazione). Per fare inferenza si utilizza un modello probabilistico che spesso consiste in una famiglia parametrica di variabili aleatorie: la distribuzione del carattere nella popolazione viene rappresentata da una variabile aleatoria X la cui distribuzione ha un parametro incognito di interesse primario θ, oltre ad eventuali altri parametri di disturbo: esempio se X~N(μ,σ^2) e l’interesse verte sulla media della popolazione, allora μ è il parametro di interesse primario, mentre σ2 è un parametro di disturbo. Quando si effettua una stima dei parametri, puntuale o per intervallo, l’informazione campionaria viene utilizzata per stimare un parametro incognito del modello scelto per X. Prima leggiamo i dati, poi facciamo un’affermazione sul parametro. Quando invece si effettua un test delle ipotesi sui parametri, l’informazione campionaria viene utilizzata per decidere se accettare o rifiutare una certa ipotesi concernente un parametro incognito del modello scelto per X. Prima facciamo un’affermazione sul parametro, poi leggiamo i dati per vedere se supportano l’affermazione.
Tutte le procedure inferenziali che consideriamo in questo corso (fra cui i test di ipotesi) fanno riferimento al paradigma dell’inferenza parametrica basata su campione casuale : Inferenza parametrica : f è una funzione (di massa o di densità di probabilità) nota a meno di un parametro θ (che può essere uno scalare, esempio nella Bernoulli θ =p, oppure un vettore, esempio , nella Normale θ =(μ,σ)). Campione casuale : gli elementi campionari sono variabili aleatorie indipendenti e identicamente distribuite come X.
Un’ ipotesi statistica parametrica è un’affermazione relativa ad un parametro (= quantità definita sulla popolazione di interesse) o, in modo equivalente, un’affermazione relativa ad un parametro che caratterizza la distribuzione della variabile aleatoria adottata come modello. Le ipotesi possono essere:
Ipotesi nulla L’ipotesi statistica oggetto di verifica è detta ipotesi nulla (o ipotesi di lavoro) ed è indicata con H0. Se X~Be(p) possibili ipotesi sono —> H0: p = 0.25 oppure H0:p ≤ 0.25 oppure H0:p ≥ 0.25. Se X~N(μ,σ2) possibili ipotesi sono —> H0:μ =360 oppure H0:μ ≤ 360 oppure H0:μ ≥ 360 (analogamente, si possono formulare ipotesi su σ2). Nell’ipotesi nulla non si può mettere il segno di disuguaglianza stretta: è possibile ≤ ma non < , è possibile ≥ ma non >, inoltre non si mette mai ≠. Ipotesi alternativa Dato il modello probabilistico per X, una volta definita l’ipotesi nulla H0 risulta automaticamente definita anche un’ ipotesi alternativa , indicata con H1, che usualmente è il complemento di H0 nello spazio parametrico in questione. Se X~Be(p) lo spazio parametrico (= insieme dei possibili valori del parametro p) è l’intervallo (0,1) per cui:
Si assume che le due ipotesi H0 e H1 siano esaustive (= una delle due è necessariamente vera) e mutuamente esclusive (= non possono essere vere contemporaneamente).
Un test di ipotesi è una regola attraverso la quale decidere se accettare o rifiutare l’ipotesi nulla H sulla base di un campione casuale (X1, ..., Xn). Concretamente, tale regola è attuata nel modo seguente. Indicato con S l’universo dei campioni (cioè l’insieme di tutti i possibili campioni (x1, ..., xn) di dimensione fissata n che si possono estrarre da X), un test delle ipotesi consiste nel suddividere l’insieme S in due sottoinsiemi disgiunti SA e SR in modo tale che: —> SA è detto regione di accettazione. —> SR è detto regione di rifiuto o regione critica. In sostanza, si tratta di stabilire a priori (cioè prima di osservare il campione) quali campioni portano ad accettare H0 e quali portano a rifiutare H0. Bipartizione dello spazio campionario Ad esempio se X~Be(p) e n=3; lo spazio dei campioni contiene 23=8 elementi. Per testare H0: p ≥0.5 vs H1: p <0.5, un possibile criterio di separazione è quello di assegnare a SR tutti i campioni con un numero di successi minore o uguale a 1. Il problema è: come tracciare la linea che separa SR da SA? Specificare un test di ipotesi significa specificare un criterio che consenta di assegnare ogni possibile campione ad una delle due categorie: SA : campioni che supportano H0 e quindi portano ad accettarla. SR : campioni che non supportano H0 e quindi portano a rifiutarla. Tipi di errore Stabilire un criterio per assegnare i campioni a SR o SA è un problema decisionale in condizioni di incertezza e quindi il criterio ottimale è quello che minimizza i rischi di errore. Poiché si contrastano due ipotesi, H0 e H1, si possono commettere due tipi di errore: I due tipi di errore sono concettualmente diversi ed hanno conseguenze diverse. Ad esempio , in un test di laboratorio per l’individuazione di un certo virus se si pone: H0 = {positivo (= soggetto malato)} H1 = {negativo (= soggetto sano)} si hanno i seguenti possibili errori:
Riassumendo: probabilità degli errori Probabilità errore I tipo (vero H0 ma si decide H1): α = P (rifiutare H0 | H0) Probabilità errore II tipo (vero H1 ma si decide H0): β = P (accettare H0 | H1) Potenza del test: la probabilità di rifiutare correttamente H0 cioè P(rifiutare H0 | H1) =1 – P(accettare H0 | H1) = 1–β
L’assegnazione dei campioni a SR e SA avviene per mezzo di una statistica test , cioè una variabile aleatoria T0 (funzione delle variabili campionarie) con le seguenti caratteristiche: T0 è funzione del campione e eventualmente anche del valore del parametro ipotizzato in H0. T0 ha distribuzione nota sotto H0 (cioè se si assume vera H0 allora la distribuzione di T0 non ha parametri incogniti). Statistica test: media campionaria Nell’esempio precedente la statistica test impiegata è la media campionaria:
La media campionaria è stata usata per assegnare i campioni a SR e SA nel seguente modo: Media campionaria standardizzata Nell’esempio precedente una statistica test equivalente (nel senso che alla fine porta alla stessa assegnazione dei campioni a SR e SA) è la media campionaria standardizzata basata sulla media della popolazione ipotizzata in H0: è funzione del campione e del valore del parametro in H0 (m = 10) sotto H0 ha distribuzione N(0,1), quindi senza parametri incogniti. La notazione (-H0) indica che Z0 ha distribuzione N(0,1) se H0 è vera, ma non se è falsa (questo fatto viene segnalato anche dallo 0 al pedice di Z). Approccio classico Alla luce del trade-off tra α e β l’approccio classico prevede di controllare l’errore di I tipo , fissando il livello α ad un valore piccolo, e facendo il possibile per contenere l’errore di II tipo, cioè minimizzando β. Si fissa la probabilità α ad un valore arbitrario piccolo (di solito 0.01 o 0.05). Tra tutte le regioni di rifiuto SR che portano al livello α desiderato, si sceglie quella ottimale, cioè quella a cui è associato il livello
β più piccolo (o, in modo equivalente, il livello 1−β più grande: da qui il nome di “ criterio della massima potenza ”). I passi per determinare la regione di rifiuto sono:
migliore.
la forma della regione di rifiuto viene suggerita dall’ipotesi alternativa H1.
Esempio - Test per H0:μ=10 vs H1:μ=7 (continua) La migliore statistica test è la media campionaria (questo fatto, che è intuitivo, è dimostrabile analiticamente). Poiché α =P(rifiutare H0 | H0), per determinare la regione di rifiuto si deve fare riferimento allo scenario H0 , cioè considerare la distribuzione della media campionaria sotto H0 , che nell’esempio (assumendo campioni di ampiezza n=10) è N(10, 6.4). La media ipotizzata sotto H1 (μ =7) è più piccola della media ipotizzata sotto H0 (μ =10) —> la migliore regione di rifiuto è costituita dai valori della media campionaria inferiori ad un certo valore critico (questo fatto, che è intuitivo, è dimostrabile analiticamente). Supponiamo di scegliere α = 0.05. Il calcolo del valore critico consiste nel determinare quel valore che lascia un’area 0.05 sulla coda sinistra della distribuzione N(10, 6.4). Sulla normale standard z0.05 = −1.65. Il valore critico è 10+2.53(−1.65) = 5.83. In generale (per un test unilaterale a sinistra), Scelto α. Il calcolo del valore critico consiste nel determinare quel valore che lascia un’area α sulla coda sinistra della distribuzione sotto H0 (con media μ0). Sulla normale standard il valore critico è zα. Il valore critico sulla distribuzione della media campionaria è («destandardizzando»): Nel caso il test sia unilaterale a destra, nella formula sopra metto il +. Esempio - Test per H0:μ=10 vs H1:μ=7 (continua) In termini di campioni: In questo modo, se H0 è vera, vi è una probabilità del 5% che estraendo un campione questo porti a rifiutarla; in altri termini, a priori vi è una probabilità del 5% di commettere un errore di I tipo. Per calcolare la probabilità di errore di II tipo, β, occorre considerare lo scenario alternativo H1, ovvero valutare quello che accade quando la media campionaria ha distribuzione N(7, 6.4).
Le due tipologie più comuni di H1 sono la unidirezionale (es. μ <10 oppure μ >10 ) e la bidirezionale (es. μ ≠10). Entrambe le tipologie sono ipotesi composte, ad es. H1: μ<10 significa che H1 include μ =9.99, μ =7.5, μ = –2.1 ecc. Quando H1 è composta non esiste un singolo valore β della probabilità di errore di II tipo: il valore di tale probabilità dipende dallo specifico punto in H1 che si considera (è tanto più basso quanto più il punto in esame è lontano da H0). Pertanto nel test H0: μ = 10 vs H1: μ < 10 il valore β dipende dallo specifico valore μ che si considera: è 0.68 per μ = 7, è 0.23 per μ = 4 ecc. Si può dunque calcolare il valore β per ogni μ < 10 (in termini matematici si scrive β (μ) perché β è una funzione di μ ).
La regione di rifiuto viene determinata usando la distribuzione della statistica test sotto H0. Negli esempi precedenti poiché H0 è puntuale (μ =10) la distribuzione è unica e quindi “sotto H0” implica l’u so della distribuzione con μ = 10. Cosa accade quando H0 è composta, ad es. in H0: μ ≥ 10 vs H1: μ < 10? In tal caso “sotto H0” fa riferimento ad una moltitudine di distribuzioni, tutte quelle con media maggiore o uguale a 10. H0 : μ ≥ 10 vs H1: μ < 10 —> H0 = sono tutte le distribuzioni con media maggiore o uguale a 10. Tuttavia per determinare la regione di rifiuto la distribuzione da considerare è ancora una volta quella con μ = 10 perché tale valore sta sulla frontiera: tra i valori in H0 è quello più vicino a H1 e quindi è il più sfavorevole perché è quello per il quale le distribuzioni della statistica test sono maggiormente sovrapposte e quindi è più difficile separare H0 da H1. Di conseguenza: portano alla stessa regione di rifiuto e quindi il test è identico.
θ = parametro oggetto di ipotesi. θ0 = valore del parametro alla frontiera tra H0 e H1. T0 = statistica test adottata, assumendo per semplicità che sia standardizzata, e quindi che abbia media nulla sotto H0. Tipicamente T0 è in relazione diretta con θ , nel senso che al crescere del valore di θ la statistica test T tende ad assumere valori più grandi, e viceversa. La forma della regione di rifiuto è suggerita dalla forma di H1.
L’approccio classico ai test di ipotesi prevede di controllare l’errore di I tipo, scegliendo il valore di α e prendendo il valore di β che ne consegue. Pertanto in H0 si dovrebbe mettere l’ipotesi il cui errato rifiuto è più dannoso, in modo da controllare tale rischio. Esempio Un amico prepara una cena a base di funghi che ha raccolto; essendo l’amico poco esperto, hai il dubbio che i funghi possano essere velenosi. Le ipotesi in gioco sono due, “funghi commestibili” e “funghi velenosi”: dovendo fare un test, quale mettere in H0? Risposta: si dovrebbe porre H0: “funghi velenosi”, perché è più grave decidere che sono commestibili quando in realtà sono velenosi piuttosto che decidere che sono velenosi quando in realtà sono commestibili. Nella ricerca scientifica H0 è l’ipotesi che si vuole falsificare, cioè l’ipotesi al momento più accreditata e che si vuole sottoporre a verifica empirica. Nelle valutazioni di efficacia H0 è l’ipotesi che il prodotto o la procedura in esame non siano efficaci: es. il farmaco non ha effetto, il fertilizzante non ha effetto, l’incentivo economico non ha effetto, il nuovo metodo di produzione non produce miglioramenti. Il principio è il seguente: fino a prova contraria il nuovo non è migliore del vecchio, ovvero, prima di rimpiazzare il vecchio con il nuovo occorre una sostanziale evidenza empirica. Nella scrittura delle ipotesi occorre scegliere tra due strutture:
Nel primo caso necessariamente si mette in H0 l’ipotesi puntuale —> H0:θ=θ(0) vs H1:θ≠θ(0) con questa specificazione si rilevano deviazioni da H0 in entrambe le direzioni. Ad es. H0 = {il risultato del nuovo metodo di produzione è identico al quello del vecchio}, con la specificazione bidirezionale H0 viene rifiutata sia che il nuovo metodo funzioni meglio sia che funzioni peggio. Quando l’alternativa H1 è bidirezionale il test si dice a due code. Nel caso di due ipotesi unidirezionali si hanno due opzioni A)H0:θ≤θ(0) vsH1:θ>θ(0) B)H0:θ≥θ(0) vsH1:θ<θ(0) in A e B le ipotesi sono scambiate salvo il fatto che il valore θ0 rimane sempre in H0 (in questo modo H0 contiene sempre il punto di frontiera θ0: ciò è necessario perché il valore critico viene determinato in modo da produrre il livello a desiderato in corrispondenza del punto più sfavorevole di H0, appunto θ0). La scelta tra le opzioni A e B va operata in modo che H0 rappresenti lo status quo, la situazione di inefficacia del nuovo etc (quindi dipende dal significato di θ ). Ad es. una struttura ricettiva vuole valutare se un certo servizio aggiuntivo aumenta la soddisfazione dei clienti; a tal fine θ = {proporzione di clienti soddisfatti con il servizio aggiuntivo}, θ0 = {proporzione di clienti soddisfatti senza il servizio aggiuntivo}. In questo caso si sceglie l’opzione A perché così H0 significa che il servizio aggiuntivo è inefficace (non aumenta la soddisfazione). Quando l’alternativa in H1 è unidirezionale il test si dice a una coda.
Consideriamo un carattere continuo con distribuzione Normale, X ~ N(μ,σ2), in cui la varianza è nota a priori, e supponiamo di disporre di un campione casuale di ampiezza n.
Decisione: poiché 1.5 < 1.65 il campione estratto non appartiene alla regione di rifiuto, quindi la decisione è di non rifiutare (accettare) H0. Questo significa che non vi è abbastanza evidenza empirica contro H0 e in favore di H1. In altri termini: alla luce della deviazione standard del carattere (15) e dell’ampiezza campionaria (25) una differenza di 4.5 tra media campionaria e media ipotizzata non è abbastanza grande per essere una prova convincente contro H0 (cioè se la vera media è 368 non è sorprendente osservare una media campionaria di 372.5). Consideriamo adesso il test a due code H0: μ = 368 vs H1: μ ≠ 368 al livello α=0. Si rifiuta su entrambe le code della N(0,1) per cui 0.05 va diviso a metà: il valore critico che lascia 0.025 sulla coda sinistra è −1.96 e il valore critico che lascia 0.025 sulla coda destra è +1.96 per cui la regione di rifiuto è (−∞, −1.96)∪(1.96, ∞). A questo punto si guardano i dati: tutto ciò che serve è la media campionaria. Supponiamo che nelle 25 scatole esaminate il peso medio sia pari a 372.5 grammi, per cui il valore campionario della statistica test Z0 è: Decisione: poiché −1.96 < 1.5 < 1.96 il campione estratto non appartiene alla regione di rifiuto, quindi la decisione è di non rifiutare (accettare) H0.
La statistica test Z0 è una misura standardizzata della distanza tra i dati campionari e l’ipotesi nulla: L’unità di misura è l’errore standard della media campionaria: una data differenza tra media campionaria e media ipotizzata è tanto più significativa (contro H0) quanto più piccolo è l’errore standard Supponiamo che nell’esempio precedente la media 372.5 sia stata osservata su un campione di ampiezza n= Si ha ancora una differenza di 4.5 tra media campionaria e media ipotizzata, ma tale differenza viene giudicata significativa, cioè porta al rifiuto di H0.
desiderato
P-value (o livello di significatività osservato): probabilità, calcolata sotto H0, di ottenere un valore della statistica test uguale a o più estremo di quello realmente osservato (detto valore campionario). “più estremo” significa “in direzione della regione di rifiuto”. Nell’esempio precedente il valore campionario della statistica test Z0 è 1.5 ma il significato di “più estremo” e quindi il p-value dipende dalla forma della regione di rifiuto, la quale dipende da H1: H1: μ > 368 —> si rifiuta sulla coda destra: il p-value è l’area a destra di 1.5 sulla N(0,1) e quindi 0.067. H1: μ < 368 —> si rifiuta sulla coda sinistra: il p-value è l’area a sinistra di 1.5 sulla N(0,1) e quindi 0.933. H1: μ ≠ 368 —> si rifiuta su entrambe le code: il p-value è l’area a destra di 1.5 + l’area a sinistra di −1.5 e quindi 0.134 (2 x 0.067=0.134). Il p-value è un indice di sintesi dell’ evidenza empirica contro H0 rispetto a H1 , nel senso che quanto più il p-value è piccolo tanto maggiore è l’evidenza empirica per rifiutare H0 in favore di H1. Ad esempio : p-value = 0.245 (valore grande) significa che, se H0 fosse vera, estraendo a caso un campione vi sarebbe una probabilità del 24.5% di osservare un valore della statistica test ugualmente o più estremo di quello effettivamente osservato nei dati. Il valore osservato nei dati non è anomalo e quindi è probabilisticamente compatibile con H0 ed i dati non parlano contro H0 e quindi H0 non può essere rifiutata. Ad esempio : p-value = 0.001 (valore piccolo) significa che, se H0 fosse vera, estraendo a caso un campione vi sarebbe una probabilità di 1 su 1000 di osservare un valore della statistica test ugualmente o più estremo di quello effettivamente osservato nei dati. Il valore osservato nei dati è decisamente anomalo e quindi è probabilisticamente incompatibile con H ed i dati parlano contro H0 e quindi H0 deve essere rifiutata. Quanto deve essere piccolo il p-value per rifiutare H0 in favore di H1? 1 su 10, 1 su 100, 1 su 1000 ...? Il livello di soglia è la probabilità di errore di I tipo : ad esempio se si adotta il criterio di rifiutare H quando il p-value è inferiore a 0.05 allora si ha una probabilità 0.05 di rifiutare H0 quando è vera (ricorda: il p-value è calcolato usando la distribuzione della statistica test sotto H0) —> test al livello α = 0.05. In generale, per effettuare un test di livello α arbitrario si procede nel seguente modo:
Esempio - p-value Nell’esempio relativo al peso dei cereali nelle scatole, il valore campionario della statistica test Z0 è 1. per cui secondo i p-value prima calcolati, nei vari sistemi di ipotesi, abbiamo: Se p-value < α Rifiuto Se p-value > α Νon rifiuto Se sono uguali...cambio α Approccio del p-value - vantaggi Un test di ipotesi di livello a può essere effettuato con due approcci alternativi ma equivalenti (= stessa decisione):
Ai fini del test per la media, passare dal caso di σ nota al caso di σ ignota comporta una sola modifica: la distribuzione della statistica test sotto H0 non è più Normale standard ma è tn−1. Con l’approccio del valore critico significa usare la tavola della t invece della tavola della Normale standard per determinare il valore critico. Con l’approccio del p-value non è spesso fattibile con la tavola della t (riporta solo pochi valori per ogni distribuzione t). Tale tavola non consente di determinare la probabilità a sinistra o a destra di un punto arbitrario; una soluzione approssimata è quella di usare la tavola della Normale standard (l’approssimazione è tanto migliore quanto più grande è n; altrimenti se si dispone di un computer si può fare il calcolo esatto con la t). Esempio Per controllare il processo produttivo di una falegnameria vengono esaminate 10 tavole, il cui spessore medio è di 6.05 mm con deviazione standard campionaria di 0.08 mm. Si assume che lo spessore abbia distribuzione Normale e che le 10 tavole siano un campione casuale. Supponiamo che lo spessore nominale delle tavole sia di 6.00 mm, per cui il responsabile del controllo di qualità vuole sottoporre a verifica: H0: μ = 6 vs H1: μ ≠ 6, fissando α = 0. La statistica test T0 ha distribuzione t9 se H0 è vera; poiché H1 è bidirezionale la regione di rifiuto sta sulle due code della t9 e i valori critici sono −2.2622 e 2.2622. Valore campionario della statistica test: Pertanto non si rifiuta H0: alla luce dei dati raccolti non si può affermare che il processo produttivo sia fuori controllo (nota: se si fosse usata erroneamente la tavola della Normale standard si sarebbe ottenuto il valore critico 1.96, rifiutando quindi H0).
Quando il carattere di interesse è dicotomico (X =1 presenza della caratteristica in oggetto, X = assenza della caratteristica in oggetto) la sua distribuzione è (necessariamente) di tipo Bernoulli e l’unico parametro è la probabilità o proporzione di successo p : X~Be(p). Uno stimatore corretto di p è il suo corrispondente nel campione, cioè la proporzione campionaria.
Esempio Una struttura ricettiva vuole valutare se un certo servizio aggiuntivo aumenta la soddisfazione dei clienti; a tal fine: p = {proporzione di clienti soddisfatti con il servizio aggiuntivo}, p0 = 0.60 = {proporzione di clienti soddisfatti senza il servizio aggiuntivo} Si formulano le ipotesi in modo che H0 indichi che il servizio aggiuntivo è inefficace (non aumenta la soddisfazione): H0:p≤0.60 vs H1:p>0.60. I dati a disposizione consistono in un campione casuale di 200 clienti che hanno ricevuto il servizio aggiuntivo, 130 dei quali si sono dichiarati soddisfatti. La proporzione campionaria è 0.65. Poiché 0.65 è maggiore di 0.60, nel campione osservato il servizio aggiuntivo aumenta la proporzione di soddisfatti. Problema: questa evidenza empirica è sufficiente per affermare che il servizio aggiuntivo aumenta la proporzione di soddisfatti nella popolazione, cioè nell’insieme di tutti i clienti? In altri termini: una proporzione di 0.65 su un campione di 200 unità è o non è probabilisticamente compatibile con una vera proporzione di 0.60? In caso di risposta affermativa si mantiene H0, altrimenti si rifiuta. Si può ò usare la statistica test Z(0)p che sotto H0 ha distribuzione approssimativamente Normale standardizzata. Per il test si sceglie un livello di significatività α = 0.01 (così si rende molto bassa, 1% appunto, la probabilità di dire che il servizio è efficace quando in realtà è inefficace). Il valore campionario della statistica test è: Approccio del valore critico: poiché H1 contiene il segno di > la regione di rifiuto sta a destra del valore critico, che è 2.33 (è il valore che sulla Normale standard lascia alla sua destra un’area pari a 0.01. La regola decisionale è di rifiutare H0 quando il valore campionario della statistica test è maggiore di 2.33. Poiché 1.44<2.33 non si rifiuta H0. Approccio del p-value: poiché H1 contiene il segno di > la regione di rifiuto sta sulla coda destra. Il p- value è la probabilità di ottenere, sulla Normale standard, un valore maggiore o uguale a quello osservato: poiché l’area a destra di 1.44 è 0.0749 si ha p- value= 0.0749. Poiché 0.0749>0.01 non si rifiuta H0. Conclusione: non si hanno prove sufficienti per affermare che il servizio aggiuntivo aumenta la proporzione di clienti soddisfatti.
Ogni test a due code ha un intervallo di confidenza (IC) equivalente Pertanto se si è già calcolato un IC per un parametro θ si può usare quell’intervallo per fare un test a due code su θ senza dover ripetere i calcoli Ad esempio, se X~N(μ, σ2), con σ2 nota, per sottoporre a test —> H0:μ=μ0 vs H1:μ≠μ al livello di significatività α : si rifiuta H0 quando il valore ipotizzato μ0 non è incluso nell’IC per μ al livello di confidenza 1−α. Esempio delle scatole di cereali: il peso medio campionario è 372.5. L’IC per μ al 95% è [366.62, 378.38], il valore 368 è incluso in tale IC e quindi il test H0: μ = 368 vs H1: μ ≠ 368 al 5% porta a non rifiutare H0.
Ricordiamo che: