Intervalli di confidenza: teoria ed esempi | Dispense di Statistica

13. INTERVALLI DI CONFIDENZA

13.1 Generalità sugli intervalli di confidenza

Da un’indagine campionaria effettuata per conoscere il valore ignoto di un parametro



, il campione

osservato fornisce, tramite il calcolo del valore assunto da uno stimatore T, una stima t del parametro



Ovviamente il valore di questa stima dipende da quali unità sono state campionate ed è quindi solo uno

dei possibili valori che T può assumere.

Il valore t assunto dalla v.c. T sul campione osservato è chiamato stima puntuale di



ed è chiaro che,

anche se lo stimatore T ha proprietà ottimali, la probabilità di estrarre un campione che fornisca il valore

vero del parametro, ossia la probabilità P(T =



), diminuisce al crescere dei possibili valori di T ed è uguale

a zero se T è una variabile continua.

Conviene allora prendere in considerazione, anziché il singolo valore t dello stimatore T, un opportuno

intervallo di valori plausibili



Il metodo generale per costruire intervalli di confidenza consiste

nell'individuare una quantità, detta quantità pivotale, 𝜏(𝑋1,…,𝑋𝑛,𝜃), funzione delle variabili casuali

campionarie e di 𝜃 e tale che la sua distribuzione di probabilità sia nota per ogni 𝜃 e non dipenda da nessuna

caratteristica incognita della distribuzione di probabilità delle v.c. campionarie.

Se la quantità pivotale 𝜏(𝑋1,…,𝑋𝑛,𝜃) ammette funzione di densità, scelti , nell'intervallo (0,1) si

possono determinare gli opportuni quantili t1 e t2 di 𝜏(𝑋1,…,𝑋𝑛,𝜃), affinché

P(𝜏(𝑋1,…,𝑋𝑛,𝜃)≥ t2) =  e P(𝜏(𝑋1,…,𝑋𝑛,𝜃)≤ t1) = 

da cui

P(t1 ≤𝜏(𝑋1,…,𝑋𝑛,𝜃)≤ t2) = 1-

con +. Inoltre, nel caso in cui, per ogni realizzazione campionaria 𝑥1,…,𝑥𝑛, la quantità pivotale

è monotona in 𝜃, la disuguaglianza precedente è invertibile rispetto a 𝜃 ed è possibile ottenere l’intervallo

di confidenza per 𝜃.

In particolare, se la quantità pivotale è monotona crescente in 𝜃, si ottiene

P(𝜏−1(𝑋1,…,𝑋𝑛,𝑡1)≤𝜃≤𝜏−1(𝑋1,…,𝑋𝑛,𝑡2)) = 1-

Quindi l’intervallo casuale [𝜏−1(𝑋1,…,𝑋𝑛,𝑡1),𝜏−1(𝑋1,…,𝑋𝑛,𝑡2)] contiene il parametro 𝜃 con probabilità

1-L'intervallo [𝜏−1(𝑥1,…,𝑥𝑛,𝑡1),𝜏−1(𝑥1,…,𝑥𝑛,𝑡2)] ottenuto sulla base del campione osservato

costituisce la realizzazione di un intervallo casuale

Intervalli di confidenza: teoria ed esempi, Dispense di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Intervalli di confidenza: teoria ed esempi e più Dispense in PDF di Statistica solo su Docsity!

13. INTERVALLI DI CONFIDENZA

Da un’indagine campionaria effettuata per conoscere il valore ignoto di un parametro , il campione

Ovviamente il valore di questa stima dipende da quali unità sono state campionate ed è quindi solo uno

Il valore t assunto dalla v.c. T sul campione osservato è chiamato stima puntuale di  ed è chiaro che,

vero del parametro, ossia la probabilità P( T = ), diminuisce al crescere dei possibili valori di T ed è uguale

intervallo di valori plausibili Il metodo generale per costruire intervalli di confidenza consiste

L’intervallo [𝜏−^1 (𝑥 1 , … , 𝑥𝑛, 𝑡 1 ), 𝜏−^1 (𝑥 1 , … , 𝑥𝑛, 𝑡 2 )] costituisce una stima intervallare di , di solito

indicata con la locuzione intervallo di confidenza di  al livello 1 - 

È sbagliato dire che l’intervallo [𝜏−1(𝑥 1 , … , 𝑥𝑛, 𝑡 1 ), 𝜏−1(𝑥 1 , … , 𝑥𝑛, 𝑡 2 )] contiene il parametro  con

probabilità 1 : una volta che l’intervallo è stato costruito sulla base del campione osservato,  è contenuto

nell’intervallo oppure non vi è contenuto (non conoscendo non è possibile saperlo). Si può però affermare

che 1  è la probabilità che si ottenga un intervallo che contiene il parametro. Lo scopo dell’indagine

valore vero del parametro con un livello di probabilità sufficientemente elevato, detto anche livello di

confidenza o livello di copertura. Questo livello viene usualmente indicato con la notazione 1  e i valori

In teoria si possono costruire infiniti intervalli di confidenza per un prefissato livello di probabilità 1 , a

seconda di come sono scelti  e  in modo che la loro somma sia , ma è evidente che l’intervallo più

simmetrica intorno all’origine, l’intervallo di minore ampiezza è quello costruito scegliendo =  = /2.

13.2 Intervallo di confidenza di 

che per ottenere una stima del parametro  si utilizza lo stimatore media campionaria X , che in questo

,^ . Considerando la v.c. standardizzata, risulta

essi ha l'estremo destro inferiore a .

Rappresentazione grafica di alcuni intervalli di confidenza di 

Una volta estratto il campione ed ottenuto il valore x di X , l'intervallo di confidenza di  è delimitato

 x  z 1  α/ 2 σ/ n, x  z 1  α/ 2 σ/ n  13.1.

casuale che contiene il parametro con probabilità Sembrerebbe preferibile scegliere 1- più grande

possibile ma all’aumentare di  aumenta l’ampiezza dell’intervallo di confidenza risultando meno

affermare con certezza che il parametro  di una popolazione normale è compresa tra  e +, ma questa

In generale, dalla 13.1.4 si nota che l’ampiezza di un intervallo di confidenza di  per una popolazione di

varianza nota aumenta al crescere del livello di probabilità 1 e del valore di ^2 mentre diminuisce

È stato determinato l'intervallo di confidenza di  sotto la condizione che sia nota la varianza della

non è una quantità pivotale. La varianza ^2 può essere però stimata in modo corretto e coerente mediante

campionarie e del parametro 

si distribuisce come una t di Student con n 1 gradi di libertà, poiché la v.c. ( n -1) S c^2 / ^2 ha una distribuzione

𝜒𝑛−1^2 ed è indipendente dalla v.c. X. Seguendo lo stesso procedimento utilizzato in precedenza, dato che

anche la t è simmetrica rispetto allo 0, si ottiene l’intervallo di confidenza di , i cui estremi dipendono dai

quantili della tn  1 di ordine /2 e di ordine 1/2 anziché dai quantili di ordine /2 e di ordine 1/2 della

è l’intervallo di confidenza per assumendo che la variabile di interesse, e quindi le v.c. campionarie,

13.3 Intervallo di confidenza di 

Assumendo che la variabile di interesse abbia distribuzione di Bernoulli di paramentro l’intervallo di

confidenza di  si basa sulla distribuzione dello stimatore media campionaria, chiamata anche proporzione

campionaria e indicata con P ˆ. Il teorema limite centrale consente di approssimare la distribuzione di P ˆ

con una distribuzione normale di valore atteso  e di varianza pari a π^ ^1 n ^ π .

La funzione di e delle variabili casuali campionarie

sua volta dipende dalla varianza della variabile casuale di Bernoulli che coincide con π  1  π . Per stimare

2 − 𝑃̂ 2 =^1

𝑛 ∑ 𝑋𝑖^ − 𝑃̂

P P

per cui l’intervallo di confidenza di  al livello di copertura approssimato 1  è il seguente

persone favorevoli all’abrogazione è ˆ p  0. 65 e l’intervallo di confidenza per ad un livello di confidenza del 99%