Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Intervalli di confidenza: teoria ed esempi, Dispense di Statistica

Intervalli di confidenza - statistica. Dispense discorsive

Tipologia: Dispense

2020/2021

Caricato il 06/03/2023

franceeessccaaa
franceeessccaaa 🇮🇹

8 documenti

1 / 8

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
13. INTERVALLI DI CONFIDENZA
13.1 Generalità sugli intervalli di confidenza
Da un’indagine campionaria effettuata per conoscere il valore ignoto di un parametro
, il campione
osservato fornisce, tramite il calcolo del valore assunto da uno stimatore T, una stima t del parametro

Ovviamente il valore di questa stima dipende da quali unità sono state campionate ed è quindi solo uno
dei possibili valori che T può assumere.
Il valore t assunto dalla v.c. T sul campione osservato è chiamato stima puntuale di
ed è chiaro che,
anche se lo stimatore T ha proprietà ottimali, la probabilità di estrarre un campione che fornisca il valore
vero del parametro, ossia la probabilità P(T =
), diminuisce al crescere dei possibili valori di T ed è uguale
a zero se T è una variabile continua.
Conviene allora prendere in considerazione, anziché il singolo valore t dello stimatore T, un opportuno
intervallo di valori plausibili

Il metodo generale per costruire intervalli di confidenza consiste
nell'individuare una quantità, detta quantità pivotale, 𝜏(𝑋1,,𝑋𝑛,𝜃), funzione delle variabili casuali
campionarie e di 𝜃 e tale che la sua distribuzione di probabilità sia nota per ogni 𝜃 e non dipenda da nessuna
caratteristica incognita della distribuzione di probabilità delle v.c. campionarie.
Se la quantità pivotale 𝜏(𝑋1,,𝑋𝑛,𝜃) ammette funzione di densità, scelti , nell'intervallo (0,1) si
possono determinare gli opportuni quantili t1 e t2 di 𝜏(𝑋1,,𝑋𝑛,𝜃), affinché
P(𝜏(𝑋1,,𝑋𝑛,𝜃) t2) = e P(𝜏(𝑋1,,𝑋𝑛,𝜃) t1) = 
da cui
P(t1 𝜏(𝑋1,,𝑋𝑛,𝜃) t2) = 1-
con +. Inoltre, nel caso in cui, per ogni realizzazione campionaria 𝑥1,,𝑥𝑛, la quantità pivotale
è monotona in 𝜃, la disuguaglianza precedente è invertibile rispetto a 𝜃 ed è possibile ottenere l’intervallo
di confidenza per 𝜃.
In particolare, se la quantità pivotale è monotona crescente in 𝜃, si ottiene
P(𝜏−1(𝑋1,,𝑋𝑛,𝑡1)𝜃𝜏−1(𝑋1,…,𝑋𝑛,𝑡2)) = 1-
Quindi l’intervallo casuale [𝜏−1(𝑋1,,𝑋𝑛,𝑡1),𝜏−1(𝑋1,,𝑋𝑛,𝑡2)] contiene il parametro 𝜃 con probabilità
1-L'intervallo [𝜏−1(𝑥1,,𝑥𝑛,𝑡1),𝜏−1(𝑥1,,𝑥𝑛,𝑡2)] ottenuto sulla base del campione osservato
costituisce la realizzazione di un intervallo casuale
pf3
pf4
pf5
pf8

Anteprima parziale del testo

Scarica Intervalli di confidenza: teoria ed esempi e più Dispense in PDF di Statistica solo su Docsity!

13. INTERVALLI DI CONFIDENZA

13.1 Generalità sugli intervalli di confidenza

Da un’indagine campionaria effettuata per conoscere il valore ignoto di un parametro , il campione

osservato fornisce, tramite il calcolo del valore assunto da uno stimatore T , una stima t del parametro

Ovviamente il valore di questa stima dipende da quali unità sono state campionate ed è quindi solo uno

dei possibili valori che T può assumere.

Il valore t assunto dalla v.c. T sul campione osservato è chiamato stima puntuale di  ed è chiaro che,

anche se lo stimatore T ha proprietà ottimali, la probabilità di estrarre un campione che fornisca il valore

vero del parametro, ossia la probabilità P( T = ), diminuisce al crescere dei possibili valori di T ed è uguale

a zero se T è una variabile continua. Conviene allora prendere in considerazione, anziché il singolo valore t dello stimatore T , un opportuno

intervallo di valori plausibili Il metodo generale per costruire intervalli di confidenza consiste

nell'individuare una quantità, detta quantità pivotale, 𝜏(𝑋 1 , … , 𝑋𝑛, 𝜃), funzione delle variabili casuali campionarie e di 𝜃 e tale che la sua distribuzione di probabilità sia nota per ogni 𝜃 e non dipenda da nessuna caratteristica incognita della distribuzione di probabilità delle v.c. campionarie. Se la quantità pivotale 𝜏(𝑋 1 , … , 𝑋𝑛, 𝜃) ammette funzione di densità, scelti , nell'intervallo (0,1) si possono determinare gli opportuni quantili t 1 e t 2 di 𝜏(𝑋 1 , … , 𝑋𝑛, 𝜃), affinché P(𝜏(𝑋 1 , … , 𝑋𝑛, 𝜃) ≥ t 2 ) =  e P(𝜏(𝑋 1 , … , 𝑋𝑛, 𝜃) ≤ t 1 ) =  da cui P( t 1 ≤ 𝜏(𝑋 1 , … , 𝑋𝑛, 𝜃) ≤ t 2 ) = 1- con +. Inoltre, nel caso in cui, per ogni realizzazione campionaria 𝑥 1 , … , 𝑥𝑛, la quantità pivotale è monotona in 𝜃, la disuguaglianza precedente è invertibile rispetto a 𝜃 ed è possibile ottenere l’intervallo di confidenza per 𝜃. In particolare, se la quantità pivotale è monotona crescente in 𝜃, si ottiene P(𝜏−^1 (𝑋 1 , … , 𝑋𝑛, 𝑡 1 ) ≤ 𝜃 ≤ 𝜏−^1 (𝑋 1 , … , 𝑋𝑛, 𝑡 2 )) = 1- Quindi l’intervallo casuale [𝜏−1(𝑋 1 , … , 𝑋𝑛, 𝑡 1 ), 𝜏−1(𝑋 1 , … , 𝑋𝑛, 𝑡 2 )] contiene il parametro 𝜃 con probabilità 1-L'intervallo [𝜏−1(𝑥 1 , … , 𝑥𝑛, 𝑡 1 ), 𝜏−1(𝑥 1 , … , 𝑥𝑛, 𝑡 2 )] ottenuto sulla base del campione osservato costituisce la realizzazione di un intervallo casuale

L’intervallo [𝜏−^1 (𝑥 1 , … , 𝑥𝑛, 𝑡 1 ), 𝜏−^1 (𝑥 1 , … , 𝑥𝑛, 𝑡 2 )] costituisce una stima intervallare di , di solito

indicata con la locuzione intervallo di confidenza di  al livello 1 - 

È sbagliato dire che l’intervallo [𝜏−1(𝑥 1 , … , 𝑥𝑛, 𝑡 1 ), 𝜏−1(𝑥 1 , … , 𝑥𝑛, 𝑡 2 )] contiene il parametro  con

probabilità 1 : una volta che l’intervallo è stato costruito sulla base del campione osservato,  è contenuto

nell’intervallo oppure non vi è contenuto (non conoscendo non è possibile saperlo). Si può però affermare

che 1  è la probabilità che si ottenga un intervallo che contiene il parametro. Lo scopo dell’indagine

campionaria consiste nel costruire un intervallo [𝜏−1(𝑋 1 , … , 𝑋𝑛, 𝑡 1 ), 𝜏−1(𝑋 1 , … , 𝑋𝑛, 𝑡 2 )] che contenga il

valore vero del parametro con un livello di probabilità sufficientemente elevato, detto anche livello di

confidenza o livello di copertura. Questo livello viene usualmente indicato con la notazione 1  e i valori

più comunemente utilizzati sono 0.90, 0.95 e 0.99. Le quantità pivotali che saranno introdotte nei prossimi paragrafi saranno monotone crescenti. Per questo motivo, non sarà approfondito il caso in cui la quantità pivotale è monotona decrescente in 𝜃. Comunque, in questo caso, valgono considerazioni analoghe a quelle fatte per quantità pivotale monotona crescente e l’intervallo è [𝜏−1(𝑋 1 , … , 𝑋𝑛, 𝑡 2 ), 𝜏−1(𝑋 1 , … , 𝑋𝑛, 𝑡 1 )], ovvero P(𝜏−^1 (𝑋 1 , … , 𝑋𝑛, 𝑡 2 ) ≤ 𝜃 ≤ 𝜏−^1 (𝑋 1 , … , 𝑋𝑛, 𝑡 1 )) = 1-

In teoria si possono costruire infiniti intervalli di confidenza per un prefissato livello di probabilità 1 , a

seconda di come sono scelti  e  in modo che la loro somma sia , ma è evidente che l’intervallo più

conveniente è quello di minore ampiezza. Si può dimostrare che se 𝜏(𝑋 1 , … , 𝑋𝑛, 𝜃) ha una distribuzione

simmetrica intorno all’origine, l’intervallo di minore ampiezza è quello costruito scegliendo =  = /2.

In questo caso i quantili t 1 e t 2 sono tali che t 1 = t 2.

13.2 Intervallo di confidenza di 

Per mostrare dettagliatamente l’applicazione del metodo della quantità pivotale, inizialmente si supponga che un campione casuale di numerosità n sia estratto da una popolazione normale di varianza nota. È noto

che per ottenere una stima del parametro  si utilizza lo stimatore media campionaria X , che in questo

caso ha distribuzione di probabilità  

N μ n

2

,^ . Considerando la v.c. standardizzata, risulta

σ n ZXμ ~ N ^0 ,^1  13.1.

Nella figura 13.1.1 solo quattro intervalli contengono il valore vero del parametro ignoto, mentre uno di

essi ha l'estremo destro inferiore a .

Figura 13.1.

Rappresentazione grafica di alcuni intervalli di confidenza di 

Una volta estratto il campione ed ottenuto il valore x di X , l'intervallo di confidenza di  è delimitato

dagli estremi

 x  z 1  α/ 2 σ/ n, x  z 1  α/ 2 σ/ n  13.1.

Esempio Da una popolazione con distribuzione normale di parametro  ignoto e di varianza ^2 = 4 è stato estratto un campione di 16 elementi la cui media aritmetica è risultata uguale a 5. L'intervallo di confidenza di  al livello di probabilità del 95% si costruisce tenendo presente che z 0.975=1.96 e risulta uguale a [4.02, 5.98].

L’intervallo di confidenza costruito sulla base del campione osservato è la realizzazione di un intervallo

casuale che contiene il parametro con probabilità Sembrerebbe preferibile scegliere 1- più grande

possibile ma all’aumentare di  aumenta l’ampiezza dell’intervallo di confidenza risultando meno

informativo. Se non si fosse disposti ad accettare la possibilità di commettere errori, infatti, si potrebbe solo

affermare con certezza che il parametro  di una popolazione normale è compresa tra  e +, ma questa

conclusione sarebbe del tutto inutile. D’altra parte, se si riduce l'ampiezza dell'intervallo, si riduce la probabilità che l’intervallo casuale contenga il parametro e quindi la probabilità che il procedimento fornisca un intervallo di valori che contenga il parametro.

In generale, dalla 13.1.4 si nota che l’ampiezza di un intervallo di confidenza di  per una popolazione di

varianza nota aumenta al crescere del livello di probabilità 1 e del valore di ^2 mentre diminuisce

all’aumentare del numero di unità statistiche rilevate.

È stato determinato l'intervallo di confidenza di  sotto la condizione che sia nota la varianza della

popolazione, ma nelle situazioni reali questo parametro è generalmente ignoto, per cui la funzione 13.1.

non è una quantità pivotale. La varianza ^2 può essere però stimata in modo corretto e coerente mediante

lo stimatore (^) S c^2 per cui, al posto della 13.1.1, si può utilizzare la seguente funzione delle variabili casuali

campionarie e del parametro 

S n

X μ c

 ~ tn -1 13.2.

che è una quantità pivotale. Infatti, si osservi che

S n

X μ c

𝑋̅−𝜇𝜎 √𝑛 √(𝑛−1) S c^2 (𝑛−1)^ 𝜎^2

si distribuisce come una t di Student con n 1 gradi di libertà, poiché la v.c. ( n -1) S c^2 / ^2 ha una distribuzione

𝜒𝑛−1^2 ed è indipendente dalla v.c. X. Seguendo lo stesso procedimento utilizzato in precedenza, dato che

anche la t è simmetrica rispetto allo 0, si ottiene l’intervallo di confidenza di , i cui estremi dipendono dai

quantili della tn  1 di ordine /2 e di ordine 1/2 anziché dai quantili di ordine /2 e di ordine 1/2 della

normale standard. Quindi

[𝑥̅ − 𝑡𝑛−1,1−𝛼 2 √𝑛^ 𝑠𝑐 , 𝑥̅ + 𝑡𝑛−1,1−𝛼/2 √𝑛𝑠𝑐] 13.2.

è l’intervallo di confidenza per assumendo che la variabile di interesse, e quindi le v.c. campionarie,

abbia distribuzione normale con varianza non nota.

Esempio 13.2. Si costruisca l’intervallo di confidenza di  al livello di probabilità del 95% sulla base di un campione di numerosità 10 su cui sono state ottenuti 𝑥̅ =10.8 e 𝑠𝑐^2 = 4.01̅ Dato che t 9,0.975 = 2.262, l’intervallo di confidenza è dato da



 

 10.80 2.262 4.0 101 ,10.802.262 4.0 101

In questo caso l’intervallo così determinato contiene il valore vero della media della popolazione che è uguale a 10.

   (^)  

13.3 Intervallo di confidenza di 

Assumendo che la variabile di interesse abbia distribuzione di Bernoulli di paramentro l’intervallo di

confidenza di  si basa sulla distribuzione dello stimatore media campionaria, chiamata anche proporzione

campionaria e indicata con P ˆ. Il teorema limite centrale consente di approssimare la distribuzione di P ˆ

con una distribuzione normale di valore atteso  e di varianza pari a π^ ^1 n ^ π .

La funzione di e delle variabili casuali campionarie

  n

π π

P π

non è tuttavia una quantità pivotale, in quanto dipende dalla varianza della proporzione campionaria, che a

sua volta dipende dalla varianza della variabile casuale di Bernoulli che coincide con π  1  π . Per stimare

la varianza si considera la varianza campionaria, che nel caso di variabili casuali campionarie con distribuzione di Bernoulli poiché X (^) i^2  Xi risulta

𝑆^2 =^1 𝑛 ∑(𝑋𝑖 − 𝑃̂)^2 =

𝑛

𝑖=

2 − 𝑃̂ 2 =^1

𝑛 ∑ 𝑋𝑖^ − 𝑃̂

𝑛

𝑖=

𝑛

𝑖=

Sostituendo al denominatore la varianza campionaria al posto della varianza, si ottiene la seguente quantità pivotale

  n

P P

P π ˆ 1 ˆ

che al crescere della numerosità campionaria tende a una distribuzione normale standard. In analogia a quanto visto in precedenza risulta

 ^ ^ ^  ^  ^ ^  

 

 (^)  P P ˆ^  z 1  / 2 P ˆ^1 nP ˆ   P ˆ z 1  / 2 P ˆ^1 nP^ ˆ 1 13.3.

per cui l’intervallo di confidenza di  al livello di copertura approssimato 1  è il seguente

    

  n p z p p n p ˆ^ z p ˆ^1 p^ ˆ , ˆ ˆ^1 ˆ 1 / 2 1 / 2

Esempio In occasione di un referendum abrogativo viene effettuato un sondaggio preliminare su un campione di 1000 individui. Sapendo che su 1000 intervistati 650 sono favorevoli all’abrogazione della legge, la proporzione campionaria di

persone favorevoli all’abrogazione è ˆ p  0. 65 e l’intervallo di confidenza per ad un livello di confidenza del 99%

è delimitato dagli estremi



 

 (^)     1000 , 0. 65 2. 576 0.^650.^35 1000

  1. 65 2. 576 0.^650.^35.

L’intervallo di confidenza al livello approssimato del 99% è quindi [0.6111, 0.6889]. Si osservi che rappresenta la probabilità che unindividuo scelto casualmente si dichiari favorevole all’abrogazione.