Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Stimatori e stime per intervalli: stime non distorte e intervalli di confidenza, Dispense di Statistica

Questa lezione tratta del rapporto tra stima di parametri e valore parametro di popolazione di riferimento, passando poi alla redazione di esempi per la trasformazione operativa di quanto presentato. Si introdurranno concetti come stima puntuale, stimatore, stima efficiente e intervalli di confidenza. Verranno inoltre presentati i calcoli per determinare l'errore quadratico medio e la stima efficiente di una variabile casuale utilizzata per stimare una determinata caratteristica di una popolazione.

Tipologia: Dispense

2019/2020

Caricato il 23/10/2020

cerenzia
cerenzia 🇮🇹

4

(1)

24 documenti

1 / 8

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Lezione 18
Stimatori e stima per intervalli
Un volta presentati i principali modelli teorici delle v.c. discrete e
continue e gli elementi di teoria dei campioni, in questa lezione trattiamo
brevemente del rapporto esistente fra la stima di alcuni parametri ed il
valore del parametro della popolazione di riferimento, per poi passare alla
redazione degli esempi finalizzati alla trasformazione operativa di quanto
presentato.
Nella lezione nella quale abbiamo presentato i metodi di
campionamento, abbiamo fatto indiretto riferimento alla cosiddetta stima
puntuale di un parametro. Abbiamo cioè “stimato” la media e la varianza di
una popolazione utilizzando i valori della v.c. del campione, perché secondo
quanto stabilito dai calcoli riportati, la Media campionaria è uno stimatore
non distorto della media della popolazione di riferimento e la Varianza
campionaria corretta, altrettanto. Ma che cosa significa “non distorto”?
Sinora abbiamo intuito che significa che il metodo per stimare, ad esempio,
la Media della popolazione, contempla calcoli che utilizzano lo stesso
metodo di misurazione che avremmo utilizzato se avessimo voluto calcolare
la Media della popolazione; tuttavia, ora che vogliamo presentare anche
altre caratteristiche degli stimatori, dobbiamo essere più espliciti e
premettere alcune definizioni.
Per “Stimatore” si intende una variabile casuale utilizzata per stimare
una determinata caratteristica della popolazione (nel nostro caso si tratta di
un parametro come la Media o la Varianza…); per Stima”, invece, si
pf3
pf4
pf5
pf8

Anteprima parziale del testo

Scarica Stimatori e stime per intervalli: stime non distorte e intervalli di confidenza e più Dispense in PDF di Statistica solo su Docsity!

Lezione 18

Stimatori e stima per intervalli

Un volta presentati i principali modelli teorici delle v.c. discrete e continue e gli elementi di teoria dei campioni, in questa lezione trattiamo brevemente del rapporto esistente fra la stima di alcuni parametri ed il valore del parametro della popolazione di riferimento, per poi passare alla redazione degli esempi finalizzati alla trasformazione operativa di quanto presentato. Nella lezione nella quale abbiamo presentato i metodi di campionamento, abbiamo fatto indiretto riferimento alla cosiddetta stima puntuale di un parametro. Abbiamo cioè “stimato” la media e la varianza di una popolazione utilizzando i valori della v.c. del campione, perché secondo quanto stabilito dai calcoli riportati, la Media campionaria è uno stimatore non distorto della media della popolazione di riferimento e la Varianza campionaria corretta, altrettanto. Ma che cosa significa “non distorto”? Sinora abbiamo intuito che significa che il metodo per stimare, ad esempio, la Media della popolazione, contempla calcoli che utilizzano lo stesso metodo di misurazione che avremmo utilizzato se avessimo voluto calcolare la Media della popolazione; tuttavia, ora che vogliamo presentare anche altre caratteristiche degli stimatori, dobbiamo essere più espliciti e premettere alcune definizioni. Per “ Stimatore ” si intende una variabile casuale utilizzata per stimare una determinata caratteristica della popolazione (nel nostro caso si tratta di un parametro come la Media o la Varianza…); per “ Stima ”, invece, si

intende il valore assunto dallo stimatore, in corrispondenza di un determinato campione^1. Da questo, possiamo derivare che per “stimatore non distorto”, o meglio “ corretto ” si intende lo stimatore il cui valore atteso (medio) sia proprio pari al parametro della popolazione. Questo l’avevamo già chiaro per quanto riguarda la media e avevamo anche calcolato che la varianza campionaria, invece, rappresenta uno stimatore non corretto della varianza (parametro) della popolazione. Ma allora, se la varianza campionaria non è uno stimatore corretto, che cosa possiamo dire su questo stimatore (che perché sia corretto deve essere trasformato nell’altro stimatore che abbiamo presentato, ossia la varianza campionaria, appunto, corretta)? Ad esempio, possiamo calcolarne l’ efficienza. Ossia possiamo calcolare, semmai dovessimo averne bisogno, che fra due stimatori non corretti (anche se noi ne abbiamo presentato solo uno per la varianza) quello più efficiente è quello che presenta un errore quadratico medio minore fra tutti. Infatti, se misuriamo, ad esempio, la varianza del campione e la varianza della popolazione (che supponiamo quindi nota), possiamo anche calcolare la loro distanza, ossia la loro differenza al quadrato e definire come efficiente quello stimatore il cui errore quadratico medio sia inferiore a quello degli altri stimatori utilizzabili. In formule, l’errore quadratico medio^2 (in inglese: Mean Square

Error – MSE) è dato dalla seguente: ^ 

MSE ( T ) E ( T   )^2

, nella quale abbiamo definito con “ T ” lo stimatore e con  (la lettera greca “theta”) il parametro della popolazione. In presenza di due stimatori T1 e T2 , allora, quello più efficiente è quello con MSE minore. (^1) Cfr. “Borra S., Di Ciaccio A., Statistica , McGraw-Hill, Milano, 2004”, pag. 275. (^2) Ibidem, pag. 276.

certi circa la vicinanza della stima ottenuta al valore vero del parametro  , che rimane incognito”^5. Nasce anche da questo fatto, l’opportunità di considerare oltre a queste stime puntuali, le stime per intervallo dei parametri, ossia delle stime basate sulla confidenza circa l’appartenenza del parametro (incognito) ad una famiglia parametrica nota per cui si possa creare un intervallo di valori entro i quali si stima che dovrebbe cadere il parametro stesso sulla base dei dati campionari (i quali permettono solo la quantificazione della stima, ossia il calcolo dello stimatore, e non quello del parametro della popolazione). In questo, caso, allora, non si tratta di quantificare lo stimatore, ma si tratta di calcolare un intervallo di valori, partendo dai dati campionari, che quantifichi i limiti massimo e minimo che il parametro dovrebbe assumere con un determinato livello di probabilità (detto: livello di confidenza). In altre parole, se abbiamo un campione di dati che supponiamo sia appartenente ad una popolazione con distribuzione Normale e non conosciamo la media di questa popolazione (Valore medio di questa v.c. Normale), possiamo costruire una intervallo di confidenza all’interno del quale sappiamo (con certo livello di probabilità) che dovrebbe essere compreso il valore del parametro stimato sulla base dei soli dati campionari. Questo perché possiamo affermare che estraendo un certo numero di campioni da una popolazione normale una determinata percentuale di questi campioni genererà un valore della media esterno a tali limiti e quindi, potrebbe indurci in errore nel considerare un determinato valore riscontrato nel campione come il vero valore della media della popolazione. Potremo riferirci correttamente al valore della media solo come valore stimato sulla (^5) Ibidem, pag. 574.

base dei dati campionari e quindi che possiamo considerare interno ad un ceto intervallo, con una determinata probabilità e non con certezza. Come già affermato, senza utilizzare le tavole statistiche della distribuzione della v.c. Normale, utilizzeremo solamente alcuni valori della stessa. In particolare, ci riferiamo ai valori già presentati nella lezione relativa alle v.c. continue, per i quali sappiamo che per quanto riguarda una v.c. Normale, il 68,27% delle volte, un determinato valore cade all’interno dell’intervallo costituito dalla Media più/meno una volta la Deviazione standard. In questo caso, quindi, possiamo considerare che, avendo estratto un campione casuale da una popolazione che supponiamo Normale, il 68,27% delle volte, la Media della popolazione (che è, quindi, una v.c.) cadrà all’interno dell’intervallo di confidenza che ha come limite inferiore (rispettivamente: superiore) la media campionaria meno (più) la deviazione standard campionaria. Parimenti avviene per gli altri valori che abbiamo indicato nella lezione citata e che riportiamo per semplicità di consultazione avendo indicato con X^ c la media campionaria e con^ ^ lo scarto quadratico medio della popolazione, che supponiamo per ora noto. ( ) 68 , 27 % ( ) n X n X (^) c c       ( 2 ) 95 , 45 % ( 2 ) n X n X (^) c c       ( 3 ) 99 , 73 % ( 3 ) n X n X (^) c c       In questo modo, quindi, stiamo stimando un valore della media della popolazione tramite una stima per intervallo , ossia non attribuendo direttamente il valore dello stimatore al parametro della popolazione; stiamo invece dichiarando che, se la popolazione di provenienza si

Da questi dati, ipotizzando di conoscere il valore della Deviazione standard della popolazione di riferimento (supposta Normale) e pari a 2, costruiamo l’intervallo di confidenza per la Media della popolazione con la probabilità pari al 50%, 95% e 99%. Per il primo intervallo, possiamo affermare che col 50% delle probabilità la media della popolazione sarà compresa fra 3 , 523 8 2  0 , 674  4  0 , 674   n Xc  e 4 , 477 8 2  0 , 674  4  0 , 674   n Xc  . Col 95%, invece, il Valore medio sarà compreso fra 2,614 (= 8 2  1 , 96  4  1 , 96  n X (^) c  ) e 5,386 (= 8 2  1 , 96  4  1 , 96  n X (^) c  ). Col 99% di probabilità, invece, sarà compreso fra 2,178 e 5,822. Come si può notare, si sono costruiti gli intervalli supponendo nota la Deviazione Standard della popolazione. In questo caso, quindi, il dato campionario relativo non è stato utilizzato. Se, invece, non fosse nota la Varianza della popolazione, in ogni caso potremmo sostituire a tale parametro lo stimatore “Varianza campionaria” mediante la medesima modalità di costruzione dell’intervallo; questa volta, però, l’intervallo considererà la Deviazione standard campionaria che all’aumentare della numerosità del campione rappresenta (asintoticamente) una approssimazione via via migliore di quella della popolazione, in questo caso ritenuta sconosciuta ma sempre considerata Normale. Tuttavia, dato che in questo caso la ampiezza campionaria incide sul calcolo della deviazione standard campionaria, la v.c. media campionaria non si distribuirà necessariamente come una v.c. Normale. Si distribuirà, invece, come una

v.c. denominata t di Student con n-1 gradi di libertà, come già definito nella lezione relativa alle v.c. continue. L’intervallo, allora, si dovrebbe costruire come segue (avendo indicato con S la deviazione standard campionaria corretta), ossia considerando invece una distribuzione Normale della Media campionaria, solamente in caso di ampiezza campionaria “sufficiente” e solitamente considerata non inferiore ad almeno^6 120 (molti autori considerano sufficiente una numerosità campionaria superiore a 30): n S X (^) c  0 , (^674) con il 50% di probabilità; n S Xc  1 , (^960) con il 95%; n S X (^) c  2 , (^576) per il 99%. In questo caso, la S indica la stima corretta dello SQM della popolazione e in questa formula “sostituisce” lo SQM della popolazione, supposto non conosciuto. Da questi valori si evince chiaramente come l’intervallo sia più o meno ampio in funzione del valore della Deviazione standard considerata, così come la spiegazione del concetto di variabilità aveva teoricamente già chiarito. (^6) Cfr.: Levine D. M., Krehbiel T. C., Berenson M. L., Statistica , seconda edizione, Apogeo, Milano, 2006, pag. 245.