Che cosa è la stima in statistica | Appunti di Statistica

STIMA

Ci sono due tipologie di metodi di interferenza statistica Ovvero la stima dei parametri di una

popolazione e la verifica delle ipotesi riguardanti valori dei parametri. La stima in particolare

è il valore dello stimatore assunto in corrispondenza di un campione osservato (y1,y2..). E si

definisce stimatore una statistica Tn usata per stimare il parametro Incognito della

distribuzione. Uno stimatore è quindi una funzione nota

tn=T(y1,y2 ecc).

Con riferimento ai parametri di una popolazione, sono possibili due tipologie di stime, una

stima puntuale e una stima intervallare. LA STIMA PUNTUALE è un singolo numero che

rappresenta la nostra scelta migliore per un parametro. LA STIMA INTERVALLARE è un

intervallo di valori entro il quale si ritiene cada il valore del parametro. Una stima puntuale di

per sé non è sufficiente Dal momento che non ci dice quanto vicino sia verosimilmente la

stima rispetto al valore del parametro. Una stima intervallare più utile poiché anche se

incorpora un margine di errore, aiuta a quantificare l'accuratezza della stima puntuale. Per

trovare un attimo puntuale possiamo fare una appropriata statistica campionaria. Ad

esempio nel caso della media Miu di una popolazione, la media campionaria è una stima

puntuale di miu. Nel caso della proporzione di una popolazione, la proporzione campionaria

è una stima puntuale. Per qualsiasi particolare parametro, ci sono molti stimatori puntuali

possibili. Ad esempio nel caso di una distribuzione normale, il centro e la media è la

mediana dal momento che la Distribuzione simmetrica. Un buon stimatore di un parametro

ha due proprietà desiderabili: ovvero un buon stimatore a una distribuzione campionaria il

cui centro coincide con il valore del parametro. In questo caso definiamo centro la media

della distribuzione campionaria punto uno stimatore che gode di questa proprietà e detto

nonna distorto quindi possiamo dedurre che uno stimatore è corretto se il suo valore atteso

e quindi la media è uguale al parametro incognito. Nel caso di un campionamento casuale, il

valore atteso della distribuzione della media campionaria è uguale alla media della

popolazione E pertanto la media campionaria è uno stimatore non distorto di miu. E anche la

proporzione campionaria è uno stimatore non distorto della proporzione della popolazione.

Inoltre un buon stimatore ha una deviazione standard piccola rispetto a quella di altri

stimatori. Questo ci dice che lo stimatore tende a cadere, rispetto agli altri, più vicino al

parametro. Ad esempio, quando si vuole stimare il centro di una distribuzione normale, la

media campionaria ha rispetto alla mediana campionaria, una deviazione standard più

piccola. Quindi le due proprietà di uno stimatore sono la correttezza o la non

dispersione e l efficienza o precisione, la quale indica quanto sono vicine le Stime al

parametro Incognito della popolazione ed è inversamente proporzionale alla varianza della

stima. All aumentare di n aumenta la precisione di uno stimatore.

La distribuzione di probabilità di uno stimatore è la sua distribuzione campionaria ed è

definita a partire da tutti i possibili campioni che costituiscono lo spazio campionario. Per

questa distribuzione si definiscono una media E(Tņ) e una varianza VAR(Tn).

Una stima intervallare indica una precisione producendo un intervallo di valori intorno alla

stima puntuale. L'intervallo è costituito da quei valori che sulla base dei dati raccolti, risultano

più credibili per il parametro sconosciuto. Dal momento che le Stime intervallari

contengono il parametro con un certo grado di confidenza, ci riferiamo a esse con il

termine intervalli di confidenza

Un intervallo di confidenza è un intervallo che contiene valori più credibili per il parametro.

La probabilità che questo metodo produca un intervallo che contiene il parametro è detto

livello di confidenza. Questo è il numero scelto in modo da essere vicino a 1 e in generale è

posto uguale a 0,95.

Anteprima parziale del testo

Scarica Che cosa è la stima in statistica e più Appunti in PDF di Statistica solo su Docsity!

STIMA

Ci sono due tipologie di metodi di interferenza statistica Ovvero la stima dei parametri di una popolazione e la verifica delle ipotesi riguardanti valori dei parametri. La stima in particolare è il valore dello stimatore assunto in corrispondenza di un campione osservato (y1,y2..). E si definisce stimatore una statistica Tn usata per stimare il parametro Incognito della distribuzione. Uno stimatore è quindi una funzione nota tn=T(y1,y2 ecc). Con riferimento ai parametri di una popolazione, sono possibili due tipologie di stime, una stima puntuale e una stima intervallare. LA STIMA PUNTUALE è un singolo numero che rappresenta la nostra scelta migliore per un parametro. LA STIMA INTERVALLARE è un intervallo di valori entro il quale si ritiene cada il valore del parametro. Una stima puntuale di per sé non è sufficiente Dal momento che non ci dice quanto vicino sia verosimilmente la stima rispetto al valore del parametro. Una stima intervallare più utile poiché anche se incorpora un margine di errore, aiuta a quantificare l'accuratezza della stima puntuale. Per trovare un attimo puntuale possiamo fare una appropriata statistica campionaria. Ad esempio nel caso della media Miu di una popolazione, la media campionaria è una stima puntuale di miu. Nel caso della proporzione di una popolazione, la proporzione campionaria è una stima puntuale. Per qualsiasi particolare parametro, ci sono molti stimatori puntuali possibili. Ad esempio nel caso di una distribuzione normale, il centro e la media è la mediana dal momento che la Distribuzione simmetrica. Un buon stimatore di un parametro ha due proprietà desiderabili: ovvero un buon stimatore a una distribuzione campionaria il cui centro coincide con il valore del parametro. In questo caso definiamo centro la media della distribuzione campionaria punto uno stimatore che gode di questa proprietà e detto nonna distorto quindi possiamo dedurre che uno stimatore è corretto se il suo valore atteso e quindi la media è uguale al parametro incognito. Nel caso di un campionamento casuale, il valore atteso della distribuzione della media campionaria è uguale alla media della popolazione E pertanto la media campionaria è uno stimatore non distorto di miu. E anche la proporzione campionaria è uno stimatore non distorto della proporzione della popolazione. Inoltre un buon stimatore ha una deviazione standard piccola rispetto a quella di altri stimatori. Questo ci dice che lo stimatore tende a cadere, rispetto agli altri, più vicino al parametro. Ad esempio, quando si vuole stimare il centro di una distribuzione normale, la media campionaria ha rispetto alla mediana campionaria, una deviazione standard più piccola. Quindi le due proprietà di uno stimatore sono la correttezza o la non dispersione e l efficienza o precisione , la quale indica quanto sono vicine le Stime al parametro Incognito della popolazione ed è inversamente proporzionale alla varianza della stima. All aumentare di n aumenta la precisione di uno stimatore. La distribuzione di probabilità di uno stimatore è la sua distribuzione campionaria ed è definita a partire da tutti i possibili campioni che costituiscono lo spazio campionario. Per questa distribuzione si definiscono una media E(Tņ) e una varianza VAR(Tn). Una stima intervallare indica una precisione producendo un intervallo di valori intorno alla stima puntuale. L'intervallo è costituito da quei valori che sulla base dei dati raccolti, risultano più credibili per il parametro sconosciuto. Dal momento che le Stime intervallari contengono il parametro con un certo grado di confidenza, ci riferiamo a esse con il termine intervalli di confidenza Un intervallo di confidenza è un intervallo che contiene valori più credibili per il parametro. La probabilità che questo metodo produca un intervallo che contiene il parametro è detto livello di confidenza. Questo è il numero scelto in modo da essere vicino a 1 e in generale è posto uguale a 0,95.

Quindi un intervallo di confidenza viene costruito prendendo una stima puntuale e sommando e sottraendo un margine di errore. Il margine di errore si basa sulla deviazione standard della distribuzione campionaria di quella stima puntuale. Quando la distribuzione campionaria è approssimativamente normale, un intervallo di confidenza al 95% ha un margine di errore pari a 1,96 deviazioni standard. Il margine di errore misura l'accuratezza della stima puntuale nello stimare un parametro. Esso è multiplo della deviazione standard della distribuzione campionaria della stima, come ad esempio 1,96 ovvero deviazione standard quando la distribuzione campionaria è normale.Il margine di errore di un intervallo di confidenza aumenta all'aumentare del livello di confidenza e si riduce al crescere della dimensione del campione. Un errore standard indica una stima della deviazione standard di una distribuzione campionaria. L'errore standard viene indicato con l'abbreviazione se. Per trovare un intervallo di confidenza per la proporzione p di una popolazione, l'errore standard è: se=radice di p cappuccio(1-p cappuccio):n Un intervallo di confidenza al 95% per la proporzione p di una popolazione è : p cappuccio più o meno 1. P cappuccio indica la proporzione campionaria stimata a partire da n osservazioni. Quindi per trovare un intervallo di confidenza al 95%, si prende la proporzione campionaria e si somma r si sottrae 1.96 errori standard. ESEMPIO: su un totale di N = 1154 intervistati, 518 hanno risposto Sì, la corrispondente proporzione campionaria è 518:1154=0.45. Intervallo di confidenza per la proporzione p di una popolazione,basato sulla proporzione campionaria p cappuccio e sull errore standard se= radice di p cappuccio(1meno p cappuccio):n per un campione di dimensione n, è P cappuccio più o meno z(se), ovvero p cappuccio piu o meno z per radice di p.cappuccio(1 meno p cappuccio:n. Nel caso di intervalli di confidenza al 90%, 95%, 99%,z è uguale a 1.645, 1.94, 2. Il margine di errore di un intervallo di confidenza aumenta all'aumentare del livello di confidenza e si riduce al crescere della dimensione del campione. Che cos'è la distribuzione t? La distribuzione t descrive le distanze standardizzate delle medie campionarie dalla media della popolazione quando non si conosce la deviazione standard della popolazione e le osservazioni derivano da una popolazione a distribuzione normale.La distribuzione z (o distribuzione normale standardizzata) prevede che si conosca la deviazione standard della popolazione. La distribuzione t è basata sulla deviazione standard del campione.La distribuzione t viene definita dai gradi di libertà, che dipendono dalla dimensione campionaria.La distribuzione t è più utile quando le dimensioni campionarie sono ridotte, quando la deviazione standard della popolazione non è nota o nel caso in cui valgano entrambe le condizioni.Con l'aumento della dimensione campionaria, la distribuzione t è sempre più simile a una distribuzione normale. La distribuzione t è simmetrica rispetto al suo zero, ma risulta più “piatta” della distribuzione normale standardizzata, cosicchè una maggiore parte della sua area è compresa nelle code. Un campione più numeroso fa sì che la distribuzione t approssimi sempre più fedelmente la distribuzione normale. Le differenze tra la distribuzione t e la normale sono maggiori quando abbiamo meno gradi di libertà.Ma cosa intendiamo per gradi di libertà? Il numero di campioni che hanno la “libertà” di cambiare senza modificare la media del campione.

Che cosa è la stima in statistica, Appunti di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Che cosa è la stima in statistica e più Appunti in PDF di Statistica solo su Docsity!

STIMA