Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Che cosa è la stima in statistica, Appunti di Statistica

La stima puntuale e la stima intervallare

Tipologia: Appunti

2021/2022

Caricato il 01/03/2022

anna-d-antuono
anna-d-antuono 🇮🇹

5

(4)

41 documenti

1 / 3

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STIMA
Ci sono due tipologie di metodi di interferenza statistica Ovvero la stima dei parametri di una
popolazione e la verifica delle ipotesi riguardanti valori dei parametri. La stima in particolare
è il valore dello stimatore assunto in corrispondenza di un campione osservato (y1,y2..). E si
definisce stimatore una statistica Tn usata per stimare il parametro Incognito della
distribuzione. Uno stimatore è quindi una funzione nota
tn=T(y1,y2 ecc).
Con riferimento ai parametri di una popolazione, sono possibili due tipologie di stime, una
stima puntuale e una stima intervallare. LA STIMA PUNTUALE è un singolo numero che
rappresenta la nostra scelta migliore per un parametro. LA STIMA INTERVALLARE è un
intervallo di valori entro il quale si ritiene cada il valore del parametro. Una stima puntuale di
per sé non è sufficiente Dal momento che non ci dice quanto vicino sia verosimilmente la
stima rispetto al valore del parametro. Una stima intervallare più utile poiché anche se
incorpora un margine di errore, aiuta a quantificare l'accuratezza della stima puntuale. Per
trovare un attimo puntuale possiamo fare una appropriata statistica campionaria. Ad
esempio nel caso della media Miu di una popolazione, la media campionaria è una stima
puntuale di miu. Nel caso della proporzione di una popolazione, la proporzione campionaria
è una stima puntuale. Per qualsiasi particolare parametro, ci sono molti stimatori puntuali
possibili. Ad esempio nel caso di una distribuzione normale, il centro e la media è la
mediana dal momento che la Distribuzione simmetrica. Un buon stimatore di un parametro
ha due proprietà desiderabili: ovvero un buon stimatore a una distribuzione campionaria il
cui centro coincide con il valore del parametro. In questo caso definiamo centro la media
della distribuzione campionaria punto uno stimatore che gode di questa proprietà e detto
nonna distorto quindi possiamo dedurre che uno stimatore è corretto se il suo valore atteso
e quindi la media è uguale al parametro incognito. Nel caso di un campionamento casuale, il
valore atteso della distribuzione della media campionaria è uguale alla media della
popolazione E pertanto la media campionaria è uno stimatore non distorto di miu. E anche la
proporzione campionaria è uno stimatore non distorto della proporzione della popolazione.
Inoltre un buon stimatore ha una deviazione standard piccola rispetto a quella di altri
stimatori. Questo ci dice che lo stimatore tende a cadere, rispetto agli altri, più vicino al
parametro. Ad esempio, quando si vuole stimare il centro di una distribuzione normale, la
media campionaria ha rispetto alla mediana campionaria, una deviazione standard più
piccola. Quindi le due proprietà di uno stimatore sono la correttezza o la non
dispersione e l efficienza o precisione, la quale indica quanto sono vicine le Stime al
parametro Incognito della popolazione ed è inversamente proporzionale alla varianza della
stima. All aumentare di n aumenta la precisione di uno stimatore.
La distribuzione di probabilità di uno stimatore è la sua distribuzione campionaria ed è
definita a partire da tutti i possibili campioni che costituiscono lo spazio campionario. Per
questa distribuzione si definiscono una media E(Tņ) e una varianza VAR(Tn).
Una stima intervallare indica una precisione producendo un intervallo di valori intorno alla
stima puntuale. L'intervallo è costituito da quei valori che sulla base dei dati raccolti, risultano
più credibili per il parametro sconosciuto. Dal momento che le Stime intervallari
contengono il parametro con un certo grado di confidenza, ci riferiamo a esse con il
termine intervalli di confidenza
Un intervallo di confidenza è un intervallo che contiene valori più credibili per il parametro.
La probabilità che questo metodo produca un intervallo che contiene il parametro è detto
livello di confidenza. Questo è il numero scelto in modo da essere vicino a 1 e in generale è
posto uguale a 0,95.
pf3

Anteprima parziale del testo

Scarica Che cosa è la stima in statistica e più Appunti in PDF di Statistica solo su Docsity!

STIMA

Ci sono due tipologie di metodi di interferenza statistica Ovvero la stima dei parametri di una popolazione e la verifica delle ipotesi riguardanti valori dei parametri. La stima in particolare è il valore dello stimatore assunto in corrispondenza di un campione osservato (y1,y2..). E si definisce stimatore una statistica Tn usata per stimare il parametro Incognito della distribuzione. Uno stimatore è quindi una funzione nota tn=T(y1,y2 ecc). Con riferimento ai parametri di una popolazione, sono possibili due tipologie di stime, una stima puntuale e una stima intervallare. LA STIMA PUNTUALE è un singolo numero che rappresenta la nostra scelta migliore per un parametro. LA STIMA INTERVALLARE è un intervallo di valori entro il quale si ritiene cada il valore del parametro. Una stima puntuale di per sé non è sufficiente Dal momento che non ci dice quanto vicino sia verosimilmente la stima rispetto al valore del parametro. Una stima intervallare più utile poiché anche se incorpora un margine di errore, aiuta a quantificare l'accuratezza della stima puntuale. Per trovare un attimo puntuale possiamo fare una appropriata statistica campionaria. Ad esempio nel caso della media Miu di una popolazione, la media campionaria è una stima puntuale di miu. Nel caso della proporzione di una popolazione, la proporzione campionaria è una stima puntuale. Per qualsiasi particolare parametro, ci sono molti stimatori puntuali possibili. Ad esempio nel caso di una distribuzione normale, il centro e la media è la mediana dal momento che la Distribuzione simmetrica. Un buon stimatore di un parametro ha due proprietà desiderabili: ovvero un buon stimatore a una distribuzione campionaria il cui centro coincide con il valore del parametro. In questo caso definiamo centro la media della distribuzione campionaria punto uno stimatore che gode di questa proprietà e detto nonna distorto quindi possiamo dedurre che uno stimatore è corretto se il suo valore atteso e quindi la media è uguale al parametro incognito. Nel caso di un campionamento casuale, il valore atteso della distribuzione della media campionaria è uguale alla media della popolazione E pertanto la media campionaria è uno stimatore non distorto di miu. E anche la proporzione campionaria è uno stimatore non distorto della proporzione della popolazione. Inoltre un buon stimatore ha una deviazione standard piccola rispetto a quella di altri stimatori. Questo ci dice che lo stimatore tende a cadere, rispetto agli altri, più vicino al parametro. Ad esempio, quando si vuole stimare il centro di una distribuzione normale, la media campionaria ha rispetto alla mediana campionaria, una deviazione standard più piccola. Quindi le due proprietà di uno stimatore sono la correttezza o la non dispersione e l efficienza o precisione , la quale indica quanto sono vicine le Stime al parametro Incognito della popolazione ed è inversamente proporzionale alla varianza della stima. All aumentare di n aumenta la precisione di uno stimatore. La distribuzione di probabilità di uno stimatore è la sua distribuzione campionaria ed è definita a partire da tutti i possibili campioni che costituiscono lo spazio campionario. Per questa distribuzione si definiscono una media E(Tņ) e una varianza VAR(Tn). Una stima intervallare indica una precisione producendo un intervallo di valori intorno alla stima puntuale. L'intervallo è costituito da quei valori che sulla base dei dati raccolti, risultano più credibili per il parametro sconosciuto. Dal momento che le Stime intervallari contengono il parametro con un certo grado di confidenza, ci riferiamo a esse con il termine intervalli di confidenza Un intervallo di confidenza è un intervallo che contiene valori più credibili per il parametro. La probabilità che questo metodo produca un intervallo che contiene il parametro è detto livello di confidenza. Questo è il numero scelto in modo da essere vicino a 1 e in generale è posto uguale a 0,95.

Quindi un intervallo di confidenza viene costruito prendendo una stima puntuale e sommando e sottraendo un margine di errore. Il margine di errore si basa sulla deviazione standard della distribuzione campionaria di quella stima puntuale. Quando la distribuzione campionaria è approssimativamente normale, un intervallo di confidenza al 95% ha un margine di errore pari a 1,96 deviazioni standard. Il margine di errore misura l'accuratezza della stima puntuale nello stimare un parametro. Esso è multiplo della deviazione standard della distribuzione campionaria della stima, come ad esempio 1,96 ovvero deviazione standard quando la distribuzione campionaria è normale.Il margine di errore di un intervallo di confidenza aumenta all'aumentare del livello di confidenza e si riduce al crescere della dimensione del campione. Un errore standard indica una stima della deviazione standard di una distribuzione campionaria. L'errore standard viene indicato con l'abbreviazione se. Per trovare un intervallo di confidenza per la proporzione p di una popolazione, l'errore standard è: se=radice di p cappuccio(1-p cappuccio):n Un intervallo di confidenza al 95% per la proporzione p di una popolazione è : p cappuccio più o meno 1. P cappuccio indica la proporzione campionaria stimata a partire da n osservazioni. Quindi per trovare un intervallo di confidenza al 95%, si prende la proporzione campionaria e si somma r si sottrae 1.96 errori standard. ESEMPIO: su un totale di N = 1154 intervistati, 518 hanno risposto Sì, la corrispondente proporzione campionaria è 518:1154=0.45. Intervallo di confidenza per la proporzione p di una popolazione,basato sulla proporzione campionaria p cappuccio e sull errore standard se= radice di p cappuccio(1meno p cappuccio):n per un campione di dimensione n, è P cappuccio più o meno z(se), ovvero p cappuccio piu o meno z per radice di p.cappuccio(1 meno p cappuccio:n. Nel caso di intervalli di confidenza al 90%, 95%, 99%,z è uguale a 1.645, 1.94, 2. Il margine di errore di un intervallo di confidenza aumenta all'aumentare del livello di confidenza e si riduce al crescere della dimensione del campione. Che cos'è la distribuzione t? La distribuzione t descrive le distanze standardizzate delle medie campionarie dalla media della popolazione quando non si conosce la deviazione standard della popolazione e le osservazioni derivano da una popolazione a distribuzione normale.La distribuzione z (o distribuzione normale standardizzata) prevede che si conosca la deviazione standard della popolazione. La distribuzione t è basata sulla deviazione standard del campione.La distribuzione t viene definita dai gradi di libertà, che dipendono dalla dimensione campionaria.La distribuzione t è più utile quando le dimensioni campionarie sono ridotte, quando la deviazione standard della popolazione non è nota o nel caso in cui valgano entrambe le condizioni.Con l'aumento della dimensione campionaria, la distribuzione t è sempre più simile a una distribuzione normale. La distribuzione t è simmetrica rispetto al suo zero, ma risulta più “piatta” della distribuzione normale standardizzata, cosicchè una maggiore parte della sua area è compresa nelle code. Un campione più numeroso fa sì che la distribuzione t approssimi sempre più fedelmente la distribuzione normale. Le differenze tra la distribuzione t e la normale sono maggiori quando abbiamo meno gradi di libertà.Ma cosa intendiamo per gradi di libertà? Il numero di campioni che hanno la “libertà” di cambiare senza modificare la media del campione.