Appunti del II modulo di Statistica | Appunti di Statistica

Statistica, modulo II

Capitolo 5

Capitolo 6

Capitolo 7

Capitolo 8

Numeri indici

Tramite la statistica inferenziale è possibile utilizzare i dati campionari (statistiche) per dire qualcosa sui (funzioni dei

dati) dati della popolazione (parametri); in particolare:

- Se non si conosce il parametro media della popolazione (), si usa la statistica media campionaria (𝑥), che è un

numero, per calcolare la stima puntale e intervallare.

- Se non si conosce il parametro varianza nella popolazione (𝜎2), si usa la statistica varianza campionaria

corretta (𝑠2), per calcolare la stima puntuale.

- Se non si conosce il parametro proporzione della popolazione (p), si usa la statistica proporzione campionaria (𝑝),

per calcolare la stima puntale e intervallare.

La stima puntuale è un numero che rappresenta la migliore previsione possibile del valore assunto dal parametro.

Intorno ad essa si costruisce un intervallo, nel quale si confida che stia il valore esatto del parametro. La stima

intervallare è quindi un intervallo di valori contenente (si confida che contenga) il valore esatto del parametro, detto

intervallo di confidenza.

Stima puntuale e stimatori

Lo stimatore è una variabile casuale usata per stimare puntualmente un parametro. Il valore (numero) che tale variabile

casuale assume in corrispondenza del singolo campione si chiama stima; esso varia al variare del campione (se si

vuole stimare la media della popolazione



, 𝑋 è la variabile casuale media campionaria stimatore, 𝑥 è la stima del

parametro. La media campionaria ha distribuzione normale; il grafico indica quindi tutti i valori essa che può assumere

quando si estrae un campione; a ciascun valore corrisponde una probabilità di manifestarsi, la quale è minore più il

valore si colloca nelle code della curva. Quando si estrae un campione, non si sa se il valore estratto abbia una bassa

o alta probabilità). Lo stimatore scelto per stimare un parametro è lo stimatore naturale (per stimare la media della

popolazione, si usa la variabile casuale media campionaria).

Lo stimatore deve soddisfare le seguenti proprietà:

- Correttezza: lo stimatore è corretto quando il suo valore atteso coincide con il parametro da stimare; quindi la

distorsione è pari a 0.

𝐸(𝑦)=𝜃 (𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑜 𝑖𝑛 𝑔𝑒𝑛𝑒𝑟𝑎𝑙𝑒)

𝐸(𝑦)−𝜃=0

Lo stimatore quindi non è corretto, quindi è distorto, quando il suo valore atteso non coincide con il parametro da

stimare, ovvero:

𝐸(𝑦)−𝜃 (𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑜 𝑖𝑛 𝑔𝑒𝑛𝑒𝑟𝑎𝑙𝑒)=𝑑𝑖𝑠𝑡𝑜𝑟𝑠𝑖𝑜𝑛𝑒

Ad esempio, se 𝐸(𝑋)=𝜇 , allora lo stimatore è corretto.

- Consistenza: lo stimatore corretto è consistente se la sua varianza tende a 0 all’aumentare di n.

In particolare, se lo stimatore è corretto, è centrato nella media; se all’aumentare di n la varianza tende a 0 significa

che lo stimatore tende ad assumere valori sempre più vicini alla media, in quanto la varianza è la media degli scarti

di x dalla media (gli scarti quindi sono piccoli).

Ad esempio, 𝑉𝑎𝑟(𝑋)=𝜎2

𝑛, quindi lo stimatore è consistente in quanto all’aumentare di n, la sua varianza tende a

- Efficienza relativa: uno stimatore è maggiormente efficiente di un altro stimatore se ha errore standard o

varianza minore; tale efficienza è relativa, in quanto confronta tra loro due stimatori, non individuando il più

efficiente in assoluto.

Appunti del II modulo di Statistica, Appunti di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Appunti del II modulo di Statistica e più Appunti in PDF di Statistica solo su Docsity!

Statistica, modulo II

Stima puntuale e stimatori

vuole stimare la media della popolazione  , 𝑋

×

×

×

×

Stima intervallare e intervalli di confidenza

×

×

× √

×

×

( 0 , 4 ) ± 1 , 96 ×

× √

( 0 , 4 ) ± 2 , 58 ×

×

normale con varianza pari a 9. stimare la taglia media delle donne trentenni (media nella popolazione  ), dato

L’esercizio richiede di calcolare la stima puntuale di  ; la stima puntuale per  è la media campionaria:

Si calcoli ora l’intervallo di confidenza per  con livello di fiducia 𝟏 − 𝜶 = 𝟎, 𝟗𝟔 , fornendo un’interpretazione.

×

×

Interpretazione : confido che questo sia uno dei 96 intervalli su 100 che contengono .

×

× 1 , 59 → ( 42 , 20 ; 39 , 40 )

Dimensione campionaria

× √

× (

× (

× √

𝑛 = 𝑝𝑞 × (

= 𝑝𝑞 × (

𝑛 = 𝑝𝑞 × (

= 0 , 25 × (

× (

≥ 3 × (

× (

× (

Test di significatività per media con varianza 𝝈

nota

- Ipotesi : l’ipotesi nulla 𝐻 0 𝑝𝑜𝑛𝑒  = 𝜇

PROCEDIMENTO 1

PROCEDIMENTO 2

( tavole ), mentre  , ovvero l’area alla destra dello z teorico, è pari a 0,05, come da dati. Qui 0,0668>0,05 , quindi

PROCEDIMENTO 1

o alla sua sinistra  /2=0,025.

PROCEDIMENTO 2

mentre  è pari a 0,0 1 , come da dati. Qui 0<0,0 1 , quindi H0 viene rifiutata.

Test di significatività per media con varianza 𝝈

non nota

- Ipotesi : l’ipotesi nulla 𝐻 0 𝑝𝑜𝑛𝑒  = 𝜇

significatività è  =0,002. Definire il sistema di ipotesi e verificare se è opportuno accettare H0:

sua sinistra  /2=0,001. I gradi di libertà sono 29, ovvero 30-1.

Test di significatività per proporzione

PROCEDIMENTO 2

ESERCIZI 2

Variabili e indipendenza/dipendenza

Legame (indipendenza, massima dipendenza funzionale, connessione) tra variabili categoriali

Indipendenza e dipendenza funzionale di variabili in un’ottima descrittiva