Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Stima Intervallare: Concetti e Applicazioni in Statistica - Prof. Parroco, Appunti di Statistica Sociale

Una spiegazione dettagliata della stima intervallare in statistica, confrontandola con la stima puntuale e illustrando i vantaggi e gli svantaggi di ciascuna. Vengono approfonditi i concetti di livello di confidenza, errore standard e ampiezza dell'intervallo, con esempi pratici e formule per il calcolo degli estremi. Anche il ruolo del teorema centrale del limite (tcl) nella costruzione di intervalli di confidenza per grandi campioni.

Tipologia: Appunti

2023/2024

Caricato il 04/03/2025

roberta-asciutto
roberta-asciutto 🇮🇹

2 documenti

1 / 6

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
LA STIMA INTERVALLARE
Cosa significa stima intervallare?
Stimare un intervallo significa trovare gli estremi di un intervallo che con una certa
probabilità contengono il valore vero del parametro. A differenza della stima
puntuale che produce un unico valore, la stima intervallare utilizza i dati
campionari per produrre un intero insieme di valori che ragionevolmente contiene
l’ignoto valore del parametro.
STIMA PUNTUALE E STIMA INTERVALLARE: PRO E CONTRO
STIMA PUNTUALE
PRO CONTRO
È sempre applicabile, la stima puntuale
è sempre calcolabile a partire dai soli
dati campionari.
È difficile avvicinarsi e azzeccare
l’ignoto valore del parametro con un
unico valore puntuale.
È semplice, basta procedere per
analogia: la media si stima con la media
del campione, la varianza si stima con la
varianza del campione e la frequenza
relativa si stima con la corrispondente
frequenza relativa campionaria.
L’affidabilità della stima puntuale
risiede tutta nella garanzia probabilistica
offerta dalle proprietà del
corrispondente stimatore.
STIMA INTERVALLARE
PRO CONTRO
E meno rischiosa perché è più facile
avvicinarsi all’ignoto valore del
parametro con un intervallo, un insieme
di valori.
Aumento della complessità nella
procedura di stima.
E più informativa poiché è un intervallo
offre un’informazione più ampia di un
unico valore.
Necessita informazioni in più oltre ai
dati campionari: esse sono informazioni
ausiliarie a priori sulla distribuzione di X
sulla U di studio.
L’affidabilità è quantificata con una
probabilità, scelta a priori, cioè fissata
prima di costruire la stima, a livello che
ci piace di più, ci interessa o ci conviene:
misura la probabilità con cui il
corrispondente estimatore intervallare
contiene effettivamente l’ignoto
Non è sempre riproducibile sulla base
di soldati campionari ma è calcolabile
soltanto qualora ci si trovi o nel caso di
una popolazione normale, o nel caso di
grandi campioni.
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Stima Intervallare: Concetti e Applicazioni in Statistica - Prof. Parroco e più Appunti in PDF di Statistica Sociale solo su Docsity!

LA STIMA INTERVALLARE

Cosa significa stima intervallare?

Stimare un intervallo significa trovare gli estremi di un intervallo che con una certa

probabilità contengono il valore vero del parametro. A differenza della stima

puntuale che produce un unico valore, la stima intervallare utilizza i dati

campionari per produrre un intero insieme di valori che ragionevolmente contiene

l’ignoto valore del parametro.

STIMA PUNTUALE E STIMA INTERVALLARE: PRO E CONTRO

STIMA PUNTUALE

PRO CONTRO

È sempre applicabile , la stima puntuale

è sempre calcolabile a partire dai soli

dati campionari.

È difficile avvicinarsi e azzeccare

l’ignoto valore del parametro con un

unico valore puntuale.

È semplice , basta procedere per

analogia: la media si stima con la media

del campione, la varianza si stima con la

varianza del campione e la frequenza

relativa si stima con la corrispondente

frequenza relativa campionaria.

L’affidabilità della stima puntuale

risiede tutta nella garanzia probabilistica

offerta dalle proprietà del

corrispondente stimatore.

STIMA INTERVALLARE

PRO CONTRO

E meno rischiosa perché è più facile

avvicinarsi all’ignoto valore del

parametro con un intervallo, un insieme

di valori.

Aumento della complessità nella

procedura di stima.

E più informativa poiché è un intervallo

offre un’informazione più ampia di un

unico valore.

Necessita informazioni in più oltre ai

dati campionari: esse sono informazioni

ausiliarie a priori sulla distribuzione di X

sulla U di studio.

L’affidabilità è quantificata con una

probabilità , scelta a priori, cioè fissata

prima di costruire la stima, a livello che

ci piace di più, ci interessa o ci conviene:

misura la probabilità con cui il

corrispondente estimatore intervallare

contiene effettivamente l’ignoto

Non è sempre riproducibile sulla base

di soldati campionari ma è calcolabile

soltanto qualora ci si trovi o nel caso di

una popolazione normale, o nel caso di

grandi campioni.

parametro.

Quando lavoriamo sulla stima intervallare noi lavoriamo su un parametro theta

(), ignoto ;

Supponiamo di voler stimare agli estremi a e b dell’intervallo di confidenza tale per

cui la probabilità che il parametro theta () sia lì= 1-

Prob { a ≤ θ ≤ b }= 1 − α

 Estremi: a e b

 1 − α livello di probabilità prefissato dal ricercatore ( di solito o al 95% o al 99%)

Come si calcolano gli estremi? Da cosa dipendono a e b?

a e b dipendono:

 Dalla stima (t), cioè il suo valore (relativo al parametro

θ )

 Dal livello di probabilità fissato una grandezza collegata a α

Dall’errore standard della stima

σ

t

(t= valore stima)

Queste condizioni definiscono il margine di errore , che ha formula

(

z

α

2

σ

t

FORMULA ESTREMI:

a = t- margine di errore

tz

α

2

σ

t

b = t+ margine di errore

t + z

α

2

σ

t

Dal punto di vista grafico, vediamo che:

α

è il pezzo di area che togli lateralmente a sinistra e a destra;

b= 3,93+ (1,960,34) = 4,*

Avremo una

Prob { 3 , 26 ≤ μ ≤ 4 , 61 }= 95 %

dei casi

Gli estremi definiscono l’ampiezza di un intervallo. Ampiezza= b-a

Per avere un intervallo più informativo l’obiettivo è avere minore variabilità , che,

all’aumentare di n determina maggiore informazione.

A seconda dei dati noti, la distribuzione è diversa:

Connoto o con n>30 si usa la normale standardizzata (z)

o

a = x −( z

α

2

σ

x )

o

b = x +( z

α

2

σ

x

)

Conignoto o con n<30 si usa la t di student (t)

o

a = x −( t

α

2

, n − 1 ∗ σ

x

)

o

b = x +( t

α ,

2

, n − 1 ∗ σ

x

Ma, in questo caso, per trovare il valore

t

α ,

2

, n − 1

, dobbiamo utilizzare la funzione Excel

=INV.T.2T(

α ; n − 1 )

La T di Student è una v.c diversa dalla

Z ∼ N ( 0 ; 1 )

, ma la sua funzione di densità è

molto simile : ha sempre forma campanulare ed è centrata sullo zero, ma ha

varianza più grande di 1. Rispetto alla Z ha le code più pesanti , cioè le code della

campana sono un po’ più lontane dall’asse delle ascisse, c’è più aria sotto le code per

effetto di una maggiore variabilità della T rispetto alla Z. La v.c T di Student ha solo

un parametro, detto gradi di libertà.

TCL E INTERVALLI DI CONFIDENZA PER GRANDI CAMPIONI PER LA

MEDIA E PER LA PERCENTUALE

Costruire un intervallo di confidenza richiede, rispetto alla stima puntuale, delle

informazioni in più. Se non abbiamo informazioni ausiliarie a priori su X , cioè se

non siamo nel caso di popolazione normale, diventa necessario compensare con

molti dati , cioè essere nel caso di grandi campioni. Solamente se il campione è

sufficientemente grande possiamo infatti appellarci a un teorema di teoria delle

probabilità fondamentale nell’inferenza statistica, che consente di recuperare la

normalità degli stimatori ( studentizzati ). Questo teorema si chiama teorema centrale

del limite.

Qualunque sia la distribuzione del fenomeno X in U, se l’ampiezza campionaria n

tende all’infinito , allora gli stimatori ( standardizzati ) media campionaria e

frequenza relativa campionaria sono Normali.

Nella pratica, però, i campioni possono essere grandi , ma ovviamente non sono

infiniti : quando n è sufficientemente grande gli stimatori media campionaria e

frequenza relativa campionaria studentizzati sono approssimativamente

Normali.

Siccome con n sufficientemente grande, grazie al TCL , ritroviamo

approssimativamente la Normale , allora per grandi campioni possiamo usare la

metodologia degli intervalli di confidenza basata sulla Z. Qui, però, la normalità è

approssimata e conseguentemente si tratterà di intervalli di confidenza

approssimati per grandi campioni con un effettivo livello di confidenza

approssimativamente pari a quello scelto.

ISTRUZIONI D’USO E AVVERTENZE PER GLI INTERVALLI DI

CONFIDENZA (IC)

Quali rischi si corrono se la realtà è lontana dalle condizioni iniziali che abbiamo

ipotizzato?

Se la popolazione non è normale come crediamo se il campione non è

bernoulliano o, ancora, se n non è sufficientemente grande perché comincia a

funzionare il TCL , allora il problema è che non c’è più garanzia probabilistica che l’IC

abbia il livello di confidenza che abbiamo scelto.

La conseguenza è che l’inferenza statistica non ha l’affidabilità che vogliamo,

l’errore che commettiamo non è più puramente campionario e non è più

quantificabile in termini probabilistici.

Un intervallo di confidenza ha associato un livello di confidenza nominale , che

coincide con (1-) scelto, ma anche un livello di confidenza effettivo chiamato

copertura. La copertura effettiva dipende dalla reale distribuzione di X. Solo se X

è certamente normale allora la copertura coincide con il livello di confidenza

nominale e l’intervallo di confidenza è esatto. In tutti gli altri casi, cioè quando la

popolazione normale è solo un’assunzione che si ritiene vicina alla realtà oppure