



Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Una spiegazione dettagliata della stima intervallare in statistica, confrontandola con la stima puntuale e illustrando i vantaggi e gli svantaggi di ciascuna. Vengono approfonditi i concetti di livello di confidenza, errore standard e ampiezza dell'intervallo, con esempi pratici e formule per il calcolo degli estremi. Anche il ruolo del teorema centrale del limite (tcl) nella costruzione di intervalli di confidenza per grandi campioni.
Tipologia: Appunti
1 / 6
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!




Cosa significa stima intervallare?
Stimare un intervallo significa trovare gli estremi di un intervallo che con una certa
probabilità contengono il valore vero del parametro. A differenza della stima
puntuale che produce un unico valore, la stima intervallare utilizza i dati
campionari per produrre un intero insieme di valori che ragionevolmente contiene
l’ignoto valore del parametro.
È sempre applicabile , la stima puntuale
è sempre calcolabile a partire dai soli
dati campionari.
È difficile avvicinarsi e azzeccare
l’ignoto valore del parametro con un
unico valore puntuale.
È semplice , basta procedere per
analogia: la media si stima con la media
del campione, la varianza si stima con la
varianza del campione e la frequenza
relativa si stima con la corrispondente
frequenza relativa campionaria.
L’affidabilità della stima puntuale
risiede tutta nella garanzia probabilistica
offerta dalle proprietà del
corrispondente stimatore.
E meno rischiosa perché è più facile
avvicinarsi all’ignoto valore del
parametro con un intervallo, un insieme
di valori.
Aumento della complessità nella
procedura di stima.
E più informativa poiché è un intervallo
offre un’informazione più ampia di un
unico valore.
Necessita informazioni in più oltre ai
dati campionari: esse sono informazioni
ausiliarie a priori sulla distribuzione di X
sulla U di studio.
L’affidabilità è quantificata con una
probabilità , scelta a priori, cioè fissata
prima di costruire la stima, a livello che
ci piace di più, ci interessa o ci conviene:
misura la probabilità con cui il
corrispondente estimatore intervallare
contiene effettivamente l’ignoto
Non è sempre riproducibile sulla base
di soldati campionari ma è calcolabile
soltanto qualora ci si trovi o nel caso di
una popolazione normale, o nel caso di
grandi campioni.
parametro.
Quando lavoriamo sulla stima intervallare noi lavoriamo su un parametro theta
( ), ignoto ;
Supponiamo di voler stimare agli estremi a e b dell’intervallo di confidenza tale per
cui la probabilità che il parametro theta ( ) sia lì= 1-
Estremi: a e b
1 − α livello di probabilità prefissato dal ricercatore ( di solito o al 95% o al 99%)
Come si calcolano gli estremi? Da cosa dipendono a e b?
a e b dipendono:
θ )
Dal livello di probabilità fissato una grandezza collegata a α
Dall’errore standard della stima
σ
t
(t= valore stima)
Queste condizioni definiscono il margine di errore , che ha formula
(
z
α
2
∗ σ
t
FORMULA ESTREMI:
a = t- margine di errore
t − z
α
2
∗ σ
t
b = t+ margine di errore
t + z
α
2
∗ σ
t
Dal punto di vista grafico, vediamo che:
α
è il pezzo di area che togli lateralmente a sinistra e a destra;
b= 3,93+ (1,960,34) = 4,*
Avremo una
dei casi
Gli estremi definiscono l’ampiezza di un intervallo. Ampiezza= b-a
Per avere un intervallo più informativo l’obiettivo è avere minore variabilità , che,
all’aumentare di n determina maggiore informazione.
A seconda dei dati noti, la distribuzione è diversa:
Con noto o con n>30 si usa la normale standardizzata (z)
o
a = x −( z
α
2
∗ σ
x )
o
b = x +( z
α
2
∗ σ
x
)
Con ignoto o con n<30 si usa la t di student (t)
o
a = x −( t
α
2
, n − 1 ∗ σ
x
)
o
b = x +( t
α ,
2
, n − 1 ∗ σ
x
Ma, in questo caso, per trovare il valore
t
α ,
2
, n − 1
, dobbiamo utilizzare la funzione Excel
α ; n − 1 )
La T di Student è una v.c diversa dalla
, ma la sua funzione di densità è
molto simile : ha sempre forma campanulare ed è centrata sullo zero, ma ha
varianza più grande di 1. Rispetto alla Z ha le code più pesanti , cioè le code della
campana sono un po’ più lontane dall’asse delle ascisse, c’è più aria sotto le code per
effetto di una maggiore variabilità della T rispetto alla Z. La v.c T di Student ha solo
un parametro, detto gradi di libertà.
TCL E INTERVALLI DI CONFIDENZA PER GRANDI CAMPIONI PER LA
MEDIA E PER LA PERCENTUALE
Costruire un intervallo di confidenza richiede, rispetto alla stima puntuale, delle
informazioni in più. Se non abbiamo informazioni ausiliarie a priori su X , cioè se
non siamo nel caso di popolazione normale, diventa necessario compensare con
molti dati , cioè essere nel caso di grandi campioni. Solamente se il campione è
sufficientemente grande possiamo infatti appellarci a un teorema di teoria delle
probabilità fondamentale nell’inferenza statistica, che consente di recuperare la
normalità degli stimatori ( studentizzati ). Questo teorema si chiama teorema centrale
del limite.
Qualunque sia la distribuzione del fenomeno X in U, se l’ampiezza campionaria n
tende all’infinito , allora gli stimatori ( standardizzati ) media campionaria e
frequenza relativa campionaria sono Normali.
Nella pratica, però, i campioni possono essere grandi , ma ovviamente non sono
infiniti : quando n è sufficientemente grande gli stimatori media campionaria e
frequenza relativa campionaria studentizzati sono approssimativamente
Normali.
Siccome con n sufficientemente grande, grazie al TCL , ritroviamo
approssimativamente la Normale , allora per grandi campioni possiamo usare la
metodologia degli intervalli di confidenza basata sulla Z. Qui, però, la normalità è
approssimata e conseguentemente si tratterà di intervalli di confidenza
approssimati per grandi campioni con un effettivo livello di confidenza
approssimativamente pari a quello scelto.
ISTRUZIONI D’USO E AVVERTENZE PER GLI INTERVALLI DI
CONFIDENZA (IC)
Quali rischi si corrono se la realtà è lontana dalle condizioni iniziali che abbiamo
ipotizzato?
Se la popolazione non è normale come crediamo se il campione non è
bernoulliano o, ancora, se n non è sufficientemente grande perché comincia a
funzionare il TCL , allora il problema è che non c’è più garanzia probabilistica che l’IC
abbia il livello di confidenza che abbiamo scelto.
La conseguenza è che l’inferenza statistica non ha l’affidabilità che vogliamo,
l’errore che commettiamo non è più puramente campionario e non è più
quantificabile in termini probabilistici.
Un intervallo di confidenza ha associato un livello di confidenza nominale , che
coincide con (1-) scelto, ma anche un livello di confidenza effettivo chiamato
copertura. La copertura effettiva dipende dalla reale distribuzione di X. Solo se X
è certamente normale allora la copertura coincide con il livello di confidenza
nominale e l’intervallo di confidenza è esatto. In tutti gli altri casi, cioè quando la
popolazione normale è solo un’assunzione che si ritiene vicina alla realtà oppure