








Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Appunti e dispense su inferenza statistica
Tipologia: Appunti
1 / 14
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!









Definizione:
L’inferenza statistica è un insieme di metodi che permettono di estrarre informazioni su una caratteristica
(come per esempio media, varianza ecc.) della popolazione da un “sottoinsieme” della stessa, detto anche
campione.
Osservazione:
La costruzione di un campione rappresentativo è un problema rilevante che richiede tecniche note come
tecniche di campionamento.
Si suppone che tutte le unità statistiche abbiano la stessa probabilità di essere estratte.
Definizione:
Un campione casuale è una ennupla (cioè n variabile) di variabili casuali (o aleatorie) indipendenti tra di
loro e identicamente distribuite , ovvero X 1
2
n
indipendenti e identicamente distribuite, cioè
i
X (deve essere specificata a priori), dove X è detta popolazione generatrice.
[sono variabili che hanno le stesse caratteristiche, stessa probabilità, stessa media ecc.]
N è un numero finito ed è detto ampiezza del campione.
Calcolare la funzione di probabilità di un campione di ampiezza n generato da una popolazione X
P ( λ ),
X che si distribuisce come una Poisson di parametro landa
1
2
n
--> i (indipendenti) i (identicamente) d (distribuite)
Sono distribuite come X i
X P ( λ ).
P ( λ ) ha support S x
= {0, 1, 2, …} P(x) = ¿
x
/x!) e
Definizione:
Poiché X 1
2
n
, sono indipendenti la probabilità congiunta è il prodotto delle probabilità.
1
= x 1
2
= x 2
n
= x n
) = p (x 1
) p (x 2
) … p (x n
x
/x 1
!) e
x
/x 2
!) e
xn
/x n
!) e
= ( λ
x1 + x2 + … + xn
1
2
n
Dato il campione di ampiezza n con X i
E ( λ ), con i = 1, 2, …, n. Calcolare la funzione di densità
congiunta.
Nota la densità di ciascun campione: f x
(x) =
λ e
con x
f x1, x2, …, xn
(x 1
, x 2
, …, x n
) = f x
(x 1
) f x
(x 2
) … f xn
(x n
) = λ e
λ e
λ e
= λ
n
e
1
2
n
prendono il nome di esiti campionari
Definizione:
Si definisce statistica (chiamata anche statistica campionaria) una funzione degli esiti campionari.
Una statistica campionaria serve per stimare una caratteristica della popolazione.
Data una popolazione generatrice X f x
(x,
θ ) o X P x
(x,
θ ), il problema dell’ inferenza
parametrica è quello di costruire una statistica per stimare θ.
La stima può essere:
Puntuale (un valore preciso);
Intervallare (un intervallo che contiene il parametro)
Definizione:
Uno stimatore del parametro
θ della popolazione è una statistica campionaria, cioè una funzione degli esiti
campionari.
T = t (X 1
2
n
θ = t ((X 1
2
n
T (o
θ
) è una variabile aleatoria o casuale.
Quando si sostituisce al posto delle variabili delle osservazioni si ottiene una stima (cioè un numero)
si suppone di avere un campione di ampiezza 4 e siano X 1
2
3
4
i i d con media
μ .
Si osserva che x 1
= 2, x 2
= 3, x 3
= 1, x 4
= t (X 1
2
3
4
Stima:
^ μ = t (X 1
2
3
4
) = t (2, 3, 1, 1) =
Stima puntuale – Proprietà di uno stimatore
Sia
θ n
= t
n
uno stimatore del parametro θ della popolazione.
a) Correttezza.
θ n
è uno stimatore corretto se E [
θ n
] = θ
Se E [
θ n
≠ θ lo stimatore si dice distorto e si definisce distorsione o Bias --> Bias (
θ n
θ n
θ
--> Distorto (
θ n
θ n
θ
b) Asintoticamente corretto
Definizione:
Uno stimatore
θ n
è asintoticamente corretto se
lim
n → ∞
θ n
] = θ
Si considera un campione di ampiezza n di variabili i i d con media
μ e varianza
σ
2
. Si consideri lo
stimatore media campionaria definito da X n
n
i = 1
n
i
a) Mostrare che è uno stimatore corretto di
μ
b) Calcolare la sua varianza
a) Se E [
n
μ allora
n
è uno stimatore corretto di
μ
n
n
i = 1
n
i
n
i = 1
n
i
n
i = 1
n
i
i
] = μ per ogni i)
n
i = 1
n
μ =
n
( μ + μ + … + μ ) =
n μ
n
= μ (è uno stimatore corretto)
n
ha Bias uguale a zero (perché stimatore corretto)
b) Calcolo varianza di X n
(media campionaria)
n
n
i = 1
n
i
n
2
i = 1
n
i
Osservazione:
i
e X j
sono indipendenti per ogni coppia i, j allora cov (X i
j
= 1 / n
2
i = 1
n
i
) = 1 / n
2
i = 1
n
σ
2
= 1/n
2
( σ
2
2
2
) = n σ
2
/ n
2
= σ
2
/ n
Osservazione:
la media campionaria X n
n
i = 1
n
i
è uno stimatore corretto della media E [ X n
] = μ , mentre la
varianza della media campionaria tende a zero per n che tende a più infinito.
1
n
n
μ
n
2
1
n
n
) + 2 cov (X 1
n
n
μ
2
/ n
2
1
n
σ
2
σ
2
n
2
σ
2
n
cov (X 1
n
μ
2
/ n
2
) --> cov (X 1
n
) = 0 perché indipendenti
= σ
2
2
) σ
2
2
/ n
2
lim
n → + ∞
lim
n → + ∞
σ 2
2
) σ
2
2
/ n
2
) = σ
2
--> gli altri sono uguali a zero
Media campionaria -->
n
^ μ
n
n
i = 1
n
i
i
i i d media μ e varianza σ
2
La media campionaria è uno stimatore corretto E [
n
μ
n
) = 0 per ogni n ed è consistente E [(
n
μ )
2
n
σ
2
/ n
Varianza campionaria --> s
2
n − 1
i = 1
n
i
n
2
a) E ( X
n
) = μ V ( X
n
) = σ
2
/ n --> E [ X
n
2
n
n
2
= σ
2
/ n + μ
2
b) E [X i
] = μ V (X i
) = σ
2
i
n
i
2
= σ
2
2
c)
i = 1
n
i
= n
n
E [s
2
n
i = 1
n
i
n
2
n − 1
i = 1
n
i
2
i = 1
n
n
2
i = 1
n
i
n
n − 1
i = 1
n
i
2
n
2
i = 1
n
i
] --> per la proprietà c:
i = 1
n
i
= n X
n
n − 1
i = 1
n
i
2
n
2
n
2
n − 1
i = 1
n
i
2
) – n E [ X
n
2
n − 1
i = 1
n
i
2
] – n [( σ
2
/ n) + μ
2
= E [s
2
n − 1
i = 1
n
2
2
2
2
n − 1
[ n σ
2
2
2
2
n − 1
σ
2
(n – 1) = σ
2
Osservazione:
Lo stimatore
σ ^
2
n
i = 1
n
i
n
2
non è corretto E [
σ ^
2
n − 1
n
σ
2
--> asintoticamente corretto ma non
corretto.
Momenti campionari
Dato un campione X 1
2
n
i
i i d X μ k
k
] --> momento di ordine k di X
μ
k
i
k
] con k = 1 (media), 2, 3, …
Momento campionario di ordine k è definito M K
n
i = 1
n
i
k
k
è uno stimatore corretto di
μ
k
Dimostrazione:
k
n
i = 1
n
i
k
n
i = 1
n
i
k
n
i = 1
n
i
k
n
i = 1
n
μ k
= (n -
μ
k
/ n) =
μ
k
Metodi di stima: il metodo dei momenti
Sia dato il campione X 1
2
n
estratto dalla distribuzione P (x; θ ) = θ x = 1
θ x = 2
Siano n = 5 con X 1
2
3
4
5
x
Stimare il parametro θ con il metodo dei momenti.
μ = E [X] = 1
θ
θ ) =
θ
θ = 2 -
θ
μ = 2 – θ θ = 2 – μ
Lo stimatore di
θ si costruisce sostituendo a
μ lo stimatore di
μ
θ
i
n
i
n
Metodo dei momenti
Si indica con μ k
k
] il momento d’ordine k e con M k
n
i = 1
n
i
k
i momenti campionari che sono stimatori
corretti di μ k
Lo schema del metodo consiste:
1. Calcolare tanti momenti teorici quanti sono i parametri da determinare.
Se si hanno m parametri da stimare, servono m momenti:
μ 1
= g 1
( θ 1
, θ 2
, θ 3,
…, θ m
μ
2
= g 2
θ
1
θ
2
θ
3,
θ
m
μ
m
= g
m
( θ
1
, θ
2
, θ
3,
…, θ
m
2. Invertire le funzioni pe ottenere
θ
1
= v 1
μ
1
μ
2
μ
m
θ
2
= v
1
( μ
1
, μ
2
, …, μ
m
θ
m
= v 1
μ
1
μ
2
μ
m
3. Sostituire i momenti teorici con quelli campionari M k
θ i
= v
i
1
2
m
) con i = 1, 2, …, m
Si consideri il campione X 1
2
n
generato dalla popolazione X N (
μ ,
σ
2
). Stimare
μ e
σ
2
con il
metodo dei momenti sapendo che il campione osservato è 1; 0; -1; 2; 5; 1; 0; 1; 1.
μ
1
μ
μ
2
2
μ )
2
μ
2
σ
2
μ 1
= θ 1
g 1
= θ 1
μ
2
θ
2
θ
1
2
g 2
θ
2
θ
1
2
μ
1
σ
2
= μ 2
2
l’ (p) = r
p
1 − p
r
p
n − r
1 − p
r ( 1 − p )−( n − r ) p
p ( 1 − p )
R – r p – n p + r p = 0; r = n p; ^ p =
r
n
i = 1
n
x i
/ n) = X n
La derivata seconda, inoltre, deve essere negativa
Efficienza
Dati due stimatori dello stesso parametro T 1
2
si può dire che T
1
è più efficiente di T
2
se
1
2
2
2
1
2
Stima per intervalli
Teorema 1:
Se X 1
2
n
sono variabili normali allora ogni loro combinazione è una variabile normale.
i = 1
n
c i
i
Y è normale
Se X i
μ ,
σ
2
) i i d allora
n
n
i = 1
n
i
N ( μ , σ
2
/n) per ogni n
Teorema limite centrale
Siano X 1
2
n
variabili con media μ e varianza σ
2
i
] = μ V (X i
) = σ
2
allora
n
i = 1
n
i
μ ,
σ
2
/n) per n che tende a + infinito
Teorema:
Se si considera lo stimatore varianza campionaria: s
2
n − 1
i = 1
n
1
n
2
(n – 1) s
2
σ
2
2
n—
distribuzione CHI
2
Distribuzione CHI n-
2
--> n – 1 sono i gradi di libertà
CHI (n-1)
= {x
0} f (x) = a X
(n-1)/
e
--> a costante di normalizzazione
La CHI
2
n
i = 1
n
i
2
i
1
2
n
indipendenti
Distribuzione t – Student
t n-
X n − μ
s
n
--> s
2
è la varianza campionaria
t n
2
n
/n) --> Z N (0, 1)
t n
è una normale mentre t n-
è una t di student
n
n
i = 1
n
i
i
μ ,
σ
2
/n)
∀ n --> media campionaria
σ
2
non è nota
t – student è il rapporto tra una normale standardizzata (Z N (0, 1)) e una CHI
2
con un certo
numero di gradi di libertà.
Stime intervallari
Si analizza gli stimatori per la media di una popolazione normale in due ipotesi diverse:
μ ,
σ
2
i
i i d con i = 1, 2, …, n
Se σ
2
è nota allora si definisce l’intervallo di confidenza a livello di confidenza 1 – α come segue:
n
1 – (alfa)/
σ
√ n
n
1 – (alfa)/
σ
√ n
Intervallo casuale
n
1 – (alfa)/
σ
√ n
≤ μ ≤ X
n
1 – (alfa)/
σ
√ n
) = 1 - α se α fosse 0 ci sarebbe Z
1
che coincide con ∞
Margine di errore
Dimostrazione:
1 – (alfa)/
n
σ
√ n
1 – (alfa)/
) = 1 – α
Derivazione standard
f t(n-1)
è simmetrica. Rispetto all’origine è simile alla
densità della normale standardizzata con code più
alte.
2
n-1; alfa/
≥ σ
2
/ ((n-1) s
2
2
n-1; 1 – (alfa/2)
) = 1 - α
(si moltiplica per (n – 1) s
2
tutti i membri e si ottiene
P (((n-1) s
2
2
n-1; alfa/
≥ σ
2
≥ ((n-1) s
2
2
n-1; 1 – (alfa/2)
) = 1 - α
P (((n-1) s
2
2
n-1; alfa/
≤ σ
2
≤ ((n-1) s
2
2
n-1; 1 – (alfa/2)
) = 1 - α
Sia X N ( μ , σ
2
) con σ = 15
Viene estratto un campione casuale di ampiezza n = 225 dal quale risulta una media campionaria pari a 20.
x
n
= 20 (osservazione della media campionaria)
distino dal valore centrale 1. Quanto deve essere grande il campione?
μ .
x
n
σ
n
1 – (alfa)/
α ;
α = 0,
0,
x n
σ
n
0,
21,65 o 18,
μ ∈ [18,35; 21,65]
≤ μ ≤ 21,65) = 0,
dal valore centrale 1. Quanto deve essere grande il campione?
n
2
Sia α = 0,05 e si suppone di avere un campione di 10 elementi con s
2
= 4. Trovare l’intervallo di confidenza
per la media sapendo che la media campionaria è X n
Info: Z 0,
= - 1,2 t 10,
= 2,5 t 9; 0,
= 2,262 t 8,
Formula da usare è: X n
- t n-1, 1 – (alfa/2)
s
n
n
+ t n-1, 1 – (alfa/2)
s
n
si usa la t – student
α
Un’azienda è in perdita di 20 mattoni al giorno con una varianza campionaria s
2
Assumendo un campione normale, determinare l’intervallo di confidenza al 95% della varianza.
P (((n-1) s
2
2
n-1; alfa/
≤ σ
2
≤ ((n-1) s
2
2
n-1; 1 – (alfa/2)
) = 1 - α
n = 20 s
2
= 0,1 1 – α = 0,95 quindi α = 0,05 α /2 = 0,
Info: CHI
2
19; 0,
2
19; 0,
Prova d’ipotesi (test d’ipotesi)
La prova d’ipotesi è uno schema per stabilire se un’ipotesi su un parametro della popolazione può essere
“accettata” o meglio “non rifiutata” conoscendo solo una statistica (cioè uno stimatore) di quel parametro.
Si suppone di avere un campione normale e di voler testare che la media della popolazione sia un valore
pari a μ 0
( ipotesi nulla: H 0
) e non un valore pari a μ 1
( ipotesi alternativa: H 1
). Queste due si dicono ipotesi
semplici perché sono numeri e sono uguaglianze.
In quest’esempio la statistica (stimatore) da usare è la media campionaria.
Il punto chiave è definire la regione di rifiuto (R)
Errore di prima specie è la probabilità di rifiutare H 0
quando H 0
è vera: P (R | H 0
α --> |: “condizionato a ”
Errore di seconda specie è la probabilità di accettare quando è vera l’ipotesi alternativa.
Se R è la regione di rifiuto e A è la regione di accettazione (S x
1
) = β
β è detta potenza del test
Il problema è estrarre un campione e valutare uno stimatore di θ su le realizzazioni del campione
θ
= t (X 1
2
n
) e si calcola sulle osservazioni x 1
, x 2
, …, x n
e si dovrà valutare se la stima
θ = t (x 1
, x 2
, …, x n
) permette di confermare l’ipotesi nulla oppure no.
Quindi, associato a questo problema si hanno due errori:
Errore di prima specie: P (rifiuto H 0
0
) = α
Errore di seconda specie: P (NON rifiutare H 0
1
β
La prova di ipotesi ha come obiettivo minimizzare entrambi gli errori e il test che minimizza ciò
α e β fu formulato da Neyman e Pearson.
La regione di rifiuto deve avere la forma --> R : L (
θ
0
θ
1
K è scelta in modo che P (L ( θ 0
) / L ( θ
1
) ≤ K) = α
Si cerca P ( X n
x
0
) = α = P (Z < Z
c
c
μ
0
1-alfa
σ /
n --> coda a sinistra
Ipotesi complesse
0
μ =¿ μ
0
(semplice)
1
--> μ ≠ μ 0
--> ipotesi complessa perché definita da una diseguaglianza
Si fissa alfa (errore di prima specie)
n
L
∪ (unione) X n
U
n
L
(unione)
n
U
α
Si deve trovare X L
e X u
con la standardizzazione
L
μ
0
σ /
n = Z L
L
alfa/
1 – (alfa/2)
L
μ
0
σ /
n = Z U
U
1 – (alfa/2)
U
μ
0
1 – (alfa/2)
σ /
n )
Altra ipotesi
0
μ ≥ μ
0
1
--> μ < μ 1
Coda da eliminare è la sinistra e la zona di rifiuto è: R :
n
c
n
c
0
α
c
- μ
0
) / σ /
n
alfa
1 – alfa
X N ( μ , σ
2
) σ
2
= 16 n = 64 campione casuale
Date le due ipotesi: H 0
: μ 0
1
: μ 1
a) Definire la probabilità di commettere un errore di prima specie e quindi determinare il punto critico e la
regione di rifiuto per l’ipotesi nulla a livello di significatività α = 0,
P (Rifiutare H 0
0
) = α
È la probabilità di rifiutare H 0
quando questa è vera.
Media campionaria > X c
(eliminare coda a destra) R : X
n
c
1 – 0,
0,
0,
c
μ
0
σ /
n = Z 1 – alfa
c
0,
Se maggiore di questo numero si rifiuta
b) Definire la potenza del test e calcolarla
La potenza del test è la probabilità di rifiutare l’ipotesi nulla quando questa non è vera.
β = P (rifiutare H 0
1
n
1
Per trovare la potenza del test normalizzare per
μ
1
e non per
μ
0
n
μ
1
σ /
n = (20,22 – 22) / 4/8 = - 2,
0,
0,
) --> si elimina la coda si sinistra, in cui l’area equivale a 0,
0,
) = 1 – 0,0091 = 0,99 --> test molto affidabile