Modelli lineari generalizzati | Dispense di Statistica

di Samantha Leorato

verosimiglianza Funzione dei parametri di un modello statistico (➔) che può essere interpretata

come la probabilità (➔) di ottenere esattamente i dati effettivamente osservati.

Basi matematiche. Per formalizzare, si consideri un modello parametrico F={f(x;θ),θ∈Θ} per la

distribuzione di una variabile aleatoria X (➔ variabile aleatoria), dove f è una funzione di massa di

probabilità, se X è una variabile aleatoria discreta o una densità, se X è continua, θ è il parametro o

il vettore di parametri che identificano univocamente la distribuzione, e Θ è lo spazio dei parametri.

Dato un valore x della variabile casuale, la funzione di v. è la funzione di θ definita da

L(θ;x)=f(x;θ). In altre parole, la funzione di v. misura la ‘plausibilità’ dell’ipotesi che la

distribuzione della popolazione sia proprio f(.;θ) (cioè che il parametro sia θ), avendo osservato

X=x. Per es., si consideri il lancio di una moneta e la variabile aleatoria X che prende valore 1 se il

risultato è testa e 0 altrimenti. Tale variabile casuale segue una legge di Bernoulli (➔ Bernoulli,

distribuzione di) con parametro p, dove p è la probabilità di osservare testa (p=1/2 corrisponde al

caso di una moneta perfettamente bilanciata). Avendo osservato X=1, la funzione di v. è uguale a

L(p;1)=P(X=1)=p. La v., quindi, è massima, e uguale a 1, se p=1, mentre è nulla se p=0, cioè è

inverosimile che la probabilità di ottenere ‘testa’ nel lancio di una moneta sia uguale a 0 visto che il

risultato del lancio è stato proprio ‘testa’.

Applicazioni statistiche. La v. ha un ruolo fondamentale nell’inferenza statistica (➔). Essa è alla

base del metodo di stima, detto della massima verosimiglianza (➔ verosimiglianza massima,

metodo della), che propone di stimare θ con il valore più ‘plausibile’ nello spazio dei parametri,

cioè quello che massimizza la verosimiglianza. La funzione di v. è anche la base di un insieme di

metodi per la verifica di ipotesi annidate (➔ ipotesi statistica), di cui fanno parte il metodo del

rapporto delle v., il metodo di Wald, e il metodo dei moltiplicatori di Lagrange (➔ test basati sulla

funzione di verosimiglianza). Dato un particolare campione x=(x1,...,xn) tratto in modo casuale dal

modello statistico F={f(x;θ),θ∈Θ} (➔ campione statistico), la funzione di v. calcolata in θ risulta

L(θ;x)=Πni=1f(xi;θ). Ritornando all’esempio del lancio di una moneta, si assuma di avere osservato 3

lanci con i risultati x1=testa, x2=croce e x3=testa. Se la probabilità di ottenere testa è p in ciascun

lancio, allora la funzione di v. è uguale a L(p;x1,x2,x3)=p2(1−p). Poiché il punto di massimo di questa

funzione soddisfa la condizione del primo ordine 2p−3p2=0, lo stimatore di massima v. di θ è

p^=2/3 e coincide quindi con la frequenza relativa del numero di teste osservate sui 3 lanci. In molte

situazioni è più conveniente lavorare con il logaritmo della funzione di v., detta anche funzione di

logverosimiglianza. Se infatti la funzione di v. viene definita dalla produttoria L(θ;x)=Πni=1f(xi;θ),

allora la logverosimiglianza viene definita dalla sommatoria logL(θ;x)=Σni=1 log(f(xi;θ)), che è

generalmente più semplice da trattare. Un altro metodo per ottenere la stima di massima v. è,

equivalentemente, quello di massimizzare una qualunque di queste due funzioni.

Samantha Leorato

verosimiglianza massima, metodo della

Dizionario di Economia e Finanza (2012)

di Samantha Leorato

verosimiglianza massima, metodo della Metodo di stima dei parametri di un modello statistico,

basato sulla massimizzazione della funzione di verosimiglianza (➔). Si assuma il modello

parametrico (➔ modello statistico) F={f(x;θ),θ∈Θ}, dove f(x;θ) è una funzione di massa di

probabilità o una densità, θ è per semplicità un singolo parametro incognito, e Θ è lo spazio dei

parametri. Dato un campione casuale x={x1,...xn} dalla popolazione, la funzione di v. è definita da

L(θ;x)=Πni=1f(xi;θ). Il metodo della massima verosimiglianza (MV) propone di stimare θ attraverso

quel valore θ^ tale che L(θ^;x)≥L(θ;x) per ogni θ∈Θ. In altre parole, la stima di v. m. di θ è il valore

più ‘plausibile’ nello spazio dei parametri alla luce dell’evidenza empirica. Lo stimatore di MV è

spesso calcolato attraverso la massimizzazione della logverosimiglianza, ossia del logaritmo della

funzione di verosimiglianza. Trattandosi di una trasformazione monotona (➔ monotono),

Anteprima parziale del testo

Scarica Modelli lineari generalizzati e più Dispense in PDF di Statistica solo su Docsity!

di Samantha Leorato verosimiglianza Funzione dei parametri di un modello statistico (➔) che può essere interpretata come la probabilità (➔) di ottenere esattamente i dati effettivamente osservati. Basi matematiche. Per formalizzare, si consideri un modello parametrico F={ f ( x ; θ ), θ ∈ Θ } per la distribuzione di una variabile aleatoria X (➔ variabile aleatoria), dove f è una funzione di massa di probabilità, se X è una variabile aleatoria discreta o una densità, se X è continua, θ è il parametro o il vettore di parametri che identificano univocamente la distribuzione, e Θ è lo spazio dei parametri. Dato un valore x della variabile casuale, la funzione di v. è la funzione di θ definita da L ( θ ; x )= f ( x ; θ ). In altre parole, la funzione di v. misura la ‘plausibilità’ dell’ipotesi che la distribuzione della popolazione sia proprio f (.; θ ) (cioè che il parametro sia θ ), avendo osservato X = x. Per es., si consideri il lancio di una moneta e la variabile aleatoria X che prende valore 1 se il risultato è testa e 0 altrimenti. Tale variabile casuale segue una legge di Bernoulli (➔ Bernoulli, distribuzione di) con parametro p , dove p è la probabilità di osservare testa ( p =1/2 corrisponde al caso di una moneta perfettamente bilanciata). Avendo osservato X =1, la funzione di v. è uguale a L ( p ;1)= P ( X =1)= p. La v., quindi, è massima, e uguale a 1, se p =1, mentre è nulla se p =0, cioè è inverosimile che la probabilità di ottenere ‘testa’ nel lancio di una moneta sia uguale a 0 visto che il risultato del lancio è stato proprio ‘testa’. Applicazioni statistiche. La v. ha un ruolo fondamentale nell’inferenza statistica (➔). Essa è alla base del metodo di stima, detto della massima verosimiglianza (➔ verosimiglianza massima, metodo della), che propone di stimare θ con il valore più ‘plausibile’ nello spazio dei parametri, cioè quello che massimizza la verosimiglianza. La funzione di v. è anche la base di un insieme di metodi per la verifica di ipotesi annidate (➔ ipotesi statistica), di cui fanno parte il metodo del rapporto delle v., il metodo di Wald, e il metodo dei moltiplicatori di Lagrange (➔ test basati sulla funzione di verosimiglianza). Dato un particolare campione x =( x 1 ,..., x n) tratto in modo casuale dal modello statistico F ={ f ( x ; θ ), θ ∈ Θ } (➔ campione statistico), la funzione di v. calcolata in θ risulta L ( θ ;x)=Πni=1 f ( x i; θ ). Ritornando all’esempio del lancio di una moneta, si assuma di avere osservato 3 lanci con i risultati x 1 =testa, x 2 =croce e x 3 =testa. Se la probabilità di ottenere testa è p in ciascun lancio, allora la funzione di v. è uguale a L ( p ; x 1 , x 2 , x 3 )=p^2 (1− p ). Poiché il punto di massimo di questa funzione soddisfa la condizione del primo ordine 2 p −3 p^2 =0, lo stimatore di massima v. di θ è p^ =2/3 e coincide quindi con la frequenza relativa del numero di teste osservate sui 3 lanci. In molte situazioni è più conveniente lavorare con il logaritmo della funzione di v., detta anche funzione di logverosimiglianza. Se infatti la funzione di v. viene definita dalla produttoria L ( θ ; x )=Πni=1 f ( x i; θ ), allora la logverosimiglianza viene definita dalla sommatoria log L ( θ ; x )=Σni=1 log( f ( x i; θ )), che è generalmente più semplice da trattare. Un altro metodo per ottenere la stima di massima v. è, equivalentemente, quello di massimizzare una qualunque di queste due funzioni. Samantha Leorato

verosimiglianza massima, metodo della

Dizionario di Economia e Finanza (2012) di Samantha Leorato verosimiglianza massima, metodo della Metodo di stima dei parametri di un modello statistico, basato sulla massimizzazione della funzione di verosimiglianza (➔). Si assuma il modello parametrico (➔ modello statistico) F={ f ( x ; θ ), θ ∈ Θ }, dove f ( x ; θ ) è una funzione di massa di probabilità o una densità, θ è per semplicità un singolo parametro incognito, e Θ è lo spazio dei parametri. Dato un campione casuale x={ x 1 ,... x n} dalla popolazione, la funzione di v. è definita da L ( θ ; x )=Πni=1 f ( x i; θ ). Il metodo della massima verosimiglianza (MV) propone di stimare θ attraverso quel valore θ^ tale che L ( θ^ ; x )≥ L ( θ ; x ) per ogni θ ∈ Θ. In altre parole, la stima di v. m. di θ è il valore più ‘plausibile’ nello spazio dei parametri alla luce dell’evidenza empirica. Lo stimatore di MV è spesso calcolato attraverso la massimizzazione della logverosimiglianza, ossia del logaritmo della funzione di verosimiglianza. Trattandosi di una trasformazione monotona (➔ monotono),

l’applicazione del logaritmo alla verosimiglianza preserva i punti di massimo o di minimo. Lo stimatore di MV può essere visto come uno stimatore ‘per analogia’. Si mostra infatti che, se θ 0 è il valore ‘vero’ del parametro nella popolazione, allora il valore atteso del logaritmo della densità E θ log( f ( X ; θ ))=ʃlog( f ( x ; θ )) f ( x ; θ 0 ) dx , visto come funzione di θ , assume il suo massimo quando θ = θ 0. La stima di MV è quel valore nello spazio dei parametri che massimizza, per analogia, la media campionaria n −1Σilog( f ( X i; θ ))= n −1log( L ( θ ;X)). Un’altra chiave di lettura considera la minimizzazione della divergenza di Kullback-Leibler (una misura di discrepanza tra distribuzioni) tra la distribuzione empirica delle osservazioni (che assegna probabilità 1/ n a ciascuna delle n osservazioni) e la famiglia di densità finita del modello F (➔ distribuzione empirica). Esempi di stimatori di MV. Il modello binomiale è usato quando si ha un campione estratto da una variabile aleatoria X che assume i due soli valori {0,1}. Tali valori possono rappresentare per es. l’esito di un esperimento (0=‘insuccesso’,1=‘successo’). Il parametro di interesse è la probabilità di successo, π = P ( X =1). Lo stimatore di MV per π è la frazione di successi su n prove, ossia π^ =Σi x i/ n. Nel modello gaussiano, dato un campione casuale da una distribuzione gaussiana di media μ e varianza σ^2 , la stima di MV di μ è uguale alla media campionaria =Σi X i/ n , quella di σ^2 è uguale a σ^^2 = n −1Σi( X i− )^2. Il modello di regressione lineare gaussiano è un modello gaussiano per la distribuzione condizionata di una variabile aleatoria Y dato un insieme di variabili aleatorie X , con media E ( Y ∣ X )= α + β ′ X e varianza σ^2. I parametri da stimare sono ( α , β ′, σ^2 ). La stima di MV coincide con quella dei minimi quadrati (➔ minimi quadrati, metodo dei) per i coefficienti della retta di regressione α e β. La stima di MV di σ^2 è la media campionaria del quadrato dei residui di regressione (➔ residuo statistico). Proprietà della stima di MV. Lo stimatore di MV gode di importanti proprietà. Anzitutto, esso è invariante per trasformazioni dei parametri. Ciò significa che se cambia la parametrizzazione, vale a dire se l’interesse si sposta dal parametro θ a una sua trasformazione g ( θ )= γ , non è necessario ricalcolare la stima di MV. Infatti, la stima di MV del nuovo parametro è semplicemente γ̂= g ( θ^ ). Lo stimatore di MV è consistente (➔ consistenza) e asintoticamente normale (➔ asintotica, distribuzione) se valgono alcune condizioni. Tali condizioni riguardano: il parametro da stimare θ 0 , che deve essere un punto interno dello spazio dei parametri Θ ; l’esistenza delle derivate prime e seconde della densità dei dati rispetto a θ ; l’integrabilità del vettore gradiente (cioè delle derivate prime) e dell’hessiano (➔) della densità dei dati rispetto a θ. Inoltre, lo stimatore di MV è asintoticamente efficiente. Si dimostra che esso raggiunge asintoticamente il limite inferiore di Cramér-Rao (➔ efficienza statistica). Tale limite, il cui calcolo dipende dal modello statistico considerato, è minore o uguale alla varianza di un arbitrario stimatore non distorto per θ. Uno stimatore non distorto che raggiunge il limite inferiore di Cramér-Rao è efficiente (non soltanto asintoticamente). Ci sono casi nei quali lo stimatore di MV non ha un comportamento asintotico ‘standard’ poiché vengono violate alcune delle condizioni suddette. Un caso è quando il supporto della distribuzione di probabilità (cioè l’insieme dei possibili valori) della variabile aleatoria considerata dipende dal parametro da stimare, per es. quando la distribuzione è uniforme in [0, θ ]. In questo caso, lo stimatore di MV di θ è inconsistente e non è asintoticamente normale. Samantha Leorato

Modelli lineari generalizzati, Dispense di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Modelli lineari generalizzati e più Dispense in PDF di Statistica solo su Docsity!

verosimiglianza massima, metodo della