Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Modelli Lineari Generalizzati, Appunti di Statistica

Appunti di statistica 3, Modelli Lineari Generalizzati .

Tipologia: Appunti

2025/2026

Caricato il 18/03/2026

alessandro-carminati-5
alessandro-carminati-5 🇮🇹

1 documento

1 / 7

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistica
3
è
un
corso
monografico
dedicato
ai
Modelli
Lineari
Generalizzati
GLM
,
considerati
una
delle
tecniche
di
regressione
più
influenti
e
ampiamente
applicabili
del
XX
secolo
.
Il
corso
rappresenta
l
'
evoluzione
naturale
dei
modelli
lineari
classici
verso
un
framework
unificato
e
elegante
che
estende
significativamente
le
possibilità
di
analisi
statistica
.
Prima
di
affrontare
questo
corso
,
è
fondamentale
aver
acquisito
competenze
in
:
I
modelli
lineari
classici
nascono
con
Gauss
e
Legendre
per
l
'
analisi
di
dati
astronomici
,
con
l
'
idea
di
predire
la
media
di
una
distribuzione
normale
come
funzione
di
covariabili
:
Già
nel
1922,
Fisher
introdusse
modelli
più
avanzati
per
dati
di
proporzione
,
sviluppando
modelli
binomiali
.
Successivamente
si
svilupparono
:
L
'
unificazione
avvenne
con
il
paper
fondamentale
di
Nelder
e
Wedderburn
1972
,
che
consolidò
tutti
questi
approcci
in
una
teoria
coerente
.
Riassunto
Completo
-
Statistica
3
Modelli
Lineari
Generalizzati
GLM
Introduzione
al
Corso
Obiettivi
e
Struttura
del
Corso
Prerequisiti
Essenziali
Regressione
lineare
semplice
(
da
Statistica
I
Statistica
inferenziale
(
da
Statistica
II
Modelli
lineari
(
da
Analisi
Statistica
Multivariata
ed
Econometria
)
Software
R
(
da
Analisi
Statistica
Multivariata
)
Sviluppo
Storico
dei
GLM
Le
Origini
Evoluzione
verso
i
GLM
Modello
probit
Bliss
, 1935
Modello
logit
Dyke
e
Patterson
, 1952
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Modelli Lineari Generalizzati e più Appunti in PDF di Statistica solo su Docsity!

Statistica 3 è un corso monografico dedicato ai Modelli Lineari Generalizzati GLM, considerati una delle tecniche di regressione più influenti e ampiamente applicabili del XX secolo. Il corso rappresenta l'evoluzione naturale dei modelli lineari classici verso un framework unificato e elegante che estende significativamente le possibilità di analisi statistica. Prima di affrontare questo corso, è fondamentale aver acquisito competenze in: I modelli lineari classici nascono con Gauss e Legendre per l'analisi di dati astronomici, con l'idea di predire la media di una distribuzione normale come funzione di covariabili: Già nel 1922, Fisher introdusse modelli più avanzati per dati di proporzione, sviluppando modelli binomiali. Successivamente si svilupparono: L'unificazione avvenne con il paper fondamentale di Nelder e Wedderburn 1972 , che consolidò tutti questi approcci in una teoria coerente.

Riassunto Completo - Statistica 3 Modelli Lineari

Generalizzati GLM

Introduzione al Corso

Obiettivi e Struttura del Corso

Prerequisiti Essenziali

Regressione lineare semplice (da Statistica I

Statistica inferenziale (da Statistica II

Modelli lineari (da Analisi Statistica Multivariata ed Econometria)

Software R (da Analisi Statistica Multivariata)

Sviluppo Storico dei GLM

Le Origini

Evoluzione verso i GLM

Modello probit Bliss, 1935

Modello logit Dyke e Patterson, 1952

I Modelli Lineari Generalizzati sono caratterizzati da tre componenti essenziali: La variabile risposta segue una distribuzione della famiglia esponenziale: dove: Il predittore lineare η_i è definito come: Collega la media μ_i = EY_i al predittore lineare: Tabella: Principali Modelli Lineari Generalizzati Modello Distribuzione Link Function Supporto Y Esempi Regressione Lineare Normale Identità (η=μ) ℝ Peso, altezza Regressione Logistica Bernoulli/Binomiale Logit (log(π/1π)) 0,1] o 0,1 Successo/fallimento Regressione Poisson Poisson Logaritmo (log(μ)) ℕ = 0,1,2,...} Conteggi, eventi Modelli Gamma Gamma Inversa 1/μ) o Log ℝ⁺ Tempi, costi Modelli Multinomiali Multinomiale Logit per categorie Categorico Scelte multiple L'Unità A del corso affronta il tema cruciale della misspecificazione nei modelli lineari e le relative soluzioni. Un modello lineare generale può essere scritto come: Componenti Fondamentali dei GLM

  1. Componente Casuale Random Component)

θ_i è il parametro naturale

φ è il parametro di dispersione

a_i(φ), b(θ), c(y,φ) sono funzioni specifiche della distribuzione

  1. Componente Sistematica Systematic Component)
  2. Funzione di Collegamento Link Function) Modelli Lineari e Misspecificazione Il Processo di Modellazione

La densità di appartiene a una famiglia di dispersione esponenziale univariata se esprimibile nella forma: con , ,. Dalla teoria delle famiglie esponenziali: Nella parametrizzazione con la media : dove è la funzione di varianza. La log-verosimiglianza per osservazioni indipendenti è: Le equazioni di verosimiglianza per sono: Per la soluzione iterativa: dove: dove è il contributo dell'i-esima osservazione alla devianza. Famiglia di Dispersione Esponenziale Media e Varianza Funzione di Varianza Stima per Massima Verosimiglianza Algoritmo IRLS Iteratively Reweighted Least Squares)

con

è la variabile risposta aggiustata

Diagnostica e Verifica del Modello Residui

Residui di Pearson:

Residui di devianza:

La devianza è definita come: Per grandi campioni, sotto il modello corretto. Per dati binari : Interpretazione: rappresenta l'odds ratio per un incremento unitario di. Per conteggi : Interpretazione: rappresenta il fattore moltiplicativo sulla media per un incremento unitario di. Quando , si usa la quasi-verosimiglianza: Le trasformazioni delle variabili, pur essendo storicamente importanti, presentano limitazioni significative: I GLM superano elegantemente questi problemi mantenendo interpretabilità e utilizzando direttamente la distribuzione appropriata dei dati. Devianza e Bontà di Adattamento Modelli Specifici Regressione Logistica Regressione Poisson Over-dispersione e Quasi-verosimiglianza

Mantiene la relazione media-varianza:

Stima robusta di anche con over-dispersione

Correzione degli errori standard tramite

Vantaggi dei GLM rispetto alle Trasformazioni

Interpretazione complessa: i coefficienti perdono significato diretto

Distinzione media/predizione:

Approssimazioni asintotiche: validità solo per grandi campioni

Dipendenza dai parametri: alcune trasformazioni dipendono da parametri noti

Esempio Applicativo: Consumi Automobili

Il corso getta le basi per argomenti avanzati in Statistica Multivariata e Data Mining: I GLM rappresentano uno dei contributi più significativi della statistica del XX secolo, fornendo un framework unificato ed elegante per l'analisi di diversi tipi di dati, mantenendo sempre interpretabilità teorica e applicabilità pratica. ⁂ Preparazione Efficace

Ripassare bene LM e diagnostica

Comprendere link e varianza per Bernoulli/Poisson/Gamma

Esercitarsi su correzioni sandwich/WLS

Saper scegliere tra trasformazioni e GLM nativi

Prospettive Future

Tabelle di contingenza e modelli log-lineari

Modelli multinomiali e ordinali

Modelli con risposte correlate (effetti casuali)

Regressione non parametrica e metodi penalizzati

1 2 Modelli-lineari-generalizzati.pdf Generalized-Linear-Models_25_09_22_15_49_19.pdf