









Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Schemi riassuntivi della teoria del corso Statistica III dell' A.S. 2025-26
Tipologia: Schemi e mappe concettuali
1 / 16
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!










vettore di covariate/
esplicative
↑
f(i i b)
,
02
=
f .
di
i
= ETyi) =
f(xi ,
v .
previsti
=
XiB
Notazione matriciale : y
=
XB
E
· v . C . risposta
: Y
=
, ...,
>
realizzazioni :
=
(y1 , ..., yn)
· matrice
disegno
X 11
... X + p
:... :
Xm ...
Xnp
↓
S S
Se c'è intercetta e un
vettore colonna di 1
= 1 norma eucl .
D(p)
=
(y
xB)T(y
Xp)
=
11y
XBll
I
RSS
= (XX) Xy
se X ha
vango pieno
1 ,
y
=
=
=
Hy
↓ hi
:
= 02(1 -
HAT-MATRIX
,
D(5)
=
11y
y()
=
y3(In
H)y
precisione
della prev
stima della varianza residuale
: >
=
R
= 1
= 1
: altrimenti stima als
non esiste perché
x non invert.
~
Np(B ,
02(xix)
residui grezzi
ris yi
Xi
: V
=
Di COOR
p.
Ci
=
(5-p-i) var() + ( - p
=
2 hi
funzione crescente
dei
p(
distanza di Mahalano bis
pesata tra Bei
Punto
: hi e ri alti
.
struttura lineare
: Y
=
XB
E
.
omosched
. e incor: var(E)
= d'In
.
: EvNn (
,
0 "In
3 E(y)
=
XB
1 rk(x)
=
p (pieno
.
=
B
Ei var(zi)
=
= 0
per
simm .
= (x -x)
y
E(b)
= (xX)
XB
=
B
var(5)
= (x(x)
var(y)
= 0
(x-x) + x x((xx) - )"
= 0'(xix) xix(xix)" =
= 04(XX)
=
ma per
TC
:
** Np(B ,
0 (xx)-1)
per
un campione
di
ampiezza
elevata
(A.
c
=
diag/o2, ...,
onl
E(b)
=
B
var()
=
=
x [X(x x)
EvNn
,
B
Np(p ,
=
x [x(xx)
)
unbiased e consistente ,
ma non di max verosimiglianza
= 02 (1 - hi)
=
STANDARD ERROR CONSISTENTI DI WHITE
ar(g)
=
"
x - X(x -X)
diag
/We
,
...
,
Wnl
var(2)
=
=
↓
matrice
dei
(noti
= 22 X
)
= 2
E(y)
=
Xp
= X
B
var(y
= 2
"
= 011
1
=> (A .
.
valgono
nella scala trasformata
> Dwis(p)
=
(y
b) "(y
B)
= (1y
XB)"(
y
XB)
=
&
= [f) (y
XB)]
1(y
XB)
=
=
(Y-XB) l
XB)
v distanza di
=
[Wi(yi
Xi)
no funzione di perdita
nella scala
media
pond
se
=
la varianza
2 Yin BiN (ti
,
mi)
,
mitti(1-Ti)
9mi (4)
= Mi
.
arcein(m -1)
Mi
var
(9mi
(i)) =
(MD-21 m
2 )
mitti (1- Ti)
=
cambia interpretazione
dei parametri
g(E(Mi))
E(g(Yi))
=
g"(xiB)
[Jensen]
=i valore previsto per
Ti
ma non stima per
la media
·
g
(E(g(Yi)))
=
(xi
B)
=
exp(xi B)
= E(Yi)
=
exp(xi B
GLM
=
è modellata come una funzione
su un vettore di covariate e non e vincolata alla gaussianita
: matrice disegno ,
non stocastica
,
a
rango
pieno
In
nxp
ind
Si N
,
E(m)
= Ti
=
Mi
(Mi)
=
log) 1
(i)
=
Be
paxi
=> Mi =
g
(pe
BB
Se il
2
Di e 10 ,
perché
è la prob
.
di successo
: Yi
=
=
+BeXE
Bi
Baxi
non
può produrre
valori non acc.
per
le
proporzioni
· la
supporta
errori
perché
Y: e
EMPIRICAL
Logit
(Ti)
=
Logit
(Sitos)
=
log(03)
=
p
paxi
11
g
[E(g(Yi)))
=
g
(Bn
B2xi)
=
exp(Be
paxi)
1
exp(B + 52xi)
&
questo approccio
non è compatibile con l'assunzione Si
,
y:
in poi
(Mi)
g(ui)
=
log(Mi)
=
Be
Bzxi
=
Mi
=
g (B
Baxi)
=
exp(B
Bzxi)
> O
var(Yi)
=
Mi
=
exp(B
Baxi)
perché
var dipende
da Xi
. che
var non è compatibile con l'assunzione
Yi ~
Poi (Mi)
approssimazione
DEL GLM
·
componente
randomica : Yi variabile risposta
con osservazioni indipendenti
distribuita come una famiglia
di distribuzioni esponenziali
·
sistematica :
n
=
XB
predittore
lineare
·
funzione legame
:
g(
. ) funzione invertibile ,
differenziabile e monotona
g(Mi)
=
Mi
=
Xi
=
=
g (mi)
=
g
.
)
da :
·
varianza
v(M)
> o
·
aild)
/wi
o con
parametro
di
dispersione
>o
noti
=>
YiED(Mi
,
ai
(d)v(Mi))
con
glui)
=
Xi
:
Mie
M
eterosched .
TEORIA GENERALE
FAMIGLIA
ESPONENZIALE
(parz . esatti)
TEORIA
NORMALE
plyi
i
di
, d)
=
exp(di biyi
Il
↓
parametro
naturale
Supporto
di Yi non dipende
da o
di e
può
essere
differenziatà infinite volte
=> MODELLO
ai
(d)
= 1 =>
c(yi , d)
=
c(yi)
=
p(yi
;
=
exp(yi0i
c(yi))
.
NATURALE di Ordine 1
Poisson
plyi : Mil
=
Mi Mexp(yilog(Mi)
Mi
Lg(yi
! ))
· Oi
=
Log (Mi)
· d'(0i)
= e =
=
Mi
·
ai(d)
=
= 1
·
/bi)
=
· bloi)
=
Mi
= e
& i
· var(yi)
=
ai(d)b"(oi)
= e
=
Mi
·
c(yi ,
p)
= -
log(yi
·
v/Mi)
= b"
=
Mi
Gamma
p(Yi :
a
,
Xi)
Diyide-disi
con yis
↓ ↑ (a)
costante
=
exp[a(logdi
(a
Log
(a))
=
=
exp((log()
diyi)
(p
1)coq(yi)
194(t))
=
=
exp(diyi
-1-1q)
log(d)
(
1)coq(yi)
1gt())
·
ai(d)
=
=
b
= a
=
Sep
= 1 = a = 1 :
·
=-
Xi
=
=-
no la distr .
·
=
log)
= -
=
Mi
=>
=
Xi 8?
2
·
vau (yi)
= ai (d)
b"(Oi)
=
Pri
la
varianza cresce più velocemente
Si ~
,
Mil Ps(Si :
Mi ,
= (*) (1-tilmisi
Yi
=
Si Pi :
mi
i)
=
(mm)
mini-mini(mi) (Timi-
=
exp(minivog) ,ni)
milog(1-mi)
Log ( mini)]
=
exp[m
(4i8i-1g(
ex))
c(yi , mil)
·
oi
=
log (1)
=
Logit
(Mi)
· ga
i
ne -Dila-ti noti
=
della
1
Logistica
= 1
=
ga)
·
ai(d)
= 1/Mi
·
=
log(
·
=e
= i
=
·
u/0i)
=
·
osmi)
=
log) i)
·
var(yi)
=
ai (d) b"(Oil-
.
+e) e
e0i)
FUNZIONE Di VEROSIMIGLIANZA
Y
ED(Mi , ai(d)v(Mi))
con g(Mi)
=
Xiß
Distr. congiunta
:
P(y : p
. d) = plui
. d) = exp[bl
Log-ver.
:
ioi-bi
,
b)
ai(p)
1 (Ui-Mi) Xir
Funzione score : er (Bid)
=
e(d)
=
w
:
(i-Mi) Xi
=
↓
V(Mi) g'(Mi)
var(Yi)
g'Mil
1
non dipende
da e
in notazione
=
/wi
ai a)
matriciale e Dv" (y-m)
= 0
Con il legame
canonico : er
(B
, d)
= [ci
(4i-Mil
Xir
in notazione matriciale
: ex
(p
. d)
= x
1(y
m)
INFORMAZIONE OSSERVATA e ATTESA
&
dev . 29 di
,
d)
jrs
=
-(p
. p))
=
·
[Mi i-Mir)
=
E(jrs)
=
[ ( Mi Mi =I
Mi
Xir Xis
=
[
Xis
.
Xir
: E
ai(p)
g(Mi) v(Mi) g(ui)
var()
.
g'(Mi)
1
in notazione matriciale I
= X'WX con =diag
/We , ...,
Wn) e Wi
=
var(y)g'(Mi)
Sotto il
legame
canonico
O-Bexiet
..
BXip
=
8
= 0 = irs
=
jus
e perché
se
non stocastica
e
vM
=
g(Mi)
= irs
= [VIMi) XirXis
=
[Wiv(Mi)
Xir Xis
ai
· J
I e W dipendono
da
Bed
· Se X è a
rango
I è definita
· sotto il
legame
canonico
,
I e sono entrambe definite positive
se rk(x)
=
p
la funzione di log-ver . è concava
ogni
soluzione è un massimo globale
D V
(y-M)
= o non può
essere risolta in forma chiusa ma serve un metodo numerico
che sfrutta un algoritmo
iterativo ,
che viene inizializzato con un arbitrario
il
quale
viene
ad ogni
interazione fino a convergenza
Distribuzione
asintotica ~Np(B ,
(xWX) )
per
n
w dipende
da
B
ed
=
vr()
= (XX)
75E/57] ;
= 0 [ (XWx) "Tis
:
Bi
=
Bo
:
Biso
: Nel caso
gaussiano
Bo
I
Bi
Bo
= 02
:
( v < (Xx)" 3 ,
o
.
5
~
Np(B ,
0'(xx)
)
p-value
=
Ross
=
P(z)(z i
= 2(
Zj No
tn-p
=
Bi
= z qu2(Xx)"]ii
No approssimazioni
TEST iPOTESi GENERALE
p
=
(B) B
Ho
:
Ba
=
Bo
VS H
:
BB
Bo
Bo
= 0
: confronto tra modello ristretto e completo
Di Esi
> WALD : We
=
(
Bol var(B) (B3- B0)
X (a
= 1 => zi
= We
2 RAPPORTO Di MAX-VER : W =
2[e( :
e( ,
,
Xa
> O
con
=
( , BB)
e
Bo
=
/Pao , Bol quindi
:
BB
= 0 Stiamo
prevedendo
sia il
quello completo
3
:
=
/B
" var()
e
(0)
Ma
equivalenti
:
We
= w +
op(1)
= Wa
↓
per
ne + c
,
(0p(1)
1 dipende
dalla
parametrizzazione
: se considero una trasformazione di
B ,
devo
il test col metodo delta
2 e 3 sono invarianti rispetto
alla
parametrizzazione
devo solo trasformare
gli
estremi dell'intervallo originale
Nel modello lineare gaussiana ,
se p- or ,
W = We
=
=
"Y-Xoll-11Y-Xpl
~
X
&
2
Se or non e noto : W =
g(117-xoll"
=
qFiXq(ne
I
11Y
/ /(n
i3 test sono una sua
generalizzazione
DEVIANZA
trasf . del prev
. lin .,
vincolate
ese
·
log-ver
.
:
em( , d)
= [a :
:0/Mil
b(0(Mi)
c(yi ,
d)
d
·
log-ver.
:
em(y , b)
= [ :
c(yi ,
d)
d
Mi ,
sat
=
yi
se p
= n
D(y,m)
=
pV
= &27ey(y ,
2n(y ,
p))
=
2[wi(ui(0(yi)
o(i))
(b(0(yi))
b(o(i))))
devianza = o
: misura discrepanza
dal fit
(m. saturo
I
dipende
da
u
ma non dalla funzione legame
D(y :
)/q
scalata : test rapporto
di
log-ver
.
modello modello con modello saturo
pieno
ridotto
W
=
D(Y , i)
, Mo)
i
X
&
no covariate ,
solo intercetta - più semplice
e con devianza
Mnr
=
(9 (3) ,
.. .
:
(i)
[4i-Mi)
:
Wu
= X
= E Wi
↓ vui)
statistica
di Pearson
·
D(yi)
=
[yi)logyi
Logi)
yi
m)
=
2[[4i(9()
yi
mi)
/Yi-Mi)
approssimazione quadratica
ne +o
i
· BINOMIALE
em(u)
=
[[miyilog(mi)
yi) log(
Mi))
Sotto la convenzione Xlogx
= o
SELEZIONE DEL MODELLO
Aic
=
-2l(b)
2k
penalizzano per complessità
del modello
Bic
= -
2l()
Procedure
: forward vs backward
↓
↓ ↓
Non garantisce
i parametri
con
dei modelli verificando ad ogni p-value più grande
stadio se quelli già ↓
presenti
sono necessari
perché
evidenzia problemi
di interazione dovuti all'
di variabili
P-value significativo
mi dice che c'è evidenza di un
Aggiungendo
una variabile irrilevante aumenta la varianza ,
ma escluderne una
vilevante aumenta la distorsione
In alcuni casi meglio
inserire variabili anche non significative nel modello
Non conservare variabili solo
significative
-> modello più
essere
preferibile perché più interpretabile
REGRESSIONE BINARIA e BINOMIALE
Yi BER) Ti
Si
=
Yi
~ Bin (Mi ,
i
1 Modello binomiale prò
essere espanso
come un vettore binario di
lunghezza
mi
,
con i primi
Si elementi pari
a 1 e i restanti mi-si pari
a 0
2 Modello binario può
essere
se le osservazioni
stessi valori per
le variabili esplicative , posso
viscriverlo in termini di tentativi e successi
&
e gli
standard error sono uguali,
ma la devianza e i residui sono diversi
implicazioni
sui test di bontá di adattamento e diagnostica
LEGAME
9))
=
. ) Con F : /R +(
,
funzione di ripartizione
↓ monotona crescente ,
continua ,
diff .
funzione
quantile
·
Logit
:
gipi)
=
log()
=
xirp
Ti
=
exp(xiB)
. della
1 + exp/xiB) distr . Logistica
· PROBiT
:
g(tti)
=
=
Xip
Mi
=
G(xi B)
·
CLOG10G
:
g(Ti)
=
log)
log(Ti))
=
XiB
Ti
= 1
exp)
exp(xip))
·
CAUCHy
:
g(i)
= tan(h(xi -E))
=
Xi
Ti
=
1
arctan(xi)
T
VARIABILI
LATENT
con EF vlatente e contine se
Osserviamo solo una variabile binaria che a dice se Yi
supera
una
Yi
T)
=
=
=
p(xiB
= 1
= T
Xip)
= 1
xip)
o senza perdita
di
=> altrimenti sarebbe
nell'intercetta
Errori simmetrici
:
= 1
= 1
XiB)
=
B)
(Mi)
=
g(
Xiß
Equazioni di verosimiglianza
:
mi(Yi-Ti)
xirf(g)
= 0
i = 1 Mi(
per la
.
+(yi)
= F
(Mi)
F(yi))
= Mi (
Quindi
:
[milyi-Mi)
Xir
= 0 => [Sixir
=
Xir
:
voglio compare
due probabilità
stimate corrispondenti
a diverse covariate [T(x)
=
F(x b)
=
F(x) B)
·
RISCHIO ASSOLUTO = P(x)
· RISCHIO RELATIVO
= (x)
(x)
M
· ODDS RATIO
=
od(X)
=
π(X)
1
π(x)/f(x)
1
nel caso della
. Logistica
e pari
a exp(c)
=
exp((X)
perché
P(x) exp(xi
B) 1
1
=
1
p)(
exp(x
))
La diagnostica
non è informativa
quindi
di
si
raggruppano
i dati
-VEROSIMIGLIANZE
relazione
↓
media della tra media e
per
gestive sorradispersione risposta
/
Varianza
Non specifico
interamente distr .
risposta
ma solo
·
=
Mi
·
var(yi)
=
QV(Mi)
·
Yi + Y
;
con itj
Q-V e
Semi-parametrico
le assunzioni ,
un numero finito di parametri ,
ma con
assunzioni parametriche
su media e varianza
REGRESSIONE POISSON
Mi
=
exp(xip)
=
exp()
exp(p)
=
exp(Bi)
una covariata :
= an "... ... ap
=
aj)an*
...
app)
=
ajMi
=
exp(Bj) Mi
aj
exp(pi)
=
Mnew-
=
Un
alla baseline
Mi
MODELLI Di
valore
visposta proporzionale
a ti
sotto il legame logaritmico log()
=
Xi
=>
LogMi
=
Xip
Logti
1
↓
Quindi
Mi
=
tiexp(xiB)
OFFSET
media
proporzionale
una non è una covariata perche
costante del previsore
il coef . e forzatamente
posto
a 1
frequenza
di osservazioni nulle è
spesso superiore
al valore atteso
poisson ,
la
pari
alla parte
Se la media e
grande
pari
a 0
,
un
adeguato
->
=>
un