Modelli lineari: regressione multipla | Sbobinature di Statistica

CAPITOLO 1 MODELLO DI REGRESSIONE SEMPLICE (y=B0+B1x+ε)

1.1 sistema di equazioni normali

𝜑=∑𝑒𝑗2𝑛

𝑗=1 =∑(𝑦𝑗−𝑦𝑗∗)2

𝑛

𝑗=1 =∑(𝑦𝑗−𝑏𝑜−𝑏1𝑥𝑗)2

𝑛

𝑗=1

Si usa il metodo dei minimi quadrati per trovare la retta che si adatta meglio ai dati: differenza al ^2 tra y

e y* (ordinata teorica=valore che avrei se il punto fosse esattamente posizionato sulla retta) pari al

quadrato del residuo e alle distanze verticali^2 tra il punto e la retta (voglio la retta che minimizza le

distanze, per cui devo lavorare con b0, intercetta, e b1, pendenza)→minimizzo 𝜑 rispetto a b0 e b1.

∑(𝑦𝑗−𝑏𝑜−𝑏1𝑥𝑗)2

𝑛

𝑗=1 = ∑(𝑦𝑗2+𝑏0

2+𝑏12𝑥𝑗2−2𝑏0𝑦𝑗+2𝑏𝑜𝑏1𝑥𝑗−2𝑏1𝑥𝑗𝑦𝑗)=

𝑛

𝑗=1 ∑𝒚𝒋𝟐+𝒏𝒃𝟎

𝟐+𝒃𝟏

𝟐∑𝒙𝒋𝟐−

𝟐𝒃𝟎∑𝒚𝒋+𝟐𝒃𝒐𝒃𝟏∑𝒙𝒋−𝟐𝒃𝟏∑𝒙𝒋𝒚𝒋

Funzione rispetto a b0

Funzione rispetto a b1

𝑛𝑏0

2−2𝑏0(∑𝑦𝑗−𝑏1∑𝑥𝑗)+⋯

𝑏12∑𝑥𝑗2−2𝑏1(∑𝑥𝑗𝑦𝑗− 𝑏𝑜∑𝑥𝑗)+⋯

Parabola con concavità verso l’alto: ha solo un minimo nel vertice, non ha massimi (nè flessi)→

calcoliamo la derivata prima eguagliando a 0: sistema di 2 equazioni, una rispetto a b0 e l’altra rispetto

a b1→sistema di equazioni normali (costruite prendendo le distanze: il segmento ej è

normale/ortogonale/perpendicolare rispetto a b0 e b1)

Equazione 1 (b0)

∑(𝑦𝑗−𝑏𝑜−𝑏1𝑥𝑗)= 0

𝑛

𝑗=1

Equazione 2 (b1)

∑(𝑦𝑗−𝑏𝑜−𝑏1𝑥𝑗)𝑥𝑗= 0

𝑛

𝑗=1

1:𝑏𝑜=𝑦−𝑏1𝑥 b0 dipende da b1.

2: 𝑦=𝑏𝑜+𝑏1𝑥 la retta passa per forza per il

baricentro della nube dei punti.

3: ∑𝑒𝑗=0

𝑛

𝑗=1 la somma (la media) dei residui

è nulla (si compensano).

4:∑𝑦𝑗

𝑛

𝑗=1 =∑𝑦𝑗∗

𝑛

𝑗=1 le ordinate teoriche

sostituite a quelle osservate ne lasciano

inalterata la somma (simile alla proprietà

associativa della media).

1: 𝑏1=∑𝒙𝒋𝒚𝒋

𝒏

𝒋=𝟏 −𝒏𝒙𝒚



∑𝒙𝒋𝟐𝒏

𝒋=𝟏 −𝒏𝒙

𝟐=∑(𝑥𝑗−𝑥)(𝑦𝑗−𝑦

)

𝑛

𝑗=1

∑(𝑥𝑗−𝑥)2

𝑛

𝑗=1 =𝑐𝑜𝑑𝑒𝑣(𝑥,𝑦)

𝑑𝑒𝑣(𝑥) =

𝑐𝑜𝑑𝑒𝑣(𝑥,𝑦) 𝑛

⁄

𝑑𝑒𝑣(𝑥) 𝑛

⁄=𝑐𝑜𝑣(𝑥,𝑦)

𝑣(𝑥) =𝒔𝒙𝒚

𝒔𝒙

𝟐 in base alla codevianza

sappiamo se le unità statistiche sono concordanti o

discordanti rispetto alle 2 variabili (se prodotti positivi

= prodotti negativi→ si compensano e c’è indipendenza

lineare di y da x).

2:∑𝑒𝑗𝑥𝑗=0

𝑛

𝑗=1 →𝑒𝑡𝑥=0 il vettore e ed il vettore x

sono perpendicolari il loro prodotto scalare è pari a 0).

1.2 R2 indice di determinazione lineare

𝑅2=𝐷𝐸𝑉(𝑦)𝑟𝑒𝑔

𝐷𝐸𝑉(𝑦) =∑(𝑦𝑗∗−𝑦)2

𝑛

𝑗=1

∑(𝑦𝑗−𝑦)2

𝑛

𝑗=1 =𝐷𝐸𝑉(𝑦)−𝐷𝐸𝑉(𝑦)𝑑𝑖𝑠𝑝

𝐷𝐸𝑉(𝑦) =1−∑(𝑦𝑗−𝑦𝑗∗)2

𝑛

𝑗=1

∑(𝑦𝑗−𝑦)2

𝑛

𝑗=1

0 perfetta indipendenza lineare

1 perfetta dipendenza lineare

La devianza di regressione è pari a 0.

La devianza di dispersione pari a 0, per cui i punti

sono perfettamente allineati sulla retta.

𝑫𝑬𝑽(𝒚)𝒓𝒆𝒈=∑(𝑦𝑗∗−𝑦)2

𝑛

𝑗=1 =∑(𝑏0+𝑏1𝑥𝑗−𝑏0−𝑏1𝑥)2

𝑛

𝑗=1 =𝑏12∑(𝑥𝑗−𝑥)2

𝑛

𝑗=1 =𝒃𝟏

𝟐∗𝑫𝑬𝑽(𝒙)=

𝑐𝑜𝑑𝑒𝑣(𝑥,𝑦)

𝑑𝑒𝑣(𝑥)22∗𝑑𝑒𝑣(𝑥)=𝒃𝟏∗𝒄𝒐𝒅𝒆𝒗(𝒙,𝒚)

1.3 Regressione con variabili espresse in forma standardizzata: r coefficiente di correlazione lineare

𝑧𝑥=𝑥−𝑥

𝑠𝑥→𝑧𝑗𝑥 =𝑥𝑗−𝑥

𝑠𝑥 e 𝑧𝑦=𝑦−𝑦



𝑠𝑦→𝑧𝑗𝑦 =𝑦𝑗−𝑦



𝑠𝑦

𝒓=𝑧𝑦𝑧𝑥𝑏1=∑(𝑧𝑗𝑥−𝑧𝑥)∑(𝑧𝑗𝑦−𝑧𝑦)

𝑛

𝑗=1

𝑛

𝑗=1 ∑(𝑧𝑗𝑥−𝑧𝑥)

𝑛

𝑗=1 =1

𝑛∑𝑧𝑗𝑥∗𝑧𝑗𝑦

𝑛

𝑗=1 =1

𝑛∑(𝑥𝑗−𝑥)

𝑠𝑥∗(𝑦𝑗−𝑦

)

𝑠𝑦

𝑛

𝑗=1 =𝒔𝒙𝒚

𝒔𝒙𝒔𝒚 →coefficiente di

correlazione adimensionale e simmetrico (se cambio il ruolo della x e della y l’indicatore non cambia).

Se lavoriamo con variabili standardizzate il coefficiente di regressione diventa il coefficiente di

correlazione e l’intercetta scompare (variabili standardizzate hanno media nulla).

Modelli lineari: regressione multipla, Sbobinature di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Modelli lineari: regressione multipla e più Sbobinature in PDF di Statistica solo su Docsity!

+B

1.2 R

CAPITOLO 2 INFERENZA NEL MODELLO DI REGRESSIONE SEMPLICE

- COV(𝜀

) = E [

] =

E

[

] =

[

] = 𝛃

[(

)]

[(

)]

𝐸[(𝛽

)] = −𝑥̅ 𝐸[(𝛽

)] = −𝑥̅ 𝑉(𝑏

=R

per prevederlo

[ 1 +

]

) = 𝑉[𝜀

)] = 𝑉(𝜀

[(

)]

[

] + 𝑥

√[ 1 +

]

√[ 1 +

]

per prevederlo

[

]

√[

]

√[

]

CAPITOLO 3 DATI MULTIVARIATI

= [ 1

]

S=

X

X

+AX

=A

A𝑋

A)A𝑋

A𝑋

4. 6 R

=I

=I

CAPITOLO 5 INFERENZA NEL MODELLO DI REGRESSIONE MULTIPLA

𝑦)]=(𝑥

)𝐸[𝑦] = (𝑥

𝑦)]=

V

V

− H)(I

− H) = 𝐼

− 𝐻=M

]𝑥 = 𝑥 − 𝑥(𝑥

DEVIANZA VALORE ATTESO

CAPITOLO 7 DIAGNOSTICA

[(

]

[

](

7.3 MULTICOLLINEARITA’

:R

CAPITOLO 8 SCELTA REGRESSORI DA INSERIRE NEL MODELLO DI REGRESSIONE

) = 𝐸 [(𝑥

𝑦] = (𝑥

𝐸[𝑦] =

𝐸[𝑥