Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Analisi di Regressione Multipla: Interpretazione e Errori - Prof. Mastromarco, Slide di Econometria

La regressione multipla, una tecnica statistica per modellare la relazione tra variabili dipendenti e indipendenti. Viene presentata la formula di regressione, la stima OLS, la interpretazione dei coefficienti angolari e l'errore stocastico. Vengono inoltre discusse le cause di errori in una regressione multipla, come l'omissione di fattori importanti e la collinearità tra variabili indipendenti.

Tipologia: Slide

2019/2020

Caricato il 04/01/2020

emilee
emilee 🇮🇹

4.5

(33)

21 documenti

1 / 30

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Analisi di Regressione
Multipla
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e

Anteprima parziale del testo

Scarica Analisi di Regressione Multipla: Interpretazione e Errori - Prof. Mastromarco e più Slide in PDF di Econometria solo su Docsity!

Analisi di Regressione

Multipla

Stima OLS della relazione Test Score / STR :

TestScore

= 698.9 – 2.28× STR , R

2

= .05, SER = 18.

E’ una stima credibile dell’effetto causale sul rendimento

nei test di un cambio del rapporto studenti-insegnanti?

No : ci sono fattori omessi che confondono l’effetto

(reddito familiare; se lo studente parla l’inglese come

lingua madre) questi rendono le stime OLS distorte: STR

cattura anche l’effetto dei fattori omessi.

Similarità con la regressione

semplice

  • β

0

è la costante (intercetta della regressione)
  • da β

1

a β

k

sono tutti chiamati coefficienti angolari
  • u è lerrore stocastico (o disturbo)
  • Abbiamo bisogno dell’assunzione sulla media
condizionata pari a zero, ovvero
  • E( u|x

1

,x

2

, …,x

k

  • Dobbiamo sempre minimizzare la somma dei
quadrati dei residui, così avremo k+1 condizioni
del primo ordine

Interpretazione della regressione

multipla

0 1 1 2 2

1 1 2 2

2

1 1

ˆ ˆ ˆ ˆ

ˆ ... , da cui

ˆ ˆ ˆ

ˆ ... ,

perciò mantenendo fisse ,..., si ha che

ˆ

ˆ , cioè ogni ha

una interpretazione

k k

k k

k

y x x x

y x x x

x x

y x

ceteris paribus

β β β β

β β β

β β

= + + + +

Δ = Δ + Δ + + Δ

Δ = Δ

  • Lequazione precedente implica che

regredendo y su x

1

e x

2

otteniamo lo

stesso effetto per x

1

che otterremmo

regredendo y su i residui della regressione

di x

1

su x

2

  • Questo significa che solo la parte di x

i

che è non correlata con x

i

serve a

spiegare la y

i

perciò stiamo stimando

leffetto di x

1

su y dopo aver depurato

leffetto di x

2

su x

1

Interpretazione della regressione

multipla

Regressione semplice e

regressione multipla

0 1 1

0 1 1 2 2

1 1

2 2

1 2

Confrontiamo la regressione semplice

con la regressione multipla

In genere, tranne il caso in cui:

0 (perciò l'effetto parziale di ) O

e non son

y x

y x x

x è nullo

x x

β β

β β β

β β

β

o correlate nel campione di dati

Quanto bene la nostra retta di regressione si

adatta ai dati?

Possiamo calcolare la proporzione della

somma totale degli scarti al quadrato (SST)

che è spiegata dal modello, chiamiamo

questa misura R-quadro della regressione

R

2

= SSE/SST = 1 – SSR/SST

Bontà del modello

( ) ( ) ( )

( )

( )

( )

( )

2

2

2

2

2 2

Si può pensar e a come uguale al quadr ato del coefficiente di

ˆ cor r elazione tr a il valor e osser vato e il valor e stimato

ˆ ˆ

ˆ ˆ

i i

i i

i i

R

y y

y y y y

R

y y y y

− −

=

− −

∑ ∑

Bontà del modello

Assunzioni per Correttezza

Modello di regressione della popolazione è lineare nei

parametri: y = β

0

+ β

1

x

1

+ β

2

x

2

+…+ β

k

x

k

  • u

Le assunzioni sono quelle della regressione semplice più quella

relativa alla non collinearità perfetta tra le variabili indipendenti:

E( u|x

1

, x

2

,… x

k

) = 0, implica che tutte le variabili esplicative

sono esogene ;

Utilizziamo un campione casuale di dimensione n , {( x

i

, x

i

,…,

x

ik

, y

i

): i =1, 2, …, n }, dal modello di popolazione, in modo tale

che il modello campionario è y

i

= β

0

+ β

1

x

i

+ β

2

x

i

+…+ β

k

x

ik

u

i

;

X e u hanno quattro momenti, cioé:

E(X

4

) < +∞ e E(u

4

) < +∞.

Nessuna delle x è costante, e non esiste una relazione lineare

perfetta tra loro (collinearità)

Troppe o Poche Variabili

  • Cosa succede se nel modello di

regressione si inseriscono variabili non

rilevanti?

  • Non cè effetto sulle stime dei parametri,

e le stime OLS restano corrette

  • Cosa succede se escludiamo variabili

rilevanti?

  • Le stime OLS saranno distorte

( )( )

( ) ( ) ( )

0 1 1 2 2

1 1 0 1 1 2 2

2

1 1 1 2 1 1 2 1 1

Il modelo vero è

, sostituendo

al numeratore si ottiene

i i i i

i i i i

i i i i i

y x x u

x x x x u

x x x x x x x u

∑ ∑ ∑

Errore per Variabili Rilevanti

Omesse

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

1 1 2 1 1

1 2

2 2

1 1 1 1

1 1 2

1 1 2

2

1 1

poichè E( ) 0 , prendendo il valore atteso

i i i i

i i

i

i i

i

x x x x x u

x x x x

u

x x x

E

x x

β β β

β β β

− −

= + +

− −

=

= +

∑ ∑

∑ ∑

!

!

Errore per Variabili Rilevanti

Omesse

Sintesi sulla Direzione dellErrore

Corr( x

1

, x

2

) > 0 Corr( x

1

, x

2

) < 0

β

2

0 errore positivo errore

negativo

β

2

< 0 errore negativo errore positivo

Sintesi sullErrore dovuto a

Variabili rilevanti Omesse

  • Due casi in cui lerrore è uguale a zero

β

2

= 0, cioè x

2

non appartiene al modello
e/o x

1

e x

2

non sono correlate nel campione.
  • Se la correlazione tra x

2

, x

1

e x

2

, y è nella

stessa direzione, lerrore sarà positivo

  • Se la correlazione tra x

2

, x

1

e x

2

, y è in

direzione opposto, lerrore sarà negativo