Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Regressione lineare: calcolo dei parametri e interpretazione, Slide di Statistica Economica

Come calcolare i parametri di una regressione lineare utilizzando il metodo dei minimi quadrati. Viene inoltre illustrato come interpretare il coefficiente angolare e l'intercetta della retta di regressione stimata.

Tipologia: Slide

2018/2019

Caricato il 07/02/2019

ruggeromansi
ruggeromansi 🇮🇹

5

(2)

17 documenti

1 / 27

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Capitolo 10
Analisi delle distribuzioni
doppie: regressione
Statistica: principi e metodi
Cap. 10-1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b

Anteprima parziale del testo

Scarica Regressione lineare: calcolo dei parametri e interpretazione e più Slide in PDF di Statistica Economica solo su Docsity!

Capitolo 10

Analisi delle distribuzioni

doppie: regressione

Statistica: principi e metodi

Analisi delle relazioni fra i caratteri di

una distribuzione doppia quantitativa

Data la distribuzione congiunta di due caratteri quantitativi, i quesiti a cui

la statistica deve rispondere sono

esiste una relazione fra i due caratteri?

che tipo di relazione esiste?

Un carattere può essere

considerato antecedente

logico dell’altro

DIPENDENZA

ESEMPIO: Età (antecedente) Statura (conseguente)

Reddito(antecedente)  Consumo (conseguente)

Non si può stabilire quale

sia il carattere

antecedente e quale il

conseguente

INTERDIPENDENZA

ESEMPIO: Voto in matematica Voto in statistica

Una relazione statistica può essere descritta tramite l’equazione

dove la variabile risposta , y, è espressa come somma di due componenti:  quella rappresentata dalla funzione matematica f( x) , che fornisce il contributo della variabile indipendente x al livello della variabile risposta y  quella “ residuale ”, εεεε, che sintetizza il contributo di tutti i fattori che potrebbero influire sulla variabile risposta y e che non vengono considerati. Tale relazione definisce il modello di regressione di Y su X.

Modello di regressione

y = f (x)+ ε

Se la funzione matematica f( x), che descrive la dipendenza di Y da X, è l’equazione della retta

dove β 0 e β 1 sono i parametri della funzione , abbiamo la regressione lineare.

x x + 1 x

y

}

}

y = β 0 +β 1 x

Regressione lineare

y = β 0 +β 1 x + ε ,

β 0 : intercetta β 1 : coefficiente angolare

150

155

160

165

170

175

160 165 170 175 180 185 190

Numero di articoli

prodotti

Numero di ore di lavoro

Grafico di dispersione

L’andamento dei punti suggerisce che la relazione statistica che lega il numero di prodotti al numero di ore lavorate può essere espressa da una retta.

x

di^ Numero ore di^ y^ Nuvola di punti

lavoro

Numero di articoli prodotti 173 164 178 172 169 163 170 160 177 166 178 165 180 165 185 170 165 152 168 156

Regressione lineare

 ( x 1 , y 1 ), ( x 2 , y 2 ), …, ( xN, yN) sono le coppie di valori osservati su N unità statistiche, dette punti osservati o nuvola di punti.

 Il problema è quello di assegnare ai parametri β 0 e β 1 della retta

i valori che consentano di approssimare nel miglior modo possibile la nuvola dei punti. In altri termini, dobbiamo determinare quella retta - tra le infinte del piano -, che meglio si adatta alla nuvola di punti.

 La soluzione viene trovata utilizzando il metodo dei minimi quadrati.

y = β 0 +β 1 x + ε ,

Metodo dei minimi quadrati

Cap. 10-

∑ (^ )^ ∑(^ )

= − = − −

N
i 1
N
i 1

Sq yi yˆi^2 yi b 0 b 1 xi^2

( )

^ (^ )

=

= N 1 i^1 i^01 i i

q

N 0 i^1 i^01 i

q

Sb 2 y b bx x 0

b^ S^2 y b bx^0

∑ ∑ ∑

∑ ∑ ∑

= = =

= = = N i 1

N (^2) 1 i

N i i 0 i

N i 1

N 1 i

N i 0

yx b x bx 0

y b bx 0

1 1

1 1

i i

i i

∑ ∑ ∑

∑ ∑

= = =

= = N i 1

N i 1

N 1 i 2 i i (^0) i 1 i

N i 1

N i (^01) i 1 i

yx b x b x 0

y Nb b x 0

∑ ∑ ∑

∑ ∑

= = =

= = N i 1

N i 1

N 1 i 2 i i y 1 x i 1 i

y 1 x

N 1 i^1 i

N 0 i^1 i

yx (μ bμ ) x b x 0

N μ bμ

x

N b

y

b

Determinazione di b 0 e b 1 : valori che rendono minima la quantità

∑= − ∑= + ∑= − ∑=^ =

N
i 1
N
i 1
N 1 i 2
1 xi 1 i
N
i i y i 1 i

yx μ x bμ x b x 0

∑= − − ^ +∑= ^ =

N
i 1
N
i 1

yi xi Nμyμx b 1 - Nμx^2 xi^20

x
xy
N
i 1
i^2 x^2
N
1 i^1 i i y x

D

C x -Nμ

yx Nμ μ b =

Equazioni normali: derivate parziali della funzione rispetto ai parametri, poste uguali a zero

Dalla soluzione del problema di minimo, si trovano le formule seguenti per b 1 e b 0 :

Stima dei parametri

devianza

codevianza

b 0 =μY −b 1 μ X

∑ ∑

=

=

= −

− −

− = = N i 1

2 i X

N i 1 i X i Y N i 1 X

2 i

N i 1 i i X Y X

XY 1 (x μ )

(x μ )(y μ ) x Nμ

xy Nμ μ D

C b

 μX e μY sono le medie aritmetiche delle distribuzioni marginali di X e di Y.

Una volta calcolati b 1 e b 0 l’equazione che ne risulta

rappresenta la retta di regressione stimata di Y su X.

Il significato da attribuire al coefficiente angolare b 1 è il seguente. Poiché la retta rispecchia l’“andamento medio” dei dati osservati, b 1 indica la variazione media che subisce Y quando X aumenta di una unità.

La retta di regressione passa per il baricentro della distribuzione doppia, cioè per il punto ( μX, μY).

Retta di regressione

yˆ =b 0 +b 1 x

 b 0 → intercetta della retta: punto in

cui la retta interseca l’asse verticale;

valore della y per x=0:

b 1 → coefficiente angolare della retta

o coefficiente di regressione;

se b 1 <0 la retta è inclinata

negativamente: al crescere della

variabile indipendente x la variabile

dipendente y decresce;

 se b 1 =0 la retta è parallela all’asse

delle ascisse: al crescere della

variabile x la y rimane costante

(indipendenza lineare);

 se b 1 >0 la retta è inclinata

positivamente e al crescere della

variabile x cresce anche la y;

Interpretazione geometrica dei

parametri

Y

X

b 1 >

Y

X

b 1 =

Y

X

b 0 b 1 <
b 0
b 0 = μμμμ y

L’analisi di regressione include la verifica

dell’ idoneità del modello a rappresentare la

relazione statistica tra le variabili Y e X.

A questo fine, viene introdotto un apposito

indice che misura la bontà dell’adattamento della

retta di regressione ai punti osservati, per la cui

costruzione ci si avvale della scomposizione

della devianza.

Adattamento della retta di regressione ai dati

Data una distribuzione doppia disaggregata, la devianza della distribuzione marginale del carattere Y può essere così scomposta:

dove sono le predizioni fornite dalla retta di regressione.

Scomposizione della devianza nel modello di regressione

yˆ i

devianza spiegata= DSL devianza residua=^ DRL

∑ ∑ ∑

= − = − + −

N i i i

N i i Y

N i

DY yi μY y μ y y

( )^2 ( ˆ ) ( ˆ )

Scomposizione della devianza nel modello

di regressione: interpretazione grafica

Cap. 10-

Y

X

y( media)

y( teorici)

y ( osservati)

Y

X

Y

X

μy

yi

Y

X

Dy

μy

yi yˆi^ DSL yˆi DRL

Distanza fra valori
osservati e media
Distanza fra
valori
osservati e
valori teorici
Distanza fra valori
teorici e media

173 164 162.23 0.49 1.145 3. 178 172 166.35 75.69 9.27 31. 169 163 158.94 0.09 19.03 16. 170 160 159.76^ 10.89 12.52^ 0. 177 166 165.52 7.29 4.94 0. 178 165 166.35 2.89 9.27 1. 180 165 167.99^ 2.89 22.01^ 8. 185 170 172.11 44.89 77.55 4. 165 152 155.65^ 127.69 58.58^ 13. 168 156 158.12 53.29 26.88 4. Totale (^) 326.10 241.20 84.

Scomposizione della devianza: esempio

x i y i yˆ i (y (^) i −μ Y )^2 (yˆi − μ Y )^2 (yi −yˆ i )^2

DY DSL DRL

Valori teorici

Possiamo anche verificare che la somma dei valori teorici di Y è uguale alla somma dei valori osservati.

  1. 10 ≈ 241. 20 + 84. 85 = 326. 05

Verifichiamo empiricamente la scomposizione della devianza di cui sopra:

y ˆ^ = 19. 851 + 0. 823 x

μY = 163.