Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Interpolazione e Regressione: Calcoli Statistici per Correlare X e Y, Appunti di Statistica Economica

Lezioni di interpolazione e regressione dal corso di statistica tenuto all'università di napoli federico ii, insegnato da g. Scepi durante l'anno accademico 2016-’17. Il documento include calcoli per determinare la relazione tra due variabili x e y, tra cui la dispersione, la retta di regressione e l'indice di determinazione lineare. Il documento include anche esercizi per applicare questi concetti.

Tipologia: Appunti

2018/2019

Caricato il 03/05/2019

Darvant
Darvant 🇮🇹

1

(1)

11 documenti

1 / 41

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1111
Università di Napoli Federico II, DISES, A.a. 2016-17, Corso di Statistica
G. ScepiLezione 11 Interpolazione e Regressione
Germana Scepi
Corso di Statistica
Anno accademico 2015-’16
Lezione: Argomento: Interpolazione e Regressione11
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29

Anteprima parziale del testo

Scarica Interpolazione e Regressione: Calcoli Statistici per Correlare X e Y e più Appunti in PDF di Statistica Economica solo su Docsity!

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione^ Germana Scepi

Corso di^ Statistica

Anno accademico 2015-’16 [email protected]

Lezione:^

Argomento:^ Interpolazione e Regressione 11

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione^ Date due variabili,

X^ e^ Y , rappresentabili come assi di un pianocartesiano, e data una nuvola di punti sul piano, costituita dalle

n

coppie di valori osservati sulle unità statistiche, il problemadell’ interpolazione

consiste nel trovare l

’equazione di una curva passante per alcuni punti del piano, oppure

“vicino”^ ai punti stessi. L’interpolazione può essere di due tipi:^ - Interpolazione matematica- Interpolazione statistica

(^300002500020000) 2000 AO 1500 AN ARATAQ AL 1000 APAGAV^50015000100005000 Prezzo casa al mq(in €)

Reddito p.c.(in €)

Linterpolazione

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione^ Interpolazione statistica^ Quando l’insieme dei punti a disposizione è numeroso, è molto probabile che questi si dispongano, sulpiano, definendo una

nube di punti. In^ questi^ casi,^ all

’^ interpolante^ matematica

si^ sostituisce l’ interpolante statistica

, che abbandona il vincolo di passare per^ i punti, a favore di una condizione più realistica, di passare,cioè,^ fra^ i punti dati.

(^3500030000250002000015000) 25000 20000 15000 10000 5000 0 1000050000

Reddito p.c.(in €) Consumi p.c.(in €)

Linterpolazione

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione^ Interpolazione statistica^ Quando l’insieme dei punti a disposizione è numeroso, è molto probabile che questi si dispongano, sulpiano, definendo una

nube di punti.

X
Y

In^ questi^ casi,^ all

’^ interpolante^ matematica

si^ sostituisce l’ interpolante statistica

, che abbandona il vincolo di passare per^ i punti, a favore di una condizione più realistica, di passare,cioè,^ fra^ i punti dati.Mentre, però, nell’

interpolazione matematica avevamo un

’unica

soluzione individuata dalla soluzione del sistema di equazioni,nell^ ’^ interpolazione

statistica^ esistono

infinite^ curve

che

possono passare fra i punti.E’^ quindi necessario stabilire delle

condizioni^ cui la funzione interpolante deve soddisfare per far sì che il problema sia definitoin modo univoco.Ancora, nell’interpolazione statistica non c

’è una relazione fissa tra il numero dei parametri Linterpolazione dell’interpolante e il numero dei punti, risultando sufficiente che i secondi superino i primi.

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione^ Metodo dei minimi quadrati

(Gauss, 1795; Legendre, 1805)

X
Y

ˆ y^ ^ x^ , a , a ,^ , a^ ^ i^ i^^0 1 k

Funzione interpolante: La condizione dei minimi quadrati determina i parametri incogniti in modo da rendere minima la somma dei quadrati degliscarti fra valori interpolati e valori osservati:^2 ˆ S^ y^ y ^ ^  min^ ^ ^ i^ i i^ S^ ^ x^ , a , ai^^0

(^2) , , ay^ ^ m in   (^)  1 ki   i La^ quantità^ da^ minimizzare,

S ,^ è^ funzione^ dei^

k +1^ parametri^ incogniti. Condizione necessaria perché ciò si verifichi è che le

k +1 derivate parziali di

S

rispetto ai parametri siano nulle. Si ha allora il sistema:^  S^ ^2 ^ x^ , ai^^  a^0

 , a , , ay (^)   (^0 1) ki   a

^00

^ iS  2 ^ x^ , a , a ,^ , a^ ^ i^^0 1 ka 1

  y^ ^0  i   a^1 ^ i

^

 S^ ^2 ^ x^ , a , i^^0  a^ k

  a , , ay (^)   (^1) ki   a^ k

^0

       ^ ^ i 

Sistema di equazioninormali a minimiquadrati Linterpolazione

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione^ Metodo dei minimi quadrati

(Gauss, 1795; Legendre, 1805) ˆ y ^ x^ , a ,^ a ,^ ,^ a ^  i i^^0 1 k Funzione interpolante: La condizione dei minimi quadrati determina i parametri incogniti in modo da rendere minima la somma dei quadrati degliscarti fra valori interpolati e valori osservati:

ˆ y^ a^ a x ^ ^0

Quando è k=1, la funzione interpolante è la retta e l

’espressione si riduce a: Che può anche essere trovata nelle forme:

y^ = a + bx ˆ^
y = b^ + b x ˆ^0

Linterpolazione

X Y

X Y

X Y

(^2) ˆ S y y    min   i i i S  x , a , a ,^ , a^  ^ i^0 1 k

y^ i
^

^^ i

2 ^ m in

La soluzione individuata rende minima la somma dei quadrati degli scarti rispetto aqualunque altra curva^

dello stesso tipo di quella scelta

.

X Y

X Y

X Y

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione^ Interpolante lineare

ˆ y^ b^ b x ^ ^0 ^ ^ ^

(^2)  0 1 0

(^11) ,^

min n S b b y^ b^ b x  ^ ^  i^ i ^ i

^ ^

^  0 1

0 1 0

1

,^
S^ b^ b^
S^ b^ b
b^
b
^ ^
^ 
^
^ ^
^  
^

Metodo dei minimi quadrati

(Gauss, 1795; Legendre, 1805)

L ’ interpolazione

2 ˆ S y y min     i i i

NOTA: La derivata di una funzione quadratica

è uguale a due volte la funzione non derivata moltiplicato la

derivata della funzione:

2 D f x ^2 ^  ^

f^ x ^ f^ x ^ ^ ^ 

Quindi, le derivate, rispetto a b

e a b^ di^0

sono: ybbx (^) i 0 1 i

n^2 ^   i ^1

^ y^ ^ bi^^0  b^0

n^2 ^ bx^ ^2 y ^  ^1 i  i ^1 

^ b ^ bx^     i^^0 1 i i

1  ^2 y^ ^ b  ^ i^

^ bx^    0 1 i i

^ y^ ^ bi^^0  b^1

n^2 ^ bx^ ^2 y ^  ^1 i  i ^1 

^ b ^ bx^     i^^0 1 i i

x^  ^2 x^ y^  ^ ii^ i

^ b ^ bx^   ^0 1 i i

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione^ Interpolante lineare

ˆ y^ b^ b x ^ ^0

y^3 y^2 y^4 y^1 x^ x^ x^ x^1 2 3

X
Y

^ ^ ^

(^2)  0 1 0

(^11) ,^

min n S b b y^ b^ b x  ^ ^  i^ i i   ^ ^

 0 1

0 1 0

1

,^
S^ b^ b^
S^ b^ b
b^
b
^ ^
^ 
^
^ ^
^  
^

2

0 i^ i^ i^

i i^ i^ x y^ b^ x^ b^ xi ^

 ^ ^

0 1 ^  ^   

Linterpolazione Metodo dei minimi quadrati^ (Gauss, 1795; Legendre, 1805)^ ^  y^ nb^ b^ x ^ ^ ^  i^ i ^ ^  i^ i ^ 

(^2) ˆ S y y min     i i i

^  ^ ^  2 0 y^ b^ b x ^ ^0 1 i^ i ^ ^  i ^  ^ ^  2 ^ ^ ^ ^0 1 ^ 

x^ y^ b^ b xi^ i^ i i

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione b^ y^ b x ^ ^0

2 2 ^  1

i i^0
x x y xy b i i i
x
n^

^ ^   ^ ^  n ^ ^ 

^ Cov(XY)^

Var(X)

Cov^ XY^ ^  b   1 Var^ X^ ^ 

b^ y^ b x ^ ^0

Cov^ XY ^  b  1 Var^ X ^ 

^ ^ ^

(^2)  0 1 0

(^11) ,^

min n S b b y^ b^ b x  ^ ^ i^ i i

^

^ ^ ,^ ,^ ^  0 1 0 10 0 1

S^ b^ b^
S^ b^ b b b
^ ^
^ 
^
  ^   

Interpolante lineare

^0 ˆ y^ b^ b x ^ ^1 Metodo dei minimi quadrati

(Gauss, 1795; Legendre, 1805) Linterpolazione

(^2) ˆ S y y min     i i i

Parametri della interpolante linearericavati con il metodo dei minimi quadrati:

^ ^ ^

Cov^ XY^ b^ Var
X   

La retta costruita con i valori di b

e b^ ottenuti dalla risoluzione del sistema, sarà dunque 0 1

quella più “vicina” ai punti, ossia quella che rende minima la somma dei quadrati delle distanzetra valori osservati e valori teorici della variabile dipendente y.

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione^ La RegressioneLa Regressione sul testo

Statistica per le decisioni

18. Il modello di Regressione lineare 18.1^ Introduzione18.2^ Modello di regressione semplice18.3^ Aspetti inferenziali del modello18.4^ Specificazione del modello18.5^ La stima dei parametri18.6^ Proprietà degli stimatori18.7^ Verifica del modello stimato18.8^ Indice di determinazione multipla18.9^ Utilizzazioni del modello di regressione semplice18.10^ Considerazioni finali I paragrafi 18.4, 18.6 e 18.7 verranno trattati nella

Lezione 23.

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione^ X^ Variabile indipendenteVariabile dipendente^ Y^

; Y f X e^     La Regressione

X
Y

-^ Decidiamo di rappresentare la nube di punti con una

funzione^ che passi

tra^ i punti stessi;

-^ Tra tutte le possibili funzioni, scegliamo la funzione lineare,

y =b+b x^ ;^01

-^ Tra tutte le infinite possibili rette, scegliamo quella cheottimizza un criterio che definiamo arbitrariamente, peresempio^ quella che minimizza la somma dei quadrati degliscarti tra valori osservati e valori teorici

Riepilogo

-^ Il^ metodo dei minimi quadrati

ci consente di ottenere le soluzioni di questo problema, soluzioni che rappresentano iparametri della retta:^0 b^ y^ b x ^ ^1

Cov^ XY ^  b  1 Var^ X ^ 

-^ Sostituendo questi valori nell

equazione^

, per ogni valore dato di

X^ otterremo

il corrispondente valore teorico di

0 Y.

ˆ y^ b^ b x ^ ^1 i^ i

ˆ y^ b^ b x ^ ^0 1 i^ i

^  

2

(^20 )

ˆ S y y^ y^ b^ i i^ i i i

b x

^ ^ ^

^ 

^ ^

= min

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione^ X^ Variabile indipendenteVariabile dipendente^ Y^

X
Y

La scelta del tipo di funzione:

Lineare

y^ i ˆ yi^ x^ i

b^ y^ b x ^ ^0 1^ Cov^ XY ^  b^^ ^1 Var^ X ^ 

E ’^ lintercetta^ sullasse delle ordinate. Può essereinterpretato come il valore di Y per X=0 (quando ciòha senso). 0 1 y^ b^ b x ^ ^

Il punto di coordinate^

è un punto della retta diregressione. La retta di regressione passa, dunque,sempre per il baricentro della nube. ; x yE ’^ il^ coefficiente angolare

della retta di regressione in quanto funzione dellangolo che la retta forma conlasse delle ascisse.Esprime dunque la^ pendenza (positiva, negativa o nulla) della retta.Esprime anche quanto varia la variabile Y al variareunitario della variabile X.

; x y  

La Regressione

; Y^ f^ X^ ^ 

e   ˆ y^ b^ b x ^ ^0 1 i^ i

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione

(^300250200150) 900000800000133 70000014151060000050000074 400000211930000056 121 2000008 1000000 100500 ^ ^   ^ ^ 115.270.

7.684.666,7 15 x^ y^ ^ ^ ^ i^ X^ i^ YiCov XY  ^ n

  La Regressione

; Y^ f^ X^ ^ 

e   mqPrezzo in € App. (X)(Y) X-M(X)^ Y-M(Y) [X-M(X)][Y-M(Y)]* 1 80 212000

  • 51,0^ - 202333,

10.319. 2 200 313000

69,0^ - 101333,

  • 6.992. 3 185 717000

54,0^ 302666,

16.344. 4 140 431000

9,0^ 16666,

5 95 270000

  • 36,0^ - 144333,

5.196. 6 60 261000

  • 71,0^ - 153333,

10.886. 7 210 431000

79,0^ 16666,

1.316. 8 65 140000

  • 66,0^ - 274333,

18.106. 9 70 282000

  • 61,0^ - 132333,

8.072. 10 120 600000

  • 11,0^ 185666,
  • 2.042. 11 100 303000
    • 31,0^ - 111333,

3.451. 12 90 220000

  • 41,0^ - 194333,

7.967. 13 180 749000

49,0^ 334666,

16.398. 14 220 663000

89,0^ 248666,

22.131. 15 150 623000

19,0^ 208666,

3.964. 1.965^ 6.215.^

0,0^ 0,^

115.270. b^ y^ b x ^ ^0

Cov^ XY ^  b  1 Var^ X ^   =131,0X=54,44X

μ=414.333,3Y=197.060,96Y

Università di Napoli Federico II, DISES, A.a. 2016-

17, Corso di^ Statistica

G. Scepi

Lezione 11^ – Interpolazione e Regressione

(^300250200150) 900000800000133 70000014151060000050000074 400000211930000056 121 2000008 1000000 100500 cov^ XY^ ^ ^ 7.684.666,7 XYb  ^1 2 Var^ X^ ^ ^  X

La Regressione

; Y^ f^ X^ ^ 

e   mqPrezzo in € App. (X)(Y) X-M(X)^ Y-M(Y) [X-M(X)][Y-M(Y)]* 1 80 212000

  • 51,0^ - 202333,

10.319. 2 200 313000

69,0^ - 101333,

  • 6.992. 3 185 717000

54,0^ 302666,

16.344. 4 140 431000

9,0^ 16666,

5 95 270000

  • 36,0^ - 144333,

5.196. 6 60 261000

  • 71,0^ - 153333,

10.886. 7 210 431000

79,0^ 16666,

1.316. 8 65 140000

  • 66,0^ - 274333,

18.106. 9 70 282000

  • 61,0^ - 132333,

8.072. 10 120 600000

  • 11,0^ 185666,
  • 2.042. 11 100 303000
    • 31,0^ - 111333,

3.451. 12 90 220000

  • 41,0^ - 194333,

7.967. 13 180 749000

49,0^ 334666,

16.398. 14 220 663000

89,0^ 248666,

22.131. 15 150 623000

19,0^ 208666,

3.964. 1.965^ 6.215.^

0,0^ 0,^

115.270. b^ y^ b x ^ ^0

Cov^ XY ^  b  1 Var^ X ^   =131,0X=54,44X

μ=414.333,3Y=197.060,96Y