

































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Lezioni di interpolazione e regressione dal corso di statistica tenuto all'università di napoli federico ii, insegnato da g. Scepi durante l'anno accademico 2016-’17. Il documento include calcoli per determinare la relazione tra due variabili x e y, tra cui la dispersione, la retta di regressione e l'indice di determinazione lineare. Il documento include anche esercizi per applicare questi concetti.
Tipologia: Appunti
1 / 41
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!


































Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Corso di^ Statistica
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Lezione 11^ – Interpolazione e Regressione^ Date due variabili,
X^ e^ Y , rappresentabili come assi di un pianocartesiano, e data una nuvola di punti sul piano, costituita dalle
n
coppie di valori osservati sulle unità statistiche, il problemadell’ interpolazione
consiste nel trovare l
’equazione di una curva passante per alcuni punti del piano, oppure
“vicino”^ ai punti stessi. L’interpolazione può essere di due tipi:^ - Interpolazione matematica- Interpolazione statistica
(^300002500020000) 2000 AO 1500 AN ARATAQ AL 1000 APAGAV^50015000100005000 Prezzo casa al mq(in €)
Reddito p.c.(in €)
L ’ interpolazione
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Lezione 11^ – Interpolazione e Regressione^ Interpolazione statistica^ Quando l’insieme dei punti a disposizione è numeroso, è molto probabile che questi si dispongano, sulpiano, definendo una
nube di punti. In^ questi^ casi,^ all
’^ interpolante^ matematica
si^ sostituisce l’ interpolante statistica
, che abbandona il vincolo di passare per^ i punti, a favore di una condizione più realistica, di passare,cioè,^ fra^ i punti dati.
(^3500030000250002000015000) 25000 20000 15000 10000 5000 0 1000050000
Reddito p.c.(in €) Consumi p.c.(in €)
L ’ interpolazione
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Lezione 11^ – Interpolazione e Regressione^ Interpolazione statistica^ Quando l’insieme dei punti a disposizione è numeroso, è molto probabile che questi si dispongano, sulpiano, definendo una
nube di punti.
In^ questi^ casi,^ all
’^ interpolante^ matematica
si^ sostituisce l’ interpolante statistica
, che abbandona il vincolo di passare per^ i punti, a favore di una condizione più realistica, di passare,cioè,^ fra^ i punti dati.Mentre, però, nell’
interpolazione matematica avevamo un
’unica
soluzione individuata dalla soluzione del sistema di equazioni,nell^ ’^ interpolazione
statistica^ esistono
infinite^ curve
che
possono passare fra i punti.E’^ quindi necessario stabilire delle
condizioni^ cui la funzione interpolante deve soddisfare per far sì che il problema sia definitoin modo univoco.Ancora, nell’interpolazione statistica non c
’è una relazione fissa tra il numero dei parametri L ’ interpolazione dell’interpolante e il numero dei punti, risultando sufficiente che i secondi superino i primi.
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Lezione 11^ – Interpolazione e Regressione^ Metodo dei minimi quadrati
(Gauss, 1795; Legendre, 1805)
ˆ y^ ^ x^ , a , a , ^ , a^ ^ i^ i^^0 1 k
(^2) , , a y^ ^ m in (^) 1 ki i La^ quantità^ da^ minimizzare,
S ,^ è^ funzione^ dei^
k +1^ parametri^ incogniti. Condizione necessaria perché ciò si verifichi è che le
k +1 derivate parziali di
S
, a , , a y (^) (^0 1) ki a
^ i S 2 ^ x^ , a , a , ^ , a^ ^ i^^0 1 k a 1
y^ ^0 i a^1 ^ i
a , , a y (^) (^1) ki a^ k
^ ^ i
Sistema di equazioninormali a minimiquadrati L ’ interpolazione
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Lezione 11^ – Interpolazione e Regressione^ Metodo dei minimi quadrati
(Gauss, 1795; Legendre, 1805) ˆ y ^ x^ , a ,^ a , ^ ,^ a ^ i i^^0 1 k Funzione interpolante: La condizione dei minimi quadrati determina i parametri incogniti in modo da rendere minima la somma dei quadrati degliscarti fra valori interpolati e valori osservati:
ˆ y^ a^ a x ^ ^0
Quando è k=1, la funzione interpolante è la retta e l
’espressione si riduce a: Che può anche essere trovata nelle forme:
L ’ interpolazione
X Y
X Y
X Y
(^2) ˆ S y y min i i i S x , a , a , ^ , a^ ^ i^0 1 k
La soluzione individuata rende minima la somma dei quadrati degli scarti rispetto aqualunque altra curva^
dello stesso tipo di quella scelta
.
X Y
X Y
X Y
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Lezione 11^ – Interpolazione e Regressione^ Interpolante lineare
ˆ y^ b^ b x ^ ^0 ^ ^ ^
(^2) 0 1 0
(^11) ,^
min n S b b y^ b^ b x ^ ^ i^ i ^ i
^ ^
^ 0 1
0 1 0
1
Metodo dei minimi quadrati
(Gauss, 1795; Legendre, 1805)
sono: y b bx (^) i 0 1 i
^ y^ ^ b i^^0 b^0
^ y^ ^ b i^^0 b^1
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Lezione 11^ – Interpolazione e Regressione^ Interpolante lineare
ˆ y^ b^ b x ^ ^0
y^3 y^2 y^4 y^1 x^ x^ x^ x^1 2 3
^ ^ ^
(^2) 0 1 0
(^11) ,^
min n S b b y^ b^ b x ^ ^ i^ i i ^ ^
0 1
0 1 0
1
2
0 i^ i^ i^
i i^ i^ x y^ b^ x^ b^ xi ^
^ ^
L ’ interpolazione Metodo dei minimi quadrati^ (Gauss, 1795; Legendre, 1805)^ ^ y^ nb^ b^ x ^ ^ ^ i^ i ^ ^ i^ i ^
(^2) ˆ S y y min i i i
x^ y^ b^ b xi^ i^ i i
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Var(X)
b^ y^ b x ^ ^0
Cov^ XY ^ b 1 Var^ X ^
^ ^ ^
(^2) 0 1 0
(^11) ,^
min n S b b y^ b^ b x ^ ^ i^ i i
^
^ ^ ,^ ,^ ^ 0 1 0 10 0 1
Interpolante lineare
^0 ˆ y^ b^ b x ^ ^1 Metodo dei minimi quadrati
(Gauss, 1795; Legendre, 1805) L ’ interpolazione
(^2) ˆ S y y min i i i
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Lezione 11^ – Interpolazione e Regressione^ La RegressioneLa Regressione sul testo
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
; Y f X e^ La Regressione
-^ Decidiamo di rappresentare la nube di punti con una
funzione^ che passi
tra^ i punti stessi;
-^ Tra tutte le possibili funzioni, scegliamo la funzione lineare,
y =b+b x^ ;^01
-^ Tra tutte le infinite possibili rette, scegliamo quella cheottimizza un criterio che definiamo arbitrariamente, peresempio^ quella che minimizza la somma dei quadrati degliscarti tra valori osservati e valori teorici
Riepilogo
-^ Il^ metodo dei minimi quadrati
ci consente di ottenere le soluzioni di questo problema, soluzioni che rappresentano iparametri della retta:^0 b^ y^ b x ^ ^1
Cov^ XY ^ b 1 Var^ X ^
-^ Sostituendo questi valori nell
’ equazione^
, per ogni valore dato di
X^ otterremo
il corrispondente valore teorico di
ˆ y^ b^ b x ^ ^0 1 i^ i
^
2
(^20 )
^ ^
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
y^ i ˆ yi^ x^ i
b^ y^ b x ^ ^0 1^ Cov^ XY ^ b^^ ^1 Var^ X ^
E ’^ l ’ intercetta^ sull ’ asse delle ordinate. Può essereinterpretato come il valore di Y per X=0 (quando ciòha senso). 0 1 y^ b^ b x ^ ^
Il punto di coordinate^
è un punto della retta di regressione. La retta di regressione passa, dunque,sempre per il baricentro della nube. ; x y E ’^ il^ coefficiente angolare
della retta di regressione in quanto funzione dell ’ angolo che la retta forma conl ’ asse delle ascisse.Esprime dunque la^ pendenza (positiva, negativa o nulla) della retta.Esprime anche quanto varia la variabile Y al variareunitario della variabile X.
; x y
La Regressione
; Y^ f^ X^ ^
e ˆ y^ b^ b x ^ ^0 1 i^ i
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Lezione 11^ – Interpolazione e Regressione
(^300250200150) 900000800000133 70000014151060000050000074 400000211930000056 121 2000008 1000000 100500 ^ ^ ^ ^ 115.270.
7.684.666,7 15 x^ y^ ^ ^ ^ i^ X^ i^ YiCov XY ^ n
La Regressione
; Y^ f^ X^ ^
e mqPrezzo in € App. (X)(Y) X-M(X)^ Y-M(Y) [X-M(X)][Y-M(Y)]* 1 80 212000
10.319. 2 200 313000
69,0^ - 101333,
54,0^ 302666,
16.344. 4 140 431000
9,0^ 16666,
5 95 270000
5.196. 6 60 261000
10.886. 7 210 431000
79,0^ 16666,
1.316. 8 65 140000
18.106. 9 70 282000
8.072. 10 120 600000
3.451. 12 90 220000
7.967. 13 180 749000
49,0^ 334666,
16.398. 14 220 663000
89,0^ 248666,
22.131. 15 150 623000
19,0^ 208666,
3.964. 1.965^ 6.215.^
0,0^ 0,^
115.270. b^ y^ b x ^ ^0
Cov^ XY ^ b 1 Var^ X ^ =131,0X =54,44X
μ=414.333,3Y =197.060,96Y
Università di Napoli Federico II, DISES, A.a. 2016-
’ 17, Corso di^ Statistica
G. Scepi
Lezione 11^ – Interpolazione e Regressione
(^300250200150) 900000800000133 70000014151060000050000074 400000211930000056 121 2000008 1000000 100500 cov^ XY^ ^ ^ 7.684.666,7 XYb ^1 2 Var^ X^ ^ ^ X
La Regressione
; Y^ f^ X^ ^
e mqPrezzo in € App. (X)(Y) X-M(X)^ Y-M(Y) [X-M(X)][Y-M(Y)]* 1 80 212000
10.319. 2 200 313000
69,0^ - 101333,
54,0^ 302666,
16.344. 4 140 431000
9,0^ 16666,
5 95 270000
5.196. 6 60 261000
10.886. 7 210 431000
79,0^ 16666,
1.316. 8 65 140000
18.106. 9 70 282000
8.072. 10 120 600000
3.451. 12 90 220000
7.967. 13 180 749000
49,0^ 334666,
16.398. 14 220 663000
89,0^ 248666,
22.131. 15 150 623000
19,0^ 208666,
3.964. 1.965^ 6.215.^
0,0^ 0,^
115.270. b^ y^ b x ^ ^0
Cov^ XY ^ b 1 Var^ X ^ =131,0X =54,44X
μ=414.333,3Y =197.060,96Y