Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Correlazione e interpolazione, Slide di Statistica

Correlazione e interpolazione. <div><br /></div><div>Contenuti: </div><div><br /></div><div><div>Analisi della relazione tra due caratteri quantitativi </div><div>•</div><div> </div><div>Interpolazione •</div><div> </div><div>Metodo dei minimi quadrati •</div><div> </div><div>Interpolazione lineare •</div><div> </div><div>Correlazione lineare  </div></div>

Tipologia: Slide

2011/2012

Caricato il 01/05/2012

andreagrassi90
andreagrassi90 🇮🇹

4

(1)

6 documenti

1 / 24

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
Analisi della relazione tra due
caratteri quantitativi
Interpolazione
Metodo dei minimi quadrati
Interpolazione lineare
Correlazione lineare
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18

Anteprima parziale del testo

Scarica Correlazione e interpolazione e più Slide in PDF di Statistica solo su Docsity!

Analisi della relazione tra due

caratteri quantitativi

  • Interpolazione
  • Metodo dei minimi quadrati
  • Interpolazione lineare
  • Correlazione lineare

Interpolazione matematica e

interpolazione statistica

Interpolazione MATEMATICA Problema tipico: si hanno N punti di coordinate (x i , y i ) e si vuole trovare l’equazione di una curva che passi esattamente per i punti stessi. y x

Interpolazione matematica e

interpolazione statistica

Considerazione: trovare l’equazione di una curva passante per N punti dati, ha senso solo se i punti sono pochi. Quando i punti osservati sono molti (situazione tipica di un problema statistico), il modo migliore per descrivere la relazione tra le due variabili X e Y studiate è quello di ricorrere ad una curva passante “il più vicino possibile” ai punti.

Interpolazione matematica e

interpolazione statistica

Interpolazione “matematica” Interpolazione “statistica” x x y y

Metodo dei minimi quadrati

Dunque con il metodo dei minimi quadrati i parametri della funzione (a 0 ,…a k ) sono scelti in modo tale da minimizzare la somma dei quadrati delle distanza tra le ordinate empiriche e quelle teoriche: y=a 0 +a 1 x xi f(xi) yi = yi - f(xi)

8

Metodo dei minimi quadrati

Funzione da minimizzare: S è una funzione convessa, ciò implica che ogni punto critico di S è un punto di minimo assoluto. Condizioni del I ordine:

S ( a

0

,…, a

k

) = y

i

! f ( x

i ( )) 2 i = 1 N " ! S ! a 0 = 0 ! ! S ! a k = 0 "

$ $ $ % $ $ $

10

Interpolazione lineare

  • Y = a + bX, equazione della retta interpolante dove: X à variabile indipendente Y à variabile dipendente (o di risposta) a, b à parametri X Y y=a 0 +a 1 x

Significato dei parametri della retta

interpolante

a: intercetta , esprime il valore di Y quando X=0. b: coefficiente angolare , misura la variazione di Y quando X aumenta di una unità. b>0 à relazione positiva: Xé allora Yé e viceversa b<0 à relazione negativa: Xé allora Yê e viceversa b=0 à assenza di relazione (di tipo lineare): al variare della X, la Y rimane costante. N.B. a e b sono espressi entrambi nella stessa unità di misura della variabile Y

Calcolo dei parametri a e b mediante il

metodo dei minimi quadrati

  • y i , x i : coppia di valori osservato per l’unità i
  • f(x i ) = a + bx i : la curva scelta è una retta, a e b sono i parametri (per semplicità si usa la notazione a,b invece di a 0 ,a 1
  • ŷ i = a + bx i : valore espresso dalla funzione scelta in corrispondenza di x i
  • y i - ŷ i = y i - f(x i ) = e i , distanza tra il punto (x i ,y i ) (osservato) e (x i ,ŷ i ) (predetto)

La funzione S da minimizzare in questo caso è: Le condizioni del primo ordine sono:

Calcolo dei parametri a e b mediante il

metodo dei minimi quadrati

S ( a , b ) = e i 2 i = 1 N ! =^ (^ y^ i "^^ y ˆ^ i ) 2 i = 1 N ! =^ [^ y^ i "^ (^ a^ +^ bxi )] 2 i = 1 N ! ! S ! a = 0 ! S ! b = 0 "

$ $ % $ $ & 2 y i & a & bx i i = 1 N ' =^0 & 2 ( y i & a & bx i ) x i i = 1 N ' =^0 "

$ $ % $ $

Quindi, dividendo per N sia il numeratore che il denominatore, b si può anche scrivere come: b = covarianza tra X e Y / varianza di X b = Cov(X,Y) / Var(X) Il numeratore di b viene detto codevianza e rappresenta una misura del legame lineare tra le due variabili. Essa è data dalla somma dei prodotti degli scarti dei valori osservati dalle rispettive medie. La codevianza divisa per N viene detta covarianza. b = ( x i ! x )( y i ! y ) i = 1 N " ( x i ! x ) 2 i = 1 N "

Osservazioni sul coefficiente angolare

b = x i y i ! Nxy i = 1 N " x i 2 ! Nx 2 i = 1 N " COD ( X , Y ) = (xi! x)(yi! y) i= 1 N " =^ xi i= 1 N " yi!^ Nxy o in alternativa: Dunque b si calcola come rapporto tra la codevianza e la devianza della X: COV ( X , Y ) = 1 N (xi! x)(yi! y) i= 1 N " =^ 1 N xi i= 1 N " yi!^ xy

b = 1,03 significa che all’aumentare della X di una unità, la Y aumenta in media di 1,03 unità. a = 3,07 è il valore assunto dalla Y per X = 0

Esempio

X Y xi- yi- (xi- )^2 (xi- )(yi- ) 1 5 -3,2 -2,4 10,24 7, 3 4 -1,2 -3,4 1,44 4, 4 7 -0,2 -0,4 0,04 0, 5 10 0,8 2,6 0,64 2, 8 11 3,8 3,6 14,44 13, 21 37 26,80 27, N = 5 x = 1 + 3 + 4 + 5 + 8 5 = 4 , 2 y = 5 + 4 + 7 + 10 + 11 5 = 7 , 4 b = COD ( X , Y ) DEV ( X ) = [( x i ! x )( y i ! y )] i = 1 N " ( x i ! x ) 2 i = 1 N " = 27 , 6 26 , 8 = 1 , 03 a = y! bx = 7 , 4! 1 , 03 # 4 , 2 = 3 , 075 x y x x y

Dati in serie storica Esempio Popolazione italiana dall’unità al 2001 (fonte: ISTAT) Data Censimento Anno Pop (migliaia) 31/12/1861 1861 26328 31/12/1871 1871 28151 31/12/1881 1881 29791 anno 1891 1891 Dato mancante 10/02/01 1901 33778 10/06/11 1911 36921 01/12/21 1921 37856 21/04/31 1931 41043 anno 1941 1941 Dato mancante 04/11/51 1951 47516 15/10/61 1961 50624 24/10/71 1971 54137 25/10/81 1981 56557 20/10/91 1991 56778 31/12/01 2001 58008

20 Quale curva (ossia: quale funzione matematica) potrebbe costituire un ragionevole modello matematico di tale evoluzione? POP totale (migliaia) 0 10000 20000 30000 40000 50000 60000 70000 1860 1880 1900 1920 1940 1960 1980 2000 Grafico a punti (o scatter )