
















Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Correlazione e interpolazione. <div><br /></div><div>Contenuti: </div><div><br /></div><div><div>Analisi della relazione tra due caratteri quantitativi </div><div>•</div><div> </div><div>Interpolazione •</div><div> </div><div>Metodo dei minimi quadrati •</div><div> </div><div>Interpolazione lineare •</div><div> </div><div>Correlazione lineare </div></div>
Tipologia: Slide
1 / 24
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!

















Interpolazione MATEMATICA Problema tipico: si hanno N punti di coordinate (x i , y i ) e si vuole trovare l’equazione di una curva che passi esattamente per i punti stessi. y x
Considerazione: trovare l’equazione di una curva passante per N punti dati, ha senso solo se i punti sono pochi. Quando i punti osservati sono molti (situazione tipica di un problema statistico), il modo migliore per descrivere la relazione tra le due variabili X e Y studiate è quello di ricorrere ad una curva passante “il più vicino possibile” ai punti.
Interpolazione “matematica” Interpolazione “statistica” x x y y
Dunque con il metodo dei minimi quadrati i parametri della funzione (a 0 ,…a k ) sono scelti in modo tale da minimizzare la somma dei quadrati delle distanza tra le ordinate empiriche e quelle teoriche: y=a 0 +a 1 x xi f(xi) yi = yi - f(xi)
8
Funzione da minimizzare: S è una funzione convessa, ciò implica che ogni punto critico di S è un punto di minimo assoluto. Condizioni del I ordine:
0
k
i
i ( )) 2 i = 1 N " ! S ! a 0 = 0 ! ! S ! a k = 0 "
$ $ $ % $ $ $
10
a: intercetta , esprime il valore di Y quando X=0. b: coefficiente angolare , misura la variazione di Y quando X aumenta di una unità. b>0 à relazione positiva: Xé allora Yé e viceversa b<0 à relazione negativa: Xé allora Yê e viceversa b=0 à assenza di relazione (di tipo lineare): al variare della X, la Y rimane costante. N.B. a e b sono espressi entrambi nella stessa unità di misura della variabile Y
La funzione S da minimizzare in questo caso è: Le condizioni del primo ordine sono:
S ( a , b ) = e i 2 i = 1 N ! =^ (^ y^ i "^^ y ˆ^ i ) 2 i = 1 N ! =^ [^ y^ i "^ (^ a^ +^ bxi )] 2 i = 1 N ! ! S ! a = 0 ! S ! b = 0 "
$ $ % $ $ & 2 y i & a & bx i i = 1 N ' =^0 & 2 ( y i & a & bx i ) x i i = 1 N ' =^0 "
$ $ % $ $
Quindi, dividendo per N sia il numeratore che il denominatore, b si può anche scrivere come: b = covarianza tra X e Y / varianza di X b = Cov(X,Y) / Var(X) Il numeratore di b viene detto codevianza e rappresenta una misura del legame lineare tra le due variabili. Essa è data dalla somma dei prodotti degli scarti dei valori osservati dalle rispettive medie. La codevianza divisa per N viene detta covarianza. b = ( x i ! x )( y i ! y ) i = 1 N " ( x i ! x ) 2 i = 1 N "
b = x i y i ! Nxy i = 1 N " x i 2 ! Nx 2 i = 1 N " COD ( X , Y ) = (xi! x)(yi! y) i= 1 N " =^ xi i= 1 N " yi!^ Nxy o in alternativa: Dunque b si calcola come rapporto tra la codevianza e la devianza della X: COV ( X , Y ) = 1 N (xi! x)(yi! y) i= 1 N " =^ 1 N xi i= 1 N " yi!^ xy
b = 1,03 significa che all’aumentare della X di una unità, la Y aumenta in media di 1,03 unità. a = 3,07 è il valore assunto dalla Y per X = 0
X Y xi- yi- (xi- )^2 (xi- )(yi- ) 1 5 -3,2 -2,4 10,24 7, 3 4 -1,2 -3,4 1,44 4, 4 7 -0,2 -0,4 0,04 0, 5 10 0,8 2,6 0,64 2, 8 11 3,8 3,6 14,44 13, 21 37 26,80 27, N = 5 x = 1 + 3 + 4 + 5 + 8 5 = 4 , 2 y = 5 + 4 + 7 + 10 + 11 5 = 7 , 4 b = COD ( X , Y ) DEV ( X ) = [( x i ! x )( y i ! y )] i = 1 N " ( x i ! x ) 2 i = 1 N " = 27 , 6 26 , 8 = 1 , 03 a = y! bx = 7 , 4! 1 , 03 # 4 , 2 = 3 , 075 x y x x y
Dati in serie storica Esempio Popolazione italiana dall’unità al 2001 (fonte: ISTAT) Data Censimento Anno Pop (migliaia) 31/12/1861 1861 26328 31/12/1871 1871 28151 31/12/1881 1881 29791 anno 1891 1891 Dato mancante 10/02/01 1901 33778 10/06/11 1911 36921 01/12/21 1921 37856 21/04/31 1931 41043 anno 1941 1941 Dato mancante 04/11/51 1951 47516 15/10/61 1961 50624 24/10/71 1971 54137 25/10/81 1981 56557 20/10/91 1991 56778 31/12/01 2001 58008
20 Quale curva (ossia: quale funzione matematica) potrebbe costituire un ragionevole modello matematico di tale evoluzione? POP totale (migliaia) 0 10000 20000 30000 40000 50000 60000 70000 1860 1880 1900 1920 1940 1960 1980 2000 Grafico a punti (o scatter )