



















Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Come calcolare i parametri di una regressione lineare utilizzando il metodo dei minimi quadrati. Viene inoltre illustrato come interpretare il coefficiente angolare e l'intercetta della retta di regressione stimata.
Tipologia: Slide
1 / 27
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!




















DIPENDENZA
INTERDIPENDENZA
Una relazione statistica può essere descritta tramite l’equazione
dove la variabile risposta , y, è espressa come somma di due componenti: quella rappresentata dalla funzione matematica f( x) , che fornisce il contributo della variabile indipendente x al livello della variabile risposta y quella “ residuale ”, εεεε, che sintetizza il contributo di tutti i fattori che potrebbero influire sulla variabile risposta y e che non vengono considerati. Tale relazione definisce il modello di regressione di Y su X.
Modello di regressione
y = f (x)+ ε
Se la funzione matematica f( x), che descrive la dipendenza di Y da X, è l’equazione della retta
dove β 0 e β 1 sono i parametri della funzione , abbiamo la regressione lineare.
x x + 1 x
y
}
}
Regressione lineare
y = β 0 +β 1 x + ε ,
β 0 : intercetta β 1 : coefficiente angolare
150
155
160
165
170
175
160 165 170 175 180 185 190
Numero di ore di lavoro
Grafico di dispersione
L’andamento dei punti suggerisce che la relazione statistica che lega il numero di prodotti al numero di ore lavorate può essere espressa da una retta.
x
lavoro
Numero di articoli prodotti 173 164 178 172 169 163 170 160 177 166 178 165 180 165 185 170 165 152 168 156
Regressione lineare
( x 1 , y 1 ), ( x 2 , y 2 ), …, ( xN, yN) sono le coppie di valori osservati su N unità statistiche, dette punti osservati o nuvola di punti.
Il problema è quello di assegnare ai parametri β 0 e β 1 della retta
i valori che consentano di approssimare nel miglior modo possibile la nuvola dei punti. In altri termini, dobbiamo determinare quella retta - tra le infinte del piano -, che meglio si adatta alla nuvola di punti.
La soluzione viene trovata utilizzando il metodo dei minimi quadrati.
y = β 0 +β 1 x + ε ,
Metodo dei minimi quadrati
∑ (^ )^ ∑(^ )
= − = − −
Sq yi yˆi^2 yi b 0 b 1 xi^2
( )
^ (^ )
∑
∑
=
= N 1 i^1 i^01 i i
q
N 0 i^1 i^01 i
q
∑ ∑ ∑
∑ ∑ ∑
= = =
= = = N i 1
N (^2) 1 i
N i i 0 i
N i 1
N 1 i
N i 0
1 1
1 1
i i
i i
∑ ∑ ∑
∑ ∑
= = =
= = N i 1
N i 1
N 1 i 2 i i (^0) i 1 i
N i 1
N i (^01) i 1 i
∑ ∑ ∑
∑ ∑
= = =
= = N i 1
N i 1
N 1 i 2 i i y 1 x i 1 i
y 1 x
N 1 i^1 i
N 0 i^1 i
Determinazione di b 0 e b 1 : valori che rendono minima la quantità
∑= − ∑= + ∑= − ∑=^ =
yx μ x bμ x b x 0
∑= − − ^ +∑= ^ =
yi xi Nμyμx b 1 - Nμx^2 xi^20
D
C x -Nμ
yx Nμ μ b =
∑
∑
Equazioni normali: derivate parziali della funzione rispetto ai parametri, poste uguali a zero
Dalla soluzione del problema di minimo, si trovano le formule seguenti per b 1 e b 0 :
Stima dei parametri
devianza
codevianza
b 0 =μY −b 1 μ X
∑
∑ ∑
∑
=
= −
−
− = = N i 1
2 i X
N i 1 i X i Y N i 1 X
2 i
N i 1 i i X Y X
XY 1 (x μ )
(x μ )(y μ ) x Nμ
xy Nμ μ D
C b
μX e μY sono le medie aritmetiche delle distribuzioni marginali di X e di Y.
Una volta calcolati b 1 e b 0 l’equazione che ne risulta
rappresenta la retta di regressione stimata di Y su X.
Il significato da attribuire al coefficiente angolare b 1 è il seguente. Poiché la retta rispecchia l’“andamento medio” dei dati osservati, b 1 indica la variazione media che subisce Y quando X aumenta di una unità.
La retta di regressione passa per il baricentro della distribuzione doppia, cioè per il punto ( μX, μY).
Retta di regressione
b 0 → intercetta della retta: punto in
b 1 → coefficiente angolare della retta
se b 1 <0 la retta è inclinata
se b 1 =0 la retta è parallela all’asse
se b 1 >0 la retta è inclinata
Interpretazione geometrica dei
parametri
Y
X
Y
X
Y
X
L’analisi di regressione include la verifica
dell’ idoneità del modello a rappresentare la
relazione statistica tra le variabili Y e X.
A questo fine, viene introdotto un apposito
indice che misura la bontà dell’adattamento della
retta di regressione ai punti osservati, per la cui
costruzione ci si avvale della scomposizione
della devianza.
Adattamento della retta di regressione ai dati
Data una distribuzione doppia disaggregata, la devianza della distribuzione marginale del carattere Y può essere così scomposta:
dove sono le predizioni fornite dalla retta di regressione.
Scomposizione della devianza nel modello di regressione
yˆ i
∑ ∑ ∑
= − = − + −
N i i i
N i i Y
N i
DY yi μY y μ y y
( )^2 ( ˆ ) ( ˆ )
Y
X
Y
X
Y
X
μy
yi
Y
X
Dy
μy
yi yˆi^ DSL yˆi DRL
173 164 162.23 0.49 1.145 3. 178 172 166.35 75.69 9.27 31. 169 163 158.94 0.09 19.03 16. 170 160 159.76^ 10.89 12.52^ 0. 177 166 165.52 7.29 4.94 0. 178 165 166.35 2.89 9.27 1. 180 165 167.99^ 2.89 22.01^ 8. 185 170 172.11 44.89 77.55 4. 165 152 155.65^ 127.69 58.58^ 13. 168 156 158.12 53.29 26.88 4. Totale (^) 326.10 241.20 84.
Scomposizione della devianza: esempio
x i y i yˆ i (y (^) i −μ Y )^2 (yˆi − μ Y )^2 (yi −yˆ i )^2
DY DSL DRL
Valori teorici
Possiamo anche verificare che la somma dei valori teorici di Y è uguale alla somma dei valori osservati.
Verifichiamo empiricamente la scomposizione della devianza di cui sopra:
y ˆ^ = 19. 851 + 0. 823 x
μY = 163.