Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Correlazione e Regressione Lineare: Relazione tra Due Variabili Quantitative - Prof. Petru, Appunti di Statistica

Questo capitolo del testo introduttivo alla statistica spiega come calcolare il coefficiente di correlazione lineare e come determinare se esiste una relazione lineare tra due variabili quantitative. Viene inoltre presentato il concetto di regressione ai minimi quadrati e come utilizzare questa tecnica per trovare l'equazione della retta che descrive la relazione tra due variabili. Inoltre, viene discusso il significato del coefficiente angolare e dell'intercetta della retta ai minimi quadrati.

Tipologia: Appunti

2020/2021

Caricato il 09/03/2021

giuliaMo---------
giuliaMo--------- 🇮🇹

4.8

(5)

7 documenti

1 / 2

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA
Capitolo 4
4.1 Grafico a dispersione e correlazione
Investimento rappresenta la variabile esplicativa (asse x) = €
Durata rappresenta la variabile risposta/dipendente (asse y) = s
Si parla di due variabili:
- Variabili concordanti -> all’aumentare di una aumenta anche l’altra
- Variabili discordanti -> aumentando il valore di una diminuisce il valore dell’altra
Coefficiente di correlazione lineare
Indica l’intensità e la direzione della relazione lineare esistente tra due variabili quantitative.
Rho indica la popolazione
R indica il campionario – non è robusto
Se r=+1 abbiamo una perfetta relazione lineare positiva (linea retta ascendente verso dx)
Se r=-1 abbiamo una perfetta relazione lineare negativa (linea retta discendente verso dx)
Se r=0 abbiamo una relazione ma non è lineare
Più si avvicina a +1 più è forte la concordanza, più si avvicina a -1 più è forte la discordanza, se si avvicina a
0 più la relazione è debole.
Correlazione tra due variabili
Per verificare se esiste una relazione lineare tra due variabili quindi tra la variabile esplicativa e la variabile
risposta, determiniamo il valore assoluto del coefficiente di correlazione: se è maggiore esiste una relazione
lineare, se è minore non esiste.
Differenza tra correlazione e casualità
Un coefficiente di correlazione lineare che implica una forte associazione positiva o negativa non implica
necessariamente un nesso di casualità se è stato calcolato utilizzando dati osservazionali. Esiste quindi la
possibilità che due variabili risultino essere correlate senza in realtà avere un nesso di casualità, questo
avviene attraverso le variabili nascoste.
4.2 Regressione ai minimi quadrati
Dobbiamo trovare un’equazione lineare che esprima la relazione tra le due variabili.
Formula punto-coefficiente angolare -> y-y1 = m(x-x1) equazione della retta che passa per i punti
Equazione della retta ai minimi quadrati e usarla per effettuare previsioni
I residui ci forniscono un’indicazione di quanto le nostre previsioni siano vicine alle osservazioni reali: più
piccoli sono i residui migliore è la previsione. Il criterio per determinare la retta che descrive la relazione tra
due variabili si basa sui residui. Il metodo per ridurre il più possibile i residui è quello dei minimi quadrati.
La retta dei minimi quadrati è la retta che minimizza la somma degli errori al quadrato. Formula pag. 117.
Interpretare il coefficiente angolare e l’interfaccia della retta ai minimi quadrati
L’intercetta di una qualsiasi retta rappresenta il punto del grafico in cui la retta interseca l’asse verticale.
Il coefficiente angolare rappresenta la variazione attesa per la variabile risposta all’aumentare di
un’unità della variabile esplicativa.
Per interpretare un’intercetta diremo che essa corrisponde al valore della variabile risposta quando il
valore della variabile esplicativa è pari a 0.
Quando il coefficiente di correlazione lineare indica che non esiste una relazione lineare tra variabile
esplicativa e la variabile risposta e il grafico indica che non ci è proprio alcuna relazione, allora possiamo
utilizzare il valore medio della variabile risposta.
Somma dei quadrati dei residui
La somma dei quadrati dei residui è inferiore a qualsiasi altra retta.
Guardare tabella 4.4 pag.122
4.3 Coefficiente di determinazione
Il coefficiente di determinazione (R alla seconda) misura la proporzione di variabilità totale della variabile
risposta che è spiegata dalla retta ai minimi quadrati. Il coefficiente di determinazione è un numero
compreso tra 0 e 1.
pf2

Anteprima parziale del testo

Scarica Correlazione e Regressione Lineare: Relazione tra Due Variabili Quantitative - Prof. Petru e più Appunti in PDF di Statistica solo su Docsity!

STATISTICA

Capitolo 4 4.1 Grafico a dispersione e correlazione Investimento rappresenta la variabile esplicativa (asse x) = € Durata rappresenta la variabile risposta/dipendente (asse y) = s Si parla di due variabili:

  • Variabili concordanti -> all’aumentare di una aumenta anche l’altra
  • Variabili discordanti -> aumentando il valore di una diminuisce il valore dell’altra Coefficiente di correlazione lineare Indica l’intensità e la direzione della relazione lineare esistente tra due variabili quantitative. Rho indica la popolazione R indica il campionario – non è robusto Se r=+1 abbiamo una perfetta relazione lineare positiva (linea retta ascendente verso dx) Se r=-1 abbiamo una perfetta relazione lineare negativa (linea retta discendente verso dx) Se r=0 abbiamo una relazione ma non è lineare Più si avvicina a +1 più è forte la concordanza, più si avvicina a -1 più è forte la discordanza, se si avvicina a 0 più la relazione è debole. Correlazione tra due variabili Per verificare se esiste una relazione lineare tra due variabili quindi tra la variabile esplicativa e la variabile risposta, determiniamo il valore assoluto del coefficiente di correlazione: se è maggiore esiste una relazione lineare, se è minore non esiste. Differenza tra correlazione e casualità Un coefficiente di correlazione lineare che implica una forte associazione positiva o negativa non implica necessariamente un nesso di casualità se è stato calcolato utilizzando dati osservazionali. Esiste quindi la possibilità che due variabili risultino essere correlate senza in realtà avere un nesso di casualità, questo avviene attraverso le variabili nascoste. 4.2 Regressione ai minimi quadrati Dobbiamo trovare un’equazione lineare che esprima la relazione tra le due variabili. Formula punto-coefficiente angolare -> y-y1 = m(x-x1) equazione della retta che passa per i punti Equazione della retta ai minimi quadrati e usarla per effettuare previsioni I residui ci forniscono un’indicazione di quanto le nostre previsioni siano vicine alle osservazioni reali: più piccoli sono i residui migliore è la previsione. Il criterio per determinare la retta che descrive la relazione tra due variabili si basa sui residui. Il metodo per ridurre il più possibile i residui è quello dei minimi quadrati. La retta dei minimi quadrati è la retta che minimizza la somma degli errori al quadrato. Formula pag. 117. Interpretare il coefficiente angolare e l’interfaccia della retta ai minimi quadrati  L’intercetta di una qualsiasi retta rappresenta il punto del grafico in cui la retta interseca l’asse verticale.  Il coefficiente angolare rappresenta la variazione attesa per la variabile risposta all’aumentare di un’unità della variabile esplicativa.  Per interpretare un’intercetta diremo che essa corrisponde al valore della variabile risposta quando il valore della variabile esplicativa è pari a 0.  Quando il coefficiente di correlazione lineare indica che non esiste una relazione lineare tra variabile esplicativa e la variabile risposta e il grafico indica che non ci è proprio alcuna relazione, allora possiamo utilizzare il valore medio della variabile risposta. Somma dei quadrati dei residui La somma dei quadrati dei residui è inferiore a qualsiasi altra retta. Guardare tabella 4.4 pag. 4.3 Coefficiente di determinazione Il coefficiente di determinazione (R alla seconda) misura la proporzione di variabilità totale della variabile risposta che è spiegata dalla retta ai minimi quadrati. Il coefficiente di determinazione è un numero compreso tra 0 e 1.

Devianza totale -> La distanza tra yi e y soprassegnato alla seconda (yi-y) Devianza residua -> La distanza tra yi e y^i alla seconda (yi-y^i) Devianza spiegata -> La distanza tra y^i e y soprassegnato alla seconda (y^i-y) Devianza totale = Devianza residua + Devianza spiegata