Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


ARGOMENTO PROVA VIDEO, Appunti di Statistica

Argomento prova video per prof sarnacchiaro

Tipologia: Appunti

2021/2022
In offerta
30 Punti
Discount

Offerta a tempo limitato


Caricato il 08/04/2022

maria_scilla
maria_scilla 🇮🇹

4.7

(10)

7 documenti

1 / 1

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
MISURA E INTERPRETAZIONE DEL COEFFICIENTE DI REGRESSIONE LINEARE
Il coefficiente di determinazione R quadro è un valore statistico che ti permette di capire se un modello di
regressione lineare può essere utilizzato per fare previsioni.
Quando si costruisce un modello di regressione lineare, spesso è importante capire quanto è forte la sua
capacità predittiva. Cioè quanto le variabili indipendenti (le x) riescono a predire bene i valori della variabile
dipendente (la y). Per stabilirlo si utilizzano una serie di misure, denominate “indici della bontà di
adattamento”.
Queste misure valutano quanta differenza c’è tra i valori osservati di y nel campione ed i valori che il
modello ha stimato per y. Piccole discrepanze tra i valori attesi ed osservati indicano che il modello si
adatta bene ai dati. Al contrario, grandi discrepanze tra valori attesi ed osservati indicano che il modello
non spiega bene la variabilità presente nei dati.
L’r quadro invece è il quadrato di del coefficiente di correlazione bivariato r. Quindi se sai quale è il valore
della correlazione bivariata r, per calcolare l’r quadro dovrai elevare al quadrato l’indice di correlazione
bivariate.
Il coefficiente di determinazione indica la proporzione di varianza totale dei valori di y intorno alla media di
y che risulta spiegata dal modello di regressione. Proprio perché è una proporzione, il suo valore sarà
sempre compreso tra 0 ed 1
R quadro=0 indica un modello le cui variabili predittive non spiegano per nulla la variabilità della y
intorno alla sua media. Se invece delle variabili indipendenti inserite nel modello utilizzassi solo la media
della y otterresti in pratica lo stesso valore esplicativo. Questa situazione si verifica quando gli y stimati dal
modello coincidono esattamente con la media di y. In questo caso anche il corrispondente indice di
correlazione sarà pari a 0.
R quadro=1 indica un modello le cui variabili indipendenti riescono a spiegare completamente la
variabilità della y intorno alla sua media. Ovvero, conoscendo i valori delle variabili indipendenti puoi
predire esattamente quale sarà il valore della y. Questa situazione si verifica solo quando tutti nel grafico a
dispersione tutti punti si collocano esattamente sulla retta di regressione.
Di solito, più è grande il valore dell’R quadro, più il modello ha un alto potere predittivo. Più grande è il
valore di R quadro, migliore è la capacità delle variabili esplicative di prevedere i valori della variabile
dipendente.
è normale osservare valori di R quadro inferiori al 50%. Questo non significa che il modello di regressione
che hai costruito non va bene ma solo che, per sua natura, la variabile dipendente che stai analizzando
dipende da tantissimi fattori diversi, molti dei quali non sono stati misurati.
Per capire se il coefficiente di determinazione è statisticamente significativo devi guardare il p-value della
statistica F. Il modello di regressione che hai costruito infatti ha senso solo c’è almeno una variabile
indipendente che riesce a spiegare i valori della y. Se il p-value relativo al test F è molto basso (spesso si
considera come soglia alpha=0,05), allora puoi affermare che l’R quadro è statisticamente significativo. Se
invece il valore del p-value del test F è oltre la soglia prefissata allora si dice che l’R quadro non è
statisticamente significativo.
Il coefficiente di determinazione mostra solo associazione. Come con la regressione lineare, è impossibile
usare R 2 per determinare se una variabile causa l'altra.
Discount

In offerta

Anteprima parziale del testo

Scarica ARGOMENTO PROVA VIDEO e più Appunti in PDF di Statistica solo su Docsity!

MISURA E INTERPRETAZIONE DEL COEFFICIENTE DI REGRESSIONE LINEARE

Il coefficiente di determinazione R quadro è un valore statistico che ti permette di capire se un modello di regressione lineare può essere utilizzato per fare previsioni. Quando si costruisce un modello di regressione lineare, spesso è importante capire quanto è forte la sua capacità predittiva. Cioè quanto le variabili indipendenti (le x) riescono a predire bene i valori della variabile dipendente (la y). Per stabilirlo si utilizzano una serie di misure, denominate “ indici della bontà di adattamento ”. Queste misure valutano quanta differenza c’è tra i valori osservati di y nel campione ed i valori che il modello ha stimato per y. Piccole discrepanze tra i valori attesi ed osservati indicano che il modello si adatta bene ai dati. Al contrario, grandi discrepanze tra valori attesi ed osservati indicano che il modello non spiega bene la variabilità presente nei dati. L’ r quadro invece è il quadrato di del coefficiente di correlazione bivariato r. Quindi se sai quale è il valore della correlazione bivariata r, per calcolare l’r quadro dovrai elevare al quadrato l’indice di correlazione bivariate. Il coefficiente di determinazione indica la proporzione di varianza totale dei valori di y intorno alla media di y che risulta spiegata dal modello di regressione. Proprio perché è una proporzione, il suo valore sarà sempre compreso tra 0 ed 1 R quadro=0 indica un modello le cui variabili predittive non spiegano per nulla la variabilità della y intorno alla sua media. Se invece delle variabili indipendenti inserite nel modello utilizzassi solo la media della y otterresti in pratica lo stesso valore esplicativo. Questa situazione si verifica quando gli y stimati dal modello coincidono esattamente con la media di y. In questo caso anche il corrispondente indice di correlazione sarà pari a 0. R quadro=1 indica un modello le cui variabili indipendenti riescono a spiegare completamente la variabilità della y intorno alla sua media. Ovvero, conoscendo i valori delle variabili indipendenti puoi predire esattamente quale sarà il valore della y. Questa situazione si verifica solo quando tutti nel grafico a dispersione tutti punti si collocano esattamente sulla retta di regressione. Di solito, più è grande il valore dell’R quadro, più il modello ha un alto potere predittivo. Più grande è il valore di R quadro, migliore è la capacità delle variabili esplicative di prevedere i valori della variabile dipendente. è normale osservare valori di R quadro inferiori al 50%. Questo non significa che il modello di regressione che hai costruito non va bene ma solo che, per sua natura, la variabile dipendente che stai analizzando dipende da tantissimi fattori diversi, molti dei quali non sono stati misurati. Per capire se il coefficiente di determinazione è statisticamente significativo devi guardare il p-value della statistica F. Il modello di regressione che hai costruito infatti ha senso solo c’è almeno una variabile indipendente che riesce a spiegare i valori della y. Se il p-value relativo al test F è molto basso (spesso si considera come soglia alpha=0,05), allora puoi affermare che l’R quadro è statisticamente significativo. Se invece il valore del p-value del test F è oltre la soglia prefissata allora si dice che l’R quadro non è statisticamente significativo. Il coefficiente di determinazione mostra solo associazione. Come con la regressione lineare, è impossibile usare R^2 per determinare se una variabile causa l'altra.