Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Teoria della regressione, Appunti di Statistica

Domande e risposte inerenti alla teoria dell'argomento regressione

Tipologia: Appunti

2023/2024

Caricato il 06/03/2024

marti_na11
marti_na11 🇮🇹

3

(2)

10 documenti

1 / 2

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
TEORIA REGRESSIONE
Che cos’è un’analisi di regressione? Qual è lo scopo di un’analisi di regressione? Che cos’è il metodo dei
minimi quadrati?
Un’analisi di regressione parte da un certo numero di osservazioni di due o più variabili e produce una funzione
interpolante con andamento regolare che descrive la relazione di fondo tra le osservazioni della cosiddetta variabile
dipendente e le osservazioni delle variabili rimanenti che vengono chiamate indipendenti o esplicative.
Analisi di regressione vengono effettuate per:
indagare sulla relazione di fondo tra le osservazioni di una var dipendente e una o più var esplicative
indagare sul processo che ha generato le osservazioni della variabile dipendente
ottenere delle previsioni sulle future osservazioni di una variabile
Una volta scelta una famiglia di funzioni, si dovrà individuare al suo interno una funzione interpolante che riproduca la
relazione di fondo tra le osservazioni delle variabili. A tal fine bisogna fare riferimento ad un metodo di accostamento
come il metodo dei minimi quadrati
Secondo questo metodo, i valori dei parametri che identificano la funzione interpolante dovrebbero minimizzare la
funzione
che chiameremo distanza quadratica
Il metodo dei minimi quadrati è utilizzato per determinare all’interno della famiglia delle funzioni lineari, una retta ai
minimi quadrati. I parametri sono due valori che minimizzano la distanza quadratica
Studieremo anche le proprietà dei piani ai minimi quadrati ovvero le proprietà dei piani che si
ottengono con il metodo di accostamento dei minimi quadrati
Che cos’è l’indice di determinazione? A cosa serve? Perché può assumere solo valori compresi tra 0 e 1?
L’indice di determinazione è un indice utilizzato per misurare la bontà d’adattamento di una retta ai minimi quadrati. E’
calcolato come rapporto tra la devianza spiegata e la devianza totale della variabile dipendente.
Dalla scomposizione della devianza discende che questo indice ha valori compresi tra 0 e 1:
se e solo se dev(Z)=0 ovvero se e solo se tutti i residui sono nulli e la retta ai minimi quadrati passa per
tutti i punti osservati
se e solo se dev(Z) raggiunge il massimo teorico ovvero dev(x1) e =0
In questo caso la retta ai minimi quadrati è orizzontale e quindi non riesce a descrivere la variabilità delle
osservazioni x1i
nei casi intermedi
In questo caso la bontà d’adattamento della retta ai minimi quadrati sarà tanto migliore quanto più elevato è il
valore di . L’indice di determinazione è tanto più prossimo a 1 quanto più la retta ai minimi quadrati passa
vicino ai punti osservati.
Possiamo anche scriverlo così
L’indice di determinazione del piano ai minimi quadrati che descrive X1 in funzione di X2 e X3 è e le
proprietà saranno analoghe a quelle dell’indice di determinazione della retta
pf2

Anteprima parziale del testo

Scarica Teoria della regressione e più Appunti in PDF di Statistica solo su Docsity!

TEORIA REGRESSIONE

Che cos’è un’analisi di regressione? Qual è lo scopo di un’analisi di regressione? Che cos’è il metodo dei

minimi quadrati?

Un’analisi di regressione parte da un certo numero di osservazioni di due o più variabili e produce una funzione interpolante con andamento regolare che descrive la relazione di fondo tra le osservazioni della cosiddetta variabile dipendente e le osservazioni delle variabili rimanenti che vengono chiamate indipendenti o esplicative. Analisi di regressione vengono effettuate per:  indagare sulla relazione di fondo tra le osservazioni di una var dipendente e una o più var esplicative  indagare sul processo che ha generato le osservazioni della variabile dipendente  ottenere delle previsioni sulle future osservazioni di una variabile Una volta scelta una famiglia di funzioni, si dovrà individuare al suo interno una funzione interpolante che riproduca la relazione di fondo tra le osservazioni delle variabili. A tal fine bisogna fare riferimento ad un metodo di accostamento come il metodo dei minimi quadrati Secondo questo metodo, i valori dei parametri che identificano la funzione interpolante dovrebbero minimizzare la funzione che chiameremo distanza quadratica Il metodo dei minimi quadrati è utilizzato per determinare all’interno della famiglia delle funzioni lineari, una retta ai minimi quadrati. I parametri sono due valori che minimizzano la distanza quadratica Studieremo anche le proprietà dei piani ai minimi quadrati ovvero le proprietà dei piani che si ottengono con il metodo di accostamento dei minimi quadrati

Che cos’è l’indice di determinazione? A cosa serve? Perché può assumere solo valori compresi tra 0 e 1?

L’indice di determinazione è un indice utilizzato per misurare la bontà d’adattamento di una retta ai minimi quadrati. E’ calcolato come rapporto tra la devianza spiegata e la devianza totale della variabile dipendente. Dalla scomposizione della devianza discende che questo indice ha valori compresi tra 0 e 1:  se e solo se dev(Z)=0 ovvero se e solo se tutti i residui sono nulli e la retta ai minimi quadrati passa per tutti i punti osservati  se e solo se dev(Z) raggiunge il massimo teorico ovvero dev(x1) e = In questo caso la retta ai minimi quadrati è orizzontale e quindi non riesce a descrivere la variabilità delle osservazioni x1i  nei casi intermedi In questo caso la bontà d’adattamento della retta ai minimi quadrati sarà tanto migliore quanto più elevato è il valore di. L’indice di determinazione è tanto più prossimo a 1 quanto più la retta ai minimi quadrati passa vicino ai punti osservati. Possiamo anche scriverlo così L’indice di determinazione del piano ai minimi quadrati che descrive X1 in funzione di X2 e X3 è e le proprietà saranno analoghe a quelle dell’indice di determinazione della retta

Che cos’è il grafico dei residui? A cosa serve?

Due problemi importanti da tenere in considerazione quando si sceglie una famiglia di possibili funzioni interpolanti sono quelli dell’underfitting e dell’overfitting. Questi problemi possono insorgere quando si sceglie una famiglia di funzioni troppo ristretta (underfitting) o troppo ampia (overfitting) L’underfitting può essere individuato mediante l’ausilio del grafico dei residui L’overfitting è invece più difficile da individuare, per poter evitare questo problema l’unica soluzione è quella di scegliere una famiglia di funzioni interpolanti ristretta ed allargarla poco alla volta. Per individuare casi di eccessiva rigidità/underfitting conviene costruire il cosiddetto grafico dei residui Come suggerisce il suo nome, il grafico dei residui si basa sui residui di interpolazione, ovvero sugli scarti zi tra i valori osservati per la variabile dipendente e i corrispettivi valori riprodotti dalla funzione interpolante: Il grafico dei residui è un grafico a dispersione che riporta i valori riprodotti x1i in ascissa e i residui zi in ordinata Per verificare se l’andamento di una funzione interpolante sia troppo rigido bisogna analizzare la successione dei segni dei residui nell’ordine in cui si presentano sul grafico dei residui (ovvero al crescere dei valori riprodotti x1i):  Se la funzione interpolante ha un andamento sufficientemente flessibile per cogliere la relazione di fondo tra le osservazioni delle variabili oggetto di analisi, la successione dei segni dei residui dovrebbe essere casuale  Se invece osservassimo lunghe successioni di residui dello stesso segno, sarebbe un segnale che l’andamento della funzione interpolante sia troppo rigido (underfitting). Quindi si dovrebbe cercare un’altra funzione interpolante all’interno di una famiglia più ampia della famiglia delle rette Con l’ausilio del grafico dei residui si possono anche individuare dei dati anomali Calcoliamo l’indice A2 che ci consente di capire se ci sono residui d’interpolazione anomali (sono anomali quando i moduli dei residui superano 3 volte l’indice A2). Se ci sono residui anomali bisognerà eliminarli e ricalcolare la funzione, se invece non esistono residui anomali allora si potrà procedere con la valutazione della bontà d’adattamento