

Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Domande e risposte inerenti alla teoria dell'argomento regressione
Tipologia: Appunti
1 / 2
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!


Un’analisi di regressione parte da un certo numero di osservazioni di due o più variabili e produce una funzione interpolante con andamento regolare che descrive la relazione di fondo tra le osservazioni della cosiddetta variabile dipendente e le osservazioni delle variabili rimanenti che vengono chiamate indipendenti o esplicative. Analisi di regressione vengono effettuate per: indagare sulla relazione di fondo tra le osservazioni di una var dipendente e una o più var esplicative indagare sul processo che ha generato le osservazioni della variabile dipendente ottenere delle previsioni sulle future osservazioni di una variabile Una volta scelta una famiglia di funzioni, si dovrà individuare al suo interno una funzione interpolante che riproduca la relazione di fondo tra le osservazioni delle variabili. A tal fine bisogna fare riferimento ad un metodo di accostamento come il metodo dei minimi quadrati Secondo questo metodo, i valori dei parametri che identificano la funzione interpolante dovrebbero minimizzare la funzione che chiameremo distanza quadratica Il metodo dei minimi quadrati è utilizzato per determinare all’interno della famiglia delle funzioni lineari, una retta ai minimi quadrati. I parametri sono due valori che minimizzano la distanza quadratica Studieremo anche le proprietà dei piani ai minimi quadrati ovvero le proprietà dei piani che si ottengono con il metodo di accostamento dei minimi quadrati
L’indice di determinazione è un indice utilizzato per misurare la bontà d’adattamento di una retta ai minimi quadrati. E’ calcolato come rapporto tra la devianza spiegata e la devianza totale della variabile dipendente. Dalla scomposizione della devianza discende che questo indice ha valori compresi tra 0 e 1: se e solo se dev(Z)=0 ovvero se e solo se tutti i residui sono nulli e la retta ai minimi quadrati passa per tutti i punti osservati se e solo se dev(Z) raggiunge il massimo teorico ovvero dev(x1) e = In questo caso la retta ai minimi quadrati è orizzontale e quindi non riesce a descrivere la variabilità delle osservazioni x1i nei casi intermedi In questo caso la bontà d’adattamento della retta ai minimi quadrati sarà tanto migliore quanto più elevato è il valore di. L’indice di determinazione è tanto più prossimo a 1 quanto più la retta ai minimi quadrati passa vicino ai punti osservati. Possiamo anche scriverlo così L’indice di determinazione del piano ai minimi quadrati che descrive X1 in funzione di X2 e X3 è e le proprietà saranno analoghe a quelle dell’indice di determinazione della retta
Due problemi importanti da tenere in considerazione quando si sceglie una famiglia di possibili funzioni interpolanti sono quelli dell’underfitting e dell’overfitting. Questi problemi possono insorgere quando si sceglie una famiglia di funzioni troppo ristretta (underfitting) o troppo ampia (overfitting) L’underfitting può essere individuato mediante l’ausilio del grafico dei residui L’overfitting è invece più difficile da individuare, per poter evitare questo problema l’unica soluzione è quella di scegliere una famiglia di funzioni interpolanti ristretta ed allargarla poco alla volta. Per individuare casi di eccessiva rigidità/underfitting conviene costruire il cosiddetto grafico dei residui Come suggerisce il suo nome, il grafico dei residui si basa sui residui di interpolazione, ovvero sugli scarti zi tra i valori osservati per la variabile dipendente e i corrispettivi valori riprodotti dalla funzione interpolante: Il grafico dei residui è un grafico a dispersione che riporta i valori riprodotti x1i in ascissa e i residui zi in ordinata Per verificare se l’andamento di una funzione interpolante sia troppo rigido bisogna analizzare la successione dei segni dei residui nell’ordine in cui si presentano sul grafico dei residui (ovvero al crescere dei valori riprodotti x1i): Se la funzione interpolante ha un andamento sufficientemente flessibile per cogliere la relazione di fondo tra le osservazioni delle variabili oggetto di analisi, la successione dei segni dei residui dovrebbe essere casuale Se invece osservassimo lunghe successioni di residui dello stesso segno, sarebbe un segnale che l’andamento della funzione interpolante sia troppo rigido (underfitting). Quindi si dovrebbe cercare un’altra funzione interpolante all’interno di una famiglia più ampia della famiglia delle rette Con l’ausilio del grafico dei residui si possono anche individuare dei dati anomali Calcoliamo l’indice A2 che ci consente di capire se ci sono residui d’interpolazione anomali (sono anomali quando i moduli dei residui superano 3 volte l’indice A2). Se ci sono residui anomali bisognerà eliminarli e ricalcolare la funzione, se invece non esistono residui anomali allora si potrà procedere con la valutazione della bontà d’adattamento