REGRESSIONE LINEARE:

Il modello di regressione lineare consente di analizzare la relazione causale (ipotesi) tra una variabile

dipendente quantitativa (misurata su scala almeno a intervalli) e una o più variabili indipendenti

quantitative.

NELLA FORMA GENERALE DEL MODELLO DI REGRESSIONE LA VARIABILE DIPENDENTE Y VIENE

CONSIDERATA COME FUNZIONE DI k VARIABILI INDIPENDENTI (X1j; X2j; X3j; ...; Xkj).

IL MODELLO DELLA REGRESSIONE LINEARE ASSUME CHE DATO UN SET DI VARIABILI INDIPENDENTI IL

VALORE MEDIO (VALORE ATTESO) DELLA VARIABILE DIPENDENTE SI MODIFICA SECONDO LA SEGUENTE

FORMULA:

Dove:

RAPPRESENTANO I PARAMETRI CHE ESPRIMONO LA RELAZIONE TRA LE k VI E LA

VD NELLA POPOLAZIONE

RAPPRESENTANO IL COEFFICIENTE DI REGRESSIONE PARZIALE TRA CIASCUNA DELLE

k VI E LA VD Y MANTENENDO COSTANTI (CONTROLLANDO) TUTTE LE ALTRE

VARIABILI.

ALFA

È L’INTERCETTA E RAPPRESENTA IL VALORE ATTESO DI Y QUANDO TUTTE LE VI SONO UGUALI A ZERO.

EPSILON

PER OGNI VALORE Y PREDETTO (MANTENENDO COSTANTI I VALORI NELLE VI) IL MODELLO PREVEDE UNA

COMPONENTE D’ERRORE (COMPONENTE STOCASTICA) QUESTO TERMINE D’ERRORE RAPPRESENTA:

- L’EFFETTO SULLA VD Y NON ESPLICITAMENTE INCLUSO NEL MODELLO;

- UN RESIDUO CASUALE NELLA VARIABILE DIPENDENTE.

SEBBENE SIA IMPLICITO NELLA FORMULAZIONE DEL MODELLO È IMPORTANTE SOTTOLINEARE CHE LA

RELAZIONE TRA E(Yj) E CIASCUN Xkj È CONCEPITA COME LINEARE E CHE GLI EFFETTI DELLE k VI SONO

ADDITIVI.

Dal momento che non è possibile indagare nella popolazione la presunta relazione tra le variabili

considerate, per la verifica delle ipotesi si procede estraendo un campione rappresentativo della

popolazione e descrivendo su questo la relazione tra le variabili considerate. Infatti nella pratica, i parametri

della popolazione non sono sempre noti. In tali casi i valori sono stimati considerando un numero finito di

osservazioni: le osservazioni campionarie. Alla base di questo passaggio vi è l'assunzione che il campione

corrisponda a una sottoparte rappresentativa della popolazione. Ovvero che nel campione siano

rappresentate tutte le caratteristiche della popolazione, e che i fenomeni al livello campionario agiscano in

maniera omologa a quanto avviene nella popolazione. Le tecniche di campionamento servono a garantire

che i campioni siano rappresentativi. Successivamente, mediante la statistica inferenziale, si verifica se la

relazione descritta al livello campionario può essere generalizzata alla popolazione di riferimento.

MULTIPLA:

Nella regressione lineare multipla ci sono molte variabili esogene, molti predittori e una variabile criterio:

ovvero c’è una sola variabile dipendente e molte variabili indipendenti.

la relazione tra le variabili indipendenti e la variabile dipendente diventa:

Regressione Multipla: Modelli e Interpretazione, Dispense di Statistica

Documenti correlati