Regressione lineare e logistica | Appunti di Statistica

Regressione Semplice e Mul�pla

Il modello di regressione lineare consente di analizzare la relazione causale tra una variabile dipendente

quan�ta�va e una o più variabili indipenden� quan�ta�ve.

Nell’analisi della regressione semplice è possibile veriﬁcare se due variabili sono legate da una relazione di �po

lineare e veriﬁcare la forza della relazione. La relazione lineare tra due variabili può essere descri�a

dall’equazione della re�a:

Dove Y è la variabile dipendente (variabile endogena); X è la variabile indipendente (predi�ore o variabile

esogena); mentre α e β sono parametri della popolazione che indicizzano la relazione tra le variabili e devono

essere s�ma�. In par�colare, il parametro α viene de�a interce�a e rappresenta il valore previsto in Y quando

X=0. Il β chiamato coeﬃciente di regressione, rappresenta il cambiamento in Y per ogni variazione unitaria della

X; è anche il coeﬃciente angolare della re�a che rappresenta meglio la relazione tra X e Y. Mentre (epsilon) è il

termine d’errore rela�vo alla previsione della variabile dipendente.

Nella regressione mul�pla ci sono 2 o più variabili indipenden�. Quindi date k variabili indipenden�, l’equazione

che descrive la relazione tra le variabili indipenden� e la variabile dipendente diventa:

Dove β1, β2, ….., βk sono i coeﬃcien� di regressione parziali e riﬂe�ono il fa�o che ognuno dei predi�ori

X1, X2, …., Xk considera� fornisce una spiegazione parziale della variabile dipendente Y.

S�ma dei Parametri

Nella regressione il primo passo prevede la s�ma dei parametri. Nella pra�ca, i parametri della popolazione non

sono sempre no�, in tal caso ii valori sono s�ma� considerando un numero ﬁnito di osservazioni, de�e

osservazioni campionarie. Per formare un campione si usano delle speciﬁche tecniche di campionamento, che

preme�ono al campione di rappresentare tu�e le cara�eris�che della popolazione. Per dis�nguere la regressione

campionaria da quella della popolazione il modello di regressione viene scri�o usando le�ere la�ne al posto di

quelle greche:

Per la s�ma dei parametri a e bi (i=1, 2, …, k) il metodo più usato è il criterio dei minimi quadra� (OLS). Tale

metodo pone come obie�vo di s�mare i parametri a e bi in modo tale da minimizzare l’errore.

In termini matema�ci, l’OLS tende a minimizzare la sommatoria degli scar� della media al quadrato: .

Nella regressione semplice le formule per il calcolo dei parametri sono:

Nella regressione mul�pla le formule per il calcolo dei parametri richiedono l’algebra matriciale. Quando

andiamo a calcolare delle s�me campionarie dei parametri è necessario conoscere l’eﬀe�o dell’errore standard

(si) del coeﬃciente s�mato:

Dove: N è l’ampiezza campionaria; k è il numero di variabili indipenden� del modello; R2i è la correlazione

mul�pla al quadrato delle variabili indipenden� sulla variabile indipendente considerata.

Le Assunzioni dell’OLS

Perché la s�ma dei parametri possa essere considerata robusta, l’OLS presuppone che alcune assunzioni siano

veriﬁcate.

•Tu�e le variabili indipenden� (X) sono misurate su scala ad intervalli, a rappor� o dicotomica, mentre la

variabile dipendente (Y) è con�nua e misurata su scala ad intervalli o a rappor�. E tu�e le variabili sono

misurate senza errore

Regressione lineare e logistica, Appunti di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica Regressione lineare e logistica e più Appunti in PDF di Statistica solo su Docsity!

Regressione Semplice e Mul�pla

S�ma dei Parametri

Le Assunzioni dell’OLS

La Valutazione del Fit del Modello

S�ma dei Parametri

Valutazione del Fit del Modello

S�ma del Modello

Verifica Significa�vità del Singolo Parametro