dispensa per professore della beffa | Dispense di Statistica

IULM – Modelli di regressione – 1

IULM

Modelli di regressione

1. Introduzione ............................................................................................................................................... 1

2. Regressione lineare semplice ..................................................................................................................... 2

2.1. Il modello......................................................................................................................................... 2

2.2. Stima dei coefficienti di regressione ............................................................................................... 3

2.3. Bontà dell’approssimazione ............................................................................................................ 4

3. Regressione lineare multipla ...................................................................................................................... 4

3.1. Il modello......................................................................................................................................... 4

3.2. Ipotesi del modello e test di significatività dei risultati ................................................................... 5

3.3. Output standard ............................................................................................................................... 6

4. Coefficienti standardizzati e multicollinearità ........................................................................................... 7

5. Complementi .............................................................................................................................................. 8

5.1. Uso della regressione a scopo predittivo ......................................................................................... 8

5.2. Variabili dummy .............................................................................................................................. 8

5.3. Numerosità dei campioni ................................................................................................................. 9

5.4. Regressione logistica ....................................................................................................................... 9

6. Esempio: customer satisfaction ............................................................................................................... 10

1. Introduzione

L'analisi di regressione

si applica al problema – che coinvolge due o più variabili – di valutare come le

variazioni di una di esse (variabile dipendente o risposta, 𝑦) sono legate alle variazioni delle altre (una o più

variabili indipendenti o esplicative o predittori, 𝑥1… 𝑥𝑝). In particolare l’obiettivo è definire ed esaminare un

modello, cioè un legame funzionale, una formula, che lega la 𝑦 alle 𝑥𝑖. Con regressione si indica in generale

la descrizione di questo legame. Ad esempio:

- la quantità venduta di un prodotto in funzione del prezzo;

- il consumo di un'automobile in funzione della potenza del motore, dell’aerodinamica e del peso;

- la soddisfazione dell’utente in funzione della soddisfazione per le singole caratteristiche del servizio.

L'analisi di regressione viene normalmente utilizzata per modellare e misurare dei rapporti causa-effetto tra

predittori e variabile dipendente, tuttavia – dal punto di vista statistico – la regressione non implica

necessariamente un rapporto causa-effetto, ma semplicemente una associazione tra le variabili. L’esistenza di

un rapporto causa-effetto è naturalmente sempre ipotizzabile, ma si tratta di un aspetto interpretativo che non

consegue da considerazioni strettamente statistiche, ma da scelte di chi effettua l’analisi, ovvero da ipotesi

esterne preesistenti rispetto alle quali la statistica può eventualmente fornire una conferma a posteriori.

L’analisi di regressione può avere due obiettivi, che non si escludono a vicenda:

1. identificare i migliori predittori di un certo fenomeno;

2. effettuare stime e previsioni.

Nell’ambito dell’analisi di mercato prevale spesso il primo obiettivo, che in termini interpretativi si traduce

nell’individuare le variabili esplicative che influenzano maggiormente la variabile considerata dipendente; è

il problema tipico delle analisi di customer satisfaction, dove l’obiettivo è identificare le caratteristiche di un

prodotto o servizio che più influenzano la soddisfazione.

La matrice dei dati oggetto dell’analisi è una matrice unità per variabili con una riga per unità e una colonna

per variabile. Nel seguito utilizzeremo un esempio (fig. 1), nel quale le unità sono film di Hollywood tratti da

romanzi e le variabili (tutte espresse in milioni di dollari) sono:

Il termine regressione fu introdotto da Francis Galton (1822-1911) a proposito della relazione tra l'altezza dei padri e

quella dei figli. Galton osservò che i padri molto alti o molto bassi tendevano ad avere figli con altezze meno estreme ed

espresse questo fatto dicendo che le altezze dei figli “regrediscono verso la media”.

dispensa per professore della beffa, Dispense di Statistica

Documenti correlati

Anteprima parziale del testo

Scarica dispensa per professore della beffa e più Dispense in PDF di Statistica solo su Docsity!

IULM

Modelli di regressione

1. Introduzione

2. Regressione lineare semplice

2.1. Il modello

2.3. Bontà dell’approssimazione

3. Regressione lineare multipla

3.1. Il modello

3.2. Ipotesi del modello e test di significatività dei risultati

4. Coefficienti standardizzati e multicollinearità

5. Complementi

5.1. Uso della regressione a scopo predittivo

5.2. Variabili dummy

6. Esempio: customer satisfaction