Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


slides sulla regressione lineare, Slide di Statistica

slides del corso svic su regressione lineare

Tipologia: Slide

2019/2020

Caricato il 09/07/2020

luna_ledi_prestint
luna_ledi_prestint 🇮🇹

4.5

(5)

15 documenti

1 / 28

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Regressione lineare
Dott.ssa Laura Anderlucci
Elementi di Statistica
CdL Sviluppo e Cooperazione Internazionale
Università di Bologna
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c

Anteprima parziale del testo

Scarica slides sulla regressione lineare e più Slide in PDF di Statistica solo su Docsity!

Regressione lineare

Dott.ssa Laura Anderlucci [email protected] Elementi di Statistica CdL Sviluppo e Cooperazione Internazionale Università di Bologna

Regressione lineare

Se la correlazione misura l’intensità e il segno del legame lineare tra due variabili, l’obiettivo delle tecniche di regressione è, invece, quello di individuare il tipo di relazione funzionale (non causale) che esiste tra una variabile dipendente e una o più variabili indipendenti (o esplicative). La regressione può essere:

  • semplice, se la variabile indipendente è una
  • multipla, se le variabili indipendenti sono 2 o più
  • lineare, se la relazione è lineare
  • non lineare, se tale relazione è non lineare

Diagramma di dispersione

0 5 10 15 20 25 0 5 10 15 20 25 Y X

x

i

, y

i

; 𝑖 =1, 2, …, n

x i y i

Studio della relazione tra 2 variabili

La relazione che si può osservare tra le variabili non è mai una relazione matematica esatta: a un dato valore di X possono corrispondere più valori di Y. Ad esempio:

  • se X è il reddito familiare e Y la spesa per consumi, a famiglie con lo stesso reddito X corrisponderanno diversi valori di spesa Y;
  • se X è il numero di componenti di una famiglia e Y il reddito familiare, in corrispondenza di famiglie con lo stesso numero di componenti possono osservarsi diversi valori di Y.

Esempio 16.2.3 p.

In uno studio sulla distribuzione dei redditi per un campione di 20 aree amministrative si è rilevato il reddito pro-capite in migliaia di euro per gli anni 1989 e 1999 in termini reali. Il grafico di dispersione relativo a questi dati mostra che non vi è una relazione funzionale esatta tra le due variabili. Mostra però che il reddito del 1999 è più elevato nei contesti in cui era elevato nel 1989. La relazione tra i due redditi pro-capite sembra poter essere approssimata da una retta attorno a cui sono dispersi i punti.

Modello di dipendenza lineare

Se la relazione f è lineare si ha:

y*=b 0 +bYXX

b 0 ordinata all’origine (o termine noto)

bYX coefficiente angolare della retta

Quale retta si adatta meglio alla nube di punti, ovvero

come scegliere il coefficiente angolare e l’ordinata

all’origine?

Coefficienti della retta dei minimi quadrati

𝑖= 1 𝑛

𝑖= 1 𝑛

𝑖 2

2

𝑖= 1 𝑛

𝑖= 1 𝑛

2

𝑋 2

b

yx

: coefficiente di regressione

Coefficiente di regressione: indica di quanto varia in

media la variabile dipendente Y per ogni variazione

unitaria positiva di X.

Ha il segno algebrico della codevianza.

b

YX

> 0 retta ascendente

b

YX

< 0 retta discendente

bYX= 0 retta parallela all’asse delle ascisse

Se Y è linearmente indipendente da X, allora la retta

dei minimi quadrati è y=yത

Indipendenza lineare

Diagramma a dispersione e retta dei minimi quadrati

Esercizio a) Per calcolare il valore del coefficiente di regressione: 𝑥 ҧ = 1 𝑛 σ𝑖= 1 7 𝑥𝑖 = 41. 86 𝑦ത = 1 𝑛 σ𝑖= 1 7 𝑦𝑖 = 24. 43 𝜎𝑋𝑌 = 1 7 σ𝑖= 1 7 𝑥𝑖𝑦𝑖 − 𝑥ҧ 𝑦ത = 33. 35 𝜎𝑋 2 = 1 7 σ 𝑖= 1 7 𝑥𝑖 2 − 𝑥ҧ = 91. 84 𝑏𝑌𝑋 = 𝜎𝑋𝑌 𝜎𝑋 2 =

  1. 35
  2. 84 = 0. 36 𝑏 0 = 𝑦ത − 𝑏𝑌𝑋 𝑥ҧ = 24. 43 − 0. 36 × 41. 86 = 9. 23 Ore di studio (X) 30 33 35 40 45 52 58 Voto (Y) 18 21 23 25 27 28 29

Esercizio b) Quante ore devo studiare in più se voglio migliorare in media di due punti il mio voto? 𝑦𝑖 ∗ = 𝑏 0 + 𝑏𝑌𝑋𝑥𝑖 = 9. 23 + 0. 36 𝑥𝑖 bYX ci dice quanto aumenta in media il voto per un’ora in più di studio (x=1). Se vogliamo sapere quante ore ci vogliono per far aumentare il voto in media di due punti occorre porre 𝑏𝑌𝑋𝑥 = 2. E quindi 0 .36𝑥 = 2 ⟹ 𝑥 = 5. 56 Ore di studio (X) 30 33 35 40 45 52 58 Voto (Y) 18 21 23 25 27 28 29

Statistical Abstract of the US per i 50 stati USA

Statistical Abstract of the US per i 50 stati USA

  • Tasso di omicidi: n. omicidi per 100.000 abitanti
  • Tasso di criminalità: n. omicidi, violenze carnali, rapine per 100. abitanti
  • Tasso di povertà: percentuale di popolazione con reddito sotto la soglia di povertà
  • % genitore singolo: % di famiglie con un solo genitore La correlazione tra il tasso di omicidi e il tasso di povertà è pari a 0.63. La correlazione tra il tasso di omicidi e il livello di scolarità è - 0.. Quale risulta essere la variabile più correlata con il tasso di omicidi?