Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


statistica regressione, Dispense di Statistica

dispensa sulla regressione statistica anno 2015-2016

Tipologia: Dispense

2016/2017

Caricato il 19/01/2017

enrico_dal_pont
enrico_dal_pont 🇮🇹

4.8

(6)

12 documenti

1 / 48

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistica
Regressione
Francesco Pauli
A.A. 2015/2016
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30

Anteprima parziale del testo

Scarica statistica regressione e più Dispense in PDF di Statistica solo su Docsity!

Statistica

Regressione

Francesco Pauli

A.A. 2015/

Ricchezza e salute

Income per Person of the World

Life Expectancy of the World

Liechtenstein

Dominica Antigua&Barbuda

Palau

Tuvalu Nauru

St. Kitts& Nevis Seychelles

San MarinoAndorra

Monaco Andorra

St.LuciaPanama

and PrincipeSao Tome

TongaSamoa

Grenada Brunei

Comoros Djibouti

Equatorial Guinea

Gabon

Luxembourg

Namibia

Swaziland

Timor-Leste

Micronesia Trinidad and Tobago

Albania

Bhutan Kiribati

Kosovo

Cyprus Maldives

Slovenia

Suriname

Belize Mauritius

Bahamas

Malta

Vanuatu

Montenegro Estonia

Gambia

Guinea-Bissau Lesotho

Botswana

Mongolia

Oman

Qatar

Iceland

Barbados CapeVerde Bahrain Latvia

SolomonIslands

Macedonia

Fiji Guyana

St.VincentJamaica and G.

Armenia Lithuania

Uruguay

Mauritania

Moldova

Kuwait

Liberia Congo, Rep.

Bosnia and H. (^) Croatia

Lebanon

Israel Costa Rica Puerto Rico^ New Zealand

Georgia

Central African Rep.

IrelandSweden^ NorwaySingapore Finland Austria

Turkmenistan

Slovak Rep.

Kyrgyzstan

Eritrea

Taiwan Denmark

Papua New Guinea

Hong Kong

United Arab Emirates

South Sudan

Switzerland

Hungary Azerbaijan Belarus

Dom.R. Bulgaria

Serbia

Burundi

Palestine Nicaragua Libya

Sierra Leone

Laos

Benin Guinea Somalia

Tajikistan

Togo

El Salvador Honduras (^) ParaguayJordan

Poland

Bolivia

Haiti

Czech Rep.

Portugal

Tunisia

Rwanda

Cuba Greece Belgium

Chad

Senegal

Zimbabwe Zambia

Cambodia

Ecuador

Guatemala

BurkinaFaso NigerMalawi Mali

Kazakhstan

Chile Netherlands

Romania

Cameroon

Sri Lanka

Cote d'Ivoire

Angola

Madagascar

Syria

Australia

Mozambique

Yemen

North Korea

Afghanistan

Ghana

Nepal

Sudan

Peru SaudiArabia VenezuelaMalaysia Morocco Uzbekistan

SpainItaly UK (^) GermanyCanada

France South Korea

Philippines

Vietnam

Ethiopia

Egypt Turkey Iran

Dem. Rep. Congo

Thailand

South Africa

Myanmar

Colombia

Ukraine

Tanzania Kenya

Argentina Algeria Iraq

Uganda

Bangladesh China Indonesia Pakistan

USA

Russia

Brazil

Nigeria

Japan

Mexico

India

2011 data for all 193 UN Members and forHong Kong, Kosovo, Palestine, Puerto Rico and Taiwan. !"#^ Documentation and version for print at:

3 orless 10100 millions^1000

Colour by region

Size by population

www.gapminder.org^ If you want to see more data visit:

remix, but attribute to^ Free to copy, share and Gapminder Foundation. Version 11 September 2012

map layout by Paolo Fausone

!"#$%&'().)!/'+&,"'-/+),'-#'.

GAPMINDER WORLD 2012

Mapping the Wealth and Health of Nations Healthy Poor Rich Sick

50

500 1 000 2 000 5 000 10 000 20 000 50 000

60

70

80

55

65

75

%&/$( #() #()-& in US Dollars^ (GDP/capita, PPP$ inflation adjusted, log scale)

,%.(

(0#(/1"&/

in years

Diagramma di dispersione: una relazione lineare

160 165 170 175 180 185 190 195

50

60

70

80

90

Altezza

Peso

`E evidente una relazione, che potrebbe essere adeguatamente descritta da

una linea retta.

Un primo modello

Adottiamo l’ipotesi di una relazione lineare.

Possiamo allora pensare ad un modello del tipo

(Peso) = α + β(Altezza) + (errore)

dove l’errore esprime la parte delle oscillazioni del peso non legate

all’altezza (o, meglio, che una funzione lineare dell’altezza non riesce a

spiegare).

Un modello di questo tipo viene chiamato

modello di regressione lineare semplice.

Rette “vicine” ai dati

160 165 170 175 180 185 190 195

50

60

70

80

90

Altezza

Peso

Vogliamo una linea retta che si “avvicini” ai punti.

Minimi quadrati: idea

Sembra ragionevole scegliere per i parametri due valori, ˆα e ˆβ, in modo

tale che la retta di regressione “riproduca” bene i nostri dati, ovvero in

modo tale che

y 1 ≈ αˆ + ˆβx 1

y 2 ≈ αˆ + βˆx 2

yN ≈ αˆ + ˆβxN

Per rendere “operativa” l’idea, dobbiamo decidere

  • in che senso interpretiamo gli ≈ che abbiamo scritto e
  • come combiniamo tra di loro le varie approssimazioni.

Retta dei minimi quadrati

Scegliamo i due parametri minimizzando

s^2 (α, β) =

∑^ N

i=

(yi − α − βxi )^2

ovvero scegliendo ˆα e βˆ in maniera tale che

s^2 (ˆα, βˆ) ≤ s^2 (α, β)

per qualsivoglia α ∈ R e β ∈ R.

In questo caso si dice che i parametri sono stati calcolati utilizzando il

metodo dei minimi quadrati.

Propriet`a dei minimi quadrati

La media aritmetica minimizza la somma (e quindi la media) dei quadrati

degli scarti delle singole osservazioni da una costante a.

Sia a un numero qualsiasi. Allora

∑^ N

i=

(yi − a)^2 =

∑^ N

i=

(yi − y )^2 + N(y − a)^2 (1)

Dimostrazione.

NB: tutte le sommatorie vanno da 1 a N

(yi − a)

2

(yi − a + y − y )

2

[(yi − y ) + (y − a)]^2 =

∑ [

(yi − y )^2 + (y − a)^2 + 2(y − a)(yi − y )

]

(yi − y )^2 +

(y − a)^2 + 2(y − a)

(yi − y ) =

(yi − y )

2

+ N(y − a)

2

+ 2(y − a) × 0.

Quindi, quando a = y , la quantit`a

(yi − a)^2 `e minima.

Minimi quadrati: determinazione dei parametri (continua)

(2) La quantit`a da minimizzare diventa quindi

s^2 (ˆα, β) =

∑^ N

i=

[yi − y − β(xi − x)]^2.

Derivando rispetto a β e mettendo a zero la derivata si ottiene l’equazione (per β)

− 2

∑^ N

i=

(xi − x)[(yi − y ) − β(xi − x)] = 0,

che possiamo riscrivere come

∑^ N

i=

(xi − x)(yi − y ) = β

∑^ N

i=

(xi − x) 2 .

Minimi quadrati: determinazione dei parametri (continua)

Se

∑N i=1(xi^ −^ x)

(^2) > 0, l’equazione precedente ammette l’unica soluzione

βˆ =

∑N i=1(xi^ −^ x)(yi^ −^ y^ ) ∑N i=1(xi^ −^ x) 2

Esercizio: verificare che questa soluzione corrisponde ad un punto di minimo.

Si noti che

βˆ =

∑N i=1(xi^ −^ x)(yi^ −^ y^ ) ∑N i=1(xi^ −^ x)

2

=

∑N i=1(xi^ −^ x)(yi^ −^ y^ )/N ∑N i=1(xi^ −^ x)

(^2) /N

=

σXY σ X^2

.

Calcolo delle stime

Sostituendo i valori del campione si ha n = 59 e

N

∑^ n

i=

xi =

1. 0342 × 104 = 175. 29 ,

N

∑^ n

i=

yi =

N

∑^ n

i=

x i^2 =

1. 8192 × 106 = 3. 0834 × 104 ,

N

∑^ n

i=

xi yi =

6. 9655 × 105 = 1. 1806 × 104 ,

Si ha allora

β^ ˆ =

∑n i=1 ∑(yi^ −^ y¯^ )(xi^ −^ ¯x) n i=1(xi^ −^ ¯x)^2

∑n ∑i=1^ xi^ yi^ /n^ −^ x¯^ y¯ n i=1 x 2 i /n^ −^ ¯x

6. 9655 × 105 / 59 − 175. 29 × 66. 763

1. 8192 × 106 / 59 − 175. 292

α ˆ = ¯y − βˆ x¯ = 66. 763 − 0. 96023 × 175 .29 = − 101. 56 ,

Diagramma di dispersione con retta di regressione

160 165 170 175 180 185 190 195

50

60

70

80

90

Altezza

Peso

La capacit`a di descrivere le variazione del peso sembra discreta,

naturalmente c’e una certa variabilita intorno alla retta stessa.

Modelli stimato, valori teorici, residui

Il modello stimato `e

yi = − 101 .56 + 0. 96023 xi + (errore).

Valori teorici:

yˆi = ˆα + ˆβxi

ad esempio, x 5 = 191 e quindi

yˆ 5 = − 101 .56 + 0. 96023 × (191) = 81. 668.

Residui

ri = yi − αˆ − βˆxi

ad esempio

r 5 = 70 − 81 .668 = − 11. 67.

Graficamente

Altezza

yi

y^^ i = α^^ + β

^

xi

xi