S. Borra, A. Di Ciaccio – Statistica, metodologie per le scienze economiche e sociali,

McGraw Hill, 2004, ISBN 88-386-6162-6

S. Borra, A. Di Ciaccio – Statistica, metodologie per le scienze economiche e sociali,

McGraw Hill, 2004, ISBN 88-386-6162-6

Cap. 20 - 1

Cenni di regressione non-parametrica

funzione non-lineare  non-linearità nei parametri o nelle variabili  overfitting  funzioni

linearizzabili  funzione additiva  bias-variance tradeoff  funzioni parametriche e non-

parametriche  smoother  kernel e bin smoother  kernel smoother gaussiano  k-nearest neighbors

 cross-validation  10-fold cross-validation  smoother multidimensionale  curse of

dimensionality  GAM  PPR  MARS

20.1 – Funzioni non-lineari e misura dell’adattamento

20.2 - La contrapposizione tra distorsione e variabilità

20.3 - Funzioni non-parametriche - smoother

20.4 - Smoother per due o più variabili esplicative

20.1 Funzioni non-lineari e misura dell’adattamento

Nell’approccio classico alla regressione lineare semplice e multipla si ipotizza che la

relazione tra la variabile dipendente e le variabili esplicative possa essere sintetizzata

attraverso una funzione lineare nei parametri. Generalmente vengono comunque adottati

modelli di regressione che sono lineari anche rispetto alle variabili. In alcuni casi, tali

assunzioni di linearità rappresentano una eccessiva semplificazione.

ESEMPIO 20.1.1 – Relazioni non-lineari

Si pensi alla relazione tra l’Età (X) di un individuo e il suo Tasso di crescita nella statura (Y). È

evidente che la relazione tra queste due variabili nel primo anno di vita è molto diversa da quella che

si ha quando l’individuo è adulto. In generale, si è osservato che la relazione tra queste due variabili

può essere espressa più correttamente attraverso una funzione esponenziale negativa, ossia

considerando come componente deterministica la funzione non-lineare

() ( )

bXXf −= exp .

Poiché le determinazioni delle variabili sono note (anche in questo capitolo considereremo

variabili esplicative non-stocastiche) mentre i parametri sono incogniti, è evidente che

ipotesi di non-linearità sui parametri sono più difficili da trattare matematicamente. In effetti,

se la non-linearità riguarda le variabili esplicative e non i parametri abbiamo una situazione

relativamente semplice: in tutti i casi in cui la funzione adottata è fissata, il procedimento di

calcolo dei parametri mediante il metodo di interpolazione dei minimi quadrati è del tutto

simile a quello visto per la regressione lineare semplice e multipla (si veda l’esempio 20.1.2).

Se invece si considera una funzione non-lineare nei parametri, il calcolo dei parametri risulta

assai complesso e necessita spesso di procedure computazionali iterative.

Capitolo 20 statistica, Appunti di Economia Politica

Documenti correlati

Anteprima parziale del testo

Scarica Capitolo 20 statistica e più Appunti in PDF di Economia Politica solo su Docsity!

Cenni di regressione non-parametrica

20.1 Funzioni non-lineari e misura dell’adattamento

**-

**-

∑^ (^ )

f j^ (^ Xj )^ = Xj , oppure non note, come vedremo nel paragrafo 20.4.

20.2 - La contrapposizione tra distorsione e variabilità

E { EQM^ }

20.3 - Funzioni non-parametriche - smoother

∑ ∫ i −

= ∑ i= 1 ω i,n i

∑ i= 1 ω i,n =^1

NOTA Il parametro λ definisce la semi-ampiezza dell’intervallo centrato nel punto x 0 in cui si vuole

centrato nel punto x 0 = 3 e di semi-ampiezza pari a λ = 2.

Ad ogni modo si dimostra che non è tanto la scelta della funzione g a determinare la qualità

( ) =∑ { − ( )} +λ∫( ′′)

20.4 Smoother per due o più variabili esplicative

= = +∑

E Y| = f(X 1 ,X 2 ,X 3 ...,XJ)=∑s α X +α X + +α X

X = =α + + +