Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Model Identification, Dispense di Model identification

Dispensa del corso "Model Identification and Data Analysis"

Tipologia: Dispense

2017/2018

Caricato il 14/04/2018

mirko14951
mirko14951 🇮🇹

2 documenti

1 / 71

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
POLITECNICO DI MILANO
Identificazione dei Modelli e
Analisi dei Dati 1
Appunti
Stefano Invernizzi
Anno accademico 2010-2011
Corso del prof. Sergio Bittanti
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47

Anteprima parziale del testo

Scarica Model Identification e più Dispense in PDF di Model identification solo su Docsity!

POLITECNICO DI MILANO

Identificazione dei Modelli e

Analisi dei Dati 1

Appunti

Stefano Invernizzi Anno accademico 2010-

Corso del prof. Sergio Bittanti

  • Introduzione al corso
    • I modelli
    • L’identificazione e i problemi che vogliamo risolvere
    • Modelli di stato e modelli di ingresso/uscita
    • Modellistica, identificazione e predizione
    • Richiami su variabili casuali, vettori casuali e processi casuali......................................................................
  • Introduzione alla predizione: processi AR, MA e ARMA
    • Il problema della predizione
    • Simbologia
    • Il predittore lineare a memoria finita
    • Problemi nella realizzazione del predittore lineare
    • L’errore di predizione
    • Il rumore bianco
    • Descrizione del segnale come uscita di un sistema lineare.........................................................................
    • Processi MA
    • Processi AR
    • Processi ARMA.............................................................................................................................................
    • Spettro
    • Rappresentazioni di un processo stazionario
    • Fattorizzazione spettrale canonica
  • La predizione
    • Il problema della predizione
    • Ipotesi di misurabilità dell’ingresso
    • Predizione a partire dalle misurazioni di!
    • Predizione con variabili esogene
    • Ricavo semplificato del predittore
  • L’identificazione...............................................................................................................................................
    • Introduzione: l’identificazione predittiva
    • Formalizzazione dei concetti relativi all’identificazione predittiva
    • Il metodo del minimo quadrato (LS, Least Square)
    • Il metodo di massima verosimiglianza (ML, Maximum Likelihood)
    • Asintoti di PEM (Prediction Error Minimization)
    • Algoritmi ricorsivi: RLS
    • RLS adattativo
    • Stima ricorsiva dei parametri di un modello ARMAX: algoritmo ELS
  • Il controllo predittivo a minima varianza
    • Il controllo digitale
    • Il controllo predittivo a minima varianza
    • Segnale di riferimento variabile nel tempo
    • Controllo predittivo a minima varianza generalizzato (GMV)
    • Scelta della complessità
    • Crossvalidazione
    • Valutazione della bontà oggettiva di un modello a partire dalla valutazione soggettiva

Introduzione al corso

I modelli

I modelli sono strumenti comunemente adottati per la descrizione di sistemi e fenomeni naturali. Essi possono essere di varia natura. Una delle tipologie di modelli è quella dei modelli deterministici , nei quali si assume in sostanza che il futuro “sia già scritto”, ovvero possa essere determinato in maniera esatta a partire dai dati relativi al presente o al passato. Tuttavia il mondo reale è governato dall’incertezza, e ciò fa sì che questi modelli risultino essere in sostanza sbagliati. A tale proposito è nota la citazione secondo la quale “tutti i modelli sono sbagliati, ma alcuni sono utili”. All’interno del nostro corso adotteremo il punto di vista secondo il quale le risposte alle domande relative ai sistemi sono fornite dai dati, che sono in sostanza dei fenomeni visibili complessi.

L’identificazione e i problemi che vogliamo risolvere

L’identificazione L’identificazione è l’insieme dei metodi e degli algoritmi che ci consentono di analizzare i dati per ottenere un certo modello. Il modello così individuato ci potrà essere utile ad esempio per risolvere problemi di controllo (cioè per far in modo che si possano determinare gli interventi da mettere in atto sull’impianto affinché quest’ultimo si comporti come desiderato), oppure per eseguire delle previsioni sulle variabili del modello stesso. Problemi I problemi che si incontrano durante l’identificazione, e che cercheremo di risolvere durante il corso, sono fondamentalmente suddivisibili in 3 classi:

  1. Stima dei parametri di un modello noto;
  2. Stima di un segnale non misurabile (es.: posizione di una nave spaziale) mediante la costruzione di un sensore virtuale.
  3. Costruzione di un modello a partire dai dati e secondo un procedimento a scatola nera (ad es.: data mining nel settore medico). In sostanza quindi non si conosce il meccanismo che regola i dati, ma si vuole ottenere un modello del sistema. Talvolta questo approccio viene adottato pur conoscendo il meccanismo che regola i dati, ad esempio perché si sta cercando di risolvere un problema di controllo che risulterebbe altrimenti troppo complesso. In tal caso si utilizza il modello esatto solo per eseguire delle simulazioni, mentre l’analisi viene eseguita sulla base di un modello semplificato.

Richiami su variabili casuali, vettori casuali e processi casuali

Variabile casuale (o aleatoria, o stocastica) Una variabile casuale 1 è una funzione reale di un evento casuale, associato all’esito 2 di un esperimento causale. Possiamo allora indicare la variabile casuale come: 1#2% Gli unici concetti di interesse nel nostro corso tra quelli legati alle variabili casuali sono i seguenti:

  • Media La media di una variabile casuale è sempre un numero reale, che viene indicato con: 34 516 = 7 = 1̅ = 1 9
  • Varianza La varianza di una variabile casuale è sempre un numero reale non negativo. La varianza è così definita: :;< 4 516 = 35#1 − 7%>^ 6 = ?>^ = >^ =? (^) !!
  • Deviazione standard La deviazione standard di una variabile casuale è sempre un numero reale non negativo, che rappresenta la radice quadrata della varianza: "# 4 516 = $:;< 4 516 =? = = $? (^) !!
  • Varianza incrociata Date due variabili casuali (^1) % e (^1) > , la varianza incrociata tra (^1) % e (^1) > è: ?%> = 35#1% − 7% % ∙ #1> − 7> % Si noti che ?%> =? (^) >% e che ?%% è la deviazione standard di (^1) % (come ovvio anche dalle notazioni usate). Proprietà delle variabili casuali
  1. Se la distribuzione di probabilità della variabile casuale 1 è gaussiana, allora con una probabilità del 95%, il valore di 1 appartiene all’intervallo: &7 − 2 ⋅ "#516; 7 + 2 ⋅ "#516*
  2. La media è un operatore lineare, ovvero se sono date le variabili casuali (^1) % e (^1) > , ed è definita una terza variabile casuale 1 = + ⋅ 1% + , ⋅ 1> , allora si ha: 3516 = 35+ ⋅ 1% + , ⋅ 1> 6 = + ⋅ 351% 6 + , ⋅ 51> 6 Vettore casuale (o aleatorio, o stocastico) Un vettore casuale è un insieme di variabili casuali. Per comodità, il vettore casuale viene sempre organizzato come un vettore colonna. Quindi, date le variabili aleatorie (^1) % e (^1) > , il vettore:

1 = -

È un vettore casuale. Anche in questo caso sono definiti i concetti di valor medio e di varianza:

  • Valor medio Il valor medio di un vettore casule è il vettore dei valori medie delle variabili casuali del vettore dato: 3516 = /^351351 %^6 > 6
  • Varianza La varianza di un vettore casuale di dimensione 1 è una matrice 1 × 1 così costruita (1 = 2): :;<516 = /??%% ?%> >%?^ >>

In altri termini, l’ 3 -esimo elemento della diagonale principale è la varianza dell’ 3 -esima componente del vettore casuale dato, mentre per le restanti posizioni, detta #3, 5%^ la posizione dell’elemento considerato, il corrispondente valore è la varianza incrociata tra la componente 3 -esima e la componente 5 -esima del vettore casuale di partenza.

Proprietà della varianza di un vettore casuale La matrice di varianza di un vettore causale è sempre semidefinita positiva: :;<516 ≥ 0

Memo sulle matrici semidefinite positive Data una matrice reale ; quadrata di dimensione 1 , diciamo che ; è semidefinita positiva (; ≥ 0 ) se: ∀. ∈ ℝ ;^ "#.% =. =^ ;. ≥ 0 Si noti infatti che, siccome. è un vettore colonna di dimensione 1 × 1, la forma quadratica "#.%^ sarà certamente un numero reale. Ad esempio, se 1 = 2, abbiamo: ; = -

>>% >>>.^.^ =^ -

E perciò: "#.% = 5.% .> 6 -

.>. = 5.%^ >%%^ + .>^ >>%^ .%^ >%>^ + .>^ >>>^ 6 -

= .%>^ >%% + .% .> >%> + .% .> >%> + .>>^ >>> =? .@ .A >@A

;

@,AB%

Memo sulle matrici definite positive Data una matrice reale ; quadrata di dimensione 1 , diciamo che ; è definita positiva (; > 0) se: ∀. ∈ ℝ ;^ $. E.. ≠ 0, "#.% =. =^ ;. > 0 Ovvero, per ogni vettore di ℝ ;^ , la forma quadratica "#.%^ è strettamente positiva, a patto che il vettore considerato non sia il vettore nullo (in quel caso ovviamente si avrà sempre "#.% = 0). Naturalmente, ogni matrice definita positiva è anche semiderfinita positiva, mentre una matrice semidefinita positiva può essere o non essere definita positiva.

Osservazione grafica Considerando ancora 1 = 2, notiamo che da un punto di vista grafico una matrice definita positiva rappresenta una conica del tipo mostrato nella figura a sinistra; una matrice semidefinita positiva, ma non definita positiva, rappresenta invece una conica come quella mostrata a destra.

Condizioni pratiche

  • ; > 0 se e solo se tutti i suoi autovalori sono positivi.
  • ; ≥ 0 se e solo se tutti i suoi autovalori sono non negativi.
  • Se ; > 0 , allora ; ≥ 0.
  • Se ; ≥ 0 ma non si ha ; > 0 , allora almeno un autovalore di ; è nullo, cioè det#;%^ = 0.

y

z

x

y

z

x

Processo casuale (o aleatorio, o stocastico) Un processo casuale è un insieme numerabile (o finito) di variabili casuali. Si ha perciò di norma un insieme di infinite variabili casuali, che vengono indicizzate con una variabile solitamente indicata con $ (in tal modo si fa di solito riferimento al tempo, ma la variabile usata come indice può talvolta assumere significati diversi). Il processo casuale viene indicato con: 1#$% Tuttavia, tale notazione non mette in evidenza il fatto che in realtà si tratta di una funzione dipendente non solo dal tempo, ma anche dall’esito 2 dell’esperimento casuale, perciò la notazione (comunque ampiamente adottata) sottintende in realtà una scrittura del tipo: 1#$, 2%

  • Valor medio Il valor medio di un processo casuale è così definito: 7#$% = 351#$%6 = 3 4 51#$, 2% Come si nota, il valor medio non dipende dal valore di 2. In sostanza quindi stiamo eseguendo la media su tutti gli esiti possibili. Si osserva anche che il valor medio varia a seconda del tempo. Ad esempio, il valor medio può essere:

Stagionale Un trend (o linea di tendenza ) Fluttuante

  • Varianza La varianza di un processo casuale è: :;<51#$%6 = 3 -L1#$% − 7#$%M>^. = ?>^ #$% La varianza può essere costante nel tempo, ma in generale non è così.
  • Varianza incrociata (funzione di covarianza) La varianza incrociata viene ottenuta considerando due valori di 1 in istanti diversi $% e $> , mediante la formula: Y#$% , $> % = 3&L1#$% % − 7#$% %M ∙ L1#$> % − 7#$> %M* Si nota che, nel caso in cui si abbia $% = $> = $, la funzione di covarianza coincide con la varianza: Y#$, $% = ?>^ #$%

t

t

t

Processo casuale stazionario Un processo casuale stazionario è un processo casuale nel quale:

  1. La media "#$% è costante: "#$% = ".
  2. La varianza '(^ #$%^ è costante: '(^ #$% = '(
  3. La covarianza Y#$% , $( % dipende solo da Z = $( − $% : Y#$% , $( % = Y#Z%, Z = $( − $% Si noti che in realtà dovremmo usare una lettera diversa da Y: a rigore matematico la scrittura appena adottata è errata, ma risulta chiaramente più pratica. Proprietà della funzione di covarianza di un processo stazionario
  4. La covarianza per Z = 0 è la varianza del processo: Y#0% = '( Infatti, se si ha Z = 0, ovvero $% = $( = $, stiamo di fatto calcolando Y#$, $% = '(^ #$% = '(^.
  5. La covarianza in modulo non è mai superiore a Y#0%: |Y#Z%| ≤ Y#0% Infatti possiamo chiamare (^1) % la variabile casuale 1#$% % e (^1) ( la variabile casuale 1#$( %. Il coefficiente di covarianza tra (^1) % e (^1) ( , in virtù della proprietà precedentemente dimostrata, sarà sempre non superiore ad 1, perciò:

|O| = [

$'%% ∙ $'^ ((

[ ≤ 1

Ma '%( non è altro che la funzione di covarianza: '%( = 78#1% − "% %#1( − "( %9 = 78#1#$% % − "%#1#$( % − "%9 = Y#$% , $( % = Y#Z% La precedente disuguaglianza può allora essere così riscritta:

[

Y#Z%

√'(^ ∙ √'(^

[ ≤ 1 → | Y#Z%| ≤ ?>^ = Y#0%

  1. La funzione di covarianza è pari: Y#Z% = Y#−Z% Funzione di covarianza normalizzata Talvolta viene introdotta la funzione di covarianza normalizzata, che è così definita:

O#Z% =

Y#Z%

Y#0%

In questo modo si ottiene una funzione sempre compresa tra −1 ed 1. Spettro di un processo stazionario Dato un processo stazionario con funzione di covarianza Y#Z%, possiamo calcolare la trasformata di Fourier di Y#Z%, ottenendo:

Γ#^% =? Y#Z% ∙ V _A`a

bc

aB_c

, ^ ∈ ℝ

Lo spettro di un processo stazionario ha le seguenti proprietà:

  1. Γ#^% è sempre reale.
  2. Γ#^% è pari.
  3. Γ#^%^ è periodica di periodo 2d. Se anziché le pulsazioni si utilizzano le frequenze, allora il periodo sarà

unitario. Spesso si rappresenta il grafico dello spettro per pulsazioni tra – d e d, corrispondenti a frequenze tra −0,5 e 0,5; quest’ultimo valore è anche la massima frequenza che si può ottenere in campo discreto: il segnale periodico che varia più rapidamente è infatti quello fluttuante tra due valori. Essendo pari, spesso è sufficiente rappresentare lo spettro tra 0 e d.

  1. Γ#^% ≥ 0.

Introduzione alla predizione: processi AR, MA e ARMA

Il problema della predizione

Consideriamo una sequenza di dati ordinati con un indice $ (che possiamo immaginare rappresenti il tempo, anche se non è necessariamente così). Supponiamo di avere come dati: 1#1% 1#2% ⋮ 1#$ − 1% E di voler calcolare l’incognita: 1#$% Il problema può essere rappresentato come mostrato nella figura seguente:

Supponiamo inoltre di non essere a conoscenza di come i dati siano stati generati.

Simbologia

Il dato incognito 1#$%, come già abbiamo affermato, rappresenta il valore che 1 assumerà all’istante $. Tuttavia, dobbiamo distinguere tra il valore che effettivamente assumerà in tale istante e quello che si stima possa assumere; di conseguenza, indichiamo la stima di 1#$% con il simbolo 1 m#$%. Tale simbologia risulta però non sufficientemente chiara, perciò si utilizza la notazione seguente: 1 m#$|" − 1% Che indica che stimiamo il valore di & all’istante ", utilizzando tutti i dati misurati fino all’istante " − 1. Naturalmente, saranno lecite anche scritture come le seguenti (il cui significato risulta ovvio): &m("|" − 2 %^ &m(" + 1 |" − 1 %

Il predittore lineare a memoria finita

Per prima cosa, proviamo a costruire un predittore lineare, ovvero un predittore che calcoli &m("|" − 1% come combinazione lineare dei dati a disposizione. Possiamo scegliere di realizzare:

  • Un predittore lineare a memoria infinita Ovvero un predittore nel quale &m("|" − 1% viene calcolato come combinazione di tutti i valori di &(∙% a partire da un certo istante iniziale 1 , che è l’istante relativamente al quale si possiede il primo dato: &m("|" − 1% = +% ∙ &(" − 1% + +/ ∙ &(" − 1% + ⋯ + +o_% ∙ &(1% Come dice il nome stesso, il predittore corrispondente all’equazione appena riportata necessita però di una memoria infinita, perché indipendentemente dal valore di ", bisogna conservare tutti i dati a partire dall’istante iniziale 1.
  • Un predittore lineare a memoria finita Se vogliamo realizzare invece un predittore con memoria finita, che abbia bisogno di memorizzare solamente gli ultimi 1 valori di &, allora dobbiamo realizzare un predittore del tipo: &m("|" − 1% = +% ∙ &(" − 1% + +/ ∙ &(" − 2% + ⋯ + +; ∙ &(" − 1%

Problemi nella realizzazione del predittore lineare

Nel seguito analizzeremo solamente predittori lineari a memoria finita. Tuttavia, i problemi che dobbiamo affrontare nella realizzazione di questo predittore sono fondamentalmente 2:

  1. Quale memoria utilizzare? Ovvero, come scegliere il valore 1 da utilizzare?
  2. Quali valori attribuire ai parametri +% , +( , … , +;?

L’errore di predizione

Introduzione Naturalmente, una volta individuato il predittore, ovvero dopo aver fissato tutti i parametri che compaiono nell’equazione: 1 m#$|" − 1% = +% ∙ &(" − 1% + +/ ∙ &(" − 2% + ⋯ + +; ∙ &(" − 1% il predittore stesso potrà essere utilizzato anche sul passato. In altri termini, possiamo calcolare: &m(q|q − 1%, rVj q = " − 1, " − 2, … Per ognuno dei valori considerati possiamo calcolare l’errore di predizione, che è di fatto l’errore di stima. Definizione L’errore di stima è definito come la differenza tra il valore vero di una grandezza & e il suo valore stimato &m: s("% = &("% − &m("|" − 1% Naturalmente, siccome &(∙% e &m(∙% variano nel tempo, anche s(∙% varierà nel tempo. In particolare, siccome consideriamo &(∙% come un processo casuale, anche s(∙% sarà un processo casuale. Quali caratteristiche deve avere l’errore di predizione perché la stima sia considerata “buona”? Naturalmente, la situazione ideale sarebbe quella nella quale l’errore di predizione è costantemente nullo; ciò è tuttavia impossibile nella realtà dei fatti. Ci accontentiamo perciò di un risultato molto meno vincolante. A tale scopo, consideriamo gli andamenti dell’errore di predizione mostrati in figura:

  1. La figura riportata a sinistra mostra chiaramente un errore di predizione con media positiva. Di conseguenza ci rendiamo conto molto facilmente del fatto che possiamo realizzare un predittore migliore di quello in analisi, tenendo conto semplicemente di questo dato evidente. Possiamo quindi concludere che uno dei requisiti dell’errore di predizione è che esso abbia media nulla.
  2. La figura a sinistra mostra invece un errore con media nulla (ipotizziamo che sia così), ma nonostante questo possiamo osservare che l’errore cambia segno ad ogni istante. Anche in questo caso quindi siamo in grado di ottenere delle informazioni più dettagliate rispetto a quelle che ci vengono direttamente fornite (ad ogni istante sappiamo dire se la predizione viene fornita per eccesso o per difetto) e quindi anche in questo caso possiamo ottenere un predittore migliore. Possiamo allora concludere che il secondo requisito necessario è che il predittore non abbia una dinamica propria , ovvero una propria logica di funzionamento. Più rigorosamente, questi concetti vengono formalizzati affermando che l’errore di predizione è un rumore bianco (WN, White Noise): s(∙% ~ tu(0, A/^ % Dove il primo dei due parametri rappresenta la media (cioè 0 ), mentre A/^ è la varianza di s(∙%.

s

s

Possiamo ora calcolare gli zeri e i poli della FdT così ottenuta:

  • Gli zeri si ottengono annullando il numeratore, e perciò abbiamo 1 zeri tutti nell’origine: X = 0 1 &ky"V Gli zeri vengono rappresentati nel piano dei numeri complessi con il simbolo ∘.
  • I poli si ottengono annullando il denominatore, e perciò avremo 1 poli. A priori, non possiamo sapere in quale regione del piano dei numeri complessi si troveranno i poli della funzione di trasferimento precedentemente riportata. Il simbolo usato per indicare i poli nel piano complesso è ×. In conclusione, per trovare un buon predittore lineare, dobbiamo cercare di descrivere il segnale esatto come l’uscita di un sistema avente una funzione di trasferimento del tipo:

t(N% =

N ;

N ;^ − +% ∙ N ;%^ − +/ ∙ N ;/^ − ⋯ − +;

e che sia alimentato da un rumore bianco. Vediamo ora che caratteristiche avrà il processo d’uscita & in relazione alle caratteristiche del processo d’ingresso.

Processi MA

Il processo MA(1) Sia dato un sistema dinamico lineare come quello mostrato nella figura seguente:

Supponiamo inoltre che il segnale d’ingresso v sia un rumore bianco di media v̅ e varianza A/^ : v~tu(v̅, A/^ % Supponiamo per praticità che si abbia v̅ = 0 (ma tale ipotesi non è in realtà necessaria). Analizziamo il sistema nel caso in cui il suo comportamento imponga la validità della seguente equazione: &("% = E{ v("% + E% v(" − 1%, E{ , E% ∈ ℝ Allora:

  1. Se E% = 0, abbiamo semplicemente &("% = E{ v("%, perciò: a) UV&("%W = UVE{ v("%W = E{ UVv("%W = 0 b) X>jV&("%W = UV(&("% − UV&("%W%/^ W = U -L&("%M

/

. = U -LE{ v("%M

/

. = E{/^ U -Lv("%M

/

. = E{/^ A/ c) |k&("% , "/ % = Y("% , "/ % = UV(&("% % − UV&("%W% ∙ (&("/ % − UV&("%W%W = UV&("% %&("/ %W = = UVE{/^ v("% %v("/ %W = E{/^ Y("% , "/ % = }

0 DV "% ≠ "/

E{/^ A/^ DV "% = "/

X

Siccome valgono tutte le relative proprietà, il segnale di uscita è ancora un processo stazionario, ed in particolare si tratta ancora di un rumore bianco.

  1. Se E% ≠ 0 e E{ qualsiasi, allora: a) UV&("%W = UVE{ v("% + E% v(" − 1%W = E{ UVv("%W + E% UVv(" − 1%W = 0 b) X>jV&("%W = UV& /^ ("%W = UVE{/^ v /^ ("% + E%/^ v /^ (" − 1% + 2E{ E% v("%v(" − 1%W = = E{/^ UVv /^ ("%W + E%/^ UVv /^ (" − 1%W + 2E{ E% UVv("%v(" − 1%W Ricordando la definizione di covarianza: X>jV&("%W = E{/^ A/^ + E%/^ A/^ + Y(", " − 1% = E{/^ A/^ + E%/^ A/ c) Y("% , "/ % = UV&("% %&("/ %W = U&LE{ v("% % + E% v("% − 1%MLE{ v("/ % + E% v("/ − 1%M* = = E{/^ UVv("% %v("/ %W + E{ E% UVv("% %v("/ − 1%W + E{ E% UVv("% − 1%v("/ %W + E%/^ UVv("% − 1%v("/ − 1%W Abbiamo ora vari casi:
  2. Se "% = "/ = ": Y(", "% = E{/^ A 2 + E 12 A 2
  3. Se "/ = "% ± 1: Y(", " + 1% = E{ E% A 2
  4. Se "/ = "% ± 2: Y(", " + 2% = 0

v (^) t(N%

In sostanza quindi, nel caso in analisi, si ottiene ancora un processo stazionario, ma in questo caso non si tratta di un rumore bianco, perché la covarianza non si annulla nei valori ±1. Diciamo in questi casi che il processo in analisi è un rumore colorato.

Y#Z% = ~

#E{^ (^ + E%^ (%'^2 SV Z = 0

E{E%A^2 DV Z = ± 1

0 DV Z = ±q, q > 1

X

Un processo di questo tipo è noto con il nome di processo MA(1) , dove l’acronimo MA sta per Moving Average , ovvero media mobile. Il nome è giustificato dal fatto che in sostanza il processo in uscita viene costruito calcolando la media dei 2 precedenti valori, sempre utilizzando gli stessi 2 coefficienti. Il caso generale: processo MA(n) Procedendo in maniera analoga, il processo MA(n), ottenuto con un sistema del tipo: &("% = E{ v("% + E% v(" − 1% + ⋯ + E; v(" − 1%, E{ , E% , … , E; ∈ ℝ Sarà ancora un processo casuale stazionario, con: UV&("%W = 0 XdeV&("%W = VE{/^ + E%/^ + ⋯ + E;/^ WA/ e sarà nuovamente un rumore colorato. In particolare, la sua funzione di covarianza sarà del tipo: Y(0% = VE{/^ + E%/^ + ⋯ + E;/^ WA/ Y(±1% = VE{ E% + E% E/ + ⋯ + E;% E; WA/ Y(±2% = VE{ E/ + E% Ef + ⋯ + E;/ E; WA/ … Y(±1% = E{ E; A/ Y(±q% = 0, q > 1 Possiamo ora provare a calcolare la funzione di trasferimento di un generico processo MA(n): &("% = E{ v("% + E% N _%^ v("% + ⋯ + E; N _;^ v("% &("% = (E{ + E% N _%^ + ⋯ + E; N _;^ %v("%

g(N% =

v("% = E{^ + E%^ N^

_% + ⋯ + E; N _; = E{^ N^

; + E% N ;_% + ⋯ + E;

N ;

Osserviamo che si tratta di una funzione di trasferimento lineare, perciò potremo calcolarne zeri e poli; gli 1 poli saranno tutti coincidenti e posizionati nell’origine, mentre la posizione degli zeri dipende chiaramente dai valori che si attribuiscono ai vari coefficienti E{ , E% , … , E;. Il processo MA() Consideriamo ora ciò che accade se, anziché considerare un segnale che sia dato dalla media pesata tra i valori assunti dall’ingresso v negli ultimi 1 istanti (dove 1 è un numero finito), consideriamo il caso in cui il segnale d’uscita sia la combinazione lineare di v valutato in un numero infinito di istanti del passato: &("% = E{ v("% + E% v(" − 1% + ⋯ + E;_% v(" − 1% + E; v(" − 1% + E;b% v(" − 1 − 1% + ⋯ Avremo allora: Y(0% = VE{/^ + E%/^ + ⋯ + E;/^ + ⋯ WA/ Allora, affinché Y(0% sia una quantità finita, è necessario che sia finita la serie:

E{/^ + E%/^ + ⋯ =? E@/

bc

@B{ In tale ipotesi, Y sarà finita in ogni suo punto: sappiamo infatti che: |Y#Z%| ≤ Y#0% Perciò è sufficiente verificare che la covarianza sia finita per Z = 0.

Y#Z%

Z

#E{^ (^ + E%^ (%'^2

E{E%'^2 E{E%'^2

Possiamo così concludere che, se |>% | < 1, allora il processo AR(1) è equivalente ad un processo MA(∞) ben definito, e perciò è stazionario, perché abbiamo già dimostrato che tutti i processi MA sono stazionari. La varianza del processo AR(1) può essere calcolata utilizzando la formula data per i processi MA(∞):

f>j81#$%9 = Y#0% = 8E{(^ + E%(^ + ⋯ + E;(^ + ⋯ 9'(^ = É? >%(@

bc

@B{

Ñ '(^ =

Inoltre, possiamo valutare la funzione di covarianza nei restanti punti:

Y#1% = #E{ E% + E% E( + ⋯ %'(^ = L>% + >%k^ + >%Ö^ + ⋯ M'(^ = >% É? >%(@

bc

@B{

Ñ '(^ = É? >%(@

bc

@B{

Ñ '(^ = >% Y#0%

In maniera del tutto analoga:

Y#2% = #E{ E( + E% Ek + ⋯ %'(^ = #>%(^ + >%Ü^ + >%á^ + ⋯ %'(^ = >%(^ É? >%(@

bc

@B{

Ñ '(^ = É? >%(@

bc

@B{

Ñ '(^ = >%(^ Y#0%

E così via. Si ottiene così:

Y#Z% = >%a^ Y#0% =

1 − >%(^

%a

Da un punto di vista grafico allora la funzione di covarianza sarà rappresentata da un esponenziale negativo simmetrico a tempo discreto:

Come mostra la figura a destra, nel caso >% < 0, il segnale generato oscilla visivamente in modo molto più significativo. Con il termine segnale generato si intende quello che, in maniera più rigorosa, dovrebbe essere chiamato realizzazione del processo , ovvero l’insieme dei valori che il processo realmente assume se lo si osserva. In sostanza, considerare una realizzazione di un processo significa fissare un certo valore di S, che ricordiamo essere la variabile che indica l’esito dell’esperimento casuale: 1#$%^ dovrebbe infatti essere espresso come 1#$, S%. Diciamo allora che:

  • Se fissiamo il valore di $ = $̅, otteniamo 1#$̅, S%, ovvero una variabile casuale.
  • Se fissiamo il valore si S = S̅, otteniamo 1#$, S̅%, ovvero una realizzazione del processo.

Y#Z%

Z

Y#Z%

Z

Analisi del processo AR(1) – secondo metodo: la lunga divisione La stessa analisi può in realtà essere condotta in maniera diversa, adottando cioè un punto di vista differente. L’obiettivo è ancora quello di esprimere la funzione di trasferimento nella forma: t#X% = E{ + E% X _%^ + E( X _(^ + ⋯ Per ottenere tale risultato, possiamo eseguire la lunga divisione tra il numeratore e il denominatore di:

t#X% =

X

X − >%

La lunga divisione si esegue come di seguito mostrato: X X − >% N −>% 1 + >%N_%

% % −>%^ /N_% %^ /N_% E così via. Al primo passo otteniamo allora:

t(N% = 1 +

N − >

Al secondo passo, otteniamo:

t(N% = 1 + >% N _%^ +

>%/^ N _%

N − >%

Cioè, ad ogni passo indichiamo il risultato della divisione, cui si somma il resto diviso per il denominatore della funzione di trasferimento iniziale. Il procedimento viene iterato all’infinito, e si ottiene, se |>% | < 1: t#X% = 1 + >% X _%^ + >%(^ X _(^ + ⋯ Che equivale alla funzione di trasferimento di un processo MA(∞), a patto di porre E@ = >%@^ : t#X% = E{ + E% X _%^ + E( X _(^ + ⋯ Analisi del processo AR(1) – terzo metodo: le equazioni di Yule-Walker Un terzo metodo di analisi è quello che prevede di ricorrere all’uso delle equazioni di Yule-Walker:

  1. Per prima cosa, calcoliamo la varianza Y#0% di 1#∙%. Y#0% = f>j81#$%9 = 78#1#$% − 781#$%9%(^9 Siccome si ha: 78v#$%9 = 0 Allora avremo, per ogni valore di $: 781#$%9 = 0 E quindi possiamo scrivere: Y#0% = 7 -L1#$%M

(

. = 78â>% 1#$ − 1% + v#$%ä^ (^ 9 = 78>%(^1 (^ #$ − 1% + v (^ #$% + 2>% 1#$ − 1%v#$%9 = = >%(^781 (^ #$ − 1%9 + 78v (^ #$%9 + 2>% 781#$ − 1%v#$%9 = >%(^ f>j81#$ − 1%9 + '(^ + 2>% UV&(" − 1%v("%W Dove UV&(" − 1%v("%W è la correlazione tra &(" − 1% e v("%. Come è evidente dall’equazione che descrive &("%, &("%^ dipende da &(" − 1%^ e da v("%; a sua volta, &(" − 1%^ dipende da &(" − 2%^ e v(" − 1%, e così via. Possiamo allora affermare che &("% dipende dal passato di v(∙% fino all’istante ", mentre &(" − 1%^ dipende dal passato di v(∙%^ fino a " − 1. Se però v(∙% è un rumore bianco, allora v("% è incorrelato con tutti i valori precedenti, e perciò anche con &(" − 1%. Ne ricaviamo allora: Y(0% = >%/^ X>jV&(" − 1%W + A/ Inoltre, siccome &(∙% è un processo stazionario: X>jV&(" − 1%W = X>jV&("%W = Y(0% Perciò:

Y(0% = >%/^ Y(0% + A/^ → Y(0% =

A/