Dispensa geostatistica, Dispense di Analisi Statistica. Università della Calabria
silvia_cristiano
silvia_cristiano

Dispensa geostatistica, Dispense di Analisi Statistica. Università della Calabria

PDF (2 MB)
30 pagine
3Numero di download
1000+Numero di visite
Descrizione
Introduzione alla geostatistica
20 punti
Punti download necessari per scaricare
questo documento
Scarica il documento
Anteprima3 pagine / 30
Questa è solo un'anteprima
3 pagine mostrate su 30 totali
Scarica il documento
Questa è solo un'anteprima
3 pagine mostrate su 30 totali
Scarica il documento
Questa è solo un'anteprima
3 pagine mostrate su 30 totali
Scarica il documento
Questa è solo un'anteprima
3 pagine mostrate su 30 totali
Scarica il documento

Università della Calabria Dipartimento di Difesa del Suolo

Introduzione alla Geostatistica

Salvatore Straface straface@unical.it

Indice

1 Introduzione 2 1.1 Continuità spaziale . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Nozioni di supporto all’analisi geostatistica . . . . . . . . . . . . . . 3 1.3 Assunzioni basilari . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2 Analisi strutturale 11 2.1 Variogramma sperimentale . . . . . . . . . . . . . . . . . . . . . . . 11

2.1.1 Possibili forme di γ(h) per l’identificazione del modello . . . 12 2.2 Comportamento nell’origine . . . . . . . . . . . . . . . . . . . . . . 12 2.3 Strutture annidate . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2.4 Anisotropie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.5 Individuazione del variogramma-modello . . . . . . . . . . . . . . . 15

2.5.1 Proprietà di γ(h) . . . . . . . . . . . . . . . . . . . . . . . . 17 2.6 Modelli di variogramma . . . . . . . . . . . . . . . . . . . . . . . . 17

3 Il Paradigma del Kriging 24 3.1 Ordinary Kriging . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 3.2 Proprietà del Kriging . . . . . . . . . . . . . . . . . . . . . . . . . . 28

1

1 Introduzione

L’efficacia di un modello numerico dipende dall’arduo compito di determinare, in base alle osservazioni disponibili, i parametri idrogeologici appropriati alla scala di interesse nelle applicazioni. Allo stesso tempo, le caratteristiche del modello in- fluenzano le modalità di soluzione di un problema di identificazione [Troisi, 1995]. Pertanto, modellazione e identificazione parametrica delle acque sotterranee non sono separabili, ma occorre considerarle contemporaneamente come componenti essenziali di un’unica questione: combinare la descrizione fisica dei processi di mo- to e di trasporto nelle formazioni naturali con la variabilità spaziale dei parametri idraulici, in modo da ottenere un strumento soddisfacente nel descrivere il compor- tamento macroscopico delle acque sotterranee [Dagan, 1989]. La soluzione di un siffatto problema si scontra però con restrizioni pratiche difficilmente superabili:

- Costi economici notevoli per la realizzazione di una campagna di misure della variabile di interesse, in grado di fornire una completa distribuzione della stessa.

- I sondaggi, per una tale utopistica dettagliata rilevazione sarebbero tanto numerosi da causare errori durante le misurazioni [Gelhar, 1993] del tutto simile al principio di Heisemberg sull’interferenza dello strumento di misura con la misura stessa.

Di conseguenza, avendo a disposizione osservazioni limitate o frammentarie, quindi, insufficienti a fornire una dettagliata descrizione spaziale della variabile in studio, ed inoltre consapevoli della elevata variabilità spaziale che caratterizza tali grandezze idrogeologiche, la soluzione del problema su indicato ha intrapreso un’altra linea di ricerca, culminata nell’approccio geostatistico della descrizione dei parametri idrodinamici dei mezzi porosi.

Nei paragrafi che seguono, verranno illustrati le fasi e le caratteristiche del meto- do geostatistico, non prima di avere riportato alcuni concetti e definizioni alla base della geostatistica. Nella parte finale, saranno descritti alcune delle metodologie geostatistiche più comunemente usate, per ottenere il valore dei parametri idrod- inamici di interesse, attraverso l’informazione congiunta di dati riguardanti altre grandezze.

1.1 Continuità spaziale

Nella maggior parte dei set di osservazioni relativi alle scienze della terra si nota una variabilità spaziale, in generale, non caotica. Ad esempio, valori di permeabilità

2

K campionati in due punti vicini tra loro, avranno una probabilità maggiore di essere simili rispetto a quelli campionati in punti lontani. Quando si osserva una rappresentazione a curve di livello, i valori non appaiono casualmente distribuiti ma, piuttosto, sembra che i valori piccoli tendono ad essere vicini a valori piccoli e, viceversa valori grandi tendono ad essere vicini a valori grandi. Nella maggior parte dei casi, la presenza di un valore alto nei pressi di valori molto piccoli, o viceversa, deve insospettire. Esiste quindi una continuità spaziale dei dati campi- onati che presume una qualche forma di correlazione nella distribuzione spaziale del parametro K.

Le grandezze come la permeabilità K nella terminologia geostatistica sono chia- mate Variabili Regionalizzate [VR] [Matheron, 1970] per far capire che si tratta di variabili associate ad un fenomeno che si sviluppa nello spazio in modo non del tutto casuale, ma in accordo ad una qualche legge spaziale che certamente muterà a seconda della variabile esaminata e del dominio spaziale. La teoria delle variabili regionalizzate congiuntamente a concetti statistici, fino a pochi decenni addietro, ritenuti reconditi hanno dato luce alla geostatistica: disciplina che studia le auto e mutue correlazioni spaziali delle VR. Essa consente, dunque, di estrarre da una campagna di osservazioni, il comportamento della loro struttura in accordo a dei modelli che, in un secondo momento, verranno adoperati da particolari strumenti (Kriging) in grado di fornire il valore più plausibile del parametro in esame, in punti in cui non sono disponibile misure.

Una procedura geostatistica, nell’analisi dei dati sperimentali, non si attiene al- lo schema classico dell’inferenza statistica: ipotesi sulla distribuzione di probabilità – stima dei parametri – test di validità dell’ipotesi. Infatti, per la soluzione di prob- lemi di stima di una VR, le tecniche geostatistiche più diffuse sono quelle lineari, basate non sull’inferenza della completa funzione di distribuzione di probabilità congiunta, ma sui momenti statistici del primo e del secondo ordine; in partico- lare vedremo il ruolo svolto dal semivariogramma per caratterizzare la struttura spaziale dei parametri idrodinamici in studio.

1.2 Nozioni di supporto all’analisi geostatistica

Di seguito si riportano delle nozioni che sono alla base dell’analisi geostatistica:

Variabile Aleatoria (o Random) [VA ] Tale variabile, definita come Z(ξ), as- sume i valori generati in modo random in accordo a una qualche funzione di densità di probabilità f(Z(ξ)) [pdf] o alla corrispondente legge di probabilità cumulata F (Z(ξ)) [Pdf].

3

Variabile regionalizzata [VR ] E’ rappresentativa di un fenomeno che ha carat- tere spaziale. Se indichiamo, sinteticamente, con x0 la posizione di un punto generico nello spazio all’interno del campo di studio, il particolare valore Z(x0) assunto dalla variabile in esame è considerato essere una realizzazione di una variabile aleatoria [VA] Z(x0, ξ1). Pertanto, si può dire che una vari- abile regionalizzata è una caso particolare di variabile aleatoria ovvero di una variabile casuale che ha carattere spaziale, mentre una variabile aleatoria non è necessariamente una variabile regionalizzata (i.e. il lancio di un dado, di una moneta, . . . ).

Funzione Aleatoria [FA ] L’insieme delle VR definite sul dominio D, rappresen- tano una funzione aleatoria Z(x, ξ). Se una VR è caratterizzata da una dis- tribuzione di probabilità cumulata Fx(Z), allora, una FA, che è l’insieme di k VR, è caratterizzata da una distribuzione di probabilità congiunta, cioè, tiene conto della variabilità simultanea di Z(x1), Z(x2), . . . , Z(xk). Più chiara- mente, considerato un insieme di k punti x1, x2, . . . , xk nel dominio della funzione aleatoria FA Z(x, ξ), ad essi corrisponde una FA a k componenti:

Z(x1), Z(x2), . . . , Z(xk)

caratterizzata dalla funzione di distribuzione k-variata

Fx1x2...xk(z1, z2, . . . , zk) = prob{Z(x1) < z1, Z(x2) < z2, . . . , Z(xk) < zk}

L’insieme dei valori assunti dalla VR Z(x) in D, è considerata essere una realizzazione della FA Z(x, ξ1).

Legge spaziale Esprime la correlazione spaziale della FA Z(x) 1 nel campo D. E’ definita come l’insieme delle funzioni di distribuzione di probabilità congiunta di Z(x), per tutti gli interi positivi k e per ogni possibile combinazione di punti x.

Momento statistico del 1o ordine o valore atteso

E[Z(x)] = m(x) (1)

dove Z(x) rappresenta la variabile regionalizzata definita nel punto x ∈ D. L’operatore E[ ], indica la media o l’insieme dei valori medi. Pertanto il

1per semplicità di notazione, successivamente, quando si scriverà Z(x) è da intendere Z(x, ξ).

4

momento primo di Z(x) è la media di tutte le sue possibili realizzazioni e se esiste è funzione di x.

Momenti statistici del 2o ordine Nelle tecniche di stime lineari si considerano: la varianza, che misura la variabilità di Z(x) intorno al suo valore atteso m(x), funzione della posizione x

V ar[Z(x)] = E [( Z(x)−m(x)

)2] = E

[ Z(x)2

] − 2E [Z(x)] ·m(x) +m(x)2

= E [ Z(x)2

] −m(x)2

(2)

la covarianza, che misura la variabilità congiunta di due VR Z(x1), Z(x2) intorno ai rispettivi valori attesi m(x1), m(x2), funzioni delle posizioni x1 e x2

Cov(x1, x2) = E [( Z(x1)−m(x1)

)( Z(x2)−m(x2)

)] = E [Z(x1) · Z(x2)]− E [Z(x1)] ·m(x2) − E [Z(x2)] ·m(x1) +m(x1) ·m(x2) = E [Z(x1) · Z(x2)]−m(x1) ·m(x2)

(3)

il semivariogramma2 definito come la metà della varianza dell’incremento [Z(x1)− Z(x2)]

γ(x1, x2) = 1

2 V ar

[ Z(x1)− Z(x2)

] =

1

2 E [( Z(x1)− Z(x2)

)2]− 1 2

{ E [Z(x1)− Z(x2)]

}2 =

1

2 E [( Z(x1)− Z(x2)

)2] se E [Z(x1)− Z(x2)] = 0

(4)

La covarianza e il semivariogramma sono entrambi momenti bivariati di Z(x), poiché caratterizzano la variabilità congiunta nello spazio della coppia [Z(x), Z(x+h)], essendo h un generico vettore di separazione. La covarianza è un indicatore della continuità spaziale: maggiore è la covarianza, minore sarà la differenza (in media) tra i valori di ogni coppia [z(x0), z(x0 + h)]. Il variogramma, invece, misura la variabilità spaziale: all’aumentare di esso, la differenza (in media) tra i valori di ogni coppia [z(x0), z(x0 + h)] sarà maggiore.

2In seguito, per semplicità di esposizione, il termine semivariogramma sarà sostituito con variogramma

5

Varianza estimativa Stimando, la variabile Z(x) nei punti dove non esistono osservazioni, utilizzando le misure disponibili, si compie certamente un er- rore pari a Z∗(x) − Z(x): errore di stima. La varianza di questo errore è chiamata varianza estimativa, o varianza della stima, da non confondere con la V ar[Z(x)] che generalmente prende il nome di varianza dispersiva.

Scala di correlazione Rappresenta la lunghezza caratteristica detta anche dis- tanza di separazione (λ) al di là della quale la correlazione fra i valori Z(x) esaminati non è considerata significativa o addirittura assume valore nullo. In termini di covarianza tale situazione si indica con Cov(h) = 0, dove h rappresenta la distanza di separazione tra i punti considerati. In termini di variogramma, vuol dire che γ(h) perviene ad un valore soglia pari alla varianza a priori Cov(0) di Z(x). La distanza alla quale Cov(h) si annulla individua, appunto, la scala di correlazione del fenomeno in esame, che nella terminologia anglosassone è denominata range.

1.3 Assunzioni basilari

La fase più importante e delicata dell’approccio geostatistico, nella caratteriz- zazione dei parametri idrodinamici di un acquifero, è sicuramente l’individuazione della legge di distribuzione spaziale di tali parametri. Cioè, descrivere attraverso un modello la correlazione fra i valori assunti dalla variabile in diversi punti del dominio D. Al perseguimento di un tale obbiettivo contribuiscono:

- l’analisi esplorativa dei dati, mediante la quale si ottengono informazioni sulla media, sulla varianza campionaria e sulla normalità della distribuzione della popolazione;

- l’analisi strutturale con la quale, attraverso il variogramma, si individua la struttura della variabile campionata.

Il modo più esatto per ottenere l’accurato comportamento spaziale del parametro in esame, sarebbe stato quello di utilizzare la sua funzione di distribuzione di prob- abilità congiunta. Purtroppo, nella realtà una simile funzione è impossibile da conoscere, in quanto la sua determinazione richiederebbe la conoscenza di tutte le possibili realizzazioni. Al contrario, a nostra disposizione, abbiamo un’unica realizzazione, relativa al dominio della formazione naturale considerata, e per di più in un numero limitato di punti. Pertanto, per superare tali impedimenti, ed identificare dall’unica realizzazione esistente le statistiche dell’insieme, dobbiamo invocare alcune assunzioni:

6

stazionarietà: Proprietà statistica di un processo stocastico a rimanere stazionario o costante nello spazio. Una più precisa definizione di stazionarietà può essere fornita da:

Il processo, Z(x), dicesi strettamente stazionario se, per qualsiasi insieme di punti x1, x2, . . . , xn e qualsiasi distanza di separazione h, la distribuzione di probabilità congiunta {Z(x1), Z(x2), . . . , Z(xn)} è identica con la distribuzione di probabilità congiunta di {Z(x1 + h), Z(x2 + h), . . . , Z(xn + h)}.

La stazionarietà strictu sensu è un’assunzione molto forte ed esiste raramente nella maggior parte dei processi naturali. Per attenuare tale ipotesi si è introdotto il concetto di processo di stazionarietà del secondo ordine.

Stazionarietà di 2o ordine: Un processo Z(x), si dice avere una stazionarietà di secondo ordine se i primi due momenti statistici sono invarianti rispetto allo spazio, ovvero se:

1. Il valore atteso E[Z(x)] esiste e non dipende dalla posizione x

E[Z(x)] = m, ∀x ∈ D (5)

2. Per ogni coppia [Z(x), Z(x+ h)] la covarianza esiste e dipende solo dal vettore di separazione h,

Cov(x, x+ h) = Cov(h) = E[Z(x+ h) · Z(x)]−m2 ∀x ∈ D (6)

L’esistenza della funzione covarianza implica che per |h| → 0 il valore della covarianza Cov(0) esiste ed ha un valore finito, coincidente con la varianza di Z(x) (varianza a priori), che ugualmente è invariante per traslazione:

Cov(x, x+ h) = E[Z(x) · Z(x)]−m2 = Cov(0) ∀x ∈ D, |h| → 0 (7)

7

La stazionarietà della covarianza implica, per conseguenza, anche la staziona- rietà del semivariogramma:

γ(h) = 1

2 E [( Z(x)− Z(x+ h)

)2] =

1

2 E [( Z(x)

)2] +

1

2 E [( Z(x+ h)

)2]− E[Z(x)Z(x+ h)] =

1

2 E [( Z(x)

)2] +

1

2 E [( Z(x+ h)

)2]− E[Z(x)Z(x+ h)]−m2 +m2 =

1

2

{ E [( Z(x)

)2]−m2}+ 1 2

{ E [( Z(x+ h)

)2]−m2} − E

[ Z(x)Z(x+ h)

] +m2

= 1

2 Cov(0) +

1

2 Cov(0)− Cov(h)

= Cov(0)− Cov(h) (8)

Tale relazione indica che, se Z è un processo stazionario di secondo ordine, il variogramma è correlato con la funzione covarianza. In questo caso, infatti, il variogramma è un immagine specchiata della covarianza.

Figura 1: Covarianza e variogramma

Ipotesi intrinseca: E’ meno forte rispetto all’ipotesi di stazionarietà del secondo ordine. Riguarda fenomeni caratterizzati da VR che non hanno una varianza finita, possiedono cioè una infinita capacità di dispersione nello spazio, ma

8

che nonostante ciò, la varianza degli incrementi del 1o ordine di Z(x) è finita e tali incrementi godono a loro volta della stazionarietà di 2o ordine. Una FA Z(x) si dice soddisfi l’ipotesi intrinseca se :

1. Il valore atteso è costante ma non specificato [Kitanidis, 1997]:

E[Z(x+ h)− Z(x)] = 0 ∀x ∈ D (9)

2. Per una generica coppia di punti il quadrato dell’incremento dipende solo dalla distanza fra i due punti e non da x:

γ(h) = 1

2 E[ ( (Z(x+ h)− Z(x)

)2 ] ∀x ∈ D (10)

La differenza fra la stazionarietà del 2o ordine e l’ipotesi intrinseca è sottile ma importante. Innanzitutto, la caratterizzazione di una funzione aleatoria stazionaria fino al 2o ordine richiede maggior informazione rispetto ad una funzione aleatoria per cui è valida l’ipotesi intrinseca: 1) per entrambe il valore atteso è costante, ma nell’ipotesi intrinseca non è necessario conoscerne il valore, 2) la funzione covarianza può essere ricavata dal variogramma solo se si conosce il suo comportamento oltre il range, ovvero se si conosce la varianza dispersiva, mentre il variogramma può essere utilizzato anche senza conoscerne la varianza.

La stazionarietà del secondo ordine sottintende l’ipotesi intrinseca, ma il contrario non è vero. Notiamo, infine, che la stazionarietà è una proprietà che riguarda il modello e non i dati, pertanto è incombenza del modella- tore definire l’estensione del dominio D, all’interno del quale il fenomeno sotto esame può essere considerato stazionario. Tale dominio, detto anche vicinaggio di stazionarietà, sarà indicato con Ds.

Ergodicità: Come già detto, nelle applicazioni relative al moto delle acque sot- terranee nei mezzi porosi si incontra una singola realizzazione del mezzo ed il concetto di insieme o popolazione è piuttosto astratto. In questo caso l’in- sieme riflette meramente l’incertezza nella descrizione della struttura spaziale di una data formazione piuttosto che un set di formazioni simili costituen- ti l’insieme (Dagan [1989]). Pertanto, la caratterizzazione statistica di una struttura random si deve basare sull’informazione contenuta in una singola realizzazione. Quindi, se limitiamo l’informazione ai primi due momenti, il

9

valore atteso e la covarianza devono essere ricavati dalle medie spaziali piut- tosto che dalle medie d’insieme. Ciò è possibile se e solo se qualche tipo di stazionarietà prevale e se l’ipotesi di ergodicità è soddisfatta. La definizione rigorosa di ergodicità è fuori dal nostro scopo, ma intuitivamente parlando, possiamo dire che l’ipotesi di ergodicità per un sistema implica che tutti gli stati dell’insieme sono presenti in ogni realizzazione.

Questo implica che dalle osservazioni della variabile spaziale di una singola realizzazione è possibile determinare proprietà statistiche del processo per tutte le realizzazioni3. Tale ipotesi è tanto più valida quanto maggiore è la dimensione del campione.

Poichè generalmente è presente solo una singola realizzazione, l’ipotesi er- godica non può essere rigorosamente verificata. L’assunzione di base è che l’ipotesi di ergodicità è soddisfatta se la varianza della media spaziale tende a zero.

3Immaginiamo di avere dei misuratori di livello idrico posizionati in tre punti distinti nel mare. Dopo un dato periodo di tempo si disporrà di tre insiemi di misure di livello idrico (L) di cui sarà possibile calcolare la media e la covarianza. Se è valida l’ipotesi di stazionarietà il valore atteso deve essere costante E[L(x)] = mL e la covarianza dipendere solo dalla distanza fra i vari punti CovL(x, x+h) = CovL(h). Altres̀ı, se avessimo una sola ed unica misura di livello idrico, l’ipotesi di ergodicità ci permetterebbe di affermare che la media d’insieme trovata coincide con la media spaziale ottenuta mediante la singola e unica misura di livello a disposizione mL = E[L1, L2, L3].

10

2 Analisi strutturale

Rappresenta il passo più delicato e importante di uno studio geostatistico. Consiste essenzialmente nel calcolo e nell’interpretazione dei variogrammi sperimentali. Il comportamento del variogramma deve rispondere ad un requisito di continuità spaziale, intesa come piccole variazioni della grandezza considerata per piccole distanze di campionamento. Sulla base dei dati disponibili, l’individuazione di tale continuità e la determinazione del modello che meglio la rappresenta, costituiscono l’obiettivo dell’analisi strutturale.

2.1 Variogramma sperimentale

L’espressione più comunemente usata, è quella proposta da [Matheron, 1970]:

γ(h) = 1

2N(h)

N(h)∑ i=1

[ Z(xi)− Z(xi + h)

]2 (11)

dove h appartiene a classi di distanze in cui viene diviso l’intervallo pari alla massima distanza tra i punti campionari xi all’interno di Ds, ed N(h) e il numero di coppie la cui distanza e compresa nell’intervallo considerato. Le distanze fra le coppie di punti campione sono rappresentate sull’asse delle ascisse ed etichettate con la lettera h; le medie delle differenze elevate al quadrato relative a tutte le coppie ad uguale distanza sono rappresentate sull’asse delle ordinate ed etichettate con la lettera greca γ(h). Il grafico cosi costruito prende il nome di variogramma sperimentale.

Nella pratica della determinazione dei variogrammi sperimentali spesso si è costretti ad operare delle approssimazioni. Un problema che si incontra sempre è legato al numero di coppie di valori ad una data distanza h. Infatti raramente nei casi reali, si dispone di siti di campionamento disposti su griglie regolari; in genere questi sono disposti casualmente sul territorio. Questa casualità nella disposizione dei punti di campionamento produce una variabilità pressoché continua del vet- tore h sul territorio considerato. Per ovviare a questa inevitabile casualità nella disposizione dei punti di campionamento, in pratica, si specifica una tolleranza sia sul modulo di h che sulla sua direzione.

Fondamentalmente l’analisi variografica è svolta a evidenziare: 1) il compor- tamento all’origine dei variogrammi stessi, 2) la presenza di anisotropie, 3) la presenza di più scale di variabilità e 4) lo studio dei rapporti delle variabili alle diverse scale

11

2.1.1 Possibili forme di γ(h) per l’identificazione del modello

Dall’ispezione visiva del variogramma sperimentale, è possibile definire quale tipo di stazionarietà sia più adeguata al suo andamento. I profili possibili di γ(h) che si incontrano nelle analisi geostatistiche sono i seguenti:

(a) Rappresentato da una curva che cresce al crescere della distanza tendendo a stabilizzarsi intorno ad un sill, in corrispondenza di valori di h maggiori del range. Per esso si ipotizza un’ipotesi di stazionarietà in tutto il dominio di osservazione.

(b) Profilo che si attesta su un sill che si mantiene costante fino ad una certa distanza per poi crescere indefinitamente. Il tipo di ipotesi adeguata è quel- la di stazionarietà circoscritta ad un dominio spaziale, interno a quello di osservazione, definito dalla distanza h alla quale il sill rimane costante.

(c) Descritto da un andamento lineare che non raggiunge mai un valore di soglia. In tali casi l’ipotesi più appropriata è quella intrinseca.

(d) L’andamento del variogramma è parabolico e non esiste un valore soglia. In tal caso occorre rimuovere l’ipotesi di stazionarietà e analizzare il fenomeno con tecniche geostatistiche non-stazionarie.

In figura 2 vengono mostrate le quattro situazioni su elencate.

2.2 Comportamento nell’origine

Il comportamento nell’origine del variogramma è responsabile della dispersione al- la piccola scala della variabile di studio. Esso può essere discontinuo, lineare o parabolico e indica, rispettivamente, un andamento di tipo discontinuo, continuo ma non derivabile o derivabile, il tutto in media quadratica, della VR. La dis- continuità nell’origine è chiamata effetto pepita (nugget effect). L’effetto pepita è dovuto essenzialmente a due fattori: 1) la densità del campionamento e 2) gli errori di misura.

Una campagna di misure scarsamente addensata, determina, a scale inferiori alla minima distanza tra i punti di misura, una rappresentazione discontinua del comportamento della VR. Cioè, a scale inferiori alla minima distanza tra i cam- pioni, si manifestano numerose strutture spaziali che, alla scala del variogramma sperimentale, è impossibile riconoscere separatamente; si coglie solo l’effetto col- lettivo prodotto: nugget effect. L’altra causa provocante la comparsa di un effetto

12

Figura 2: Profili tipo di γ(h)

pepita è costituita dagli errori di misura. Infatti, l’errore di misura, pur non avendo un carattere spaziale, può essere visto come una componente Zu(x) della variabile Z(x). Pertanto il variogramma di quest’ultima comprende anche il variogramma degli errori di misura, che essendo spazialmente indipendenti, sono rappresentati da un variogramma pepitico.

2.3 Strutture annidate

E’ consueto nella pratica riscontrare nell’andamento di un variogramma sperimen- tale con sill variazioni di pendenza. Il cambiamento di pendenza è un segno che il variogramma sperimentale è costituito dalla sovrapposizione di più variogrammi elementari, aventi diversi valori di range, ed i cambiamenti di pendenza si verificano in corrispondenza dei ranges dei variogramma elementari. Ciò appare evidente os- servando lo schema di composizione di variogrammi elementari di figura 6. Questo vuol dire che il fenomeno è caratterizzato da più strutture di variabilità, ognuna operante alla scala spaziale, o temporale, espressa dal range del variogramma ele- mentare corrispondente. Si dimostra facilmente che una variabile che presenta un variogramma con più strutture spaziali può essere considerata la risultante della

13

Figura 3: Variogramma con effetto pepita

somma di più componenti indipendenti, dette appunto componenti spaziali. In pratica, se:

Z(x) = ∑ u

Zu(x)

e le Zu(x) sono indipendenti, si avrà che:

γ(h) = ∑ u

γu(h) (12)

con γu(h) si è indicata la componente strutturale u del variogramma γ(h) e con Zu(x) si è indicata la componente spaziale u della variabile Z(x). In altre parole il variogramma di Z(x) è costituito dalla somma dei variogrammi delle componenti- variabili Zu(x). Il sill di ogni componente spaziale rappresenta la dispersione della variabile che compete a quella scala. Un variogramma con più strutture di vari- abilità è chiamato nella terminologia geostatistica annidato (nested), ad indicare che le strutture di variabilità, a scala progressiva, sono inscatolate l’una dentro l’altra.

2.4 Anisotropie

La variabilità dei parametri che descrivono i fenomeni ambientali è influenzata da fattori strutturali che spesso agiscono in forma anisotropa, cioè con modalità e

14

Figura 4: Sovrapposizione di variogrammi elementari

caratteristiche dipendenti dalle direzioni dello spazio. Come conseguenza, si avrà che anche i parametri coinvolti nei processi avranno carattere anisotropo. Ecco il motivo per cui nella funzione variogramma è stato introdotto il vettore h. Per esempio, la percentuale di sabbia di un deposito fluviale presenta, trasversalmente all’asse del fiume, una variabilità maggiore che non lungo l’asse; in un processo di sedimentazione, la variabilità litologica lungo la verticale si presenta general- mente più accentuata che non nelle direzioni del piano orizzontale; e cosi tanti altri esempi si possono enunciare. Poiché i variogrammi misurano in termini quantita- tivi la variabilità spaziale di un parametro, accade quindi spesso di imbattersi in variogrammi sperimentali, che mostrano un comportamento anisotropo. In geosta- tistica si conoscono due tipi di anisotropie: zonale o geometrica. La prima ha luogo quando la variabilità, misurata dal sill, si presenta particolarmente accentuata in una determinata direzione, detta per l’appunto direzione di zonalità. Il secondo tipo di anisotropia ha luogo invece quando il grado di variabilità è lo stesso in tutte le direzioni, ma ciò che varia, rispetto ad esse, è il range, cioè la distanza alla quale tale variabilità complessiva viene raggiunta.

2.5 Individuazione del variogramma-modello

L’obbiettivo dell’analisi strutturale di un set di dati consiste nella determinazione di una funzione analitica γ(h), che ben modella il comportamento spaziale reale della variabile considerata. Cioè, dagli andamenti dei variogrammi sperimentali, è necessario identificare una funzione matematica ammissibile che meglio interpre- ta tali diagrammi sperimentali. Ammissibili perché la funzione modello non può essere qualsiasi, ma deve rispettare determinate condizioni che sono da associare

15

Figura 5: Esempio di variogrammi con anisotropia zonale

Figura 6: Esempio di variogrammi con anisotropia geometrica [de Marsily, 1986]

16

all’applicabilità degli strumenti (Kriging) forniti dalla geostatistica. In tale para- grafo vengono elencate le proprietà matematiche di γ(h), e presentati i modelli ammissibili adottati per il fitting del variogramma sperimentale.

2.5.1 Proprietà di γ(h)

La funzione variogramma possiede le seguenti proprietà:

1. è una funzione definita positiva

γ(h) ≥ 0

2. è una funzione pari

γ(h) = γ(−h)

3. nel caso di stazionarietà è legato alla covarianza dalla seguente relazione

γ(h) = Cov(0)− Cov(h)

4. il variogramma all’infinito cresce meno velocemente di h2

lim |h|→inf

γ(h)

|h|2 = 0

5. deve dare origine a combinazioni lineari autorizzate, ovvero le combinazioni lineari nelle quali partecipano per l’applicazione del Kriging devono ammet- tere una varianza finita.

2.6 Modelli di variogramma

Per modello s’intende una funzione matematica continua che rappresenta adeguata- mente il grafico del variogramma sperimentale, garantendo il rispetto di tutte le proprietà prima elencate. Nella letteratura geostatistica i modelli più comune- mente utilizzati nelle applicazioni pratiche sono i seguenti [de Marsily, 1986; Ki- tanidis, 1997]:

17

Modello sferico É rappresentato da una curva crescente fino alla scala di corre- lazione λ. Dopo la scala di correlazione le differenze quadratiche medie non cambiano e la curva, raggiunta la varianza (σ2), rimane costante. É un va- riogramma caratteristico di dati con aree d’influenza ben sviluppate e buona continuità. La formula che ne regola l’andamento è la seguente:

γ(h) = σ2 (

1.5 h

λ − 0.5

(h λ

)3) ∀h ≤ λ

γ(h) = σ2 ∀h ≥ λ (13)

In questo caso la varianza σ2 coincide con il sill (c) mentre la scala di corre- lazione λ è pari al range (a). Tale simbologia viene mantenuta anche per gli altri modelli.

Figura 7: Modello di variogramma sferico

Modello esponenziale É descritto da una curva che cresce al crescere delle dis- tanze senza raggiungere il valore della varianza, ovvero lo raggiunge solo asintoticamente. É caratteristico di dati che hanno una limitata area entro

18

cui si manifestano le relazioni d’influenza oppure che mostrano una elevata distanza di continuità. La sua legge è la seguente:

γ(h) = σ2 (

1− e− 3h λ

) (14)

Anche in questo caso il sill coincide con la varianza mentre il range è pari a 3λ.

Figura 8: Modello di variogramma esponenziale

Modello gaussiano É rappresentato da una curva che inizialmente cresce lenta- mente con la distanza. Da una certa distanza in poi, il tasso di crescita è accelerato, assestandosi sul valore della varianza ad un ben definito valore della scala di correlazione. É caratteristico di dati con una elevata presenza di tendenza che si manifesta a piccola scala e, nello stesso tempo, un al- to livello di continuità regionale. La formula che regola tale modello è la seguente:

γ(h) = σ2 (

1− e−( h λ)

2) (15)

19

Al solito il sill (c) coincide con la varianza, mentre il range(a) è pari a √

3λ.4

Il Gaussiano è l’unico modello che ha un andamento parabolico all’origine, ciò sta ad indicare che esso rappresenta una VR che è abbastanza smooth da essere differenziabile.

Figura 9: Modello di variogramma gaussiano

Modello potenza É descritto da una curva che evidenzia una crescita delle dif- ferenze quadratiche medie al crescere delle distanze. La formula è la seguente:

γ(h) = ωhs 0 ≤ s ≥ 2 (16)

Come si può notare in figure (10) il comportamento di γ(h) all’origine varia con s. Se s ≤ 1 il variogramma ha una concavità verso il basso, se s = 1 il modello potenza coincide con il modello lineare ed il variogramma diventa una retta di coefficiente angolare pari a ω , mentre per s ≥ 1 il variogram- ma presena una concavità verso l’alto. Tali modelli sono caratterizzati da una dispersione spaziale non limitata. Non possono essere usati per FA stazionarie di 2o ordine.

4Secondo Deutsch and Journel [1992] il modello gaussiano è γ(h) = σ2 (

1− e−( 3h λ )

2) .

20

Figura 10: Modello di variogramma potenza

Modello effetto pepita É descritto da una funzione del tipo:

γ(h) = 0 ∀h ≥ 0 γ(h) = c0 se h = 0 (17)

dove c0 è la varianza di nugget.

Come si può notare in figure (11) il comportamento di γ(h) è quello di puro effetto pepita. Poichè per definizione ogni variogramma modello può essere ottenuto mediante sue combinazioni lineari, il modello effetto pepita può essere utilizzato o da solo o, come più frequentemente accade, sommato ad altri variogrammi modello per tenere conto delle discontinuità all’origine.

Nella pratica, generalmente, variogrammi descriventi la struttura spaziale di una funzione, sono formati da combinazioni di più variogrammi elementari (strut- ture annidate). Pertanto, il modello da utilizzare viene fuori da una procedura di identificazione, che mira a scomporre il variogramma nelle sue strutture elementari, fornendo di ognuna i parametri che le caratterizzano.

21

Figura 11: Modello di variogramma effetto pepita

I parametri relativi all’anisotropia sono differenti a seconda del tipo incontrato. Nel caso di quella geometrica in un piano, dove si evidenzia una variabilità identica nelle due direzioni ortogonali, ma con differenti scale di correlazione, il range può essere visto come il raggio vettore di un ellisse. L’asse maggiore e minore dell’ellisse sono rispettivamente il massimo e il minimo range (figura 12). In questo caso i parametri sono:

• l’angolo Φg che la direzione di massimo range forma con l’asse x1 del sistema di riferimento assegnato.

• il rapporto A tra il minimo range e quello massimo.

Nel caso di anisotropia zonale dove la variabilità spaziale è più marcata in una specifica direzione (di zonalità); equivalente ad una anisotropia geometrica dove l’asse minore dell’ellisse è trascurabile rispetto a quello maggiore figura 13, l’unico parametro caratterizzante è l’angolo Φz che la direzione di zonalità forma con l’asse x1.

É, comunque, da sottolineare il fatto che una procedura di identificazione del variogramma modello, esposta qui in modo molto semplice e schematica, nella realtà necessita di una grande esperienza e sensibilità da parte del variografo.

22

Figura 12: Anisotropia geometrica

Figura 13: Anisotropia zonale

23

3 Il Paradigma del Kriging

Nelle applicazioni geostatistiche, subito dopo la modellazione dei variogrammi e la determinazione dei corrispondenti parametri, è possibile procedere alla stima dei valori nei punti non noti usando il metodo del Kriging. Esso consiste nella risoluzione di un sistema di equazioni lineari, dove si introduce il modello prob- abilistico di variabilità spaziale fornito dall’analisi strutturale, al fine di calcolare l’incertezza e l’intervallo di affidabilità delle stime.

3.1 Ordinary Kriging

Il Kriging è spesso associato all’acronimo inglese B.L.U.E., che sta per Best Linear Unbiased Estimated, cioè stimatore ottimale, lineare e corretto [Delhomme, 1978]. E’ uno stimatore ottimale dato che tende a minimizzare la varianza (σ2R ) degli errori di stima, lineare in quanto le sue stime sono combinazioni lineari pesate di dati noti e infine corretto perché cerca di produrre stime tali che la media dell’errore sia nulla. Di seguito si assume che per la VR sia valida l’ipotesi intrinseca, ovvero

1. Il valore atteso è costante ma non specificato [Kitanidis, 1997]:

E[Z(x+ h)− Z(x)] = 0 ∀x ∈ D (18)

2. Per una generica coppia di punti il quadrato dell’incremento dipende solo dalla distanza fra i due punti e non da x:

γ(h) = 1

2 E[ ( (Z(x+ h)− Z(x)

)2 ] ∀x ∈ D (19)

Lo stimatore lineare, nel punto incognito x0 5, è rappresentato dalla seguente

espressione:

Z∗0 = n∑

i=1

λiZi

dove Zi sono le n osservazioni sperimentali e λi sono i coefficienti ponderatori o pesi 6.

5per semplicità di notazione nel seguito si scriverà Z0 al posto di Z(x0) 6a rigore occorrerebbe scrivere λ0i in quanto i pesi variano al variare della posizione in cui si

stima la variabile Z(x0), tuttavia per ragione di semplicità si ometterà l’apice e si scriverà λi

24

non sono stati rilasciati commenti
Questa è solo un'anteprima
3 pagine mostrate su 30 totali
Scarica il documento