























Study with the several resources on Docsity
Earn points by helping other students or get them with a premium plan
Prepare for your exams
Study with the several resources on Docsity
Earn points to download
Earn points by helping other students or get them with a premium plan
La definizione classica di probabilità secondo laplace, la definizione di variabili aleatorie discrete e continue, e il calcolo del valore medio per variabili aleatorie discrete e continue. Vengono inoltre fornite le definizioni di varianza e deviazione standard. Il documento include esempi di calcolo del valore medio per una variabile aleatoria discreta (lancio di un dado) e continua.
Typology: Study notes
1 / 31
This page cannot be seen from the preview
Don't miss anything!
























LABORATORIO DI FISICA – INGEGNERIA "La Sapienza" Prof. A. Sciubba
Prima di introdurre il concetto di probabilità analizziamo la definizione di evento : consideriamo tutte le possibili modalità con cui si può presentare un qualsiasi fenomeno, per esempio i 37 risultati possibili nel gioco della roulette: ognuno di essi può essere considerato un elemento di uno spazio S che li contenga tutti (diagrammi di Venn).
I sottoinsiemi di S (p.es. tutti i numeri pari; tutti i numeri verdi; tutti i numeri superiori a 24) sono eventi composti determinati dal concorso di uno o più eventi elementari (consistenti ciascuno in un solo elemento dello spazio S); p.es. nel gioco della roulette l'evento "dispari" è rappresentato dagli eventi elementari corrispondenti all'uscita dei numeri 1, 3, 5, ..., 35. Eventi composti possono avere elementi in comune (il numero 28 è pari e è "superiore a 24" e "non verde"); in caso contrario si dicono incompatibili o mutuamente esclusivi. Analogamente, gli eventi elementari possono appartenere a più eventi composti.
Se un insieme di eventi contiene tutti gli eventi elementari, tale insieme si dice completo.
Lo spazio S può contenere anche un numero infinito di eventi elementari come nel caso in cui questi rappresentino tutti i possibili risultati di una misura; p.es. di una lunghezza, di una massa, di un tempo.
Di tutti i possibili eventi definibili nello spazio S, in questi cenni elementari di teoria delle probabilità, siamo interessati solo alla categoria dei sottoinsiemi disgiunti che definiscono gli eventi incompatibili o mutuamente esclusivi (p.es. "pari" e "dispari" sono eventi mutuamente esclusivi: non hanno nessun elemento in comune; invece "rosso" e "dispari" hanno eventi elementari in comune ).
Qualora gli eventi non siano incompatibili è possibile, almeno in linea di principio, ricondurli ad eventi incompatibili. Per chiarire il concetto consideriamo la figura:
Gli eventi A e B non sono incompatibili perché hanno degli eventi elementari in comune: tutti gli eventi appartenenti all'intersezione C = A ∩ B. Per riportarli ad eventi incompatibili consideriamo i tre eventi: A' = A - C = A - (A ∩ B) B' = B - C = A - (A ∩ B) C = A ∩ B.
Nel caso di eventi non incompatibili può avere importanza la domanda: qual è la probabilità che si verifichi l'evento A subordinata al fatto che si è verificato l'evento B? Questo tipo di calcolo è leggermente più complesso (probabilità condizionate) e diventa indispensabile per una trattazione avanzata dell'analisi dei dati sperimentali che non affronteremo in questo corso elementare.
EVENTI MUTUAMENTE ESCLUSIVI, INDIPENDENTI, O ...
Va prestata molta attenzione alla definizione di eventi incompatibili e indipendenti:
Sorvoliamo per il momento sul fatto che questa definizione di probabilità si fondi sul concetto di equiprobabilità e analizziamo come esempio il lancio di un dado a 6 facce. Se il dado non è truccato nessun numero verrà preferito all'altro ( equiprobabilità ).
In queste condizioni possiamo applicare la definizione e calcolare, per esempio, la probabilità che esca un numero pari (^1 ). I casi favorevoli (numero pari) sono rappresentati da 2, 4, 6 e i casi totali da 1, 2, 3, 4, 5, 6; abbiamo 3 casi favorevoli su 6 possibili: quindi la probabilità di ottenere un numero pari è
2
1 6
(^3) = = 50% come potevamo aspettarci intuitivamente in base alla nostra esperienza. Dalla definizione si può notare come la probabilità sia un numero compreso fra 0 (nessun caso favorevole) e 1 (tutti gli eventi possibili sono favorevoli): 0 ≤≤≤≤ p ≤≤≤≤ 1.
Anche se è impossibile definire la probabilità nel caso di eventi elementari non equiprobabili (per esempio un dado truccato) la definizione classica è spesso molto utile. Possiamo per esempio calcolare facilmente la probabilità di un evento elementare: nel caso del dado a 6 facce l'uscita di un particolare numero corrisponde ad un evento elementare mentre abbiamo 6 casi possibili; la probabilità che esca un numero particolare è 61. Quindi:
P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 61.
Come altro esempio consideriamo il lancio di 3 monete e chiediamoci quale sia la probabilità di ottenere 2 e solo 2 facce uguali. Indichiamo con T testa e C croce. Tutti i possibili risultati sono costituiti da: TTT TTC TCT TCC CTT CTC CCT CCC. Abbiamo quindi 6 casi favorevoli su 8 possibili e la probabilità del nostro evento è pari a 86
(bisogna prestare molta attenzione nel contare i casi favorevoli e quelli possibili; per esempio TTC, TCT e CTT sono 3 eventi diversi anche se contengono lo stesso numero di T e C).
In generale, utilizzando la definizione classica di probabilità è immediato calcolare la probabilità di verificarsi di eventi composti: esaminiamo nuovamente la figura e calcoliamo la probabilità che si verifichi l'evento A o l'evento B (unione).
(^1) I possibili risultati del lancio {1, 2, 3, 4, 5, 6} sono eventi elementari (non sono scomponibili in eventi più semplici); un risultato pari è invece un evento non elementare perché è rappresentato da più eventi elementari {2}, {4}, {6}.
Supponiamo che l'evento A sia costituito da nA eventi elementari, l'evento B da nB eventi
elementari, che l'intersezione di A e B contenga nC eventi elementari e che lo spazio S sia costituito da nT eventi elementari.
P(AoB) = P(A∪B) =
nA+nB-nC nT =
nA nT +
nB nT -
nC nT = P(A) + P(B) - P(A∩B).
Nel caso quindi di eventi incompatibili, cioè quando P(A∩B)=0, la probabilità di A o B è semplicemente P(A∪B) = P(A) + P(B).
Anche se è impossibile definire la probabilità nel caso di eventi elementari non equiprobabili (per esempio un dado truccato) la definizione classica è spesso molto utile: la tecnica si riduce a un opportuno conteggio di eventi; per questo motivo sarà spesso utile ricorrere al calcolo combinatoriale(^2 ).
Definizione frequentistica di probabilità (Venn)
Eseguiamo più volte lo stesso esperimento e, per semplificare l’analisi del fenomeno, dopo ogni misura riportiamo il sistema nelle condizioni iniziali. In queste condizioni ogni risultato è indipendente da tutti gli altri. Analizziamo ora la frazione di volte in cui si presenta un particolare risultato. Come esempio consideriamo il lancio di una moneta(^3 )^ e riportiamo in un grafico in ascissa il numero di lanci e in ordinata il rapporto fra il numero di volte ( frequenza ) in cui esce testa e il numero di lanci effettuati ( frequenza relativa ):
n(T) n(T)+n(C)
n(T)+n(C) Come si può notare, nei primissimi lanci la frequenza relativa varia notevolmente perché per diversi lanci di seguito può uscire sempre testa o sempre croce (chiameremo questa variazione fluttuazione statistica ). Dopo circa una cinquantina di lanci, tuttavia, s'inizia a vedere una tendenza verso il valore 50% mentre l'ampiezza delle fluttuazioni diminuisce (possiamo facilmente immaginare che una lunga sequenza di sole teste o sole croci accada molto raramente).
(^2) Per alcuni richiami al calcolo combinatoriale vedere l'appendice (^3) Gli esempi di questo paragrafo sono stati ottenuti da una simulazione al calcolatore.
La definizione frequentistica di probabilità consente di risolvere il problema di eventi non equiprobabili (dado truccato) ma obbliga ad eseguire, qualora sia possibile, un numero elevato di misure (metodo a posteriori).
Come esercizio si provi a lanciare almeno una ventina di volte due monete e si osservi l'andamento della frequenza relativa con la quale si osserva testa in almeno una delle due monete. Si confronti poi il risultato ottenuto con quanto è prevedibile in base alla definizione classica della probabilità.
Definizione assiomatica di probabilità (Kolmogorov)
Seguendo la recente teoria assiomatica la probabilità viene definita sulla base dei seguenti assiomi e proprietà:
al verificarsi di ogni evento E viene associato un numero non negativo 0 ≤ p(E) ≤ 1 che viene definito probabilità
se p(E) = 1 l'evento E è certo
se due eventi E 1 e E 2 rispettivamente con probabilità p(E 1 ) e p(E 2 ) di realizzarsi sono mutuamente esclusivi (o incompatibili: se si verifica uno non si verifica l'altro (^4 )^ ) la probabilità che si verifichi l'evento E 1 o E 2 è:
L'assioma 3) e la proprietà 4) consentono di calcolare la probabilità in molti casi. In generale: se le p(Ei ) sono uguali (eventi equiprobabili), il calcolo coincide con quello della definizione classica.
Come esempio si calcoli la probabilità che nel lancio di un dado si ottenga un particolare risultato E 1.
Poiché tale evento è incompatibile con gli altri 5 casi (eventi E 2 E 3 E 4 E 5 E 6 ), per il terzo
assioma risulta: p(E 1 o E 2 o E 3 o E 4 o E 5 o E 6 ) = p(E 1 ) + p(E 2 ) + p(E 3 ) + p(E 4 ) + p(E 5 ) + p(E 6 )
Per il secondo assioma si ha che: p(E 1 o E 2 o E 3 o E 4 o E 5 o E 6 ) = 1 (^5 ).
Nell'ipotesi che le p(Ei ) siano uguali (equiprobabilità): 6 p(Ei ) = 1 da cui si ottiene p(E (^) i ) = 61.
(^4) Ciò significa che gli eventi E 1 e E 2 o sono eventi elementari o sono eventi composti che non hanno eventi elementari in comune. (^5) E (^) 1, E 2 , E 3 , E (^) 4, E 5 e E 6 , rappresentando tutti gli eventi elementari dello spazio dei risultati del lancio di un dado, costituiscono un insieme completo di eventi; è certo che si verifichi uno di tali risultati.
VARIABILI ALEATORIE
Consideriamo nuovamente lo spazio S degli eventi; in base a quanto visto finora siamo in grado di associare ad ogni evento, elementare o non, una probabilità. Parallelamente può essere possibile associare ad ogni evento dello spazio S un numero: se gli eventi rappresentano delle misure, i numeri da associare possono essere i risultati numerici di tali misure; se gli eventi elementari di S rappresentano le 6 facce di un dado è naturale associare ad ogni faccia il numero di punti che vi sono riportati - ma potremmo associarvi anche il quadrato di tale numero o la superficie totale dei punti che sono riportati su ogni faccia; nel caso delle lotterie a certe combinazioni di numeri si associano dei valori in denaro; … ).
Se è possibile mettere in corrispondenza tutti gli eventi relativi ad un particolare fenomeno con dei numeri in modo tale che agli eventi E 1 , E 2 , ..., EN corrispondano i numeri
x 1 , x 2 , ..., x (^) N allora:
si definisce variabile aleatoria (v.a.) la variabile X = {x (^1) , x 2 , ..., x (^) N}.
È quindi ovvio il significato di variabile aleatoria: si tratta di una variabile che assume particolari valori non in base a leggi deterministiche ma al caso.
Se la corrispondenza è tra gli elementi di S e una parte o tutti i numeri naturali si parla di variabile aleatoria discreta. Se invece è necessario un insieme continuo di numeri reali la variabile aleatoria è detta continua (come spesso accade qualora S rappresenti lo spazio dei risultati di misure).
Poiché ad ogni elemento di S si può associare una probabilità, data la corrispondenza fra gli eventi Ei di S e i valori xi assunti da X, si può parlare tanto di
probabilità associata dell'evento Ei quanto di probabilità associata alla possibilità che X assuma il valore x (^) i : P(Ei ) = P(X=x (^) i ).
Può tornare utile definire, sia nel caso discreto sia in quello continuo, una funzione cumulativa della variabile aleatoria X che rappresenta la probabilità che la v.a. X sia minore o uguale ad un particolare valore x:
i i
P x = P(X ≤ x).
x
∫ ∞
= P(X ≤ x).
Per esempio, nel caso della distribuzione uniforme di una variabile aleatoria discreta la F(x) e' una funzione a gradini (di altezza uguale, pari a P) che vale 0 per ogni X minore del più piccolo valore possibile della variabile aleatoria e vale 1 per ogni X maggiore o uguale al più grande valore possibile.
Per esempio nel caso della distribuzione uniforme di una variabile aleatoria continua definita fra a e b , la F(x) è una funzione triangolare che vale 0 per ogni valore di X minore di
a , cresce linearmente fra a e b con pendenza b a
e vale 1 per x ≥ b.
Dalle definizioni della funzione cumulativa si ha che: F(- ∞) = 0 (la probabilità che la X non assuma nessun valore è nulla); F(∞) = 1 (la probabilità che la X assuma un qualsiasi valore è 1).
Tramite la funzione cumulativa è molto semplice calcolare la probabilità che la variabile aleatoria sia compresa in un certo intervallo. Nel caso continuo, per esempio, la probabilità che X sia compresa fra x 1 e x 2 vale:
P (x 1 ≤ X ≤ x 2 ) = f(x')dx'
2
1
x
x
∫ =^ f(x^ ')^ dx'
x 2 ∫ −∞
x 1 f x'dx'= F(x 2 ) - F(x 1 );
analogamente nel caso di v.a. discrete: P (x 1 ≤ X ≤ x 2 ) = (^) ∑ x 1 ≤ xi≤x 2
P( xi )= (^) ∑ −∞ ≤xi ≤x 2
P( xi ) - (^) ∑ −∞ ≤xi ≤x 1
P( xi )= F(x 2 ) - F(x 1 ).
Dall'esempio è chiara l'utilità della funzione cumulativa: una volta definita non è più necessario distinguere fra v.a. discrete e continue.
RIASSUNTI DI UNA DISTRIBUZIONE
Spesso di una distribuzione di probabilità di una variabile aleatoria discreta o di una funzione di distribuzione di una variabile aleatoria continua (in generale diremo di una distribuzione) non è tanto importante conoscere la probabilità per ogni valore o intervallo di valori di X quanto alcuni valori caratteristici che riassumono tale distribuzione: per esempio il valore più probabile, un valore che indichi quanto la distribuzione sia simmetrica rispetto ad un valore centrale, ecc.).
VALOR MEDIO
Data una variabile aleatoria X discreta con distribuzione di probabilità P(X) si definisce valore atteso o speranza matematica o valore medio o media (da non confondersi con la media aritmetica (^7 )) della variabile aleatoria X la somma:
( (^) i) ognix
xi Px i
∑
Analogamente, nel caso di una v.a. continua con densità di probabilità f(x), si definisce valore atteso (o media) l'integrale esteso a tutto il campo S di definizione di X:
xf ( x) dx S
∫
Il significato di tali espressioni è quello di una media effettuata pesando ogni valore della variabile aleatoria con la probabilità che essa assuma quel valore (analogia con il baricentro in meccanica dove le distanze vengono pesate con le masse).
Simbolicamente il valore atteso della v.a. X si indica con E(X) (da "Expectation value", cioè valore previsto)(^8 ).
Avremo in seguito bisogno di calcolare anche il valor medio non della variabile X ma di una sua funzione g(X). Tale valor medio E[g(X)] è pari alla somma su tutti i valori di X della quantità g(x (^) i ) P(xi ):
E[g(X)] = g(x )P(x) ognixi
∑ i i
e nel caso continuo E[g(X)] = g(x)f(x)dx S
∫
In generale indicheremo con m il valore atteso della variabile aleatoria X:
m = E(X) è un riassunto della distribuzione di X
(^7) La media è un riassunto di una distribuzione che è possibile calcolare quando sia nota la distribuzione di probabilità (calcolo delle probabilità); la media aritmetica è il risultato di un calcolo statistico che si effettua sui dati di un campione di risultati; solo per popolazione infinita la media aritmetica tende (probabilisticamente) alla media. (^8) Dal punto di vista dimensionale E(X) è il prodotto di X per una probabilità, quindi E(X) ha le dimensioni di X.
In generale indicheremo(^11 )^ con σσσσ^2 la varianza della v.a. X :
σσσσ^2 = σσσσ^2 (X) è un riassunto della distribuzione di X
Spesso sarà utile ricordare che:
σσσσ^2 (X) = E{[X - E(X)] 2 } = E[X^2 - 2 X E(X) + E(X)^2 ] = E(X^2 - 2 X m + m^2 ) =
= E(X^2 ) - 2 m E(X) + m^2 = E(X^2 ) - m^2.
e analogamente
σσσσ^2 [g(X)] = E{[g(X)^2 - 2 g(X) E[g(X)] + E[g(X)] 2 } =
= E[g(X)^2 ] -2 E[g(X)] 2 + E[g(X)] 2 = E[g(X)^2 ] - E[g(X)]^2.
di un dado: σ^2 = E{(X – m)^2 } = (^ −^26 ,^5 ) + (−^16 ,^5 ) +(−^06 ,^5 ) +^0 , 65 +^1 , 65 +^26 ,^5 =^176 ,^5 =
(^222222) 12
35
o alternativamente σ^2 = E(X^2 ) – m^2 = 61 + 64 + 69 +^166 +^256 +^366 −( ) 272 = 916 − 494 = 1235
2 ∫
∞
−∞
x b
a
2 ∫ - m
3(b-a)
b 3 - a^3 - 2
a +b^2
12
b - a^2
Analizziamo alcune proprietà della σ^2 (X) ricordando che non è un’operazione lineare (sommatoria o integrale del quadrato di uno scarto):
DEVIAZIONE STANDARD o scarto quadratico medio
Spesso è più comodo utilizzare al posto della varianza σ^2 di una distribuzione la sua radice quadrata σ detta deviazione standard o scarto quadratico medio che ha le stesse dimensioni fisiche della variabile aleatoria(^12 ).
σ= σ^2
(^11) Non è stata fissata una convenzione per i simboli da utilizzare per la media e la varianza: altri autori utilizzano E(X) e Var(X) (^12) Come vedremo in seguito la deviazione standard è legata alla larghezza della distribuzione intorno alla media: più è grande la deviazione standard e maggiore è la quantità di risultati che distano dalla media. Perché una distribuzione di probabilità non può avere deviazione standard nulla?
Si definisce variabile ridotta o standardizzata o scarto standardizzato la variabile:
σ
X− m
che ha la caratteristica di essere adimensionale,
di avere valore atteso nullo: E( σ
σ
E X− m = 0
e varianza unitaria: σ^2 (Z) = E[(Z-0)^2 ] =E(Z^2 )=E
σ
σ
− 2
X m^2
E[X m^2 ] σ
Per esempio nel caso di una v.a. X con distribuzione uniforme fra a e b è: z =
12
b a
2
a b x −
− .
••• Come esempio dell'uso dei riassunti di una distribuzione consideriamo nuovamente la distribuzione uniforme di una variabile aleatoria continua compresa fra a e b e chiediamoci quale sia la probabilità che X assuma un valore compreso fra m - σ e m + σ.
Si tratta di calcolare (^) ∫ ( )
−
m σ
m σ
f xdx con m = 2
a + b e σ = 12
b − a ;
poiché nell'intervallo in esame f(x) vale b a
∫^ (^ )
−
m σ
m σ
f xdx = b a
2 σ −
Questo risultato è valido in generale: indipendentemente dai valori assunti da a e b , nel caso di una distribuzione uniforme, la variabile aleatoria X è compresa nel 57,7 % dei casi nell'intervallo [m - σ; m + σ].
Ovviamente lo stesso risultato si può ottenere utilizzando la variabile ridotta:
f(x)dx
m+ σ
m- σ
∫ =^ b-adx
m+ σ 1
m- σ
∫ =^ b-adz
(^1) σ
∫ =^12 dz
∫ =^3
Nel seguito chiameremo intervallo di confidenza un intervallo, per esempio [m - σ; m + σ], della variabile aleatoria e livello di confidenza la probabilità P(m - σ < X < m + σ) ad esso associato. Vedremo che, come nel caso della distribuzione uniforme, in un intervallo di semiampiezza σ centrato intorno al valore medio è compreso più del 50% della probabilità.
Le quantità (2) e (3) (^) ∑ ( ) m− Kσ≤x≤m+Kσ
i i
P x e f( x) dx
mK σ
mK σ
∫
−
rappresentano la probabilità che la variabile
aleatoria X ha di essere compresa nell'intervallo [m - K σ ; m + K σ]. La disuguaglianza di Chebychev può essere quindi letta nel seguente modo:
P ( x− m≤Kσ) ≥ 2 K
1 −^1
Dalla disuguaglianza segue, cioè, che pur non conoscendo la distribuzione della X è possibile calcolare dei limiti inferiori per i livelli di confidenza :
K P( x− m≤Kσ) ≥ 1 0 1,5 55,6 % 2 75,0 % 2,5 84,0 % 3 88,9 % 4 93,7 % 5 96,0 %
Da qui segue l'importanza di conoscere almeno la media e la varianza di una distribuzione: sono sufficienti a fornire, anche da sole, notevoli informazioni.
Qualora fosse nota la distribuzione di X sarebbe possibile calcolare esattamente i livelli di confidenza e il risultato sarebbe superiore ai valori ottenuti da Chebychev (per esercizio si confronti la tabella con quanto ricavabile da una distribuzione uniforme e dalla distribuzione di Gauss).
IL CASO DI PIÙ VARIABILI ALEATORIE
Nell'elaborazione dei dati relativi ai risultati di misure molto spesso si avrà bisogno di considerare funzioni di più variabili aleatorie. Estendiamo quindi alcuni dei concetti finora acquisiti al caso di più variabili aleatorie. Per semplicità ci limiteremo al caso in cui queste sono tutte variabili continue (l'estensione al caso di variabili discrete e a quello di variabili sia continue sia discrete è ovvia). Sempre per semplicità consideriamo solo il caso di due v.a.; l'estensione a più variabili è immediata.
Si definisce distribuzione di probabilità congiunta (evento AND) di due variabili aleatorie (e analogamente nel caso di più v.a.) la probabilità che, contemporaneamente (^13 ), ciascuna v.a. assuma un particolare valore:
Nota la f(x,y) è possibile calcolare la distribuzione marginale della v.a. X cioè la distribuzione di probabilità della v.a. X senza nessuna richiesta sui valori assunti dalla v.a. Y:
f(x) = (^) ∫ SY
f (x,y)dy;
analogamente la distribuzione marginale della Y è f(y) = (^) ∫ SX
f (x,y)dx.
Calcoliamo ora il valore atteso di X:
E(X) = (^) ∫∫ SX SY
x f(x,y)dxdy = x f(x,y)dy dx SX SY
∫ ∫ (^)
= xf(x)dx SX
∫ =^ mx.
Analogamente per la varianza di X:
σσσσ 2222 (X) = (^) ∫∫ ( − ) SX S Y
2 x mX f(x,y)dxdy= ( x m ) f(x,y)dy dx SX SY
2 ∫ X ∫ (^)
− = ( x m ) f(x)dx SX
2 ∫ −^ X =^ σσσσ^
2222 X
Esaminiamo alcune proprietà delle operazioni di valore atteso e varianza. Per semplicità considereremo solo il caso di 2 v.a. (X e Y con, rispettivamente, media mx e
my e varianza σ^2 x e σ^2 y) essendo ovvia l'estensione al caso della combinazione lineare di
più variabili.
(^13) La contemporaneità non va intesa in senso temporale stretto ma col significato di valori assunti dalle v.a. nello stesso evento.
Se il procedimento di misura non ha alterato la grandezza fisica in misura (p.es. errore di inserzione trascurabile) le Xi rappresentano N v.a. indipendenti con media m e varianza σ^2. La media aritmetica delle xi quindi altri non è che la combinazione lineare delle N v.a.
indipendenti Xi con coefficienti tutti uguali a (^) N^1.
Pertanto, applicando i risultati ottenuti nel caso di una generica combinazione lineare, si ottengono le relazioni:
( ) ( ) ∑ ∑ ∑
∑ = = = =
= m N
m N N
m N
x E N
x E X E i i i
il valore atteso della media aritmetica di N valori di X coincide col valore atteso di X
( ) ( ) ( ) ( )
( ) N
x N
x N
x X
2 2 2
2 i 2
2 2
i
2 2 i (^2) = σ = σ = σ =σ
=^ σ
σ = σ ∑ ∑ ∑ ∑
la varianza della media aritmetica è N volte più piccola della varianza di X.
B) la varianza di una funzione di più v. a. indipendenti
Analizziamo una qualsiasi funzione di più v.a. indipendenti Y = g(X 1 ,X 2 ,...,XN) e calcoliamone la varianza σ^2 (Y) in funzione delle σ^2 (Xi ).
Poiché utilizzeremo il risultato in modo approssimativo, calcoliamo lo sviluppo in serie di Taylor di Y nell'intorno dei valori medi mi di Xi Y = g(X 1 , X 2 , ..., XN) =
i=1,N i m
X m X
g (^) − ∂
∂ ∑ +^ X X (X^ m)(X^ m)^ ...
g 2
1 i i j j i jm
2
i,j=1,N
− − + ∂ ∂
∂ ∑
dove le derivate sono calcolate nel punto m: {X 1 = m 1 , X 2 = m 2 , ..., XN = m (^) N}.
Arrestando lo sviluppo al primo termine (cosa lecita se la funzione è linearizzabile nell'intorno del punto m), si ottiene:
− ∂
σ ∂ ∑ i i i=1,N im
1 2 N (^2) X m X
i i 2 i=1,N
2
im
X m X
g (^) σ −
∂
∂ ∑ =
i=1,N
2
im
X X
g σ
∂
∂ ∑
Se, invece, la funzione Y = g(X 1 , X 2 , ..., XN) è lineare si ottiene in modo esatto:
i=1,N
2
i m
X X
g σ
∂
∂ ∑.
(^16) Qui è stato sfruttato il fatto che la varianza di una combinazione lineare di v.a. indipendenti è uguale alla combinazione lineare delle varianze con i coefficienti al quadrato
C) la formula di propagazione delle incertezze (incertezza standard combinata)
Ogni volta che eseguiamo misure derivate di grandezze fisiche abbiamo bisogno di stimare come l'incertezza nella determinazione dei valori delle grandezze fisiche Xi misurate direttamente si ripercuota sull'indeterminazione della misura derivata Y = f(X1, X2, …, XN).
In generale, per ogni grandezza Xi , avremo calcolato la media aritmetica di una serie di misure. Avremo anche stimato la deviazione standard di X (^) i calcolando la deviazione standard sperimentale della media aritmetica (incertezza di tipo A). A volte, invece, avremo a disposizione una sola misura e quindi la stima dell'incertezza sarà limitata all'incertezza di tipo B.
Per semplicità di notazione in entrambi i casi chiamiamo X (^) i la migliore stima di Xi e
σ (^) S (Xi)la migliore stima della loro incertezza: Xi = X (^) i± σ (^) S(Xi)
Incertezze assolute
Utilizziamo per la funzione Y = f(X1, X2, …, XN) la relazione ricavata in precedenza
σ^2 (Y) ≈ 2 ( (^) i) i=1,N
2
im
σ X X
f ∑ (^)
e sostituiamo ai valori attesi e alle varianze delle v.a. Xi le
migliori stime che possiamo ricavare sperimentalmente:
Y = (^ )^ S^2 (^ i)
2
i 1 ,N i
1 2 N X σ X
f f X,X , ,X X
∑ =
dove con X abbiamo indicato il punto X = {X^1 ,X 2 ,...,XN}.
propagazione delle incertezze assolute
Incertezze relative
Supponiamo, e in laboratorio vedremo che è un caso frequentissimo, che la funzione Y = f(X1, X2, …, XN) sia espressa sotto forma di un monomio: Y = c X 1 p 1 Xp 22 ...XpNN.
Applichiamo la formula di propagazione delle incertezze assolute iniziando a calcolare i
coefficienti di sensibilità Xi
f ∂
= c X 1 p 1 Xp 22 ...piXpii−^1 ...XpNN= i
i X
p.
i 1 , N
i
2
2
i
i σ (X) X
i 1 , N
2
i
2 i i X
σ(X) p.
Passando alle incertezze relative: Y
σs (Y) = (^) ∑ =
i 1 , N
2
i
2 i i X
σ(X) p e sostituendo ai valori attesi e
alle varianze delle v.a. Xi le migliori stime che possiamo ricavare sperimentalmente:
σs (Y) = (^) ∑ =
i 1 , N
2
i
2 s i i (^) X
σ (X) p
propagazione delle incertezze relative (valida solo per monomi)