Definizione e calcolo di probabilità, variabili aleatorie e valore medio, Study notes of Mathematics

La definizione classica di probabilità secondo laplace, la definizione di variabili aleatorie discrete e continue, e il calcolo del valore medio per variabili aleatorie discrete e continue. Vengono inoltre fornite le definizioni di varianza e deviazione standard. Il documento include esempi di calcolo del valore medio per una variabile aleatoria discreta (lancio di un dado) e continua.

Typology: Study notes

2022/2023

Uploaded on 12/21/2023

lara-gigliola-guener
lara-gigliola-guener 🇹🇷

1 document

1 / 31

Toggle sidebar

This page cannot be seen from the preview

Don't miss anything!

bg1
LABORATORIO DI FISICA – INGEGNERIA "La Sapienza" Prof. A. Sciubba
PROBABILITÀ
E
EL
LE
EM
ME
EN
NT
TI
I
D
DI
I
T
TE
EO
OR
RI
IA
A
D
DE
EL
LL
LE
E
P
PR
RO
OB
BA
AB
BI
IL
LI
IT
TÀ
À
(come ragionare quantitativamente in condizioni di incertezza)
LO SPAZIO DEGLI EVENTI
Prima di introdurre il concetto di probabilità analizziamo la definizione di evento:
consideriamo tutte le possibili modalità con cui si può presentare un qualsiasi fenomeno, per
esempio i 37 risultati possibili nel gioco della roulette: ognuno di essi può essere considerato
un elemento di uno spazio S che li contenga tutti (diagrammi di Venn).
I sottoinsiemi di S (p.es. tutti i numeri pari; tutti i numeri verdi; tutti i numeri superiori
a 24) sono eventi composti determinati dal concorso di uno o più eventi elementari
(consistenti ciascuno in un solo elemento dello spazio S); p.es. nel gioco della roulette
l'evento "dispari" è rappresentato dagli eventi elementari corrispondenti all'uscita dei numeri
1, 3, 5, ..., 35.
Eventi composti possono avere elementi in comune (il numero 28 è pari e è "superiore a 24"
e "non verde"); in caso contrario si dicono incompatibili o mutuamente esclusivi.
Analogamente, gli eventi elementari possono appartenere a più eventi composti.
Se un insieme di eventi contiene tutti gli eventi elementari, tale insieme si dice
completo.
Lo spazio S può contenere anche un numero infinito di eventi elementari come nel
caso in cui questi rappresentino tutti i possibili risultati di una misura; p.es. di una lunghezza,
di una massa, di un tempo.
Di tutti i possibili eventi definibili nello spazio S, in questi cenni elementari di teoria
delle probabilità, siamo interessati solo alla categoria dei sottoinsiemi disgiunti che
definiscono gli eventi incompatibili o mutuamente esclusivi (p.es. "pari" e "dispari" sono
eventi mutuamente esclusivi: non hanno nessun elemento in comune; invece "rosso" e
"dispari" hanno eventi elementari in comune ).
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f

Partial preview of the text

Download Definizione e calcolo di probabilità, variabili aleatorie e valore medio and more Study notes Mathematics in PDF only on Docsity!

LABORATORIO DI FISICA – INGEGNERIA "La Sapienza" Prof. A. Sciubba

PROBABILITÀ

EL ELEEMMEENNTTII DDII

TETEOORRIIAA DDEELLLLEE PPRROOBBAABBIILLIITTÀÀ

(come ragionare quantitativamente in condizioni di incertezza)

LO SPAZIO DEGLI EVENTI

Prima di introdurre il concetto di probabilità analizziamo la definizione di evento : consideriamo tutte le possibili modalità con cui si può presentare un qualsiasi fenomeno, per esempio i 37 risultati possibili nel gioco della roulette: ognuno di essi può essere considerato un elemento di uno spazio S che li contenga tutti (diagrammi di Venn).

I sottoinsiemi di S (p.es. tutti i numeri pari; tutti i numeri verdi; tutti i numeri superiori a 24) sono eventi composti determinati dal concorso di uno o più eventi elementari (consistenti ciascuno in un solo elemento dello spazio S); p.es. nel gioco della roulette l'evento "dispari" è rappresentato dagli eventi elementari corrispondenti all'uscita dei numeri 1, 3, 5, ..., 35. Eventi composti possono avere elementi in comune (il numero 28 è pari e è "superiore a 24" e "non verde"); in caso contrario si dicono incompatibili o mutuamente esclusivi. Analogamente, gli eventi elementari possono appartenere a più eventi composti.

Se un insieme di eventi contiene tutti gli eventi elementari, tale insieme si dice completo.

Lo spazio S può contenere anche un numero infinito di eventi elementari come nel caso in cui questi rappresentino tutti i possibili risultati di una misura; p.es. di una lunghezza, di una massa, di un tempo.

Di tutti i possibili eventi definibili nello spazio S, in questi cenni elementari di teoria delle probabilità, siamo interessati solo alla categoria dei sottoinsiemi disgiunti che definiscono gli eventi incompatibili o mutuamente esclusivi (p.es. "pari" e "dispari" sono eventi mutuamente esclusivi: non hanno nessun elemento in comune; invece "rosso" e "dispari" hanno eventi elementari in comune ).

Qualora gli eventi non siano incompatibili è possibile, almeno in linea di principio, ricondurli ad eventi incompatibili. Per chiarire il concetto consideriamo la figura:

Gli eventi A e B non sono incompatibili perché hanno degli eventi elementari in comune: tutti gli eventi appartenenti all'intersezione C = A ∩ B. Per riportarli ad eventi incompatibili consideriamo i tre eventi: A' = A - C = A - (A ∩ B) B' = B - C = A - (A ∩ B) C = A ∩ B.

Nel caso di eventi non incompatibili può avere importanza la domanda: qual è la probabilità che si verifichi l'evento A subordinata al fatto che si è verificato l'evento B? Questo tipo di calcolo è leggermente più complesso (probabilità condizionate) e diventa indispensabile per una trattazione avanzata dell'analisi dei dati sperimentali che non affronteremo in questo corso elementare.

EVENTI MUTUAMENTE ESCLUSIVI, INDIPENDENTI, O ...

Va prestata molta attenzione alla definizione di eventi incompatibili e indipendenti:

  • i possibili risultati di un lancio di un dado sono eventi incompatibili: o esce l'1 o il 2 o...il 6;
  • il risultato di un lancio e il successivo sono indipendenti;
  • nel lancio di un dado l'uscita di un numero pari e del numero 3 sono eventi incompatibili;
  • l'uscita di un numero pari e del numero 2 non sono né eventi indipendenti (anzi, se esce il 2 sicuramente il risultato è pari) né eventi esclusivi (se esce pari può uscire il numero 2); la trattazione di questo tipo di eventi richiede l'introduzione del concetto di probabilità condizionata.

Sorvoliamo per il momento sul fatto che questa definizione di probabilità si fondi sul concetto di equiprobabilità e analizziamo come esempio il lancio di un dado a 6 facce. Se il dado non è truccato nessun numero verrà preferito all'altro ( equiprobabilità ).

In queste condizioni possiamo applicare la definizione e calcolare, per esempio, la probabilità che esca un numero pari (^1 ). I casi favorevoli (numero pari) sono rappresentati da 2, 4, 6 e i casi totali da 1, 2, 3, 4, 5, 6; abbiamo 3 casi favorevoli su 6 possibili: quindi la probabilità di ottenere un numero pari è

2

1 6

(^3) = = 50% come potevamo aspettarci intuitivamente in base alla nostra esperienza. Dalla definizione si può notare come la probabilità sia un numero compreso fra 0 (nessun caso favorevole) e 1 (tutti gli eventi possibili sono favorevoli): 0 ≤≤≤≤ p ≤≤≤≤ 1.

Anche se è impossibile definire la probabilità nel caso di eventi elementari non equiprobabili (per esempio un dado truccato) la definizione classica è spesso molto utile. Possiamo per esempio calcolare facilmente la probabilità di un evento elementare: nel caso del dado a 6 facce l'uscita di un particolare numero corrisponde ad un evento elementare mentre abbiamo 6 casi possibili; la probabilità che esca un numero particolare è 61. Quindi:

P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = 61.

Come altro esempio consideriamo il lancio di 3 monete e chiediamoci quale sia la probabilità di ottenere 2 e solo 2 facce uguali. Indichiamo con T testa e C croce. Tutti i possibili risultati sono costituiti da: TTT TTC TCT TCC CTT CTC CCT CCC. Abbiamo quindi 6 casi favorevoli su 8 possibili e la probabilità del nostro evento è pari a 86

(bisogna prestare molta attenzione nel contare i casi favorevoli e quelli possibili; per esempio TTC, TCT e CTT sono 3 eventi diversi anche se contengono lo stesso numero di T e C).

In generale, utilizzando la definizione classica di probabilità è immediato calcolare la probabilità di verificarsi di eventi composti: esaminiamo nuovamente la figura e calcoliamo la probabilità che si verifichi l'evento A o l'evento B (unione).

(^1) I possibili risultati del lancio {1, 2, 3, 4, 5, 6} sono eventi elementari (non sono scomponibili in eventi più semplici); un risultato pari è invece un evento non elementare perché è rappresentato da più eventi elementari {2}, {4}, {6}.

Supponiamo che l'evento A sia costituito da nA eventi elementari, l'evento B da nB eventi

elementari, che l'intersezione di A e B contenga nC eventi elementari e che lo spazio S sia costituito da nT eventi elementari.

P(AoB) = P(A∪B) =

nA+nB-nC nT =

nA nT +

nB nT -

nC nT = P(A) + P(B) - P(A∩B).

Nel caso quindi di eventi incompatibili, cioè quando P(A∩B)=0, la probabilità di A o B è semplicemente P(A∪B) = P(A) + P(B).

Anche se è impossibile definire la probabilità nel caso di eventi elementari non equiprobabili (per esempio un dado truccato) la definizione classica è spesso molto utile: la tecnica si riduce a un opportuno conteggio di eventi; per questo motivo sarà spesso utile ricorrere al calcolo combinatoriale(^2 ).

Definizione frequentistica di probabilità (Venn)

Eseguiamo più volte lo stesso esperimento e, per semplificare l’analisi del fenomeno, dopo ogni misura riportiamo il sistema nelle condizioni iniziali. In queste condizioni ogni risultato è indipendente da tutti gli altri. Analizziamo ora la frazione di volte in cui si presenta un particolare risultato. Come esempio consideriamo il lancio di una moneta(^3 )^ e riportiamo in un grafico in ascissa il numero di lanci e in ordinata il rapporto fra il numero di volte ( frequenza ) in cui esce testa e il numero di lanci effettuati ( frequenza relativa ):

n(T) n(T)+n(C)

n(T)+n(C) Come si può notare, nei primissimi lanci la frequenza relativa varia notevolmente perché per diversi lanci di seguito può uscire sempre testa o sempre croce (chiameremo questa variazione fluttuazione statistica ). Dopo circa una cinquantina di lanci, tuttavia, s'inizia a vedere una tendenza verso il valore 50% mentre l'ampiezza delle fluttuazioni diminuisce (possiamo facilmente immaginare che una lunga sequenza di sole teste o sole croci accada molto raramente).

(^2) Per alcuni richiami al calcolo combinatoriale vedere l'appendice (^3) Gli esempi di questo paragrafo sono stati ottenuti da una simulazione al calcolatore.

La definizione frequentistica di probabilità consente di risolvere il problema di eventi non equiprobabili (dado truccato) ma obbliga ad eseguire, qualora sia possibile, un numero elevato di misure (metodo a posteriori).

Come esercizio si provi a lanciare almeno una ventina di volte due monete e si osservi l'andamento della frequenza relativa con la quale si osserva testa in almeno una delle due monete. Si confronti poi il risultato ottenuto con quanto è prevedibile in base alla definizione classica della probabilità.

Definizione assiomatica di probabilità (Kolmogorov)

Seguendo la recente teoria assiomatica la probabilità viene definita sulla base dei seguenti assiomi e proprietà:

  1. al verificarsi di ogni evento E viene associato un numero non negativo 0 ≤ p(E) ≤ 1 che viene definito probabilità

  2. se p(E) = 1 l'evento E è certo

  3. se due eventi E 1 e E 2 rispettivamente con probabilità p(E 1 ) e p(E 2 ) di realizzarsi sono mutuamente esclusivi (o incompatibili: se si verifica uno non si verifica l'altro (^4 )^ ) la probabilità che si verifichi l'evento E 1 o E 2 è:

p(E 1 o E 2 ) = p(E 1 ) + p(E 2 ) (probabilità semplice o evento OR )

  1. se due eventi E 1 e E 2 rispettivamente con probabilità p(E 1 ) e p(E 2 ) di realizzarsi sono indipendenti statisticamente (l'accadere o meno di E 1 non altera la probabilità di verificarsi di E 2 ) la probabilità che si verifichino sia E 1 sia E 2 è:

p(E 1 e E 2 ) = p(E 1 ) x p(E 2 ) (probabilità composta o evento AND )

L'assioma 3) e la proprietà 4) consentono di calcolare la probabilità in molti casi. In generale: se le p(Ei ) sono uguali (eventi equiprobabili), il calcolo coincide con quello della definizione classica.

Come esempio si calcoli la probabilità che nel lancio di un dado si ottenga un particolare risultato E 1.

Poiché tale evento è incompatibile con gli altri 5 casi (eventi E 2 E 3 E 4 E 5 E 6 ), per il terzo

assioma risulta: p(E 1 o E 2 o E 3 o E 4 o E 5 o E 6 ) = p(E 1 ) + p(E 2 ) + p(E 3 ) + p(E 4 ) + p(E 5 ) + p(E 6 )

Per il secondo assioma si ha che: p(E 1 o E 2 o E 3 o E 4 o E 5 o E 6 ) = 1 (^5 ).

Nell'ipotesi che le p(Ei ) siano uguali (equiprobabilità): 6 p(Ei ) = 1 da cui si ottiene p(E (^) i ) = 61.

(^4) Ciò significa che gli eventi E 1 e E 2 o sono eventi elementari o sono eventi composti che non hanno eventi elementari in comune. (^5) E (^) 1, E 2 , E 3 , E (^) 4, E 5 e E 6 , rappresentando tutti gli eventi elementari dello spazio dei risultati del lancio di un dado, costituiscono un insieme completo di eventi; è certo che si verifichi uno di tali risultati.

VARIABILI ALEATORIE

Consideriamo nuovamente lo spazio S degli eventi; in base a quanto visto finora siamo in grado di associare ad ogni evento, elementare o non, una probabilità. Parallelamente può essere possibile associare ad ogni evento dello spazio S un numero: se gli eventi rappresentano delle misure, i numeri da associare possono essere i risultati numerici di tali misure; se gli eventi elementari di S rappresentano le 6 facce di un dado è naturale associare ad ogni faccia il numero di punti che vi sono riportati - ma potremmo associarvi anche il quadrato di tale numero o la superficie totale dei punti che sono riportati su ogni faccia; nel caso delle lotterie a certe combinazioni di numeri si associano dei valori in denaro; … ).

Se è possibile mettere in corrispondenza tutti gli eventi relativi ad un particolare fenomeno con dei numeri in modo tale che agli eventi E 1 , E 2 , ..., EN corrispondano i numeri

x 1 , x 2 , ..., x (^) N allora:

si definisce variabile aleatoria (v.a.) la variabile X = {x (^1) , x 2 , ..., x (^) N}.

È quindi ovvio il significato di variabile aleatoria: si tratta di una variabile che assume particolari valori non in base a leggi deterministiche ma al caso.

Se la corrispondenza è tra gli elementi di S e una parte o tutti i numeri naturali si parla di variabile aleatoria discreta. Se invece è necessario un insieme continuo di numeri reali la variabile aleatoria è detta continua (come spesso accade qualora S rappresenti lo spazio dei risultati di misure).

Poiché ad ogni elemento di S si può associare una probabilità, data la corrispondenza fra gli eventi Ei di S e i valori xi assunti da X, si può parlare tanto di

probabilità associata dell'evento Ei quanto di probabilità associata alla possibilità che X assuma il valore x (^) i : P(Ei ) = P(X=x (^) i ).

FUNZIONE CUMULATIVA

Può tornare utile definire, sia nel caso discreto sia in quello continuo, una funzione cumulativa della variabile aleatoria X che rappresenta la probabilità che la v.a. X sia minore o uguale ad un particolare valore x:

  • v.a. discreta F(x) = (^) ∑ ( ) x≤x

i i

P x = P(X ≤ x).

  • variabile aleatoria continua F(x) = f(x')dx'

x

∫ ∞

= P(X ≤ x).

Per esempio, nel caso della distribuzione uniforme di una variabile aleatoria discreta la F(x) e' una funzione a gradini (di altezza uguale, pari a P) che vale 0 per ogni X minore del più piccolo valore possibile della variabile aleatoria e vale 1 per ogni X maggiore o uguale al più grande valore possibile.

Per esempio nel caso della distribuzione uniforme di una variabile aleatoria continua definita fra a e b , la F(x) è una funzione triangolare che vale 0 per ogni valore di X minore di

a , cresce linearmente fra a e b con pendenza b a

e vale 1 per x ≥ b.

Dalle definizioni della funzione cumulativa si ha che: F(- ∞) = 0 (la probabilità che la X non assuma nessun valore è nulla); F(∞) = 1 (la probabilità che la X assuma un qualsiasi valore è 1).

Tramite la funzione cumulativa è molto semplice calcolare la probabilità che la variabile aleatoria sia compresa in un certo intervallo. Nel caso continuo, per esempio, la probabilità che X sia compresa fra x 1 e x 2 vale:

P (x 1 ≤ X ≤ x 2 ) = f(x')dx'

2

1

x

x

∫ =^ f(x^ ')^ dx'

x 2 ∫ −∞

  • (^) ∫ ( ) −∞

x 1 f x'dx'= F(x 2 ) - F(x 1 );

analogamente nel caso di v.a. discrete: P (x 1 ≤ X ≤ x 2 ) = (^) ∑ x 1 ≤ xi≤x 2

P( xi )= (^) ∑ −∞ ≤xi ≤x 2

P( xi ) - (^) ∑ −∞ ≤xi ≤x 1

P( xi )= F(x 2 ) - F(x 1 ).

Dall'esempio è chiara l'utilità della funzione cumulativa: una volta definita non è più necessario distinguere fra v.a. discrete e continue.

RIASSUNTI DI UNA DISTRIBUZIONE

Spesso di una distribuzione di probabilità di una variabile aleatoria discreta o di una funzione di distribuzione di una variabile aleatoria continua (in generale diremo di una distribuzione) non è tanto importante conoscere la probabilità per ogni valore o intervallo di valori di X quanto alcuni valori caratteristici che riassumono tale distribuzione: per esempio il valore più probabile, un valore che indichi quanto la distribuzione sia simmetrica rispetto ad un valore centrale, ecc.).

VALOR MEDIO

Data una variabile aleatoria X discreta con distribuzione di probabilità P(X) si definisce valore atteso o speranza matematica o valore medio o media (da non confondersi con la media aritmetica (^7 )) della variabile aleatoria X la somma:

( (^) i) ognix

xi Px i

Analogamente, nel caso di una v.a. continua con densità di probabilità f(x), si definisce valore atteso (o media) l'integrale esteso a tutto il campo S di definizione di X:

xf ( x) dx S

Il significato di tali espressioni è quello di una media effettuata pesando ogni valore della variabile aleatoria con la probabilità che essa assuma quel valore (analogia con il baricentro in meccanica dove le distanze vengono pesate con le masse).

Simbolicamente il valore atteso della v.a. X si indica con E(X) (da "Expectation value", cioè valore previsto)(^8 ).

Avremo in seguito bisogno di calcolare anche il valor medio non della variabile X ma di una sua funzione g(X). Tale valor medio E[g(X)] è pari alla somma su tutti i valori di X della quantità g(x (^) i ) P(xi ):

E[g(X)] = g(x )P(x) ognixi

∑ i i

e nel caso continuo E[g(X)] = g(x)f(x)dx S

In generale indicheremo con m il valore atteso della variabile aleatoria X:

m = E(X) è un riassunto della distribuzione di X

(^7) La media è un riassunto di una distribuzione che è possibile calcolare quando sia nota la distribuzione di probabilità (calcolo delle probabilità); la media aritmetica è il risultato di un calcolo statistico che si effettua sui dati di un campione di risultati; solo per popolazione infinita la media aritmetica tende (probabilisticamente) alla media. (^8) Dal punto di vista dimensionale E(X) è il prodotto di X per una probabilità, quindi E(X) ha le dimensioni di X.

In generale indicheremo(^11 )^ con σσσσ^2 la varianza della v.a. X :

σσσσ^2 = σσσσ^2 (X) è un riassunto della distribuzione di X

Spesso sarà utile ricordare che:

σσσσ^2 (X) = E{[X - E(X)] 2 } = E[X^2 - 2 X E(X) + E(X)^2 ] = E(X^2 - 2 X m + m^2 ) =

= E(X^2 ) - 2 m E(X) + m^2 = E(X^2 ) - m^2.

e analogamente

σσσσ^2 [g(X)] = E{[g(X)^2 - 2 g(X) E[g(X)] + E[g(X)] 2 } =

= E[g(X)^2 ] -2 E[g(X)] 2 + E[g(X)] 2 = E[g(X)^2 ] - E[g(X)]^2.

  • come esempio calcoliamo la varianza della distribuzione di probabilità nel caso del lancio

di un dado: σ^2 = E{(X – m)^2 } = (^ −^26 ,^5 ) + (−^16 ,^5 ) +(−^06 ,^5 ) +^0 , 65 +^1 , 65 +^26 ,^5 =^176 ,^5 =

(^222222) 12

35

o alternativamente σ^2 = E(X^2 ) – m^2 = 61 + 64 + 69 +^166 +^256 +^366 −( ) 272 = 916 − 494 = 1235

  • e nel caso di una distribuzione uniforme continua fra a e b :

σ^2 (X) = x f( )xdx

2 ∫

−∞

  • m^2 = dx b-a

x b

a

2 ∫ - m

2

3(b-a)

b 3 - a^3 - 2

a +b^2  

  

 = (^ )

12

b - a^2

Analizziamo alcune proprietà della σ^2 (X) ricordando che non è un’operazione lineare (sommatoria o integrale del quadrato di uno scarto):

  • σσσσ^2 (a) = E{[a - E(a)] 2 } = E[(a - a)^2 ] = 0
  • σσσσ^2 (a X+b) = E{[(a X+b)-E(a X+b)] 2 }=E{[(a X+b) - (a m+b)] 2 }= a^2 E[(X - m)^2 ] = a^2 σσσσ^2 (X)

DEVIAZIONE STANDARD o scarto quadratico medio

Spesso è più comodo utilizzare al posto della varianza σ^2 di una distribuzione la sua radice quadrata σ detta deviazione standard o scarto quadratico medio che ha le stesse dimensioni fisiche della variabile aleatoria(^12 ).

σ= σ^2

(^11) Non è stata fissata una convenzione per i simboli da utilizzare per la media e la varianza: altri autori utilizzano E(X) e Var(X) (^12) Come vedremo in seguito la deviazione standard è legata alla larghezza della distribuzione intorno alla media: più è grande la deviazione standard e maggiore è la quantità di risultati che distano dalla media. Perché una distribuzione di probabilità non può avere deviazione standard nulla?

VARIABILE RIDOTTA

Si definisce variabile ridotta o standardizzata o scarto standardizzato la variabile:

Z =

σ

X− m

che ha la caratteristica di essere adimensionale,

di avere valore atteso nullo: E( σ

X − m) = ( )

σ

E X− m = 0

e varianza unitaria: σ^2 (Z) = E[(Z-0)^2 ] =E(Z^2 )=E 

 

 

 

  

  

 σ

X − m^2 =E ( )

 

 

 

 σ

− 2

X m^2

= (^2 )

E[X m^2 ] σ

Per esempio nel caso di una v.a. X con distribuzione uniforme fra a e b è: z =

12

b a

2

a b x −

− .

••• Come esempio dell'uso dei riassunti di una distribuzione consideriamo nuovamente la distribuzione uniforme di una variabile aleatoria continua compresa fra a e b e chiediamoci quale sia la probabilità che X assuma un valore compreso fra m - σ e m + σ.

Si tratta di calcolare (^) ∫ ( )

m σ

m σ

f xdx con m = 2

a + b e σ = 12

b − a ;

poiché nell'intervallo in esame f(x) vale b a

∫^ (^ )

m σ

m σ

f xdx = b a

2 σ −

Questo risultato è valido in generale: indipendentemente dai valori assunti da a e b , nel caso di una distribuzione uniforme, la variabile aleatoria X è compresa nel 57,7 % dei casi nell'intervallo [m - σ; m + σ].

Ovviamente lo stesso risultato si può ottenere utilizzando la variabile ridotta:

f(x)dx

m+ σ

m- σ

∫ =^ b-adx

m+ σ 1

m- σ

∫ =^ b-adz

(^1) σ

  • 1

∫ =^12 dz

  • 1

∫ =^3

Nel seguito chiameremo intervallo di confidenza un intervallo, per esempio [m - σ; m + σ], della variabile aleatoria e livello di confidenza la probabilità P(m - σ < X < m + σ) ad esso associato. Vedremo che, come nel caso della distribuzione uniforme, in un intervallo di semiampiezza σ centrato intorno al valore medio è compreso più del 50% della probabilità.

Le quantità (2) e (3) (^) ∑ ( ) m− Kσ≤x≤m+Kσ

i i

P x e f( x) dx

mK σ

mK σ

rappresentano la probabilità che la variabile

aleatoria X ha di essere compresa nell'intervallo [m - K σ ; m + K σ]. La disuguaglianza di Chebychev può essere quindi letta nel seguente modo:

P ( x− m≤Kσ) ≥ 2 K

1 −^1

Dalla disuguaglianza segue, cioè, che pur non conoscendo la distribuzione della X è possibile calcolare dei limiti inferiori per i livelli di confidenza :

K P( x− m≤Kσ) ≥ 1 0 1,5 55,6 % 2 75,0 % 2,5 84,0 % 3 88,9 % 4 93,7 % 5 96,0 %

Da qui segue l'importanza di conoscere almeno la media e la varianza di una distribuzione: sono sufficienti a fornire, anche da sole, notevoli informazioni.

Qualora fosse nota la distribuzione di X sarebbe possibile calcolare esattamente i livelli di confidenza e il risultato sarebbe superiore ai valori ottenuti da Chebychev (per esercizio si confronti la tabella con quanto ricavabile da una distribuzione uniforme e dalla distribuzione di Gauss).

IL CASO DI PIÙ VARIABILI ALEATORIE

Nell'elaborazione dei dati relativi ai risultati di misure molto spesso si avrà bisogno di considerare funzioni di più variabili aleatorie. Estendiamo quindi alcuni dei concetti finora acquisiti al caso di più variabili aleatorie. Per semplicità ci limiteremo al caso in cui queste sono tutte variabili continue (l'estensione al caso di variabili discrete e a quello di variabili sia continue sia discrete è ovvia). Sempre per semplicità consideriamo solo il caso di due v.a.; l'estensione a più variabili è immediata.

Si definisce distribuzione di probabilità congiunta (evento AND) di due variabili aleatorie (e analogamente nel caso di più v.a.) la probabilità che, contemporaneamente (^13 ), ciascuna v.a. assuma un particolare valore:

d^2 P = d^2 P(x,y) = P[(x ≤ X < x + dx), (y ≤ Y < y + dy)] = f(x,y) dx dy

Nota la f(x,y) è possibile calcolare la distribuzione marginale della v.a. X cioè la distribuzione di probabilità della v.a. X senza nessuna richiesta sui valori assunti dalla v.a. Y:

f(x) = (^) ∫ SY

f (x,y)dy;

analogamente la distribuzione marginale della Y è f(y) = (^) ∫ SX

f (x,y)dx.

Calcoliamo ora il valore atteso di X:

E(X) = (^) ∫∫ SX SY

x f(x,y)dxdy = x f(x,y)dy dx SX SY

∫ ∫ (^) 

 

 

 

= xf(x)dx SX

∫ =^ mx.

Analogamente per la varianza di X:

σσσσ 2222 (X) = (^) ∫∫ ( − ) SX S Y

2 x mX f(x,y)dxdy= ( x m ) f(x,y)dy dx SX SY

2 ∫ X ∫ (^)  

− = ( x m ) f(x)dx SX

2 ∫ −^ X =^ σσσσ^

2222 X

Esaminiamo alcune proprietà delle operazioni di valore atteso e varianza. Per semplicità considereremo solo il caso di 2 v.a. (X e Y con, rispettivamente, media mx e

my e varianza σ^2 x e σ^2 y) essendo ovvia l'estensione al caso della combinazione lineare di

più variabili.

  • E(aX+bY+c) = ∫∫ (a x + b y + c) f(x,y) dx dy = = a ∫∫ x f(x,y) dx dy + b ∫∫ y f(x,y) dx dy + c ∫∫ f(x,y) dx dy = = a ∫x (∫ f(x,y) dy) dx + b ∫y (∫ f(x,y) dx) dy + c ∫∫ f(x,y) dx dy = = a ∫x f(x) dx + b ∫y f(y) dy + c 1 = a E(X) + b E(Y) + c = a mx + b mY + c (1)

(^13) La contemporaneità non va intesa in senso temporale stretto ma col significato di valori assunti dalle v.a. nello stesso evento.

Se il procedimento di misura non ha alterato la grandezza fisica in misura (p.es. errore di inserzione trascurabile) le Xi rappresentano N v.a. indipendenti con media m e varianza σ^2. La media aritmetica delle xi quindi altri non è che la combinazione lineare delle N v.a.

indipendenti Xi con coefficienti tutti uguali a (^) N^1.

Pertanto, applicando i risultati ottenuti nel caso di una generica combinazione lineare, si ottengono le relazioni:

( ) ( ) ∑ ∑ ∑

∑ = = = = 

^ =

= m N

m N N

m N

EX

N

x E N

x E X E i i i

il valore atteso della media aritmetica di N valori di X coincide col valore atteso di X

( ) ( ) ( ) ( )

( ) N

X

X

N

X N

N

x N

x N

N

x X

2 2 2

2 i 2

2 2

i

2 2 i (^2) = σ = σ = σ =σ 

=^ σ 

σ = σ ∑ ∑ ∑ ∑

la varianza della media aritmetica è N volte più piccola della varianza di X.

B) la varianza di una funzione di più v. a. indipendenti

Analizziamo una qualsiasi funzione di più v.a. indipendenti Y = g(X 1 ,X 2 ,...,XN) e calcoliamone la varianza σ^2 (Y) in funzione delle σ^2 (Xi ).

Poiché utilizzeremo il risultato in modo approssimativo, calcoliamo lo sviluppo in serie di Taylor di Y nell'intorno dei valori medi mi di Xi Y = g(X 1 , X 2 , ..., XN) =

= g(m 1 , m 2 , ..., m N) + ( i i)

i=1,N i m

X m X

g (^) − ∂

∂ ∑ +^ X X (X^ m)(X^ m)^ ...

g 2

1 i i j j i jm

2

i,j=1,N

− − + ∂ ∂

∂ ∑

dove le derivate sono calcolate nel punto m: {X 1 = m 1 , X 2 = m 2 , ..., XN = m (^) N}.

Arrestando lo sviluppo al primo termine (cosa lecita se la funzione è linearizzabile nell'intorno del punto m), si ottiene:

σσ^ σσ^2 (Y)^ ≈≈≈≈^ (^ )^ (^ )

 

 

 

 − ∂

σ ∂ ∑ i i i=1,N im

1 2 N (^2) X m X

g m,m ,...,m + g = (^16 )^ ( )

i i 2 i=1,N

2

im

X m X

g (^) σ − 

 

 

 

 ∂

∂ ∑ =

2 ( i)

i=1,N

2

im

X X

g  σ 

 

 

 ∂

∂ ∑

Se, invece, la funzione Y = g(X 1 , X 2 , ..., XN) è lineare si ottiene in modo esatto:

σ^2 (Y) =^2 ( i)

i=1,N

2

i m

X X

g  σ 

 

 

 ∂

∂ ∑.

(^16) Qui è stato sfruttato il fatto che la varianza di una combinazione lineare di v.a. indipendenti è uguale alla combinazione lineare delle varianze con i coefficienti al quadrato

C) la formula di propagazione delle incertezze (incertezza standard combinata)

Ogni volta che eseguiamo misure derivate di grandezze fisiche abbiamo bisogno di stimare come l'incertezza nella determinazione dei valori delle grandezze fisiche Xi misurate direttamente si ripercuota sull'indeterminazione della misura derivata Y = f(X1, X2, …, XN).

In generale, per ogni grandezza Xi , avremo calcolato la media aritmetica di una serie di misure. Avremo anche stimato la deviazione standard di X (^) i calcolando la deviazione standard sperimentale della media aritmetica (incertezza di tipo A). A volte, invece, avremo a disposizione una sola misura e quindi la stima dell'incertezza sarà limitata all'incertezza di tipo B.

Per semplicità di notazione in entrambi i casi chiamiamo X (^) i la migliore stima di Xi e

σ (^) S (Xi)la migliore stima della loro incertezza: Xi = X (^) i± σ (^) S(Xi)

Incertezze assolute

Utilizziamo per la funzione Y = f(X1, X2, …, XN) la relazione ricavata in precedenza

σ^2 (Y) ≈ 2 ( (^) i) i=1,N

2

im

σ X X

f ∑ (^)  

e sostituiamo ai valori attesi e alle varianze delle v.a. Xi le

migliori stime che possiamo ricavare sperimentalmente:

Y = (^ )^ S^2 (^ i)

2

i 1 ,N i

1 2 N X σ X

f f X,X , ,X X

∑ = 

dove con X abbiamo indicato il punto X = {X^1 ,X 2 ,...,XN}.

propagazione delle incertezze assolute

Incertezze relative

Supponiamo, e in laboratorio vedremo che è un caso frequentissimo, che la funzione Y = f(X1, X2, …, XN) sia espressa sotto forma di un monomio: Y = c X 1 p 1 Xp 22 ...XpNN.

Applichiamo la formula di propagazione delle incertezze assolute iniziando a calcolare i

coefficienti di sensibilità Xi

f ∂

= c X 1 p 1 Xp 22 ...piXpii−^1 ...XpNN= i

i X

Y

p.

Pertanto σs(Y) = (^) ∑

i 1 , N

i

2

2

i

i σ (X) X

Y

p = Y (^) ∑

i 1 , N

2

i

2 i i X

σ(X) p.

Passando alle incertezze relative: Y

σs (Y) = (^) ∑ =

i 1 , N

2

i

2 i i X

σ(X) p e sostituendo ai valori attesi e

alle varianze delle v.a. Xi le migliori stime che possiamo ricavare sperimentalmente:

Y

σs (Y) = (^) ∑ = 

i 1 , N

2

i

2 s i i (^) X

σ (X) p

propagazione delle incertezze relative (valida solo per monomi)