




























































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Calcolo delle probabilità, Sistemi di alternative, Cambi di variabile, Spazi di Hilbert, Processi stocastici, Catene di Markov, Processi di Markov a Salti, Serie Storiche, Analisi di Fourier, Software RStudio
Tipologia: Sbobinature
1 / 200
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





























































































P
restrizione, supponendo che I sia vera, la probabilità
che siano vere entrambe è
P(A e B|I) = P(A|I) ∙ P(B|I e A) = P(B|I) ∙ P(A|I e B)
Queste sono le regole intuitive, ossia regole minimali a cui seguono tante altre regole di calcolo.
Vediamone alcune:
Perché se A = ”c’è il sole” e B = non A = ”non c’è il sole”, siamo nella situazione di due eventi
incompatibili. Quindi quando andiamo a fare P(A oppure B) è sempre vera, ma quindi
P(A oppure B|I) = P(A|I) + P(B|I) = 1
Quindi questa regola è verificata per la Regola #0.
P(A oppure B|I) = P(A|I) + P(B|I) – P(A e B|I)
Ossia si deve togliere la probabilità che siano vere entrambe.
L’insieme A contiene tutti gli eventi in cui l’affermazione A è vera.
Lo stesso vale per l’insieme B.
L’idea di Kolmogorov è che c’è un collegamento tra la teoria dell’area e la probabilità.
Perché si pensa alla probabilità come un’area?
Perché questa formula della somma (in realtà anche quella del prodotto) si visualizzano bene in questo
modo, questo ha portato alcuni matematici, tra cui Kolmogorov, a dire che la probabilità è un caso
particolare di area.
Vediamo graficamente alcune informazioni:
Se scelgo (A e non B) e B sono incompatibili, poiché la prima contiene “non B” e la seconda “B”, quindi:
P[(A e non B) oppure B] = P(B|I) + P(A e non B|I)
Ci sono dei casi molto semplici in cui ci si deve accorgere immediatamente che qualcosa non va bene.
Per esempio:
due eventi A e B NON sono incompatibili;
escluso dalla formula e si deve procedere solo con la somma delle due probabilità;
Vediamo ora il cosiddetto approccio rigoroso , che è un approccio più matematico che consente anche di
fare un’operazione in più che è quella di passare al limite per opportuni parametri che tendono a 0 o
all’∞.
Kolmogorov si accorse che la probabilità si può porre all’interno di questa teoria di misura, misura
intesa come insiemi o aree.
Si propone quindi di metterla in forma rigorosa sulla base di alcuni assiomi:
essere abbastanza grande da contenere, tra i suoi elementi, tutte le possibili situazioni che
vogliamo considerare.
Es: lancio di un dado
Le affermazioni che andremo a considerare sono affermazioni che comprendono alcune di queste
eventualità.
Es:
A = “esce pari” A = ”T ∈ [20°; 30°]”
B = ”esce 3” B = ”T = 0°”
come
Es:
I = “ è uscito un numero maggiore di 2” = {3, 4, 5, 6}
Vogliamo calcolare la probabilità di A non rispetto la probabilità iniziale, ma sapendo I:
Questa affermazione esclude che due sia uscito.
Non abbiamo ancora detto qual è la probabilità iniziale P(I) in questo esempio, ma si può supporre.
Perché questi assiomi?
Perché si doveva fare una costruzione rigorosa.
Oss: le regole intuitive valgono nella teoria di Kolmogorov;
Oss: nella teoria si richiede anche che F sia una σ-algebra e p, la probabilità iniziale, sia σ-additiva ;
Queste sono due ipotesi con cui si può passare agevolmente al limite.
σ-algebra: se ho una famiglia infinita di eventi (A n
∈ F ) con n ∈ ℕ, anche ⋃
𝑛∈ℕ 𝑛
∈ F ;
σ-additiva è la cosa analoga per la probabilità p, ossia non è solo additiva quando abbiamo due eventi
incompatibili, o un numero finito di eventi incompatibili, ma anche se ne abbiamo infiniti di eventi e sono
a due a due incompatibili, la probabilità dell’unione è la somma delle probabilità.
Se A n
sono eventi a due a due incompatibili, allora 𝑃
𝑛∈ℕ 𝑛
𝑛
𝑛∈ℕ
Calcolo probabilità iniziale
Caso Discreto
Il nostro insieme universo Ω è un insieme discreto, cioè è un insieme che contiene un numero finito di
elementi w i
𝑖
𝑖= 1
𝑁
con N ∈ ℕ
In questo caso è molto facile definire una probabilità partendo da una densità discreta.
Densità discreta: funzione 𝜌 =
𝑖
𝑖= 1
𝑛
, ossia una famiglia di numeri associati a ciascuna di queste
eventualità p i,
Che proprietà deve avere?
Siccome sono probabilità che accadono singolarmente devono essere tutte 0 ≤ p i
≤ 1, si definisce poi la
probabilità associata a questa densità discreta:
𝑤 𝑖
𝑖
∈𝐴
ma ∑ 𝑝
𝑖
𝑁
𝑖= 1
Facciamo un esempio concreto.
Es: lancio del dado
Probabilità uniforme (quando tutti i p i
sono uguali): p i
Evento A
Se il dado è truccato in maniera tale che la probabilità che esca pari sia il doppio di quella che esca
dispari, vuol dire che un numero pari ha il doppio delle possibilità di uscire rispetto a un numero dispari.
Lo indichiamo così p = 2d.
Ma so che
3p + 3d = 1 → 6d + 3d = 1 → d = 1/9 → p = 2/
Quindi la nostra densità discreta sarà data da {1/9, 2/9, 1/9, 2/9, 1/9, 2/9}.
P(“esce pari”) = P(“esce 2”) + P(“esce 4”) + P(“esce 6”)
Da cui la probabilità che esca dispari sarà
P(“esce dispari) = 1 – P(“esce pari”) = 1/9 ∙ 3 = 3/9 = 1/
Def: una famiglia finita di eventi (A i
n
i=
è detta sistema di
alternative (alternative = a due a due incompatibili) se
i
j
= 0 per ∀i, j ∈ {1, …, n}
𝑖
𝑛
𝑖= 1
Quest’ultima condizione sta a significare che almeno una di queste affermazioni è vera e si realizza
sempre.
Questa è quella che nella teoria dei sistemi si chiama anche partizione.
Questi eventi sono sottoinsiemi del nostro Ω, che sono a due a due disgiunti.
Perché è importante un sistema di alternative?
Oss: qualunque sia l’informazione I, rispetto alla probabilità iniziale, ma anche rispetto a qualunque
probabilità condizionata, vale sempre:
𝑖
𝑗
𝑖
𝑗
𝑖
𝑛
𝑖= 1
però, per la regola della somma,
𝑖
𝑛
𝑖= 1
𝑖
𝑛
𝑖= 1
𝑖
𝑛
𝑖= 1
𝑖
𝑖= 1
𝑛
𝑑𝑒𝑛𝑠𝑖𝑡à 𝑑𝑖𝑠𝑐𝑟𝑒𝑡𝑎
C’è un modo per fare una famiglia continua e trovare una densità continua?
Facciamo due esempi:
c
= {“esce i} con i ∈ {1, 2, …, 6}
C’è un risultato importante: la formula di fattorizzazione o decomposizione.
Non è solo un prodotto, ma è una somma più un prodotto.
Oss: sia (A i
n
i=
un sistema di alternative e B un evento qualunque della mia algebra degli eventi NON
collegato agli A i
, allora vale:
𝑖
𝑛
𝑖= 1
𝑖
Questo vale per una probabilità qualsiasi o anche condizionata.
Calcoliamo la probabilità di B, sapendo che l’alternativa A i
si è realizzata, quindi che è vera.
Oss: se P(A i
| I)>0, in generale, basta sommare solo sulle alternative con P(A i
Dimostrazione:
A me interessa la probabilità di B, quando per esempio Ω=I.
Se gli eventi (A i
n
i= 1
sono a due a due incompatibili, per additività,
avremo che:
𝑖
𝑛
𝑖= 1
𝑖
𝑛
𝑖= 1
𝑖
𝑖
Siccome almeno una di queste alternative si realizza, quando vado a fare l’unione di qualcosa di vero
intersecato con B, otteniamo qualcosa di vero intersecato con B, quindi questo insieme è proprio uguale
a B, perché stiamo distribuendo l’unione sull’intersezione.
Quest’uguaglianza è vera se la definizione di Kolmogorov è vera.
In questo caso dovremo assumere le probabilità positive.
In realtà i sistemi di alternative non si disegnano così di solito, e questa formula non si usa quasi mai
così esplicitamente, ma si usa molto più spesso nelle rappresentazioni grafiche ad albero :
Gli eventi si rappresentano con dei pallini, che si chiamano nodi.
Il primo evento è l’evento vero.
Quando introduciamo un sistema di alternative, facciamo partire da sinistra verso destra dei cosiddetti
archi e, al termine di ciascun arco, introduciamo un nuovo nodo quindi un'altra alternativa.
Qui si può iterare senza complicazioni.
Possiamo pesare ora questi archi e li pesiamo scrivendo sopra la probabilità.
Quale?
Mettiamo la probabilità che sia vera l’alternativa A i
sapendo tutte le informazioni che ci sono a sinistra,
non solo quella da cui proveniamo.
Se mi interessa la probabilità di un evento D possiamo completare aggiungendo l’evento B e la sua
negazione (solitamente non si mette).
Per calcolare la probabilità di D, dobbiamo aggiungere D a tutte le possibili foglie (estremità destre):
Un altro punto di vista è il seguente: aggiornare la probabilità di A sapendo che B accade, quindi è vero.
Teorema: se A, B e I sono eventi, e se P(B|I) > 0 e P(A|I) > 0, vale
Dimostrazione: la regola del prodotto di Kolmogorov assicura che:
Probabilità delle cause
Non è altro che la formula di decomposizione insieme alla formula di Bayes.
Sia (A i
n
i=
un sistema di alternative, che pensiamo come possibili cause dell’evento B, non cause fisiche,
ma magari indizi che portano a correlazione, allora per ogni i ∈ {1, …, n}:
𝑖
𝑖
𝑖
formula di Bayes
𝑖
𝑛
𝑖= 1
𝑖
regola del grafo ad albero
Oss: nella formula (⋇), a sinistra abbiamo le probabilità di un sistema di alternative, quindi una densità
discreta, quindi anche a destra dev’esserci una densità discreta. Ma a destra, il numeratore
dipende dall’indice i, il denominatore è lo stesso per tutti gli i ∈ {1, …, n}.
Quindi si può scrivere così:
𝑖
𝑖
𝑖
dove ‘c’ è univocamente determinata dal fatto che a destra debba esserci una densità discreta.
Riprendiamo l’esempio di prima, ma stavolta applichiamo la formula di Bayes:
Sappiamo che è uscito 1 all’ultimo lancio, ma non sappiamo se
abbiamo lanciato una volta o due il dado.
Quindi:
1
𝐶
1
𝐶
1
𝐶
Ci vuole un modo compatto per tenere traccia di tutti questi vari sistemi di alternative.
Si possono quindi introdurre le cosiddette variabili aleatorie che sono in perfetta corrispondenza con i
sistemi di alternative.
Nell’esempio precedente, possiamo pensare di considerare, invece, che il sistema di alternative
1
2
6
, una variabile aleatoria X per indicare l’esito del lancio.
Se A i
= “esito è i”, in modo compatto mi basta dire che {X=i}.
In realtà si indica con X ∈ {1, 2, 3, 4, 5, 6}, non sapendo, però, quale sia con certezza.
Se abbiamo più lanci possiamo chiamare X il primo lancio, Y il secondo lancio, Z il terzo lancio e così via.
La cosa interessante è che con queste variabili posso farci delle operazioni.
Oss: dato un sistema di alternative (A i
n
i=
, possiamo sempre pensare di introdurre una “variabile” X che
indica X ∈ {1, 2, …, 6}, in modo che A i
= {X=i}.
Es: alternativa semplice
A = {X=1} quando A è vera
C
= {X=0} quando A NON è vera
insieme E, ossia una funzione definita X: Ω → E tale che gli insiemi
con w = insiemi elementi di partenza.
Es: lancio dado X ∈ {1, 2, 3, 4, 5, 6}
{X è pari} = {X ∈ {2, 4, 6}}
2
Oss: se Ω ∈ {1, 2, 3, 4, 5, 6}, allora X(w) = w
Nello spazio vero matematico questo non è così banale da costruire.
Oss:
discreta. In questo caso gli eventi importanti sono del tipo {X:v} con v ∈ E;
d
, sottoinsieme, gli eventi importanti sono del tipo {X∈V} dove
V⊆E è un sottoinsieme aperto.
riscriviamolo in forma di variabili aleatorie:
X ∈ {1, 2, 3, 4, 5, 6} “esito 1° lancio”
Y ∈ {1, 2, 3, 4, 5, 6} “esito 2° lancio”
1
1
𝐶
Introduciamo una nuova variabile Z ∈ {1, 2, 3, 4, 5, 6} “esito ultimo lancio”.
Scriviamola in funzione di X e Y:
1
1
𝐶
X è l’esito del primo lancio, ma se X∈D 1
si deve tirare di nuovo.
Calcoliamo la legge di Z, ossia la densità discreta:
1
1
1
𝐶
1
𝐶
1
1
1
𝐶
1
𝐶
Se v è pari:
1
Se v è dispari:
1
La densità di Z è:
Questa dovrebbe essere una densità discreta, quindi dev’essere positiva minore di 1, e la somma totale
deve dare 1.
Come cambia la legge di Z, sapendo che il primo lancio ha un esito ≤4?
Dobbiamo calcolare ρ(Z=v | X≤4)
Es:
C’è un gioco a premi in cui si può scegliere una di tre porte indistinguibili numerate, ma solo dietro a una
c’è il premio.
Il giocatore sceglie una porta e il conduttore del gioco, che conosce cosa c’è dietro le porte, apre
un’altra delle due porte e rivela che non c’è nulla dietro.
A questo punto il conduttore propone al giocatore un cambio di scelta.
Conviene cambiare scelta o rimanere nella propria scelta?
Scegliamo:
X ∈ {1, 2, 3} porta in cui è nascosto il premio;
S ∈ {1, 2, 3} porta scelta dal giocatore;
C ∈ {1, 2, 3} porta scelta dal conduttore;
Calcolare se è maggiore la probabilità che dietro la porta scelta ci sia il premio, oppure se tale
probabilità sia maggiore se cambio la porta scelta:
Sappiamo che, tramite le formule di Bayes:
Costruiamo ora il grafico ad albero di questo caso ipotizzato che il gioco NON sia truccato:
questo è un caso speciale della formula:
𝑣∈𝐸
Es: lancio di un dado
Calcoliamo queste due funzioni per il caso discreto.
Nel caso del lancio di un dado equo:
La probabilità uniforme è p(X=v) = 1/6.
La funzione di ripartizione sarà quella mostrata in figura
Perché non c’è un salto verso il basso?
Perché stiamo guardando la probabilità di eventi sempre più grandi.
Oss: Se t < t’, l’evento {X≤t} ⊆ {X≤t’}
Come vediamo, la funzione che abbiamo ottenuto è non decrescente.
Nel caso continuo questi grafici non ci saranno, sarà appunto un grafico continuo.
Facciamo un altro esempio nel caso continuo.
Es: supponiamo X:Ω → [0, 3] sia una variabile aleatoria continua con densità uniforme
Uniforme: uguale in tutti i punti;
La densità o si specifica nei singoli valori, o la si mette a 0 fuori dall’insieme dei possibili valori.
Invece di sommare sui possibili valori, dobbiamo integrare:
𝑉
𝑡
−∞
(−∞,𝑡]∩𝐸
In questo tipo di ragionamenti conviene sempre porre uguale a 0 la densità fuori dall’insieme in cui
è inizialmente specificata, altrimenti dovremo dire:
(−∞,𝑡]∩[ 0 , 3 ]
In questo caso:
𝑡
0
In questo caso non ci sono salti, perché vorrebbe dire che la probabilità che assuma esattamente
quel valore è positiva, ma per una variabile continua questo non accade.
Proprietà della funzione di sopravvivenza e di ripartizione
Funzione di ripartizione Funzione di sopravvivenza
x
(t) ∈ [0, 1] SUR x
(t) ∈ [0, 1]
lim
𝑡→+∞
𝑥
(𝑡) = 1 lim
𝑡→+∞
𝑥
È non decrescente
(crescente ma non strettamente)
È non crescente
(decrescente ma non strettamente)
Se ci sono discontinuità, sono di tipo salto, quindi
il limite destro e il limite sinistro sono diversi
𝐶𝐷𝐹
𝑋
(𝑡
) − 𝐶𝐷𝐹
𝑋
(𝑡
−
) = 𝐶𝐹𝐷
𝑋
(𝑡) − 𝐶𝐷𝐹
𝑋
(𝑡
−
) = 𝑃(𝑋 = 𝑡) 𝑆𝑈𝑅
𝑋
(𝑡
) − 𝑆𝑈𝑅
𝑋
(𝑡
−
) = 𝑆𝑈𝑅
𝑋
(𝑡) − 𝑆𝑈𝑅
𝑋
(𝑡
−
) = 𝑃(𝑋 = 𝑡)
Se X è una variabile continua con densità ρ (X) si ha
𝑋
𝑋
Qualunque sia la variabile aleatoria avremo queste proprietà.
Se ci viene data una funzione di ripartizione di una certa variabile X continua e vogliamo trovare
la densità, quello che dobbiamo fare è la derivata di questa funzione.
Se invece ci viene data la densità e vogliamo studiare la funzione di ripartizione, dovremo fare
l’integrale.
Oss: 𝑃
𝑋
𝑋