






Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
I concetti di base sulle distribuzioni di probabilità, comprese le variabili discrete e continue, la funzione di probabilità di massa, la funzione cumulata e la densità di probabilità. Vengono inoltre descritte tre tipologie di distribuzioni discrete: Bernoulli, Binomiale e Poisson.
Tipologia: Appunti
1 / 12
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!







Benché specificato con esattezza nelle possibili modalità di rappresentazione, l’esito di un
fenomeno aleatorio non è noto a priori (ad esempio quando lancio un dado so che gli esiti potranno
essere i numeri da 1 a 6 ma non so quale sarà l’esito).
La distribuzione di probabilità è una funzione
f
x
che descrive analiticamente la probabilità associata
ai possibili valori della variabile casuale, dandone un modello per la curva di frequenza, cioè un
modello analitico per esprimere la probabilità con cui si verificano gli esiti possibili che conosco.
La formulazione è accompagnata dalla definizione della funzione di ripartizione o funzione
cumulata
x
. La funzione di ripartizione
x
è un’espressione analitica della cumulata che fissa il
modello per la curva di frequenza cumulata.
Le trattazioni differiscono tra variabili discrete (userò le sommatorie) e variabili continue (userò gli
integrali).
Le unità non numeriche sono per esempio il colore degli occhi, fuma o non fuma, titolo di studio
ecc..
Le unità numeriche possono essere continue o discrete.
Per esempio, per questo corso, le unità statistiche numeriche discrete sono:
il numero di servitori del sistema,
il numero di parti nel sistema,
il numero di parti su una risorsa.
mentre le unità statistiche numeriche continue sono:
i tempi di attraversamento,
i tempi di attesa,
il tasso di servizio,
il tasso di arrivo.
Le unità numeriche derivano da un processo di misura e costituiscono dati variabili quantitativi, a
loro volta continui o discreti (cioè se assumono qualsiasi valore in un intervallo oppure sono
vincolati ad un insieme finito di punti isolati).
Non è la presenza della virgola a stabilire se una variabile è continua o discreta.
Infatti se una variabile può assumere valori 2,15- 3,5- 6,25; la variabile poiché può assumere solo
questi 3 valori sarà discreta (non può assumere valori compresi nell’intervallo tra due numeri
generici).
“Le variabili discrete sono assimilabili a delle gocce d’acqua..”
Per le variabili discrete lo spazio campionario è un insieme finito (cioè i valori che può assumere la
variabile discreta sono dei valori limitati all’interno di un insieme). La funzione di distribuzione
f
x
( x ) è detta probabilità di massa.
La variabile
x può assumere valori
x
1
, x
2
, … x
n
e a questi valori possiamo associare sia la funzione
di probabilità di massa f x
( x ) che la funzione cumulata F
x
( x ).
La funzione probabilità di massa
f
x
( x ) ci dice qual è la probabilità che la variabile
assumi
valore
x
i
La funzione cumulata F
x
( x ) ci dice qual è la probabilità che la variabile X assumi un valore
x
i
Affinché una funzione costituisca la probabilità di massa è fondamentale che sia non negativa e
produca cumulata unitaria sullo spazio campionario, cioè la somma di tutti i possibili valori in
corrispondenza di
x
i
è uguale ad 1 o che la funzione cumulata in corrispondenza dell’ultimo valore
x
n
è 1.
Questa legge è anche detta legge di inevitabilità perché non posso evitare che la x assuma un valore
all’interno dell’intervallo.
Si definisce valore atteso di una trasformazione g ( X ) della variabile casuale X , con distinzione di
formulazione tra variabili discrete e variabili continue, la quantità scalare:
Per calcolare il valore atteso bisogna considerare una trasformazione della variabile. X è la
variabile, la trasformo tramite una funzione
g ( X ) .
Nel caso discreto eseguo una sommatoria del prodotto tra la funzione
g ( X ) e tutti i valori che
assume la funzione
f
x
( x
i
Nel caso continuo eseguo l’integrale del prodotto tra la funzione g ( X ) e la funzione f x
( x )
E’ immediato che:
Il valore atteso di una costante restituisce la costante stessa.
Nel caso discreto: la funzione g ( X ) è una costante e va fuori dalla sommatoria, la
sommatoria di f
x
( x
i
) =1 (per le legge di inevitabilità) e dunque ottengo g ( X ).
Nel caso continuo: la funzione g ( X ) è una costante e va fuori dall’integrale, l’integrale di
f
x
( x )=1 e dunque ottengo g ( X ).
Il valore atteso è un operatore matematico distributivo rispetto alla somma algebrica, se la
trasformazione
g ( X ) è una trasformazione ottenuta per somma algebrica di vari termini
possiamo sempre separare i termini grazie alla proprietà distributiva del valore atteso.
Se la trasformazione g ( X ) coincide proprio con la variabile X calcolo il valore atteso della variabile
stessa e cioè la sua media (erroneamente quando si parla di valore atteso si sottintende solo una
trasformazione della g ( X ) nella variabile stessa, ma in realtà la funzione g ( X ) può subire qualsiasi
trasformazione).
Se la trasformazione g ( X ) consiste in una sottrazione tra la variabile e il suo valore atteso ed eleva
tutto al quadrato, sto calcolando la varianza della variabile.
Se la differenza tra la variabile X e la media E ( X ) la chiamo “scarto dalla media”, la g ( X )
rappresenta lo scarto dalla media al quadrato, cioè quello che si chiama scarto quadratico dalla
media. Se calcolo la varianza sto calcolando la media degli scarti quadratici dalla media. La
varianza si può esprimere anche come la differenza tra la media dei quadrati e il quadrato della
media.
E’ importante poter calcolare in questo modo media e varianza perché posso conoscere la media e la
varianza delle funzioni di distribuzione di probabilità senza avere i dati sperimentali ma solo
conoscendo la legge di distribuzione.
Media e varianza di una trasformazione lineare
La media di una trasformazione lineare si calcola come trasformazione lineare della media.
Cioè se
g ( X )= n + m X , il valore atteso che gode della proprietà distributiva separa i due addendi. Il
valore atteso della costante
n [ E ( n )] è uguale alla costante
n stessa. Il valore atteso di
m X [
E ( m X ) ]
è [
mE ( X ) ]
perché m è costante ed è portata fuori dall’operatore. Infine ottengo n + mE ( X ).
Dunque la trasformazione lineare che ha subito la variabile si riflette sul valore atteso.
Se calcolo allo stesso modo la varianza di questa trasformazione lineare, il valore n (valore che
determina lo scostamento dall’origine) scompare nel risultato finale. Dunque dipende solo dal
fattore di scala
m .
La varianza della variabile di destinazione dipende solo dal fattore di scala e non è influenzata dallo
spostamento dell’origine.
Probabilità congiunta di variabili indipendenti
Nel caso in cui le variabili congiunte siano indipendenti, si possono ulteriormente elaborare la
funzione probabilità di massa e la cumulata perché le posso esprimere come prodotto delle funzioni
riferite alla singola variabile. Se le variabili sono indipendenti:
Caso discreto: la funzione probabilità di massa in funzione di
x , y può essere espressa
come prodotto della funzione probabilità di x e la funzione probabilità di y. In modo
analogo per la cumulata. Esprimo le funzioni di probabilità congiunta come prodotto delle
funzioni di probabilità a variabile singola, tali probabilità sono dette marginali.
Caso continuo: la funzione cumulata in funzione di x , y può essere espressa come prodotto
della funzione cumulata di x e la funzione cumulata di y , da qui sarà poi ricavabile la
funzione densità di probabilità come prodotto delle due derivate delle due cumulate, ognuna
in funzione della propria variabile.
Ovvero: a prescindere dalla qualità discreta o continua della variabile casuale, i risultati sono
identici, ma formalmente vengono raggiunti con procedimenti diversi.
E’ possibile calcolare il valore atteso di una trasformazione lineare delle due variabili.
La trasformazione che io applico alla variabile si riflette poi sul valore atteso. Questa regola vale a
prescindere che le variabili
x , y siano dipendenti o indipendenti.
Passaggi commentati:
1. Inizialmente applico la sommatoria per tutti i valori
i , j (perché devo fare la somma per tutti i
possibili valori di x e per tutti i possibili valori di y ).
2. Scrivo all’interno della sommatoria la trasformazione e, per definizione di valore atteso,
moltiplico per il valore della funzione di probabilità congiunta.
3. Siccome le sommatorie sono distributive ho separato i due contributi. 4. Segue:
a è costante e va fuori dalla sommatoria. La sommatoria di
i si riferisce solo alla
x
(quindi posso separare le due sommatorie). Resta la sommatoria di
j e questa farà
riferimento alla funzione
f
xy
( x
i
, y
j
5. Trascuriamo il secondo addendo perché si ragiona in maniera analoga.
a che moltiplica la sommatoria di
i della sola funzione riferita alla
x [ x
i
f
x
( x
i
. (Quando sommo la f
xy
( x
i
, y
j
) su tutti i valori di j , che sono i valori di y , perdo la
dipendenza da y ).
a moltiplica proprio la definizione di valore atteso della variabile stessa
x .
8. La soluzione sarà: aE ( x ) + bE ( y ). Dunque il valore atteso della trasformazione lineare delle
due variabili è la somma dei valori attesi di ogni singola variabile, moltiplicato per la
rispettiva costante.
Per la varianza non si verifica la stessa soluzione:
Queste regole valgono sia per le variabili discrete che continue.
In definitiva:
Il valore atteso di una somma è uguale alla somma dei valori attesi. Questa regola vale sia per
variabili dipendenti che indipendenti.
La varianza di una somma è uguale alla somma delle varianze se e solo se le variabili sono
indipendenti. Infatti le covarianze sono nulle quando le variabili sono indipendenti.
Definizione: È la distribuzione B ( N , p ) discreta per la probabilità di ottenere un numero
x
i
di successi su
esperimenti di Bernoulli.
Dalla distribuzione di Bernoulli ottengo la distribuzione binomiale. Se invece di eseguire un
solo esperimento di Bernoulli eseguissimo N esperimenti di Bernoulli, tutti con la stessa
probabilità di successo p , la funzione di distribuzione sarà espressa dal coefficiente
binomiale moltiplicato il seguente termine:
Calcolo la probabilità di ottenere un numero di successi pari a
x
i
eseguendo N esperimenti.
Es.: Lancio 10 volte la moneta voglio vedere qual è la probabilità di ottenere due volte testa.
La curva che si ottiene inizia a richiamare la curva di Gauss, infatti al tendere di un numero
infinito di prove si può costruire la curva gaussiana. Le due curve nel grafico sono state
ottenute rispettivamente una con 30 esperimenti e l’altra con 20. Ad entrambe le curve
corrisponde una probabilità di successo pari a 0,5.
Media e Varianza:
Poiché in questo caso le variabili sono indipendenti la varianza può essere valutata come somma
delle varianze.
Il passaggio logico per passare dalla distribuzione binomiale a quella di Poisson qual è?
Quando consideriamo la distribuzione binomiale ci domandiamo qual è il numero di
successi che otteniamo eseguendo un certo numero di volte un esperimento. Nel caso della
distribuzione di Poisson voglio esprimere la probabilità di ottenere un certo numero di
successi, osservando un fenomeno di tipo continuo, in cui i successi si susseguono con una
certa frequenza. Ad esempio, una nascita all'interno del sistema è un fenomeno che si
verifica in modo discreto (perché arriva un pezzo, due pezzi e così via..) perché si verifica
con una certa cadenza che rappresenta proprio la frequenza.
Definizione: È la distribuzione discreta per la probabilità di ottenere
x
i
successi a
frequenza λ in un intervallo spaziale o temporale di ampiezza l.
La dimostrazione per ottenere la distribuzione di Poisson si basa su tre ipotesi. Trascuriamo
la dimostrazione e concentriamoci sulle ipotesi:
Δl) che possiamo individuare,l) che possiamo individuare,
verificare al massimo un solo evento ,
indipendenti.
Se le tre ipotesi sono rispettate è possibile applicare la distribuzione di Bernoulli, cioè
successo o fallimento, in ogni sotto intervallo. In tutto l'intervallo, ottenuto agganciando i
sotto intervalli tra loro, applico la distribuzione binomiale. Successivamente faccio tendere a
0 il Δl) che possiamo individuare,l, cioè sto andando verso un processo continuo e posso ricavare la distribuzione di
Poisson. La funzione di distribuzione è chiamata probabilità di massa perché ci dice la
probabilità di ottenere un certo numero di successi e la variabile è discreta.
La frequenza di successo può essere espressa in funzione dello spazio o del tempo.
Ad esempio per calcolare la probabilità di trovare 10 buche sull'asfalto in un tratto di 10 km,
devo conoscere con quale frequenza si presentano le buche sull’asfalto. Questa distribuzione