






















































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Dispensa statistica inferenziale 2024/2025
Tipologia: Dispense
1 / 94
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!























































































Riguarda lo studio statistico di una popolazione quando si è in possesso di informazioni relative ad un
campione di essa. Si possiedono pertanto solo le informazioni relative ad un sottoinsieme di essa.
Dall’analisi delle informazioni contenute nel campione preso in
esame, mediante l’inferenza statistica si ricavano informazioni
inerenti l’intero collettivo (es. sondaggi elettorali su campione di
100 unità). Generalmente le unità n del campione sono molto
inferiori allle unità N del collettivo (n << N). In statistica si usa
distinguere tra due tipi di problemi:
Una condizione affinchè le conclusioni tratte sulla base del campione siano estendibili all’intera
popolazione è che il campione sia rappresentativo, ovvero che riproduca in scala ridotta le
caratteristiche salienti della popolazione (es. campione su sondaggio elettorale deve contenere la
stessa percentuale di maschi/femmine, titolo di studio, livello di occupazione relativa all’intero
collettivo). È altresi importante che il campione non sia distorto, ovvero non rappresentativo
dell’intera popolazione, poiché tale campione genererà risultati non attendibili e nel peggiore dei casi
sbagliati (es. sondaggi Brexit). Un campione è rappresentativo quando è scelto casualmente tra l’intera
popolazione. Al fine di poter stabilire la casualità è necessario approfondire gli elementi del calcolo
delle probabilità. Pertanto l’inferenza statistica è fortemente connesso con tale disciplina.
Tale disciplina si occupa di studiare esperimenti casuali. Un eseperimento casuale è un esperimento
qualsiasi, in qualsiasi ambito, ripetibile e di esito incerto (es. lancio di un dado). Nella pratica ci si
riferisce a esperimenti più complessi, non sempre ripetibili (es. meteo di domani). Il contrario di un
esperimento casuale è l’esperimento deterministico, il quale ha la caratteristica della ripetitibilità ma
hanno un esito certo (es. esperimenti in campo fisico, ebollizione dell’acqua a 100°C).
nome di evento elementare (es. numero sulla faccia del dado,
temperatura di domani) e viene indicato con la lettera 𝑒 (o omega
minuscola ω).
eventi e si indica con la lettera 𝑆 (o omega maiuscola Ω). Il numero di
elementi di Ω prende il nome di cardinalità e si indica con |Ω| (es.
|Ω|=8, vedi sotto)
1 sul lancio di un dado).
Il numero di combinazioni possibili (Ω) corrisponde
al numero di risultati possibili elevato al numero di
eventi studiati ( 2
3
). Uno spazio degli eventi di questo
tipo si definisce discreto (≠continuo), poiché il
numero dei singoli eventi che lo determinano è
ottenibile mediante l’operazione di conteggio.
Solitamente gli eventi sono quegli esperimenti casuali per cui si intende calcolare la probabilità di
avvenimento. Vengono descritti prima sotto forma di espressione verbale (es. “esce testa al primo
lancio) e in seguito sotto forma di sottoinsieme dello spazio degli eventi. Tale sottoinsieme comprende
tutte le possibili combinazioni di eventi che soddisfano le condizioni affinché si verifichi l’evento A.
Un esempio di spazio degli eventi di tipo continuo è dato dall’esempio sotto, dove appunto viene
considerato come spazio degli eventi il periodo di durata di una lampadina in ore.
Lo spazio degli eventi, essendo il tempo una unità
di misura continua, non è soggetto a conteggio
(spazio discreto) ma a misurazione, pertanto il
valore 𝑥 corrispondente alla durata in ore della
lampadina è compreso tra 0 e 𝑻, inteso come
valore massimo concepibile.
L’esperimento di cui andremo a studiare il verificarsi o meno, in caso di spazio degli eventi continuo,
non sarà pertanto riferito alle cardinalità ad esso associate (caso discreto) ma ad un intervallo di
valori (caso continuo) appartenenti all’insieme 𝑹 dei numeri reali. Un evento tipico potrebbe essere:
Definiamo insieme complementare, e lo indichiamo
con A soprasegnato, l’insieme costituito da tutti gli
elementi non appartenenti ad A.
L’insieme complementare è quel sottoinsieme di Ω che
contiene tutti gli eventi non appartenenti ad A.
Se consideriamo l’evento A “esce testa al primo
lancio”, l’insieme complementare A-soprasegnato è
l’insieme degli eventi “esce croce al primo lancio”
oppure “non esce testa al primo lancio”.
Se consideriamo l’evento B “esce due volte testa”,
l’insieme complementare B-soprasegnato è
l’insieme degli eventi “non esce due volte testa”
oppure “esce croce almeno una volta nei primi
due lanci”.
2°: Per qualsiasi evento elementare la probabilità che si verifichi è sempre non negativa.
3°: Supponendo di avere una sequenza di eventi (𝐴 1
2
, … ) disgiunti a due a due, ovvero il cui insieme
intersezione è vuoto (𝑨 𝒊
𝒋
≠ 𝟎, ∀𝑖 ≠ 𝑗) e che pertanto non hanno elementi in comune, la probabilità
dell’unione di tali eventi è uguale alla somma delle probabilità dei singoli eventi.
Le implicazioni di tali assiomi sono che:
uno spazio degli eventi nullo è =0.
elementare sarà sempre ≤ 1
complementare (A-soprasegnato) sarà = 1 − 𝑃(𝐴)
sottoinsieme dell’evento B (𝐴 ⊆ 𝐵) sarà sempre ≤ alla
probabilità che si verifichi B.
P(A∪B) è uguale alla somma della probabilità di ciascun evento considerato singolarmente meno la
probabilità dell’intersezione P(A∩B). L’intersezione deve essere sottratta perché altrimenti verrebbe
conteggiata sia in P(A) che in P(B). → Qualora i due eventi fossero disgiunti, l’intersezione
corrisponderebbe ad un insieme vuoto e pertanto la formula si riduce a quella del terzo assioma.
Esistono diverse tecniche per calcolare la probabilità di un evento, tutte in grado di rispettare gli
assiomi visti in precedenza. Tali impostazioni si differenziano in: classica, frequentista e soggettivista.
Secondo tale impostazione la probabilità che si verifichi un evento A è data dal rapporto tra casi
favorevoli (cardinalità di A) e casi possibili (cardinalità di Ω), sotto condizione che i casi per cui
l’evento A si verifica siano equiprobabili.
Tale probabilità è molto semplice da calcolare ma fornisce risultati in contesti molto limitati (giochi di
sorte e simili) e una definizione tautologica, ovvero richiede che venga già assunta la situazione di
equiprobabilità a priori.
La condizione “con ripetizione” significa che a seguito
dell’estrazione la pallina viene reinserita nell’urna e lo spazio
degli eventi rimane inalterato. È possibile, pertanto, che la
stessa pallina venga estratta più volte, fino ad un massimo
dovuto al numero di estrazione. La condizione inversa, ovvero
“senza ripetizione”, fa si che tale pallina estratta non venga
reinserita nell’urna, andando cosi a ridurre di una cardinalità lo
spazio degli eventi. Per evitare problemi di confusione
solitamente si numerano le palline in modo da associare ad
esse ciascun evento possibile dello spazio degli eventi. Essendo 17 le palline totali avremo un 𝛺 = 17.
Il numero complessivo delle possibilità di estrazione viene dato da 𝛺
3
, dove la potenza è il numero di
ripetizioni. In maniera analoga il numero di possibili estrazioni favorevoli è dato da 10
3
. Pertanto la
probabilità dell’evento A si ottiene:
La probabilità dell’evento B si ottiene modificando il numeratore, in quanto il denominatore rimane
è bianca, non tenendo conto della posizione di estrazione (prima estratta, seconda estratta, terza
estratta) e pertanto la probabilità di tale evento è sicuramente maggiore rispetto ad un evento del tipo
C=”la prima pallina estratta è bianca”; inoltre è necessario che le altre due estratte siano rosse, e ciò
presenta un’analogia con il calcolo svolto per la provabilità dell’evento A. Per calcolare la probabilità di
B, pertanto, sarà necessario considerare il numero di casi possibili di estrazione per il numero di
ripetizioni ( 7 × 3 = 21 ) e moltiplicarlo per la probabilità che esca una pallina rossa in entrambe le
altre due estrazioni ( 10 × 10 = 10
2
). Pertanto:
Qualora si tenesse conto della posizione di estrazione (prima, seconda, terza estratta) della pallina
bianca, il numero di probabilità dell’evento B si riduce poiché il numero degli eventi favorevoli
all’estrazione di una singola pallina bianca in una determinata posizione passa da 21 a 7 (
𝑃
( 𝐵
)
3
Si chiama così poiché la probabilità di un determinato
evento si calcola in relazione alla frequenza relativa
degli esiti favorevoli, dato un determinato ammontare 𝑛
di eventi studiati. Si basa sulla condizione di ripetibilità,
almeno ideale, dell’esperimento per un numero finito 𝑛
di volte, solitamente molto grande (𝑛 → ∞).
Per calcolare la probabilità, pertanto, si ripete
l’esperimento 𝑛 volte e si contano gli esiti favorevoli
𝑛(𝐴) dell’evento studiato. La probabilità dell’evento A
corrisponde al limite del rapporto tra eventi favorevoli e
spazio degli eventi, per 𝑛 → ∞. Tale rapporto corrisponde alla frequenza relativa.
→ Supponendo di lanciare 𝑛 = 1000 volte una moneta, la probabilità che si verifichi l’evento “esce
testa” converge intorno a valori pari a 0,5 (sebbene dopo pochi lanci tale valore di P(A) potrebbe
essere fortemente variabile).
verificarsi di un evento altera la probabilità (o l’aspettativa) del verificarsi dell’altro.Definiamo
pertanto:
P(B) = probabilità marginale
P(B|A) = probabilità condizionata
formulata.
marginale dell’evento B
dell’evento intersezione sapendo le probabilità marginali di due
eventi indipendenti (→ regola di calcolo)
l’indipendenza non ha una direzione precisa, ovvero se due eventi sono indipendenti P(B|A) = P(B) e
Qualora una qualsiasi di queste relazioni non sia verificata possiamo affermare che non siamo in
condizioni di indipendenza e, pertanto, i due eventi sono legati da un certo livello di dipendenza.
P(A) =1/2 poiché la probabilità che esca testa al primo lancio è
la stessa per ogni lancio
P(B)=3/8 poiché è dato dal numero di tentativi (3) moltiplicato
per la probabilità che esca testa ad ogni lancio [(
1
2
3
P(A∩B)=1/4 poiché le probabilità di tale evento sono due su
otto (TTC e TCT)
Osservando infine il valore di P(B|A) notiamo che è diverso da
quello di P(B), pertanto i due eventi sono dipendenti.
P(A)=1/2 come in precedenza
P(B)=1/4 poiché sono soltanto due i casi favorevoli su otto
possibili
P(A∩B)= 1/8 poiché c’è solo un esito favorevole su otto
P(B|A)=1/4=P(B), ovvero la probabilità condizionata è uguale
alla probabilità marginale, pertanto i due eventi sono
indipendenti.
È un teorema che prende in esame eventi che hanno una relazione di causa-effetto. Tale teorema serve
per calcolare la probabilità di ciascun possibile evento-causa, dato il verificarsi di un evento-effetto. Si
tratta pertanto di calcolare la probabilità condizionata di ciascun possibile evento-causa.
Data una serie di eventi appartententi a contesti differenti, possiamo
vedere ciascun evento A come l’effetto di possibili altri eventi, che ne
costituiscono le cause (𝐶
1
𝑘
). Un esempio possibile è che dato un
evento A=”Ho la febbre” esistono differenti malattie “𝐶
𝑘
” che
potrebbero esserne la causa scatenante ed avere come effetto
appunto A. Dato tale esempio, con il teorema di Bayes possiamo
calcolare la probabilità che ciascuna possibile causa (malattia) sia
responsabile del verificarsi del determinato evento-effetto A (febbre),
ovvero la probabilità condizionata di ciascun effetto-causa, dato per
certo il verificarsi dell’evento-effetto A.
→ Per applicare il teorema è necessario innanzitutto calcolare le probabilità marginali di ciascun
evento-causa e poi applicare la formula seguente.
Teorema di Bayes
La probabilità della i-esima causa condizionata da A è uguale al rapporto tra:
condizionata dalla i-esima causa (assume valori compresi tra 0 e 1)
probabilità totale dell’evento A condizionata dalle j-esime cause (assume valori pari a 1)
→ Per calcolare la probabilità che un effetto osservato sia prodotto esattamente da una determinata
causa 𝑖, occorre moltiplicare la probabilità della particolare causa per la probabilità che tale causa
possa generare l’effetto A e dividere per la sommatoria del prodotto delle probabilità marginali di tutte
le possibili cause e la probabilità che tali eventi possano aver causato l’evento osservato A.
Dati:
1
=“Il paziente ha l’influenza”
𝐴= “Il paziente ha la febbre”
Allora:
1
) sarà la probabilità che ha un soggetto di prendere l’influenza
1
) sarà la probabilità che un paziente che ha l’influenza manifesti il sintomo della febbre
1
|𝐴) sarà la probabilità che un paziente abbia l’influenza sapendo che ha la febbre
N.B. Il teorema di Bayes pertanto mi fornisce un risultato opposto alla probabilità condizionata vista
finora, in quanto tale probabilità condizionata andava a calcolare la probabilità che una determinata
conseguenza (febbre) potesse verificarsi dato il verificarsi di una possibile causa (influenza).
Abbiamo a che fare con una variabile casuale discreta quando posso associare un numero naturale ad
ogni possibile realizzazione; abbiamo a che fare con una variabile casuale continua quando questa può
assumere un qualunque numero reale in un certo intervallo.
da uno studente casuale)
lampadina)
Analogamente a quanto fatto nell’analisi delle distribuzioni di frequenza per caratteri discreti e
continui, anche per le variabili casuali occorre studiare i due casi di distinti.
Per tale variabile casuale il risultato è un numero intero e, pertanto, la funzione di probabilità ad essa
associata darà dei valori appartenenti all’insieme 𝑁 dei numeri naturali.
È una particolare funzione matematica che ha come argomento ogni possibile realizzazione della
variabile casuale. Nel nostro esempio la variabile casuale può assumere valori compresi tra 0 e 3, dove
3 è appunto il numero di lanci della moneta. Per essere tale, la funzione di probabilità dovrà
necessariamente possedere determinati requisiti:
1° La funzione di probabilità deve restituire sempre valori non
negativi, pertanto ⨍(𝑥) ≥ 0.
2° La funzione di probabilità ⨍(x) ha sempre somma pari a 1:
sommando ciascun valore assunto dalla funzione ⨍(x) per ciascun
evento elementare 𝑥, tale valore sarà pari a 1.
3° Il valore assunto dalla funzione per un dato valore 𝑥 è pari alla
probabilità che si verifichi la variabile casuale X per tale valore della 𝑥.
Pertanto ⨍( 2 ) = 𝑃(𝑋 = 2 ).
Questa tabella ricorda la distribuzione di frequenze relative. In particolare, in questa
tabella andiamo ad elencare i possibili valori distinti 𝑥
𝑖
della variabile casuale
(carattere). Tale distribuzione disaggregata risulta utile quando abbiamo poche
realizzazioni plausibili (modalità). Nella prima colonna vengono le elencate le 𝑥
𝑘
possibili realizzazioni. Nella seconda colonna viene riportata la ⨍(𝑥
𝑘
) probabilità
relativa a ciascuna realizzazione.
Nel 𝑙𝑎𝑛𝑐𝑖𝑜 𝑑𝑖 𝑡𝑟𝑒 𝑚𝑜𝑛𝑒𝑡𝑒 lo spazio degli eventi è pari ad 8, ciò significa
che sono possibili 8 combinazioni diverse. Il numero di realizzazioni
possibili va da 0 (non esce mai testa) a 3 (esce sempre testa), poiché le
monete vengono lanciate tre volte. Per ogni esito 𝑥
𝑖
è associato un
determinato valore di ⨍(x), ovvero la probabilità che si verifichi quel
particolare esito, corrispondente appunto alla frequenza relativa degli esiti compatibili. L’aggregazione
degli esiti favorevoli equivale ad un’operazione di spoglio dei dati.
Data una classe di studenti vogliamo calcolare la probabilità, per
ciascun voto di esame analizzato, che lo studente estratto casualmente
abbia preso tale voto (esito). La probabilità totale, ottenuta sommando
le probabilità marginali di ciascun possibile esito (=voto) danno come
risultato un valore =1. Tali probabilità marginali, in questo specifico
caso, corrispondono alle frequenze relative di tale voto.
Data una distribuzione di probabilità con variabili casuali discrete è possibile ricavare da essa,
mediante particolari indici di sintesi, delle informazioni utili per confrontare distribuzioni diverse.
Analogamente a quanto visto per le distribuzioni di frequenza, riprenderemo degli indici statistici e li
adatteremo alla disciplina del calcolo delle probabilità.
VALORE ATTESO (o SPERANZA MATEMATICA) → MEDIA ARITMETICA
Analogamente a quanto visto per le distribuzioni di frequenza, anche per la probabilità è possibile
calcolare un indice 𝜇 oppure 𝑬(𝒙) che ci consente di cogliere la tendenza generale (media) degli esiti.
Tale indice assume valori ≥ 0
In questo contesto la varianza può essere interpretata come misura di incertezza di un particolare
esito oppure come indice di volatilità dei risultati.
In questo ambito la varianza può assumere valori:
La varianza è un indice che altera l’unità di misura originale poiché la eleva al quadrato. Per ovviare
tale problema si utilizza la deviazione standard.
Come analogamente visto in precedenza, la deviazione standard si ottiene:
In ambito di inferenza statistica si utilizzano solitamente solo valore atteso, varianza e deviazione
standard, anche se con le dovute modifiche è possibile calcolare qualsiasi altro indice.
Riprendendo l’esempio dei voti e calcolando le rispettive
colonne della media aritmetica e del momento secondo, il
valore della varianza e della deviazione standard in tale
distribuzione si otterranno semplicemente facendo:
Anche qui siamo in presenza di incertezza.
RAPPRESENTAZIONI GRAFICHE DELLA FUNZIONE DI PROBABILITÀ (variabile discreta)
Tale grafico ad aste avrà nell’asse delle ordinate i valori assunti
dalla funzione di probabilità per ciascuna realizzazione considerata,
ovvero le frequenze relative degli esiti, e nell’asse delle ascisse
l’insieme delle possibili realizzazioni.
Essendo la funzione di probabilità ⨍(x) una funzione matematica, possiamo indicare con 𝑭(𝒙) la
funzione di ripartizione per cui la probabilità della variabile casuale 𝑋 sia ≤ di un certo valore 𝑥.
Pertanto:
La funzione di ripartizione F(x) si ottiene in tre modi diversi, a seconda del valore della 𝑥.
considerata, essendo inferiore alla realizzazione minima possibile, sarà sicuramente impossibile e
pertanto la probabilità che si verifichi è nulla, ovvero 𝑷(𝒙 < 𝒙 𝟏
) = 𝟎 (es. probabilitò che si verifichi un
voto di esami minore di 18).
trovare una coppia di possibili realizzazioni consecutive (𝑥 𝑖
𝑖+ 1
) che contengano tale argomento. Una
volta individuati tali valori, la funzione di ripartizione assumerà come valore la probabilità che la
variabile casuale sia minore o uguale al più piccolo di tali valori individuati, ovvero 𝑭(𝒙) = 𝑷(𝑿 ≤ 𝒙 𝒊
considerata, essendo minore o uguale alla realizzazione massima possibile, corrisponderà alla
certezza, per cui 𝑷(𝒙 ≥ 𝒙
𝒌
) = 𝟏 (es. probabilità che si verifichi un voto minore o uguale a 30 e lode).
Tali punti evidenziati in rosso corrispondono alle probabilità cumulata di ciascun esito, hanno
coordinate (𝒙
𝒊
𝒊
) e possono essere assimilati alle frequenze relative cumulate. Congiungendo
tutti i punti si ottiene un grafico a gradini non decrescente e con valori di 𝐹(𝑥) compresi tra 0 e 1
analogo a quanto visto nella funzione di ripartizione dei caratteri discreti, in quanto la funzione
assume valori sensati solo per tali punti (≠variabili casuali continue, sensate in tutto l’intervallo).
sul grafico i valori di ⨍(x), ovvero della probabilità
marginale di ciascun esito (seconda colonna).
calcolare la probabilità cumulata delle i-esime realizzazioni (terza
colonna)
Se volessi calcolare la probabilità di un esito pari a 2,5 otterrei dei
valori non sensati e pertanto dovrei considerare come valori 2 o 3.
Se una variabile casuale ha un range di realizzazioni molto grande è opportuno utilizzare dei modelli
statistici o modelli probabilistici. Tale modello si traduce in una formula predefinita della funzione di
probabilità che dipende da una o poche costanti prefissate. Tali costanti si chiamano parametri del
modello. A seconda della fattispecie di indagine statistica il modello varia.
Si utilizza quando abbiamo delle variabili casuali binarie, ovvero che possono assumere solo due
possibili valori, tipicamente 0 e 1. Nella realtà è molto frequente incontrare delle variabili casuali
binarie, poiché tali valori assunti possono corrispondere a due risultati che sottolineano la
presenza/assenza di un determinato attributo (es. indagine marketing: voglio sapere se un cliente è
soddisfatto, valore 1, oppure non soddisfatto. valore 0). Tali variabili binarie pertanto sono il risultato
(o il punto di partenza) di una operazione di codifica.
Tale distribuzione generalizza (e include) la distribuzione di Bernoulli. La distribuzione binomiale si
utilizza ogni volta che abbiamo una variabile casuale discreta che può assumere valori compresi tra 0 e
un valore limite prefissato, indicato con 𝒏. Analogamente a prima, tale modello ci fornisce una formula
unica per determinare la probabilità tale che:
𝒏!
𝒙!(𝒏−𝒙)!
è il fattore binomiale e corrisponde al numero di combinazioni
→ La seconda parte è molto simile alla formula del modello di Bernoulli se non fosse che all’esponente
del secondo fattore figura (𝑛 − 𝑥). Tuttavia, se 𝑛 = 1 , la seconda parte torna ad essere quella di
Bernoulli e, inoltre, si può dimostrare che
𝑛!
𝑥!(𝑛−𝑥)!
= 1 e pertanto la formula della distribuzione
binomiale torna ad essere esattamente uguale alla formula di Bernoulli.
Anche la distribuzione binomiale definisce il valore atteso e la varianza, pertanto:
→ Anche tali formule generalizzano quelle viste prima, poiché per 𝑛 = 1 otteniamo gli stessi valori.
Per quanto concerne la rappresentazione grafica della funzione di probabilità e della funzione di
ripartizione della distribuzione binomiale, essendo il numero di realizzazioni possibili >2, il grafico
sarà necessariamente differente da quello della distribuzione di Bernoulli.
Il diagramma ad aste assume un andamento inizialmente crescente
e poi decrescente, con un unico massimo. Al variare del valore
prefissato del paramentro 𝑝 le aste del grafico variano di intensità,
più precisamente:
probabilità dei valori → 𝑛)
probabilità dei valori → 0.
→ Tale grafico è simmetrico per valori di 𝑝 = 0 , 5
La funzione di ripartizione assume la tipica forma a gradini poiché il
numero di realizzazioni 𝑛 + 1 è un numero intero e pertanto non
possono essere considerati i valori intermedi alle singole unità.
Anche nella distribuzione binomiale la funzione di ripartizione è
sempre non decrescente e assume valori compresi tra 0 e 1.
La variabile casuale binomiale si utilizza ogniqualvolta abbiamo un numero di possibile di esiti
compreso tra 0 e un valore 𝑛 prefissato. Più precisamente, si utilizza quando 𝑥 corrisponde al numero
di successi in 𝑛 prove indipendenti fra loro ed eseguite con la stessa probabilità di successo 𝑝.
Le 𝑛 ripetizioni di tale esperimento avvengono in
maniera indipendente l’una dall’altra e sotto la stessa
condizione di probabilità 𝑝. In questo esempio
avremo una distribuzione binomiale con 𝑛 = 5 e 𝑝 =
0 , 01 , ovvero la probabilità di estrarre un pezzo
difettoso è pari all’1%.
→ Il simbolo ~ (tilde) è il simbolo usato universalmente in statistica per definire una distribuzione; ciò
che definisce la natura della distribuzione è l’elemento successivo, in questo caso 𝑿~𝑩𝒊𝒏, che indica
appunto la distribuzione binomiale. I valori di 𝑛 e 𝑝 vengono indicati tra parentesi e nell’ordine
rappresentato.
La distribuzione binomiale è il numero delle volte che osservo un determinato esito in un numero 𝑛 di
prove indipendenti ed equiprobabili. In caso di una sola prova, la distribuzione binomiale diventa una
distribuzione di Bernoulli.
Sotto tali parametri della distribuzione binomiale la funzione di probabilità darà i seguenti risultati:
⨍(0) vuol dire la probabilità che su 5 estrazioni ci siano 0
risultati favorevoli al verificarsi di X=”numero pezzi difettosi in 5
estrazioni”.
→ Per convenzione 0! = 1 , pertanto il fattore binomiale si
semplifica.
⨍(1) vuol dire la probabilità che su 5 estrazioni ci sia 1 risultato
favorevole al verificarsi di X=”numero pezzi difettosi in 5
estrazioni”.
→ Il fattore binomiale corrisponde al numero di sequenze binarie
che mi danno un determinato valore della 𝑥.
quella per cui tutti gli esiti osservati non verificano l’evento.
verifichi una sola estrazione di pezzi difettosi, poiché tale pezzo
estratto potrebbe essere estratto in 5 posizioni differenti.
All’aumentare degli esiti favorevoli diminuisce la probabilità che
tali esiti si verifichino.
L’esempio di distribuzione di Poisson evidenzia le differenze
con la distribuzione binomiale, in quanto non è più presente
un numero limitato di esperimenti e, pertanto, il numero di
esiti favorevoli viene conteggiato su un totale indefinito.
La distribuzione di Poisson viene indicata con 𝑿~𝑷𝒐𝒊𝒔 e tra parentesi viene indicato il valore del
parametro 𝜆. Tale valore sta a significare che il valore atteso di clienti che verificano 𝑋, ovvero che
contattano il call-center in un’ora, è pari a 5 = 𝜆.
Come si vede dai calcoli, prefissato il valore di 𝜆 = 5 , la
probabilità ⨍(0) è molto bassa e tende ad aumentare
avvicinandosi al valore atteso.
La distribuzione di Poisson può essere vista come una approssimazione della distribuzione binomiale.
Infatti:
Il limite, per 𝑛 (numero di prove) che tende ad infinito, di una probabilità di un valore 𝑥 calcolata sotto
il modello binomiale è uguale alla probabilità di tale valore 𝑥 calcolata sotto il modello di Poisson.
Pertanto, in una distribuzione binomiale con un numero molto elevato di tentativi, il valore della
probabilità può essere approssimato mediante un modello di Poisson, risolvendo i problemi di calcolo
legati ad un fattoriale molto elevato. Tale approssimazione fornisce valori attendibili e accurati se il
rapporto tra
𝒏
𝒑
Data una distribuzione binomiale con 𝑛 = 100 e un valore di 𝑝 =
0 , 15 , tale che
𝑛
𝑝
= 666 , 67 , possiamo calcolare la probabilità di
ciascuna realizzazione direttamente con la formula di Poisson, il
cui valore fornisce una approssimazione affidabile del valore.
Anche nel caso delle variabili casuali continue si andrà ad associare all’esito di un esperimento un
certo valore numerico reale relativo alla probabilità. Tale valore numerico sarà un qualsiasi numero
reale appartenente all’intervallo (es. misurazione dell’altezza si un soggetto estratto casualmente). Le
variabili casuali continue vengono solitamente analizzata mediante procedimenti di misurazione. La
distribuzione di probabilità viene formalizzata tramite una funzione di densità.
È una funzione molto diversa dalla funzione di probabilità. La necessità di utilizzare tale tipologia di
funzione è data dal fatto che la variabile casuale può assumere qualsiasi valore dell’intervallo e quindi
non avrebbe senso definire la probabilità di ciascun singolo valore.
La funzione di densità si indica sempre con ⨍(x) e affinchè venga definita correttamente, deve
soddisfare due requisiti:
2
), dove 𝑙
1
è il valore
minimo ammissibile della variabile casuale e 𝑙 2
il valore massimo.
Queste due condizioni sono analoghe ai requisiti della funzione di probabilità nel caso discreto.
singoli valori possono essere contati singolarmente mediante una
sommatoria, nel caso continuo non è possibile quindi si utilizza
l’integrale. Il totale deve coincidere con la probabilità massima (1).
Pertanto, essendo la funzione di densità definita mediante un integrale definito, il grafico sarà del tipo:
L’area evidenziata in rosso è pari ad 1
La funzione di densità mi da la probabilità di un certo
intervallo, ovvero la probabilità che un determinato valore 𝑥
giaccia in un determinato intervallo definito (𝑙
1
2
È dimostrabile che la probabilità nell’intervallo non
varia se decidiamo arbitrariamente di includere /non
includere gli estremi dell’intervallo. Tale condizione è
valida solo per le variabili casuali continue, poiché la
probabilità di un singolo valore reale in un intervallo
reale è pari a 0.
Se volessimo calcolare la probabilità dell’intervallo
(𝑎, 𝑏) dovremo pertanto calcolare l’integrale
definito di tale intervallo. L’area evidenziata
assumerà valori compresi tra 0 e 1.