Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


STATISTICA INFERENZIALE, Dispense di Statistica Inferenziale

Dispensa statistica inferenziale 2024/2025

Tipologia: Dispense

2024/2025

Caricato il 08/04/2026

nicola-gambelunghe
nicola-gambelunghe 🇮🇹

1 documento

1 / 94

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
INFERENZA STATISTICA
Riguarda lo studio statistico di una popolazione quando si è in possesso di informazioni relative ad un
campione di essa. Si possiedono pertanto solo le informazioni relative ad un sottoinsieme di essa.
Dall’analisi delle informazioni contenute nel campione preso in
esame, mediante l’inferenza statistica si ricavano informazioni
inerenti l’intero collettivo (es. sondaggi elettorali su campione di
100 unità). Generalmente le unità n del campione sono molto
inferiori allle unità N del collettivo (n << N). In statistica si usa
distinguere tra due tipi di problemi:
- Problema diretto: passaggio dalla popolazione al campione, ovvero all’estrazione del campione
- Problema inverso: passaggio da risultati campionari a risultati generalizzati al collettivo
Una condizione affinchè le conclusioni tratte sulla base del campione siano estendibili all’intera
popolazione è che il campione sia rappresentativo, ovvero che riproduca in scala ridotta le
caratteristiche salienti della popolazione (es. campione su sondaggio elettorale deve contenere la
stessa percentuale di maschi/femmine, titolo di studio, livello di occupazione relativa all’intero
collettivo). È altresi importante che il campione non sia distorto, ovvero non rappresentativo
dell’intera popolazione, poiché tale campione genererà risultati non attendibili e nel peggiore dei casi
sbagliati (es. sondaggi Brexit). Un campione è rappresentativo quando è scelto casualmente tra l’intera
popolazione. Al fine di poter stabilire la casualità è necessario approfondire gli elementi del calcolo
delle probabilità. Pertanto l’inferenza statistica è fortemente connesso con tale disciplina.
ELEMENTI DI PROBABILITÀ
Tale disciplina si occupa di studiare esperimenti casuali. Un eseperimento casuale è un esperimento
qualsiasi, in qualsiasi ambito, ripetibile e di esito incerto (es. lancio di un dado). Nella pratica ci si
riferisce a esperimenti più complessi, non sempre ripetibili (es. meteo di domani). Il contrario di un
esperimento casuale è l’esperimento deterministico, il quale ha la caratteristica della ripetitibilità ma
hanno un esito certo (es. esperimenti in campo fisico, ebollizione dell’acqua a 100°C).
- Ogni singolo esito possibile di un esperimento casuale prende il
nome di evento elementare (es. numero sulla faccia del dado,
temperatura di domani) e viene indicato con la lettera 𝑒 (o omega
minuscola ω).
- L’insieme dei possibili esiti totali prende il nome di spazio degli
eventi e si indica con la lettera 𝑆 (o omega maiuscola Ω). Il numero di
elementi di Ω prende il nome di cardinalità e si indica con |Ω| (es.
|Ω|=8, vedi sotto)
- Con evento si intende un qualsiasi sottoinsieme A dello spazio degli eventi (es. estrazione del numero
1 sul lancio di un dado).
Il numero di combinazioni possibili (Ω) corrisponde
al numero di risultati possibili elevato al numero di
eventi studiati (23). Uno spazio degli eventi di questo
tipo si definisce discreto (≠continuo), poiché il
numero dei singoli eventi che lo determinano è
ottenibile mediante l’operazione di conteggio.
Solitamente gli eventi sono quegli esperimenti casuali per cui si intende calcolare la probabilità di
avvenimento. Vengono descritti prima sotto forma di espressione verbale (es. “esce testa al primo
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e

Anteprima parziale del testo

Scarica STATISTICA INFERENZIALE e più Dispense in PDF di Statistica Inferenziale solo su Docsity!

INFERENZA STATISTICA

Riguarda lo studio statistico di una popolazione quando si è in possesso di informazioni relative ad un

campione di essa. Si possiedono pertanto solo le informazioni relative ad un sottoinsieme di essa.

Dall’analisi delle informazioni contenute nel campione preso in

esame, mediante l’inferenza statistica si ricavano informazioni

inerenti l’intero collettivo (es. sondaggi elettorali su campione di

100 unità). Generalmente le unità n del campione sono molto

inferiori allle unità N del collettivo (n << N). In statistica si usa

distinguere tra due tipi di problemi:

  • Problema diretto: passaggio dalla popolazione al campione, ovvero all’estrazione del campione
  • Problema inverso: passaggio da risultati campionari a risultati generalizzati al collettivo

Una condizione affinchè le conclusioni tratte sulla base del campione siano estendibili all’intera

popolazione è che il campione sia rappresentativo, ovvero che riproduca in scala ridotta le

caratteristiche salienti della popolazione (es. campione su sondaggio elettorale deve contenere la

stessa percentuale di maschi/femmine, titolo di studio, livello di occupazione relativa all’intero

collettivo). È altresi importante che il campione non sia distorto, ovvero non rappresentativo

dell’intera popolazione, poiché tale campione genererà risultati non attendibili e nel peggiore dei casi

sbagliati (es. sondaggi Brexit). Un campione è rappresentativo quando è scelto casualmente tra l’intera

popolazione. Al fine di poter stabilire la casualità è necessario approfondire gli elementi del calcolo

delle probabilità. Pertanto l’inferenza statistica è fortemente connesso con tale disciplina.

ELEMENTI DI PROBABILITÀ

Tale disciplina si occupa di studiare esperimenti casuali. Un eseperimento casuale è un esperimento

qualsiasi, in qualsiasi ambito, ripetibile e di esito incerto (es. lancio di un dado). Nella pratica ci si

riferisce a esperimenti più complessi, non sempre ripetibili (es. meteo di domani). Il contrario di un

esperimento casuale è l’esperimento deterministico, il quale ha la caratteristica della ripetitibilità ma

hanno un esito certo (es. esperimenti in campo fisico, ebollizione dell’acqua a 100°C).

  • Ogni singolo esito possibile di un esperimento casuale prende il

nome di evento elementare (es. numero sulla faccia del dado,

temperatura di domani) e viene indicato con la lettera 𝑒 (o omega

minuscola ω).

  • L’insieme dei possibili esiti totali prende il nome di spazio degli

eventi e si indica con la lettera 𝑆 (o omega maiuscola Ω). Il numero di

elementi di Ω prende il nome di cardinalità e si indica con |Ω| (es.

|Ω|=8, vedi sotto)

  • Con evento si intende un qualsiasi sottoinsieme A dello spazio degli eventi (es. estrazione del numero

1 sul lancio di un dado).

Il numero di combinazioni possibili (Ω) corrisponde

al numero di risultati possibili elevato al numero di

eventi studiati ( 2

3

). Uno spazio degli eventi di questo

tipo si definisce discreto (≠continuo), poiché il

numero dei singoli eventi che lo determinano è

ottenibile mediante l’operazione di conteggio.

Solitamente gli eventi sono quegli esperimenti casuali per cui si intende calcolare la probabilità di

avvenimento. Vengono descritti prima sotto forma di espressione verbale (es. “esce testa al primo

lancio) e in seguito sotto forma di sottoinsieme dello spazio degli eventi. Tale sottoinsieme comprende

tutte le possibili combinazioni di eventi che soddisfano le condizioni affinché si verifichi l’evento A.

Un esempio di spazio degli eventi di tipo continuo è dato dall’esempio sotto, dove appunto viene

considerato come spazio degli eventi il periodo di durata di una lampadina in ore.

Lo spazio degli eventi, essendo il tempo una unità

di misura continua, non è soggetto a conteggio

(spazio discreto) ma a misurazione, pertanto il

valore 𝑥 corrispondente alla durata in ore della

lampadina è compreso tra 0 e 𝑻, inteso come

valore massimo concepibile.

L’esperimento di cui andremo a studiare il verificarsi o meno, in caso di spazio degli eventi continuo,

non sarà pertanto riferito alle cardinalità ad esso associate (caso discreto) ma ad un intervallo di

valori (caso continuo) appartenenti all’insieme 𝑹 dei numeri reali. Un evento tipico potrebbe essere:

RICHIAMI DI INSIEMISTICA

  • Insieme complementare

Definiamo insieme complementare, e lo indichiamo

con A soprasegnato, l’insieme costituito da tutti gli

elementi non appartenenti ad A.

L’insieme complementare è quel sottoinsieme di Ω che

contiene tutti gli eventi non appartenenti ad A.

Se consideriamo l’evento A “esce testa al primo

lancio”, l’insieme complementare A-soprasegnato è

l’insieme degli eventi “esce croce al primo lancio”

oppure “non esce testa al primo lancio”.

Se consideriamo l’evento B “esce due volte testa”,

l’insieme complementare B-soprasegnato è

l’insieme degli eventi “non esce due volte testa”

oppure “esce croce almeno una volta nei primi

due lanci”.

2°: Per qualsiasi evento elementare la probabilità che si verifichi è sempre non negativa.

3°: Supponendo di avere una sequenza di eventi (𝐴 1

2

, … ) disgiunti a due a due, ovvero il cui insieme

intersezione è vuoto (𝑨 𝒊

𝒋

≠ 𝟎, ∀𝑖 ≠ 𝑗) e che pertanto non hanno elementi in comune, la probabilità

dell’unione di tali eventi è uguale alla somma delle probabilità dei singoli eventi.

Le implicazioni di tali assiomi sono che:

  • La probabilità di un evento elementare appartenente ad

uno spazio degli eventi nullo è =0.

  • La probabilità che si verifichi un qualunque evento

elementare sarà sempre ≤ 1

  • Regola del complemento: La probabilità di un evento

complementare (A-soprasegnato) sarà = 1 − 𝑃(𝐴)

  • La probabilità di un evento A appartenente ad un

sottoinsieme dell’evento B (𝐴 ⊆ 𝐵) sarà sempre ≤ alla

probabilità che si verifichi B.

  • Regola della somma: Generalizzando il terzo assioma, la probabilità congiunta di due eventi qualsiasi

P(A∪B) è uguale alla somma della probabilità di ciascun evento considerato singolarmente meno la

probabilità dell’intersezione P(A∩B). L’intersezione deve essere sottratta perché altrimenti verrebbe

conteggiata sia in P(A) che in P(B). → Qualora i due eventi fossero disgiunti, l’intersezione

corrisponderebbe ad un insieme vuoto e pertanto la formula si riduce a quella del terzo assioma.

DIVERSI MODI PER FORMULARE UNA FUNZIONE DI PROBABILITÀ

Esistono diverse tecniche per calcolare la probabilità di un evento, tutte in grado di rispettare gli

assiomi visti in precedenza. Tali impostazioni si differenziano in: classica, frequentista e soggettivista.

- IMPOSTAZIONE CLASSICA

Secondo tale impostazione la probabilità che si verifichi un evento A è data dal rapporto tra casi

favorevoli (cardinalità di A) e casi possibili (cardinalità di Ω), sotto condizione che i casi per cui

l’evento A si verifica siano equiprobabili.

Tale probabilità è molto semplice da calcolare ma fornisce risultati in contesti molto limitati (giochi di

sorte e simili) e una definizione tautologica, ovvero richiede che venga già assunta la situazione di

equiprobabilità a priori.

La condizione “con ripetizione” significa che a seguito

dell’estrazione la pallina viene reinserita nell’urna e lo spazio

degli eventi rimane inalterato. È possibile, pertanto, che la

stessa pallina venga estratta più volte, fino ad un massimo

dovuto al numero di estrazione. La condizione inversa, ovvero

“senza ripetizione”, fa si che tale pallina estratta non venga

reinserita nell’urna, andando cosi a ridurre di una cardinalità lo

spazio degli eventi. Per evitare problemi di confusione

solitamente si numerano le palline in modo da associare ad

esse ciascun evento possibile dello spazio degli eventi. Essendo 17 le palline totali avremo un 𝛺 = 17.

Il numero complessivo delle possibilità di estrazione viene dato da 𝛺

3

, dove la potenza è il numero di

ripetizioni. In maniera analoga il numero di possibili estrazioni favorevoli è dato da 10

3

. Pertanto la

probabilità dell’evento A si ottiene:

La probabilità dell’evento B si ottiene modificando il numeratore, in quanto il denominatore rimane

invariato poiché lo spazio degli eventi rimane costante. L’evento B si verifica se solo una pallina su tre

è bianca, non tenendo conto della posizione di estrazione (prima estratta, seconda estratta, terza

estratta) e pertanto la probabilità di tale evento è sicuramente maggiore rispetto ad un evento del tipo

C=”la prima pallina estratta è bianca”; inoltre è necessario che le altre due estratte siano rosse, e ciò

presenta un’analogia con il calcolo svolto per la provabilità dell’evento A. Per calcolare la probabilità di

B, pertanto, sarà necessario considerare il numero di casi possibili di estrazione per il numero di

ripetizioni ( 7 × 3 = 21 ) e moltiplicarlo per la probabilità che esca una pallina rossa in entrambe le

altre due estrazioni ( 10 × 10 = 10

2

). Pertanto:

Qualora si tenesse conto della posizione di estrazione (prima, seconda, terza estratta) della pallina

bianca, il numero di probabilità dell’evento B si riduce poiché il numero degli eventi favorevoli

all’estrazione di una singola pallina bianca in una determinata posizione passa da 21 a 7 (

𝑃

( 𝐵

)

3

- IMPOSTAZIONE FREQUENTISTA

Si chiama così poiché la probabilità di un determinato

evento si calcola in relazione alla frequenza relativa

degli esiti favorevoli, dato un determinato ammontare 𝑛

di eventi studiati. Si basa sulla condizione di ripetibilità,

almeno ideale, dell’esperimento per un numero finito 𝑛

di volte, solitamente molto grande (𝑛 → ∞).

Per calcolare la probabilità, pertanto, si ripete

l’esperimento 𝑛 volte e si contano gli esiti favorevoli

𝑛(𝐴) dell’evento studiato. La probabilità dell’evento A

corrisponde al limite del rapporto tra eventi favorevoli e

spazio degli eventi, per 𝑛 → ∞. Tale rapporto corrisponde alla frequenza relativa.

→ Supponendo di lanciare 𝑛 = 1000 volte una moneta, la probabilità che si verifichi l’evento “esce

testa” converge intorno a valori pari a 0,5 (sebbene dopo pochi lanci tale valore di P(A) potrebbe

essere fortemente variabile).

verificarsi di un evento altera la probabilità (o l’aspettativa) del verificarsi dell’altro.Definiamo

pertanto:

P(B) = probabilità marginale

P(B|A) = probabilità condizionata

  • La prima equazione è la definizione di indipendenza appena

formulata.

  • La seconda formula consente di calcolare la probabilità

marginale dell’evento B

  • La terza equzione invece ci consente di calcolare la probabilità

dell’evento intersezione sapendo le probabilità marginali di due

eventi indipendenti (→ regola di calcolo)

  • Dividendo la terza equazione per P(B) ottengo una quarta formula che ci permette di constatare che

l’indipendenza non ha una direzione precisa, ovvero se due eventi sono indipendenti P(B|A) = P(B) e

P(A|B) = P(A).

Qualora una qualsiasi di queste relazioni non sia verificata possiamo affermare che non siamo in

condizioni di indipendenza e, pertanto, i due eventi sono legati da un certo livello di dipendenza.

P(A) =1/2 poiché la probabilità che esca testa al primo lancio è

la stessa per ogni lancio

P(B)=3/8 poiché è dato dal numero di tentativi (3) moltiplicato

per la probabilità che esca testa ad ogni lancio [(

1

2

3

].

P(A∩B)=1/4 poiché le probabilità di tale evento sono due su

otto (TTC e TCT)

Osservando infine il valore di P(B|A) notiamo che è diverso da

quello di P(B), pertanto i due eventi sono dipendenti.

P(A)=1/2 come in precedenza

P(B)=1/4 poiché sono soltanto due i casi favorevoli su otto

possibili

P(A∩B)= 1/8 poiché c’è solo un esito favorevole su otto

P(B|A)=1/4=P(B), ovvero la probabilità condizionata è uguale

alla probabilità marginale, pertanto i due eventi sono

indipendenti.

TEOREMA DI BAYES

È un teorema che prende in esame eventi che hanno una relazione di causa-effetto. Tale teorema serve

per calcolare la probabilità di ciascun possibile evento-causa, dato il verificarsi di un evento-effetto. Si

tratta pertanto di calcolare la probabilità condizionata di ciascun possibile evento-causa.

Data una serie di eventi appartententi a contesti differenti, possiamo

vedere ciascun evento A come l’effetto di possibili altri eventi, che ne

costituiscono le cause (𝐶

1

𝑘

). Un esempio possibile è che dato un

evento A=”Ho la febbre” esistono differenti malattie “𝐶

𝑘

” che

potrebbero esserne la causa scatenante ed avere come effetto

appunto A. Dato tale esempio, con il teorema di Bayes possiamo

calcolare la probabilità che ciascuna possibile causa (malattia) sia

responsabile del verificarsi del determinato evento-effetto A (febbre),

ovvero la probabilità condizionata di ciascun effetto-causa, dato per

certo il verificarsi dell’evento-effetto A.

→ Per applicare il teorema è necessario innanzitutto calcolare le probabilità marginali di ciascun

evento-causa e poi applicare la formula seguente.

Teorema di Bayes

La probabilità della i-esima causa condizionata da A è uguale al rapporto tra:

  • al numeratore: prodotto tra la probabilità marginale della i-esima causa e la probabilità dell’evento A

condizionata dalla i-esima causa (assume valori compresi tra 0 e 1)

  • al denominatore: sommatoria del prodotto tra la probabilità marginale totale delle j-esime cause e la

probabilità totale dell’evento A condizionata dalle j-esime cause (assume valori pari a 1)

→ Per calcolare la probabilità che un effetto osservato sia prodotto esattamente da una determinata

causa 𝑖, occorre moltiplicare la probabilità della particolare causa per la probabilità che tale causa

possa generare l’effetto A e dividere per la sommatoria del prodotto delle probabilità marginali di tutte

le possibili cause e la probabilità che tali eventi possano aver causato l’evento osservato A.

Dati:

1

=“Il paziente ha l’influenza”

𝐴= “Il paziente ha la febbre”

Allora:

- P (𝐶

1

) sarà la probabilità che ha un soggetto di prendere l’influenza

- P (𝐴|𝐶

1

) sarà la probabilità che un paziente che ha l’influenza manifesti il sintomo della febbre

- P (𝐶

1

|𝐴) sarà la probabilità che un paziente abbia l’influenza sapendo che ha la febbre

N.B. Il teorema di Bayes pertanto mi fornisce un risultato opposto alla probabilità condizionata vista

finora, in quanto tale probabilità condizionata andava a calcolare la probabilità che una determinata

conseguenza (febbre) potesse verificarsi dato il verificarsi di una possibile causa (influenza).

Abbiamo a che fare con una variabile casuale discreta quando posso associare un numero naturale ad

ogni possibile realizzazione; abbiamo a che fare con una variabile casuale continua quando questa può

assumere un qualunque numero reale in un certo intervallo.

  • Le variabili casuali discrete sono associate all’operazione di conteggio (es. numero di esami sostenuti

da uno studente casuale)

  • Le variabili casuali continue sono associate all’operazione di misurazione (es. durata di una

lampadina)

VARIABILI CASUALI DISCRETE

Analogamente a quanto fatto nell’analisi delle distribuzioni di frequenza per caratteri discreti e

continui, anche per le variabili casuali occorre studiare i due casi di distinti.

Per tale variabile casuale il risultato è un numero intero e, pertanto, la funzione di probabilità ad essa

associata darà dei valori appartenenti all’insieme 𝑁 dei numeri naturali.

FUNZIONE DI PROBABILITÀ

È una particolare funzione matematica che ha come argomento ogni possibile realizzazione della

variabile casuale. Nel nostro esempio la variabile casuale può assumere valori compresi tra 0 e 3, dove

3 è appunto il numero di lanci della moneta. Per essere tale, la funzione di probabilità dovrà

necessariamente possedere determinati requisiti:

1° La funzione di probabilità deve restituire sempre valori non

negativi, pertanto ⨍(𝑥) ≥ 0.

2° La funzione di probabilità ⨍(x) ha sempre somma pari a 1:

sommando ciascun valore assunto dalla funzione ⨍(x) per ciascun

evento elementare 𝑥, tale valore sarà pari a 1.

3° Il valore assunto dalla funzione per un dato valore 𝑥 è pari alla

probabilità che si verifichi la variabile casuale X per tale valore della 𝑥.

Pertanto ⨍( 2 ) = 𝑃(𝑋 = 2 ).

DISTRIBUZIONE DI PROBABILITÀ

Questa tabella ricorda la distribuzione di frequenze relative. In particolare, in questa

tabella andiamo ad elencare i possibili valori distinti 𝑥

𝑖

della variabile casuale

(carattere). Tale distribuzione disaggregata risulta utile quando abbiamo poche

realizzazioni plausibili (modalità). Nella prima colonna vengono le elencate le 𝑥

𝑘

possibili realizzazioni. Nella seconda colonna viene riportata la ⨍(𝑥

𝑘

) probabilità

relativa a ciascuna realizzazione.

Nel 𝑙𝑎𝑛𝑐𝑖𝑜 𝑑𝑖 𝑡𝑟𝑒 𝑚𝑜𝑛𝑒𝑡𝑒 lo spazio degli eventi è pari ad 8, ciò significa

che sono possibili 8 combinazioni diverse. Il numero di realizzazioni

possibili va da 0 (non esce mai testa) a 3 (esce sempre testa), poiché le

monete vengono lanciate tre volte. Per ogni esito 𝑥

𝑖

è associato un

determinato valore di ⨍(x), ovvero la probabilità che si verifichi quel

particolare esito, corrispondente appunto alla frequenza relativa degli esiti compatibili. L’aggregazione

degli esiti favorevoli equivale ad un’operazione di spoglio dei dati.

Data una classe di studenti vogliamo calcolare la probabilità, per

ciascun voto di esame analizzato, che lo studente estratto casualmente

abbia preso tale voto (esito). La probabilità totale, ottenuta sommando

le probabilità marginali di ciascun possibile esito (=voto) danno come

risultato un valore =1. Tali probabilità marginali, in questo specifico

caso, corrispondono alle frequenze relative di tale voto.

ELABORAZIONE DI DISTRIBUZIONI DISCRETE

Data una distribuzione di probabilità con variabili casuali discrete è possibile ricavare da essa,

mediante particolari indici di sintesi, delle informazioni utili per confrontare distribuzioni diverse.

Analogamente a quanto visto per le distribuzioni di frequenza, riprenderemo degli indici statistici e li

adatteremo alla disciplina del calcolo delle probabilità.

VALORE ATTESO (o SPERANZA MATEMATICA) → MEDIA ARITMETICA

Analogamente a quanto visto per le distribuzioni di frequenza, anche per la probabilità è possibile

calcolare un indice 𝜇 oppure 𝑬(𝒙) che ci consente di cogliere la tendenza generale (media) degli esiti.

Tale indice assume valori ≥ 0

VARIANZA (≥0)

In questo contesto la varianza può essere interpretata come misura di incertezza di un particolare

esito oppure come indice di volatilità dei risultati.

In questo ambito la varianza può assumere valori:

  • = 𝟎, quando è possibile un solo valore (esito) della 𝑥 → variabilità nulla / evento certo
  • > 𝟎, quando sono possibili più valori (esiti) della 𝑥 → variabilità / evento possibile

La varianza è un indice che altera l’unità di misura originale poiché la eleva al quadrato. Per ovviare

tale problema si utilizza la deviazione standard.

DEVIAZIONE STANDARD (≥0)

Come analogamente visto in precedenza, la deviazione standard si ottiene:

In ambito di inferenza statistica si utilizzano solitamente solo valore atteso, varianza e deviazione

standard, anche se con le dovute modifiche è possibile calcolare qualsiasi altro indice.

Riprendendo l’esempio dei voti e calcolando le rispettive

colonne della media aritmetica e del momento secondo, il

valore della varianza e della deviazione standard in tale

distribuzione si otterranno semplicemente facendo:

Anche qui siamo in presenza di incertezza.

RAPPRESENTAZIONI GRAFICHE DELLA FUNZIONE DI PROBABILITÀ (variabile discreta)

- GRAFICO AD ASTE

Tale grafico ad aste avrà nell’asse delle ordinate i valori assunti

dalla funzione di probabilità per ciascuna realizzazione considerata,

ovvero le frequenze relative degli esiti, e nell’asse delle ascisse

l’insieme delle possibili realizzazioni.

- FUNZIONE DI RIPARTIZIONE

Essendo la funzione di probabilità ⨍(x) una funzione matematica, possiamo indicare con 𝑭(𝒙) la

funzione di ripartizione per cui la probabilità della variabile casuale 𝑋 sia ≤ di un certo valore 𝑥.

Pertanto:

La funzione di ripartizione F(x) si ottiene in tre modi diversi, a seconda del valore della 𝑥.

  • Nel primo caso il valore della funzione di ripartizione assume valore 𝑭(𝒙) = 𝟎 perché la realizzazione

considerata, essendo inferiore alla realizzazione minima possibile, sarà sicuramente impossibile e

pertanto la probabilità che si verifichi è nulla, ovvero 𝑷(𝒙 < 𝒙 𝟏

) = 𝟎 (es. probabilitò che si verifichi un

voto di esami minore di 18).

  • Nel secondo caso, dato un certo valore dell’argomento 𝑥 della funzione di ripartizione 𝐹(𝑥), devo

trovare una coppia di possibili realizzazioni consecutive (𝑥 𝑖

𝑖+ 1

) che contengano tale argomento. Una

volta individuati tali valori, la funzione di ripartizione assumerà come valore la probabilità che la

variabile casuale sia minore o uguale al più piccolo di tali valori individuati, ovvero 𝑭(𝒙) = 𝑷(𝑿 ≤ 𝒙 𝒊

  • Nel terzo caso il valore della funzione di ripartizione assume valore 𝑭(𝒙) = 𝟏 perché la realizzazione

considerata, essendo minore o uguale alla realizzazione massima possibile, corrisponderà alla

certezza, per cui 𝑷(𝒙 ≥ 𝒙

𝒌

) = 𝟏 (es. probabilità che si verifichi un voto minore o uguale a 30 e lode).

Tali punti evidenziati in rosso corrispondono alle probabilità cumulata di ciascun esito, hanno

coordinate (𝒙

𝒊

𝒊

) e possono essere assimilati alle frequenze relative cumulate. Congiungendo

tutti i punti si ottiene un grafico a gradini non decrescente e con valori di 𝐹(𝑥) compresi tra 0 e 1

analogo a quanto visto nella funzione di ripartizione dei caratteri discreti, in quanto la funzione

assume valori sensati solo per tali punti (≠variabili casuali continue, sensate in tutto l’intervallo).

  • Per costruire un grafico ad aste è necessario riportare

sul grafico i valori di ⨍(x), ovvero della probabilità

marginale di ciascun esito (seconda colonna).

  • Per costruire la funzione di ripartizione F(x) è necessario invece

calcolare la probabilità cumulata delle i-esime realizzazioni (terza

colonna)

Se volessi calcolare la probabilità di un esito pari a 2,5 otterrei dei

valori non sensati e pertanto dovrei considerare come valori 2 o 3.

MODELLI STATISTICI

Se una variabile casuale ha un range di realizzazioni molto grande è opportuno utilizzare dei modelli

statistici o modelli probabilistici. Tale modello si traduce in una formula predefinita della funzione di

probabilità che dipende da una o poche costanti prefissate. Tali costanti si chiamano parametri del

modello. A seconda della fattispecie di indagine statistica il modello varia.

DISTRIBUZIONE DI BERNOULLI

Si utilizza quando abbiamo delle variabili casuali binarie, ovvero che possono assumere solo due

possibili valori, tipicamente 0 e 1. Nella realtà è molto frequente incontrare delle variabili casuali

binarie, poiché tali valori assunti possono corrispondere a due risultati che sottolineano la

presenza/assenza di un determinato attributo (es. indagine marketing: voglio sapere se un cliente è

soddisfatto, valore 1, oppure non soddisfatto. valore 0). Tali variabili binarie pertanto sono il risultato

(o il punto di partenza) di una operazione di codifica.

DISTRIBUZIONE BINOMIALE

Tale distribuzione generalizza (e include) la distribuzione di Bernoulli. La distribuzione binomiale si

utilizza ogni volta che abbiamo una variabile casuale discreta che può assumere valori compresi tra 0 e

un valore limite prefissato, indicato con 𝒏. Analogamente a prima, tale modello ci fornisce una formula

unica per determinare la probabilità tale che:

  • 𝒑 è il parametro del modello e può essere associato alla probabilità di successo

𝒏!

𝒙!(𝒏−𝒙)!

è il fattore binomiale e corrisponde al numero di combinazioni

  • 𝒙 è il numero di successi in 𝑛 prove

→ La seconda parte è molto simile alla formula del modello di Bernoulli se non fosse che all’esponente

del secondo fattore figura (𝑛 − 𝑥). Tuttavia, se 𝑛 = 1 , la seconda parte torna ad essere quella di

Bernoulli e, inoltre, si può dimostrare che

𝑛!

𝑥!(𝑛−𝑥)!

= 1 e pertanto la formula della distribuzione

binomiale torna ad essere esattamente uguale alla formula di Bernoulli.

Anche la distribuzione binomiale definisce il valore atteso e la varianza, pertanto:

  • il valore atteso è uguale a → 𝑬(𝒙) = 𝒏𝒑
  • la varianza è uguale a → 𝑽

→ Anche tali formule generalizzano quelle viste prima, poiché per 𝑛 = 1 otteniamo gli stessi valori.

Per quanto concerne la rappresentazione grafica della funzione di probabilità e della funzione di

ripartizione della distribuzione binomiale, essendo il numero di realizzazioni possibili >2, il grafico

sarà necessariamente differente da quello della distribuzione di Bernoulli.

Il diagramma ad aste assume un andamento inizialmente crescente

e poi decrescente, con un unico massimo. Al variare del valore

prefissato del paramentro 𝑝 le aste del grafico variano di intensità,

più precisamente:

  • se 𝑝 aumenta le aste a destra diventano più alte (aumenta la

probabilità dei valori → 𝑛)

  • se 𝑝 diminuisce le aste a sinistra diventano più alte (aumenta la

probabilità dei valori → 0.

→ Tale grafico è simmetrico per valori di 𝑝 = 0 , 5

La funzione di ripartizione assume la tipica forma a gradini poiché il

numero di realizzazioni 𝑛 + 1 è un numero intero e pertanto non

possono essere considerati i valori intermedi alle singole unità.

Anche nella distribuzione binomiale la funzione di ripartizione è

sempre non decrescente e assume valori compresi tra 0 e 1.

La variabile casuale binomiale si utilizza ogniqualvolta abbiamo un numero di possibile di esiti

compreso tra 0 e un valore 𝑛 prefissato. Più precisamente, si utilizza quando 𝑥 corrisponde al numero

di successi in 𝑛 prove indipendenti fra loro ed eseguite con la stessa probabilità di successo 𝑝.

Le 𝑛 ripetizioni di tale esperimento avvengono in

maniera indipendente l’una dall’altra e sotto la stessa

condizione di probabilità 𝑝. In questo esempio

avremo una distribuzione binomiale con 𝑛 = 5 e 𝑝 =

0 , 01 , ovvero la probabilità di estrarre un pezzo

difettoso è pari all’1%.

→ Il simbolo ~ (tilde) è il simbolo usato universalmente in statistica per definire una distribuzione; ciò

che definisce la natura della distribuzione è l’elemento successivo, in questo caso 𝑿~𝑩𝒊𝒏, che indica

appunto la distribuzione binomiale. I valori di 𝑛 e 𝑝 vengono indicati tra parentesi e nell’ordine

rappresentato.

La distribuzione binomiale è il numero delle volte che osservo un determinato esito in un numero 𝑛 di

prove indipendenti ed equiprobabili. In caso di una sola prova, la distribuzione binomiale diventa una

distribuzione di Bernoulli.

Sotto tali parametri della distribuzione binomiale la funzione di probabilità darà i seguenti risultati:

⨍(0) vuol dire la probabilità che su 5 estrazioni ci siano 0

risultati favorevoli al verificarsi di X=”numero pezzi difettosi in 5

estrazioni”.

→ Per convenzione 0! = 1 , pertanto il fattore binomiale si

semplifica.

⨍(1) vuol dire la probabilità che su 5 estrazioni ci sia 1 risultato

favorevole al verificarsi di X=”numero pezzi difettosi in 5

estrazioni”.

→ Il fattore binomiale corrisponde al numero di sequenze binarie

che mi danno un determinato valore della 𝑥.

  • Per 𝑥 = 0 esiste una sola sequenza binaria possibile, ovvero

quella per cui tutti gli esiti osservati non verificano l’evento.

  • Per 𝑥 = 1 ci sono 5 possibili sequenze binarie affinchè si

verifichi una sola estrazione di pezzi difettosi, poiché tale pezzo

estratto potrebbe essere estratto in 5 posizioni differenti.

All’aumentare degli esiti favorevoli diminuisce la probabilità che

tali esiti si verifichino.

L’esempio di distribuzione di Poisson evidenzia le differenze

con la distribuzione binomiale, in quanto non è più presente

un numero limitato di esperimenti e, pertanto, il numero di

esiti favorevoli viene conteggiato su un totale indefinito.

La distribuzione di Poisson viene indicata con 𝑿~𝑷𝒐𝒊𝒔 e tra parentesi viene indicato il valore del

parametro 𝜆. Tale valore sta a significare che il valore atteso di clienti che verificano 𝑋, ovvero che

contattano il call-center in un’ora, è pari a 5 = 𝜆.

Come si vede dai calcoli, prefissato il valore di 𝜆 = 5 , la

probabilità ⨍(0) è molto bassa e tende ad aumentare

avvicinandosi al valore atteso.

LEGAME TRA DISTRIBUZIONE BINOMIALE E DISTRIBUZIONE DI POISSON

La distribuzione di Poisson può essere vista come una approssimazione della distribuzione binomiale.

Infatti:

Il limite, per 𝑛 (numero di prove) che tende ad infinito, di una probabilità di un valore 𝑥 calcolata sotto

il modello binomiale è uguale alla probabilità di tale valore 𝑥 calcolata sotto il modello di Poisson.

Pertanto, in una distribuzione binomiale con un numero molto elevato di tentativi, il valore della

probabilità può essere approssimato mediante un modello di Poisson, risolvendo i problemi di calcolo

legati ad un fattoriale molto elevato. Tale approssimazione fornisce valori attendibili e accurati se il

rapporto tra

𝒏

𝒑

Data una distribuzione binomiale con 𝑛 = 100 e un valore di 𝑝 =

0 , 15 , tale che

𝑛

𝑝

= 666 , 67 , possiamo calcolare la probabilità di

ciascuna realizzazione direttamente con la formula di Poisson, il

cui valore fornisce una approssimazione affidabile del valore.

VARIABILI CASUALI CONTINUE

Anche nel caso delle variabili casuali continue si andrà ad associare all’esito di un esperimento un

certo valore numerico reale relativo alla probabilità. Tale valore numerico sarà un qualsiasi numero

reale appartenente all’intervallo (es. misurazione dell’altezza si un soggetto estratto casualmente). Le

variabili casuali continue vengono solitamente analizzata mediante procedimenti di misurazione. La

distribuzione di probabilità viene formalizzata tramite una funzione di densità.

FUNZIONE DI DENSITÀ

È una funzione molto diversa dalla funzione di probabilità. La necessità di utilizzare tale tipologia di

funzione è data dal fatto che la variabile casuale può assumere qualsiasi valore dell’intervallo e quindi

non avrebbe senso definire la probabilità di ciascun singolo valore.

La funzione di densità si indica sempre con ⨍(x) e affinchè venga definita correttamente, deve

soddisfare due requisiti:

  • sempre non negativa (può assumere valore 0) nell’intervallo considerato
  • l’integrale di 𝒇𝒙𝒅𝒙 = 𝟏 sia nell’intervallo (−∞; +∞) che nell’intervallo (𝑙 1

2

), dove 𝑙

1

è il valore

minimo ammissibile della variabile casuale e 𝑙 2

il valore massimo.

Queste due condizioni sono analoghe ai requisiti della funzione di probabilità nel caso discreto.

  • La prima condizione è identica
  • La seconda varia leggermente, poiché mentre nel caso discreto i

singoli valori possono essere contati singolarmente mediante una

sommatoria, nel caso continuo non è possibile quindi si utilizza

l’integrale. Il totale deve coincidere con la probabilità massima (1).

Pertanto, essendo la funzione di densità definita mediante un integrale definito, il grafico sarà del tipo:

L’area evidenziata in rosso è pari ad 1

La funzione di densità mi da la probabilità di un certo

intervallo, ovvero la probabilità che un determinato valore 𝑥

giaccia in un determinato intervallo definito (𝑙

1

2

È dimostrabile che la probabilità nell’intervallo non

varia se decidiamo arbitrariamente di includere /non

includere gli estremi dell’intervallo. Tale condizione è

valida solo per le variabili casuali continue, poiché la

probabilità di un singolo valore reale in un intervallo

reale è pari a 0.

Se volessimo calcolare la probabilità dell’intervallo

(𝑎, 𝑏) dovremo pertanto calcolare l’integrale

definito di tale intervallo. L’area evidenziata

assumerà valori compresi tra 0 e 1.