Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Distribuzioni di probabilità: concetti di base e tipologie, Appunti di Statistica

I concetti di base sulle distribuzioni di probabilità, comprese le variabili discrete e continue, la funzione di probabilità di massa, la funzione cumulata e la densità di probabilità. Vengono inoltre descritte tre tipologie di distribuzioni discrete: Bernoulli, Binomiale e Poisson.

Tipologia: Appunti

2019/2020

Caricato il 25/11/2020

romeorossi
romeorossi 🇮🇹

4.4

(27)

92 documenti

1 / 12

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Distribuzioni di probabilità
Benché specificato con esattezza nelle possibili modalità di rappresentazione, l’esito di un
fenomeno aleatorio non è noto a priori (ad esempio quando lancio un dado so che gli esiti potranno
essere i numeri da 1 a 6 ma non so quale sarà l’esito).
La distribuzione di probabilità è una funzione
f
x
che descrive analiticamente la probabilità associata
ai possibili valori della variabile casuale, dandone un modello per la curva di frequenza, cioè un
modello analitico per esprimere la probabilità con cui si verificano gli esiti possibili che conosco.
La formulazione è accompagnata dalla definizione della funzione di ripartizione o funzione
cumulata
Fx
. La funzione di ripartizione
Fx
è un’espressione analitica della cumulata che fissa il
modello per la curva di frequenza cumulata.
Variabili discrete e variabili continue
Le trattazioni differiscono tra variabili discrete (userò le sommatorie) e variabili continue (userò gli
integrali).
Le unità non numeriche sono per esempio il colore degli occhi, fuma o non fuma, titolo di studio
ecc..
Le unità numeriche possono essere continue o discrete.
Per esempio, per questo corso, le unità statistiche numeriche discrete sono:
il numero di servitori del sistema,
il numero di parti nel sistema,
il numero di parti su una risorsa.
mentre le unità statistiche numeriche continue sono:
i tempi di attraversamento,
i tempi di attesa,
il tasso di servizio,
il tasso di arrivo.
Le unità numeriche derivano da un processo di misura e costituiscono dati variabili quantitativi, a
loro volta continui o discreti (cioè se assumono qualsiasi valore in un intervallo oppure sono
vincolati ad un insieme finito di punti isolati).
Non è la presenza della virgola a stabilire se una variabile è continua o discreta.
Infatti se una variabile può assumere valori 2,15- 3,5- 6,25; la variabile poiché può assumere solo
questi 3 valori sarà discreta (non può assumere valori compresi nell’intervallo tra due numeri
generici).
1
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica Distribuzioni di probabilità: concetti di base e tipologie e più Appunti in PDF di Statistica solo su Docsity!

Distribuzioni di probabilità

Benché specificato con esattezza nelle possibili modalità di rappresentazione, l’esito di un

fenomeno aleatorio non è noto a priori (ad esempio quando lancio un dado so che gli esiti potranno

essere i numeri da 1 a 6 ma non so quale sarà l’esito).

La distribuzione di probabilità è una funzione

f

x

che descrive analiticamente la probabilità associata

ai possibili valori della variabile casuale, dandone un modello per la curva di frequenza, cioè un

modello analitico per esprimere la probabilità con cui si verificano gli esiti possibili che conosco.

La formulazione è accompagnata dalla definizione della funzione di ripartizione o funzione

cumulata

F

x

. La funzione di ripartizione

F

x

è un’espressione analitica della cumulata che fissa il

modello per la curva di frequenza cumulata.

Variabili discrete e variabili continue

Le trattazioni differiscono tra variabili discrete (userò le sommatorie) e variabili continue (userò gli

integrali).

Le unità non numeriche sono per esempio il colore degli occhi, fuma o non fuma, titolo di studio

ecc..

Le unità numeriche possono essere continue o discrete.

Per esempio, per questo corso, le unità statistiche numeriche discrete sono:

 il numero di servitori del sistema,

 il numero di parti nel sistema,

 il numero di parti su una risorsa.

mentre le unità statistiche numeriche continue sono:

 i tempi di attraversamento,

 i tempi di attesa,

 il tasso di servizio,

 il tasso di arrivo.

Le unità numeriche derivano da un processo di misura e costituiscono dati variabili quantitativi, a

loro volta continui o discreti (cioè se assumono qualsiasi valore in un intervallo oppure sono

vincolati ad un insieme finito di punti isolati).

Non è la presenza della virgola a stabilire se una variabile è continua o discreta.

Infatti se una variabile può assumere valori 2,15- 3,5- 6,25; la variabile poiché può assumere solo

questi 3 valori sarà discreta (non può assumere valori compresi nell’intervallo tra due numeri

generici).

Distribuzioni discrete

“Le variabili discrete sono assimilabili a delle gocce d’acqua..”

Per le variabili discrete lo spazio campionario è un insieme finito (cioè i valori che può assumere la

variabile discreta sono dei valori limitati all’interno di un insieme). La funzione di distribuzione

f

x

( x ) è detta probabilità di massa.

La variabile

x può assumere valori

x

1

, x

2

, … x

n

e a questi valori possiamo associare sia la funzione

di probabilità di massa f x

( x ) che la funzione cumulata F

x

( x ).

 La funzione probabilità di massa

f

x

( x ) ci dice qual è la probabilità che la variabile

X

assumi

valore

x

i

 La funzione cumulata F

x

( x ) ci dice qual è la probabilità che la variabile X assumi un valore

x

i

Affinché una funzione costituisca la probabilità di massa è fondamentale che sia non negativa e

produca cumulata unitaria sullo spazio campionario, cioè la somma di tutti i possibili valori in

corrispondenza di

x

i

è uguale ad 1 o che la funzione cumulata in corrispondenza dell’ultimo valore

x

n

è 1.

Questa legge è anche detta legge di inevitabilità perché non posso evitare che la x assuma un valore

all’interno dell’intervallo.

Valori attesi

Si definisce valore atteso di una trasformazione g ( X ) della variabile casuale X , con distinzione di

formulazione tra variabili discrete e variabili continue, la quantità scalare:

Per calcolare il valore atteso bisogna considerare una trasformazione della variabile. X è la

variabile, la trasformo tramite una funzione

g ( X ) .

Nel caso discreto eseguo una sommatoria del prodotto tra la funzione

g ( X ) e tutti i valori che

assume la funzione

f

x

( x

i

Nel caso continuo eseguo l’integrale del prodotto tra la funzione g ( X ) e la funzione f x

( x )

E’ immediato che:

 Il valore atteso di una costante restituisce la costante stessa.

Nel caso discreto: la funzione g ( X ) è una costante e va fuori dalla sommatoria, la

sommatoria di f

x

( x

i

) =1 (per le legge di inevitabilità) e dunque ottengo g ( X ).

Nel caso continuo: la funzione g ( X ) è una costante e va fuori dall’integrale, l’integrale di

f

x

( x )=1 e dunque ottengo g ( X ).

 Il valore atteso è un operatore matematico distributivo rispetto alla somma algebrica, se la

trasformazione

g ( X ) è una trasformazione ottenuta per somma algebrica di vari termini

possiamo sempre separare i termini grazie alla proprietà distributiva del valore atteso.

Media e varianza come valori attesi

Se la trasformazione g ( X ) coincide proprio con la variabile X calcolo il valore atteso della variabile

stessa e cioè la sua media (erroneamente quando si parla di valore atteso si sottintende solo una

trasformazione della g ( X ) nella variabile stessa, ma in realtà la funzione g ( X ) può subire qualsiasi

trasformazione).

Se la trasformazione g ( X ) consiste in una sottrazione tra la variabile e il suo valore atteso ed eleva

tutto al quadrato, sto calcolando la varianza della variabile.

Se la differenza tra la variabile X e la media E ( X ) la chiamo “scarto dalla media”, la g ( X )

rappresenta lo scarto dalla media al quadrato, cioè quello che si chiama scarto quadratico dalla

media. Se calcolo la varianza sto calcolando la media degli scarti quadratici dalla media. La

varianza si può esprimere anche come la differenza tra la media dei quadrati e il quadrato della

media.

E’ importante poter calcolare in questo modo media e varianza perché posso conoscere la media e la

varianza delle funzioni di distribuzione di probabilità senza avere i dati sperimentali ma solo

conoscendo la legge di distribuzione.

Media e varianza di una trasformazione lineare

La media di una trasformazione lineare si calcola come trasformazione lineare della media.

Cioè se

g ( X )= n + m X , il valore atteso che gode della proprietà distributiva separa i due addendi. Il

valore atteso della costante

n [ E ( n )] è uguale alla costante

n stessa. Il valore atteso di

m X [

E ( m X ) ]

è [

mE ( X ) ]

perché m è costante ed è portata fuori dall’operatore. Infine ottengo n + mE ( X ).

Dunque la trasformazione lineare che ha subito la variabile si riflette sul valore atteso.

Se calcolo allo stesso modo la varianza di questa trasformazione lineare, il valore n (valore che

determina lo scostamento dall’origine) scompare nel risultato finale. Dunque dipende solo dal

fattore di scala

m .

La varianza della variabile di destinazione dipende solo dal fattore di scala e non è influenzata dallo

spostamento dell’origine.

Probabilità congiunta di variabili indipendenti

Nel caso in cui le variabili congiunte siano indipendenti, si possono ulteriormente elaborare la

funzione probabilità di massa e la cumulata perché le posso esprimere come prodotto delle funzioni

riferite alla singola variabile. Se le variabili sono indipendenti:

 Caso discreto: la funzione probabilità di massa in funzione di

x , y può essere espressa

come prodotto della funzione probabilità di x e la funzione probabilità di y. In modo

analogo per la cumulata. Esprimo le funzioni di probabilità congiunta come prodotto delle

funzioni di probabilità a variabile singola, tali probabilità sono dette marginali.

 Caso continuo: la funzione cumulata in funzione di x , y può essere espressa come prodotto

della funzione cumulata di x e la funzione cumulata di y , da qui sarà poi ricavabile la

funzione densità di probabilità come prodotto delle due derivate delle due cumulate, ognuna

in funzione della propria variabile.

Ovvero: a prescindere dalla qualità discreta o continua della variabile casuale, i risultati sono

identici, ma formalmente vengono raggiunti con procedimenti diversi.

Probabilità congiunta per la somma algebrica

E’ possibile calcolare il valore atteso di una trasformazione lineare delle due variabili.

La trasformazione che io applico alla variabile si riflette poi sul valore atteso. Questa regola vale a

prescindere che le variabili

x , y siano dipendenti o indipendenti.

Passaggi commentati:

1. Inizialmente applico la sommatoria per tutti i valori

i , j (perché devo fare la somma per tutti i

possibili valori di x e per tutti i possibili valori di y ).

2. Scrivo all’interno della sommatoria la trasformazione e, per definizione di valore atteso,

moltiplico per il valore della funzione di probabilità congiunta.

3. Siccome le sommatorie sono distributive ho separato i due contributi. 4. Segue:

a è costante e va fuori dalla sommatoria. La sommatoria di

i si riferisce solo alla

x

(quindi posso separare le due sommatorie). Resta la sommatoria di

j e questa farà

riferimento alla funzione

f

xy

( x

i

, y

j

5. Trascuriamo il secondo addendo perché si ragiona in maniera analoga.

6. Troviamo poi

a che moltiplica la sommatoria di

i della sola funzione riferita alla

x [ x

i

f

x

( x

i

)]

. (Quando sommo la f

xy

( x

i

, y

j

) su tutti i valori di j , che sono i valori di y , perdo la

dipendenza da y ).

a moltiplica proprio la definizione di valore atteso della variabile stessa

x .

8. La soluzione sarà: aE ( x ) + bE ( y ). Dunque il valore atteso della trasformazione lineare delle

due variabili è la somma dei valori attesi di ogni singola variabile, moltiplicato per la

rispettiva costante.

Per la varianza non si verifica la stessa soluzione:

 Queste regole valgono sia per le variabili discrete che continue.

In definitiva:

Il valore atteso di una somma è uguale alla somma dei valori attesi. Questa regola vale sia per

variabili dipendenti che indipendenti.

La varianza di una somma è uguale alla somma delle varianze se e solo se le variabili sono

indipendenti. Infatti le covarianze sono nulle quando le variabili sono indipendenti.

Distribuzione Binomiale

Definizione: È la distribuzione B ( N , p ) discreta per la probabilità di ottenere un numero

x

i

di successi su

N

esperimenti di Bernoulli.

Dalla distribuzione di Bernoulli ottengo la distribuzione binomiale. Se invece di eseguire un

solo esperimento di Bernoulli eseguissimo N esperimenti di Bernoulli, tutti con la stessa

probabilità di successo p , la funzione di distribuzione sarà espressa dal coefficiente

binomiale moltiplicato il seguente termine:

Calcolo la probabilità di ottenere un numero di successi pari a

x

i

eseguendo N esperimenti.

Es.: Lancio 10 volte la moneta voglio vedere qual è la probabilità di ottenere due volte testa.

La curva che si ottiene inizia a richiamare la curva di Gauss, infatti al tendere di un numero

infinito di prove si può costruire la curva gaussiana. Le due curve nel grafico sono state

ottenute rispettivamente una con 30 esperimenti e l’altra con 20. Ad entrambe le curve

corrisponde una probabilità di successo pari a 0,5.

Media e Varianza:

Poiché in questo caso le variabili sono indipendenti la varianza può essere valutata come somma

delle varianze.

Distribuzione di Poisson

Il passaggio logico per passare dalla distribuzione binomiale a quella di Poisson qual è?

Quando consideriamo la distribuzione binomiale ci domandiamo qual è il numero di

successi che otteniamo eseguendo un certo numero di volte un esperimento. Nel caso della

distribuzione di Poisson voglio esprimere la probabilità di ottenere un certo numero di

successi, osservando un fenomeno di tipo continuo, in cui i successi si susseguono con una

certa frequenza. Ad esempio, una nascita all'interno del sistema è un fenomeno che si

verifica in modo discreto (perché arriva un pezzo, due pezzi e così via..) perché si verifica

con una certa cadenza che rappresenta proprio la frequenza.

Definizione: È la distribuzione discreta per la probabilità di ottenere

x

i

successi a

frequenza λ in un intervallo spaziale o temporale di ampiezza l.

La dimostrazione per ottenere la distribuzione di Poisson si basa su tre ipotesi. Trascuriamo

la dimostrazione e concentriamoci sulle ipotesi:

  1. La probabilità di successo è costante in tutti i sotto intervalli (con uguale ampiezza

Δl) che possiamo individuare,l) che possiamo individuare,

  1. Si considera un intervallo Δl) che possiamo individuare,l talmente piccolo in modo che in ognuno si possa

verificare al massimo un solo evento ,

  1. Le realizzazioni in qualsiasi sotto intervallo non sovrapposto devono essere fra loro

indipendenti.

Se le tre ipotesi sono rispettate è possibile applicare la distribuzione di Bernoulli, cioè

successo o fallimento, in ogni sotto intervallo. In tutto l'intervallo, ottenuto agganciando i

sotto intervalli tra loro, applico la distribuzione binomiale. Successivamente faccio tendere a

0 il Δl) che possiamo individuare,l, cioè sto andando verso un processo continuo e posso ricavare la distribuzione di

Poisson. La funzione di distribuzione è chiamata probabilità di massa perché ci dice la

probabilità di ottenere un certo numero di successi e la variabile è discreta.

La frequenza di successo può essere espressa in funzione dello spazio o del tempo.

Ad esempio per calcolare la probabilità di trovare 10 buche sull'asfalto in un tratto di 10 km,

devo conoscere con quale frequenza si presentano le buche sull’asfalto. Questa distribuzione