Statistica inferenziale | Appunti di Statistica Inferenziale

CAPITOLO 12

Probabilità

Un esperimento in cui esiti non possono essere previsti con certezza è chiamato

esperimento causale. Esempi di esperimenti casuali sono: il lancio di una moneta

osservandone il risultato, l'osservazione della frequenza dei pezzi difettosi di una catena di

montaggio e l'osservazione della variazione giornaliera di un indice di borsa.

La singola esecuzione di un esperimento casuale è detta prova. Ci sono esperimenti casuali

che possono essere eseguiti ripetutamente in condizioni identiche e altri che possono essere

concepiti come tali. Un esempio del primo tipo di esperimento e il lancio di una moneta no

un esperimento in cui un determinato farmaco viene somministrato a cavie può essere

considerato ripetibile, sostanzialmente nelle stesse condizioni, se si assume che le cavie

usate siano simili nelle loro caratteristiche rilevanti.

Una caratteristica degli esperimenti casuali è che i possibili esiti sono noti e specificati prima

che l'esperimento venga eseguito. Il singolo esito è chiamato evento elementare ed è

indicato con 𝜔 . L'insieme di tutti gli eventi elementari è chiamato spazio campionario ed è

indicato con Ω . A volte lo spazio campionario sarà costruito con l’ausilio di un dramma

chiamato albero degli eventi.

Esempi

1) Si descriva l'esperimento che consiste nel lanciare tre volte una moneta e

nell'osservare le facce che si presentano. In un singolo lancio si può uscire testa (T) o

croce (C). Lo spazio campionario è dato da Ω=

{𝑇𝑇𝑇,𝑇𝑇𝐶,𝑇𝐶𝑇,𝑇𝐶𝐶,𝐶𝑇𝑇,𝐶𝑇𝐶,𝐶𝐶𝑇,𝐶𝐶𝐶}.

2) Si descriva lo spazio campionario dell'esperimento che consiste nel lanciare una

moneta ripetutamente finché non esce testa. Lo spazio campionario

dell'esperimento è costituito da un'infinità numerabile di elementi: Ω=

{𝑇,𝐶𝑇,𝐶𝐶𝑇,𝐶𝐶𝐶𝑇,…}.

3) Si immagini di osservare la durata di una lampadina elettrica prodotta da una certa

azienda produttrice di materiale elettrico. Si definisca lo spazio campionario

connesso all'esperimento. I possibili risultati dell'esperimento sono tutti i numeri

reali dell'intervallo[0,𝑇], dove T è la durata massima desumibile dalle caratteristiche

tecniche del processo produttivo. Si può allora scrivere Ω={𝜔: 0≤𝜔≤𝑇}.

Spazi campionari costituiti da un numero finito o da un'infinità numerabile di elementi si

chiamano discreti; quelli costituiti da un'infinità non numerabile di elementi si dicono

continui. Un evento è un sottoinsieme dello spazio campionario Ω . Un evento si realizza se

si manifesta uno degli eventi elementari che lo compongono.

Richiami insiemistica

Siano A e B due eventi arbitrari dello spazio campionario Ω . Allora:

• L'evento unione di A e B, indicato con𝐴∪𝐵 , è formato da tutti gli eventi elementari

che appartengono ad A, a B o a entrambi;

• l'evento intersezione di A e B, indicato con𝐴∩𝐵 , è formato da tutti gli eventi

elementari che appartengono sia ad A che a B. I due eventi si dicono disgiunti o

incompatibili se non hanno nessun evento elementare in comune, cioè se 𝐴∩𝐵=∅ ;

• l'evento complementare di A, indicato con 𝐴, è formato da tutti gli eventi elementari

di Ω che non appartengono ad A.

Anteprima parziale del testo

Scarica Statistica inferenziale e più Appunti in PDF di Statistica Inferenziale solo su Docsity!

CAPITOLO 12

Probabilità

Un esperimento in cui esiti non possono essere previsti con certezza è chiamato

esperimento causale. Esempi di esperimenti casuali sono: il lancio di una moneta

osservandone il risultato, l'osservazione della frequenza dei pezzi difettosi di una catena di

montaggio e l'osservazione della variazione giornaliera di un indice di borsa.

La singola esecuzione di un esperimento casuale è detta prova. Ci sono esperimenti casuali

che possono essere eseguiti ripetutamente in condizioni identiche e altri che possono essere

concepiti come tali. Un esempio del primo tipo di esperimento e il lancio di una moneta no

un esperimento in cui un determinato farmaco viene somministrato a cavie può essere

considerato ripetibile, sostanzialmente nelle stesse condizioni, se si assume che le cavie

usate siano simili nelle loro caratteristiche rilevanti.

Una caratteristica degli esperimenti casuali è che i possibili esiti sono noti e specificati prima

che l'esperimento venga eseguito. Il singolo esito è chiamato evento elementare ed è

indicato con 𝜔. L'insieme di tutti gli eventi elementari è chiamato spazio campionario ed è

indicato con Ω. A volte lo spazio campionario sarà costruito con l’ausilio di un dramma

chiamato albero degli eventi.

Esempi

1) Si descriva l'esperimento che consiste nel lanciare tre volte una moneta e

nell'osservare le facce che si presentano. In un singolo lancio si può uscire testa (T) o

croce (C). Lo spazio campionario è dato da Ω =

2) Si descriva lo spazio campionario dell'esperimento che consiste nel lanciare una

moneta ripetutamente finché non esce testa. Lo spazio campionario

dell'esperimento è costituito da un'infinità numerabile di elementi: Ω =

3) Si immagini di osservare la durata di una lampadina elettrica prodotta da una certa

azienda produttrice di materiale elettrico. Si definisca lo spazio campionario

connesso all'esperimento. I possibili risultati dell'esperimento sono tutti i numeri

reali dell'intervallo

[

]

, dove T è la durata massima desumibile dalle caratteristiche

tecniche del processo produttivo. Si può allora scrivere Ω = {𝜔: 0 ≤ 𝜔 ≤ 𝑇}.

Spazi campionari costituiti da un numero finito o da un'infinità numerabile di elementi si

chiamano discreti ; quelli costituiti da un'infinità non numerabile di elementi si dicono

continui. Un evento è un sottoinsieme dello spazio campionario Ω. Un evento si realizza se

si manifesta uno degli eventi elementari che lo compongono.

Richiami insiemistica

Siano A e B due eventi arbitrari dello spazio campionario Ω. Allora:

L'evento unione di A e B, indicato con𝐴 ∪ 𝐵 , è formato da tutti gli eventi elementari

che appartengono ad A, a B o a entrambi;

l'evento intersezione di A e B, indicato con𝐴 ∩ 𝐵 , è formato da tutti gli eventi

elementari che appartengono sia ad A che a B. I due eventi si dicono disgiunti o

incompatibili se non hanno nessun evento elementare in comune, cioè se 𝐴 ∩ 𝐵 = ∅ ;

l'evento complementare di A, indicato con 𝐴, è formato da tutti gli eventi elementari

di Ω che non appartengono ad A.

Funzione di probabilità

Una misura di probabilità è una funzione definita su una data famiglia di sottoinsiemi

(eventi) di Ω che soddisfa le seguenti proprietà:

(a) 𝑃(𝐴) ≥ 0 , per ogni evento A;

(b) 𝑃(Ω) = 1 ;

(c) 𝑃(𝐴

) + ⋯, per ogni sequenza di eventi disgiunti.

La proprietà (a) stabilisce che la probabilità è non negativa. La probabilità (b) assegna

probabilità 1 all'evento certo che uno qualsiasi degli eventi elementari si verifichi. La

probabilità (c) asserisce che, dati due o più eventi disgiunti, la probabilità che uno di essi si

realizzi è pari alla somma delle loro probabilità.

I tre assiomi enunciati costituiscono i fondamenti della teoria della probabilità e sono

conosciuti come assiomi della probabilità. Dai tre assiomi si possono derivare le seguenti

ulteriori proprietà per la funzione proprietà:

𝑃(∅) = 0 ;
𝑃(𝐴) ≤ 1 , per ogni evento A;
𝑃(𝐴) = 1 − 𝑃(𝐴), per ogni evento A;
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵), dove A e B sono due eventi arbitrari.

Le funzioni di probabilità possono essere assegnate secondo tre impostazioni:

Impostazione classica : la probabilità dell'evento A è il rapporto tra il numero di casi

favorevoli al verificarsi di A e il numero totale di casi possibili, purché questi siano

equiprobabili. Questa concezione presenta due chiari limiti: in primo luogo, soffre di

circolarità, impiegando l'espressione eventi elementari ugualmente probabili nella

definizione di probabilità, in secondo luogo, è applicabile solo quando gli eventi

elementari sono equiprobabili. - >𝑃(𝐴) =

|𝐴|

|Ω|

Impostazione frequentista: Se si ripete un esperimento un gran numero di volte

nelle stesse condizioni, ciascuno dei possibili eventi si verificherà con frequenza

relativa approssimativamente uguale alla sua probabilità, e l'approssimazione

ordinariamente aumenterà all'aumentare del numero delle prove. L'interpretazione

frequentista, richiedono che l'esperimento sia ripetibile, non copre il campo degli

eventi non ripetibili la cui incertezza può essere comunque espressa in termini

probabilistici. P(A) è il lim

𝑛→∞

𝑛

( 𝐴

)

𝑛

. numeratore è il numero di volte in cui A si verifica, il

denominatore è il numero di prove da fare.

Impostazione soggettivista : la probabilità di un evento è il grado di convinzione che

un individuo ha, sulla base delle informazioni possedute in un dato momento, nel

verificarsi dell'evento.

Si consideri la partizione dello spazio campionario Ω formata dai k eventi 𝐶

𝑘

. Ehi

allora, per qualsiasi evento A tale che 𝑃

> 0 , La probabilità di 𝐶

𝑖

, ammesso che A si sia

verificato, è data da 𝑃(𝐶

𝑖

𝑃

( 𝐶 𝑖

) 𝑃

( 𝐴

| 𝐶 𝑖

∑ 𝑃(𝐶

𝑗

)𝑃(𝐴|𝐶

𝑗

𝑘

𝑗= 1

Questa formula è nota come teorema di Bayes. 𝑃(𝐶

𝑖

|𝐴|) è conosciuta come probabilità a

posteriori, mentre 𝑃(𝐶

𝑖

) è chiamata probabilità a priori della causa𝐶

𝑖

Esempio

Si hanno due urne: la prima, 𝑈

,contenente 4 palline bianche e 6 nere; la seconda, 𝑈

contenente 3 palline bianche e 5 nere. Si estragga a sorte un'urna e poi una pallina dall'urna

selezionata. Qual è la probabilità che l’urna selezionata sia 𝑈

, sapendo che è stata estratta

una pallina bianca?

Indicando con A, 𝐶

gli eventi: “pallina bianca”, “selezione urna 𝑈

” e “selezione urna

”, si ha 𝑃

𝑃(𝐶

)𝑃(𝐴|𝐶

𝑃(𝐶

)𝑃(𝐴|𝐶

|)+𝑃(𝐶

)𝑃(𝐴|𝐶

( 1 / 2 )( 4 / 10 )

( 1 / 2 )( 4 / 10 )+( 1 / 2 )( 3 / 8 )

CAPITOLO 13

Variabili casuali

Dato lo spazio campionario Ω di un esperimento casuale, una variabile causale è una

funzione definita su Ω che associa un numero reale x ogni evento elementare 𝜔 di Ω.

Variabile discreta

Una variabile causale X è detta discreta se può assumere un numero finito o infinità

numerabile di valori. Indicato con x uno specifico valore della variabile casuale X, la

probabilità da assegnare a questo valore è data dalla probabilità che si verifichi uno degli

eventi elementari in cui X=x.

L'insieme dei valori che la variabile casuale X può assumere con i rispettivi livelli di

probabilità costituisce la distribuzione di probabilità di X. per una variabile casuale avente k i

valori, la distribuzione di probabilità può essere presentata in una tabella:

x P(X=x)

𝑘

La distribuzione di probabilità può essere anche espressa tramite la funzione 𝑓

𝑘

, denominata funzione di probabilità , che gode delle due ovvie

proprietà:

𝑓(𝑥) ≥ 0 , per ogni x

= 1 , sommatoria estesa a tutti i valori di X

La distribuzione di probabilità può essere descritta tramite la funzione di ripartizione , F(x), la

quale associa ogni valore di x di X la somma delle probabilità corrispondenti a x e a tutti i

valori inferiori: 𝐹(𝑥) = 𝑃(𝑋 ≤ 𝑥) = ∑ 𝑓(𝑡) , 𝑡 ≤ 𝑥.

La funzione di ripartizione che gode delle seguenti proprietà:

È definita per ogni x;
Assume valori nell’intervallo [ 0 , 1 ];
È una funzione non decrescente in x.

La rappresentazione grafica della funzione di probabilità f(x) si effettua mediante un sistema

di assi cartesiani, ponendo sull'asse delle ascisse i valori di X e su quello delle ordinate le

corrispondenti probabilità, usualmente raffigurate con aste. La rappresentazione grafica

della F(x) dà luogo invece a un grafico gradini.

Se si aumenta N o si diminuisce 𝛿 il profilo del grafico tende a una curva che assume la veste

e il significato di funzione di densità. Una funzione f(x) Ehi può essere considerata una

funzione di densità se non negativa e se l'area al di sotto di essa è uguale a 1.

a probabilità che la variabile casuale X assuma un valore compreso tra a e b è raffigurata con

l’area sotto la curva descritta dalla funzione f(x) nell’intervallo (a, b). in termini matematici,

la probabilità in questione espressa da𝑃

𝑏

𝑎

. Questa probabilità può

essere espressa come differenza tra i valori assoluti della funzione di ripartizione in b e in a:

La media e la varianza di una variabile casuale continua sono espresse dagli integrali: 𝜇 =

+∞

−∞

+∞

−∞

𝑓(𝑥) 𝑑𝑥. Come nel caso discreto, la media indica l'ordine di

grandezza del fenomeno aleatorio rappresentato dalla variabile casuale, mentre la

deviazione standard ne mette in luce il grado di dispersione attorno alla media.

Considerata la distribuzione di probabilità di una variabile casuale continua, descritta dalla

funzione di ripartizione F(x), fissato un livello di probabilità p, si chiama quantile di livello p

la quantità 𝑥

𝑝

In corrispondenza della quale la funzione di ripartizione assume il valore p:

𝑝

= 𝑝. Poiché𝐹

𝑝

è interpretabile come l'area al di sotto della curva di

densità a sinistra di𝑥

𝑝

, il quantile di livello p il punto dell'asse delle ascisse alla cui sinistra

l'area sotto la curva di densità è uguale a p.

Data la variabile casuale X, discreta continua, avente media 𝜇 e varianza 𝜎

, richiama

variabile casuale standardizzata la quantità 𝑌 =

(𝑋−𝜇)

𝜎

. Ogni variabile casuale standardizzata a

media 0 e varianza 1.

Generalizzando questa idea, si considerino n prove bernoulliane indipendenti, ciascuna con

la stessa probabilità p di successo, e sia X la variabile casuale che conta quante volte si

verifica l'evento successo. L'obiettivo è quello di determinare la distribuzione di probabilità

di questa variabile casuale.

La variabile casuale discreta, X, ha distribuzione binomiale se la sua funzione di probabilità è

espressa da𝑓(𝑥) =

𝑛!

𝑥!(𝑛−𝑥)!

𝑥

𝑛−𝑥

, 𝑥 = 0 , 1 , … , 𝑛 dove 0<p<1, n numero intero positivo.

La media e la varianza della distribuzione binomiale di parametri n e p sono date da:

E(X)=np, Var(X)=np(1-p).

Osservazioni

Se p=0.5 la distribuzione è simmetrica, se p>0.5 la distribuzione è asimmetrica negativa, se

p<0.5 la distribuzione è asimmetrica positiva.

Distribuzione di Poisson

Una variabile casuale discreta, X, ha distribuzione di Poisson se la sua funzione di

probabilità espressa da𝑓

𝜆

𝑥

𝑥!

−𝜆

, 𝑥 = 0 , 1 , 2 , …, dove il parametro 𝜆 è una costante

positiva.

La media e la varianza della distribuzione di Poisson sono date da E(X)=𝜆 Var(X)=𝜆.

La distribuzione di Poisson trova applicazione quando il fenomeno aleatorio consiste nel

contare le occorrenze di un evento casuale in un dato intervallo di tempo o di spazio. Il

modello è approssimato nei casi in cui la probabilità dell'evento aleatorio è molto piccola.

Per questo motivo è nota anche come legge degli eventi rari. Si può dimostrare che la

distribuzione di Poisson è asimmetrica positivamente e che l'asimmetria diminuisce

all'aumentare di 𝜆. si può anche dimostrare che la distribuzione binomiale si avvicina alla

distribuzione di Poisson quando n diventa via via più grande e p via via più piccolo in modo

tale che np resti fisso e pari a 𝜆. questo risultato consente di usare la distribuzione di

Poisson per approssimare la distribuzione binomiale quando n è molto grande e poi p è

molto piccolo. Un criterio impiego per stabilire se la distribuzione di Poisson approssima

adeguatamente la distribuzione di binomiale è rappresentato dalla disuguaglianza n/p>500.

Caso continuo

Distribuzione normale (di Gauss)

Una variabile casuale continua, X, ha distribuzione normale se la funzione di densità è

espressa da𝑓

𝜎 √

2 𝜋

−

(𝑥−𝜇)

2 𝜎

con −∞ < 𝑥 < ∞ , dove 𝜇 𝑒 𝜎

sono due parametri tali che

La funzione densità ha le seguenti proprietà

È simmetrica rispetto a 𝑥 = 𝜇
È crescente nell’intervallo (−∞, 𝜇 ) e decresce nell’intervallo (𝜇, ∞ ), raggiunge il

massimo,

𝜎 √

2 𝜋

, per 𝑥 = 𝜇

Ha l’asse x come asintoto orizzontale, ossia lim

𝑥→±∞

Ha due punti di flesso in 𝑥 = 𝜇 − 𝜎 e 𝑥 = 𝜇 + 𝜎 , è concava (verso il basso)

nell’intervallo (𝜇 − 𝜎, 𝜇 + 𝜎 ) e convessa altrove.

La media e la varianza della distribuzione normale di parametri 𝜇 𝑒 𝜎

sono date da: 𝐸(𝑋) =

Per brevità si adotta la notazione 𝑋~𝑁(𝜇, 𝜎

) per indicare la variabile casuale X ha

distribuzione normale con media 𝜇 e varianza 𝜎

La media determina la posizione della curva di densità sull'asse delle ascisse. Ad esempio, ha

valori crescenti di 𝜇 corrispondono curve che si spostano verso destra punto la varianza

determina l'altezza e la larghezza della curva. Una varianza grande produce una curva

schiacciata e ampia; una varianza piccola dà luogo a una curva alta e stretta.

La distribuzione Norm è usata per descrivere un gran numero di fenomeni aleatori in vari

campi di applicazione, ma è anche usata per approssimare altre distribuzioni, come quella

binomiale quella di Poisson.

Funzione di ripartizione

Geometricamente, la funzione di ripartizione della distribuzione normale è l'area sottesa alla

curva a sinistra di x.

Tramite la funzione di ripartizione è possibile determinare la probabilità che X assuma un

valore appartenente a qualsiasi intervallo (a, b): P(a<X<b)=F(b)-F(a). In base a questa

relazione la probabilità che a<X<b è uguale alla differenza tra l'area sottesa alla curva a

sinistra di b (area in azzurro scuro + area in azzurro chiaro) e quella sottesa alla curva a

sinistra di a (area in azzurro scuro).

assuma un valore nell’intervallo (a, b) è uguale alla probabilità che la variabile casuale

normale standard N (0,1) assuma un valore nell’intervallo di estremi (

(𝑏−𝜇)

𝜎

(𝑎−𝜇)

𝜎

Probabilità e quantili tramite la tavola della distribuzione normale standard

Con la tavola è possibile calcolare, in modo approssimato, la probabilità che una variabile

casuale normale, con media e varianza date, assuma un valore nell’intervallo (a, b) dove a e

b sono numeri arbitrari. La tavola contiene i valori della funzione di ripartizione della

distribuzione normale standard per valori non negativi di z compresi tra 0 e 3.49, con un

passo di 0.01. I valori di Φ(𝑧) per i valori negativi di z possono essere ottenuti sfruttando la

relazione Φ

dove z è un numero positivo. Questa uguaglianza è illustrata nel

grafico qui sotto, in cuoi mostra che, data la simmetria della curva normale, per ogni z

positivo assegnato, l’area a sinistra di – z,Φ(−𝑧) , è uguale all’area a destra di z, 1 − Φ(𝑧).

Probabilità

Se la variabile casuale ha distribuzione normale standard, la probabilità 𝑃(𝑧

) si

ottiene immediatamente come𝑃(𝑧

) dove Φ(𝑧

) si

deducono dalla tavola.

Quantili

Se la distribuzione è normale standard, il problema è trovare il valore di z che soddisfa

l’equazione Φ(𝑧) = 𝑝, dove p è il livello di probabilità assegnato. La soluzione rispetto a z, 𝑧

𝑝

è il quantile.

Se p≥0.5, per la soluzione approssimata del problema con la tavola, è necessario individuare

all’interno di questa, la casella contenete la probabilità più vicina a p. Dopodiché 𝑧

𝑝

è il

numero con due cifre decimali che si ottiene combinando i valori di z della riga e della

colonna corrispondenti a quella casella.

Se p<0.5 si fa ricorso alla relazione Φ = 1 − Φ(𝑧): si individua, all'interno della tavola, la

probabilità più vicina a 1-p; si ricava, con lo stesso procedimento di prima, il valore

corrispondente di z, 𝑧

1 −𝑝

; infine si moltiplica per – 1 il valore così trovato. Il tutto è riassunto

dalla relazione 𝑧

𝑝

1 −𝑝

dove p<0.5.

I quantili di una distribuzione normale 𝑁(𝜇, 𝜎

), con media e varianza qualsiasi, possono

essere determinati così come segue:

Si calcola dapprima, il quantile 𝑧

𝑝

della distribuzione normale standard con il

procedimento illustrato sopra;

Si calcola poi il quantile 𝑥

𝑝

della distribuzione normale 𝑁(𝜇, 𝜎

) sfruttando la

relazione 𝑥

𝑝

Esempio

( 170 − 175 )

[

]

𝑝

= 175 + 12 ⋅ 1. 282 = 190. 384 (il 90%è al massimo 190.384)

1° decile 𝑝 = 0. 10 → 𝑥

𝑝

= 175 − 12 ⋅ 1. 282 = 159. 616 (perché 𝑧

𝑝

è negativo).

Distribuzione chi-quadrato

Una variabile casuale continua, X, ha distribuzione chi-quadrato se la sua funzione di

densità è espressa da 𝑓(𝑥) = 𝑎𝑥

𝑟

− 1

−

𝑥

, 𝑥 ≥ 0 , dove r è un numero intero positivo detto

gradi di libertà e a una costante positiva il cui valore dipende da r.

La funzione di densità è asimmetrica positivamente. L'asimmetria si attenua al crescere dei

gradi di libertà.

La media e la varianza della distribuzione chi-quadrato con r gradi di libertà sono date da:

E(X)=r, Var(X)=2r.

Quantili

Se r è piccolo utilizzo la tavola.

Se r tende a infinito, la distribuzione chi-quadrato tende alla normale con media r e varianza

2 r. Ne segue che, se r è sufficientemente grande, i quantili della distribuzione chi-quadrato

possono essere determinati sfruttando 𝑥

𝑝

⋅ √ 2 𝑟 dove 𝑧

𝑝

è il quantile di livello p

della normale standard.

Esempio

𝑝

≈ 100 − 1. 645 √ 200 ≈ 76. 74 (- perché 𝑧

𝑝

CAPITOLO 15

Distribuzioni di probabilità congiunte

Con riferimento a uno spazio campionario Ω , una variabile casuale doppia , (X, Y), è una

coppia di funzioni 𝑋(𝜔) e 𝑌(𝜔) che associa una coppia di numeri reali, (x, y), a ogni evento

elementare 𝜔 ∈ Ω.

Distribuzione di probabilità congiunta di due variabili casuali discrete

Una variabile casuale doppia (X, Y) si dice discreta se sia X sia Y sono discrete. Le probabilità

associate alle singole coppie di valori (x, y) assunti dalla variabile casuale doppia vengono

descritte con la funzione di probabilità congiunta così definita 𝑓(𝑥, 𝑦) = 𝑃(𝑋 = 𝑥, 𝑌 = 𝑦).

La funzione di probabilità congiunta gode delle due seguenti proprietà:

𝑥 𝑦

Quando sia X che Y assumono un numero limitato di valori, è utile rappresentare la

distribuzione di probabilità congiunta con una tabella a doppia entrata.

Esempio

Lancio 2 monete: Ω = {(𝑇, 𝑇), (𝑇, 𝐶), (𝐶, 𝑇), (𝐶, 𝐶)}

X= “numero di volte che esce testa”

𝜔 𝑃(𝜔 ) X Y

TT 1/4 2 0

TC 1/4 1 1

CT 1/4 1 1

CC 1/4 0 0

f (x, y) Y

X

Probabilità marginali

La funzione di probabilità di X, indicata con 𝑓

𝑋

, è data da 𝑓

𝑋

𝑦

, dove la

somma è estesa a tutti i possibili valori di Y. Analogamente, la funzione di probabilità di Y,

indicata con 𝑓

𝑌

, è data da 𝑓

𝑌

𝑥

, dove la somma è estesa a tutti i possibili

valori di X.

Le funzioni di probabilità 𝑓

𝑋

𝑌

si chiamano funzioni di probabilità marginali o

distribuzioni di probabilità marginali di X e di Y.

La media e la varianza della distribuzione di probabilità marginale di X sono date da:

𝑋

𝑥

𝑋

𝑥

𝑋

Analogamente, la media e la varianza della distribuzione di probabilità marginale di Y

sono:𝜇

𝑌

𝑦

𝑌

𝑦

𝑌

Esempio

f (x, y) Y

X

Probabilità condizionate

Considerata una variabile casuale doppia discreta (X, Y), la funzione di probabilità

condizionata di Y , dato che X assume il valore x, per il quale 𝑓

𝑋

> 0 , è definita da

𝑌|𝑋|

𝑓

( 𝑥, 𝑦

)

𝑓 𝑋

( 𝑥

)

, dove y varia nell’insieme dei possibili valori di Y. Analogamente, la

funzione di probabilità condizionata di X , dato che Y assume valore y, per il quale 𝑓

𝑌

è definita da 𝑓

𝑋|𝑌|

𝑓(𝑥, 𝑦)

𝑓

𝑌

(𝑦)

, dove x varia nell’insieme dei possibili valori di X.

Si noti che questa definizione ricalca quella di P(B/A), cioè quella di probabilità condizionata

che l’evento B si realizzi, dato che l’evento A si è realizzato. Qui, A è l’evento X=x e B

l’evento Y=y.

Indipendenza tra due variabili casuali

Due variabili casuali discrete X e Y si dicono indipendenti se, per ogni coppia (x, y), la

funzione di probabilità congiunta f (x, y) è uguale al prodotto delle funzioni di probabilità

marginali𝑓

𝑋

𝑌

𝑋

𝑌

L'indipendenza tra X e Y può essere espressa equivalentemente mediante le funzioni di

probabilità condizionate.

Date due variabili casuali discrete X e Y, per ogni coppia (x, y), tale che 𝑓

𝑋

𝑌

le seguenti condizioni sono equivalenti:

a) 𝑓

𝑌|𝑋|

𝑌

b) 𝑓

𝑋|𝑌|

𝑋

c) 𝑓

𝑋

𝑌

𝑥

𝑛

𝑥

𝑛

Funzione di densità congiunta (caso continuo)

𝑛

(integrale n volte)

Combinazioni lineari di n variabili casuali

Si considerano combinazioni lineari di n variabili casuali definite da 𝑌 = 𝑎

𝑛

𝑖

𝑛

𝑖= 1

𝑖

dove 𝑎

𝑛

sono costanti assegnate.

Siano date n variabili casuali 𝑋

𝑛

discrete o continue. La media e la varianza della

combinazione lineare 𝑌 = 𝑎

𝑛

𝑖

𝑛

𝑖= 1

𝑖

, sono date da:𝐸

𝑋 1

𝑋 2

𝑛

𝑋𝑛

𝑖

𝑛

𝑖= 1

𝑋𝑖

𝑋 1

𝑋 2

𝑛

𝑋𝑛

𝑖

𝑛 2

𝑖= 1

𝑋𝑖

𝑖

𝑛

𝑗=𝑖+ 1

𝑛− 1

𝑖= 1

𝑗

𝑖

𝑗

, dove

𝑋𝑖

sono la media e la varianza della i-esima variabile casuale 𝑋

𝑖

, mentre 𝐶(𝑋

𝑖

𝑗

) è la

covarianza tra 𝑋

𝑖

𝑗

Se si pone 𝑎

𝑛

, la combinazione lineare Y diventa la media aritmetica delle

variabili casuali 𝑋

𝑛

, che verrà indicata con 𝑋.

Siano date n variabili casuali 𝑋

𝑛

, indipendenti e tutte con la stessa media 𝜇 e la

stessa varianza 𝜎

. Allora la media aritmetica di queste variabili casuali, 𝑋 =

(𝑋

+𝑋

+⋯+𝑋

𝑛

)

𝑛

, ha

valore atteso e varianza date da: 𝐸(𝑋) = 𝜇, 𝑉(𝑋) =

𝜎

𝑛

CAPITOLO 16

Legge dei grandi numeri e teorema del limite centrale

Legge dei grandi numeri

La legge dei grandi numeri riguarda il comportamento, al crescere indefinito di n, della

distribuzione della media aritmetica𝑋

𝑛

di una sequenza di n variabili casuali𝑋

𝑛

indipendenti e tutte con la stessa distribuzione, che rappresentano il risultato di n repliche,

nelle stesse condizioni, di un esperimento casuale.

Siano date n variabili casuali 𝑋

𝑛

indipendenti e tutti con la stessa distribuzione (iid),

con valore atteso𝐸

𝑖

= 𝜇 e varianza 𝑉𝑎𝑟

𝑖

Sia 𝑋

𝑛

𝑖

𝑛

𝑖= 1

la media aritmetica di queste variabili casuali. allora per ogni 𝜀 > 0

piccolo a piacere, si ha lim

𝑛→∞

𝑛

− 𝜇| ≥ 𝜀) = 0 oppure, equivalentemente,

lim

𝑛→∞

𝑛

Teorema del limite centrale

Sia {𝑋

𝑛

} una successione di variabili casuali indipendenti e identicamente distribuite con E

𝑖

)= μ e Var (𝑋

𝑖

finita. Sia 𝑆

𝑛

𝑖

𝑛

𝑖= 1

la variabile casuale somma con E (𝑆

𝑛

)=nμ e Var

𝑛

) = n𝜎

. Allora: lim

𝑛→∞

( 𝑆 𝑛

−𝑛𝜇

)

√𝑛𝜎

Statistica inferenziale, Appunti di Statistica Inferenziale

Documenti correlati

Anteprima parziale del testo

Scarica Statistica inferenziale e più Appunti in PDF di Statistica Inferenziale solo su Docsity!

CAPITOLO 12

Probabilità

Un esperimento in cui esiti non possono essere previsti con certezza è chiamato

esperimento causale. Esempi di esperimenti casuali sono: il lancio di una moneta

osservandone il risultato, l'osservazione della frequenza dei pezzi difettosi di una catena di

montaggio e l'osservazione della variazione giornaliera di un indice di borsa.

La singola esecuzione di un esperimento casuale è detta prova. Ci sono esperimenti casuali

che possono essere eseguiti ripetutamente in condizioni identiche e altri che possono essere

concepiti come tali. Un esempio del primo tipo di esperimento e il lancio di una moneta no

un esperimento in cui un determinato farmaco viene somministrato a cavie può essere

considerato ripetibile, sostanzialmente nelle stesse condizioni, se si assume che le cavie

usate siano simili nelle loro caratteristiche rilevanti.

Una caratteristica degli esperimenti casuali è che i possibili esiti sono noti e specificati prima

che l'esperimento venga eseguito. Il singolo esito è chiamato evento elementare ed è

indicato con 𝜔. L'insieme di tutti gli eventi elementari è chiamato spazio campionario ed è

indicato con Ω. A volte lo spazio campionario sarà costruito con l’ausilio di un dramma

chiamato albero degli eventi.

Esempi

1) Si descriva l'esperimento che consiste nel lanciare tre volte una moneta e

nell'osservare le facce che si presentano. In un singolo lancio si può uscire testa (T) o

croce (C). Lo spazio campionario è dato da Ω =

2) Si descriva lo spazio campionario dell'esperimento che consiste nel lanciare una

moneta ripetutamente finché non esce testa. Lo spazio campionario

dell'esperimento è costituito da un'infinità numerabile di elementi: Ω =

3) Si immagini di osservare la durata di una lampadina elettrica prodotta da una certa

azienda produttrice di materiale elettrico. Si definisca lo spazio campionario

connesso all'esperimento. I possibili risultati dell'esperimento sono tutti i numeri

reali dell'intervallo

[

]

, dove T è la durata massima desumibile dalle caratteristiche

tecniche del processo produttivo. Si può allora scrivere Ω = {𝜔: 0 ≤ 𝜔 ≤ 𝑇}.

Spazi campionari costituiti da un numero finito o da un'infinità numerabile di elementi si

chiamano discreti ; quelli costituiti da un'infinità non numerabile di elementi si dicono

continui. Un evento è un sottoinsieme dello spazio campionario Ω. Un evento si realizza se

si manifesta uno degli eventi elementari che lo compongono.

Richiami insiemistica

Siano A e B due eventi arbitrari dello spazio campionario Ω. Allora:

che appartengono ad A, a B o a entrambi;

elementari che appartengono sia ad A che a B. I due eventi si dicono disgiunti o

incompatibili se non hanno nessun evento elementare in comune, cioè se 𝐴 ∩ 𝐵 = ∅ ;

di Ω che non appartengono ad A.

Funzione di probabilità

Una misura di probabilità è una funzione definita su una data famiglia di sottoinsiemi

(eventi) di Ω che soddisfa le seguenti proprietà:

(a) 𝑃(𝐴) ≥ 0 , per ogni evento A;

(b) 𝑃(Ω) = 1 ;

(c) 𝑃(𝐴

) + ⋯, per ogni sequenza di eventi disgiunti.

La proprietà (a) stabilisce che la probabilità è non negativa. La probabilità (b) assegna

probabilità 1 all'evento certo che uno qualsiasi degli eventi elementari si verifichi. La

probabilità (c) asserisce che, dati due o più eventi disgiunti, la probabilità che uno di essi si

realizzi è pari alla somma delle loro probabilità.

I tre assiomi enunciati costituiscono i fondamenti della teoria della probabilità e sono

conosciuti come assiomi della probabilità. Dai tre assiomi si possono derivare le seguenti

ulteriori proprietà per la funzione proprietà:

Le funzioni di probabilità possono essere assegnate secondo tre impostazioni:

favorevoli al verificarsi di A e il numero totale di casi possibili, purché questi siano

equiprobabili. Questa concezione presenta due chiari limiti: in primo luogo, soffre di

circolarità, impiegando l'espressione eventi elementari ugualmente probabili nella

definizione di probabilità, in secondo luogo, è applicabile solo quando gli eventi

elementari sono equiprobabili. - >𝑃(𝐴) =

nelle stesse condizioni, ciascuno dei possibili eventi si verificherà con frequenza

relativa approssimativamente uguale alla sua probabilità, e l'approssimazione

ordinariamente aumenterà all'aumentare del numero delle prove. L'interpretazione

frequentista, richiedono che l'esperimento sia ripetibile, non copre il campo degli

eventi non ripetibili la cui incertezza può essere comunque espressa in termini

probabilistici. P(A) è il lim

. numeratore è il numero di volte in cui A si verifica, il

denominatore è il numero di prove da fare.

un individuo ha, sulla base delle informazioni possedute in un dato momento, nel

verificarsi dell'evento.

Si consideri la partizione dello spazio campionario Ω formata dai k eventi 𝐶

. Ehi

allora, per qualsiasi evento A tale che 𝑃

> 0 , La probabilità di 𝐶