































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
appunti e sbobine di statistica base
Tipologia: Appunti
1 / 39
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!
































La statistica è una scienza empirica perché il fine è decifrare i dati incerti, prendere decisioni in condizioni di
incertezza--> metodo di studio di fenomeni collettivi, dato che si esaminano sempre tanti casi, non uno
solo... variabilità. È proprio il fatto che esistono casi diversi che danno il motivo di studiare questi casi.
I caratteri statistici possono essere:
discrete à assumono valori in un insieme discreto
continue à assumono valori in un intervallo
nominale: non ordinabile (es: genere maschile M e genere femminile F)
ordinabile: nomi delle persone
L’insieme di tutte le informazioni relative a un fenomeno di interesse costituisce la popolazione.
L’obiettivo della statistica è lo studio delle popolazioni.
La raccolta dei dati statistici:
Distribuzione di frequenza à si consideri un insieme di n unità statistiche sul quale è stato osservato un
carattere che assume modalità
m
1
,m
2
, … ,m
k
Si definisce frequenza assoluta di
m
i
il numero di volte che la modalità mi è stata osservata sulle n unità
statistiche e si indica con n.
Le classi devono essere:
a) Disgiunte: in modo che non ci sia ambiguità nell’attribuzione delle osservazioni alle classi. Si lascia
aperta la classe in uno dei due estremi
b) Esaustive: tutte le osservazioni devono poter essere collocate in una delle classi. La soluzione
consiste nell’utilizzare come ultima classe una classe aperta
c) Ampiezza: conviene che le classi siano tutte di uguale ampiezza, tuttavia se nella distribuzione dei
dati vi sono intervalli con una scarsa densità di osservazioni può essere opportuno costruire classi di
maggiore ampiezza per evitare classi vuote
d) Valore centrale: costituito dalla semi-somma degli estremi, sia rappresentativo della classe perché
nelle successive elaborazioni sarà utilizzato in sostituzione dei valori effettivi
Frequenza relativa à si considerano n unità statistiche sulle quali è stato osservato un carattere che assume
k modalità
m
1
,m
2
, … ,m
k
Si definisce frequenza relativa
f
i
di
m
i
il rapporto fra il numero di volte
n
i
nelle
quali la modalità mi è stata osservata e la numerosità n. Quindi f =
n
i
n
e inoltre la somma delle frequenze
relative è a pari a 1.
La frequenza relative
f
i
moltiplicata per 100 indica la percentuale di volte nelle quali è stata osservata la
modalità
m
i
sulle n unità statistiche.
i= 1
k
f
i
n
1
n
n
2
n
n
k
n
Istogramma
L’istogramma è un grafico mediante il quale rappresentare la distribuzione di frequenza di un carattere
quantitativo.
1.le basi di rettangoli sono costituite dalle classi
Area dei rettangoli coincida con la frequenza relativa.
Distribuzione simmetrica
Distribuzione asimmetrica positiva
Distribuzione asimmetrica negativa
prof ( med )=
n+ 1
Se n è dispari mediana
x+ x
Proprietà 1
Sia y una trasformazione lineare di x, Y=ax+b
La mediana di Y è la trasformazione lineare della mediana x
Med (Y)=a med(x)+b
Proprietà 2
Siano x1- med, x2-med, ..., xn med gli scarti dalla mediana. Il numero di scarti positivi è uguale al numero di
scarti negativi.
Proprietà 3
La mediana è quel valore che minimizza la somma degli scarti in valore assoluto
i= 1
n
I x−med I=min
i= 1
n
I x−α I
La moda
La moda di una variabile statistica x, che assume valori
x
1
, x
2
, … , x
n
con frequenze
n
1
, n
2
,… ,n
k
, è il valore
di X al quale corrisponde la massima frequenza.
La varianza è il più importante indice di variabilità e, al tempo stesso, di disposizione intorno alla media. Sia
x una variabile statistica che assume i valori
x
1
, x
2
, … , x
n
e ha media x, la varianza è data da:
s
2
n
i= 1
n
( x−x )
2
La varianza indica qual è la concentrazione dei dati intorno alla media, fornendo informazioni sull’ordine di
grandezza degli scarti x-
x delle osservazioni dalla media. Poiché la somma degli scarti è nulla (gli scarti
positivi e gli scarti negativi si compensano) la loro media non da informazioni sulla dispersione dei dati
intorno a x. Pertanto, la varianza è calcolata come media degli scarti al quadrato.
Esempio: varianza di (1,2,5,6,7,9) la media è 5
s
2
2
2
2
2
2
Quando i dati sono raggruppati in classi, analogamente a quanto avviene per la media, non è possibile
calcolare il valore esatto della varianza.
Proprietà della varianza
La disuguaglianza di Chebyshev motiva ulteriormente il ricorso alla varianza come indice di dispersione
intorno alla media. Sia X una variabile statistica come media x e varianza s
2
; è possibile dimostrare che
fr
I X −x I <ε
s
2
ε
2
Dove fr ( I X −x I <ε ) è la frequenza relativa con la quale X assume valori nell’intervallo (x−ε , x +ε ).
La disuguaglianza di Chebyshev afferma che una qualsiasi variabile X assume valori in un intorno della
media, di semi-ampiezza ε, con la frequenza relativa almeno pari a
s
2
ε
2
La disuguaglianza di Chebyshev fornisce un limite inferiore per la frequenza. Quando la varianza diminuisce
questo limite aumenta; ma se aumenta la frequenza con la quale X assume valori intorno a x, ciò significa
che la distribuzione è più concentrata intorno alla sua media.
Sia s
x
2
la varianza di una variabile X, la varianza di una trasformazione lineare Y=aX+b è data da
s
Y
2
=s
aX+ b
2
=a
2
s
x
2
La varianza è indipendente dalla posizione: se si effettua una traslazione dei dati, aggiungendo a ciascuna
osservazione una stessa quantità b, la varianza rimane invariata. Se si altera l’unità di misura dei dati,
moltiplicandoli per una costante non nulla a, la varianza risulta modificata di conseguenza.
Poiché la varianza e lo scarto quadratico medio dipendono dall’unità di misura e dall’ordine di grandezza
dei dati, quando la variabile assume soltanto valori positivi, può essere conveniente utilizzare il coefficiente
di variazione
s
x
La differenza interquartile misura la variabilità del 50% dei dati che si trovano al centro della distribuzione.
Per definire questo indice è necessario introdurre i quartili. Essi dividono i dati in quattro parti uguali: il
primo quartile
1
si lascia a sinistra il 25% dei dati, il secondo quartile si lascia a sinistra il 50% dei dati e
coincide con la mediana e il terzo quartile si lascia a sinistra il 75% delle osservazioni.
La profondità del primo quartile è data da
prof
1
[ prof ( med) ]+ 1
Se la profondità del primo quartile è un numero intero,
1
è dato dall’osservazione che occupa la posiziona
corrispondente nella sequenza ordinata; altrimenti il primo quartile è dato da
1
( [
prof (
Q
1
) ]
)
( [
prof (
Q
1
) ]
Il terzo quartile viene calcolato in maniera speculare a partire dall’ultima osservazione.
La differenza interquartile è data da
DQ=
3
1
e fornisce indicazione sulla variabilità della metà centrale dei dati.
Eventuali relazioni fra due variabili possono essere rappresentate con un grafico a dispersione. Esso è un
grafico che usa le coordinate cartesiane per rappresentare i valori di due variabili. I dati sono rappresentati
da punti, a ciascuno dei quali corrisponde una coordinata sull’asse orizzontale data dal valore di una
variabile e una coordinata sull’asse verticale data dal valore dell’altra variabile.
l’angolo a destra in alto, ciò suggerisce un’associazione positiva.
basso a destra, ciò suggerisce un’associazione negativa.
Molte decisioni sono prese in condizioni di incertezza.
Il calcolo delle probabilità si può definire come “la logica del possibile o dell’incerto” poiché tratta di
proposizioni alle quali non è possibile associare con certezza l’attributo vero o l’attributo falso ma soltanto
l’attributo possibile.
Le proposizioni di interesse per il calcolo della probabilità prendono il nome di eventi casuali. Per definirli è
necessario introdurre il concetto di esperimento casuale.
Si definisce esperimento casuale o prova qualsiasi fenomeno del mondo reale per il quale vi è più di un
risultato possibile e pertanto l’esito è incerto. Un esperimento casuale è un fenomeno alla cui
manifestazione è associato uno stato di incertezza.
Si indicano con
ω
1
, ω
2
, … , ω
n
i possibili risultati di un esperimento casuale. L’insieme S di tutti i possibili
risultati
S=(ω
1
, ω
2
, … , ω
n
è definito SPAZIO CAMPIONARIO.
In un sondaggio di opinione che prevede le risposte “molto favorevole”, “favorevole”, “contrario” e “molto
contrario”, ciascuna risposta costituisce un possibile risultato dell’esperimento. Si può ora definire un
evento casuale: esso è proposizione non ambigua formulabile intorno a un esperimento casuale.
Gli eventi (casuali) possono essere rappresentati come sottoinsiemi dello spazio. I sottoinsiemi di S costituiti
da singoli elementi prendono il nome di eventi elementari.
Se si considera come sottoinsieme (improprio) di S lo stesso spazio campionario, esso rappresenta
all’evento che si verifica se uno qualsiasi dei possibili risultati dell’esperimento si verifica. poiché uno di tali
risultati deve necessariamente verificarsi, allora S prende il nome di evento certo.
Si consideri il sottoinsieme di S che non contiene alcun elemento, cioè l’insieme vuoto ∅ ; poiché uno dei
possibili risultati dell’esperimento necessariamente si verifica. Esso prende il nome di evento impossibile.
Uno strumento molto utile per visualizzare gli eventi è il diagramma di Venn. Vi sono tre operazioni che si
possono fare con gli eventi: l’intersezione, l’unione e la negazione.
eventi A e B, l’ intersezione A ∩ Bè costituita dagli elementi di S comuni sia ad A sia a B. Pertanto,
l’intersezione è l’evento che si verifica quando si verificano contemporaneamente A e B.
eventi A e B, l’ unione A ∪ B è costituita dagli elementi di S che appartengono soltanto ad A
oppure soltanto B oppure entrambi. Pertanto, l’unione di A e B è l’evento che si verifica quando si
verifica quando si verifica soltanto A oppure si verifica soltanto B oppure si verificano
contemporaneamente A e B.
costituito dagli elementi di S che non appartengono ad A. Esso rappresenta quindi un evento che si
verifica quando A non si verifica e pertanto viene chiamato negazione di A
contemporaneamente. In tal caso A e B non hanno elementi in comune e la loro intersezione è
l’evento impossibile,
. Se sono incompatibili a due a due saranno incompatibili a tre a tre
schema di scommesse. La probabilità di un evento è la somma che un individuo coerente è disposto a
scommettere per ricevere una somma unitaria se l’evento si verifica e zero altrimenti.
Secondo la definizione soggettivista la valutazione della probabilità di un evento è compiuta da un individuo
sulla base delle informazioni a lui disponibili. Pertanto, è possibile assegnare una probabilità a qualsiasi
evento casuale, sicché la definizione soggettivista è applicabile nell’ambito di qualsiasi esperimento casuale.
Il dibattito sulla definizione della probabilità trova una sua composizione con l’impostazione assiomatica. La
probabilità è definita mediante alcuni postulati dai quali si ricavano tutte le sue proprietà.
Postulato 1
Per qualunque evento A la probabilità è non negativa
Postulato 2
La probabilità dell’evento certo è 1
Postulato 3
Siano A e B due eventi incompatibili, la probabilità della loro unione è data dalla somma delle probabilità
Teorema 1
Dato un evento A, la probabilità della sua negazione è
Per dimostrare questo risultato si produce osservando che A e A sono necessari, A ∪ A=S, il che implica
P ( A ∪ A) =P( S )= 1. Inoltre, A e A sono incompatibili
Teorema 2
La probabilità dell’evento impossibile è nulla, P ( ∅ )= 0
L’evento impossibile è la negazione dell’evento certo e pertanto si ha P ( ∅ )= 1 −P ( S)= 0
Teorema 3
Per un qualunque evento A si ha
Per il teorema 1 si ha P ( A )= 1 P( A). Poiché per il primo postulato P( A) è non negativa, la probabilità di
A non può essere maggiore di 1.
Teorema 4
Dati due eventi A e B, la probabilità dell’unione è data
L’evento “unione di A e B” può essere ottenuto anche come unione di eventi incompatibili
; di conseguenza per il terzo postulato si ha P ( A ∪ B)=P ( A) + P( A ∩ B).
Quando gli eventi elementari sono equiprobabili (cioè hanno tutti la stessa probabilità di verificarsi) e in
numero finito, la probabilità di un evento A si ottiene come rapporto fra casi favorevoli e casi possibili.
Siano
1
2
n
gli eventi elementari dello spazio campionario S generato da un esperimento. Se essi
sono equiprobabili ossia
1
2
n
Ciascuno ha probabilità 1/n, cioè
i
n
i= 1, 2, …, n
Sia A un evento costituito dall’unione di k degli n eventi elementari equiprobabili, si ha P ( A )=
k
n
Probabilità condizionata
Vi sono circostanze nelle quali l’informazione sul verificarsi di un evento modifica la valutazione della
probabilità di un altro evento. La probabilità di un evento si modifica in seguito all’informazione relativa al
verificarsi di un altro evento e si parla perciò di probabilità condizionata.
posto P(B)>0.
Quando si calcola la probabilità di A dato B, l’evento B deve essere vero; esso assume quindi il ruolo di
evento certo e rappresenta il nuovo insieme dei possibili risultati dell’esperimento. Inoltre, A può verificarsi
solo se il risultato dell’esperimento è un elemento di A che appartiene anche a B. Pertanto, l’evento
possibile non è più A ma A ∩ B. Si può ottenere anche ka probabilità dell’intersezione di due eventi A e B
che risulta P ( A ∩B )=P ( A ) P ( B I A ) o alternativamente P ( A ∩B )=P ( B ) P ( A I B )
Molti esperimenti sono schematizzabili come estrazioni di unità da un insieme. Quando l’estrazione
riguarda più unità è rilevante la modalità con la quale essa avviene. In particolare, si distingue fra estrazione
in blocco ed estrazione con rimessa.
1- Nel primo caso l’unità estratta viene eliminata dall’insieme
2- Nel secondo caso l’unità estratta viene rimessa dall’insieme
Quando l’estrazione avviene in blocco vi è dipendenza fra le prove e il calcolo della probabilità di eventi
definiti in funzione del risultato di due o più estrazioni richiede il ricorso alla probabilità condizionata.
La probabilità condizionata può essere utilizzata per calcolare la probabilità di un evento A qualora siano
note: la probabilità di un altro evento B e le probabilità condizionate P (A I B) e P( A I B).
Il teorema di Bayes può essere applicato anche a più eventi di interesse
1
2
n
, necessari e
incompatibili, la cui probabilità può essere aggiornata disponendo dell’informazione che si è verificato un
evento B. Si generalizza così il confronto a n ipotesi in presenza delle quali può essersi verificato l’evento B.
Si indichi con P(
i
) la probabilità a priori dell’evento
i
, per i=1, 2, …, n, e con P(B I A) la probabilità
probativa o verosimiglianza di B dato A. La probabilità a posteriori dell’evento
i
è data da
i
i
i
j= 1
n
j
j
ELEMENTI DI CALCOLO COMBINATO
Nell’ambito del calcolo delle probabilità può sorgere l’esigenza di contare quanti sono i possibili risultati di
un esperimento. In questo contesto quanti sono i possibili risultati di un esperimento. Si supponga di avere
n elementi e n posti. Le diverse sequenze che si possono ottenere disponendo gli n elementi negli n posti
sono definite permutazioni. Si vuole determinare quale sia il numero
n
di tutte le possibili permutazioni.
Quando si sceglie l’elemento da collocare al primo posto, si può scegliere fra n elementi. Per il secondo
posto la scelta è limitata fra n-1 elementi rimanenti. Di conseguenza vi sono n(n-1) modi di riempire i primi
due posti. Per il terzo posto, la scelta è limitata fra n-2 elementi.
n
=n( n− 1 ) ( n− 2 ) … ( 2 ) ( 1 )= 1!
Se i posti disponibili per allocare gli n elementi sono m, dove m<n, il numero delle diverse sequenze
ordinate, definite disposizioni, che si possono ottenere è D
D=n ( n− 1 ) ( n− 2 ) … ( n−m+ 1 )=
n!
( n−m)!
Infine, si supponga di essere interessati ai modi nei quali si possono scegliere m elementi da un insieme che
ne contiene n, ma di non essere interessati all’ordine con il quale si dispongono gli elementi. Sequenze che
contengono gli stessi elementi ordinati in modo diverso non vengono distinte. Tali sequenze sono definite
combinazioni. Per ottenere il numero delle combinazioni C si osserva che vi sono m! sequenze ordinate che
contengono gli stessi elementi.
m!
n!
m !( n−m)!
n
m
Probabilità congiunte
I concetti introdotti fino a questo punto sono utili per schematizzare situazioni nelle quali si è interessati a
due caratteri statistici che possono essere osservati congiuntamente come risultato di un’unica rilevazione.
Si consideri un esperimento casuale i cui possibili risultati sono costituiti dalle coppie di modalità
(m ¿
¿ i ,l
j
)¿, i=1, 2, …, k e j=1, 2, …, h dei caratteri M e L.
A ciascuna coppia di modalità
(m
i
,l
j
è associata una probabilità congiunta
p
ij
. L’insieme delle probabilità
congiunte
p
ij
, per i= 1, 2, …, k e j= 1, 2, …, h costituisce la distribuzione di probabilità congiunta dei due
caratteri M e L. Il suo studio è essenziale per l’analisi della dipendenza esistente fra i due caratteri. Per il
primo postulato le probabilità congiunte sono non negative,
p
ij
per qualunque i e j
La somma delle loro probabilità deve essere pari a 1.
i= 1
k
j= 1
h
p
ij
Si indichi con
1
l’evento “il carattere M ha assunto la modalità
m
1
” e si supponga di voler conoscere la sua
probabilità. L’evento
1
si verifica quando si verifica
11
oppure
12
…oppure
1 h
. Pertanto, l’evento
1
è
rappresentato nel seguente modo:
1
11
12
1 h
La probabilità di
1
è definita probabilità marginale perché l’interesse si è spostato dalla coppia di caratteri
M e L al solo carattere M.
In generale, sia
i
l’evento “il carattere M assume la modalità
m
1
”, la probabilità marginale si ottiene
sommando le probabilità congiunte che si trovano sulla i.
p
i
= p
i 1
i 2
ih
Per i= 1, 2, …, k
Analogamente, sia
j
l’evento “il carattere L assume la modalità
l
j
” la probabilità marginale
p
j
di
j
si
ottiene sommando le probabilità congiunte che si trovano sulla j.
p
j
= p
1 j
2 j
+…+ p
kj
Chiaramente le probabilità marginali sono non negative e la loro somma è pari a 1.
i= 1
k
p
i
j= 1
h
p
j
I due caratteri M e L sono indipendenti se le probabilità congiunte possono essere ottenute come prodotto
delle probabilità marginali
p
ij
= p
i
p
j
La funzione di densità ha le seguenti proprietà:
f ( x ) ≥ 0 , per qualunque x
La misura dell’area sotto la funzione di densità è uguàale a 1
La prima proprietà è necessaria affinché le probabilità siano non negative.
La seconda proprietà è equivalente ad affermare che la probabilità dell’evento certo è 1.
Una caratteristica delle variabili casuali continue è che la probabilità che assumono un singolo valore è
nulla, ossia P (X= x) = 0. Infatti, la probabilità che assumano un particolare valore x è data dall’area sotto f(x)
su un intervallo di lunghezza nulla e di conseguenza vale zero.
Funzione di ripartizione
Sia X una variabile casuale, la funzione di ripartizione F(x) esprime la probabilità che X assuma un valore al
massimo pari a x
F ( x )=P ( X ≤ x)
Essa è definita per qualunque valore reale di x.
Essendo una probabilità, la funzione di ripartizione assume valori nell’intervallo [0, 1]. Essa inoltre è una
funzione non decrescente e pertanto se
x
0
< x
1
si ha
x
0
≤ F ( x
1
Nel caso di variabili casuali discrete, il valore della funzione di ripartizione nel punto x è dato dalla somma di
tutte le probabilità
p
i
dei valori
x
i
non superiori a x.
F ( x )=
x
i ≤ x
p
La funzione di ripartizione delle variabili casuali discrete si presenta graficamente come una funzione a
gradini.
la funzione di ripartizione fornisce le stesse informazioni della funzione di probabilità: i punti di
discontinuità corrispondono ai valori assunti dalla variabile casuale e le altezze dei salti sono le probabilità
corrispondenti.
Nel caso di variabili casuali continue il valore della funzione di ripartizione in x è dato dalla misura dell’area
sottesa alla funzione di densità fino al punto x.
Se la variabile casuale è continua, la funzione di ripartizione è continua e varia fra zero e 1.
La probabilità che una variabile casuale X, discreta e continua, assuma valori in un intervallo (a,b] può
essere calcolata come differenza fra il valore che la funzione di ripartizione assume nell’estremo superiore
dell’intervallo e quello che assume nell’estremo inferiore, cioè
P ( a<X ≤ b) =F ( b) −F ( a )
Valore atteso
Nell’ambito della statistica descrittiva è stato osservato che, sebbene la distribuzione di frequenza fornisca
tutte le informazioni su un insieme di dati, vi sono circostanze nelle quali è utile costruire degli indici che
caratterizzino gli aspetti essenziali della distribuzione.
Un indice che fornisce informazioni sulla posizione di una variabile casuale X è il valore atteso. Esso si indica
con E[X] oppure μ.
Nel caso di variabili casuali discrete il valore atteso è dato da
i
x
i
p
i
È immediato verificare che il valore atteso di una variabile casuale è la quantità corrispondente
distribuzione nel contesto descrittivo. Il valore atteso infatti è anche definito media della variabile casuale.
Per interpretare il valore atteso si supponga che il risultato di un esperimento casuale sia descritto da una
variabile casuale X, discreta o continua, e si considerino N replicazioni indipendenti dell’esperimento. Il
valore atteso E[X] può essere interpretato come il valore cui converge la media dei valori osservati di X
quando N diventa infinitamente grande.
Variabili casuali standardizzate
In alcune circostanze può risultare utile standardizzare una variabile casuale. Data una variabile X, con
media
μ e varianza σ
2
, la variabile casuale standardizzata è definita da
X−μ
σ
La variabile casuale Z si può ottenere come una particolare trasformazione lineare di X, ponendo a=1/σ e
b=-
μ/σ
σ
μ
σ
Una variabile casuale standardizzata ha sempre media nulla e varianza unitaria:
σ
μ
σ
Var ( Z )=
σ
2
Var ( X )= 1
In molte situazioni può esservi più di un fenomeno di interesse.
Quando l’interesse riguarda due caratteristiche, che si manifestano congiuntamente sulla stessa unità
statistica, un’adeguata rappresentazione dell’esperimento può essere ottenuta mediante una variabile
casuale doppia o variabile casuale bivariata. In altre circostanze, infine l’interesse può riguardare un
insieme di n caratteristiche che si manifestano sulla stessa unità statistica, dove n>2. In tal caso la
descrizione del fenomeno avviene mediante una variabile casuale multivariata.
Una variabile casuale doppia (X,Y) è definita associando a ogni risultato una coppia di valori reali (x,y).
La variabili X e Y che costituiscono la variabile casuale doppia (X,Y) sono definite marginali. Se entrambi le
variabili sono discrete la variabile casuale doppia è discreta, mentre se entrambe le variabili sono continue
si ha una variabile casuale doppia continua. Sebbene possibile, raramente si incontrano variabile doppie
delle quali una componente è discreta e l’altra è continua. L’interesse riguarda in via prioritaria la
distribuzione congiunta; essa esprime la probabilità con la quale contemporaneamente entrambe le
variabili assumono specifici valori. Lo studio della distribuzione congiunta è essenziale per l’analisi dei
legami e delle forme di dipendenza esistenti fra le componenti della variabile casuale doppia. Tuttavia, in
alcune circostanze può essere utile considerare anche le distribuzioni marginali, ossia le distribuzioni della X
e della Y considerate singolarmente. Infine, può risultare interessante studiare le distribuzioni condizionate,
analizzando la distribuzione di una delle due variabili dato che l’altro assunto un particolare valore.
Variabile casuali doppie discrete
Sia (X, Y) una variabile casuale doppia discreta e si supponga che sia X sia Y assumono un numero finito di
valori; sicché X assume i valori
x
1
, x
2
, … , x
n
e Y assume i valori
y
1
, y
2
, … , y
n
. La variabile casuale doppia (X,
x
i
, y
i
x
i
e Y=
y
i
. La probabilità
congiunta
p
ij
X =x
i
Y = y
i
x
i
, y
i
p
ij
costituisce la
funzione di probabilità congiunta della variabile casuale e doppia (X, Y). Le probabilità congiunte soddisfano
due condizioni:
p
ij
per i= 1, 2, …, k e j= 1, 2, …, h
i= 1
k
j= 1
h
p
ij
La prima proprietà assicura che le probabilità siano non negative.
La seconda proprietà si spiega osservando che le coppie di valori (x i
, y
i
) sono eventi necessari e
incompatibili, pertanto, la somma delle loro probabilità deve essere 1.
A partire dalla funzione di probabilità congiunta è possibile ottenere le funzioni di probabilità marginali.
L’evento X=
x
i
x
i
, y
1
x
i
, y
2
(x
i
, y
h
.
X =x
i
X=x
i
Y = y
1
X=x
i
Y = y
h
La funzione di probabilità congiunta di una variabile casuale doppia discreta (X, Y) e le funzioni di
probabilità marginali possono essere rappresentate simultaneamente in una tabella a doppia entrata. Al
centro vi sono le probabilità congiunte, mentre nell’ultima riga e nell’ultima colonna vi sono le probabilità
marginali.
Sulla base delle distribuzioni marginali è possibile calcolare i valori attesi marginali
μ
X
e μ
Y
e le varianze
marginali σ X
2
e σ
Y
2
delle variabili casuali X e Y.
Le funzioni di probabilità condizionate sono utili per valutare l’influenza che il valore assunto da una delle
due variabili ha sulla probabilità con la quale l’altra variabile assume i diversi valori.