Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Variabili casuali discrete e continue: teoria e applicazioni, Appunti di Statistica

appunti e sbobine di statistica base

Tipologia: Appunti

2020/2021

Caricato il 22/01/2023

Erikagaetani01
Erikagaetani01 🇮🇹

5

(3)

4 documenti

1 / 39

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistica
Le distribuzioni di frequenza
La statistica è una scienza empirica perché il fine è decifrare i dati incerti, prendere decisioni in condizioni di
incertezza--> metodo di studio di fenomeni collettivi, dato che si esaminano sempre tanti casi, non uno
solo...variabilità. È proprio il fatto che esistono casi diversi che danno il motivo di studiare questi casi.
I caratteri statistici possono essere:
- Quantitativi: sono numeri reali o valori. Sono variabili:
discrete à assumono valori in un insieme discreto
continue à assumono valori in un intervallo
- Qualitativi: non sono esprimibili numericamente
nominale: non ordinabile (es: genere maschile M e genere femminile F)
ordinabile: nomi delle persone
L’insieme di tutte le informazioni relative a un fenomeno di interesse costituisce la popolazione.
L’obiettivo della statistica è lo studio delle popolazioni.
La raccolta dei dati statistici:
1. Censimentoà la rilevazione dei dati è esaustiva
2. Campionamento à la rilevanza dei dati avviene soltanto su alcune unità statistiche
Distribuzione di frequenza à si consideri un insieme di n unità statistiche sul quale è stato osservato un
carattere che assume modalità
m1,m2,,mk
Si definisce frequenza assoluta di
mi
il numero di volte che la modalità mi è stata osservata sulle n unità
statistiche e si indica con n.
Le classi devono essere:
a) Disgiunte : in modo che non ci sia ambiguità nell’attribuzione delle osservazioni alle classi. Si lascia
aperta la classe in uno dei due estremi
b) Esaustive : tutte le osservazioni devono poter essere collocate in una delle classi. La soluzione
consiste nell’utilizzare come ultima classe una classe aperta
c) Ampiezza : conviene che le classi siano tutte di uguale ampiezza, tuttavia se nella distribuzione dei
dati vi sono intervalli con una scarsa densità di osservazioni può essere opportuno costruire classi di
maggiore ampiezza per evitare classi vuote
d) Valore centrale : costituito dalla semi-somma degli estremi, sia rappresentativo della classe perché
nelle successive elaborazioni sarà utilizzato in sostituzione dei valori effettivi
Frequenza relativa à si considerano n unità statistiche sulle quali è stato osservato un carattere che assume
k modalità
m1,m2,,mk
Si definisce frequenza relativa
fi
di
mi
il rapporto fra il numero di volte
ni
nelle
quali la modalità mi è stata osservata e la numerosità n. Quindi
f=ni
n
e inoltre la somma delle frequenze
relative è a pari a 1.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27

Anteprima parziale del testo

Scarica Variabili casuali discrete e continue: teoria e applicazioni e più Appunti in PDF di Statistica solo su Docsity!

Statistica

Le distribuzioni di frequenza

La statistica è una scienza empirica perché il fine è decifrare i dati incerti, prendere decisioni in condizioni di

incertezza--> metodo di studio di fenomeni collettivi, dato che si esaminano sempre tanti casi, non uno

solo... variabilità. È proprio il fatto che esistono casi diversi che danno il motivo di studiare questi casi.

I caratteri statistici possono essere:

  • Quantitativi: sono numeri reali o valori. Sono variabili:

discrete à assumono valori in un insieme discreto

continue à assumono valori in un intervallo

  • Qualitativi: non sono esprimibili numericamente

nominale: non ordinabile (es: genere maschile M e genere femminile F)

ordinabile: nomi delle persone

L’insieme di tutte le informazioni relative a un fenomeno di interesse costituisce la popolazione.

L’obiettivo della statistica è lo studio delle popolazioni.

La raccolta dei dati statistici:

  1. Censimentoà la rilevazione dei dati è esaustiva
  2. Campionamento à la rilevanza dei dati avviene soltanto su alcune unità statistiche

Distribuzione di frequenza à si consideri un insieme di n unità statistiche sul quale è stato osservato un

carattere che assume modalità

m

1

,m

2

, … ,m

k

Si definisce frequenza assoluta di

m

i

il numero di volte che la modalità mi è stata osservata sulle n unità

statistiche e si indica con n.

Le classi devono essere:

a) Disgiunte: in modo che non ci sia ambiguità nell’attribuzione delle osservazioni alle classi. Si lascia

aperta la classe in uno dei due estremi

b) Esaustive: tutte le osservazioni devono poter essere collocate in una delle classi. La soluzione

consiste nell’utilizzare come ultima classe una classe aperta

c) Ampiezza: conviene che le classi siano tutte di uguale ampiezza, tuttavia se nella distribuzione dei

dati vi sono intervalli con una scarsa densità di osservazioni può essere opportuno costruire classi di

maggiore ampiezza per evitare classi vuote

d) Valore centrale: costituito dalla semi-somma degli estremi, sia rappresentativo della classe perché

nelle successive elaborazioni sarà utilizzato in sostituzione dei valori effettivi

Frequenza relativa à si considerano n unità statistiche sulle quali è stato osservato un carattere che assume

k modalità

m

1

,m

2

, … ,m

k

Si definisce frequenza relativa

f

i

di

m

i

il rapporto fra il numero di volte

n

i

nelle

quali la modalità mi è stata osservata e la numerosità n. Quindi f =

n

i

n

e inoltre la somma delle frequenze

relative è a pari a 1.

La frequenza relative

f

i

moltiplicata per 100 indica la percentuale di volte nelle quali è stata osservata la

modalità

m

i

sulle n unità statistiche.

i= 1

k

f

i

n

1

n

n

2

n

n

k

n

Istogramma

L’istogramma è un grafico mediante il quale rappresentare la distribuzione di frequenza di un carattere

quantitativo.

1.le basi di rettangoli sono costituite dalle classi

  1. l’area dei rettangoli è proporzionale alla frequenza delle classi

Area dei rettangoli coincida con la frequenza relativa.

Distribuzione simmetrica

Distribuzione asimmetrica positiva

Distribuzione asimmetrica negativa

prof ( med )=

n+ 1

Se n è dispari mediana

x+ x

Proprietà 1

Sia y una trasformazione lineare di x, Y=ax+b

La mediana di Y è la trasformazione lineare della mediana x

Med (Y)=a med(x)+b

Proprietà 2

Siano x1- med, x2-med, ..., xn med gli scarti dalla mediana. Il numero di scarti positivi è uguale al numero di

scarti negativi.

Proprietà 3

La mediana è quel valore che minimizza la somma degli scarti in valore assoluto

i= 1

n

I x−med I=min

i= 1

n

I x−α I

La moda

La moda di una variabile statistica x, che assume valori

x

1

, x

2

, … , x

n

con frequenze

n

1

, n

2

,… ,n

k

, è il valore

di X al quale corrisponde la massima frequenza.

Indice di variazione

La varianza è il più importante indice di variabilità e, al tempo stesso, di disposizione intorno alla media. Sia

x una variabile statistica che assume i valori

x

1

, x

2

, … , x

n

e ha media x, la varianza è data da:

s

2

n

i= 1

n

( x−x )

2

La varianza indica qual è la concentrazione dei dati intorno alla media, fornendo informazioni sull’ordine di

grandezza degli scarti x-

x delle osservazioni dalla media. Poiché la somma degli scarti è nulla (gli scarti

positivi e gli scarti negativi si compensano) la loro media non da informazioni sulla dispersione dei dati

intorno a x. Pertanto, la varianza è calcolata come media degli scarti al quadrato.

Esempio: varianza di (1,2,5,6,7,9) la media è 5

s

2

[( 1 − 5 )¿¿ 2 +( 2 − 5 )

2

2

2

2

2

]¿

Quando i dati sono raggruppati in classi, analogamente a quanto avviene per la media, non è possibile

calcolare il valore esatto della varianza.

Proprietà della varianza

La disuguaglianza di Chebyshev motiva ulteriormente il ricorso alla varianza come indice di dispersione

intorno alla media. Sia X una variabile statistica come media x e varianza s

2

; è possibile dimostrare che

fr

I X −x I <ε

s

2

ε

2

Dove fr ( I X −x I <ε ) è la frequenza relativa con la quale X assume valori nell’intervallo (x−ε , x +ε ).

La disuguaglianza di Chebyshev afferma che una qualsiasi variabile X assume valori in un intorno della

media, di semi-ampiezza ε, con la frequenza relativa almeno pari a

s

2

ε

2

La disuguaglianza di Chebyshev fornisce un limite inferiore per la frequenza. Quando la varianza diminuisce

questo limite aumenta; ma se aumenta la frequenza con la quale X assume valori intorno a x, ciò significa

che la distribuzione è più concentrata intorno alla sua media.

Sia s

x

2

la varianza di una variabile X, la varianza di una trasformazione lineare Y=aX+b è data da

s

Y

2

=s

aX+ b

2

=a

2

s

x

2

La varianza è indipendente dalla posizione: se si effettua una traslazione dei dati, aggiungendo a ciascuna

osservazione una stessa quantità b, la varianza rimane invariata. Se si altera l’unità di misura dei dati,

moltiplicandoli per una costante non nulla a, la varianza risulta modificata di conseguenza.

Poiché la varianza e lo scarto quadratico medio dipendono dall’unità di misura e dall’ordine di grandezza

dei dati, quando la variabile assume soltanto valori positivi, può essere conveniente utilizzare il coefficiente

di variazione

CV =

s

x

La differenza interquartile misura la variabilità del 50% dei dati che si trovano al centro della distribuzione.

Per definire questo indice è necessario introdurre i quartili. Essi dividono i dati in quattro parti uguali: il

primo quartile

Q

1

si lascia a sinistra il 25% dei dati, il secondo quartile si lascia a sinistra il 50% dei dati e

coincide con la mediana e il terzo quartile si lascia a sinistra il 75% delle osservazioni.

La profondità del primo quartile è data da

prof

Q

1

[ prof ( med) ]+ 1

Se la profondità del primo quartile è un numero intero,

Q

1

è dato dall’osservazione che occupa la posiziona

corrispondente nella sequenza ordinata; altrimenti il primo quartile è dato da

Q

1

X

( [

prof (

Q

1

) ]

)

+ X

( [

prof (

Q

1

) ]

  • 1 )

Il terzo quartile viene calcolato in maniera speculare a partire dall’ultima osservazione.

La differenza interquartile è data da

DQ=

Q

3

−Q

1

e fornisce indicazione sulla variabilità della metà centrale dei dati.

Box-plot

Eventuali relazioni fra due variabili possono essere rappresentate con un grafico a dispersione. Esso è un

grafico che usa le coordinate cartesiane per rappresentare i valori di due variabili. I dati sono rappresentati

da punti, a ciascuno dei quali corrisponde una coordinata sull’asse orizzontale data dal valore di una

variabile e una coordinata sull’asse verticale data dal valore dell’altra variabile.

  1. Se i punti di dispongono in modo crescente a partire dall’angolo a sinistra in basso del grafico verso

l’angolo a destra in alto, ciò suggerisce un’associazione positiva.

  1. Se i dati si dispongono in modo decrescente dell’angolo a sinistra in alto del grafico a quello in

basso a destra, ciò suggerisce un’associazione negativa.

  1. Se i punti si dispongono in maniera casuale ciò indica l’assenza di un’associazione

Il calcolo della probabilità

Molte decisioni sono prese in condizioni di incertezza.

Il calcolo delle probabilità si può definire come “la logica del possibile o dell’incerto” poiché tratta di

proposizioni alle quali non è possibile associare con certezza l’attributo vero o l’attributo falso ma soltanto

l’attributo possibile.

Le proposizioni di interesse per il calcolo della probabilità prendono il nome di eventi casuali. Per definirli è

necessario introdurre il concetto di esperimento casuale.

Si definisce esperimento casuale o prova qualsiasi fenomeno del mondo reale per il quale vi è più di un

risultato possibile e pertanto l’esito è incerto. Un esperimento casuale è un fenomeno alla cui

manifestazione è associato uno stato di incertezza.

Si indicano con

ω

1

, ω

2

, … , ω

n

i possibili risultati di un esperimento casuale. L’insieme S di tutti i possibili

risultati

S=(ω

1

, ω

2

, … , ω

n

è definito SPAZIO CAMPIONARIO.

In un sondaggio di opinione che prevede le risposte “molto favorevole”, “favorevole”, “contrario” e “molto

contrario”, ciascuna risposta costituisce un possibile risultato dell’esperimento. Si può ora definire un

evento casuale: esso è proposizione non ambigua formulabile intorno a un esperimento casuale.

Gli eventi (casuali) possono essere rappresentati come sottoinsiemi dello spazio. I sottoinsiemi di S costituiti

da singoli elementi prendono il nome di eventi elementari.

Se si considera come sottoinsieme (improprio) di S lo stesso spazio campionario, esso rappresenta

all’evento che si verifica se uno qualsiasi dei possibili risultati dell’esperimento si verifica. poiché uno di tali

risultati deve necessariamente verificarsi, allora S prende il nome di evento certo.

Si consideri il sottoinsieme di S che non contiene alcun elemento, cioè l’insieme vuoto ; poiché uno dei

possibili risultati dell’esperimento necessariamente si verifica. Esso prende il nome di evento impossibile.

Uno strumento molto utile per visualizzare gli eventi è il diagramma di Venn. Vi sono tre operazioni che si

possono fare con gli eventi: l’intersezione, l’unione e la negazione.

  1. Dato un esperimento casuale, che ammette un insieme S di possibili risultati, e considerati due

eventi A e B, l’ intersezione A ∩ Bè costituita dagli elementi di S comuni sia ad A sia a B. Pertanto,

l’intersezione è l’evento che si verifica quando si verificano contemporaneamente A e B.

  1. Dato un esperimento casuale, che ammette un insieme S di possibili risultati, e considerati due

eventi A e B, l’ unione A B è costituita dagli elementi di S che appartengono soltanto ad A

oppure soltanto B oppure entrambi. Pertanto, l’unione di A e B è l’evento che si verifica quando si

verifica quando si verifica soltanto A oppure si verifica soltanto B oppure si verificano

contemporaneamente A e B.

  1. Dato un evento A contenuto in S, si indica con A l’insieme complementare di A rispetto a S,

costituito dagli elementi di S che non appartengono ad A. Esso rappresenta quindi un evento che si

verifica quando A non si verifica e pertanto viene chiamato negazione di A

  1. Due eventi A e B, contenuti in S, si dicono incompatibili se non possono verificarsi

contemporaneamente. In tal caso A e B non hanno elementi in comune e la loro intersezione è

l’evento impossibile,

A ∩ B= ∅

. Se sono incompatibili a due a due saranno incompatibili a tre a tre

schema di scommesse. La probabilità di un evento è la somma che un individuo coerente è disposto a

scommettere per ricevere una somma unitaria se l’evento si verifica e zero altrimenti.

Secondo la definizione soggettivista la valutazione della probabilità di un evento è compiuta da un individuo

sulla base delle informazioni a lui disponibili. Pertanto, è possibile assegnare una probabilità a qualsiasi

evento casuale, sicché la definizione soggettivista è applicabile nell’ambito di qualsiasi esperimento casuale.

Il dibattito sulla definizione della probabilità trova una sua composizione con l’impostazione assiomatica. La

probabilità è definita mediante alcuni postulati dai quali si ricavano tutte le sue proprietà.

Postulato 1

Per qualunque evento A la probabilità è non negativa

P ( A ) ≥ 0

Postulato 2

La probabilità dell’evento certo è 1

P ( S )= 1

Postulato 3

Siano A e B due eventi incompatibili, la probabilità della loro unione è data dalla somma delle probabilità

A ∩ B= ∅ → P ( A ∪ B) =P( A )+P ( B)

Teorema 1

Dato un evento A, la probabilità della sua negazione è

P ( A )= 1 −P( A )

Per dimostrare questo risultato si produce osservando che A e A sono necessari, A A=S, il che implica

P ( A A) =P( S )= 1. Inoltre, A e A sono incompatibili

Teorema 2

La probabilità dell’evento impossibile è nulla, P ( )= 0

L’evento impossibile è la negazione dell’evento certo e pertanto si ha P ( )= 1 −P ( S)= 0

Teorema 3

Per un qualunque evento A si ha

P ( A ) ≤ 1

Per il teorema 1 si ha P ( A )= 1 P( A). Poiché per il primo postulato P( A) è non negativa, la probabilità di

A non può essere maggiore di 1.

Teorema 4

Dati due eventi A e B, la probabilità dell’unione è data

P ( A ∪ B)=P ( A) +P ( B )−P ( A ∩B )

L’evento “unione di A e B” può essere ottenuto anche come unione di eventi incompatibili

A ∪ B=A ∪ ( A ∩B)

; di conseguenza per il terzo postulato si ha P ( A B)=P ( A) + P( A ∩ B).

Quando gli eventi elementari sono equiprobabili (cioè hanno tutti la stessa probabilità di verificarsi) e in

numero finito, la probabilità di un evento A si ottiene come rapporto fra casi favorevoli e casi possibili.

Siano

E

1

, E

2

,…, E

n

gli eventi elementari dello spazio campionario S generato da un esperimento. Se essi

sono equiprobabili ossia

P
E

1

=P
E

2

=…=P
E

n

Ciascuno ha probabilità 1/n, cioè

P
E

i

n

i= 1, 2, …, n

Sia A un evento costituito dall’unione di k degli n eventi elementari equiprobabili, si ha P ( A )=

k

n

Probabilità condizionata

Vi sono circostanze nelle quali l’informazione sul verificarsi di un evento modifica la valutazione della

probabilità di un altro evento. La probabilità di un evento si modifica in seguito all’informazione relativa al

verificarsi di un altro evento e si parla perciò di probabilità condizionata.

P ( A I B )=
P ( A ∩ B)
P ( B )

posto P(B)>0.

Quando si calcola la probabilità di A dato B, l’evento B deve essere vero; esso assume quindi il ruolo di

evento certo e rappresenta il nuovo insieme dei possibili risultati dell’esperimento. Inoltre, A può verificarsi

solo se il risultato dell’esperimento è un elemento di A che appartiene anche a B. Pertanto, l’evento

possibile non è più A ma A ∩ B. Si può ottenere anche ka probabilità dell’intersezione di due eventi A e B

che risulta P ( A ∩B )=P ( A ) P ( B I A ) o alternativamente P ( A ∩B )=P ( B ) P ( A I B )

Molti esperimenti sono schematizzabili come estrazioni di unità da un insieme. Quando l’estrazione

riguarda più unità è rilevante la modalità con la quale essa avviene. In particolare, si distingue fra estrazione

in blocco ed estrazione con rimessa.

1- Nel primo caso l’unità estratta viene eliminata dall’insieme

2- Nel secondo caso l’unità estratta viene rimessa dall’insieme

Quando l’estrazione avviene in blocco vi è dipendenza fra le prove e il calcolo della probabilità di eventi

definiti in funzione del risultato di due o più estrazioni richiede il ricorso alla probabilità condizionata.

La probabilità condizionata può essere utilizzata per calcolare la probabilità di un evento A qualora siano

note: la probabilità di un altro evento B e le probabilità condizionate P (A I B) e P( A I B).

Il teorema di Bayes può essere applicato anche a più eventi di interesse

A

1

, A

2

,… , A

n

, necessari e

incompatibili, la cui probabilità può essere aggiornata disponendo dell’informazione che si è verificato un

evento B. Si generalizza così il confronto a n ipotesi in presenza delle quali può essersi verificato l’evento B.

Si indichi con P(

A

i

) la probabilità a priori dell’evento

A

i

, per i=1, 2, …, n, e con P(B I A) la probabilità

probativa o verosimiglianza di B dato A. La probabilità a posteriori dell’evento

A

i

è data da

P
A

i

I B
P
A

i

P (B I A

i

j= 1

n

P
A

j

P(B I A

j

ELEMENTI DI CALCOLO COMBINATO

Nell’ambito del calcolo delle probabilità può sorgere l’esigenza di contare quanti sono i possibili risultati di

un esperimento. In questo contesto quanti sono i possibili risultati di un esperimento. Si supponga di avere

n elementi e n posti. Le diverse sequenze che si possono ottenere disponendo gli n elementi negli n posti

sono definite permutazioni. Si vuole determinare quale sia il numero

P

n

di tutte le possibili permutazioni.

Quando si sceglie l’elemento da collocare al primo posto, si può scegliere fra n elementi. Per il secondo

posto la scelta è limitata fra n-1 elementi rimanenti. Di conseguenza vi sono n(n-1) modi di riempire i primi

due posti. Per il terzo posto, la scelta è limitata fra n-2 elementi.

P

n

=n( n− 1 ) ( n− 2 ) … ( 2 ) ( 1 )= 1!

Se i posti disponibili per allocare gli n elementi sono m, dove m<n, il numero delle diverse sequenze

ordinate, definite disposizioni, che si possono ottenere è D

D=n ( n− 1 ) ( n− 2 ) … ( n−m+ 1 )=

n!

( n−m)!

Infine, si supponga di essere interessati ai modi nei quali si possono scegliere m elementi da un insieme che

ne contiene n, ma di non essere interessati all’ordine con il quale si dispongono gli elementi. Sequenze che

contengono gli stessi elementi ordinati in modo diverso non vengono distinte. Tali sequenze sono definite

combinazioni. Per ottenere il numero delle combinazioni C si osserva che vi sono m! sequenze ordinate che

contengono gli stessi elementi.

C=¿
D

m!

n!

m !( n−m)!

n

m

Probabilità congiunte

I concetti introdotti fino a questo punto sono utili per schematizzare situazioni nelle quali si è interessati a

due caratteri statistici che possono essere osservati congiuntamente come risultato di un’unica rilevazione.

Si consideri un esperimento casuale i cui possibili risultati sono costituiti dalle coppie di modalità

(m ¿

¿ i ,l

j

)¿, i=1, 2, …, k e j=1, 2, …, h dei caratteri M e L.

A ciascuna coppia di modalità

(m

i

,l

j

è associata una probabilità congiunta

p

ij

. L’insieme delle probabilità

congiunte

p

ij

, per i= 1, 2, …, k e j= 1, 2, …, h costituisce la distribuzione di probabilità congiunta dei due

caratteri M e L. Il suo studio è essenziale per l’analisi della dipendenza esistente fra i due caratteri. Per il

primo postulato le probabilità congiunte sono non negative,

p

ij

per qualunque i e j

La somma delle loro probabilità deve essere pari a 1.

i= 1

k

j= 1

h

p

ij

Si indichi con

A

1

l’evento “il carattere M ha assunto la modalità

m

1

” e si supponga di voler conoscere la sua

probabilità. L’evento

A

1

si verifica quando si verifica

E

11

oppure

E

12

…oppure

E

1 h

. Pertanto, l’evento

A

1

è

rappresentato nel seguente modo:

A

1

=E

11

∪ E

12

∪ … ∪ E

1 h

La probabilità di

A

1

è definita probabilità marginale perché l’interesse si è spostato dalla coppia di caratteri

M e L al solo carattere M.

In generale, sia

A

i

l’evento “il carattere M assume la modalità

m

1

”, la probabilità marginale si ottiene

sommando le probabilità congiunte che si trovano sulla i.

p

i

= p

i 1

  • p

i 2

  • …+ p

ih

Per i= 1, 2, …, k

Analogamente, sia

B

j

l’evento “il carattere L assume la modalità

l

j

” la probabilità marginale

p

j

di

B

j

si

ottiene sommando le probabilità congiunte che si trovano sulla j.

p

j

= p

1 j

  • p

2 j

+…+ p

kj

Chiaramente le probabilità marginali sono non negative e la loro somma è pari a 1.

i= 1

k

p

i

j= 1

h

p

j

I due caratteri M e L sono indipendenti se le probabilità congiunte possono essere ottenute come prodotto

delle probabilità marginali

p

ij

= p

i

p

j

La funzione di densità ha le seguenti proprietà:

  1. f ( x ) ≥ 0 , per qualunque x

  2. La misura dell’area sotto la funzione di densità è uguàale a 1

La prima proprietà è necessaria affinché le probabilità siano non negative.

La seconda proprietà è equivalente ad affermare che la probabilità dell’evento certo è 1.

Una caratteristica delle variabili casuali continue è che la probabilità che assumono un singolo valore è

nulla, ossia P (X= x) = 0. Infatti, la probabilità che assumano un particolare valore x è data dall’area sotto f(x)

su un intervallo di lunghezza nulla e di conseguenza vale zero.

Funzione di ripartizione

Sia X una variabile casuale, la funzione di ripartizione F(x) esprime la probabilità che X assuma un valore al

massimo pari a x

F ( x )=P ( X ≤ x)

Essa è definita per qualunque valore reale di x.

Essendo una probabilità, la funzione di ripartizione assume valori nell’intervallo [0, 1]. Essa inoltre è una

funzione non decrescente e pertanto se

x

0

< x

1

si ha

F

x

0

≤ F ( x

1

Nel caso di variabili casuali discrete, il valore della funzione di ripartizione nel punto x è dato dalla somma di

tutte le probabilità

p

i

dei valori

x

i

non superiori a x.

F ( x )=

x

i ≤ x

p

La funzione di ripartizione delle variabili casuali discrete si presenta graficamente come una funzione a

gradini.

la funzione di ripartizione fornisce le stesse informazioni della funzione di probabilità: i punti di

discontinuità corrispondono ai valori assunti dalla variabile casuale e le altezze dei salti sono le probabilità

corrispondenti.

Nel caso di variabili casuali continue il valore della funzione di ripartizione in x è dato dalla misura dell’area

sottesa alla funzione di densità fino al punto x.

Se la variabile casuale è continua, la funzione di ripartizione è continua e varia fra zero e 1.

La probabilità che una variabile casuale X, discreta e continua, assuma valori in un intervallo (a,b] può

essere calcolata come differenza fra il valore che la funzione di ripartizione assume nell’estremo superiore

dell’intervallo e quello che assume nell’estremo inferiore, cioè

P ( a<X ≤ b) =F ( b) −F ( a )

Valore atteso

Nell’ambito della statistica descrittiva è stato osservato che, sebbene la distribuzione di frequenza fornisca

tutte le informazioni su un insieme di dati, vi sono circostanze nelle quali è utile costruire degli indici che

caratterizzino gli aspetti essenziali della distribuzione.

Un indice che fornisce informazioni sulla posizione di una variabile casuale X è il valore atteso. Esso si indica

con E[X] oppure μ.

Nel caso di variabili casuali discrete il valore atteso è dato da

μ= E [ X ] =

i

x

i

p

i

È immediato verificare che il valore atteso di una variabile casuale è la quantità corrispondente

distribuzione nel contesto descrittivo. Il valore atteso infatti è anche definito media della variabile casuale.

Per interpretare il valore atteso si supponga che il risultato di un esperimento casuale sia descritto da una

variabile casuale X, discreta o continua, e si considerino N replicazioni indipendenti dell’esperimento. Il

valore atteso E[X] può essere interpretato come il valore cui converge la media dei valori osservati di X

quando N diventa infinitamente grande.

Variabili casuali standardizzate

In alcune circostanze può risultare utile standardizzare una variabile casuale. Data una variabile X, con

media

μ e varianza σ

2

, la variabile casuale standardizzata è definita da

Z=

X−μ

σ

La variabile casuale Z si può ottenere come una particolare trasformazione lineare di X, ponendo a=1/σ e

b=-

μ/σ

Z=

σ

X −

μ

σ

Una variabile casuale standardizzata ha sempre media nulla e varianza unitaria:

E [ Z ] =

σ

E [ X ] −

μ

σ

Var ( Z )=

σ

2

Var ( X )= 1

Variabili casuali doppie

In molte situazioni può esservi più di un fenomeno di interesse.

Quando l’interesse riguarda due caratteristiche, che si manifestano congiuntamente sulla stessa unità

statistica, un’adeguata rappresentazione dell’esperimento può essere ottenuta mediante una variabile

casuale doppia o variabile casuale bivariata. In altre circostanze, infine l’interesse può riguardare un

insieme di n caratteristiche che si manifestano sulla stessa unità statistica, dove n>2. In tal caso la

descrizione del fenomeno avviene mediante una variabile casuale multivariata.

Una variabile casuale doppia (X,Y) è definita associando a ogni risultato una coppia di valori reali (x,y).

La variabili X e Y che costituiscono la variabile casuale doppia (X,Y) sono definite marginali. Se entrambi le

variabili sono discrete la variabile casuale doppia è discreta, mentre se entrambe le variabili sono continue

si ha una variabile casuale doppia continua. Sebbene possibile, raramente si incontrano variabile doppie

delle quali una componente è discreta e l’altra è continua. L’interesse riguarda in via prioritaria la

distribuzione congiunta; essa esprime la probabilità con la quale contemporaneamente entrambe le

variabili assumono specifici valori. Lo studio della distribuzione congiunta è essenziale per l’analisi dei

legami e delle forme di dipendenza esistenti fra le componenti della variabile casuale doppia. Tuttavia, in

alcune circostanze può essere utile considerare anche le distribuzioni marginali, ossia le distribuzioni della X

e della Y considerate singolarmente. Infine, può risultare interessante studiare le distribuzioni condizionate,

analizzando la distribuzione di una delle due variabili dato che l’altro assunto un particolare valore.

Variabile casuali doppie discrete

Sia (X, Y) una variabile casuale doppia discreta e si supponga che sia X sia Y assumono un numero finito di

valori; sicché X assume i valori

x

1

, x

2

, … , x

n

e Y assume i valori

y

1

, y

2

, … , y

n

. La variabile casuale doppia (X,

Y) assume valore (

x

i

, y

i

) quando si verificano contemporaneamente gli eventi X=

x

i

e Y=

y

i

. La probabilità

congiunta

p

ij

=P[

X =x

i

Y = y

i

]

L’insieme di tutte le possibili coppie di valori (

x

i

, y

i

) con le corrispondenti probabilità

p

ij

costituisce la

funzione di probabilità congiunta della variabile casuale e doppia (X, Y). Le probabilità congiunte soddisfano

due condizioni:

p

ij

per i= 1, 2, …, k e j= 1, 2, …, h

i= 1

k

j= 1

h

p

ij

La prima proprietà assicura che le probabilità siano non negative.

La seconda proprietà si spiega osservando che le coppie di valori (x i

, y

i

) sono eventi necessari e

incompatibili, pertanto, la somma delle loro probabilità deve essere 1.

A partire dalla funzione di probabilità congiunta è possibile ottenere le funzioni di probabilità marginali.

L’evento X=

x

i

si verificano quando si verifica quando si verifica la coppia di valori (

x

i

, y

1

) oppure la coppia

x

i

, y

2

), …, oppure la coppia

(x

i

, y

h

.

P

X =x

i

=P

[ (

X=x

i

Y = y

1

) ]

+…+ P[

X=x

i

Y = y

h

]

La funzione di probabilità congiunta di una variabile casuale doppia discreta (X, Y) e le funzioni di

probabilità marginali possono essere rappresentate simultaneamente in una tabella a doppia entrata. Al

centro vi sono le probabilità congiunte, mentre nell’ultima riga e nell’ultima colonna vi sono le probabilità

marginali.

Sulla base delle distribuzioni marginali è possibile calcolare i valori attesi marginali

μ

X

e μ

Y

e le varianze

marginali σ X

2

e σ

Y

2

delle variabili casuali X e Y.

Le funzioni di probabilità condizionate sono utili per valutare l’influenza che il valore assunto da una delle

due variabili ha sulla probabilità con la quale l’altra variabile assume i diversi valori.