Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Probabilità: Somma e Differenza di Due Variabili Aleatorie Discrete, Esercizi di Statistica

somma e differenza di variabili aleatorie discrete

Tipologia: Esercizi

2019/2020

Caricato il 26/05/2020

Giuseppe7777cilia
Giuseppe7777cilia 🇮🇹

5

(2)

6 documenti

1 / 7

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
PROBABILITÀ – SCHEDA N. 5
SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE
1. Distribuzione congiunta
Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale,
perché quello che interessa sono proprio le relazioni presenti tra due o più grandezze. Ad esempio nello
studio di possibili cause di tumore potremmo voler indagare il rapporto tra il numero medio di sigarette
fumate in un giorno e l’età in cui viene riscontrata questa patologia.
Per specificare la relazione tra due variabili aleatorie discrete il punto di partenza è quello di estendere il
concetto di densità di probabilità.
La densità congiunta di e
X
Y
, che indichiamo con
(
)
,
XY
fxy
, è la probabilità che sia uguale ad
e
X
x
Y
sia uguale a
y
:
(,) ( , )
XY
fxy PXxYy
=
==
che può essere schematizzata con una tabella di contingenza “a due entrate”.
Come abbiamo visto nel caso della probabilità di due eventi, alla tabella della densità congiunta (Tabella
1 della scheda 1), possono essere aggiunte una riga e una colonna che rappresentano le densità di
probabilità (marginali) di
X
e
Y
.
Due variabili aleatorie
X
e
Y
sono indipendenti se
P(X=x
Y=y)=P(X=x)P(Y=y)
,
per ogni coppia di valori
x
e
y
assunti da
X
e
Y
.
2. Densità di probabilità della somma di due variabili aleatorie discrete
ESEMPIO 1. Uno studente ha registrato i tempi che impiega per andare a scuola facendo prima
un tragitto a piedi e poi uno in autobus. Indichiamo con il tempo (in minuti) del percorso a piedi
e di attesa dell’autobus e con
X
Y
il tempo (in minuti) del percorso in autobus. Utilizziamo le
frequenze registrate come valutazione delle probabilità dei tempi di percorrenza e – per semplicità
– suddividiamo i tempi in classi e consideriamo il valore centrale della classe.
X 5 7.5 10
(
)
X
fx
0.20 0.50 0.30
Y 5 10 15 20
(
)
X
fx
0.10 0.30 0.40 0.20
Tabella 1. Densità di probabilità (marginali) di
e
X
Y
, tempi di percorrenza
Siamo interessati a studiare il tempo totale per andare a scuola, ovvero la densità di probabilità di
.
XY
+
Possiamo ricavare la densità di probabilità di
XY
+
, note le densità di X e Y? La risposta è NO! È
necessario conoscere la densità congiunta. Infatti la probabilità che
XY
+
sia uguale a coincide con
la somma di tutte le probabilità che sia uguale ad e
k
X a
Y
sia uguale a , con la condizione che
sia uguale a .
b
ab
+
k
Torniamo all’esempio. Se consideriamo e
X
Y
indipendenti, possiamo calcolare la tabella della
distribuzione congiunta.
1
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Probabilità: Somma e Differenza di Due Variabili Aleatorie Discrete e più Esercizi in PDF di Statistica solo su Docsity!

PROBABILITÀ – SCHEDA N. 5

SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

1. Distribuzione congiunta

Ci sono situazioni in cui un esperimento casuale non si può modellare con una sola variabile casuale, perché quello che interessa sono proprio le relazioni presenti tra due o più grandezze. Ad esempio nello studio di possibili cause di tumore potremmo voler indagare il rapporto tra il numero medio di sigarette fumate in un giorno e l’età in cui viene riscontrata questa patologia. Per specificare la relazione tra due variabili aleatorie discrete il punto di partenza è quello di estendere il concetto di densità di probabilità.

La densità congiunta di X eY , che indichiamo con f XY( x ,y ), è la probabilità che sia uguale ad

e

X

x Y sia uguale a y :

f XY ( x , y ) = P ( X = x Y, =y)

che può essere schematizzata con una tabella di contingenza “a due entrate”.

Come abbiamo visto nel caso della probabilità di due eventi, alla tabella della densità congiunta (Tabella 1 della scheda 1), possono essere aggiunte una riga e una colonna che rappresentano le densità di

probabilità ( marginali ) diX eY.

Due variabili aleatorieX eY sono indipendenti se

P(X=x∩Y=y)=P(X=x)P(Y=y),

per ogni coppia di valorix ey assunti daX eY.

2. Densità di probabilità della somma di due variabili aleatorie discrete

ESEMPIO 1. Uno studente ha registrato i tempi che impiega per andare a scuola facendo prima un tragitto a piedi e poi uno in autobus. Indichiamo con il tempo (in minuti) del percorso a piedi e di attesa dell’autobus e con

X

Y il tempo (in minuti) del percorso in autobus. Utilizziamo le

frequenze registrate come valutazione delle probabilità dei tempi di percorrenza e – per semplicità

  • suddividiamo i tempi in classi e consideriamo il valore centrale della classe. X 5 7.5 10

f X ( x ) 0.20 0.50 0.

Y 5 10 15 20

f X ( x ) 0.10 0.30 0.40 0.

Tabella 1. Densità di probabilità (marginali) di X eY , tempi di percorrenza

Siamo interessati a studiare il tempo totale per andare a scuola, ovvero la densità di probabilità di

X +Y.

Possiamo ricavare la densità di probabilità di X + Y, note le densità di X e Y? La risposta è NO! È

necessario conoscere la densità congiunta. Infatti la probabilità che X + Y sia uguale a coincide con

la somma di tutte le probabilità che sia uguale ad e

k

X a Y sia uguale a , con la condizione che

sia uguale a.

b

a +b k

Torniamo all’esempio. Se consideriamo X eY indipendenti, possiamo calcolare la tabella della

distribuzione congiunta.

X\Y 5 10 15 20 totale X 5 0.02 0.06 0.08 0.04 0. 7.5 0.05 0.15 0.20 0.10 0. 10 0.03 0.09 0.12 0.06 0. totale Y 0.10 0.30 0.40 0.

Tabella 2. Densità congiunta di X eY , tempi di percorrenza

Quali valori può assumere la variabile aleatoria X +Y? I valori di tutte le somme possibili, cioè

X + Y 5 10 15 20

Tabella 3. Valori assunti da X +Y. Sono evidenziati i valori uguali.

Utilizzando le tabelle 2 e 3 possiamo calcolare la denstità di X +Y.

X + Y^10 12.5^15 17.5^20 22.5^25 27.5^30

f X +Y ( k) 0.02 0.

Tabella 4. Densità di probabilità di X +Y.

ESEMPIO 2. In una popolazione il 15% delle coppie non ha figli, il 20% ne ha uno, il 35% ne ha due e il 30% ne ha tre. Assumiamo che in ogni famiglia il genere dei figli (maschio, femmina) è equiprobabile e indipendente da quello dei fratelli. Si seleziona una famiglia a caso e si denotano

con X eY il numero di femmine e di maschi presenti tra i figli in tale famiglia.

Calcoliamo la densità congiunta.

- probabilità di nessun figlio: P ( X = 0,Y = 0 )=0.

  • probabilità di un solo figlio femmina:

P ( X = 1,Y = 0 ) = P ( X + Y = 1, X = 1 ) = P ( X = 1 | X +Y = 1 ) P ( X +Y = 1 ) = 0.50 × 0.20 =0.

  • probabilità di un due figli femmina:

P ( X = 2,Y = 0 ) = P ( X + Y = 2, X = 2 ) = P ( X = 2 | X + Y = 2 ) P ( X +Y = 2 ) = 0.50^2 × 0.35 =0.

e così via. Verificate che anche gli altri valori della tabella siano corretti.

X\Y 0 1 2 3 totale X 0 0.1500 0.1000 0.0875 0.0375 0. 1 0.1000 0.1750 0.1125 0 0. 2 0.0875 0.1125 0 0 0. 3 0.0375 0 0 0 0. totale Y 0.375 0.3875 0.2000 0.

Tabella 5. Densità congiunta del numero di figli maschi e femmine per famiglia

Osserviamo che le due variabili X eY non sono indipendenti.

ESEMPIO 3. Abbiamo già visto, in schede precedenti, il problema del lancio di due dadi.

Indichiamo con X^ eY^ le variabili aleatorie che rappresentano il numero di pallini sulla faccia in

alto rispettivamente del primo e del secondo dado. Consideriamo la variabile aleatoria X + Y che

rappresenta la somma dei pallini sulle facce di ciascuno dei due dadi. Quali valori può assumere e qual è la sua densità di probabilità?

X + Y assume tutti i valori interi da 2 (caso 1+1) fino a 12 (caso 6+6); con quali probabilità?

Come sappiamo la probabilità di comprare la coppia di quantità di pane nei due giorni consecutivi (x 1 , x 2 ) è:

P ( X 1 = x 1 , X 2 = x 2 ) = P ( X 1 = x 1 ) P ( X 2 = x 2 |X 1 = x 1 )

quindi, ad esempio, la probabilità che il primo giorno non sia stato comprato pane e il secondo giorno si compri: 0 kg di pane è: 0.20 x 0.050 = 0. 0.250 kg di pane è: 0.20 x 0.475 = 0. 0.750 kg di pane è: 0.20 x 0.400 = 0. 1.250 kg di pane è: 0.20 x 0.050 = 0. 2.000 kg di pane è: 0.20 x 0.025 = 0.

Completa la tabella della distribuzione congiunta riportata qui sotto:

Tabella 8. Distribuzione congiunta dell’acquisto di pane in due giorni consecutivi.

Consideriamo ora la variabile aleatoria che indica la somma del pane comprato nei due giorni: T = X 1 + X 2.

La variabile aleatoria T può assumere valori da 0 a 4 kg così come riportato nella seguente tabella della somma dei valori di T 0 0.250 0.750 1.250 2. 0 0.000 0.250 0.750 1.250 2. 0.250 0.250 0.500 1.000 1.500 2. 0.750 0.750 1.000 1.500 2.000 2. 1.250 1.250 1.500 2.000 2.500 3. 2.000 2.000 2.250 2.750 3.250 4.

Tabella 9. Valori assunti dalla somma del pane comprato in due giorni consecutivi.

quindi riassumendo (completa):

casi

0 X 1 =0 X 2 =

(X 1 =0 X 2 =0.250)

(X 1 =0.250 X 2 =0)

0.500 (X 1 =0.250 X 2 =0.250)

0.750 (X^1 =0.250 X^2 =0.500)

(X 1 =0.500 X 2 =0.250)

casi

Possiamo ora calcolare la funzione di densità di T (completa):

T fT 0 0. 0.250 0.095 + 0.10 = 0. 0.500 0.

0 750.

T fT

Tabella 10. Densità di probabilità di T.

Controlla se hai fatto i calcoli esatti calcolando la somma dei valori della densità di T.

3. Densità di probabilità della differenza di due variabili aleatorie discrete

Quanto abbiamo visto per la somma di due variabili aleatorie, vale in modo analogo anche per la differenza o il prodotto.

ESEMPIO 5. Consideriamo nuovamente il lancio di due dadi e la variabile aleatoria T che indica il valore assoluto della differenza dei pallini sulle due facce:

T = | X - Y|

La variabile aleatoria T assume valori tra 0 e 5. Quale è la densità di T calcolata in 0? Ovvero, qual è la probabilità che T assuma il valore 0? È la probabilità di ottenere le coppie con valori uguali e quindi 6 x 1/36, cioè 1/6. Quale è la densità di T calcolata in 2?

Tabella 7. Distribuzione congiunta del

risultato del lancio di due dadi\con

evidenziate le probabilità di ottenere come

differenza 0.

X\Y 1 2 3 4 5 6

4. Valore atteso e varianza della somma e del prodotto di due variabili aleatorie. Covarianza fra due variabili aleatorie.

Quando X e Y sono due variabili aleatorie definite sullo stesso spazio campionario si ha:

a. E(X+Y)=E(X)+E(Y) Non è quindi necessario conoscere la densità congiunta di X e Y. b. Se X e Y sono indipendenti allora E(XY)=E(X)E(Y)

Per la varianza della somma non vale proprio l’analogo dell’identità a. In questo caso è necessario conoscere anche la covarianza fra X e Y. Infatti, svolgendo i calcoli, si ottiene:

Var(X + Y) = Var(X) + 2Cov(X,Y) + Var(Y), dove Cov(X,Y)=E((X-E(X))(Y-E(Y))) è la covarianza fra le due variabili X e Y. Utilizzando la densità congiunta si può vedere che

Cov(X,Y)= ,

( (^) i ( ))( (^) j ( )) (^) XY( , ) i j

∑ x^ −^ E^ X^ y^ −E Y^ f^ x^ i yj

E ancora Cov(X,Y)=E(XY)-E(X)E(Y).

E1. Esperienza. Simulazione della somma di due variabili aleatorie indipendenti: il risultato del lancio di due dadi

Simulate 1000 lanci di due dadi (in due colonne). Considerando che sono indipendenti, calcolate la somma dei due risultati. Calcolate la distribuzione della somma e confrontatela con i risultati teorici ottenuti.

E2. Esperienza. Simulazione della somma di due variabili aleatorie non indipendenti

Simulate 1000 realizzazioni del della somma di due variabili aleatorie e Y che hanno la seguente densità congiunta.

X

X\Y 0 1 2

Per simulare la distribuzione congiunta ci sono due strategie:

  1. Prima si simula la variabile X e, a seconda del risultato, si simula la variabile Y con le probabilità condizionata riga (da costruire). [Questa strategia è piuttosto lunga]
  2. Si considera una variabile aleatoria con 9 valori possibili (le coppie di X e Y) e con la densità della congiunta. Si calcola quindi la funzione di distribuzione cumulata.

t = ( x y , ) fT ( t ) FT ( t ) z^ =^ x^ + y

Si generano quindi 1000 realizzazioni di T come visto nel paragrafo 4 della scheda 3: questo ha permesso di simulazione le realizzazioni di una variabile aleatoria discreta bidimensionale (X,Y). Questa permette di trovare le realizzazioni di qualunque funzione di X e Y. In particolare nel caso della somma, si associa a ogni realizzazione di T la somma degli x e y corrispondenti. Si calcolano quindi le frequenze dei valori otenuti con la somma. Confrontate quanto ottenuto con i valori (teorici) della densità di probabilità di X+Y.