Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


tema esame probabilità e statistica, Prove d'esame di Probabilità e Statistica

esercizi svolti con annesse domande chiuse, utile per preparare l'esame di probabilità e statistica

Tipologia: Prove d'esame

2018/2019

Caricato il 30/03/2019

_flaag_
_flaag_ 🇮🇹

1 documento

1 / 24

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Probabilit`a e Statistica 2/5/2017
Cognome
Nome
Matricola
Domande corrette Punti Esercizio 1
Punti Esercizio 2 Punti Esercizio 3
La risposta a ciascuno dei 10 test `e considerata valida se e soltanto se
tutti i valori di verit`a relativi sono stati indicati correttamente.
Domanda 1. Siano A, B, C tre eventi con P{A}=
1/2,P{B}=1/3,P{C}=1/6. Indicare le aermazioni
vere.
zP{A\B}potrebbe avere qualunque valore tra 0
e1/3.
se AeBsono indipendenti, allora P{A[B}=
5/6,
P{A\B}<1/6.
zP{A[B[C}= 1 se e solo se P{A\B}=
P{A\C}=P{B\C}=P{A\B\C}= 0.
Domanda 2. Indicare quali delle seguenti funzioni `e
una densit`a di probabilit`a.
f(x)=4/(3x)se1x2, f(x)=0
altrimenti,
zf(x)=e
1xse x1ef(x) = 0 altrimenti,
f(x)=4x1 se 0 x1ef(x) = 0 altrimenti,
zf(x)=2
p1x2/se |x|<1ef(x)=0
altrimenti.
Domanda 3. Siano XeYdue variabili aleatorie
indipendenti con densit`a Binomiali B(n, p)eB(n, q).
se E[X]>E[Y] allora X>Y.
zE[X]>E[Y] se e solo se P{X=0}<P{Y=0}.
zP{X=0,Y =0}=P{X=n,Y =n}se e solo
se p=q,
se Var [X]=Var [Y] allora p=q.
Domanda 4. Si pescano contemporaneamente due car-
te da un mazzo di 52. Consideriamo i tre eventi A= “esce
almeno una carta di ”, B= “esce almeno un J”, C=
“escono Q e J”. Allora
V F
zP{BC}=P{B}P{C}.
V F
zBeCsono indipendenti.
V F
zAeBsono indipendenti.
V F
zBCcio`e B`e contenuto in C,
Domanda 5. Siano XeYdue variabili aleatorie indi-
pendenti con densit`a di Poisson P()eP(µ).
V F
zX+YP(+µ),
V F
zPnY
1+X=0
o=P{Y=0},
V F
zY
1+Xha densit`a di Poisson con parametro µ
1+.
V F
zP{XY =1}=µe(+µ).
Domanda 6. Sia Xuna variabile aleatoria con densit`a
esponenziale con parametro . La variabile aleatoria Y=
pXha densit`a f(y)=0sey0 e, se y>0,
V F
zf(y)=epy,
V F
zf(y)=2yey2/2,
V F
zf(y)=(2py)1ey/2.
Domanda 7. Siano X, Y P(2) due variabili aleatorie
indipendenti.
V F
zCov(XY,X +Y) = 0.
V F
zXYeX+Ysono indipendenti.
V F
zX2eY2sono indipendenti.
V F
z1+(1)X+Yha densit`a B(1,p)peruncertop.
Domanda 8. Siano X, Y due variabili aleatorie
indipendenti con densit`a normale N(0,1) allora
V F
z2XY+ 3 ha densit`a normale N(3,3)
V F
z2X+3Y+ 1 ha densit`a normale N(1,13)
V F
zX3ha densit`a normale N(0,2) per qualche 2>
0
V F
z2X+YeX+Ynon sono correlate.
Domanda 9. Qui sotto sono disegnati i grafici della
densit`a binomiale B(20,p) per due valori diversi di p.
V F
zla pdella densit`a del grafico di sinistra `e 1/2.
V F
zla pdella densit`a del grafico di destra `e pi`u grande
della pdella densit`a del grafico di sinistra.
V F
zse X`e una v.a. con la densit`a del grafico di
sinistra, allora P{X= 15}>0.
V F
zse X`e una v.a. con la densit`a del grafico di
sinistra, allora P{X= 15}= 0.
Domanda 10. Sia Xuna variabile aleatoria la cui
funzione di ripartizione FXha il grafico disegnato in
figura.
-
6
1
213
22
0.2
0.5
0.75
0.8
1
Apporre i corretti valori di verit`a
V F
zPX=3
2 =0.8
V F
zP{X=0}=0.2
V F
zPX=3
4 =0.5
V F
zE[X]=1.275
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18

Anteprima parziale del testo

Scarica tema esame probabilità e statistica e più Prove d'esame in PDF di Probabilità e Statistica solo su Docsity!

Probabilit`a e Statistica — 2/5/

Cognome

Nome

Matricola

Domande corrette Punti Esercizio 1

Punti Esercizio 2 Punti Esercizio 3

La risposta a ciascuno dei 10 test e considerata valida se e soltanto se tutti i valori di verita relativi sono stati indicati correttamente.

Domanda 1. Siano A, B, C tre eventi con P {A} =

1 / 2 , P {B} = 1/ 3 , P {C} = 1/6. Indicare le a↵ermazioni vere. z (^) P {A \ B} potrebbe avere qualunque valore tra 0 e 1/3. se A e B sono indipendenti, allora P {A [ B} = 5 /6, P {A \ B} < 1 /6. z (^) P {A [ B [ C} = 1 se e solo se P {A \ B} = P {A \ C} = P {B \ C} = P {A \ B \ C} = 0.

Domanda 2. Indicare quali delle seguenti funzioni `e

una densita di probabilita.

f (x) = 4 /(3x) se 1  x  2, f (x) = 0 altrimenti, z (^) f (x) = e 1 x (^) se x 1 e f (x) = 0 altrimenti, f (x) = 4x 1 se 0  x  1 e f (x) = 0 altrimenti, z (^) f (x) = 2 p 1 x 2 /⇡ se |x| < 1 e f (x) = 0 altrimenti.

Domanda 3. Siano X e Y due variabili aleatorie

indipendenti con densit`a Binomiali B(n, p) e B(n, q).

se E [X] > E [Y ] allora X > Y. z (^) E [X] > E [Y ] se e solo se P {X = 0} < P {Y = 0}. z (^) P {X = 0, Y = 0} = P {X = n, Y = n} se e solo se p = q, se Var [X] = Var [Y ] allora p = q.

Domanda 4. Si pescano contemporaneamente due car-

te da un mazzo di 52. Consideriamo i tre eventi A = “esce almeno una carta di ”, B = “esce almeno un J”, C = “escono Q e J”. Allora

Vz F P {B C} = P {B} P {C}. V Fz^ B e C sono indipendenti. V Fz^ A e B sono indipendenti. V Fz^ B ✓ C cioe Be contenuto in C,

Domanda 5. Siano X e Y due variabili aleatorie indi-

pendenti con densit`a di Poisson P() e P(μ).

Vz F X + Y ⇠ P( + μ), Vz F P

n Y 1+X = 0

o = P {Y = 0},

V Fz^ 1+YX ha densit`a di Poisson con parametro (^) 1+μ. Vz F P {XY = 1} = μe (+μ)^.

Domanda 6. Sia X una variabile aleatoria con densit`a

esponenziale con parametrop . La variabile aleatoria Y = X ha densit`a f (y) = 0 se y  0 e, se y > 0, V Fz^ f (y) = e

py , Vz F f (y) = 2ye y^ (^2) / 2 , V Fz^ f (y) = (2 p y) ^1 e y/^2.

Domanda 7. Siano X, Y ⇠ P(2) due variabili aleatorie

indipendenti. Vz F Cov(X Y, X + Y ) = 0. V Fz^ X Y e X + Y sono indipendenti. Vz F X 2 e Y 2 sono indipendenti. Vz F 1 + (1) X+Y^ ha densit`a B(1, p) per un certo p.

Domanda 8. Siano X, Y due variabili aleatorie

indipendenti con densita normale N (0, 1) allora V Fz^2 X Y + 3 ha densita normale N (3, 3) Vz F 2 X + 3Y + 1 ha densita normale N (1, 13) V Fz^ X 3 ha densita normale N (0, 2 ) per qualche 2 > 0 Vz F 2 X + Y e X + Y non sono correlate.

Domanda 9. Qui sotto sono disegnati i grafici della

densit`a binomiale B(20, p) per due valori diversi di p.

Vz F la p della densita del grafico di sinistrae 1/2. V Fz^ la p della densita del grafico di destrae piu grande della p della densita del grafico di sinistra. Vz F se X e una v.a. con la densita del grafico di sinistra, allora P {X = 15} > 0. V Fz^ se X e una v.a. con la densita del grafico di sinistra, allora P {X = 15} = 0.

Domanda 10. Sia X una variabile aleatoria la cui

funzione di ripartizione F (^) X ha il grafico disegnato in figura.

1 2 1

3 2 2

1

Apporre i corretti valori di verit`a V Fz^ P

X = 32 = 0. 8

Vz F P {X = 0} = 0. 2 V Fz^ P

X = 34 = 0. 5

Vz F E [X] = 1. 275

Esercizio 1

Lanciamo tre volte una moneta truccata (la probabilità che esca ￿￿￿￿￿ nel singolo lancio è p, con

0 < p < 1 ), sia X la variabile aleatoria che vale 1 se è uscito più spesso ￿￿￿￿￿ che ￿￿￿￿￿ e 0 altrimenti,

sia Y la variabile aleatoria che vale 1 se i primi due lanci hanno avuto lo stesso esito e 0 altrimenti.

1.1 Determinare la probabilità congiunta e le probabilità marginali del vettore (X, Y ).

Soluzione: L’esperimento può essere così descritto:

Esito: TTT TTC TCT CTT TCC CTC CCT CCC

Probabilità p 3 p 2 q p 2 q p^2 q pq 2 pq 2 pq 2 q 3

(X, Y ) 1 , 1 1 , 1 1 , 0 1 , 0 0 , 0 0 , 0 0 , 1 0 , 1

e dunque

X = 0 X = 1

Y = 0 2 pq 2 2 p 2 q 2 pq

Y = 1 q 2 p^2 q 2 + p 2

q 2 ( 2 p + 1 ) p 2 ( 2 q + 1 )

1.2 Calcolare E [XY ] e Var [XY ].

Soluzione: Osserviamo che XY è una variabile aleatoria che vale 1 con probabilità p 2 e

0 altrimenti, ossia (XY ) ⇠ Bern(p^2 ), pertanto E [XY ] = p 2 e Var [XY ] = p 2 p 4.

1.3 Verificare che X e Y sono indipendenti se e solo se la moneta non è truccata, cioè se p = 12.

Soluzione: Osserviamo che P {X = 0 } = q 2 ( 2 p + 1 ) e P {Y = 0 } = 2 pq, mentre in termini

della congiunta si ha P {X = 0 , Y = 0 } = 2 pq 2 , perché X e Y siano indipendenti deve

valere che

P {X = 0 } · P {Y = 0 } = P {X = 0 , Y = 0 } ,

che nel nostro caso significa

q 2 ( 2 p + 1 ) · 2 pq = 2 pq 2 ) q( 2 p + 1 ) = 1 ,

poiché q = 1 p, l’ultima uguaglianza si riduce a p( 1 2 p) = 0 , verificata solo per

p = 12 , dunque se p , 12 X e Y non sono indipendenti. Resta da stabilire se X e Y siano

indipendenti quando p = 12 , per sostituzione diretta si ottiene

X = 0 X = 1

Y = 0 1 / 4 1 / 4 1 / 2

Y = 1 1 / 4 1 / 4 1 / 2

dunque: se p = 12 , allora X e Y sono indipendenti.

Esercizio 3

Nell’ambito di un progetto di screening di una patologia (che, è noto, riguarda il 30% di una popola-

zione), viene utilizzato un test clinico molto a￿dabile, nel senso che i “falsi positivi” (coloro che pur

essendo sani risultano positivi al test) sono il 2% dell’intera popolazione, e i “falsi negativi” (coloro

che pur avendo contratto la patologia in esame risultano comunque negativi al test) sono il 4% del-

l’intera popolazione.

Una persona scelta a caso viene sottoposta al test.

3.1 Detto M l’evento “la persona sottoposta al test è malata”, e T+ l’evento “il test ha dato esito

positivo” (ovviamente T = T+ ), sulla base dei dati determinare P {T+ |M} e P

T |M

Soluzione: Dai dati abbiamo che

P

falso positivo = P

T+ \ M

P

falso negativo = P {T \ M} = 0. 04.

Dunque, poiché inoltre P {M} = 0. 3 , abbiamo

P {T+ \ M} = P {M} P {T \ M} = 0. 26 , P

T \ M

= P

M

P

T+ \ M

onde

P {T+ |M} =

P {T+ \ M}

P {M}

, P

T |M

P

T \ M

P

M

3.2 Calcolare la probabilità che il test, e￿ettuato su un individuo a caso della popolazione in esame,

dia esito negativo.

Soluzione: Si ricava immediatamente

P {T } = P {T \ M} + P

T \ M

3.3 Determinare la probabilità che la persona sottoposta al test sia e￿ettivamente sana, dato che il

test ha dato esito negativo.

Soluzione: Usando la formula di Bayes, si trova

P

M|T

P

T |M

P

M

P {T }

34

35 ·^0.^7

Probabilit`a e Statistica — 7.7.

Cognome

Nome

Matricola

Teoria Esercizi Es. 1 Es. 2 Es. 3

La risposta a ciascuno dei 10 test e considerata valida se e soltanto se tutti i valori di verita relativi sono stati indicati correttamente.

Domanda 1. Se X e Y sono due variabili aleatorie

indipendenti con densit`a (1, 1), allora:

V Fz^ X + Y ⇠ (2, 2) Vz F X + Y ⇠ (2, 1) V Fz^ X · Y ⇠ (1, 1) V Fz^ X + Y ⇠ (1, 2)

Domanda 2. Un’ipotesi statistica `e (barrare l’unica

risposta esatta):

l’ipotesi che i valori dei parametri massimizzino la funzione verosimiglianza una variabile aleatoria con densita non dipendente da parametri non noti z (^) un’a↵ermazione sui parametri caratterizzanti la densita di una o pi`u variabili aleatorie una statistica test

Domanda 3. Sia X 1 ,... , X n un n campione estratto

da una popolazione X ⇠ N (μ, 2 ) (parametri non noti) e X (^) n , S (^) n^2 la media e la varianza campionaria. Apporre i corretti valori di verit`a alle seguenti a↵ermazioni:

Vz F (n 1)S (^) n^2 / 2 ha densita 2 (n 1) V Fz^ nS (^) n^2 / 2 ha densita 2 (n) V Fz^ n^11

P (^) n i=1 X^

2 i `e uno stimatore non distorto di^ ^

2

Vz F X (^) n e S (^) n sono indipendenti

Domanda 4. Sia X 1 ,... , X n un n campione della den-

sita N (μ, 2 ) (parametri non noti), X (^) n e S (^) n^2 la media e la varianza campionaria. La statistica test per verificare l’i- potesi “H 0 : μ = μ 0 ” contro l’alternativa “H 1 : μ > μ 0 ”e (barrare l’unica risposta vera) z (^) (X n ^ μ^0 )/

p S (^) n^2 /n (X (^) n μ)/

p S (^2) n /n (X (^) n μ 0 )/

p 2 /n (X (^) n μ)/

p 2 /n

Domanda 5. In un test d’ipotesi il p-value `e (barrare

l’unica risposta vera):

il massimo tra le probabilita di errore di prima e di seconda specie il valore stimato del parametro su cui si fa il test z (^) il piu piccolo livello di significativita per cui si puo rifiutare l’ipotesi nulla con i dati osservati

Domanda 6. In un test d’ipotesi, il livello di

significativita ↵e (barrare l’unica risposta vera): un valore dato dalle tavole statistiche la probabilita di rifiutare l’ipotesi vera z (^) la probabilita massima con cui si potrebbe rifiutare l’ipotesi nulla, quando essa e vera la probabilita di errore di II tipo l’ordinata del punto di intersezione della retta di regressione con l’asse y

Domanda 7. Sia X 1 ,... , X n un n-campione della den-

sita uniforme su [✓, ✓] (✓ > 0 parametro non noto). Apporre i corretti valori di verita: Vz F ✓b = (^2) n

P

|X (^) i | `e uno stimatore non distorto di ✓ Vz F E

X (^) i^2

= ✓^

2 3 Vz F l’errore quadratico medio di ✓b `e ✓ 2 /(3n)

Domanda 8. Dato un modello lineare semplice Y =

0 + 1 x + E, con E ⇠ N (0, 2 ), apporre l’esatto valore di verita alle seguenti a↵ermazioni: Vz F 1 rappresenta l’incremento della variabile risposta Y in corrispondenza di un incremento unitario del predittore x V Fz^ R 2 = (^) S (^) xxS^ xy S (^) yy Vz F b 1 ha densita N ( 1 , ^ 2 S (^) xx ) V Fz^ b 1 ha densit`a N ( 1 , 2 )

Domanda 9. Siano X 1 ,... , X n e Y 1 ,... , Y m due

campioni indipendenti delle densita normali N (μ (^) x , (^) x^2 ) e N (μ (^) y , (^) y^2 ) con varianze campionarie S (^) x^2 e S (^) y^2. Si conside- ri il test di verifica di ipotesi seguente: “H 0 : (^2) x = (^) y^2 ” contro l’alternativa “H 1 : (^2) x 6 = (^2) y ”, la statistica teste (barrare l’unica risposta esatta): |S (^) x^2 S (^2) y | z (^) S 2 x /S^ 2 y (S (^) x^2 S (^2) y ) 2 |S (^) x S (^) y | S (^2) x /n+S (^2) y /m

Domanda 10. Sia X n una catena di Markov a tempo

discreto sugli stati { 1 , 2 }, sappiamo che p 11 = 0.2 e p 21 = 1; allora (apporre i corretti valori di verita): Vz F esiste senz’altro la distribuzione asintotica Vz F la distribuzione invariantee ⇡ = [ 59 , 49 ] V Fz^ la distribuzione invariante e ⇡ = [0. 5 , 0 .5] V Fz^ la distribuzione invariantee tale che P⇡ = ⇡

Esercizio 2

Per studiare l’e↵etto che l’assunzione di alcolici provoca alle capacita visive e motorie delle persone, 44 volontari sono stati divisi in due gruppi da 22 persone ciascuno. Al gruppo Ae stato dato da bere un alcolico, al gruppo B un placebo, in seguito sono state valutate (a prestazioni migliori corrisponde un voto piu basso) le capacita dei soggetti, i dati (che possiamo supporre distribuiti secondo opportune gaussiane) sono i seguenti:

x (^) A = 2. 21 , s (^2) A = (0.98) 2 , x (^) B = 1. 71 , s (^2) B = (0.72) 2.

2.1 Determinare al 95% di confidenza un intervallo per il voto medio di chi non ha assunto alcolici.

Soluzione: Usando t (^0) .975;21 = 2.0796 si trova che l’intervallo ceracto `e "

  1. 71 2. 0796

r (0.72) 2 22

r (0.92) 2 22

= [1.3908; 2.0292].

2.2 E possibile a` ↵ermare che le varianze nei due gruppi sono uguali?

Soluzione: Test di confronto tra le varianze di due normali, le ipotesi (con ovvia simbologia) sono ( H 0 : (^) A^2 = (^2) B H 1 : (^) A^2 6 = (^2) B

detta u la statistica test (il rapporto tra le due varianze), si rifiuta l’ipotesi nulla al 10% se u > 2 .08 oppure se u < 0 .48, nel nostro caso u =

s (^2) A s (^2) B

dunque non vi `e alcuna evidenza del fatto che le varianze siano di↵erenti.

2.3 Al 5% di significativit`a, i dati che sono stati raccolti supportano l’opinione che l’assunzione di alcolici sia pericolosa per chi guida, piloti,...?

Soluzione: Test di confronto tra le medie di due normali. Per il punto precedente, `e possibile e↵ettuare il test “a varianze incognite, ma ipotizzate uguali”: ( H 0 : μ (^) A = μ (^) B l’alcol non ha e↵etti evidenti H 1 : μ (^) A > μ (^) B l’alcol ha e↵etti negativi sulle prestazioni

la varianza pooled `e s (^2) P =

si rifiuta H 0 a livello 5% se u > t (^0) .95;42 , poich´e 1.6759 = t (^0) .95;50 < t (^0) .95;42 < t (^0) .95;40 = 1.6839; la statistica test `e u = x (^) A x (^) B s s (^2) P ·

n (^) A

n (^) B

◆ =^

s

  1. 7394 ·

◆ '^1.^93 ,

poich´e u > 1 .69, al 5% di significativit`a possiamo a↵ermare che si rifiuta l’ipotesi nulla.

Esercizio 3

Una societa di marketing sta studiando il legame (su base mensile) tra le entrate x di una famiglia (genitori e uno/due figli) e la spesa media y per “generi voluttuari”. Per comodita, x e y sono misurate in migliaia di §. Si suppone che sussista un legame lineare:

spese = 0 + 1 · (entrate) + e, e ⇠ N (0, 2 ).

Di seguito sono riportati i dati di sintesi relativi a n = 82 osservazioni, e accanto i due scatterplot, quello relativo a entrate e spese mensili e quello dei residui (il test di Shapiro, e↵ettuato su questi ultimi, d`a un p-value del 93.6%).

P

x (^) i = 242. 83 , P x (^2) i = 755. 3623 P y (^) i = 58. 77 , P y (^2) i = 49. 9079 , P x (^) i y (^) i = 190. 0186.

2.0 2.5 3.0 3.5 4.0 4.

entrate mensili

spese

0.2 0.4 0.6 0.8 1.0 1.2 1.

-0.

-0.

y fittati

residui

3.1 Determinare la stime di 0 e 1 e il coeciente di determinazione.

Soluzione: Si ricava facilmente che

x = 2. 9613 , y = 0. 7167 , Sxx = 36. 2598 , Syy = 7. 7870 , Sxy = 15. 9806.

Con le formule consuete, si trova allora c 0 = 0 .5884 e c 1 = 0.4407; inoltre R 2 = 0.9045.

3.2 Come giudicate l’ecacia del modello “spese = 0 + 1 · (entrate) + e”?

Soluzione: Dai grafici sembra lecito ipotizzare un legame lineare tra entrate mensili e spese “voluttuarie”, i residui sembrano abbastanza ben distribuiti, l’ipotesi di normalita non puo essere scartata; prendendo in considerazione il coeciente di determinazione, e prossimo a 0.9, nuovamente indice di una buona ecacia del modello nello spiegare la variabilita delle spese sulla base delle entrate mensili.

3.3 Assumendo per buono il modello, determinare l’entrata mensile ex che non consente margini per “spese extra”.

Soluzione: Poich´e l’equazione della retta di regressione `e spese = 0 .5884 + 0. 4407 · entrate, non vi sarebbero margini di spesa se le entrate ammontassero a

ex =

cio`e circa 1330§.

3.4 Determinare un intervallo di confidenza al 95% per la spesa mensile media di una famiglia con entrate di 2800§. (Pu`o essere utile sapere che bv = (0.09644) 2 )

Soluzione: La formula dell’intervallo di confidenza per la risposta media in corrispondenza di x ⇤^ `e

E [Y (x ⇤^ )] 2 c 0 + c 1 x ⇤^ ± t (^1) ↵/2;n 2

s bv ·

n

(x ⇤^ x) 2 S (^) xx

poich´e t (^0) .975;80 = 1.9901 e

bv =

S (^) xx S (^) yy S (^) xy^2 (n 2)S (^) xx

= 9. 3 · 10 ^3 ,

ricaviamo che

E [Y (2.8)] 2 0 .5884 + 0. 4407 · 2. 8 ± 1. 9901

s

  1. 009299 ·

ossia E [Y (2.8)] 2 [0.624; 0.667]; la stima e attendibile, poich´e x ⇤^ = 2.8 appartiene al range di valori delle x (^) i (e anzi molto vicino alla media).

17.7.2017 — Esercizi

Esercizio 1

Andrea e Bruno giocano al gioco seguente: si lanciano due dadi regolari, se la somma dei punteggi e maggiore o uguale a 10 (evento E), allora successivamente si lanciano due monete, se invece la somma dei punteggi minore o uguale a 9 (evento E), si lancia una sola moneta. Andrea vince se, in seguito al lancio della/delle monete, esce almeno una volta testa. 1.1 Calcolare la probabilita di vittoria di Andrea.

Soluzione: Poniamo A = “Andrea vince”, poich´e si vede facilmente che P {E} = 16 , si ha che

P {A|E} =

, P

A|E =

e dunque, usando la formula delle probabilit`a totali si ha:

P {A} = P {A|E} P {E} + P

A|E P

E =

1.2 Sapendo che Andrea ha vinto la partita, quanto vale la probabilit`a che il punteggio del lancio dei dadi fosse maggiore o uguale a 10?

Soluzione: Per il Teorema di Bayes

P {E|A} =

P {A|E} P {E}

P {A}

3 4 ·^

1 6 13 24

1.3 Andrea e Bruno giocano pi`u partite, ad ogni partita Andrea e Bruno puntano 1§ ciascuno, il vincitore incassa il piatto. Calcolare valore atteso e varianza della variabile aleatoria X = “vincita di Andrea” (nella singola partita).

Soluzione: Poich´e P {X = 1} = P {A} = 1324 e P {X = 1 } = P

A = 1124 , si ricava immediatamente che E [X] = 121 e E

X 2

= 1, onde Var [X] = 143144.

1.4 Andrea e Bruno giocano n = 180 partite, calcolare la probabilit`a che alla fine delle partite Andrea abbia vinto dei soldi.

Soluzione: Sia Y la variabile aleatoria “vincita complessiva di Andrea”; ovviamente, detta X (^) i la variabile “vincita di Andrea nella i-esima partita”, si ha che

Y =

X^180

i=

X (^) i ,

per il Teorema del Limite Centrale, quindi, Y ⇡ N orm(180 · 121 , 180 · 143144 ), standardizzando, si ha

P {Y > 0 } = P

Y 15

p

  1. 75

p

  1. 75

⇡ P {Z > 1. 12 } = (1.12) = 0. 86650 ,

se inoltre usiamo la correzione di continuit`a, allora

P {Y > 0 } = P

Y 15

p

  1. 75

p

  1. 75

⇡ P {Z > 1. 08 } = (1.08) = 0. 85993.

Esercizio 2

Abbiamo una moneta, e non sappiamo se si tratti di una moneta truccata o meno, la lanciamo n = 300 volte, ottenendo 166 volte testa. 2.1 Calcolare un intervallo al 95% di confidenza per la probabilit`a che esca testa.

Soluzione: Intervallo di confidenza (asintotico) per la p di una Bernoulliana; poich´e z (^0). 975 = 1.96 si ha

p 2

s 166 300 ·^

134 300 300

, ) p 2 [0.4971; 0.6096].

2.2 Quanti lanci sarebbe stato necessario fare, per poter garantire a priori che la larghezza dell’intervallo trovato (sempre con la confidenza del 95%) non fosse superiore a 0.05?

Soluzione: La larghezza di un intervallo di confidenza di questo genere `e data da

l = 2z (^1) ↵ 2

r x(1 x) n

osservato che 0 < x < 1 ) x(1 x) 

si ricava l = 2z (^1) ↵ 2

r x(1 x) n

 2 z (^1) ↵ 2

r 1 4 n

z (^1) ↵ 2 p n

poich´e nel nostro caso z (^1) ↵ 2 = 1.96, si ottiene

l 

p n

 0. 05 ) n

dunque sarebbero necessari almeno 1537 lanci.

2.3 Se qualcuno, sulla base dei 300 lanci e↵ettuati, si dichiarasse convinto che la moneta e sbilanciata, a favore di testa, con la significativita del 5% cosa concludereste? Qual `e il p-value di questo test?

Soluzione: Detta p = P {testa} il test in questione e ( H 0 : p = 0. 5 la monetae equilibrata H 1 : p > 0. 5 la moneta `e sbilanciata a favore di testa

si rifiuta H 0 al 5% di significativit`a se u > z (^0). 95 = 1.645, nel nostro caso

u =

166 q^300 ^0.^5 0 .5(1 0 .5) 300

dunque rifiutiamo H 0 ; il p-value `e 1 (u) ' 1 (1.85) = 0.03216, ossia del 3% circa.

Probabilit`a e Statistica — 9.9.

Cognome

Nome

Matricola

Es. 1 Es. 2 Es. 3 Esercizi Teoria

La risposta a ciascuno dei 10 test e considerata valida se e soltanto se tutti i valori di verita relativi sono stati indicati correttamente.

Domanda 1. Dall’esperienza passata sappiamo che il

60% dei turisti che visitano la val di Fassa salgono sul Pordoi e che il 15% salgono sulla Marmolada ma non sul Pordoi. Apporre i corretti valori di verit`a:

Vz F la percentuale dei turisti che saliranno almeno su una delle due vette e del 75% V Fz^ none possibile calcolare la percentuale di turisti che saliranno almeno su una delle due vette Vz F la percentuale dei turisti che non saliranno su nessuna delle due vette e del 25% Vz F none possibile calcolare la percentuale di turisti che saliranno sulla Marmolada.

Domanda 2. Sia X 1 ,... , X n un n-campione estratto da

una popolazione X ⇠ f (x|✓), dove ✓ e un parametro inco- gnito che varia nel dominio D (^) ✓. Apporre i corretti valori di verita: V Fz^ per ogni osservazione x 1 , x 2 ,... , x (^) n , la funzione di verosimiglianza `e L(✓) :=

P

f (x (^) i |✓) Vz F per ogni osservazione x 1 , x 2 ,... , x (^) n , la funzione di verosimiglianza `e L(✓) :=

Q

f (x (^) i |✓) V Fz^ la stima di massima verosimiglianza per ✓ e il massimo di L(✓) Vz F la stima di massima verosimiglianza per ✓e il valore ✓b che massimizza L(✓)

Domanda 3. Sia X una variabile aleatoria la cui fun-

zione di ripartizione F (^) X e data da F (^) X (x) = 0 per x  0 e F (^) X (x) = x 2 /(1 + x) 2 per x > 0. Apporre i corretti valori di verita: Vz F P {X > 0 } = 1 V Fz^ P {X > 1 } = 1/ 2 V Fz^ la densit`a di Y =

p X `e f (^) Y (y) = 0 per y < 0 e f (^) Y (y) = y/(1 + y) per y > 0 Vz F se 3 P {X  x ⇤^ } = P {X > x ⇤^ } allora x ⇤^ = 1

Domanda 4. Siano X, Y due variabili aleatorie congiun-

tamente gaussiane con medie nulle e Var [X] = Var [Y ] = 4, Cov [X, Y ] = 1. Quale delle seguenti a↵ermazioni `e l’unica vera? P {|X Y | > 1 } vale circa 0. 55 Var [X + Y ] = 4 z (^) Var [X + Y ] < Var [X Y ]

P {|X + Y | > 100 } = 1

Domanda 5. Siano X, Y due variabili aleatorie indi-

pendenti con densita rispettive di Bernoulli Be(1/2) e di Poisson P(1/2) con parametro 1/2. Quale l’unica vera delle seguenti a↵ermazioni? z (^) P {X Y > 0 } = e 1 / (^2) / 2

P {X + Y = 0} = e ^1 /^2 E [X + Y ] = 2 E [XY ] = 1/ 2

Domanda 6. Sulla base di un campione x 1 ,... , x n da

popolazione normale N (μ, 2 ) (parametri non noti) abbia- mo verificato l’ipotesi H 0 : μ = 0 contro H 1 : μ 6 = 0 con si- gnificativit`a ↵ = 4.2% e abbiamo RIFIUTATO H 0. Inol- tre il nostro campione ha fornito: p^ sx 2 x /n^

= 3.3. Barrare l’unica risposta vera. il p-value puo essere sia strettamente minore sia strettamente maggiore di 4.2% z (^) il p-valuee sicuramente minore o uguale di 4.2% il p-value `e sicuramente maggiore di 4.2% il p-value vale 3.3%

Domanda 7. Siano A e B due eventi qualsiasi. Apporre

i corretti valori di verit`a: Vz F P {A [ B}  P {A} + P {B} Vz F P {A \ B c^ } = P {A} P {A \ B} V Fz^ P {A \ B c^ } = P {A} P {B} Vz F P {A [ B} + P {A \ B} = P {A} + P {B}

Domanda 8. Sia X 1 ,... , X n un n-campione della den-

sita normale N (μ, 2 ) (parametri non noti) e siano X (^) n e S (^2) n la media e la varianza campionaria. Apporre i corretti valori di verita: Vz F X (^) n ha densit`a normale N (μ, 2 /n) Vz F

p n (X (^) n μ)/S (^) n ha densita di Student t(n 1) V Fz^ nS (^2) n / 2 ha densita chi quadrato 2 (n) V Fz^ X (^) n /S (^) n ha densit`a di Student t(n 1)

Domanda 9. Se X `e una variabile aleatoria reale con-

tinua, con densita f allora (apporre i corretti valori di verita) Vz F P {x < X < x + 1} =

R (^) x+ x f^ (y)dy^ per ogni^ x V Fz^ P {x < X < x + 1} = f (x + 1) f (x) per ogni x V Fz^ P {X = x} = f (x) per ogni x Vz F f (x) = (^) dxd P {X  x}, per qualche x

Domanda 10. Dato un modello lineare gaussiano uni-

variato, sia R 2 il coeciente di determinazione. Apporre l’esatto valore di verita alle seguenti a↵ermazioni: V Fz^ R 2 = S (^) xY /(S (^) xx S (^) Y Y ) Vz F R 2 > 0 .8 none suciente, da solo, a garantire la bont`a del modello V Fz^ R 2 = SSRES /S (^) Y Y

09.09.2016 — Esercizi

Esercizio 1

Sia X la variabile aleatoria avente densit`a

f (^) X (x) =

cx 4 2 < x < 2 0 altrove

1.1 Determinare il valore da attribuire a c anch´e f (^) X sia e↵ettivamente la densit`a di una variabile aleatoria.

Soluzione: Da 1 =

Z

R

f (^) X (x) dx =

Z 2

2

cx 4 dx = c ·

si ricava c = 645.

1.2 Determinare valore atteso e varianza di X.

Soluzione: E [X] = 0 per simmetria, inoltre

Var [X] = E

X 2

Z

R

x 2 f (^) X (x) dx =

Z 2

2

x 6 dx =

1.3 Sia X 1 ,... , X 100 un campione i.i.d. distribuito come X. Determinare approssimativamente un valore k tale che P

X

(^) < k = 0.9.

Soluzione: Per il Teorema del Limite Centrale, X ⇡ N (0, 351 ); pertanto, standardizzando:

P

X

(^) < k = P

X

p 1 / 35

k p 1 / 35

' P

n |Z| < k

p 35

o ,

imponendo che P

|Z| < k

p 35 = 0.9 si ha k

p 35 = z (^0). 95 = 1.645, in definitiva k = 1 p.^64535 ' 0 .2781.

1.4 Determinare la densit`a della variabile aleatoria Y = X 2.

Soluzione: Osserviamo che X 2 [ 2 , 2], e quindi Y = X 2 2 [0, 4], dunque per 0 < y < 4 si ha

F (^) Y (y) = P {Y  y} = P

X 2 < y = P {

p y < X <

p y} =

Z py

py

x 4 dx =

p y 5 32

in definitiva

f (^) Y (y) =

p y 3 0  y  4

0 altrove

Esercizio 3

Per controllare l’ecienza di un canale di trasmissione digitale viene spedito un segnale formato da 90 bit, tutti 0:

0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0.

Il segnale ricevuto risulta:

0,0,0, 1 ,0,0,0,0,0, 1 ,0,0,0,0, 1 ,0,0, 1 ,0,0,0, 1 ,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, 1 ,0,0,0,0,0,0,0, 0,0,0,0, 1 ,0,0,0,0,0,0, 1 ,0,0,0,0,0, 1 ,0,0,0,0,0,0, 1 ,0,0,0,0,0,0, 1 ,0,0,0,0,0,0,0,0,0,0, 1 ,0,0.

3.1 Fornire una stima numerica per p 1 = P {errore di trasmissione}.

Soluzione: Sia X la variabile di Bernoulli che vale 1 in caso di errore nella trasmissione del singolo bit (da “0” diventa “1”), in simboli X ⇠ Bern(p 1 ); e noto che lo stimatore della probabilita di successo di una variabile di Bernoulli `e costituito dalla media campionaria, nel nostro caso

p b 1 = x =

3.2 Deteminare, con la confidenza (approssimativamente) del 95%, un valore minimo per p 1.

Soluzione: Intervallo di confidenza per il parametro di una bernoulliana, da

p > x z (^1) ↵

r x(1 x) n

nel nostro caso si ricava

p >

s 2 15 ·^

13 15 90

, ossia p > 0. 0744.

3.3 Un canale di trasmissione digitale viene classificato come eciente se la percentuale di bit errati non supera il 10%. Sulla base dei dati forniti, il canale di trasmissione in questione puo essere classificato come eciente, sı o no? Per rispondere e↵ettuate un test statistico tale che la probabilita di commettere l’errore di primo tipo di concludere che il canale none eciente quando e↵ettivamente lo e valga al piu ↵ = 0.05. Quanto vale il p-value del test apena svolto?

Soluzione: Si tratta di e↵ettuare il test (z-test asintotico sul parametro di una bernoulliana) ( H 0 : p  0. 1 H 1 : p > 0. 1

posto

U =

X p (^0) q p 0 (1p 0 ) n

si rifiuta H 0 a livello ↵ se u > z (^1) ↵ ; nel nostro caso u = 1.05, poich´e z (^0). 95 = 1.645 non si rifiuta H 0 : non vi `e suciente evidenza per a↵ermare che il canale non sia eciente. Il p-value vale 1 (u), ossia all’incirca il 15%.

Probabilit`a e Statistica — 30.01.

Cognome

Nome

Matricola

Domande corrette Punti Esercizio 1

Punti Esercizio 2 Punti Esercizio 3

La risposta a ciascuno dei 10 test e considerata valida se e soltanto se tutti i valori di verita relativi sono stati indicati correttamente.

Domanda 1. Sia X 1 ,... , X n un n campione del-

la densita di Poisson P(). Lo stimatore di massima verosimiglianza di e X 1 + · · · + X (^) n , z (^) (X 1 + · · · + X (^) n )/n, (X 12 + · · · + X (^) n^2 )/n.

Domanda 2. Dire se le seguenti funzioni f : R! R

sono densita di probabilita (e indicare con V): V Fz^ f (x) = 6x(2x 1) per 0  x  1, f (x) = 0 altrimenti, Vz F f (x) = 1 |x| per 1  x  1, f (x) = 0 altrimenti, V Fz^ f (x) = x per 0  x  1, f (x) = 0 altrimenti, V Fz^ f (x) = (2x1) exp(x) per 0  x < 1 , f (x) = 0 altrimenti.

Domanda 3. Siano A, B e C tre eventi con probabilit`a

P(A) = 3/4, P(B) = 1/6, P(C) = 1/16. Apporre i corretti valori di verit`a alle seguenti a↵ermazioni: V Fz^ P (A [ B [ C) = 1, V Fz^ A contiene B [ C, Vz F P(A) > P(B [ C).

Domanda 4. Se X, Y due variabili aleatorie

indipendenti con densita normale N (0, 1) allora: Vz F 12 X + 5Y ha densita normale N (0, 169), V Fz^4 X 3 Y ha densit`a normale N (0, 7), Vz F Cov(3X 2 Y, 3 X + 2Y ) = 13,

Domanda 5. In un test chi-quadrato d’indipendenza il

numero di gradi di liberta della distribuzione 2 utilizzatae:

la somma delle numerosita dei campioni ciascuna diminuita di uno, il prodotto delle numerosita dei campioni ciascuna diminuita di uno, z (^) il prodotto del numero di valori (o classi) che la variabile aleatoria puo assumere (o a cui puo appartenere) ciascuno diminuito di uno, la somma del numero di valori (o classi) che la variabile aleatoria puo assumere (o a cui puo appartenere) meno 2.

Domanda 6. Se la variazione assoluta di un’azione

in un giorno e modellata come una variabile aleatoria V = 2X 1 con X ⇠ Bern(p), la variazione in 16 giorni lavorativi consecutivi sara coerentemente modellata come: V Fz^ la variabile aleatoria 16V , V Fz^ una variabile aleatoria con densit`a normale N (32p 16 , 48 p(1 p)), Vz F la variabile aleatoria

P 16

i=1 (2X^ i^ ^ 1) con^ X^ i^ ⇠ Bern(p) indipendenti.

Domanda 7. Sia X 1 ,... , X n un n-campione della den-

sit`a esponenziale E(✓) (avente E[X] = 1/✓) (0 < ✓ < 1) e sia X (^) n =

P (^) n i=1 X^ i^ /n^ la media campionaria. Apporre i corretti valori di verita: V Fz^ X (^) ne uno stimatore non distorto di ✓, Vz F X (^) n e uno stimatore non distorto di 1/✓, Vz F (X 21 + · · · + X (^) n^2 )/ne uno stimatore non distorto di 2/✓ 2 , V Fz^ (X 21 + · · · + X (^) n^2 )/n `e uno stimatore non distorto di 1/✓ 2.

Domanda 8. Sia X 1 ,... , X n un n-campione della den-

sita normale N (μ, 1) e sia X (^) n la media campionaria. Con- sideriamo il test con significativita ↵ (0 < ↵ < 0 .5) di H 0 : μ = 0 contro H 1 : μ 6 = 0. Detta la f.d.r. della normale standard, apporre i corretti valori di verita: V Fz^ la regione di rifiutoe [z (^1) ↵/ 2 /

p n, z 1 ↵/ 2 /

p n] Vz F la regione di rifiuto `e ( 1 , z (^1) ↵/ 2 /

p n) [ (z (^1) ↵/ 2 /

p n, + 1 ) V Fz^ la regione di rifiuto `e [z (^1) ↵ /

p n, z 1 ↵ /

p n] V Fz^ la regione di rifiuto `e [(1 ↵/2)/

p n, (1 ↵/2)/

p n]

Domanda 9. Siano X 1 ,... , X n e Y 1 ,... , Y m due

campioni indipendenti delle densita normali N (μ (^) x , (^) x^2 ) e N (μ (^) y , (^) y^2 ) (parametri non noti) con medie campionarie X e Y e varianze campionarie S (^2) x e S (^2) y. se vale l’ipotesi (^2) x = (^2) y , allora S (^) x^2 /S (^) y^2 ha densita di Fisher F (^) m 1 ,n 1 , z (^) se vale l’ipotesi 2 x =^ ^ 2 y , allora^ S^ 2 x /S^ 2 y ha densita di Fisher F (^) n 1 ,m 1 , S (^2) x /S (^2) y ha densita di Fisher F (^) n 1 ,m 1 , S (^2) x /S (^2) y ha densit`a di Fisher F (^) n,m.

Domanda 10. Si lanciano quattro monete equilibrate.

Se consideriamo gli eventi A “si ottengono esattamente due teste” e B “si ottengono esattamente tre teste” allora V Fz^ A ✓ B, Vz F P (B c^ ) > P (A), V Fz^ P (B) > P (A).

giovani famiglie adulti AAA 32.86 46.55 35. BBB 27.14 38.45 29.

Rifiutiamo l’ipotesi di indipendenza se u > (^20) .95;2 = 5.99, poich´e la statistica test vale

u =

X

i,j

(O (^) ij E (^) ij ) 2 E (^) ij

rifiutiamo l’ipotesi di indipendenza: vi `e un legame tra catena di pizzerie e la tipologia di clientela.

  1. Si vocifera di una fusione tra le due catene di pizzerie, ci si chiede se questo porterebbe ad una equa distribuzione dei clienti nelle varie tipologie; sempre al 5% di significativita,e possibile a↵ermare che tale fusione non porterebbe alla equa distribuzione di cui si dice?

Soluzione: Una fusione porterebbe (sempre sulla base dello stesso campione) alla seguente situazione: giovani famiglie adulti AAA+BBB 60 85 65

Possiamo e↵ettuare allora un test 2 di adattamento, una “equa distribuzione” porterebbe a numerosit`a teoriche E 1 = E 2 = E 3 = 70; rifiutiamo l’ipotesi di equa distribuzione, nuovamente, se u > (^20) .95;2 = 5.99, poich´e la statistica test vale X

j

(O (^) j E (^) j ) 2 E (^) j

con la significativita el 5% none possibile rifiutare l’ipotesi di “equa distribuzione”.

  1. Determinare i p-value dei due test e↵ettuati pi`u sopra.

Soluzione: Entrambi i test coinvolgono una 22 , ossia una Exp( = 12 ); posto allora V ⇠ Exp( 12 ), si ha:

test di indipendenza: p-value = P {V > 7. 41 } = e ^

(^12) · 7. 41 ' 0. 0246 , test di adattamento: p-value = P {V > 5 } = e ^

(^52) ' 0. 0821.

Esercizio 3

Un centro meteorologico vi chiede di analizzare le temperature minime espresse in o^ F registrate in gennaio in 54 localita degli Stati Uniti. Per ogni localita sono note la Latitudine (distanza angolare dall’Equatore) e la Longitudine (distanza angolare dal meridiano di Greenwich), entrambe espresse in gradi. In allegato `e riportato uno scatterplot dei dati, insieme all’output prodotto da R ed alcuni grafici di diagnostica relativi al modello lineare: T emp = 0 + 1 Lat + 2 Long + ✏

Problema 3

Un centro meteorologico vi chiede di analizzare le temperature minime espresse in oF registrate in gennaio

in 54 località degli Stati Uniti. Per ogni località sono note la Latitudine (distanza angolare dall’Equatore)

e la Longitudine (distanza angolare dal meridiano di Greenwich) entrambe espresse in gradi.

In allegato è riportato uno scatter plot dei dati insieme all’output prodotto da R ed alcuni grafici di

diagnostica relativi al modello lineare:

T emp = 0 + 1 Lat + 2 Long + ✏

Motivando opportunamente le risposte:

  • Si valuti la bontà del modello rispetto al suo adattamento ai dati.
  • Si valuti la bontà del modello rispetto alle assunzioni modellistiche di omoschedasticità e normalità

Motivando opportunamente le risposte:

  1. Si valuti la bont`a del modello rispetto al suo adattamento ai dati.

Soluzione: Il coeciente R 2 e abbastanza elevato, il p-value complessivoe estremamente basso, il modello pare esauriente rispetto ai dati.

  1. Si valuti la bonta del modello rispetto alle assunzioni modellistiche di omoschedasticita e normalit`a degli errori.

Soluzione: Il p-value del test di Shapiro e elevato: non si puo rifiutare l’ipotesi di normalita degli errori; il grafico dei residui non mostra particolari andamenti; a livello di omoschedasticita si puo notare una apparente maggiore variabilita degli errori relativi a valori “bassi” della latitudine.

  1. Rifiutereste a livello dei significativit`a del 5% l’ipotesi secondo la quale la temperatura attesa dipende linearmente dalla latitudine?

Soluzione: Si tratta di e↵ettuare il test

H 0 : 1 = 0 vs. H 1 : 1 6 = 0,

e suciente guardare il p-value relativo al predittore Lat: il legame (lineare, come si evince dal grafico) tra temperatura e latitudinee molto forte.

  1. Rifiutereste a livello dei significativit`a del 5% l’ipotesi secondo la quale la temperatura attesa dipende linearmente dalla longitudine?

Soluzione: Si tratta ora di e↵ettuare il test

H 0 : 2 = 0 vs. H 1 : 2 6 = 0,

con un p-value del 18%, non vi e motivo di rifiutare l’ipotesi nulla: non vie alcun legame tra temperatura e longitudine.

  1. Sulla base delle risposte precedenti, suggerireste l’utilizzo di un modello piu semplice? Se sı, quale?

Soluzione: S`ı, quello con la sola latitudine.