










Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Compiti di STATISTICA con soluzioni aggiornati ad Aprile 2019
Tipologia: Prove d'esame
1 / 18
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!











Esercizio 2. Modello di regressione lineare yi = β 0 + β 1 xi + εi, εi ∼ N (0, σ^2 ), in cui x = reddito autocertificato, y = reddito evaso.
(A) β̂ 1 = 0.575, β̂ 0 = 2.9434, ̂σ^2 = 9.3496.
(B) Test di H 0 : β 1 = 0 contro H 1 : β 1 > 0. Statistica test sotto H 0 : ( β̂ 1 − 0)/s(β̂ 1 ) con distribuzione approssimata T (n − 2). Valore campionario della statistica test sotto H 0 : tcamp = 7.8767; regione rifiuto per α = 0.05: (1. 6706 , ∞).
(C) R^2 = 0.5084.
(D) Residuo in corrispondenza dell’osservazione (xi = 23. 39 , yi = 16.26): ̂ui = − 0 .1317.
Valori e calcoli utili: n = 62, dev(x) = nV ar(x) = 1754 .7488, dev(y) = nV ar(y) = 1141 .0542,
codev(x, y) = corr(x, y)
dev(x)dev(y) = 1008.9047, β̂ 1 = codev(x, y)/dev(x) = 0.575, β̂ 0 = y − β̂ 1 x =
2 .9434, ̂σ^2 = (dev(y) − β̂^21 dev(x))/(n − 2) = 9 .3496, se(β̂ 1 ) =
σ^2 /dev(x) =
dev(RES) = dev(y) − β̂ 12 dev(x) = 560.9776, dev(REG) = dev(y) − dev(RES) = 580.0766, R^2 =
dev(REG)/dev(y) = 0.5084; ̂yi = β̂ 0 + β̂ 1 xi = 16.3917, ̂ui = yi − ̂yi = − 0 .1317.
Esercizio 3. Assunzioni: E =’Evasore’, D =’Dipendente’, R =’Professionista’; A =’Altro’; P (E|D) = 0 .123, P (E|R) = 0.241, P (E|A) = 0.412, P (D) = 0.453, P (R) = 0.146.
(A) P (E) = P (E|D)P (D) + P (E|R)P (R) + P (E|A)P (A) = 0.2561.
(B) P (R|E) = P (E|R)P (R)/P (E) = 0.1374.
Valori e calcoli utili: P (A) = 1 − P (D) − P (R) = 0. 401
Premessa: Nell’ambito di un progetto di cooperazione, la catena commerciale CPD fa produrre alcuni prodotti alimentari (fuori stagione per l’Italia) in Burchina Faso.
Esercizio 1. Uno degli obiettivi CPD e quello di ridurre al minimo possibile l’uso di pesticidi nella coltivazione dei prodotti. A titolo di esprerimento, relativamente alla produzione di fagiolinie stata fatta una comparazione per verificare l’eventuale perdita di produzione nel caso non si usino pesticidi. La seguente tabella riporta i risultati ottenuti su due distinti campioni casuali (dati espressi in qli/ettaro).
Senza pesticidi 1. 8 2. 6 2. 5 1 2. 7 Con pesticidi 3. 3 2. 7 3. 8 2. 7 2. 9
Assumendo che la produzione su ciascuna unit`a del campione si distribuisca in modo normale ed evitando assunzioni sulle varianze:
(A) Stimare la differenza fra le produzioni medie delle due diverse metodologie; fornire il corrispondente standard error. (B) Il fatto di non usare pesticidi fa mediamente diminuire la produzione? (α = 0.01) (C) Effettuare il calcolo dello standard error richiesto al punto A nel caso in cui si assuma l’uguaglianza delle due varianze. Confrontare il risultato con quello ottenuto al punto A e spiegare.
Esercizio 2. Produzioni di tipo biologico o, comunque, di lotta integrata richiedono il monitoraggio della quantita parassiti che possono attaccare le produzioni. Il monitoraggioe spesso effettuato mediante ’trappole’ per catturare e contare i parassiti presenti al momento. I dati che seguono (rilevati in assenza di ogni intervento) possono aiutare a percepire in che misura la presenza di parassiti danneggia le produzioni (presenza del parassita yellow fly rilevato dalle trappole espressa in unit`a standardizzate; produzione in qli/ettaro).
Produzione di fagiolini 3. 3 2. 7 3. 2 1. 7 3. 2 Presenza yellow fly 2. 2 2. 6 4. 7 7. 4 5. 4
Si formuli un opportuno modello e si risponda alle seguenti domande. (A) Stimare tutti i parametri del modello mediante il metodo dei minimi quadrati. (B) Calcolare lo standard error dei coefficienti di regressione. (C) Indicare quanta parte della variabilita della variabile dipendentee spiegata dal modello considerato.
Esercizio 3. Nel 2008 sono state coinvolte nella produzione di fagiolini 61 persone. Si assuma che la probabilit`a di una persona di infortunarsi nell’arco della stagione sia il 2% e che gli eventuali infortuni avvengano in modo indipendente l’uno dall’altro.
(A) Calcolare la probabilita che, complessivamente, si infortunino meno di 2 persone. (B) Seppure in modo approssimato, il calcolo precedente puo essere effettuato ricorrendo ad un’altra distribuzione (fra quelle a voi note). Effettuare il calcolo spiegandone le ragioni teoriche.
Esercizio 1. Assunzioni: X =’Produzione senza pesticidi’∼ N (μX , σ X^2 ); Y =’Produzione con pesticidi’∼ N (μY , σ^2 Y );
(A) La quantita da stimaree μY − μX ; lo stimatore e Y − X; la stimae y − x = 0.96; il corrispondente standard error `e
s^2 Y /nY + s^2 X /nX =
(B) Test di H 0 : μY − μX = 0 contro H 1 : μY − μX > 0. In assenza di assunzioni sulle varianze possiamo adottare l’approssimazione di Satterthwaite. Statistica test sotto H 0 : (Y − X − 0)/se con distribuzione approssimata T (g), dove se indica lo standard error calcolato come sopra e g indica i g.l. calcolati con l’approssimazione di Satterthwaite. Valore campionario della statistica test 2.4971; regione di rifiuto per α = 0.01 (2. 998 , ∞).
Premessa: Si parla di microcredito in Blangladesh e della celebre Grameen Bank.
Esercizio 1. La seguente tabella mostra una serie di dati della Bank riferiti al recente periodo di attivit`a. Si vuole analizzare il legame dell’ammontare dei prestiti concessi in funzione del numero di debitori.
Anno 2004 2005 2006 2007 2008 Prestiti concessi (milioni USD) 330 410 470 540 640 Numero debitori (milioni) 3. 9 5. 3 5. 8 6. 2 6. 1
Formulare un opportuno modello che risponda alle esigenze espresse e rispondere alle seguenti domande:
(A) Stimare tutti i parametri del modello. (B) Calcolare devianza di regressione, devianza residua ed indice R^2. (C) In base al modello, stimare il valore dei debiti concessi qualora i debitori salissero del 10% rispetto al 2008.
Esercizio 2. La probabilita che una donna restituisca interamente il prestito concessoe del 98.8%; per un uomo tale probabilitae del 90%. Sapendo che i debitori uomini sono il 9.5%:
(A) Calcolare la probabilita che un prestito, estratto casualmente, non venga restituito per intero. (B) Calcolare le probabilita a posteriori condizionatamente al fatto che un prestito non venga interamente restituito. (C) Calcolare la probabilita che su 94 prestiti, estratti casualmente con reimmissione, quelli non restituiti interamente siano piu di 2.
Esercizio 3. La tabella seguente (riferita ad un caso di studio e non a tutta la popolazione) analizza le perdite subita dalla Bank sui debitori che non restituiscono il prestito per intero. Le statistiche riguardano l’ammontare percentuale delle rate non rimborsate sul totale (stante la povert`a dei debitori, la variabile in analisi coincide praticamente con la LGD).
Statistiche Debitori osservazioni media
Varianza corretta Uomini 267 47. 4 17. 5 Donne 378 44. 9 16. 9
Assumendo che la percentuale non restituita segua una distribuzione Normale (assunzione non comple- tamente giustificata): (A) Stimare la differenza media della percentuale non restituita fra uomini e donne; fornire il corrispon- dente standard error. (B) Le donne tendono ad avere una perdita percentuale media inferiore agli uomini? Rispondere mediante il p-value.
Esercizio 1. Modello di regressione lineare yi = β 0 + β 1 xi + εi, εi ∼ N (0, σ^2 ), in cui y =’Prestiti concessi’, x =’Numero di debitori’.
(A) β̂ 1 = 110, β̂ 0 = − 122 .7, ̂σ^2 = 4641.7.
(B) dev(Res) = 13925.2, dev(Reg) = 42754.8, R^2 = 0.7543.
(C) x 0 = (1 + 10%) ∗ x 2008 = 6.71, da cui ŷ(x 0 ) = 615.5.
d Calcoli e valori utili:
xi 3.9 5.3 5.8 6.2 6.1 27. yi 330 410 470 540 640 2390 x^2 i 15.21 28.09 33.64 38.44 37.21 152. y^2 i 108900 168100 220900 291600 409600 1199100 xiyi 1287 2173 2726 3348 3904 13438
da cui: n = 5, x = 5.46, y = 478, dev(x) =
∑n i=1 x 2 i −^ nx
(^2) = 3.532, dev(y) = ∑n i=1 y 2 i −^ ny
codev(x, y) =
∑n i=1 xiyi^ −nxy^ = 388.6,^ dev(RES) =^ dev(y)−^ ̂β^1
2 dev(x) = 13925.2, ̂σ^2 = dev(RES)/(n−
β̂ 0 + β̂ 1 x 0 = 615.5.
Esercizio 2. Assunzioni: F =’Donna’, M =’Uomo’, R =’Restituisce il prestito’. P (R|F ) = 0.988, P (R|M ) = 0.9, P (M ) = 0.095, P (F ) = 1 − P (M ) = 0.905.
(A) P (R) = 1 − P (R) = 0.0204, dove P (R) = P (R|F )P (F ) + P (R|M )P (M ) = 0.9796.
(B) P (F |R) = P (R|F )P (F )/P (R) = 0.5334, P (M |R) = 1 − P (F |R) = 0.4666.
(C) X =’numero prestiti non interamente restituiti’Bi(n = 94, p = 0.0204). P (X > 2) = 1 − P (X ≤
Esercizio 3. Assunzioni: X =’Percentuale non restituita da uomo’∼ N (μX , σ^2 X ), Y =’Percentuale non restituita da donna’∼ N (μY , σ^2 Y ),
(A) Stima di√ μX − μY. Stimatore X − Y , stima x − y = 2.5; corrispondente standard error se = s^2 X /nX + s^2 Y /nY =
(B) Test di H 0 : μX − μY = 0 contro H 0 : μX − μY > 0. Statistica test (sotto H 0 ) (X − Y − 0)/
S^2 X /nX + S Y^2 /nY la cui distribuzione `e, approssimativamente, N (0, 1) in base alle elevate dimensioni campionarie nX e nY. Valore campionario della statistica test (sotto H 0 ): zcamp = 1.8125; p − value = P ((X − Y − 0)/
S^2 X /nX + S Y^2 /nY > zcamp|H 0 ) = P (Z > zcamp|H 0 ) = 0. 03496
Calcoli e valori utili: nX = 267, nY = 378, x = 47.4, y = 44.9, sX = 17.5, sY = 16.9, s^2 X = 306.25, s^2 Y = 285.61.
da cui: n = 5, x = 2005, y = 63.2, dev(x) =
∑n i=1 x
2 i −^ nx
(^2) = 10, dev(y) = ∑n i=1 y
2 i −^ ny
codev(x, y) =
∑n i=1 xiyi^ −^ nxy^ = 115,^ dev(RES) =^ dev(y)^ −^ ̂β^1
2 dev(x) = 32, ̂σ^2 = dev(RES)/(n − 2) =
10 .7667, ̂σ(β̂ 1 ) =
σ^2 /dev(x) =
Esercizio 2.
(A) Assunzioni:∑ X =’cliente acquista abitualmente prodotti CES’∼ Be(p). Stimatore di p: ̂p = n i=1 xi/n; stima^ ̂p^ = 201/1358 = 0.148; standard error:^ se^ =^
pq/n̂ =
(B) Assunzioni: X 1 =’cliente maschio acquista abitualmente prodotti CES’∼ Be(p 1 ); X 2 =’cliente ma- schio acquista abitualmente prodotti CES’∼ Be(p 2 ), campioni indipendenti. Test di H 0 : p 1 − p 2 = 0 contro H 0 : p 1 −p 2 6 = 0. La statistica test, sotto H 0 , `e (p̂ 1 − p̂ 2 −0)/
pq̂(1/n 1 + 1/n 2 ) la cui distribuzione e, approssimativamente, N (0, 1); il valore campionario della statistica teste, sotto H 0 , zcamp = − 2 .0392; p − value = 2P ((̂p 1 − p̂ 2 − 0)/
p̂q(1/n 1 + 1/n 2 ) > |zcamp||H 0 ) = 2P (Z > 2. 0392 |H 0 ) = 2 ∗ 0 .02071 = 0 .04143.
Calcoli e valori utili: n 1 = 534, n 2 = 824, ̂p 1 = 0.1236, ̂p 2 = 0.16383, x 1 =’numero acquirenti abituali maschi’= n 1 p̂ 1 = 66, x 2 =’numero acquirenti abituali femmine’= n 2 ̂p 2 = 135, ̂p = (66+135)/(534+824) = 0 .148,
p̂q(1/n 1 + 1/n 2 ) =
Esercizio 3. Assunzioni: X =’spesa mensile in prodotti CES’, D =’diplomato’, X|D ∼ N (μ 1 = 24, σ 1 = 8 .3), X|D ∼ N (μ 2 = 14, σ 2 = 4.8), P (D) = 0.446, P (D) = 0.554.
(A) P (X > c) = P (X > c|D)P (D) + P (X > c|D)P (D) = 0.36407 dove c = 20.
(B) P (D|X < c) = P (X < c|D)P (D)/P (X < c) = 0.22087.
(C) Y =’numero clienti su 129 che spendono pi`u di 20 euro’∼ Bi(n = 129, p = 0.36407). E(Y ) = np = 46 .96526, σ(Y ) =
npq =
Calcoli e valori utili: P (X > c|D) = P ((X − μ 1 )/σ 1 > (c − μ 1 )/σ 1 ) = P (Z > − 0 .48193) = 0.68507, P (X > c|D) = P ((X − μ 2 )/σ 2 > (c − μ 2 )/σ 2 ) = P (Z > 1 .25) = 0.10565.
Premessa: Progetto Formazione–Sicurezza della provincia di Udine, in collaborazione con INAIL e Ispettorato del lavoro, finalizzato alla riduzione degli infortuni sul lavoro.
Esercizio 1. Prima di mettere in pratica il progetto e stata fatta una rilevazione puramente conoscitiva. Si ritiene infatti che la preparazione in termini di sicurezza sia spesso adeguata ma che talvolta il personale non ne rispetti le norme per pigrizia o per rendere piu semplice e spedito il lavoro. La seguente tabella riporta i principali risultati della rilevazione. La domanda, con una diversa formulazione, e stata fatta sia agli operai che ai loro supervisori (con diversa qualifica) con riferimento all’ultimo anno. No Sı Operai: Le `e capitato di non mettere in pratica tutti gli accorgimenti che lei conosce riguardo alla sua sicurezza? 284 303 Supervisori: Ritiene significativo, fra i suoi operai, il ricorso a pratiche ”scorciatoie” riguardo alla sicurezza personale? 355 428
(A) La proporzione di quanti ritengono che vengano adottati comportamenti non sicuri e significativa- mente diversa nei due gruppi? (α = 0.02) (B) Calcolare la potenza del test costruito al punto A nel caso in cui l’alternativa sia ’le probabilita dei due gruppi differiscono di 0.06’.
Esercizio 2. Nell’ambito del progetto in questione e stato selezionato un piccolo campione di imprese ad alto rischio di infortuni. Per un certo periodo, al personale delle stesse sono state somministrate ore di formazione attinenti la sicurezza. L’analisi dei dati raccolti (principali statistiche in tabella, unita di misura rimosse) puo consentire di valutare se e in che misura tale attivita risulta efficace per la riduzione del rischio di infortunio.
Indicatore formazione 57 62 60 45 35 45 Indicatore infortuni 7. 4 5. 2 3. 3 6 5. 1 7. 5
Formulare un opportuno modello di regressione e:
(A) Stimarne tutti i parametri. (B) Fornire lo standard error degli stimatori dei coefficienti di regressione. (C) L’attivit`a di formazione risulta efficace allo scopo formulato sopra? Rispondere impostando il problema in termini di test delle ipotesi (α = 0.025). (D) Scomporre la varianza della variabile dipendente nelle sue componenti fornendo un’interpretazione dei valori ottenuti.
Esercizio 3. Si considerino due linee di montaggio che lavorano in modo indipendente. Ogni giorno, in media, ci sono 1 .3 ricorsi all’infermeria per quanto riguarda la linea 1 e 1.8 per quanto concerne la linea 2. Si assuma che la distribuzione del numero di ricorsi in infermeria segua una distribuzione di Poisson.
(A) Calcolare la probabilita che, in un giorno, ci siano complessivamente piu di 2 ricorsi all’infermeria. (B) Calcolare la probabilit`a che, in un giorno, ci siano 2 ricorsi all’infermeria e tutti provenienti dalla stessa linea.
Esercizio 1. Assunzioni: X =’Operaio non mette in pratica... ’∼ Be(pX ); Y =’Supervisore ritiene significativo il
... ’∼ Be(pY ). Campioni indipendenti.
Premessa: L’attenzione `e rivolta a possibili differenze di carattere socio-economico fra le regioni italiane.
Esercizio 1. La rilevazione ISTAT Condizioni di vita e distribuzione del reddito in Italia fornisce un’idea su come la situazione economica e percepita nelle diverse regioni. La seguente tabella riporta le percentuali di coloro che hanno risposto affermativamente alla domanda “Arriva a fine mese con molta difficolta?”.
Anno Centro-Nord Centro-Sud Piem. Lomb. Veneto Friuli Em.-Rom. Campania Puglia Calabria Sicilia Sardegna 2007 15. 5 10. 1 12. 2 11. 4 13. 2 22 21. 3 22. 7 26. 4 16. 6 2008 16. 5 12. 8 12. 6 10. 6 11 28 24. 1 25. 2 29. 7 21. 9
Assumendo che la percentuale di risposte affermative si distribuisca in modo normale, rispondere alle seguenti domande. (A) In media, la situazione 2008 appare significativamente peggiorata rispetto al 2007? (α = 0.01) (B) Con riferimento al 2008, esiste una differenza significativa fra la percezione media nelle regioni del centro-nord e quelle del centro-sud? (α = 0.02)
Esercizio 2. Si sta tentando di misurare se, nelle diverse regioni italiane, la spesa in consumi alimentari `e in relazione col reddito oppure no. A questo scopo, sono stati esaminati il PIL e la spesa alimentare (per entrambi in espressi in termini pro-capite e su scala logaritmica) al 2007 nelle 20 regioni italiane ottenendo le statistiche riportate in tabella (c = ln(spesa alimentare pro-capite), r = ln(PIL pro-capite)).
c = 7. 6655 r = 10. 1068
i=
(ci − c)^2 = 0. 2227
i=
(ri − r)^2 = 0. 4454
i=
(ci − c) (ri − r) = 0. 1084
(A) Formulare un modello statistico che risponda alle esigenze espresse. Stimarne i parametri. (B) I consumi alimentari tendono a diminuire in modo significativo al diminuire del PIL pro-capite? (α = 0.01). (C) Scomporre la devianza della variabile dipendente nelle sue componenti (di regressione e residua) fornendone i valori. Quale indicazione utile fornisce tale scomposizione? (D) Calcolare valori teorici e residui per le regioni Sicilia e Trentino-Alto Adige, le cui coppie (Spesa alimentare pro-capite; PIL pro-capite) sono risultate pari, rispettivamente, a (2260, 17156) e (1937, 32412). Commentare brevemente il risultato.
Esercizio 3. Una variabile casuale discreta ha la distribuzione riportata nella seguente tabella
x − 1 0 1 2 3 4 5 6 P (X = x) 0. 17 0. 06 0. 15 0. 18 0. 07 0. 14 0. 08 0. 15
(A) Si rappresenti graficamente la distribuzione della variabile casuale (X|X > 2). (B) Si calcolino valore atteso e deviazione standard della variabile casuale costruita al punto A.
Esercizio 1.
(A) Test sulla differenza fra medie per campioni appaiati; si assume quindi D = X 2008 − X 2007 ∼ N (μD , σ D^2 ), dove X indica la percentuale di coloro che rispondono affermativamente alla domanda. Test di H 0 : μD = 0 contro H 1 : μD > 0; statistica test (sotto H 0 ): (D − 0)/(SD /
n) la cui distribuzione `e T (n − 1); regione di rifiuto per α = 0.01: (2. 8214 , ∞); valore campionario della statistica test sotto H 0 : 2 .5959.
Calcoli e valori utili: d 1 2. 7 0. 4 − 0. 8 − 2. 2 6 2. 8 2. 5 3. 3 5. 3
n = 10, d = 2.1, s^2 D = 6.54444, sD = 2.55821, sD /
n = 0.80898.
(B) Test sulla differenza fra medie per campioni indipendenti; si assume quindi X 1 = ‘% in del centro -nord’ ∼ N (μ 1 , σ^2 ), X 2 = ‘% in regione del centro-sud’ ∼ N (μ 2 , σ^2 ) (varianze uguali). Test di H 0 : μ 1 − μ 2 = 0 contro H 0 : μ 1 − μ 2 6 = 0; statistica test (sotto H 0 ): (X 1 − X 2 − 0)/(Sp
1 /n 1 + 1/n 2 ) la cui distribuzione `e T (n 1 +n 2 −2); regione di accettazione per α = 0.02: [− 2. 8965 , 2 .8965]; valore campionario della statistica test sotto H 0 : − 7 .5349.
Calcoli e valori utili: (A) n 1 = 5, n 2 = 5, x 1 = 12.7, x 2 = 25.78, s^21 = 5.44, s^22 = 9.627, s^2 p =
[s^21 (n 1 − 1) + s^22 (n 2 − 1)]/(n 1 + n 2 − 2) = 7.5335, sp = 2.74472, sp
1 /n 1 + 1/n 2 = 1.73591.
Esercizio 2. Modello di regressione lineare yi = β 0 +β 1 xi+εi, εi ∼ N (0, σ^2 ), in cui y = ln(Spesa alimentare pro-capite), x = ln(PIL pro-capite).
(A) β̂ 1 = 0.2434, β̂ 0 = 5.2057, ̂σ^2 = 0.218131.
(B) Test di H 0 : β 1 = 0 contro H 0 : β 1 > 0; statistica test (sotto H 0 ): ( β̂ 1 − 0)/se(β̂ 1 ) la cui distribuzione `e T (n − 2); regione di rifiuto per α = 0.01: (2. 5524 , ∞); valore campionario della statistica test sotto H 0 : 1 .5553.
(C) dev(y) = 4.454, dev(REG) = 0.528, dev(RES) = 3.926. Segue che R^2 = 0.1185, ovvero il modello spiega il 11.85% della variabilit`a della variabile indipendente.
(D) ̂ySIC = β̂ 0 + β̂ 1 ln(17156) = 7.5787, ̂uSIC = ySIC − ŷSIC = ln(2260) − 7 .5787 = 0.1444, ŷT.A.A. =
β̂ 0 + β̂ 1 ln(32412) = 7.7335, ̂uT.A.A. = yT.A.A. − ̂yT.A.A. = ln(32412) − 7 .7335 = − 0 .1646.
Calcoli e valori utili:
da cui: n = 20, x = 10.11, y = 7.67, dev(x) = 8.908, dev(y) = 4.454, codev(x, y) = 2.168, β̂ 1 =
codev(x, y)/dev(x) = 0.2434, β̂ 0 = y − β̂ 1 x = 5.2057, dev(RES) = dev(y) − β̂ 12 dev(x) = 3.926, ̂σ^2 =
dev(RES)/(n − 2) = 0.218131, ̂σ = 0.467045, se(β̂ 1 ) = σ/̂
dev(x) = 0.1565.
Esercizio 3. Le prime due righe della tabella forniscono la risposta alla domanda (A), per ricavare la quale e sufficiente applicare la definizione di probabilita condizionata: P (X = x|X > 2) = P (X = x, X > 2)/P (X > 2). In tale formula P (X > 2) = 0.44, mentre P (X = x, X > 2) vale 0 se x <= 2 oppure P (X = x) se x > 2. Le altre due righe forniscono il prospetto di calcolo per la risposta alla domanda (B).
x 3 4 5 6 P (X = x|X > 2) 0. 15909 0. 31818 0. 18182 0. 34091 1 xP (X = x|X > 2) 0. 47727 1. 27272 0. 9091 2. 04546 4. 70455 x^2 P (X = x|X > 2) 1. 43181 5. 09088 4. 5455 12. 27276 23. 34091
E√(X|X > 2) = 4.70455, V (X|X > 2) = E(X^2 |X > 2) − E(X|X > 2)^2 = 1.20816, σ(X|X > 2) = 1 .20816 = 1.09916.
Calcoli e valori utili: d − 5. 5 − 6. 3 − 1 − 2. 2 − 1. 1 − 0. 3 − 0. 6
Esercizio 2. Modello di regressione lineare yi = β 0 + β 1 xi + ui, ui ∼ N (0, σ^2 ), in cui y =var.% prod. lavoro, x =var.% PIL.
(A) β̂ 1 = 0.9785, β̂ 0 = − 0 .2843, σ̂^2 = 1.10744.
(B) Test di H 0 : β 1 = 0 contro H 0 : β 1 6 = 0; statistica test (sotto H 0 ): ( β̂ 1 − 0)/se(β̂ 1 ) la cui distribuzione `e T (n − 2); regione di accettazione per α = 0.02: [− 3. 3649 , 3 .3649]; valore campionario della statistica test sotto H 0 : 2.284.
(C) I dati costituiscono una serie temporale. La correlazione che normalmente esiste fra frenomeni rilevati a tempi vicini mette a rischio l’assunzione di indipendenza dei residui.
(D) ̂y 2009 = β̂ 0 + β̂ 1 x 2009 = − 0 .2843 + 0. 9785 ∗ − 5 .1 = − 5. 2744
Calcoli e valori utili:
Anno 2002 2003 2004 2005 2006 2007 2008 Somma xi 0. 5 0 1. 4 0. 6 2. 1 1. 4 − 0. 9 5. 1 yi − 0. 5 − 1. 8 1. 8 1. 6 1. 5 0. 9 − 0. 5 3 x^2 i 0. 25 0 1. 96 0. 36 4. 41 1. 96 0. 81 9. 75 y^2 i 0. 25 3. 24 3. 24 2. 56 2. 25 0. 81 0. 25 12. 6 xiyi − 0. 25 0 2. 52 0. 96 3. 15 1. 26 0. 45 8. 09 da cui: n = 7, x = 0.7286, y = 0.4286, dev(x) =
∑n i=1 x
2 i −^ nx (^2) = 6.0343, dev(y) = ∑n i=1 y
2 i −^ ny
11 .3143, codev(x, y) =
∑n i=1 xiyi^ −^ nxy^ = 5.9043, β̂ 1 = codev(x, y)/dev(x) = 0.9785, β̂ 0 = y − β̂ 1 x =
− 0 .2843, dev(RES) = dev(y) − β̂ 12 dev(x) = 5.537199, ̂σ^2 = dev(RES)/(n − 2) = 1.10744, ̂σ = 1.05235,
se(β̂ 1 ) = σ/̂
dev(x) = 0.4284.
Esercizio 3.
(A) X e Y sono indipendenti se e solo se f (x, y) = f (x)f (y) per tutte le celle della tabella. Poiche questoe vero, le due variabili sono indipendenti.
y x − 1 0 2 0 0. 0855 0. 1755 0. 1890 0. 45 2 0. 1045 0. 2145 0. 2310 0. 55
(B) Dai valori in tabella si calcolano facilmente i possibili valori che W = XY puo assumere con le rispettive probabilita:
w − 2 0 4 f (w) 0. 1045 0. 6645 0. 2310
Premessa: Si parla di livello di alfabetizzazione nei diversi paesi africani e della loro relazione con altre variabili.
Esercizio 1. Il grado di alfabetizzazione giovanile si presenta in modo assai eterogeneo fra i diversi paesi africani. Per quanto riguarda il differenziale fra sessi, i dati OECD riferiti allo Youth Literacy Rate (periodo 2005-2008) riportano per ciascun paese il tasso di alfabetizzazione giovanile separatamente per maschi e femmine. Da tali dati `e stata ricavata la seguente tabella (i valori dello Youth Literacy Rate sono espressi in %; sono stati considerati 36 paesi):
Media Varianza corretta Maschi 20. 76 332. 06 Femmine 23. 04 473. 28 Differenziale Maschi – Femmine − 2. 29 87. 78
Rispondere alle seguenti domande formulando le opportune assunzioni. (A) In media, nel complesso dei paesi considerati il tasso di alfabetizzazione femminile `e significativamente inferiore a quello maschile? (α = 0.01) (B) Se le deviazioni standard riportate in tabella fossero state quelle vere, invece di quelle calcolate, sarebbe cambiato qualcosa nella procedura di test? Motivare la risposta. Nel caso in cui si risponda che nella procedura qualcosa cambia effettuare i nuovi conti. (C) Calcolare la potenza del test, nella situazione di cui al punto (B), nel caso in cui l’ipotesi alternativa sia quella di un differenziale fra sessi di 5.1 punti percentuali.
Esercizio 2. Un’altra analisi, di tipo cross-section, ha mirato a vedere se esiste una qualche relazione fra tasso % di alfabetizzazione della popolazione adulta (l) e variazione % del PIL (g). La seguente tabella riporta alcune statistiche (fonte OECD, anni 2005 − 2008).
l = 13. 69 g = 15. 46
i=
li − l
i=
(gi − g)^2 = 263. 94
i=
li − l
(gi − g) = 247. 46
Considerando la variazione del PIL come variabile dipendente: (A) Formulare un modello statistico che risponda alle esigenze indicate e stimarne tutti i parametri mediante metodo dei minimi quadrati. (B) Si forniscano gli standard errors dei coefficienti di regressione (C) La variazione del PIL `e legata in modo significativo alla variabile indipendente? (α = 0.01).
Esercizio 3. Una variabile casuale X ∼ P o(λ). D’altra parte il parametro λ non e noto ma si sa che puo assumere o valore 1.08, e questo accade con probabilita 0.48, oppure valore 1.98, con la probabilita rimanente. Tutti gli altri valori di λ sono impossibile. Da X `e stato estratto un campione casuale semplice di due osservazioni: x = (x 1 = 3, x 2 = 3).
(A) Quale fra i due valori dei parametri ha la verosimiglianza maggiore? Argomentare la risposta. (B) Quale fra i due valori dei parametri ha la probabilit`a a posteriori maggiore? Argomentare la risposta.
Esercizio 1. In base alla correlazione che verosimilmente esiste fra tassi di alfabetizzazione di maschi e femmine rilevati nello stesso paese, occorre utilizzare la metodologia prevista per i dati appaiati. D = ‘tasso alfabetizzazione maschile’ − ‘tasso alfabetizzazione femminile’ ∼ N (μD , σ^2 D ).