



Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
simulazione esame statistica del 2020 completa di soluzioni
Tipologia: Prove d'esame
1 / 7
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!




Quesito 1
La tabella seguente riporta i dati relativi a 10 High-tech stores di Modena, rilevati il 7 Gennaio 2020. Le variabili rilevate includono il genere e l’et`a dello store manager, l’incasso giornaliero ed il numero di Ipad venduti.
Store Genere Et`a Incasso (in e) Ipad venduti 1 F 19 500 8 2 M 81 900 2 3 F 24 1100 2 4 F 38 2400 5 5 M 25 1900 1 6 F 36 4100 9 7 F 37 3500 1 8 M 51 2800 8 9 M 29 1900 2 10 M 60 1900 2
(a) Calcolare la moda, i quartili e la media aritmetica degli Ipad venduti.
La moda e la modalita a cui e associata la piu elevata frequenza assoluta (o relativa). Il valore modale risulta pertanto 2, con una frequenza assoluta osservata pari a 4. La profondita della medianae:
prof (med) =
n + 1 2
pertanto la mediana e data dalla media delle modalita assunte dalla quinta e della sesta osservazione della distribuzione dei dati ordinati, ovvero, indicando con X il carattere ”Numero di Ipad venduti”:
med =
x(5) + x(6) 2
La profondita del primo quartilee:
prof (Q1) =
[prof (med)] + 1 2
sicch´e il primo e il terzo quartile sono dati dalla terza osservazione nei dati ordinati, a partire rispettivamente da sinistra e da destra, da cui:
Q1 = x(3) = 2 e Q3 = x(7) = 8
Infine, il numero medio di Ipad venduti si ricava facilmente come:
x ¯ =
n
∑^ n
i=
xi =
(b) Calcolare il campo di variazione e lo scarto quadratico medio del numero di Ipad venduti.
Il campo di Variazione `e = 9 − 1 = 8. La varianza del numero di Ipad venduti si ottiene come:
s^2 =
n
∑^ n
i=
(xi − x¯)^2 =
Quindi lo scarto quadratico medio `e pari a:
s =
s^2 =
(c) Si considerino i seguenti box-plots e si indichi:
2
4
6
8
A
2
4
6
8
B
1
2
3
4
5
6
7
8
C • Il box-plot che meglio rappresenta la dis- tribuzione del numero di Ipad venduti: A B C nessuna delle precedenti
Soluzione:
i=1 Xi^ ∼^ Bin(200,^0 .04). Per il teorema del limite centrale, inoltre,Y =
i=1 Xi^ ∼^ N^ (200︸ ×︷︷^0.^04 ︸ 8
(d) Si dimostri che la varianza di una variabile aletoria di Bernoulli di parametro π `e pari a π(1 − π).
Si veda il paragrafo 9.2 del libro di testo
Quesito 3
Sia X una popolazione distribuita secondo la legge Bernoulliana di parametro π dalla quale si estraggono tre v.c. X 1 , X 2 e X 3. Si consideri il seguente stimatore per π
X 2 + kX 3
(a) Si dica per quali valori di k lo stimatore risulta corretto
Dato che E(T 1 ) =
4 +^ k
π l’unico valore di k per cui T 1 e correttoe k = 1/ 2.
(b) Utilizzando un valore di k = 0.5 calcolare il valore atteso, la distorsione e l’errore quadratico medio di T 1.
I valori richiesti risultano pari a:
π = π, d(T 1 ) = 0,
V ar(T 1 ) = EQM (T 1 ) =
π(1 − π)
(c) Confrontare, in termini di efficienza, lo stimatore T 1 con lo stimatore
Il secondo stimatore corrisponde alla proporzione campionaria, quindi
E(T 2 ) = π, d(T 2 ) = 0,
V ar(T 2 ) = EQM (T 2 ) =
π(1 − π)
Dato che EQM (T 1 ) > EQM (T 2 ), il secondo stimatore risulta pi`u efficiente.
(d) Determinare il valore di T 1 e T 2 se si osserva il campione {x 1 = 1, x 2 = 0, x 3 = 0}
In corrispondenza del campione, le stime risultano t 1 = 1/ 4 e t 2 = 1/ 3.
Quesito 4
Si intende studiare la relazione tra costo del lavoro per dipendente (x, migliaia di euro) e il valore aggiunto per addetto (y, migliaia di euro). Le grandezze rilevate su un campione di numerosit`a n = 30 sono le seguenti:
i=
(xi − x¯)^2 = 46, 29;
i=
(yi − y¯)^2 = 152, 98;
i=
(xi − x¯)(yi − y¯) = 70, 50;
i=
( ˆyi − y¯)^2 = 107, 36; ¯x = 26, 73; ¯y = 31, 35
costo del lavoro per dipendente valore aggiunto per addetto 31,6 37, 27,1 28, 28,2 38, 24,9 30, 25,9 29, 22,7 24,
(a) Stimare i parametri della retta di regressione di y su x e scrivere l’equazione della retta di regressione, interpretando il coefficiente di regressione La variabile dipendente Y rappresenta il valore aggiunto per addetto e la variabile indipendente X il costo del lavoro per dipendente. I valori dei minimi quadrati dei parametri della retta di regressione sono dati da:
β^ ˆ = sXY s^2 X
∑n i=1 ∑(xi^ −^ ¯x)(yi^ −^ y¯) n i=1(xi^ −^ x¯)
2
α ˆ = ¯y − βˆ 1 · x¯
β^ ˆ =^70 ,^50 46 , 29
e dell’intercetta
α ˆ = 31, 35 − (1, 52 × 26 , 73) = − 9 , 28
La retta di regressione stimata `e:
y ˆi = ˆα + βxˆ i = − 9 , 28 + 1, 52 xi
La relazione lineare tra la X e la Y e crescente: se X (costo del lavoro per dipendente) aumenta di una unita (1 migliaio di euro) il valore di Y (valore aggiunto per addetto) aumenta in media di 1, migliaia di euro (1520 euro).
(b) Rappresentare graficamente le 6 coppie di punti in tabella e la retta di regressione
Decisione Valore osservato della statistica test:
t =
45 , 62 28 46 , 29
Quindi si rifiuta l’ipotesi nulla (2, 78 > 2 , 048). Ad una data variazione del costo del lavoro (x) corrisponde una variazione in media di maggiore entita del valore aggiunto per addetto (y) con livello di significativita 5%.
(e) Dimostrare la formula di scomposizione della devianza.
Vedi formule del libro di testo