Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Esercizi di Statistica: Analisi di Dati e Modelli di Regressione, Prove d'esame di Statistica

simulazione esame statistica del 2020 completa di soluzioni

Tipologia: Prove d'esame

2019/2020

Caricato il 28/02/2020

virginia-gennuso
virginia-gennuso 🇮🇹

3

(1)

4 documenti

1 / 7

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA
Prova scritta del 03 Febbraio 2020
Soluzione
Quesito 1
La tabella seguente riporta i dati relativi a 10 High-tech stores di Modena, rilevati il 7 Gennaio 2020. Le
variabili rilevate includono il genere e l’et`a dello store manager, l’incasso giornaliero ed il numero di Ipad
venduti.
Store Genere Et`a Incasso (in e) Ipad venduti
1 F 19 500 8
2 M 81 900 2
3 F 24 1100 2
4 F 38 2400 5
5 M 25 1900 1
6 F 36 4100 9
7 F 37 3500 1
8 M 51 2800 8
9 M 29 1900 2
10 M 60 1900 2
(a) Calcolare la moda, i quartili e la media aritmetica degli Ipad venduti.
La moda `e la modalit`a a cui `e associata la pi`u elevata frequenza assoluta (o relativa). Il valore modale
risulta pertanto 2, con una frequenza assoluta osservata pari a 4. La profondit`a della mediana `e:
prof (med) = n+ 1
2= 5.5
pertanto la mediana `e data dalla media delle modalit`a assunte dalla quinta e della sesta osservazione
della distribuzione dei dati ordinati, ovvero, indicando con X il carattere ”Numero di Ipad venduti”:
med =x(5) +x(6)
2=2+2
2= 2
La profondit`a del primo quartile `e:
prof (Q1) = [prof (med)] + 1
2=[5.5] + 1
2= 3
sicch´e il primo e il terzo quartile sono dati dalla terza osservazione nei dati ordinati, a partire
rispettivamente da sinistra e da destra, da cui:
Q1 = x(3) = 2 e Q3 = x(7) = 8
1
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Esercizi di Statistica: Analisi di Dati e Modelli di Regressione e più Prove d'esame in PDF di Statistica solo su Docsity!

STATISTICA

Prova scritta del 03 Febbraio 2020

Soluzione

Quesito 1

La tabella seguente riporta i dati relativi a 10 High-tech stores di Modena, rilevati il 7 Gennaio 2020. Le variabili rilevate includono il genere e l’et`a dello store manager, l’incasso giornaliero ed il numero di Ipad venduti.

Store Genere Et`a Incasso (in e) Ipad venduti 1 F 19 500 8 2 M 81 900 2 3 F 24 1100 2 4 F 38 2400 5 5 M 25 1900 1 6 F 36 4100 9 7 F 37 3500 1 8 M 51 2800 8 9 M 29 1900 2 10 M 60 1900 2

(a) Calcolare la moda, i quartili e la media aritmetica degli Ipad venduti.

La moda e la modalita a cui e associata la piu elevata frequenza assoluta (o relativa). Il valore modale risulta pertanto 2, con una frequenza assoluta osservata pari a 4. La profondita della medianae:

prof (med) =

n + 1 2

pertanto la mediana e data dalla media delle modalita assunte dalla quinta e della sesta osservazione della distribuzione dei dati ordinati, ovvero, indicando con X il carattere ”Numero di Ipad venduti”:

med =

x(5) + x(6) 2

La profondita del primo quartilee:

prof (Q1) =

[prof (med)] + 1 2

[5.5] + 1

sicch´e il primo e il terzo quartile sono dati dalla terza osservazione nei dati ordinati, a partire rispettivamente da sinistra e da destra, da cui:

Q1 = x(3) = 2 e Q3 = x(7) = 8

Infine, il numero medio di Ipad venduti si ricava facilmente come:

x ¯ =

n

∑^ n

i=

xi =

(b) Calcolare il campo di variazione e lo scarto quadratico medio del numero di Ipad venduti.

Il campo di Variazione `e = 9 − 1 = 8. La varianza del numero di Ipad venduti si ottiene come:

s^2 =

n

∑^ n

i=

(xi − x¯)^2 =

(8 − 4)^2 + (2 − 4)^2 + ... + (2 − 2)^2

Quindi lo scarto quadratico medio `e pari a:

s =

s^2 =

(c) Si considerino i seguenti box-plots e si indichi:

2

4

6

8

A

2

4

6

8

B

1

2

3

4

5

6

7

8

C • Il box-plot che meglio rappresenta la dis- tribuzione del numero di Ipad venduti: A B C nessuna delle precedenti

  • La distribuzione con il maggior grado di asim- metria: A B C nessuna delle precedenti
  • La distribuzione con il minor grado di vari- abilit`a (misurata dallo scarto interquartile): A B C nessuna delle precedenti
  • La distribuzione con il maggior numero di outlier: A B C nessuna delle precedenti
  • La distribuzione con la mediana pi`u elevata: A B C nessuna delle precedenti

Soluzione:

  • Nessuno dei precedenti. Il box-plot A ha mediana diversa dal primo quartile, a differenza del caso in esame. Il box-plot B ha Q1=med=2 e Q3=8 ma non riporta i baffi in corrispondenza dei valori 1 e 9. Il box-plot C segnala la presenza di outlier, che nella distribuzione del Numero di Ipad non sono invece presenti.
  • C
  • C
  • C
  • A
  1. 04 × (0.96) = 0. 0384. Pertanto, la loro somma si distribuisce secondo una Binomiale di parametri n = 200 e π = 0. 04 , ovvero Y =

i=1 Xi^ ∼^ Bin(200,^0 .04). Per il teorema del limite centrale, inoltre,Y =

i=1 Xi^ ∼^ N^ (200︸ ×︷︷^0.^04 ︸ 8

; 200︸ × 0 .︷︷ 04 × 0. 96 ︸

  1. 68

(d) Si dimostri che la varianza di una variabile aletoria di Bernoulli di parametro π `e pari a π(1 − π).

Si veda il paragrafo 9.2 del libro di testo

Quesito 3

Sia X una popolazione distribuita secondo la legge Bernoulliana di parametro π dalla quale si estraggono tre v.c. X 1 , X 2 e X 3. Si consideri il seguente stimatore per π

T 1 =

X 1 +

X 2 + kX 3

(a) Si dica per quali valori di k lo stimatore risulta corretto

Dato che E(T 1 ) =

4 +^ k

π l’unico valore di k per cui T 1 e correttoe k = 1/ 2.

(b) Utilizzando un valore di k = 0.5 calcolare il valore atteso, la distorsione e l’errore quadratico medio di T 1.

I valori richiesti risultano pari a:

E(T 1 ) =

π = π, d(T 1 ) = 0,

V ar(T 1 ) = EQM (T 1 ) =

π(1 − π)

(c) Confrontare, in termini di efficienza, lo stimatore T 1 con lo stimatore

T 2 =

X 1 +

X 2 +

X 3

Il secondo stimatore corrisponde alla proporzione campionaria, quindi

E(T 2 ) = π, d(T 2 ) = 0,

V ar(T 2 ) = EQM (T 2 ) =

π(1 − π)

Dato che EQM (T 1 ) > EQM (T 2 ), il secondo stimatore risulta pi`u efficiente.

(d) Determinare il valore di T 1 e T 2 se si osserva il campione {x 1 = 1, x 2 = 0, x 3 = 0}

In corrispondenza del campione, le stime risultano t 1 = 1/ 4 e t 2 = 1/ 3.

Quesito 4

Si intende studiare la relazione tra costo del lavoro per dipendente (x, migliaia di euro) e il valore aggiunto per addetto (y, migliaia di euro). Le grandezze rilevate su un campione di numerosit`a n = 30 sono le seguenti:

∑^30

i=

(xi − x¯)^2 = 46, 29;

∑^30

i=

(yi − y¯)^2 = 152, 98;

∑^30

i=

(xi − x¯)(yi − y¯) = 70, 50;

∑^30

i=

( ˆyi − y¯)^2 = 107, 36; ¯x = 26, 73; ¯y = 31, 35

costo del lavoro per dipendente valore aggiunto per addetto 31,6 37, 27,1 28, 28,2 38, 24,9 30, 25,9 29, 22,7 24,

(a) Stimare i parametri della retta di regressione di y su x e scrivere l’equazione della retta di regressione, interpretando il coefficiente di regressione La variabile dipendente Y rappresenta il valore aggiunto per addetto e la variabile indipendente X il costo del lavoro per dipendente. I valori dei minimi quadrati dei parametri della retta di regressione sono dati da:

β^ ˆ = sXY s^2 X

∑n i=1 ∑(xi^ −^ ¯x)(yi^ −^ y¯) n i=1(xi^ −^ x¯)

2

α ˆ = ¯y − βˆ 1 · x¯

β^ ˆ =^70 ,^50 46 , 29

e dell’intercetta

α ˆ = 31, 35 − (1, 52 × 26 , 73) = − 9 , 28

La retta di regressione stimata `e:

y ˆi = ˆα + βxˆ i = − 9 , 28 + 1, 52 xi

La relazione lineare tra la X e la Y e crescente: se X (costo del lavoro per dipendente) aumenta di una unita (1 migliaio di euro) il valore di Y (valore aggiunto per addetto) aumenta in media di 1, migliaia di euro (1520 euro).

(b) Rappresentare graficamente le 6 coppie di punti in tabella e la retta di regressione

Decisione Valore osservato della statistica test:

t =

45 , 62 28 46 , 29

Quindi si rifiuta l’ipotesi nulla (2, 78 > 2 , 048). Ad una data variazione del costo del lavoro (x) corrisponde una variazione in media di maggiore entita del valore aggiunto per addetto (y) con livello di significativita 5%.

(e) Dimostrare la formula di scomposizione della devianza.

Vedi formule del libro di testo