Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Esami di Statistica., Prove d'esame di Statistica

Esami degli anni precedenti della prof Mezzetti

Tipologia: Prove d'esame

2023/2024

Caricato il 06/11/2024

alessandro-guglielmo-1
alessandro-guglielmo-1 🇮🇹

4.2

(6)

8 documenti

1 / 26

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a

Anteprima parziale del testo

Scarica Esami di Statistica. e più Prove d'esame in PDF di Statistica solo su Docsity!

Modalità A

ESAME

1 8 Dicembre 2023

COMPITO A

Cognome Nome

Numero di matricola

**_1) Approssimare tutti i calcoli alla seconda cifra decimale.

  1. Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto riportato negli appositi spazi._** 3) Al termine della prova, è OBBLIGATORIO consegnare il presente foglio ed il foglio di brutta (DI CUI NON SI TERRÀ CONTO AI FINI DELLA VALUTAZIONE).

1. Si sono osservato i prezzi di 80 appartamenti di 50 mq circa a Roma, raccogliendo le seguenti

informazioni Y = “Prezzo dell'appartamento (in migliaia di euro)” e X = “Distanza dell’appartamento dal

centro in km (come centro si considera Piazza di Spagna)”, Si osservano le seguenti osservazioni. Lo scopo

della raccolta dati e capire la relazione tra il prezzo dell’appartamento e la distanza dal centro

∑ 𝑥𝑖 80 𝑖= 1 = 320 ∑ 𝑦𝑖 = 80 𝑖= 1 28000 ∑ 𝑥𝑖^2 80 𝑖= 1 = 2400 ∑ 𝑦𝑖^2 = 80 𝑖= 1 10447693 ∑ 𝑥𝑖𝑦𝑖 80 𝑖= 1 = 100000

a) calcolare i parametri della retta di regressione del prezzo di un appartamento (Y) sulla distanza dal centro

(X) e spiegarne il significato;

x y x2 y2 xy somme 320 28000 2400 10447693,00 100000, medie 4 350 30 130596,16 1250, Varianze 14 8096, Covarianza - 150, correlazione - 0,45 R2= 0, b1 - 10, bo 392, 350,00 previsione Somma residui2 519121,

b) Si calcoli il coefficiente di determinazione, e commentare i risultati

d) Valutare la somma dei residui e la somma dei residui al quadrato

d) secondo il modello, quanto ci aspettiamo sia il prezzo di un appartamento di 50mq a San Lorenzo, se dista

circa 4 km da Piazza di Spagna?

R^2

Modalità A

3. Data una popolazione con media  e varianza ^2 e un campione casuale semplice di quattro variabili,

considerare il seguente stimatore per μ

T = X + X − X + X.

a) Indicare se T è uno stimatore corretto per μ

b) Calcolare l’errore quadratico medio di T

a)

E(𝑇) =

2 5

1 5

7 5

6 5

𝜎^2 +

𝜎^2 +

𝜎^2 + 4 𝜎^2 =

𝜎^2

b) EQM

5. Il proprietario di un bar osserva per 25 giorni il numero di cornetti venduti e ottiene i seguenti risultati

25 𝑖= 1

= 3000 ∑ 𝑥𝑖^2

25 𝑖= 1

Supponendo che, X, il numero di cornetti venduti giornalmente segua una distribuzione normale N(^2 )

con entrambi i parametri non noti.

a) Proporre uno stimatore corretto per μ (“numero medio di cornetti venduti quotidianamente”) e valutarne

la stima nel campione osservato

b) Proporre uno stimatore corretto e valutare una stima per ^2 (varianza della distribuzione)

Stimatore e Stima per120 Stimatore e Stima per ^2 100

c) Si costruisca un intervallo di confidenza di livello 9 9 % per il numero medio di cornetti venduti

quotidianamente

t-stud=2,

d) Si verifichi l’ipotesi nulla che il valore medio sia rimasto invariato rispetto all’anno scorso dove un valore

medio era risultato uguale a 115, contro l’alternativa che il numero medio sia superiore a 115 , usando un

livello di significatività pari a 5 %.

Stat=-2,5>1,

Rifiuto

Modalità A

e) Quali conclusioni può trarre il proprietario del bar?

6. Fornire la definizione di stimatore non distorto

7. La seguente tabella mostra le informazioni circa 20 dipendenti di un’azienda. Per ciascun dipendente è

indicato: ID, Stipendio mensile lordo (in migliaia di Euro), Titolo di studio (Medie/Superiori/Laurea) e

Genere.

ID Stipendio Titolo di Studio Genere 1 1,2 Medie F 2 2,8 Laurea M 3 2 Superiori F 4 2,5 Superiori M 5 2,4 Medie M 6 4 Laurea M 7 2 Medie F 8 2,1 Superiori M 9 2,1 Superiori F 10 2,7 Laurea F 11 1,5 Medie F 12 3,6 Superiori M 13 1,9 Medie M 14 1,9 Superiori M 15 2 Medie F 16 2,5 Superiori M 17 1,5 Medie F 18 2,2 Superiori F 19 2 Superiori F 20 2,5 Laurea M SOMME 45,

Calcolare la media del carattere

“Stipendio”

Indicare un'opportuna misura di sintesi

per descrivere il carattere TITOLO DI

STUDIO

Moda: Superiori

Mediana: Superiori

Modalità B

ESAME

1 8 Dicembre 2023

COMPITO B

Cognome Nome

Numero di matricola

**_1) Approssimare tutti i calcoli alla seconda cifra decimale.

  1. Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto riportato negli appositi spazi._** 3) Al termine della prova, è OBBLIGATORIO consegnare il presente foglio ed il foglio di brutta (DI CUI NON SI TERRÀ CONTO AI FINI DELLA VALUTAZIONE).

1. La XXXX Bank ha un sistema di scoring che utilizza per valutare nuove richieste di prestito. Si sono

tracciati il numero di pagamenti in ritardo o non pervenuti per un campione di 200 clienti ad alto rischio che,

negli ultimi 5 anni, hanno ricevuto un prestito e hanno avuto un piano di pagamenti. Per ciascun cliente si è

rilevato X=” Punteggio (Credit Scoring)” e Y=”Numero pagamenti in ritardo o mancanti” e si sono trovati i

seguenti risultati:

∑ 𝑥𝑖 200 𝑖= 1 = 5600 ∑ 𝑦𝑖 = 200 𝑖= 1 2500 ∑ 𝑥𝑖^2 200 𝑖= 1 = 160800 ∑ 𝑦𝑖^2 = 200 𝑖= 1 32100 ∑ 𝑥𝑖𝑦𝑖 200 𝑖= 1 = 68400

a) calcolare i parametri della retta di regressione del numero di pagamenti mancanti (o in ritardo) sul punteggio

ottenuto e spiegarne il significato

x y x2 y2 xy somme 5600 2500 160800 32100 68400 Medie 28 12.5 804 160.5 342 Varianza 20 4. cov - 8 correlazione - 0.8677 R2=0. b1 - 0. bo 23. 22.1 previsione residui2 210

b) Si calcoli il coefficiente di determinazione, e commentare i risultati

d) Valutare la somma dei residui e la somma dei residui al quadrato

R^2

Modalità B

d) secondo il modello, quanti pagamenti mancanti ci aspettiamo da un cliente che ha ottenuto un punteggio

uguale a 25?

2. Una settimana di lavoro tipica per gli infermieri d’ospedale è di cinque turni di 10 ore. La seguente

tabella di frequenza mostra i risultati di un sondaggio su 130 infermiere/infermieri presso gli ospedali

dell’aerea di interesse. A ciascun infermiere è stato chiesto quanti turni di 10 ore avevano effettuato

durante il mese precedente e i risultati sono rappresentanti nella seguente tabella

Numero di Turni di 10

ore

Numero di

infermieri

a) Indicare Unità Statistica, Carattere e Specificare la tipologia del carattere

Unità Statistica

Infermieri

Carattere

Numero di turni sdi 10 ore

Il carattere specificato è:

□ Qualitativo nominale

□ Qualitativo ordinale

X Quantitativo discreto

□ Quantitativo continuo

b) Calcolare media, moda, mediana e varianza (se possibile) del Carattere “Numero di Turni di 10 ore nel

precedente mese”

3. I Licei Scientifici sono equamente distribuiti nel Municipi di Roma? Nella tabella è mostrato il numero

di Licei Scientifici Statali per i primi 6 municipi di Roma (Fonte: Elaborazioni Ufficio di statistica di Roma

Capitale su dati Ministero dell’Istruzione)

Municipio Roma Numero di Licei

Scientifici

I 21

II 9

Moda

Mediana

Media

Varianza

Modalità B

4. L’indice gender pay gap è la differenza tra il salario medio orario dei maschi e delle femmine, espresso

come percentuale del salario maschile. Nel seguente grafico è mostrato l’indice gender pay gap per i paesi

Europei

a) Confrontare il valore del gender pay gap dell’Italia rispetto al valore mediano (senza calcolarlo). Il valore

dell’Italia rispetto alla mediana è

Inferiore x

Uguale □

Superiore □

5. Enunciare il teorema del limite centrale

6. E' stato chiesto a 1500 studenti milanesi se, quando prendono i mezzi pubblici di superficie per tratte brevi

(inferiori alle 5 fermate), timbrino o meno il biglietto. 850 è il numero degli studenti che hanno risposto di no.

Supponendo che gli studenti intervistati siano un campione casuale estratto da una stessa popolazione (iid)

a) Si fornisca una stima della proporzione effettiva p di coloro che timbrano il biglietto, utilizzando uno

stimatore non distorto.

a)

b) Volendo determinare un intervallo di confidenza per p al livello (1-)=0,95, si indichi

L’'espressione analitica dell'opportuno

intervallo di confidenza

Modalità B

Il valore del quantile ottenuto

sulle tavole a tale scopo 1,

Gli estremi dell'intervallo

di confidenza ottenuto 0,4083,

7. Nel suo libro 2011, l’autrice e progettista di videogiochi Jane McGonigal riporta “Ad un’età di 21 anni,

un giovane mediamente raggiunge un ammontare di 10000 ore passate ai videogiochi. Questo corrisponde

quasi al tempo complessivo che i giovani trascorrono in classe durante tutta la scuola media e superiore”

(fonte: Reality is Broken. Why Games Makes Us Better and How They Can Change the World) Se il tempo

medio giornaliero che un diciottenne di Roma trascorre giocando ai videogiochi si distribuisce come una

gaussiana di media 2.5 ore con varianza pari a 0.49 ore^2. Calcolare le seguenti probabilità:

a) La probabilità che un diciottenne trascorra meno di 3 ore al giorno giocando ai videogiochi?

b) Supponendo che tutte le giornate siano indipendenti qual è la probabilità che in un anno un diciottenne

di Roma abbia giocato complessivamente videogiochi più di 900 ore?

a)

P(X<3)=P(Z<9.7143)

p=0.

b)

P(X> 900 ) =P(Z>- 0 .935) 0.

E(sum X)=921. 5

Var(sum X)=178.

8. Il supervisore delle operazioni presso un centro di assistenza clienti online, è preoccupato per il tempo

medio che intercorre tra la ricezione di una domanda o un reclamo di un cliente e l’invio di una risposta. La

società va orgogliosa di un tempo di risposta medio non superiore alle 36 ore. Viene selezionato un

campione casuale di 10 richieste da parte di clienti, rilevando un tempo medio campionario di risposta di 41

ore e una varianza campionaria corretta di 64 ore^2.

a) Verificare l’ipotesi che il tempo medio di risposta sia effettivamente 36 ore contro l’alternativa che

sia superiore, avendo fissato il livello di significatività =0.05 e supponendo il tempo di risposta si

distribuisca come una gaussiana.

b) A quali conclusioni arriva il supervisore

2

Rifiuto ipotesi nulla

Modalità C

ESAME

10 Gennaio 2022

COMPITO C

Cognome Nome

Numero di matricola

**_1) Approssimare tutti i calcoli alla seconda cifra decimale.

  1. Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto riportato negli appositi spazi._** 3) Al termine della prova, è OBBLIGATORIO consegnare il presente foglio ed il foglio di brutta (DI CUI NON SI TERRÀ CONTO AI FINI DELLA VALUTAZIONE).

1. In una ditta lavorano 4 ingegneri che percepiscono un reddito lordo di 2 4 000€ all’anno ciascuno, e il proprietario, anch’egli un ingegnere percepisce un reddito di 1 2 0000€ all’anno. Calcolare il reddito medio annuo di un ingegnere. a) 432 00 € b) 25000 € c) 72000 € 2. Siano X 1 ,…,X 169 variabili aleatorie iid con legge bernoulliana di parametro 0. 3. Se 𝑌 = ∑ (^169) 𝑖= 1 𝑋𝑖, si fornisca una valutazione approssimata di P(Y >50). 3. Data una popolazione con media  e varianza ^2 e un campione casuale semplice di quattro variabili calcolare l’errore quadratico medio del seguente stimatore per  e indicare se T è uno stimatore corretto per  : 𝑇 1 = − 1 4

3 4

7 4

4. Un college con tasse scolastiche più elevate corrisponde a lavori più remunerativi? Per i 5 0 migliori college negli Stati Uniti sono stati rilevati il reddito annuo lordo dopo 3 anni dalla fine del college in migliaia dollari (Y) e i relativi costi di iscrizione annuali (X) in migliaia dollari. ∑ 𝑥𝑖 50 𝑖= 1

50 𝑖= 1

= 1400 ∑ 𝑥𝑖^2

50 𝑖= 1

= 33300 ∑ 𝑦𝑖^2

50 𝑖= 1

50 𝑖= 1 = 34020 a) calcolare i parametri della retta di regressione del reddito a 3 anni dalla fine del college (Y) sul costo di iscrizione annuale (X) e spiegarne il significato;

Modalità C b) Si calcoli il coefficiente di determinazione, c) Valutare la somma dei residui e la somma dei residui al quadrato d) secondo il modello, qual è il reddito annuo atteso a 3 dalla fine di un college la cui tassa di iscrizione annuale è di circa 3 0 mila dollari? 2

R

Modalità C 7. Si considerino i dati x 1 , x 2 ,... , xn : a) La media è necessariamente maggiore della mediana b) La media è necessariamente minore della mediana c) Media e mediana sono necessariamente uguali d) Nessuna delle risposte indicate è corretta

8. Sono state intervistate 6 0 famiglie, e in particolare, è stato chiesto il numero X di automobili posseduti e il numero Y di componenti della famiglia. I dati sono raccolti nella seguente tabella: Numero Componenti famiglia, Y Numero Automobili, X 1 2 3 Totale 0 1 2 5 8 1 5 10 15 30 2 2 4 14 20 Totale 8 16 34 58 a) I due caratteri sono indipendenti? Giustificare la risposta. Indipendenti? Giustificare la risposta b) Si calcolino le medie e le varianze del numero di Numero Componenti in Famiglia condizionatamente a famiglie con nessuna Automobile Medie condizionate Varianze condizionate Condizionate a Numero Automobili= 0 9. Di seguito sono riportati per numero di presenze (in milioni) negli esercizi ricettivi Anno 2019 per i primi 5 comuni italiani gli arrivi turistici nelle strutture ricettive a carattere alberghiero in alcune regioni italiane (Fonte: ISTAT, Movimento dei clienti negli esercizi ricettivi - Anno 20 19 ): Comune Numero Presenze nelle strutture ricettive Roma 31 Venezia 14 Milano 13

Modalità C Firenze 11 Rimini 1 a) Si calcoli l’indice di concentrazione di Gini del numero di presenze nelle strutture ricettive, commentando poi i risultati ottenuti. b) Quale dovrebbe essere il numero di arrivi in ogni regione nel caso di equidistribuzione? c) Indicare la mediana del numero di presenze negli esercizi ricettivi b) c) 10. Nell'ambito di un'indagine di marketing si è osservato un campione di n=122 consumatori per ognuno dei quali è stata rilevata la spesa mensile per telefonia cellulare la cui media nella popolazione è indicata con μ. Sapendo che la media campionaria e la varianza campionaria corretta sono pari, rispettivamente, a 𝑥̄ = 21. 5 𝑒 𝑠𝐶^2 = 169. a) Proporre uno stimatore e una stima per μ (“spesa media mensile per telefonia cellulare”) \

Modalità C

Modalità A

ESAME

12 Dicembre 2022

COMPITO A

Cognome Nome

Numero di matricola

**_1) Approssimare tutti i calcoli alla quarta cifra decimale.

  1. Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto riportato negli appositi spazi._** 3) Al termine della prova, è OBBLIGATORIO consegnare il presente foglio ed il foglio di brutta (DI CUI NON SI TERRÀ CONTO AI FINI DELLA VALUTAZIONE).

1. Su un campione di 30 0 acquirenti di detersivi per piatti sono state rilevate le quantità acquistate in un

anno per tre diverse marche, la cui distribuzione doppia è sintetizzata nella seguente tabella:

Quantità

Marca 0 - | 5 5 - | 10 10 - | 15

Totale

A 20 40 40 100

B 20 30 50 100

C 50 30 20 100

Totale 90 100 110 300

a) I caratteri “Quantità di detersivo acquistata” e “Marca di detersivo” sono indipendenti? Motivare la

risposta

b) Individuare la mediana del carattere Quantità.

c) Estraendo a caso uno dei 3 0 0 acquirenti calcolare la probabilità che acquisti tra 5 e 10 litri della

marca B;

d) Estraendo a caso un acquirente della marca B calcolare la probabilità che acquisti tra 5 e 10 litri di

detersivo.