Scarica Esami di Statistica. e più Prove d'esame in PDF di Statistica solo su Docsity!
Modalità A
ESAME
1 8 Dicembre 2023
COMPITO A
Cognome Nome
Numero di matricola
**_1) Approssimare tutti i calcoli alla seconda cifra decimale.
- Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto riportato negli appositi spazi._** 3) Al termine della prova, è OBBLIGATORIO consegnare il presente foglio ed il foglio di brutta (DI CUI NON SI TERRÀ CONTO AI FINI DELLA VALUTAZIONE).
1. Si sono osservato i prezzi di 80 appartamenti di 50 mq circa a Roma, raccogliendo le seguenti
informazioni Y = “Prezzo dell'appartamento (in migliaia di euro)” e X = “Distanza dell’appartamento dal
centro in km (come centro si considera Piazza di Spagna)”, Si osservano le seguenti osservazioni. Lo scopo
della raccolta dati e capire la relazione tra il prezzo dell’appartamento e la distanza dal centro
∑ 𝑥𝑖 80 𝑖= 1 = 320 ∑ 𝑦𝑖 = 80 𝑖= 1 28000 ∑ 𝑥𝑖^2 80 𝑖= 1 = 2400 ∑ 𝑦𝑖^2 = 80 𝑖= 1 10447693 ∑ 𝑥𝑖𝑦𝑖 80 𝑖= 1 = 100000
a) calcolare i parametri della retta di regressione del prezzo di un appartamento (Y) sulla distanza dal centro
(X) e spiegarne il significato;
x y x2 y2 xy somme 320 28000 2400 10447693,00 100000, medie 4 350 30 130596,16 1250, Varianze 14 8096, Covarianza - 150, correlazione - 0,45 R2= 0, b1 - 10, bo 392, 350,00 previsione Somma residui2 519121,
b) Si calcoli il coefficiente di determinazione, e commentare i risultati
d) Valutare la somma dei residui e la somma dei residui al quadrato
d) secondo il modello, quanto ci aspettiamo sia il prezzo di un appartamento di 50mq a San Lorenzo, se dista
circa 4 km da Piazza di Spagna?
R^2
Modalità A
3. Data una popolazione con media e varianza ^2 e un campione casuale semplice di quattro variabili,
considerare il seguente stimatore per μ
T = X + X − X + X.
a) Indicare se T è uno stimatore corretto per μ
b) Calcolare l’errore quadratico medio di T
a)
E(𝑇) =
2 5
1 5
7 5
6 5
𝜎^2 +
𝜎^2 +
𝜎^2 + 4 𝜎^2 =
𝜎^2
b) EQM
5. Il proprietario di un bar osserva per 25 giorni il numero di cornetti venduti e ottiene i seguenti risultati
25 𝑖= 1
= 3000 ∑ 𝑥𝑖^2
25 𝑖= 1
Supponendo che, X, il numero di cornetti venduti giornalmente segua una distribuzione normale N(^2 )
con entrambi i parametri non noti.
a) Proporre uno stimatore corretto per μ (“numero medio di cornetti venduti quotidianamente”) e valutarne
la stima nel campione osservato
b) Proporre uno stimatore corretto e valutare una stima per ^2 (varianza della distribuzione)
Stimatore e Stima per 120 Stimatore e Stima per ^2 100
c) Si costruisca un intervallo di confidenza di livello 9 9 % per il numero medio di cornetti venduti
quotidianamente
t-stud=2,
d) Si verifichi l’ipotesi nulla che il valore medio sia rimasto invariato rispetto all’anno scorso dove un valore
medio era risultato uguale a 115, contro l’alternativa che il numero medio sia superiore a 115 , usando un
livello di significatività pari a 5 %.
Stat=-2,5>1,
Rifiuto
Modalità A
e) Quali conclusioni può trarre il proprietario del bar?
6. Fornire la definizione di stimatore non distorto
7. La seguente tabella mostra le informazioni circa 20 dipendenti di un’azienda. Per ciascun dipendente è
indicato: ID, Stipendio mensile lordo (in migliaia di Euro), Titolo di studio (Medie/Superiori/Laurea) e
Genere.
ID Stipendio Titolo di Studio Genere 1 1,2 Medie F 2 2,8 Laurea M 3 2 Superiori F 4 2,5 Superiori M 5 2,4 Medie M 6 4 Laurea M 7 2 Medie F 8 2,1 Superiori M 9 2,1 Superiori F 10 2,7 Laurea F 11 1,5 Medie F 12 3,6 Superiori M 13 1,9 Medie M 14 1,9 Superiori M 15 2 Medie F 16 2,5 Superiori M 17 1,5 Medie F 18 2,2 Superiori F 19 2 Superiori F 20 2,5 Laurea M SOMME 45,
Calcolare la media del carattere
“Stipendio”
Indicare un'opportuna misura di sintesi
per descrivere il carattere TITOLO DI
STUDIO
Moda: Superiori
Mediana: Superiori
Modalità B
ESAME
1 8 Dicembre 2023
COMPITO B
Cognome Nome
Numero di matricola
**_1) Approssimare tutti i calcoli alla seconda cifra decimale.
- Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto riportato negli appositi spazi._** 3) Al termine della prova, è OBBLIGATORIO consegnare il presente foglio ed il foglio di brutta (DI CUI NON SI TERRÀ CONTO AI FINI DELLA VALUTAZIONE).
1. La XXXX Bank ha un sistema di scoring che utilizza per valutare nuove richieste di prestito. Si sono
tracciati il numero di pagamenti in ritardo o non pervenuti per un campione di 200 clienti ad alto rischio che,
negli ultimi 5 anni, hanno ricevuto un prestito e hanno avuto un piano di pagamenti. Per ciascun cliente si è
rilevato X=” Punteggio (Credit Scoring)” e Y=”Numero pagamenti in ritardo o mancanti” e si sono trovati i
seguenti risultati:
∑ 𝑥𝑖 200 𝑖= 1 = 5600 ∑ 𝑦𝑖 = 200 𝑖= 1 2500 ∑ 𝑥𝑖^2 200 𝑖= 1 = 160800 ∑ 𝑦𝑖^2 = 200 𝑖= 1 32100 ∑ 𝑥𝑖𝑦𝑖 200 𝑖= 1 = 68400
a) calcolare i parametri della retta di regressione del numero di pagamenti mancanti (o in ritardo) sul punteggio
ottenuto e spiegarne il significato
x y x2 y2 xy somme 5600 2500 160800 32100 68400 Medie 28 12.5 804 160.5 342 Varianza 20 4. cov - 8 correlazione - 0.8677 R2=0. b1 - 0. bo 23. 22.1 previsione residui2 210
b) Si calcoli il coefficiente di determinazione, e commentare i risultati
d) Valutare la somma dei residui e la somma dei residui al quadrato
R^2
Modalità B
d) secondo il modello, quanti pagamenti mancanti ci aspettiamo da un cliente che ha ottenuto un punteggio
uguale a 25?
2. Una settimana di lavoro tipica per gli infermieri d’ospedale è di cinque turni di 10 ore. La seguente
tabella di frequenza mostra i risultati di un sondaggio su 130 infermiere/infermieri presso gli ospedali
dell’aerea di interesse. A ciascun infermiere è stato chiesto quanti turni di 10 ore avevano effettuato
durante il mese precedente e i risultati sono rappresentanti nella seguente tabella
Numero di Turni di 10
ore
Numero di
infermieri
a) Indicare Unità Statistica, Carattere e Specificare la tipologia del carattere
Unità Statistica
Infermieri
Carattere
Numero di turni sdi 10 ore
Il carattere specificato è:
□ Qualitativo nominale
□ Qualitativo ordinale
X Quantitativo discreto
□ Quantitativo continuo
b) Calcolare media, moda, mediana e varianza (se possibile) del Carattere “Numero di Turni di 10 ore nel
precedente mese”
3. I Licei Scientifici sono equamente distribuiti nel Municipi di Roma? Nella tabella è mostrato il numero
di Licei Scientifici Statali per i primi 6 municipi di Roma (Fonte: Elaborazioni Ufficio di statistica di Roma
Capitale su dati Ministero dell’Istruzione)
Municipio Roma Numero di Licei
Scientifici
I 21
II 9
Moda
Mediana
Media
Varianza
Modalità B
4. L’indice gender pay gap è la differenza tra il salario medio orario dei maschi e delle femmine, espresso
come percentuale del salario maschile. Nel seguente grafico è mostrato l’indice gender pay gap per i paesi
Europei
a) Confrontare il valore del gender pay gap dell’Italia rispetto al valore mediano (senza calcolarlo). Il valore
dell’Italia rispetto alla mediana è
Inferiore x
Uguale □
Superiore □
5. Enunciare il teorema del limite centrale
6. E' stato chiesto a 1500 studenti milanesi se, quando prendono i mezzi pubblici di superficie per tratte brevi
(inferiori alle 5 fermate), timbrino o meno il biglietto. 850 è il numero degli studenti che hanno risposto di no.
Supponendo che gli studenti intervistati siano un campione casuale estratto da una stessa popolazione (iid)
a) Si fornisca una stima della proporzione effettiva p di coloro che timbrano il biglietto, utilizzando uno
stimatore non distorto.
a)
b) Volendo determinare un intervallo di confidenza per p al livello (1-)=0,95, si indichi
L’'espressione analitica dell'opportuno
intervallo di confidenza
Modalità B
Il valore del quantile ottenuto
sulle tavole a tale scopo 1,
Gli estremi dell'intervallo
di confidenza ottenuto 0,4083,
7. Nel suo libro 2011, l’autrice e progettista di videogiochi Jane McGonigal riporta “Ad un’età di 21 anni,
un giovane mediamente raggiunge un ammontare di 10000 ore passate ai videogiochi. Questo corrisponde
quasi al tempo complessivo che i giovani trascorrono in classe durante tutta la scuola media e superiore”
(fonte: Reality is Broken. Why Games Makes Us Better and How They Can Change the World) Se il tempo
medio giornaliero che un diciottenne di Roma trascorre giocando ai videogiochi si distribuisce come una
gaussiana di media 2.5 ore con varianza pari a 0.49 ore^2. Calcolare le seguenti probabilità:
a) La probabilità che un diciottenne trascorra meno di 3 ore al giorno giocando ai videogiochi?
b) Supponendo che tutte le giornate siano indipendenti qual è la probabilità che in un anno un diciottenne
di Roma abbia giocato complessivamente videogiochi più di 900 ore?
a)
P(X<3)=P(Z<9.7143)
p=0.
b)
P(X> 900 ) =P(Z>- 0 .935) 0.
E(sum X)=921. 5
Var(sum X)=178.
8. Il supervisore delle operazioni presso un centro di assistenza clienti online, è preoccupato per il tempo
medio che intercorre tra la ricezione di una domanda o un reclamo di un cliente e l’invio di una risposta. La
società va orgogliosa di un tempo di risposta medio non superiore alle 36 ore. Viene selezionato un
campione casuale di 10 richieste da parte di clienti, rilevando un tempo medio campionario di risposta di 41
ore e una varianza campionaria corretta di 64 ore^2.
a) Verificare l’ipotesi che il tempo medio di risposta sia effettivamente 36 ore contro l’alternativa che
sia superiore, avendo fissato il livello di significatività =0.05 e supponendo il tempo di risposta si
distribuisca come una gaussiana.
b) A quali conclusioni arriva il supervisore
2
Rifiuto ipotesi nulla
Modalità C
ESAME
10 Gennaio 2022
COMPITO C
Cognome Nome
Numero di matricola
**_1) Approssimare tutti i calcoli alla seconda cifra decimale.
- Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto riportato negli appositi spazi._** 3) Al termine della prova, è OBBLIGATORIO consegnare il presente foglio ed il foglio di brutta (DI CUI NON SI TERRÀ CONTO AI FINI DELLA VALUTAZIONE).
1. In una ditta lavorano 4 ingegneri che percepiscono un reddito lordo di 2 4 000€ all’anno ciascuno, e il proprietario, anch’egli un ingegnere percepisce un reddito di 1 2 0000€ all’anno. Calcolare il reddito medio annuo di un ingegnere. a) 432 00 € b) 25000 € c) 72000 € 2. Siano X 1 ,…,X 169 variabili aleatorie iid con legge bernoulliana di parametro 0. 3. Se 𝑌 = ∑ (^169) 𝑖= 1 𝑋𝑖, si fornisca una valutazione approssimata di P(Y >50). 3. Data una popolazione con media e varianza ^2 e un campione casuale semplice di quattro variabili calcolare l’errore quadratico medio del seguente stimatore per e indicare se T è uno stimatore corretto per : 𝑇 1 = − 1 4
3 4
7 4
4. Un college con tasse scolastiche più elevate corrisponde a lavori più remunerativi? Per i 5 0 migliori college negli Stati Uniti sono stati rilevati il reddito annuo lordo dopo 3 anni dalla fine del college in migliaia dollari (Y) e i relativi costi di iscrizione annuali (X) in migliaia dollari. ∑ 𝑥𝑖 50 𝑖= 1
50 𝑖= 1
= 1400 ∑ 𝑥𝑖^2
50 𝑖= 1
= 33300 ∑ 𝑦𝑖^2
50 𝑖= 1
50 𝑖= 1 = 34020 a) calcolare i parametri della retta di regressione del reddito a 3 anni dalla fine del college (Y) sul costo di iscrizione annuale (X) e spiegarne il significato;
Modalità C b) Si calcoli il coefficiente di determinazione, c) Valutare la somma dei residui e la somma dei residui al quadrato d) secondo il modello, qual è il reddito annuo atteso a 3 dalla fine di un college la cui tassa di iscrizione annuale è di circa 3 0 mila dollari? 2
R
Modalità C 7. Si considerino i dati x 1 , x 2 ,... , xn : a) La media è necessariamente maggiore della mediana b) La media è necessariamente minore della mediana c) Media e mediana sono necessariamente uguali d) Nessuna delle risposte indicate è corretta
8. Sono state intervistate 6 0 famiglie, e in particolare, è stato chiesto il numero X di automobili posseduti e il numero Y di componenti della famiglia. I dati sono raccolti nella seguente tabella: Numero Componenti famiglia, Y Numero Automobili, X 1 2 3 Totale 0 1 2 5 8 1 5 10 15 30 2 2 4 14 20 Totale 8 16 34 58 a) I due caratteri sono indipendenti? Giustificare la risposta. Indipendenti? Giustificare la risposta b) Si calcolino le medie e le varianze del numero di Numero Componenti in Famiglia condizionatamente a famiglie con nessuna Automobile Medie condizionate Varianze condizionate Condizionate a Numero Automobili= 0 9. Di seguito sono riportati per numero di presenze (in milioni) negli esercizi ricettivi Anno 2019 per i primi 5 comuni italiani gli arrivi turistici nelle strutture ricettive a carattere alberghiero in alcune regioni italiane (Fonte: ISTAT, Movimento dei clienti negli esercizi ricettivi - Anno 20 19 ): Comune Numero Presenze nelle strutture ricettive Roma 31 Venezia 14 Milano 13
Modalità C Firenze 11 Rimini 1 a) Si calcoli l’indice di concentrazione di Gini del numero di presenze nelle strutture ricettive, commentando poi i risultati ottenuti. b) Quale dovrebbe essere il numero di arrivi in ogni regione nel caso di equidistribuzione? c) Indicare la mediana del numero di presenze negli esercizi ricettivi b) c) 10. Nell'ambito di un'indagine di marketing si è osservato un campione di n=122 consumatori per ognuno dei quali è stata rilevata la spesa mensile per telefonia cellulare la cui media nella popolazione è indicata con μ. Sapendo che la media campionaria e la varianza campionaria corretta sono pari, rispettivamente, a 𝑥̄ = 21. 5 𝑒 𝑠𝐶^2 = 169. a) Proporre uno stimatore e una stima per μ (“spesa media mensile per telefonia cellulare”) \
Modalità C
Modalità A
ESAME
12 Dicembre 2022
COMPITO A
Cognome Nome
Numero di matricola
**_1) Approssimare tutti i calcoli alla quarta cifra decimale.
- Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto riportato negli appositi spazi._** 3) Al termine della prova, è OBBLIGATORIO consegnare il presente foglio ed il foglio di brutta (DI CUI NON SI TERRÀ CONTO AI FINI DELLA VALUTAZIONE).
1. Su un campione di 30 0 acquirenti di detersivi per piatti sono state rilevate le quantità acquistate in un
anno per tre diverse marche, la cui distribuzione doppia è sintetizzata nella seguente tabella:
Quantità
Marca 0 - | 5 5 - | 10 10 - | 15
Totale
A 20 40 40 100
B 20 30 50 100
C 50 30 20 100
Totale 90 100 110 300
a) I caratteri “Quantità di detersivo acquistata” e “Marca di detersivo” sono indipendenti? Motivare la
risposta
b) Individuare la mediana del carattere Quantità.
c) Estraendo a caso uno dei 3 0 0 acquirenti calcolare la probabilità che acquisti tra 5 e 10 litri della
marca B;
d) Estraendo a caso un acquirente della marca B calcolare la probabilità che acquisti tra 5 e 10 litri di
detersivo.