











Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Temi d'esame di Statistica Applicata
Tipologia: Prove d'esame
1 / 19
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!












Prova di STATISTICA APPLICATA (prima parte)
1) Dato un campione casuale semplice di 25 elementi dalla variabile casuale Y∼ N (μ,16) si è ottenuto Σi y (^) i = 2200. Calcolare una stima puntuale e una stima intervallare al 90% del parametro μ.
2) Dato un campione casuale semplice di n elementi (x 1 , x 2 , …, x (^) n ) dalla v.c. X, confrontare le caratteristiche (distorsione ed efficienza) dei tre seguenti stimatori del parametro μ = M(X):
Y 1 =
n ,^ Y^2 =^
X 1 + Xn 2 ,^ Y^3 =^
X 1 + Xn n.
3) Quando e perché la distribuzione binomiale può essere approssimata con quella della v.c. normale?
Completare le seguenti frasi scegliendo l’opzione corretta
a) un cambiamento di forma b) un appiattimento c) una traslazione
a) teoria della stima puntuale b) teoria della stima intervallare c) teoria dei test statistici
a) due realizzazioni indipendenti b) una variabile casuale e una sua realizzazione c) due variabili casuali
a) la distorsione del parametro b) la varianza dello stimatore c) il valor medio dello stimatore
a) asintoticamente Normale b) Normale se la variabile di campionamento è Normale c) entrambe le precedenti
a) corretto b) distorto ma la distorsione è nota c) nessuna delle precedenti
a) dal valore del parametro b) dalla numerosità del campione c) dalla media dello stimatore
a) aumentando α b) diminuendo α c) non dipende da α
Prova di STATISTICA APPLICATA (completamento)
Completare le seguenti frasi scegliendo l’opzione corretta
d) verificare se la temperatura media delle città del Nord è diversa da quella del Sud e) verificare se la temperatura media delle città del Nord a gennaio è minore rispetto a giugno f) verificare se la temperatura media delle città del Nord è uguale a quella del Sud
a)
−x − −y σ 0 2/ n
b)
−x − −y (sx^2 + sy^2 )/ n
c) sono equivalenti a b c
dove x−^ e y−^ sono le medie campionarie, mentre sx^2 e sy^2 le varianze campionarie corrette.
a) verificare l’uguaglianza delle medie di un carattere rilevato su k gruppi di unità b) verificare l’uguaglianza delle medie di k variabili casuali normali di eguale varianza c) verificare l’uguaglianza delle varianze di un carattere rilevato su k gruppi di unità
a) β aumenta b) β raddoppia c) β diminuisce
(statistica F ) è 0.025, il valore di significatività del coefficiente angolare è: a b c a) 0. b) 0.025 2 c) 0.
a) 0. b) 0. c) un qualsiasi valore tra 0 e 1
a disposizione un campione casuale semplice di 10 unità. La seguente statistica g(x) =
−x− 50 s/ 10
, dove −x è la
media campionaria ed s lo scarto quadratico medio campionario corretto: a b c a) si distribuisce come una normale b) si distribuisce come una t -Student con 9 gradi di libertà c) non è possibile stabilire esattamente la distribuzione di g(x)
metriche: a b c a) modello di regressione con variabile dummy b) modello di regressione logistica c) modello di regressione lineare multipla
Prova di STATISTICA APPLICATA (prima parte) del 14.7. (tema 3)
1) A seguito di una indagine di mercato presso n=400 consumatori, si è stimato che la quota di mercato del
quota di mercato con probabilità del 90%.
2) Dato un campione casuale semplice di n =2 elementi (x 1 , x 2 ,) dalla v.c. X di varianza nota pari a 16 ed i seguenti stimatori del parametro = M(X):
T 1 =
q X^2. 2.1) studiare la proprietà di non distorsione dei tre stimatori; 2.2) quale dei precedenti stimatori ha EQM minore?
Completare le seguenti frasi scegliendo l’opzione corretta
a) media pari a 0 e varianza pari a 1 b) media pari a 0 e varianza pari a 4/ c) media pari a 8 e varianza pari a 1
a) una traslazione della funzione di densità b) un appiattimento della funzione di densità c) nessuna delle precedenti
a) sia asintoticamente non distorto b) abbia errore quadratico medio asintoticamente nullo c) abbia varianza asintoticamente nulla
a) una Normale b) una t–Student con 9 gdl c) una Chi-quadrato con 10 gdl
a) sempre b) solo se sono indipendenti c) mai
a) pari a 1 b) pari a 0 c) pari a 0.
a) del tipo di distribuzione della variabile casuale di campionamento b) della stima dei parametri della variabile casuale di campionamento c) dei momenti teorici della variabile casuale di campionamento
a) dipende da α b) dipende dalla numerosità campionaria c) entrambe le precedenti
Prova di STATISTICA APPLICATA (completamento) del 14.7. (tema 3)
Completare le seguenti frasi scegliendo l’opzione corretta
a) Var(εi ) = ^2 < ∞ b) Var(εi ) = ^2 = 0 c) Var(εi ) = ^2 = 1
a) β b) 1 - β c) 1 - α
a) aumenta all’aumentare di α b) dipende da β c) dipende dal sistema di ipotesi
a) deve valere l’ipotesi di normalità b) le variabili devono essere dipendenti c) entrambe le precedenti
a) la variabile esplicativa X 1 è rilevante nella spiegazione di Y al 99% b) la variabile esplicativa X 1 è rilevante nella spiegazione di Y al 95% c) la variabile esplicativa X 1 non è rilevante nella spiegazione di Y
a) i percentili della Normale standardizzata b) i percentili della Normale standardizzatasolo se la dimensione del campione è grande c) i percentili della t-Student con n-3 gradi di libertà
Prova di STATISTICA APPLICATA (prima parte) del 12.6. (tema 7)
1) Dato un campione casuale semplice di n =25 elementi dalla v.c. X N(,^2 ), calcolare la probabilità che la media campionaria sia maggiore di +(/10).
2) Dato un campione casuale semplice di n elementi dalla v.c. X di varianza ^2 , calcolare l’ errore quadratico medio dei due seguenti stimatori del parametro = M(X):
T 1 =
n 1 Xi , T 2 =
n 1 Xi.
Completare le seguenti frasi scegliendo l’opzione corretta
a) aumenta b) raddoppia c) rimane invariata
a) la somma di 9 normali standardizzate elevate al quadrato b) la somma di 10 normali standardizzate elevate al quadrato c) nessuna delle precedenti
a) sono tutti significativamente diversi da zero a b c b) almeno uno è significativamente diverso da zero c) non si può concludere nulla sulla significatività dei coefficienti
a) le prove sono effettuate con reimmissione b) i risultati sono correlati c) nessuna delle precedenti
a) linearmente dipendenti (collineari) b) indipendenti e identicamente distribuite c) entrambe le precedenti
a) è standardizzata b) ha media 2 c) ha media 0.
normale con varianza nota: a b c a) si dimezza b) raddoppia c) diminuisce
distribuzione della media campionaria è: a b c a) una t di Student b) asintoticamente normale c) asintoticamente una t di Student
Prova di STATISTICA APPLICATA (completamento) del 12.6. (tema 7 )
Completare le seguenti frasi scegliendo l’opzione corretta
a) delle città del Nord è diversa da quelle del Sud b) delle città del Nord è superiore a quella del Sud c) delle città del Nord in inverno è superiore che in estate
a) La varianza dell’errore è nota b) La varianza dell’errore è incognita e non dipende dalle variabili esplicative c) La varianza dell’errore è incognita e può dipendere in modo sistematico dalle variabili esplicative
a) accettare l’ipotesi H 0 quando questa è falsa b) accettare H 1 quando questa è falsa c) rifiutare H 1 quando è falsa
a) una v.c. normale b) una qualsiasi variabile casuale discreta c) una v.c. bernoulliana
a) 75% b) 25% c) indefinita
b) La differenza tra l’osservazione y (^) i ed il valore stimato dal modello ŷi c) La differenza in modulo tra l’osservazione yi ed il valore stimato dal modello ŷi
sistema d’ipotesi H 0 :=2 contro H 1 :>2, se si rifiuta H 0 quando la media campionaria supera la soglia 2.768931, determinare: a) la significatività α associata al test b) il p-value se si osserva un valore della media campionaria pari a 2, c) la potenza del test in corrispondenza di =2, d) se in un nuovo campione di dimensione m si osservasse un valore della media campionaria pari a 2,2 e si concludesse che il p-value è pari a 1%, determinare il valore di m.
U NIVERSITÀ C ATTOLICA D EL S ACRO C UORE - M ILANO FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI Prova di STATISTICA APPLICATA (prima parte) del 26.6. (tema 8)
Studente _______________________________________ matricola _______________________ q 1
1) In una indagine campionaria la proporzione di coloro che consumano abitualmente pesce (più di 50gr al giorno) è risultata (29/100). Individuare la numerosità n del campione tale da garantire che l’ampiezza dell’intervallo di confidenza, di livello 95%, non superi 0.04.
2) Dato un campione casuale semplice di n elementi dalla v.c. X di varianza 36 e media incognita, confrontare distorsione ed errore quadratico medio dei tre seguenti stimatori del parametro = M(X):
T 1 =
(^2) i=1n^ Xi n ,^ T^2 = X^1 ^ Xn,^ T^3 =
X 1 - Xn 2 3) Data una v.c. distribuita come N(μ,σ^2 =4), si consideri il sistema d’ipotesi H 0 : μ= 1; H 1 : μ= 2. Se in un campione casuale semplice di ampiezza n=16 osserviamo una media campionaria pari a 1.6, determinare il p-value.
Completare le seguenti frasi scegliendo l’opzione corretta
a) trasla verso destra; b) trasla verso sinistra; c) si abbassa verso l’asse delle ascisse
a) n= b) n= c) n=
a) una varianza campionaria di osservazioni dicotomiche b) una media campionaria di osservazioni dicotomiche c) nessuna delle precedenti
a) (5-1)/2= b) (5+1)/2= c) (5+1)/2+1/2=3.
a) del parametro b) della media campionaria c) della media campionaria e della varianza campionaria
a) dal valore dello stimatore media campionaria b) dal livello di confidenza c) dalla media dello stimatore media campionaria
confrontare: a b c a) i valori delle distorsioni b) i valori degli errori quadratici medi c) i valori attesi
U NIVERSITÀ C ATTOLICA D EL S ACRO C UORE - M ILANO FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI Prova di STATISTICA APPLICATA (completamento) del 26.6. (tema 8 )
Studente _______________________________________ matricola _______________________ q 1
Completare le seguenti frasi scegliendo l’opzione corretta
a) è basato su una distribuzione esatta χ^2 b) è basato su una distribuzione asintotica χ^2 c) è basato su una distribuzione asintotica χ^2 nell’ipotesi che entrambe le variabili siano indipendenti
a) Stabilire se le osservazioni sono indipendenti b) Stabilire se le osservazioni provengono da una normale di media= c) Stabilire se le osservazioni hanno una distribuzione normale
a) per n elevato b) perché si standardizza c) solo per estrazioni senza reimmissione
a) Non è un modello lineare b) E’ un modello lineare solo se x 1^ è una variabile binaria ( dummy ) c) E’ un modello lineare
a) un intervallo finito di possibili valori del parametro b) uno specifico valore del parametro c) non si può stabilire in generale in quanto dipende dai dati
del test in =1 calcolata sulla base di un campione casuale semplice di dimensione n è: a b c a) minore della potenza del test in = b) maggiore della potenza del test per = c) minore della potenza del test in =2, solo a parità di n
Prova di STATISTICA APPLICATA (prima parte) del 9.6. (tema 17)
1) Dato un campione casuale semplice di n =36 elementi dalla v.c. X N (,^2 =9) si è ottenuta una statistica campionaria x i =7200. Calcolare una stima puntuale per e un intervallo di confidenza al 90%.
2) Dato un campione casuale semplice di n =2 elementi dalla v.c. X di varianza ^2 , confrontare distorsione ed errore quadratico medio dei due seguenti stimatori del parametro = M(X):
T 1 = (2X 1 +X 2 )/2 , T 2 = (X 1 2X 2 )/2.
3) Data la v.c. Y t 120 (cioè t di Student con 120 gdl) calcolare approssimativamente P(|Y|>2).
Completare le seguenti frasi scegliendo l’opzione corretta
a) quello con minore varianza b) quello non distorto c) quello a cui è associato il minor EQM
a) il rapporto tra due Chi-quadrato con rispettivamente 10 e 20 gdl b) 2 volte il rapporto tra due Chi-quadrato indipendenti con rispettivamente 10 e 20 gdl c) nessuna delle precedenti
a) EQM(X)=Var(X) b) Var(X)= c) Var(X)>
sufficiente conoscere: a b c a) la proporzione di palline rosse contenute nell’urna b) il numero totale di palline dell’urna c) nessuna delle precedenti
a) collineari b) identicamente distribuite c) entrambe le precedenti
a) M(T)= n n b) M(T)= c) M(T)=/ n
a) dimezza b) raddoppia c) aumenta
a) estremi e ampiezza variabili b) estremi variabili e ampiezza fissa c) estremi e ampiezza fissi
Prova di STATISTICA APPLICATA (completamento) del 9.6. (tema 17 )
Completare le seguenti frasi scegliendo l’opzione corretta
inserita in un modello di regressione lineare: a b c a) come una variabile quantitativa, codificando Aziendale=1, Economica=2, Quantitativa= b) inserendo 3 variabili dummy (0,1) in corrispondenza di ciascuna modalità c) inserendo 2 variabili dummy (0,1) in corrispondenza di 2 delle 3 modalità e usando la 3a^ come riferimento
a) di una azienda del Nord è diversa da quella di una azienda del Sud b) di una azienda tessile è diversa da quella di una azienda meccanica c) di una azienda X nel 2013 è diversa da quella degli addetti della stessa azienda nel 2012
a) da una v.c. normale con varianza nota b) da una v.c. normale con varianza incognita c) da una generica variabile casuale, purché di varianza nota
c) nessuna delle precedenti
a) al livello di significatività del test b) ad (1), se è vera H 1 c) nessuna delle precedenti
a) hanno distribuzione normale b) hanno distribuzione di media nulla c) entrambe le precedenti
a) assume solo valori positivi b) assume valori nell’intervallo [0,1] c) assume qualsiasi valore in R
sul coefficiente della variabile esplicativa ha valore: a b c a) 22. b) (22.12)^2 c) 22.
è scesa (H 1 : <25%). A tale proposito, osservato un campione di n consumatori si è ottenuta una stima p^^ =21%, cui è associato un p-value pari a 0.0359, che ha portato a rifiutare H 0. Indicare: a) il possibile intervallo di valori plausibili per il livello di significatività del test; b) il valore della numerosità campionaria n.
2) Una biblioteca desidera verificare se i costi medi di rilegatura della tipografia di cui usualmente si serve ( Tipogr_V ) sono equivalenti a quelli di una tipografia di nuova apertura Tipogr_N , ovvero se quest’ultima sia più conveniente. A tale scopo richiede il preventivo per la rilegatura di 20 specifici volumi ad entrambe le tipografie e ne registra i prezzi. Assumendo che detti prezzi si distribuiscano secondo la legge normale, si eseguono due differenti test statistici (vedi Tab A e B retro pagina).
Prova di STATISTICA APPLICATA del 6.7. (tema 24)
1) Si è interessati al numero medio ( μ) di uova consumate in una settimana da un soggetto sano di età compresa tra 30 e 40 anni. Si estrae un campione casuale di 120 soggetti e si rileva una media di 1.65 uova consumate alla settimana, con uno scarto quadratico medio di 0.42. a) Specificare se è necessario formulare alcune assunzioni sulla popolazione per poter determinare un intervallo di confidenza per μ. In caso di risposta affermativa, specificare quali assunzioni. b) Si determini l’intervallo di confidenza al 97% per μ. c) Lasciando invariata la realizzazione campionaria, qual è l’unico modo in cui sarebbe possibile ridurre il margine d’errore (ampiezza) dell’intervallo precedente?
T 1 =n(X 1 −X (^) n) T (^) 2=(X 1 +X (^) n)/n
3) La libreria AIXUL è stata progettata per essere montata direttamente dal cliente. Prima della commercializzazione è necessario stabilire quale tra due libretti di istruzioni di montaggio sia più chiaro. Si selezionano casualmente 5 coppie di clienti omogenei, dunque interscambiabili, rispetto alla capacità di montare un mobile. Si assegna ad ogni cliente della coppia un diverso libretto di istruzioni (A o B) e si rilevano i tempi (in minuti) impiegati per il montaggio:
coppia 1 2 3 4 5 Tempo per libretto A 30 26 34 40 43 Tempo per libretto B 34 20 41 38 50 a) Scrivere il sistema di ipotesi da adottare per verificare che il libretto A comporta minori tempi medi di montaggio.
indichi la conclusione del test.
self-service , si estrae un campione di acquisti effettuati nella stessa giornata. Si rilevano le variabili: SPESA=ammontare della spesa (€); ETA=età del cliente (anni); DIST=distanza dell’abitazione del cliente (km); TEMPO=tempo complessivamente trascorso dal cliente nel magazzino (minuti).
Si è ottenuto il seguente output:
a) Scrivere l’espressione analitica del modello ipotizzato e spiegare le relative assunzioni. b) E’ utile inserire la variabile ETA nel modello? Motivare la risposta. c) Calcolare il valore della statistica F del test globale del modello (non inclusa nel prospetto), specificando le ipotesi d) Fissato α= 0.05, si indichi, motivando la risposta, la conclusione del precedente test F. e) Fornire l’interpretazione del coefficiente della variabile TEMPO.
5) Si vuole verificare se 4 diversi trattamenti per la realizzazione di un certo prodotto sono equivalenti. A tal fine vengono eseguite 6 prove per ciascun trattamento, nelle quali viene misurata la qualità del prodotto finito ed eseguita un’analisi della varianza. Il prospetto è riportato nella tabella seguente
Analisi varianza: ad un fattore Gruppi Conteggio Somma Media Varianza T 1 6 57. 2 9. 53333 0. 23066 T 2 6 50. 9 8. 48333 0. 16566 T 3 6 48. 5 8. 08333 0. 35366 T 4 6 49. 1 8. 18333 0. 14566
Origine variazione SQ gdl MQ F p-value F crit Tra gruppi 79. 3125 3 26. 4375 c1 c2 3.098 4 In gruppi 44. 7833 20 2. 2392 Totale 124. 0958 23
a) Calcolare il valore della della statistica F , indicata con la costante c. b) Confrontando c1 e F crit (calcolato all’usuale livello del 5%) indicare i possibili valori per la costante c ( p-value del test). c) Indicare la conclusione del test.
e) Interpretare il significato del coefficiente di X3. f) Calcolare il valore di Y quando le esplicative assumono i valori X1=7, X2=55 e X3=10.
5) Per studiare se l’età è un fattore significativo nella manifestazione di disturbi coronarici, si sono osservati 100 soggetti, registrandone l’età (AGE) e la presenza/assenza di coronaropatia (CHD). La tabella seguente riporta l’output di una procedura di regressione logistica: variable B std.err. p-value Exp(B) AGE 0. 111 0. 024 0.00 1 1. 117 costant - 5. 310 1. 134 0.0 01 0 .0 05 a) indicare l’espressione del modello ipotizzato per descrivere la P(CHD=1); b) interpretare il valore Exp(B) relativo alla variabile AGE.
6) Per verificare la validità di un corso di formazione destinato ad abbassare il tempo di esecuzione di una determinata procedura, vengono osservati 42 soggetti, metà dei quali vengono addestrati e metà no. Misurati i rispettivi tempi di esecuzione, vengono eseguiti i due seguenti test. Test t: due campioni accoppiati per medie Test t: due campioni assumendo uguale varianza Training No Trng Training No Trng Media 17.55714 19.41429 Media 17.55714 19. Varianza 3.737571 8.458286 Varianza 3.737571 8. Osservazioni 21 21 Osservazioni 21 21 Correlazione di Pearson 0.05169 2 Varianza complessiva 6. gdl c1 gdl c Stat t - 2.4972 Stat t - 2. P(T<=t) una coda 0.01068 P(T<=t) una coda 0. t critico una coda 1.724718 t critico una coda 1. P(T<=t) due code c3^ P(T<=t) due code c t critico due code 2.085963 t critico due code 2. a) Indicare quale test è opportuno adottare, motivando la risposta. b) Indicare il valore delle costanti c1 e c2 , motivando la risposta. c) Indicare il valore delle costanti c3 e c4 , motivando la risposta. d) Quale conclusione viene suggerita dal test adottato?