Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Temi Esami Statistica Applicata, Prove d'esame di Statistica Applicata

Temi d'esame di Statistica Applicata

Tipologia: Prove d'esame

2018/2019

Caricato il 28/04/2019

federica-mundo
federica-mundo 🇮🇹

1 documento

1 / 19

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
UNIVERSITÀ CATTOLICA DEL SACRO CUORE - MILANO
FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI
Prova di STATISTICA APPLICATA (prima parte)
Studente _______________________________________matricola _______________________ q = 1
1) Dato un campione casuale semplice di 25 elementi dalla variabile casuale YN(μ,16) si è ottenuto Σi yi = 2200.
Calcolare una stima puntuale e una stima intervallare al 90% del parametro μ.
2) Dato un campione casuale semplice di n elementi (x1, x2, …, xn) dalla v.c. X, confrontare le caratteristiche
(distorsione ed efficienza) dei tre seguenti stimatori del parametro μ = M(X):
Y1 = i=1
n Xi
n , Y2 = X1 + Xn
2 , Y3 = X1 + Xn
n .
3) Quando e perché la distribuzione binomiale può essere approssimata con quella della v.c. normale?
Completare le seguenti frasi scegliendo l’opzione corretta
1. Se in una variabile casuale Normale aumenta il parametro µ, la funzione di densità ha: a b c
a) un cambiamento di forma
b) un appiattimento
c) una traslazione
2. La valutazione numerica di un parametro della popolazione fa parte della: a b c
a) teoria della stima puntuale
b) teoria della stima intervallare
c) teoria dei test statistici
3. Lo stimatore e la stima sono rispettivamente: a b c
a) due realizzazioni indipendenti
b) una variabile casuale e una sua realizzazione
c) due variabili casuali
4. Se uno stimatore è non distorto, il suo MSE coincide con: a b c
a) la distorsione del parametro
b) la varianza dello stimatore
c) il valor medio dello stimatore
5. La distribuzione dello stimatore Media campionaria è: a b c
a) asintoticamente Normale
b) Normale se la variabile di campionamento è Normale
c) entrambe le precedenti
6. Lo stimatore Varianza campionaria è: a b c
a) corretto
b) distorto ma la distorsione è nota
c) nessuna delle precedenti
7. L’ampiezza di un intervallo di confidenza dipende: a b c
a) dal valore del parametro
b) dalla numerosità del campione
c) dalla media dello stimatore
8. L’ampiezza di un intervallo di confidenza diminuisce: a b c
a) aumentando α
b) diminuendo α
c) non dipende da α
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Anteprima parziale del testo

Scarica Temi Esami Statistica Applicata e più Prove d'esame in PDF di Statistica Applicata solo su Docsity!

U NIVERSITÀ C ATTOLICA D EL S ACRO C UORE - M ILANO

FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI

Prova di STATISTICA APPLICATA (prima parte)

Studente _______________________________________matricola _______________________ q = 1

1) Dato un campione casuale semplice di 25 elementi dalla variabile casuale Y∼ N (μ,16) si è ottenuto Σi y (^) i = 2200. Calcolare una stima puntuale e una stima intervallare al 90% del parametro μ.

2) Dato un campione casuale semplice di n elementi (x 1 , x 2 , …, x (^) n ) dalla v.c. X, confrontare le caratteristiche (distorsione ed efficienza) dei tre seguenti stimatori del parametro μ = M(X):

Y 1 =

∑i=1n^ Xi

n ,^ Y^2 =^

X 1 + Xn 2 ,^ Y^3 =^

X 1 + Xn n.

3) Quando e perché la distribuzione binomiale può essere approssimata con quella della v.c. normale?

Completare le seguenti frasi scegliendo l’opzione corretta

  1. Se in una variabile casuale Normale aumenta il parametro μ, la funzione di densità ha: a b c

a) un cambiamento di forma b) un appiattimento c) una traslazione

  1. La valutazione numerica di un parametro della popolazione fa parte della: a b c

a) teoria della stima puntuale b) teoria della stima intervallare c) teoria dei test statistici

  1. Lo stimatore e la stima sono rispettivamente: a b c

a) due realizzazioni indipendenti b) una variabile casuale e una sua realizzazione c) due variabili casuali

  1. Se uno stimatore è non distorto, il suo MSE coincide con: a b c

a) la distorsione del parametro b) la varianza dello stimatore c) il valor medio dello stimatore

  1. La distribuzione dello stimatore Media campionaria è: a b c

a) asintoticamente Normale b) Normale se la variabile di campionamento è Normale c) entrambe le precedenti

  1. Lo stimatore Varianza campionaria è: a b c

a) corretto b) distorto ma la distorsione è nota c) nessuna delle precedenti

  1. L’ampiezza di un intervallo di confidenza dipende: a b c

a) dal valore del parametro b) dalla numerosità del campione c) dalla media dello stimatore

  1. L’ampiezza di un intervallo di confidenza diminuisce: a b c

a) aumentando α b) diminuendo α c) non dipende da α

Prova di STATISTICA APPLICATA (completamento)

Studente _______________________________________matricola _______________________ q = 1

Completare le seguenti frasi scegliendo l’opzione corretta

  1. Il test t per dati appaiati è adatto per: a b c

d) verificare se la temperatura media delle città del Nord è diversa da quella del Sud e) verificare se la temperatura media delle città del Nord a gennaio è minore rispetto a giugno f) verificare se la temperatura media delle città del Nord è uguale a quella del Sud

  1. Dati 2 campioni casuali semplici di dimensione n estratti da 2 distinte variabili casuali normali di varianza uguale e nota σ 02 , quale delle seguenti statistiche è adatta per verificare l’uguaglianza delle 2 medie:

a)

−x − −y σ 0 2/ n

b)

−x − −y (sx^2 + sy^2 )/ n

c) sono equivalenti a b c

dove x−^ e y−^ sono le medie campionarie, mentre sx^2 e sy^2 le varianze campionarie corrette.

  1. ANOVA è un test statistico che serve per: a b c

a) verificare l’uguaglianza delle medie di un carattere rilevato su k gruppi di unità b) verificare l’uguaglianza delle medie di k variabili casuali normali di eguale varianza c) verificare l’uguaglianza delle varianze di un carattere rilevato su k gruppi di unità

  1. Se nel test (H 0 : μ=μ 0 | H 1 : μ≠μ 0 ) per la media di una normale di varianza nota, si dimezza α: a b c

a) β aumenta b) β raddoppia c) β diminuisce

  1. Se nella stima dei parametri di una retta di regressione il valore di significatività globale del modello

(statistica F ) è 0.025, il valore di significatività del coefficiente angolare è: a b c a) 0. b) 0.025 2 c) 0.

  1. Nella stessa situazione del quesito precedente, il valore di significatività dell’intercetta sarà: a b c

a) 0. b) 0. c) un qualsiasi valore tra 0 e 1

  1. Si vuole verificare se la media di un certo carattere X (di cui non è nota la distribuzione) è uguale a 50, avendo

a disposizione un campione casuale semplice di 10 unità. La seguente statistica g(x) =

−x− 50 s/ 10

, dove −x è la

media campionaria ed s lo scarto quadratico medio campionario corretto: a b c a) si distribuisce come una normale b) si distribuisce come una t -Student con 9 gradi di libertà c) non è possibile stabilire esattamente la distribuzione di g(x)

  1. Individuare il modello adatto a studiare la dipendenza di una variabile dicotomica da k variabili esplicative

metriche: a b c a) modello di regressione con variabile dummy b) modello di regressione logistica c) modello di regressione lineare multipla

U NIVERSITÀ C ATTOLICA DEL S ACRO C UORE - M ILANO

FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI

Prova di STATISTICA APPLICATA (prima parte) del 14.7. (tema 3)

Studente _______________________________________ matricola _______________________ q  1

1) A seguito di una indagine di mercato presso n=400 consumatori, si è stimato che la quota di mercato del

prodotto A è pari a p ˆ^ = 0.28. Individuare un intervallo di valori all’interno del quale può ritenersi cada la vera

quota di mercato con probabilità del 90%.

2) Dato un campione casuale semplice di n =2 elementi (x 1 , x 2 ,) dalla v.c. X di varianza nota pari a 16 ed i seguenti stimatori del parametro  = M(X):

T 1 =

2 X^1 +^

2 X^2 ,^ T^2 =^

4 X^1 +^

4 X^2 ,^ T^3 =^

3 X^1 +^

q X^2. 2.1) studiare la proprietà di non distorsione dei tre stimatori; 2.2) quale dei precedenti stimatori ha EQM minore?

Completare le seguenti frasi scegliendo l’opzione corretta

  1. Una variabile casuale t-Student con 8 gdl ha : a b c

a) media pari a 0 e varianza pari a 1 b) media pari a 0 e varianza pari a 4/ c) media pari a 8 e varianza pari a 1

  1. Se in una variabile casuale Normale standardizzata il parametro μ diminuisce si ha: a b c

a) una traslazione della funzione di densità b) un appiattimento della funzione di densità c) nessuna delle precedenti

  1. Quale delle seguenti condizioni deve essere verificata affinché uno stimatore sia consistente: a b c

a) sia asintoticamente non distorto b) abbia errore quadratico medio asintoticamente nullo c) abbia varianza asintoticamente nulla

  1. La somma dei quadrati di 10 v.c. Normali standardizzate indipendenti si distribuisce come: a b c

a) una Normale b) una t–Student con 9 gdl c) una Chi-quadrato con 10 gdl

  1. Il Teorema del Limite Centrale si può applicare a successioni di v.c. di Bernoulli: a b c

a) sempre b) solo se sono indipendenti c) mai

  1. In una variabile casuale X, Normale con media pari a 4 e varianza 1, la P(X>4) risulta: a b c

a) pari a 1 b) pari a 0 c) pari a 0.

  1. Il metodo della massima verosimiglianza richiede la conoscenza: a b c

a) del tipo di distribuzione della variabile casuale di campionamento b) della stima dei parametri della variabile casuale di campionamento c) dei momenti teorici della variabile casuale di campionamento

  1. L’ampiezza dell’intervallo di confidenza: a b c

a) dipende da α b) dipende dalla numerosità campionaria c) entrambe le precedenti

Università Cattolica del Sacro Cuore - Milano

FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI

Prova di STATISTICA APPLICATA (completamento) del 14.7. (tema 3)

Studente _______________________________________ matricola _______________________ q  1

Completare le seguenti frasi scegliendo l’opzione corretta

  1. L’ipotesi di omoschedasticità degli errori εi nel modello lineare multiplo prevede che: a b c

a) Var(εi ) = ^2 < ∞ b) Var(εi ) = ^2 = 0 c) Var(εi ) = ^2 = 1

  1. Per confrontare la media di due variabili casuali Normali indipendenti di varianza incognita ma uguale, sulla base di un c.c.s. da ciascuna delle due variabili, rispettivamente di dimensione n e m , la distribuzione della statistica test, sotto l’ipotesi nulla, ha gradi di libertà: a b c a) g = n - 2 b) g = n + m c) g = n + m - 2
  2. Nella verifica di ipotesi la potenza di un test cresce all’aumentare di: a b c

a) β b) 1 - β c) 1 - α

  1. In una analisi di mercato la variabile che descrive la soddisfazione del cliente, con modalità “soddisfatto” e “non soddisfatto”, può essere studiata tramite a b c a) il modello lineare semplice b) il modello logit c) il modello di regressione multipla
  2. La regione di accettazione di un test statistico: a b c

a) aumenta all’aumentare di α b) dipende da β c) dipende dal sistema di ipotesi

  1. Nel test sulla uguaglianza tra due varianze: a b c

a) deve valere l’ipotesi di normalità b) le variabili devono essere dipendenti c) entrambe le precedenti

7. Se il p-value del test t per verificare la nullità del coefficiente  1 nel modello di regressione multiplo

y=  0 +  1 x 1  2 x 2  e , ha valore 0.03 si conclude che: a b c

a) la variabile esplicativa X 1 è rilevante nella spiegazione di Y al 99% b) la variabile esplicativa X 1 è rilevante nella spiegazione di Y al 95% c) la variabile esplicativa X 1 non è rilevante nella spiegazione di Y

  1. Nella verifica di ipotesi sulla media  di una v.c. Normale con varianza non nota si utilizzano: a b c

a) i percentili della Normale standardizzata b) i percentili della Normale standardizzatasolo se la dimensione del campione è grande c) i percentili della t-Student con n-3 gradi di libertà

U NIVERSITÀ C ATTOLICA D EL S ACRO C UORE - M ILANO

FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI

Prova di STATISTICA APPLICATA (prima parte) del 12.6. (tema 7)

Studente _______________________________________ matricola _______________________ q  1

1) Dato un campione casuale semplice di n =25 elementi dalla v.c. X  N(,^2 ), calcolare la probabilità che la media campionaria sia maggiore di +(/10).

2) Dato un campione casuale semplice di n elementi dalla v.c. X di varianza ^2 , calcolare l’ errore quadratico medio dei due seguenti stimatori del parametro  = M(X):

T 1 =

n 2 i=2

n 1 Xi , T 2 =

n i=1

n 1 Xi.

3) Sapendo che la media campionaria è y=21 e che n =16 costruire l’intervallo di confidenza al 90% per la

media della v.c. Y N (, 9).

Completare le seguenti frasi scegliendo l’opzione corretta

  1. Se in una v.c. X normale raddoppia la varianza, allora P(X>): a b c

a) aumenta b) raddoppia c) rimane invariata

  1. La variabile casuale Chi-quadrato con 10 gdl è: a b c

a) la somma di 9 normali standardizzate elevate al quadrato b) la somma di 10 normali standardizzate elevate al quadrato c) nessuna delle precedenti

  1. Se in un modello di regressione multipla il p-value del test F è 0.2, i coefficienti:

a) sono tutti significativamente diversi da zero a b c b) almeno uno è significativamente diverso da zero c) non si può concludere nulla sulla significatività dei coefficienti

  1. In una v.c. ipergeometrica: a b c

a) le prove sono effettuate con reimmissione b) i risultati sono correlati c) nessuna delle precedenti

  1. Un campione casuale semplice è costituito da n variabili casuali: a b c

a) linearmente dipendenti (collineari) b) indipendenti e identicamente distribuite c) entrambe le precedenti

  1. Data una v.c. normale X N (,1) e sapendo che P(X>0)=0.5, allora la v.c. X: a b c

a) è standardizzata b) ha media 2 c) ha media 0.

  1. Se la numerosità campionaria quadruplica, l’intervallo di confidenza per la media di una popolazione

normale con varianza nota: a b c a) si dimezza b) raddoppia c) diminuisce

  1. Con riferimento al campionamento di n elementi da una v.c. generica di varianza nota pari a 16, la

distribuzione della media campionaria è: a b c a) una t di Student b) asintoticamente normale c) asintoticamente una t di Student

U NIVERSITÀ C ATTOLICA D EL S ACRO C UORE - M ILANO

FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI

Prova di STATISTICA APPLICATA (completamento) del 12.6. (tema 7 )

Studente _______________________________________ matricola _______________________ q  1

Completare le seguenti frasi scegliendo l’opzione corretta

  1. Il test t per dati appaiati è adatto per verificare se il consumo pro-capite di cioccolato: a b c

a) delle città del Nord è diversa da quelle del Sud b) delle città del Nord è superiore a quella del Sud c) delle città del Nord in inverno è superiore che in estate

  1. Tra le ipotesi del modello di regressione lineare figura la seguente: a b c

a) La varianza dell’errore è nota b) La varianza dell’errore è incognita e non dipende dalle variabili esplicative c) La varianza dell’errore è incognita e può dipendere in modo sistematico dalle variabili esplicative

3. Il test F associato al modello lineare Y=  0 +  1 x 1  2 x 2  3 x 3 +  assume come ipotesi nulla: a b c

a)^  0 =^  1 =^  2 =^  3 =

b) che uno qualunque dei parametri  1 ,  2 ,  3 sia zero

c)  1 =  2 =  3 =

  1. L’errore di II tipo corrisponde a: a b c

a) accettare l’ipotesi H 0 quando questa è falsa b) accettare H 1 quando questa è falsa c) rifiutare H 1 quando è falsa

  1. In un modello di regressione logistica, la variabile dipendente Y é: a b c

a) una v.c. normale b) una qualsiasi variabile casuale discreta c) una v.c. bernoulliana

  1. Per lo stesso modello di cui alla domanda 5 precedente, indicato con β 1 il parametro associato all’unica

variabile indipendente X 1 , si può affermare che se X 1 aumenta di una unità: a b c

a) il logit della probabilità di successo p aumenta di β 1

b) la probabilità di successo p aumenta di β 1

c) Y aumenta di β 1

  1. Se l’odds vale 3 allora la probabilità di successo p è: a b c

a) 75% b) 25% c) indefinita

  1. In un modello di regressione lineare multipla il residuo per l’osservazione i-esima è a b c

a) Un sinonimo (cioè un modo equivalente per dire la stessa cosa) dell’ errore 

b) La differenza tra l’osservazione y (^) i ed il valore stimato dal modello ŷi c) La differenza in modulo tra l’osservazione yi ed il valore stimato dal modello ŷi

1) Sia X una v.c. normale con media  e varianza 9. Dato un campione casuale con n =25 osservazioni, ed il

sistema d’ipotesi H 0 :=2 contro H 1 :>2, se si rifiuta H 0 quando la media campionaria supera la soglia 2.768931, determinare: a) la significatività α associata al test b) il p-value se si osserva un valore della media campionaria pari a 2, c) la potenza del test in corrispondenza di =2, d) se in un nuovo campione di dimensione m si osservasse un valore della media campionaria pari a 2,2 e si concludesse che il p-value è pari a 1%, determinare il valore di m.

U NIVERSITÀ C ATTOLICA D EL S ACRO C UORE - M ILANO FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI Prova di STATISTICA APPLICATA (prima parte) del 26.6. (tema 8)

Studente _______________________________________ matricola _______________________ q1

1) In una indagine campionaria la proporzione di coloro che consumano abitualmente pesce (più di 50gr al giorno) è risultata (29/100). Individuare la numerosità n del campione tale da garantire che l’ampiezza dell’intervallo di confidenza, di livello 95%, non superi 0.04.

2) Dato un campione casuale semplice di n elementi dalla v.c. X di varianza 36 e media incognita, confrontare distorsione ed errore quadratico medio dei tre seguenti stimatori del parametro  = M(X):

T 1 =

(^2) i=1n^ Xi n ,^ T^2 = X^1 ^ Xn,^ T^3 =

X 1 - Xn 2 3) Data una v.c. distribuita come N(μ,σ^2 =4), si consideri il sistema d’ipotesi H 0 : μ= 1; H 1 : μ= 2. Se in un campione casuale semplice di ampiezza n=16 osserviamo una media campionaria pari a 1.6, determinare il p-value.

Completare le seguenti frasi scegliendo l’opzione corretta

  1. Se in una v.c. X normale la media raddoppia, la funzione di densità: a b c

a) trasla verso destra; b) trasla verso sinistra; c) si abbassa verso l’asse delle ascisse

  1. Se in una binomiale simmetrica Bin(n,0.5) la mediana è 5: a b c

a) n= b) n= c) n=

  1. Lo stimatore proporzione campionaria è: a b c

a) una varianza campionaria di osservazioni dicotomiche b) una media campionaria di osservazioni dicotomiche c) nessuna delle precedenti

  1. In una v.c. rettangolare o uniforme sull’intervallo (1,5) la media è uguale a: a b c

a) (5-1)/2= b) (5+1)/2= c) (5+1)/2+1/2=3.

  1. La funzione di verosimiglianza si analizza al variare: a b c

a) del parametro b) della media campionaria c) della media campionaria e della varianza campionaria

  1. A parità di numerosità campionaria n= 10, l’intervallo di confidenza della media con varianza ignota, rispetto a quello con varianza nota: a b c a) è più ampio b) è meno ampio c) non si possono fare confronti
  2. L’ampiezza di un intervallo di confidenza per la media di una popolazione normale dipende: a b c

a) dal valore dello stimatore media campionaria b) dal livello di confidenza c) dalla media dello stimatore media campionaria

  1. Per poter confrontare due stimatori in termini di efficienza rispetto alla stima dello stesso parametro, occorre

confrontare: a b c a) i valori delle distorsioni b) i valori degli errori quadratici medi c) i valori attesi

U NIVERSITÀ C ATTOLICA D EL S ACRO C UORE - M ILANO FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI Prova di STATISTICA APPLICATA (completamento) del 26.6. (tema 8 )

Studente _______________________________________ matricola _______________________ q1

Completare le seguenti frasi scegliendo l’opzione corretta

  1. Sia Y una variabile dipendente misurata in centinaia di euro; sia X una variabile indipendente misurata in kg; sia il coefficiente stimato nella regressione lineare semplice di Y su X pari a 2. Il valore 2 significa che: a b c a) Se X aumenta di 1 kg la stima dell’incremento medio di Y è di 2 euro b) Se X aumenta di 1 kg la stima dell’incremento medio di Y è di 200 euro c) Se X aumenta di 1 kg la stima dell’incremento medio di Y è del 2%
  2. Il test χ^2 d’indipendenza tra due variabili X e Y si chiama così in quanto: a b c

a) è basato su una distribuzione esatta χ^2 b) è basato su una distribuzione asintotica χ^2 c) è basato su una distribuzione asintotica χ^2 nell’ipotesi che entrambe le variabili siano indipendenti

  1. Per studiare la dipendenza di una variabile quantitativa Y da 2 variabili esplicative di cui una qualitativa è adatto: a b c a) un modello di regressione multipla con almeno una variabile dummy b) un modello di regressione logistica c) un modello di regressione semplice
  2. Il grafico q-qplot serve per: a b c

a) Stabilire se le osservazioni sono indipendenti b) Stabilire se le osservazioni provengono da una normale di media= c) Stabilire se le osservazioni hanno una distribuzione normale

  1. Nei test su una proporzione si usa l’approssimazione normale: a b c

a) per n elevato b) perché si standardizza c) solo per estrazioni senza reimmissione

6. Il modello Y=  0 +  1 x 1^  2 x 2  3 x 3 +errore a b c

a) Non è un modello lineare b) E’ un modello lineare solo se x 1^ è una variabile binaria ( dummy ) c) E’ un modello lineare

  1. Un’ipotesi semplice su una distribuzione con un solo parametro prevede: a b c

a) un intervallo finito di possibili valori del parametro b) uno specifico valore del parametro c) non si può stabilire in generale in quanto dipende dai dati

  1. Dato il sistema di ipotesi H 0 :=0 contro H 1 :>0 sulla media  di una normale X di varianza nota, la potenza

del test in =1 calcolata sulla base di un campione casuale semplice di dimensione n è: a b c a) minore della potenza del test in = b) maggiore della potenza del test per = c) minore della potenza del test in =2, solo a parità di n

1) Un’università dichiara sul suo sito web di ammettere fino al 60% dei candidati che fanno richiesta

di iscrizione (ipotesi nulla). Fissato  pari a 0.05, qual è stata la proporzione massima di studenti

ammessi su un campione di casuale semplice di 610 studenti , sapendo che il test ha portato a

rifiutare l’ipotesi nulla H 0 : ≤0.6?

U NIVERSITÀ C ATTOLICA D EL S ACRO C UORE - M ILANO

FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI

Prova di STATISTICA APPLICATA (prima parte) del 9.6. (tema 17)

Studente _______________________________________ matricola _______________________ q  1

1) Dato un campione casuale semplice di n =36 elementi dalla v.c. X  N (,^2 =9) si è ottenuta una statistica campionaria  x i =7200. Calcolare una stima puntuale per  e un intervallo di confidenza al 90%.

2) Dato un campione casuale semplice di n =2 elementi dalla v.c. X di varianza ^2 , confrontare distorsione ed errore quadratico medio dei due seguenti stimatori del parametro  = M(X):

T 1 = (2X 1 +X 2 )/2 , T 2 = (X 1 2X 2 )/2.

3) Data la v.c. Y t 120 (cioè t di Student con 120 gdl) calcolare approssimativamente P(|Y|>2).

Completare le seguenti frasi scegliendo l’opzione corretta

  1. Quale, tra due, è il miglior stimatore di un parametro : a b c

a) quello con minore varianza b) quello non distorto c) quello a cui è associato il minor EQM

  1. La variabile casuale F con 10 e 20 gdl è ottenibile come: a b c

a) il rapporto tra due Chi-quadrato con rispettivamente 10 e 20 gdl b) 2 volte il rapporto tra due Chi-quadrato indipendenti con rispettivamente 10 e 20 gdl c) nessuna delle precedenti

  1. Si consideri lo stimatore X^ della media di una v.c. X~ N (,16). Si può concludere che, per n >1: a b c

a) EQM(X)=Var(X) b) Var(X)= c) Var(X)>

  1. Per definire la v.c. ipergeometrica X= “numero di palline rosse estratte senza reimmissione da un’urna”, è

sufficiente conoscere: a b c a) la proporzione di palline rosse contenute nell’urna b) il numero totale di palline dell’urna c) nessuna delle precedenti

  1. Le n componenti della v.c. di campionamento (X 1 ,…,Xn ) sono: a b c

a) collineari b) identicamente distribuite c) entrambe le precedenti

  1. Sapendo che T è uno stimatore asintoticamente corretto del parametro , allora può essere: a b c

a) M(T)= n  n b) M(T)= c) M(T)=/ n

  1. Se la numerosità campionaria quadruplica, la P(|X|<1), essendo X^ la v.c. media campionaria: a b c

a) dimezza b) raddoppia c) aumenta

  1. L’intervallo di confidenza per la media di una variabile X normale di varianza nota ha: a b c

a) estremi e ampiezza variabili b) estremi variabili e ampiezza fissa c) estremi e ampiezza fissi

U NIVERSITÀ C ATTOLICA D EL S ACRO C UORE - M ILANO

FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI

Prova di STATISTICA APPLICATA (completamento) del 9.6. (tema 17 )

Studente _______________________________________ matricola _______________________ q  1

Completare le seguenti frasi scegliendo l’opzione corretta

  1. La variabile qualitativa X= “area scientifica”, con modalità: Aziendale, Economica, Quantitativa, può essere

inserita in un modello di regressione lineare: a b c a) come una variabile quantitativa, codificando Aziendale=1, Economica=2, Quantitativa= b) inserendo 3 variabili dummy (0,1) in corrispondenza di ciascuna modalità c) inserendo 2 variabili dummy (0,1) in corrispondenza di 2 delle 3 modalità e usando la 3a^ come riferimento

  1. Il test t per dati appaiati è adatto per verificare se la media dei giorni di malattia per dipendente: a b c

a) di una azienda del Nord è diversa da quella di una azienda del Sud b) di una azienda tessile è diversa da quella di una azienda meccanica c) di una azienda X nel 2013 è diversa da quella degli addetti della stessa azienda nel 2012

  1. Per applicare il test t sulla media è necessario ipotizzare che il campione casuale semplice provenga: a b c

a) da una v.c. normale con varianza nota b) da una v.c. normale con varianza incognita c) da una generica variabile casuale, purché di varianza nota

4. Il test F associato al modello lineare Y=  0 +  1 x 1  2 x 2  3 x 3 +  assume come ipotesi alternativa: a b c

a)  0 =  1 =  2 =  3 =

b) che uno qualunque dei parametri  0 ,  1 ,  2 ,  3 sia diverso da zero

c) nessuna delle precedenti

  1. La probabilità di rifiutare l’ipotesi nulla corrisponde: a b c

a) al livello di significatività del test b) ad (1), se è vera H 1 c) nessuna delle precedenti

  1. Con riferimento al modello di regressione yi = y (^) i*^ + i (i=1,2,…,n), gli errori i : a b c

a) hanno distribuzione normale b) hanno distribuzione di media nulla c) entrambe le precedenti

7. Il logit della probabilità di successo  : a b c

a) assume solo valori positivi b) assume valori nell’intervallo [0,1] c) assume qualsiasi valore in R

  1. Se in un modello di regressione con k =1 variabili esplicative il valore della statistica F è 22.12, la statistica t

sul coefficiente della variabile esplicativa ha valore: a b c a) 22. b) (22.12)^2 c) 22.

1) Si desidera verificare se l’azienda A ha mantenuto la quota di mercato pari a =25% (H 0 ) oppure la sua quota

è scesa (H 1 : <25%). A tale proposito, osservato un campione di n consumatori si è ottenuta una stima p^^ =21%, cui è associato un p-value pari a 0.0359, che ha portato a rifiutare H 0. Indicare: a) il possibile intervallo di valori plausibili per il livello di significatività  del test; b) il valore della numerosità campionaria n.

2) Una biblioteca desidera verificare se i costi medi di rilegatura della tipografia di cui usualmente si serve ( Tipogr_V ) sono equivalenti a quelli di una tipografia di nuova apertura Tipogr_N , ovvero se quest’ultima sia più conveniente. A tale scopo richiede il preventivo per la rilegatura di 20 specifici volumi ad entrambe le tipografie e ne registra i prezzi. Assumendo che detti prezzi si distribuiscano secondo la legge normale, si eseguono due differenti test statistici (vedi Tab A e B retro pagina).

U NIVERSITÀ C ATTOLICA D EL SACRO CUORE - M ILANO

FACOLTÀ DI ECONOMIA - LAUREE TRIENNALI

Prova di STATISTICA APPLICATA del 6.7. (tema 24)

Studente _______________________________________ matricola _______________________ q = 1

1) Si è interessati al numero medio ( μ) di uova consumate in una settimana da un soggetto sano di età compresa tra 30 e 40 anni. Si estrae un campione casuale di 120 soggetti e si rileva una media di 1.65 uova consumate alla settimana, con uno scarto quadratico medio di 0.42. a) Specificare se è necessario formulare alcune assunzioni sulla popolazione per poter determinare un intervallo di confidenza per μ. In caso di risposta affermativa, specificare quali assunzioni. b) Si determini l’intervallo di confidenza al 97% per μ. c) Lasciando invariata la realizzazione campionaria, qual è l’unico modo in cui sarebbe possibile ridurre il margine d’errore (ampiezza) dell’intervallo precedente?

2) Estratto un campione casuale di dimensione n da una v.c. Normale X di varianza nota σ 0 2 , si confrontino

(distorsione ed EQM) i due seguenti stimatori della media μ di X:

T 1 =n(X 1 −X (^) n) T (^) 2=(X 1 +X (^) n)/n

3) La libreria AIXUL è stata progettata per essere montata direttamente dal cliente. Prima della commercializzazione è necessario stabilire quale tra due libretti di istruzioni di montaggio sia più chiaro. Si selezionano casualmente 5 coppie di clienti omogenei, dunque interscambiabili, rispetto alla capacità di montare un mobile. Si assegna ad ogni cliente della coppia un diverso libretto di istruzioni (A o B) e si rilevano i tempi (in minuti) impiegati per il montaggio:

coppia 1 2 3 4 5 Tempo per libretto A 30 26 34 40 43 Tempo per libretto B 34 20 41 38 50 a) Scrivere il sistema di ipotesi da adottare per verificare che il libretto A comporta minori tempi medi di montaggio.

b) Fissando α=0.01 e assumendo che la differenza tra le medie campionarie abbia distribuzione Normale, si

indichi la conclusione del test.

4) Al fine di valutare quali variabili influiscano sull’ammontare della spesa dei cliente di un magazzino di mobili

self-service , si estrae un campione di acquisti effettuati nella stessa giornata. Si rilevano le variabili: SPESA=ammontare della spesa (€); ETA=età del cliente (anni); DIST=distanza dell’abitazione del cliente (km); TEMPO=tempo complessivamente trascorso dal cliente nel magazzino (minuti).

Si è ottenuto il seguente output:

a) Scrivere l’espressione analitica del modello ipotizzato e spiegare le relative assunzioni. b) E’ utile inserire la variabile ETA nel modello? Motivare la risposta. c) Calcolare il valore della statistica F del test globale del modello (non inclusa nel prospetto), specificando le ipotesi d) Fissato α= 0.05, si indichi, motivando la risposta, la conclusione del precedente test F. e) Fornire l’interpretazione del coefficiente della variabile TEMPO.

5) Si vuole verificare se 4 diversi trattamenti per la realizzazione di un certo prodotto sono equivalenti. A tal fine vengono eseguite 6 prove per ciascun trattamento, nelle quali viene misurata la qualità del prodotto finito ed eseguita un’analisi della varianza. Il prospetto è riportato nella tabella seguente

Analisi varianza: ad un fattore Gruppi Conteggio Somma Media Varianza T 1 6 57. 2 9. 53333 0. 23066 T 2 6 50. 9 8. 48333 0. 16566 T 3 6 48. 5 8. 08333 0. 35366 T 4 6 49. 1 8. 18333 0. 14566

Origine variazione SQ gdl MQ F p-value F crit Tra gruppi 79. 3125 3 26. 4375 c1 c2 3.098 4 In gruppi 44. 7833 20 2. 2392 Totale 124. 0958 23

a) Calcolare il valore della della statistica F , indicata con la costante c. b) Confrontando c1 e F crit (calcolato all’usuale livello del 5%) indicare i possibili valori per la costante c ( p-value del test). c) Indicare la conclusione del test.

e) Interpretare il significato del coefficiente di X3. f) Calcolare il valore di Y quando le esplicative assumono i valori X1=7, X2=55 e X3=10.

5) Per studiare se l’età è un fattore significativo nella manifestazione di disturbi coronarici, si sono osservati 100 soggetti, registrandone l’età (AGE) e la presenza/assenza di coronaropatia (CHD). La tabella seguente riporta l’output di una procedura di regressione logistica: variable B std.err. p-value Exp(B) AGE 0. 111 0. 024 0.00 1 1. 117 costant - 5. 310 1. 134 0.0 01 0 .0 05 a) indicare l’espressione del modello ipotizzato per descrivere la P(CHD=1); b) interpretare il valore Exp(B) relativo alla variabile AGE.

6) Per verificare la validità di un corso di formazione destinato ad abbassare il tempo di esecuzione di una determinata procedura, vengono osservati 42 soggetti, metà dei quali vengono addestrati e metà no. Misurati i rispettivi tempi di esecuzione, vengono eseguiti i due seguenti test. Test t: due campioni accoppiati per medie Test t: due campioni assumendo uguale varianza Training No Trng Training No Trng Media 17.55714 19.41429 Media 17.55714 19. Varianza 3.737571 8.458286 Varianza 3.737571 8. Osservazioni 21 21 Osservazioni 21 21 Correlazione di Pearson 0.05169 2 Varianza complessiva 6. gdl c1 gdl c Stat t - 2.4972 Stat t - 2. P(T<=t) una coda 0.01068 P(T<=t) una coda 0. t critico una coda 1.724718 t critico una coda 1. P(T<=t) due code c3^ P(T<=t) due code c t critico due code 2.085963 t critico due code 2. a) Indicare quale test è opportuno adottare, motivando la risposta. b) Indicare il valore delle costanti c1 e c2 , motivando la risposta. c) Indicare il valore delle costanti c3 e c4 , motivando la risposta. d) Quale conclusione viene suggerita dal test adottato?