Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Esame statistica unimercatorum, Prove d'esame di Statistica

Domande e risposte dell’esame di statistica

Tipologia: Prove d'esame

2019/2020

Caricato il 27/07/2020

gauz
gauz 🇮🇹

4

(33)

1 documento

1 / 63

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1 Nel modello di regressione lineare semplice ⓴ :
Le ipotesi del modello
a Rappresenta la componente deterministica della retta di regressione
b Rappresenta la derivata prima della componente deterministica rispetto a x
c Rappresenta il valore della componente deterministica quando x è uguale a zero
d Indica di quanto aumenta la componente deterministica se x aumenta di una
unità
2 Nel modello di regressione lineare Y = a + bX:
Le ipotesi del modello
a Y è una variabile casuale
b Y è una variabile deterministica
c X è una variabile casuale
d X e Y sono variabili casuali
3 Lo stimatore:
Stima e distribuzione dei parametri
a E' esattamente uguale al valore vero del parametro della popolazione
b E' così definita la statistica calcolata sui dati del campione
c Differisce dal valore vero del parametro della popolazione per effetto del puro
caso
d Rispetta sempre la proprietà della correttezza
4 L'intervallo di confidenza al 95% per la media m di una popolazione è 20.5 <μ< 22.25:
Stima e distribuzione dei parametri
a Non potrà che diminuire
b Non potrà che aumentare
c Rimarrà la stessa
d Non è determinabile perché non si dispone di tutti i dati del problema
5 Nel modello di regressione, l'indice di determinazione:
Le ipotesi del modello
a E' pari al rapporto tra devianza residua e devianza totale
b E' pari al rapporto tra devianza di regressione e devianza totale
c Un valore dell'indice di determinazione pari a 0,5 implica che i punti sono allineati sulla retta
di regressione
d E' pari al rapporto tra devianza totale e devianza di regressione
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f

Anteprima parziale del testo

Scarica Esame statistica unimercatorum e più Prove d'esame in PDF di Statistica solo su Docsity!

1 Nel modello di regressione lineare semplice ⓴ : Le ipotesi del modello a Rappresenta la componente deterministica della retta di regressione b Rappresenta la derivata prima della componente deterministica rispetto a x c Rappresenta il valore della componente deterministica quando x è uguale a zero d Indica di quanto aumenta la componente deterministica se x aumenta di una unità 2 Nel modello di regressione lineare Y = a + bX: Le ipotesi del modello a Y è una variabile casuale b Y è una variabile deterministica c X è una variabile casuale d X e Y sono variabili casuali 3 Lo stimatore: Stima e distribuzione dei parametri a E' esattamente uguale al valore vero del parametro della popolazione b E' così definita la statistica calcolata sui dati del campione c Differisce dal valore vero del parametro della popolazione per effetto del puro caso d Rispetta sempre la proprietà della correttezza 4 L'intervallo di confidenza al 95% per la media m di una popolazione è 20.5 <μ< 22.25: Stima e distribuzione dei parametri a Non potrà che diminuire b Non potrà che aumentare c Rimarrà la stessa d Non è determinabile perché non si dispone di tutti i dati del problema 5 Nel modello di regressione, l'indice di determinazione: Le ipotesi del modello a E' pari al rapporto tra devianza residua e devianza totale b E' pari al rapporto tra devianza di regressione e devianza totale c Un valore dell'indice di determinazione pari a 0,5 implica che i punti sono allineati sulla retta di regressione d E' pari al rapporto tra devianza totale e devianza di regressione

6 Nella specificazione del modello di regressione lineare: Le ipotesi del modello a La varianza degli errori è eteroschedastica b Le distribuzioni degli errori non sono centrate sulla media c Le ipotesi di normalità della componente di disturbo sono necessarie per l'analisi inferenziale d Gli errori sono correlati 7 Nel modello di regressione lineare: Stima e distribuzione dei parametri a La variabile casuale Y ha lo stesso valore atteso del predittore b Il predittore ha lo scopo di “stimare” il valore di un parametro c La varianza dell'errore di stima è più grande della varianza dell'errore di previsione d La varianza dei dati campionari è uno stimatore corretto della varianza della popolazione 8 Lo stimatore: Stima e distribuzione dei parametri a E' esattamente uguale al valore vero del parametro della popolazione b E' così definita la statistica calcolata sui dati del campione c Differisce dal valore vero del parametro della popolazione per effetto del puro caso d Rispetta sempre la proprietà della correttezza 9 Sia data la popolazione P = {3,6,9}. a) Calcolate la media μ e la varianza σ^2 della popolazione P: Stima e distribuzione dei parametri a μ = 6 e varianza = 36 b μ = 3 e varianza = 6 c μ = 6 e varianza = 5 d μ = 6 e varianza = 6 10 Data la retta di regressione Y = a + bX, calcolare la media di Y sapendo che X ha media μ e scostamento quadratico medio σ: Stima e distribuzione dei parametri a La media di Y è pari ad a + bμ b La media di Y è pari a bμ c La media di Y è pari ad a + μ

4 Nel modello di regressione lineare multipla: Introduzione al modello c Si assume che esso sia linearizzabile nei parametri d La normalità del termine di errore non implica la normalità̀ degli stimatori dei minimi quadrati dei coefficienti di regressione 5 Quale delle seguenti affermazioni non è corretta: Ipotesi e stima dei parametri a Il valore atteso della variabile dipendente è uguale alla componente deterministica b La variabile dipendente y è una combinazione lineare di una parte deterministica e di una componente stocastica costituita dall'errore c La costante del modello di regressione misura il valore atteso della variabile dipendente quando almeno una delle variabili esplicative è pari a zero d ⓵ misura la variazione di E(yi) dovuta ad una variazione unitaria di x 6 I minimi quadrati ordinari: Ipotesi e stima dei parametri a La normalità del termine di errore non implica la normalità̀ degli stimatori dei minimi quadrati dei coefficienti di regressione b Gli stimatori di massima verosimiglianza per i coefficienti di regressione non sono gli stessi dei minimi quadrati ordinari c La varianza corretta degli stimatori dei minimi quadrati ordinari è una quantità fondamentale per l’inferenza sui coefficienti di regressione d X non è una matrice deterministica di rango pieno 7 Quale delle seguenti affermazioni non è corretta: Ipotesi e stima dei parametri a b è̀ uno stimatore corretto di β , ossia E(b) = β b Nella classe degli stimatori corretti di βj (per j=0,1,...,k) che sono funzioni lineari delle Yi , gli stimatori dei minimi quadrati ordinari sono i più efficienti, cioè sono quelli che hanno minima varianza per qualsiasi valore dei parametri c La varianza di bj è omoschedastica d Nel modello di regressione si assume che le osservazioni della variabile risposta siano correlate 8 In un test di ipotesi quale delle seguenti affermazioni è vera: Test a Si accetta l'ipotesi alternativa se il valore della statistica empirica è maggiore del corrispondente percentile della normale b Si accetta l'ipotesi alternativa se il valore della statistica empirica è maggiore del corrispondente percentile della t di student c Un test statistico è una regola per discriminare i campioni che, se osservati, portano al rifiuto o all'accettazione dell'ipotesi nulla

9 Quale delle seguenti affermazioni è corretta nell'ipotesi di un modello di regressione lineare: Ipotesi e stima dei parametri a Gli errori sono eteroschedastici b Gli errori devono avere media nulla e raggrupparsi in cluster sotto e sopra la media c La presenza del termine di errore è dovuta al fatto che la relazione tra la variabile dipendente e indipendente potrebbe non essere lineare d Il residuo i-esimo è la determinazione di una variabile casuale con media nulla e con varianza che indipendente da i 10 Quale delle seguenti affermazioni non è corretta nell'ipotesi di un modello di regressione lineare: Ipotesi e stima dei parametri a Gli errori hanno media nulla b La presenza del termine di errore è dovuta alla possibilità di commettere degli errori di rilevazione c La presenza del termine di errore è dovuta fatto che i dati osservati sono tratti da un campione d Gli errori possono distribuirsi non normalmente Nel modello di regressione semplice, se il coefficiente di correlazione è pari a -0.829: Coefficiente di determinazione a Il coefficiente di determinazione è pari a 0, b Il prodotto dei due coefficienti di regressioni, rispettivamente della regressione di Y su X e della regressione di X su Y, è pari a -0, c Il modello di regressione non riesce a descrivere bene i dati campionari osservati d La radice quadrata del prodotto dei due coefficienti di regressioni, rispettivamente della regressione di Y su X e della regressione di X su Y, è pari a 0, 2 Nel modello di regressione lineare semplice: Coefficiente di determinazione a Se ⓵ è uguale a zero, R^2 è diverso da zero b Il segno del coefficiente di correlazione è uguale al segno del coefficiente di regressione c Se le due variabili X e Y sono incorrelate allora sono anche indipendenti d Il coefficiente di determinazione è uguale al coefficiente di correlazione 3 In un modello di regressione lineare multipla: Significatività del modello a Per studiare la bontà del modello si utilizza l'indice di determinazione R^ b L'inserimento di una variabile esplicativa ulteriore non incrementa il valore della devianza di regressione c E' indifferente utilizzare l'indice di determinazione R^2 o l'indice di determinazione corretto per studiare la bontà del modello

8 L'esistenza di una correlazione fra le variabili indipendenti di un modello di regressione: Problemi da affrontare a Non inficia la robustezza delle stime b Le stime dei minimi quadrati ordinari sono distorte c Si riduce la capacità previsiva del modello d Le stime sono comunque sempre significative in presenza di un coefficiente di determinazione elevato 9 Quale delle seguenti affermazioni non è corretta: Problemi da affrontare a In presenza di multicollinearità le varianze e gli standard error delle stime aumentano b Eventuali cambiamenti nella specificazione del modello modificano anche sensibilmente le stime dei parametri c La multicollinearità si distingue in due tipologie: la quasi multicollinearità multicollinearità perfetta d Quando il fattore di accrescimento della varianza ovvero il VIF è maggiore di uno siamo in presenza di un'alta multicollinearità 10 Esistono alcuni modi per individuare il caso di multicollinearità nei dati: Problemi da affrontare a (^) Se esistono dei valori della correlazione prossimi a ۰, la multicollinearità è sospetta b Si possono stimare regressioni tra ogni covariata e le altre covariate. Se una di queste regressioni presenta un coefficiente di determinazione maggiore di 0.5, allora la covariata considerata come variabile dipendente sarà causa di multicollinearità c Quando le statistiche test t e il test F danno risultati contraddittori d Se il coefficiente di correlazione assume valore pari a 0. 1 Quale delle seguenti affermazioni non è corretta nell'ipotesi di un modello di regressione lineare: Introduzione a Gli errori hanno media nulla b La presenza del termine di errore è dovuta alla possibilità di commettere degli errori di rilevazione c La presenza del termine di errore è dovuta fatto che i dati osservati sono tratti da un campione d Gli errori possono distribuirsi non normalmente 2 Quale delle seguenti affermazioni è corretta nell'ipotesi di un modello di regressione lineare: Introduzione a Gli errori sono eteroschedastici b Gli errori devono avere media nulla e raggrupparsi in cluster sotto e sopra la media c La presenza del termine di errore è dovuta al fatto che la relazione tra la variabile dipendente e indipendente potrebbe non essere lineare d Il residuo i-esimo è la determinazione di una variabile casuale con media nulla e con varianza

2 Quale delle seguenti affermazioni è corretta nell'ipotesi di un modello di regressione lineare: Introduzione che indipendente da i 3 Nella verifica delle ipotesi fondamentali alla base del modello di regressione lineare: Introduzione a Se l'assunzione sull'incorrelazione dei residui non è soddisfata, il metodo dei minimi quadrati ordinari è sempre applicabile b Se l'assunzione sull'omoschedasticità dei residui non è soddisfata, il metodo dei minimi quadrati ordinari conduce sempre a risultati non distorti c Il primo passo consiste nell'analisi grafica dei residui d Se l'ipotesi di normalità dei residui non è soddisfatta, l'assunzione di linearità del modello non è valida 4 Nell'analisi dei residui: Grafici dei residui a In presenza di autocorrelazione positiva degli errori, i residui si dispongono in modo casuale intorno alla media b In presenza di mal specificazione del modello i residui si dispongono in maniera casuale intorno all'asse delle ascisse c In presenza di omoschedasticità, il modello di regressione non ha intercetta e i residui hanno media non nulla d In presenza di cambiamento strutturale nella relazione tra variabile dipendente e variabili esplicative, i residui risultano clusterizzati 5 Nell'analisi dei residui in un modello di regressione lineare: Grafici dei residui a In presenza di mal specificazione del modello si è in presenza di eteroschedasticità b In presenza di mal specificazione del modello il modello di regressione non ha intercetta e i residui hanno media nulla c In presenza omissione di una variabile esplicativa, il modello di regressione non ha intercetta e i residui hanno media non nulla d In presenza di mal specificazione del modello, i residui tendono a disporsi lungo una parabola 6 Nel modello di regressione lineare: Casi particolari a Se vale l'assunzione di eteroschedasticità, i residui si dispongono vicino alla retta di regressione b Se la relazione tra la variabile dipendente e indipendente è lineare, i residui tendono a mostrano anch'essi una tendenza lineare c Le assunzioni alla base della distribuzione dei residui si basano sul teorema centrale del limite d I residui spiegano parte del legame (tra la variabile dipendente e le variabili esplicative) che non è stato catturato e spiegato dal modello

1 Quale delle seguenti affermazioni non è corretta nell'ipotesi di un modello di regressione lineare: Introduzione c La presenza del termine di errore è dovuta fatto che i dati osservati sono tratti da un campione d Gli errori possono distribuirsi non normalmente 2 Quale delle seguenti affermazioni è corretta nell'ipotesi di un modello di regressione lineare: Introduzione a Gli errori sono eteroschedastici b Gli errori devono avere media nulla e raggrupparsi in cluster sotto e sopra la media c La presenza del termine di errore è dovuta al fatto che la relazione tra la variabile dipendente e indipendente potrebbe non essere lineare d Il residuo i-esimo è la determinazione di una variabile casuale con media nulla e con varianza che indipendente da i 3 Nella verifica delle ipotesi fondamentali alla base del modello di regressione lineare: Introduzione a Se l'assunzione sull'incorrelazione dei residui non è soddisfata, il metodo dei minimi quadrati ordinari è sempre applicabile b Se l'assunzione sull'omoschedasticità dei residui non è soddisfata, il metodo dei minimi quadrati ordinari conduce sempre a risultati non distorti c Il primo passo consiste nell'analisi grafica dei residui d Se l'ipotesi di normalità dei residui non è soddisfatta, l'assunzione di linearità del modello non è valida 4 Nell'analisi dei residui: Grafici dei residui a In presenza di autocorrelazione positiva degli errori, i residui si dispongono in modo casuale intorno alla media b In presenza di mal specificazione del modello i residui si dispongono in maniera casuale intorno all'asse delle ascisse c In presenza di omoschedasticità, il modello di regressione non ha intercetta e i residui hanno media non nulla d In presenza di cambiamento strutturale nella relazione tra variabile dipendente e variabili esplicative, i residui risultano clusterizzati 5 Nell'analisi dei residui in un modello di regressione lineare: Grafici dei residui a In presenza di mal specificazione del modello si è in presenza di eteroschedasticità b In presenza di mal specificazione del modello il modello di regressione non ha intercetta e i residui hanno media nulla c In presenza omissione di una variabile esplicativa, il modello di regressione non ha intercetta e

5 Nell'analisi dei residui in un modello di regressione lineare: Grafici dei residui i residui hanno media non nulla d In presenza di mal specificazione del modello, i residui tendono a disporsi lungo una parabola 6 Nel modello di regressione lineare: Casi particolari a Se vale l'assunzione di eteroschedasticità, i residui si dispongono vicino alla retta di regressione b Se la relazione tra la variabile dipendente e indipendente è lineare, i residui tendono a mostrano anch'essi una tendenza lineare c Le assunzioni alla base della distribuzione dei residui si basano sul teorema centrale del limite d I residui spiegano parte del legame (tra la variabile dipendente e le variabili esplicative) che non è stato catturato e spiegato dal modello 7 Utilizzando un diagramma a dispersione tipo scatterplot: Grafici dei residui a Il coefficiente di correlazione dei residui deve essere positivo b Il coefficiente di correlazione dei residui deve essere vicino a zero c Il coefficiente di correlazione dei residui deve essere pari a zero d Il coefficiente di correlazione dei residui non può essere calcolato se la relazione tra tra le variabili del modello di regressione è di tipo non lineare 8 Quando le relazioni non sono lineari occorre utilizzare una forma funzionale appropriata: Grafici dei residui a E' preferibile utilizzare una forma funzionale quadratica b E' preferibile utilizzare una forma funzionale esponenziale c E' preferibile utilizzare una forma funzionale sempre linearizzabile nei parametri d Si deve utilizzare la forma funzionale che meglio si adatta ai dati 9 Nel modello identificato dall'equazione logY = a +bX + u: Violazione dell'ipotesi di linearità a La regressione è condotta sulla variabile risposta b La regressione è condotta su una trasformata della variabile risposta a causa della relazione di non linearità tra le variabili X e Y c La regressione è condotta su una trasformata della variabile risposta a causa della non linearità dei parametri d La regressione è condotta su una trasformata della variabile risposta a causa dell'ipotesi di non linearità degli errori e per stabilizzare la varianza degli stessi

4 I residui studentizzati: Omoschedasticità c Si distribuiscono normalmente per qualunque valore della numerosità campionaria d Se il diagramma di dispersione da luogo a una nuvola di punti che non presenta particolari strutture l'ipotesi di eteroschedasticità è confermata 5 In caso di multicollinearità: Rango pieno a Il Vif presenta valori superiori ad 1 e inferiori a 2 b L'indice R^2 presenta valori pari a 0. c (^) Se i valori della correlazione sono prossimi a ۪.7, la multicollinearità è sospetta d In caso di quasi multicollinearità non è possible calcolare il vettore b dei parametri 6 Quale delle seguenti affermazioni non è vera: Rango pieno a La multicollinearità può essere risolta aumentando la numerosità campionaria b La multicollinearità può essere risolta aumentando il numero delle variabili esplicative c In presenza di multicollinearità si ha una perdita di precisione delle stime dei parametri d La violazione dell'ipotesi di rango pieno della matrice X è più grave della presenza di eteroschedasticità 7 L'analisi grafica dei residui di un modello di regressione non consente di: Omoschedasticità a Verificare l'ipotesi di linearità b Verificare l'ipotesi di omoschedasticità c Verificare l'ipotesi di rango pieno della matrice X d Selezionare le variabili affette da multicollinearità 8 Il metodo dei minimi quadrati pesati: Omoschedasticità a Si utilizza al posto della trasformazione logaritmitica della variabile risposta per risolvere il problema dell'eteroschedasticità b Assegnare dei pesi non equivale a operare una trasformazione di variabili c Si utilizza quando le comuni trasformazioni di variabili non risolvono il problema dell'eteroschedasticità d E' utilizzato per risolvere il problema della violazione dell'ipotesi di incorrelazione degli errori 9 Una variabile dummy con quattro modalità: Variabili qualitative a E' un esempio di variabile politomica

9 Una variabile dummy con quattro modalità: Variabili qualitative b E' un esempio di variabile dicotomica c Se utilizzata in un modello di regressione non crea problemi di collinearità d E' una variabile di tipo misto ossia quali-quantitativa 10 Supponiamo di utilizzare una variabile dummy con quattro modalità (1= licenza media; 2=scuola superiore; 3= laurea; 4=post-laurea): Variabili qualitative a La trappola delle variabili dummy crea problemi di multicollinearità, essendo le modalità della variabile legate tra loro dalla relazione: D1+D2+D3+D4 = b Se D1+D2+D3=0 implica che una persona ha conseguto il titolo di laurea c Il relativo modello di regressione denominato base è tale che D1+D2+D3+D4= d Le rette di regressione dei 3 modelli di regressione che posso complessivamente costruire sono tra loro parallele 1 Nel modello di regressione lineare semplice Y0: Errore di previsione a Rappresenta la componente deterministica della retta di regressione b Il valore atteso della previsione puntuale di Y c Rappresenta il valore della componente deterministica quando l'intercetta è uguale a zero d Il valore vero della previsione puntuale di Y 2 L'errore di previsione: Errore di previsione a Presenta varianza costante b Presenta distribuzione t-student con media nulla c La sua varianza dipende dalla variabilità dei parametri d Y0 è la migliore previsione corretta a varianza minima 3 La varianza dell'errore di previsione: Errore di previsione a La varianza della componente a è dipendente dalla varianza dell'errore associato a ogni osservazione b La varianza della componente b è indipendente dalla varianza dell'errore associato a ogni osservazione c Dipende dalla covarianza tra le due variabili X e Y d Aumenta all'aumentare della numerosità campionaria

9 Per stimare correttamente l'errore di previsione, quale delle seguenti affermazioni non è corretta: Sintesi a La relazione tra le variabile dipendente e le variabili esplicative deve essere lineare b Gli errori associati a ogni osservazione sono assunti normali ed indipendentemente distribuiti, con media 0 e varianza costante c La matrice dei dati deve avere rango pieno d La matrice dei dati può non essere invertibile 10 Quale delle seguenti affermazioni non è corretta, nella stima dell'errore di previsione in un modello di regressione lineare: Ancora sull'errore di previsione a Gli errori hanno media nulla b La presenza del termine di errore è dovuta alla possibilità di commettere degli errori di rilevazione c La presenza del termine di errore è dovuta fatto che i dati osservati sono tratti da un campione d Gli errori possono distribuirsi non normalmente 1 Nel modello di regressione lineare semplice Y0: Errore di previsione a Rappresenta la componente deterministica della retta di regressione b Il valore atteso della previsione puntuale di Y c Rappresenta il valore della componente deterministica quando l'intercetta è uguale a zero d Il valore vero della previsione puntuale di Y 2 L'errore di previsione: Errore di previsione a Presenta varianza costante b Presenta distribuzione t-student con media nulla c La sua varianza dipende dalla variabilità dei parametri d Y0 è la migliore previsione corretta a varianza minima 3 La varianza dell'errore di previsione: Errore di previsione a La varianza della componente a è dipendente dalla varianza dell'errore associato a ogni osservazione b La varianza della componente b è indipendente dalla varianza dell'errore associato a ogni osservazione c Dipende dalla covarianza tra le due variabili X e Y d Aumenta all'aumentare della numerosità campionaria

4 La varianza dell'errore di previsione: Ancora sull'errore di previsione a Aumenta con il diminuire dei residui campionari b Aumenta al diminuire della numerosità campionaria c Diminuisce con l'aumentare della distanza dalla media di X d Non si può calcolare se non si conosce la varianza del termine di errore associato ad ogni osservazione 5 L'errore di previsione: Ancora sull'errore di previsione a Si distribuisce sempre come una normale standardizzata b Si distribuisce sempre come una t-student c Si distribuisce come una t-student per piccoli campioni d Si distribuisce come una t-student quando si procede ad una stima della varianza del termine di errore associato ad ogni osservazione 6 Nel modello di regressione lineare: Errore di previsione a La variabile casuale Y ha lo stesso valore atteso del predittore b Il predittore ha lo scopo di “stimare” il valore di un parametro c La varianza dell'errore di stima è più grande della varianza dell'errore di previsione d La varianza dei dati campionari è uno stimatore corretto della varianza della popolazione 7 Per determinare l'intervallo di confidenza intorno all'errore previsto, occorre prima di tutto: Ancora sull'errore di previsione a Conoscere lo scostamento quadratico medio dell'errore di previsione b Conoscere la varianza del termine di errore associato ad ogni osservazione c Determinare la distribuzione dell'errore di previsione d Stabilire il livello di significatività della distribuzione normale 8 Nel modello di regressione multiplo: Sintesi a L'errore di previsione presenta media costante b La varianza dell'errore di previsione è costante c La varianza dell'errore di previsione è sempre calcolabile d Una volta che il modello di regressione è stato stimato, può essere impiegato anche per prevedere il valore della variabile risposta in relazione ad un certo insieme di valori delle variabili esplicative

3 In quale dei seguenti esempi non è consigliabile utilizzare un modello di probabilità lineare: Modello di probabilità lineare d Analisi della relazione tra consumi e reddito 4 Quale delle seguenti affermazioni non è corretta, utilizzando un modello di probabilità lineare: Modello di probabilità lineare a La relazione tra probabilità e variabili esplicative è lineare b Le assunzioni di normalità dei residui sono violate c L'eteroschedasticità presente può essere risolta introducendo i minimi quadrati pesati d Il modello non è efficiente se si utilizzano i minimi quadrati ordinari 5 In un modello logit: Modello logit a La forma della curva è a S b La forma della curva è di tipo lineare c Il valore atteso della variabile risposta non è una probabilità d La funzione di ripartizione è quella di una normale standardizzata 6 Nel confronto tra un modello logit e un modello probit: Modello logit a La funzione di ripartizione dei due modelli è la stessa per entrambi i modelli ed è la funzione logistica b I due modelli non forniscono stime simili nell'intervallo [0,1] c Si preferisce il modello logit al modello probit per una semplicità nei calcoli d La probabilità associta agli eventi estremi è maggiore nel modello probit che nel logit 7 Nel modello logit, quale delle seguenti affermazioni non è corretta: Modello logit a Mentre π (x) è funzione non lineare delle variabili esplicative, il logaritmo dell’odds, detto logit, è funzione lineare delle stesse b Se operiamo una trasformazione lineare dei parametri, possiamo utilizzare come stima dei parametri i minimi quadrati generalizzati c Si esplicita una funzione di probabilità congiunta di regressori e variabile dipendente d L'interpretazione dei coefficienti è la stessa di un modello di regressione lineare 8 L'odds ratio OR: Odds e Odds ratio a Se Xj è una variabile dicotomica: OR(j) misura la variazione di propensione al successo derivante da un incremento unitario della variabile Xj b Se Xj è una variabile continua: OR(j) misura la variazione di propensione al successo

8 L'odds ratio OR: Odds e Odds ratio derivante dal possesso dell'attributo c A una variazione unitaria della variabile Xj corrisponde un OR pari all'esponenziale del relativo parametro d E' il rapporto tra la probabilità di un evento (“successo”) e quella dell'evento complementare (“insuccesso”) 9 Nell'interpretare i risultati di un modello logit, tramite gli odds ratio (OR): Odds e Odds ratio a Se OR(j) = 1 e quindi βj = 0 ciò implica che diminuisce la proporzione tra successi e insuccessi b Se 0 < OR(j) < 1 e quindi βj < 0 non cambia la proporzione tra successi e insuccessi c OR misura l'incremento di propensione al successo: quanto varia la proporzione tra successi e insuccessi d Se OR(j) = 1 e βj >0 aumenta la proporzione tra successi e insuccessi 10 In un modello logit, il parametro: Odds e Odds ratio a Per β>0, P(y=1) aumenta se x aumenta b Per β<0, P(y=1) diminuisce se x aumenta c Se β=0, P(y=1) non varia se x varia, ovvero la curva si appiattisce a una retta orizzontale d Se β=0, P(y=1) non varia se x non varia, ovvero la curva si appiattisce a una retta orizzontale 1 L'effetto marginale: Effetti marginali a E' l'effetto che produce una variazione unitaria della variabile esplicativa sugli odds b E' l'effetto che produce una variazione unitaria della variabile esplicativa sulla probabilità c Il suo effetto massimo si raggiunge per P = d Non può essere calcolato in presenza di più variabili esplicative 2 La probabilità di successo: Effetti marginali a E' pari al valore della funzione di ripartizione di una variabile casuale normale in corrispondenza dei valori X2, …, Xk b E' la funzione lineare nei parametri che lega la probabilità di successo alle sue variabili esplicative c Corrisponde all funzione di trasformazione logit