























































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Domande e risposte dell’esame di statistica
Tipologia: Prove d'esame
1 / 63
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!
























































1 Nel modello di regressione lineare semplice ⓴ : Le ipotesi del modello a Rappresenta la componente deterministica della retta di regressione b Rappresenta la derivata prima della componente deterministica rispetto a x c Rappresenta il valore della componente deterministica quando x è uguale a zero d Indica di quanto aumenta la componente deterministica se x aumenta di una unità 2 Nel modello di regressione lineare Y = a + bX: Le ipotesi del modello a Y è una variabile casuale b Y è una variabile deterministica c X è una variabile casuale d X e Y sono variabili casuali 3 Lo stimatore: Stima e distribuzione dei parametri a E' esattamente uguale al valore vero del parametro della popolazione b E' così definita la statistica calcolata sui dati del campione c Differisce dal valore vero del parametro della popolazione per effetto del puro caso d Rispetta sempre la proprietà della correttezza 4 L'intervallo di confidenza al 95% per la media m di una popolazione è 20.5 <μ< 22.25: Stima e distribuzione dei parametri a Non potrà che diminuire b Non potrà che aumentare c Rimarrà la stessa d Non è determinabile perché non si dispone di tutti i dati del problema 5 Nel modello di regressione, l'indice di determinazione: Le ipotesi del modello a E' pari al rapporto tra devianza residua e devianza totale b E' pari al rapporto tra devianza di regressione e devianza totale c Un valore dell'indice di determinazione pari a 0,5 implica che i punti sono allineati sulla retta di regressione d E' pari al rapporto tra devianza totale e devianza di regressione
6 Nella specificazione del modello di regressione lineare: Le ipotesi del modello a La varianza degli errori è eteroschedastica b Le distribuzioni degli errori non sono centrate sulla media c Le ipotesi di normalità della componente di disturbo sono necessarie per l'analisi inferenziale d Gli errori sono correlati 7 Nel modello di regressione lineare: Stima e distribuzione dei parametri a La variabile casuale Y ha lo stesso valore atteso del predittore b Il predittore ha lo scopo di “stimare” il valore di un parametro c La varianza dell'errore di stima è più grande della varianza dell'errore di previsione d La varianza dei dati campionari è uno stimatore corretto della varianza della popolazione 8 Lo stimatore: Stima e distribuzione dei parametri a E' esattamente uguale al valore vero del parametro della popolazione b E' così definita la statistica calcolata sui dati del campione c Differisce dal valore vero del parametro della popolazione per effetto del puro caso d Rispetta sempre la proprietà della correttezza 9 Sia data la popolazione P = {3,6,9}. a) Calcolate la media μ e la varianza σ^2 della popolazione P: Stima e distribuzione dei parametri a μ = 6 e varianza = 36 b μ = 3 e varianza = 6 c μ = 6 e varianza = 5 d μ = 6 e varianza = 6 10 Data la retta di regressione Y = a + bX, calcolare la media di Y sapendo che X ha media μ e scostamento quadratico medio σ: Stima e distribuzione dei parametri a La media di Y è pari ad a + bμ b La media di Y è pari a bμ c La media di Y è pari ad a + μ
4 Nel modello di regressione lineare multipla: Introduzione al modello c Si assume che esso sia linearizzabile nei parametri d La normalità del termine di errore non implica la normalità̀ degli stimatori dei minimi quadrati dei coefficienti di regressione 5 Quale delle seguenti affermazioni non è corretta: Ipotesi e stima dei parametri a Il valore atteso della variabile dipendente è uguale alla componente deterministica b La variabile dipendente y è una combinazione lineare di una parte deterministica e di una componente stocastica costituita dall'errore c La costante del modello di regressione misura il valore atteso della variabile dipendente quando almeno una delle variabili esplicative è pari a zero d ⓵ misura la variazione di E(yi) dovuta ad una variazione unitaria di x 6 I minimi quadrati ordinari: Ipotesi e stima dei parametri a La normalità del termine di errore non implica la normalità̀ degli stimatori dei minimi quadrati dei coefficienti di regressione b Gli stimatori di massima verosimiglianza per i coefficienti di regressione non sono gli stessi dei minimi quadrati ordinari c La varianza corretta degli stimatori dei minimi quadrati ordinari è una quantità fondamentale per l’inferenza sui coefficienti di regressione d X non è una matrice deterministica di rango pieno 7 Quale delle seguenti affermazioni non è corretta: Ipotesi e stima dei parametri a b è̀ uno stimatore corretto di β , ossia E(b) = β b Nella classe degli stimatori corretti di βj (per j=0,1,...,k) che sono funzioni lineari delle Yi , gli stimatori dei minimi quadrati ordinari sono i più efficienti, cioè sono quelli che hanno minima varianza per qualsiasi valore dei parametri c La varianza di bj è omoschedastica d Nel modello di regressione si assume che le osservazioni della variabile risposta siano correlate 8 In un test di ipotesi quale delle seguenti affermazioni è vera: Test a Si accetta l'ipotesi alternativa se il valore della statistica empirica è maggiore del corrispondente percentile della normale b Si accetta l'ipotesi alternativa se il valore della statistica empirica è maggiore del corrispondente percentile della t di student c Un test statistico è una regola per discriminare i campioni che, se osservati, portano al rifiuto o all'accettazione dell'ipotesi nulla
9 Quale delle seguenti affermazioni è corretta nell'ipotesi di un modello di regressione lineare: Ipotesi e stima dei parametri a Gli errori sono eteroschedastici b Gli errori devono avere media nulla e raggrupparsi in cluster sotto e sopra la media c La presenza del termine di errore è dovuta al fatto che la relazione tra la variabile dipendente e indipendente potrebbe non essere lineare d Il residuo i-esimo è la determinazione di una variabile casuale con media nulla e con varianza che indipendente da i 10 Quale delle seguenti affermazioni non è corretta nell'ipotesi di un modello di regressione lineare: Ipotesi e stima dei parametri a Gli errori hanno media nulla b La presenza del termine di errore è dovuta alla possibilità di commettere degli errori di rilevazione c La presenza del termine di errore è dovuta fatto che i dati osservati sono tratti da un campione d Gli errori possono distribuirsi non normalmente Nel modello di regressione semplice, se il coefficiente di correlazione è pari a -0.829: Coefficiente di determinazione a Il coefficiente di determinazione è pari a 0, b Il prodotto dei due coefficienti di regressioni, rispettivamente della regressione di Y su X e della regressione di X su Y, è pari a -0, c Il modello di regressione non riesce a descrivere bene i dati campionari osservati d La radice quadrata del prodotto dei due coefficienti di regressioni, rispettivamente della regressione di Y su X e della regressione di X su Y, è pari a 0, 2 Nel modello di regressione lineare semplice: Coefficiente di determinazione a Se ⓵ è uguale a zero, R^2 è diverso da zero b Il segno del coefficiente di correlazione è uguale al segno del coefficiente di regressione c Se le due variabili X e Y sono incorrelate allora sono anche indipendenti d Il coefficiente di determinazione è uguale al coefficiente di correlazione 3 In un modello di regressione lineare multipla: Significatività del modello a Per studiare la bontà del modello si utilizza l'indice di determinazione R^ b L'inserimento di una variabile esplicativa ulteriore non incrementa il valore della devianza di regressione c E' indifferente utilizzare l'indice di determinazione R^2 o l'indice di determinazione corretto per studiare la bontà del modello
8 L'esistenza di una correlazione fra le variabili indipendenti di un modello di regressione: Problemi da affrontare a Non inficia la robustezza delle stime b Le stime dei minimi quadrati ordinari sono distorte c Si riduce la capacità previsiva del modello d Le stime sono comunque sempre significative in presenza di un coefficiente di determinazione elevato 9 Quale delle seguenti affermazioni non è corretta: Problemi da affrontare a In presenza di multicollinearità le varianze e gli standard error delle stime aumentano b Eventuali cambiamenti nella specificazione del modello modificano anche sensibilmente le stime dei parametri c La multicollinearità si distingue in due tipologie: la quasi multicollinearità multicollinearità perfetta d Quando il fattore di accrescimento della varianza ovvero il VIF è maggiore di uno siamo in presenza di un'alta multicollinearità 10 Esistono alcuni modi per individuare il caso di multicollinearità nei dati: Problemi da affrontare a (^) Se esistono dei valori della correlazione prossimi a ۰, la multicollinearità è sospetta b Si possono stimare regressioni tra ogni covariata e le altre covariate. Se una di queste regressioni presenta un coefficiente di determinazione maggiore di 0.5, allora la covariata considerata come variabile dipendente sarà causa di multicollinearità c Quando le statistiche test t e il test F danno risultati contraddittori d Se il coefficiente di correlazione assume valore pari a 0. 1 Quale delle seguenti affermazioni non è corretta nell'ipotesi di un modello di regressione lineare: Introduzione a Gli errori hanno media nulla b La presenza del termine di errore è dovuta alla possibilità di commettere degli errori di rilevazione c La presenza del termine di errore è dovuta fatto che i dati osservati sono tratti da un campione d Gli errori possono distribuirsi non normalmente 2 Quale delle seguenti affermazioni è corretta nell'ipotesi di un modello di regressione lineare: Introduzione a Gli errori sono eteroschedastici b Gli errori devono avere media nulla e raggrupparsi in cluster sotto e sopra la media c La presenza del termine di errore è dovuta al fatto che la relazione tra la variabile dipendente e indipendente potrebbe non essere lineare d Il residuo i-esimo è la determinazione di una variabile casuale con media nulla e con varianza
2 Quale delle seguenti affermazioni è corretta nell'ipotesi di un modello di regressione lineare: Introduzione che indipendente da i 3 Nella verifica delle ipotesi fondamentali alla base del modello di regressione lineare: Introduzione a Se l'assunzione sull'incorrelazione dei residui non è soddisfata, il metodo dei minimi quadrati ordinari è sempre applicabile b Se l'assunzione sull'omoschedasticità dei residui non è soddisfata, il metodo dei minimi quadrati ordinari conduce sempre a risultati non distorti c Il primo passo consiste nell'analisi grafica dei residui d Se l'ipotesi di normalità dei residui non è soddisfatta, l'assunzione di linearità del modello non è valida 4 Nell'analisi dei residui: Grafici dei residui a In presenza di autocorrelazione positiva degli errori, i residui si dispongono in modo casuale intorno alla media b In presenza di mal specificazione del modello i residui si dispongono in maniera casuale intorno all'asse delle ascisse c In presenza di omoschedasticità, il modello di regressione non ha intercetta e i residui hanno media non nulla d In presenza di cambiamento strutturale nella relazione tra variabile dipendente e variabili esplicative, i residui risultano clusterizzati 5 Nell'analisi dei residui in un modello di regressione lineare: Grafici dei residui a In presenza di mal specificazione del modello si è in presenza di eteroschedasticità b In presenza di mal specificazione del modello il modello di regressione non ha intercetta e i residui hanno media nulla c In presenza omissione di una variabile esplicativa, il modello di regressione non ha intercetta e i residui hanno media non nulla d In presenza di mal specificazione del modello, i residui tendono a disporsi lungo una parabola 6 Nel modello di regressione lineare: Casi particolari a Se vale l'assunzione di eteroschedasticità, i residui si dispongono vicino alla retta di regressione b Se la relazione tra la variabile dipendente e indipendente è lineare, i residui tendono a mostrano anch'essi una tendenza lineare c Le assunzioni alla base della distribuzione dei residui si basano sul teorema centrale del limite d I residui spiegano parte del legame (tra la variabile dipendente e le variabili esplicative) che non è stato catturato e spiegato dal modello
1 Quale delle seguenti affermazioni non è corretta nell'ipotesi di un modello di regressione lineare: Introduzione c La presenza del termine di errore è dovuta fatto che i dati osservati sono tratti da un campione d Gli errori possono distribuirsi non normalmente 2 Quale delle seguenti affermazioni è corretta nell'ipotesi di un modello di regressione lineare: Introduzione a Gli errori sono eteroschedastici b Gli errori devono avere media nulla e raggrupparsi in cluster sotto e sopra la media c La presenza del termine di errore è dovuta al fatto che la relazione tra la variabile dipendente e indipendente potrebbe non essere lineare d Il residuo i-esimo è la determinazione di una variabile casuale con media nulla e con varianza che indipendente da i 3 Nella verifica delle ipotesi fondamentali alla base del modello di regressione lineare: Introduzione a Se l'assunzione sull'incorrelazione dei residui non è soddisfata, il metodo dei minimi quadrati ordinari è sempre applicabile b Se l'assunzione sull'omoschedasticità dei residui non è soddisfata, il metodo dei minimi quadrati ordinari conduce sempre a risultati non distorti c Il primo passo consiste nell'analisi grafica dei residui d Se l'ipotesi di normalità dei residui non è soddisfatta, l'assunzione di linearità del modello non è valida 4 Nell'analisi dei residui: Grafici dei residui a In presenza di autocorrelazione positiva degli errori, i residui si dispongono in modo casuale intorno alla media b In presenza di mal specificazione del modello i residui si dispongono in maniera casuale intorno all'asse delle ascisse c In presenza di omoschedasticità, il modello di regressione non ha intercetta e i residui hanno media non nulla d In presenza di cambiamento strutturale nella relazione tra variabile dipendente e variabili esplicative, i residui risultano clusterizzati 5 Nell'analisi dei residui in un modello di regressione lineare: Grafici dei residui a In presenza di mal specificazione del modello si è in presenza di eteroschedasticità b In presenza di mal specificazione del modello il modello di regressione non ha intercetta e i residui hanno media nulla c In presenza omissione di una variabile esplicativa, il modello di regressione non ha intercetta e
5 Nell'analisi dei residui in un modello di regressione lineare: Grafici dei residui i residui hanno media non nulla d In presenza di mal specificazione del modello, i residui tendono a disporsi lungo una parabola 6 Nel modello di regressione lineare: Casi particolari a Se vale l'assunzione di eteroschedasticità, i residui si dispongono vicino alla retta di regressione b Se la relazione tra la variabile dipendente e indipendente è lineare, i residui tendono a mostrano anch'essi una tendenza lineare c Le assunzioni alla base della distribuzione dei residui si basano sul teorema centrale del limite d I residui spiegano parte del legame (tra la variabile dipendente e le variabili esplicative) che non è stato catturato e spiegato dal modello 7 Utilizzando un diagramma a dispersione tipo scatterplot: Grafici dei residui a Il coefficiente di correlazione dei residui deve essere positivo b Il coefficiente di correlazione dei residui deve essere vicino a zero c Il coefficiente di correlazione dei residui deve essere pari a zero d Il coefficiente di correlazione dei residui non può essere calcolato se la relazione tra tra le variabili del modello di regressione è di tipo non lineare 8 Quando le relazioni non sono lineari occorre utilizzare una forma funzionale appropriata: Grafici dei residui a E' preferibile utilizzare una forma funzionale quadratica b E' preferibile utilizzare una forma funzionale esponenziale c E' preferibile utilizzare una forma funzionale sempre linearizzabile nei parametri d Si deve utilizzare la forma funzionale che meglio si adatta ai dati 9 Nel modello identificato dall'equazione logY = a +bX + u: Violazione dell'ipotesi di linearità a La regressione è condotta sulla variabile risposta b La regressione è condotta su una trasformata della variabile risposta a causa della relazione di non linearità tra le variabili X e Y c La regressione è condotta su una trasformata della variabile risposta a causa della non linearità dei parametri d La regressione è condotta su una trasformata della variabile risposta a causa dell'ipotesi di non linearità degli errori e per stabilizzare la varianza degli stessi
4 I residui studentizzati: Omoschedasticità c Si distribuiscono normalmente per qualunque valore della numerosità campionaria d Se il diagramma di dispersione da luogo a una nuvola di punti che non presenta particolari strutture l'ipotesi di eteroschedasticità è confermata 5 In caso di multicollinearità: Rango pieno a Il Vif presenta valori superiori ad 1 e inferiori a 2 b L'indice R^2 presenta valori pari a 0. c (^) Se i valori della correlazione sono prossimi a ۪.7, la multicollinearità è sospetta d In caso di quasi multicollinearità non è possible calcolare il vettore b dei parametri 6 Quale delle seguenti affermazioni non è vera: Rango pieno a La multicollinearità può essere risolta aumentando la numerosità campionaria b La multicollinearità può essere risolta aumentando il numero delle variabili esplicative c In presenza di multicollinearità si ha una perdita di precisione delle stime dei parametri d La violazione dell'ipotesi di rango pieno della matrice X è più grave della presenza di eteroschedasticità 7 L'analisi grafica dei residui di un modello di regressione non consente di: Omoschedasticità a Verificare l'ipotesi di linearità b Verificare l'ipotesi di omoschedasticità c Verificare l'ipotesi di rango pieno della matrice X d Selezionare le variabili affette da multicollinearità 8 Il metodo dei minimi quadrati pesati: Omoschedasticità a Si utilizza al posto della trasformazione logaritmitica della variabile risposta per risolvere il problema dell'eteroschedasticità b Assegnare dei pesi non equivale a operare una trasformazione di variabili c Si utilizza quando le comuni trasformazioni di variabili non risolvono il problema dell'eteroschedasticità d E' utilizzato per risolvere il problema della violazione dell'ipotesi di incorrelazione degli errori 9 Una variabile dummy con quattro modalità: Variabili qualitative a E' un esempio di variabile politomica
9 Una variabile dummy con quattro modalità: Variabili qualitative b E' un esempio di variabile dicotomica c Se utilizzata in un modello di regressione non crea problemi di collinearità d E' una variabile di tipo misto ossia quali-quantitativa 10 Supponiamo di utilizzare una variabile dummy con quattro modalità (1= licenza media; 2=scuola superiore; 3= laurea; 4=post-laurea): Variabili qualitative a La trappola delle variabili dummy crea problemi di multicollinearità, essendo le modalità della variabile legate tra loro dalla relazione: D1+D2+D3+D4 = b Se D1+D2+D3=0 implica che una persona ha conseguto il titolo di laurea c Il relativo modello di regressione denominato base è tale che D1+D2+D3+D4= d Le rette di regressione dei 3 modelli di regressione che posso complessivamente costruire sono tra loro parallele 1 Nel modello di regressione lineare semplice Y0: Errore di previsione a Rappresenta la componente deterministica della retta di regressione b Il valore atteso della previsione puntuale di Y c Rappresenta il valore della componente deterministica quando l'intercetta è uguale a zero d Il valore vero della previsione puntuale di Y 2 L'errore di previsione: Errore di previsione a Presenta varianza costante b Presenta distribuzione t-student con media nulla c La sua varianza dipende dalla variabilità dei parametri d Y0 è la migliore previsione corretta a varianza minima 3 La varianza dell'errore di previsione: Errore di previsione a La varianza della componente a è dipendente dalla varianza dell'errore associato a ogni osservazione b La varianza della componente b è indipendente dalla varianza dell'errore associato a ogni osservazione c Dipende dalla covarianza tra le due variabili X e Y d Aumenta all'aumentare della numerosità campionaria
9 Per stimare correttamente l'errore di previsione, quale delle seguenti affermazioni non è corretta: Sintesi a La relazione tra le variabile dipendente e le variabili esplicative deve essere lineare b Gli errori associati a ogni osservazione sono assunti normali ed indipendentemente distribuiti, con media 0 e varianza costante c La matrice dei dati deve avere rango pieno d La matrice dei dati può non essere invertibile 10 Quale delle seguenti affermazioni non è corretta, nella stima dell'errore di previsione in un modello di regressione lineare: Ancora sull'errore di previsione a Gli errori hanno media nulla b La presenza del termine di errore è dovuta alla possibilità di commettere degli errori di rilevazione c La presenza del termine di errore è dovuta fatto che i dati osservati sono tratti da un campione d Gli errori possono distribuirsi non normalmente 1 Nel modello di regressione lineare semplice Y0: Errore di previsione a Rappresenta la componente deterministica della retta di regressione b Il valore atteso della previsione puntuale di Y c Rappresenta il valore della componente deterministica quando l'intercetta è uguale a zero d Il valore vero della previsione puntuale di Y 2 L'errore di previsione: Errore di previsione a Presenta varianza costante b Presenta distribuzione t-student con media nulla c La sua varianza dipende dalla variabilità dei parametri d Y0 è la migliore previsione corretta a varianza minima 3 La varianza dell'errore di previsione: Errore di previsione a La varianza della componente a è dipendente dalla varianza dell'errore associato a ogni osservazione b La varianza della componente b è indipendente dalla varianza dell'errore associato a ogni osservazione c Dipende dalla covarianza tra le due variabili X e Y d Aumenta all'aumentare della numerosità campionaria
4 La varianza dell'errore di previsione: Ancora sull'errore di previsione a Aumenta con il diminuire dei residui campionari b Aumenta al diminuire della numerosità campionaria c Diminuisce con l'aumentare della distanza dalla media di X d Non si può calcolare se non si conosce la varianza del termine di errore associato ad ogni osservazione 5 L'errore di previsione: Ancora sull'errore di previsione a Si distribuisce sempre come una normale standardizzata b Si distribuisce sempre come una t-student c Si distribuisce come una t-student per piccoli campioni d Si distribuisce come una t-student quando si procede ad una stima della varianza del termine di errore associato ad ogni osservazione 6 Nel modello di regressione lineare: Errore di previsione a La variabile casuale Y ha lo stesso valore atteso del predittore b Il predittore ha lo scopo di “stimare” il valore di un parametro c La varianza dell'errore di stima è più grande della varianza dell'errore di previsione d La varianza dei dati campionari è uno stimatore corretto della varianza della popolazione 7 Per determinare l'intervallo di confidenza intorno all'errore previsto, occorre prima di tutto: Ancora sull'errore di previsione a Conoscere lo scostamento quadratico medio dell'errore di previsione b Conoscere la varianza del termine di errore associato ad ogni osservazione c Determinare la distribuzione dell'errore di previsione d Stabilire il livello di significatività della distribuzione normale 8 Nel modello di regressione multiplo: Sintesi a L'errore di previsione presenta media costante b La varianza dell'errore di previsione è costante c La varianza dell'errore di previsione è sempre calcolabile d Una volta che il modello di regressione è stato stimato, può essere impiegato anche per prevedere il valore della variabile risposta in relazione ad un certo insieme di valori delle variabili esplicative
3 In quale dei seguenti esempi non è consigliabile utilizzare un modello di probabilità lineare: Modello di probabilità lineare d Analisi della relazione tra consumi e reddito 4 Quale delle seguenti affermazioni non è corretta, utilizzando un modello di probabilità lineare: Modello di probabilità lineare a La relazione tra probabilità e variabili esplicative è lineare b Le assunzioni di normalità dei residui sono violate c L'eteroschedasticità presente può essere risolta introducendo i minimi quadrati pesati d Il modello non è efficiente se si utilizzano i minimi quadrati ordinari 5 In un modello logit: Modello logit a La forma della curva è a S b La forma della curva è di tipo lineare c Il valore atteso della variabile risposta non è una probabilità d La funzione di ripartizione è quella di una normale standardizzata 6 Nel confronto tra un modello logit e un modello probit: Modello logit a La funzione di ripartizione dei due modelli è la stessa per entrambi i modelli ed è la funzione logistica b I due modelli non forniscono stime simili nell'intervallo [0,1] c Si preferisce il modello logit al modello probit per una semplicità nei calcoli d La probabilità associta agli eventi estremi è maggiore nel modello probit che nel logit 7 Nel modello logit, quale delle seguenti affermazioni non è corretta: Modello logit a Mentre π (x) è funzione non lineare delle variabili esplicative, il logaritmo dell’odds, detto logit, è funzione lineare delle stesse b Se operiamo una trasformazione lineare dei parametri, possiamo utilizzare come stima dei parametri i minimi quadrati generalizzati c Si esplicita una funzione di probabilità congiunta di regressori e variabile dipendente d L'interpretazione dei coefficienti è la stessa di un modello di regressione lineare 8 L'odds ratio OR: Odds e Odds ratio a Se Xj è una variabile dicotomica: OR(j) misura la variazione di propensione al successo derivante da un incremento unitario della variabile Xj b Se Xj è una variabile continua: OR(j) misura la variazione di propensione al successo
8 L'odds ratio OR: Odds e Odds ratio derivante dal possesso dell'attributo c A una variazione unitaria della variabile Xj corrisponde un OR pari all'esponenziale del relativo parametro d E' il rapporto tra la probabilità di un evento (“successo”) e quella dell'evento complementare (“insuccesso”) 9 Nell'interpretare i risultati di un modello logit, tramite gli odds ratio (OR): Odds e Odds ratio a Se OR(j) = 1 e quindi βj = 0 ciò implica che diminuisce la proporzione tra successi e insuccessi b Se 0 < OR(j) < 1 e quindi βj < 0 non cambia la proporzione tra successi e insuccessi c OR misura l'incremento di propensione al successo: quanto varia la proporzione tra successi e insuccessi d Se OR(j) = 1 e βj >0 aumenta la proporzione tra successi e insuccessi 10 In un modello logit, il parametro: Odds e Odds ratio a Per β>0, P(y=1) aumenta se x aumenta b Per β<0, P(y=1) diminuisce se x aumenta c Se β=0, P(y=1) non varia se x varia, ovvero la curva si appiattisce a una retta orizzontale d Se β=0, P(y=1) non varia se x non varia, ovvero la curva si appiattisce a una retta orizzontale 1 L'effetto marginale: Effetti marginali a E' l'effetto che produce una variazione unitaria della variabile esplicativa sugli odds b E' l'effetto che produce una variazione unitaria della variabile esplicativa sulla probabilità c Il suo effetto massimo si raggiunge per P = d Non può essere calcolato in presenza di più variabili esplicative 2 La probabilità di successo: Effetti marginali a E' pari al valore della funzione di ripartizione di una variabile casuale normale in corrispondenza dei valori X2, …, Xk b E' la funzione lineare nei parametri che lega la probabilità di successo alle sue variabili esplicative c Corrisponde all funzione di trasformazione logit