Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


spss, simulazione statistica, Esercizi di Statistica

Simulazione regressione, t-test e ANOVA. campionamento su spss

Tipologia: Esercizi

2018/2019

Caricato il 15/12/2019

martanovanta7
martanovanta7 🇮🇹

4.5

(4)

8 documenti

1 / 6

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Esercizio 1
1) Modello di Regressione multipla
Si effettua prima una regressione a blocchi. Il modello ottenuto e’ discreto, ma presenta problemi di
significatività e di collinearità.
Riepilogo del modello
Modello R R-quadrato R-quadrato corretto
Deviazione standard
Errore della stima
1 ,624a,390 ,377 10,51649
a. Predittori: (Costante), Reddito familiare, Spesa mensile media, Anni di fedeltà, età, Minuti
mensili medi
Coefficientia
Modello
Coefficienti non standardizzati
Coefficienti
standardizzati
t Sig.
Statistiche di collinearità
B
Deviazione
standard Errore Beta Tolleranza VIF
1 (Costante) 83,162 6,702 12,408 ,000
età ,019 ,068 ,018 ,277 ,782 ,578 1,731
Minuti mensili medi -,170 ,021 -,593 -8,094 ,000 ,466 2,147
Spesa mensile media -,035 ,039 -,052 -,904 ,367 ,745 1,342
Anni di fedeltà 3,184 1,194 ,144 2,666 ,008 ,862 1,160
Reddito familiare -,069 ,065 -,058 -1,070 ,286 ,855 1,169
a. Variabile dipendente: Score di gradimento gennaio 2010
Mostrare i problemi (dove sono? Quali sono le possibili cause?)
Com’e’ la matrice di correlazione? Commentarla
Correlazioni
età
Minuti mensili
medi
Spesa mensile
media Anni di fedeltà
Reddito
familiare
Score di
gradimento
gennaio 2010
età Correlazione di Pearson 1 -,641** -,274** -,130*-,285** ,411**
Sig. (2-code) ,000 ,000 ,040 ,000 ,000
N 250 250 250 250 250 250
Minuti mensili medi Correlazione di Pearson -,641** 1 ,478** ,289** ,333** -,608**
Sig. (2-code) ,000 ,000 ,000 ,000 ,000
N 250 250 250 250 250 250
Spesa mensile media Correlazione di Pearson -,274** ,478** 1 ,288** ,213** -,312**
Sig. (2-code) ,000 ,000 ,000 ,001 ,000
N 250 250 250 250 250 250
Anni di fedeltà Correlazione di Pearson -,130*,289** ,288** 1 ,236** -,059
Sig. (2-code) ,040 ,000 ,000 ,000 ,352
N 250 250 250 250 250 250
Reddito familiare Correlazione di Pearson -,285** ,333** ,213** ,236** 1 -,238**
Sig. (2-code) ,000 ,000 ,001 ,000 ,000
N 250 250 250 250 250 250
Score di gradimento
gennaio 2010
Correlazione di Pearson ,411** -,608** -,312** -,059 -,238** 1
Sig. (2-code) ,000 ,000 ,000 ,352 ,000
N 250 250 250 250 250 250
**. La correlazione è significativa al livello 0,01 (2-code).
*. La correlazione è significativa al livello 0,05 (2-code).
Si ristima il modello con metodo per passi (spiegare cosa vuol dire)
pf3
pf4
pf5

Anteprima parziale del testo

Scarica spss, simulazione statistica e più Esercizi in PDF di Statistica solo su Docsity!

Esercizio 1

1) Modello di Regressione multipla

Si effettua prima una regressione a blocchi. Il modello ottenuto e’ discreto, ma presenta problemi di

significatività e di collinearità.

Riepilogo del modello Modello R R-quadrato R-quadrato corretto Deviazione standard Errore della stima 1 ,624a^ ,390 ,377 10, a. Predittori: (Costante), Reddito familiare, Spesa mensile media, Anni di fedeltà, età, Minuti mensili medi Coefficientia Modello Coefficienti non standardizzati Coefficienti standardizzati t Sig. Statistiche di collinearità B Deviazione standard Errore Beta Tolleranza VIF 1 (Costante) 83,162 6,702 12,408 , età ,019 ,068 ,018 ,277 ,782 ,578 1, Minuti mensili medi -,170 ,021 -,593 -8,094 ,000 ,466 2, Spesa mensile media -,035 ,039 -,052 -,904 ,367 ,745 1, Anni di fedeltà 3,184 1,194 ,144 2,666 ,008 ,862 1, Reddito familiare -,069 ,065 -,058 -1,070 ,286 ,855 1, a. Variabile dipendente: Score di gradimento gennaio 2010

Mostrare i problemi (dove sono? Quali sono le possibili cause?)

Com’e’ la matrice di correlazione? Commentarla

Correlazioni età Minuti mensili medi Spesa mensile media Anni di fedeltà Reddito familiare Score di gradimento gennaio 2010 età Correlazione di Pearson 1 -,641^ -,274^ -,130^ -,285^ ,411* Sig. (2-code) ,000 ,000 ,040 ,000 , N 250 250 250 250 250 250 Minuti mensili medi Correlazione di Pearson -,641^1 ,478^ ,289^ ,333^ -,608** Sig. (2-code) ,000 ,000 ,000 ,000 , N 250 250 250 250 250 250 Spesa mensile media Correlazione di Pearson -,274^ ,478^1 ,288^ ,213^ -,312** Sig. (2-code) ,000 ,000 ,000 ,001 , N 250 250 250 250 250 250 Anni di fedeltà Correlazione di Pearson -,130^ ,289^ ,288^1 ,236^ -, Sig. (2-code) ,040 ,000 ,000 ,000 , N 250 250 250 250 250 250 Reddito familiare Correlazione di Pearson -,285^ ,333^ ,213^ ,236^1 -,238* Sig. (2-code) ,000 ,000 ,001 ,000 , N 250 250 250 250 250 250 Score di gradimento gennaio 2010 Correlazione di Pearson ,411^ -,608^ -,312^ -,059 -,238^1 Sig. (2-code) ,000 ,000 ,000 ,352 , N 250 250 250 250 250 250 **. La correlazione è significativa al livello 0,01 (2-code). *. La correlazione è significativa al livello 0,05 (2-code).

Si ristima il modello con metodo per passi (spiegare cosa vuol dire)

Riepilogo del modello

Modello R R-quadrato R-quadrato corretto Deviazione standard Errore della stima 1 ,608a^ ,369 ,367 10, 2 ,620b^ ,384 ,379 10, a. Predittori: (Costante), Minuti mensili medi b. Predittori: (Costante), Minuti mensili medi, Anni di fedeltà Coefficientia Modello Coefficienti non standardizzati Coefficienti standardizzati t Sig. Statistiche di collinearità B Deviazione standard Errore Beta Tolleranza VIF 1 (Costante) 86,657 2,434 35,597 , Minuti mensili medi -,174 ,014 -,608 -12,049 ,000 1,000 1, 2 (Costante) 80,824 3,394 23,811 , Minuti mensili medi -,184 ,015 -,644 -12,355 ,000 ,916 1, Anni di fedeltà 2,823 1,157 ,127 2,441 ,015 ,916 1, a. Variabile dipendente: Score di gradimento gennaio 2010

Interpretare i B e i Beta.

Commentare quindi da cosa dipende il gradimento e con che tipo di relazione (diretta? Inversa?)

Se si aggiunge il genere (è possibile in quanto è dicotomica!!)

Coefficientia Modello Coefficienti non standardizzati Coefficienti standardizzati t Sig. Statistiche di collinearità B Deviazione standard Errore Beta Tolleranza VIF 1 (Costante) 86,657 2,434 35,597 , Minuti mensili medi -,174 ,014 -,608 -12,049 ,000 1,000 1, 2 (Costante) 79,026 2,736 28,884 , Minuti mensili medi -,149 ,015 -,519 -10,218 ,000 ,890 1, Genere 7,071 1,352 ,266 5,231 ,000 ,890 1, 3 (Costante) 72,700 3,554 20,455 , Minuti mensili medi -,159 ,015 -,557 -10,707 ,000 ,827 1, Genere 7,183 1,335 ,270 5,380 ,000 ,889 1, Anni di fedeltà 3,003 1,097 ,135 2,738 ,007 ,916 1, a. Variabile dipendente: Score di gradimento gennaio 2010

Il genere è significativo, interpretarlo alla luce del fatto che 0 è maschio e 1 e’ femmina, e quindi la stima è

delle femmine rispetto ai maschi (in sostanza le femmine hanno un gradimento piu’ alto dei maschi).

Motivare.

Per fare la previsione occorre sostituire nel modello FINALE (quello con le sole variabili significative) i valori

del soggetto osservato (quindi, se il reddito, ad esempio, non e’ significativo, non va messo nel modello!!)

Il modello è Y= 72,7 – 0,159minuti + 7,183genere + 3,033*annifedelta

Il gradimento dipende dall’età, e aumenta al crescere dell’età

Per rispondere alla seconda parte: ANOVA a due vie

Test degli effetti fra soggetti Variabile dipendente:Score di gradimento gennaio 2010 Sorgente Somma dei quadrati Tipo III df Media dei quadrati F Sig. Modello corretto 17725,804a^7 2532,258 23,142 , Intercetta 165831,899 1 165831,899 1515,487 , Genere 1877,542 1 1877,542 17,158 , ClassiEtà 1826,941 3 608,980 5,565 , Genere * ClassiEtà 1912,260 3 637,420 5,825 , Errore 26480,803 242 109, Totale 898613,959 250 Totale corretto 44206,607 249 a. R quadrato = ,401 (R quadrato corretto = ,384)

Dipende dal genere, dalle classi di eta’ e della loro interazione. Spiegare in che modo si esplicita

l’interazione significativa e cosa vuol dire.

4) Test t per campioni appaiati

Statistiche per campioni appaiati Media N Deviazione std. Errore std. Media Coppia 1 Score di gradimento gennaio 2010 58,4605 250 13,32429 , Score di gradimento gennaio 2011 62,2010 250 14,36026 ,

Test per campioni appaiati

Differenze a coppie

t df

Sig. (2-

Media code)

Deviazione

std.

Errore std.

Media

Intervallo di confidenza

per la differenza al 95%

Inferiore Superiore

Coppia

Score di

gradimento

gennaio 2010 -

Score di

gradimento

gennaio 2011

Il test e’ significativo. Spiegare cosa vuol dire ( risultato: la campagna e’ stata efficace)

5) Regressione logistica binaria: VD: Abbandono, VI : genere, eta, minuti, spesa, fedelta,

reddito.

Metodo Forward di Ward (dopo aver fatto fare la ricodifica delle variabili categoriche!)

Codifica variabile dipendente Valore originale Valore interno NO 0 SI 1 Codifiche variabili categoriali Frequenza Codifica del parametro (1) Genere maschio 125 1, femmina 125 , Riepilogo del modello Passo -2 log verosimiglianza R-quadrato di Cox e Snell R-quadrato di Nagelkerke 1 136,869a^ ,318 , 2 121,800b^ ,358 , 3 117,733b^ ,368 , a. La stima è stata interrotta all'iterazione numero 6 perché le stime dei parametri sono cambiate di meno del ,001. b. La stima è stata interrotta all'iterazione numero 7 perché le stime dei parametri sono cambiate di meno del ,001.