Scarica Appunti programma SPSS statistica e più Appunti in PDF di Analisi Statistica solo su Docsity!
Variabili
- dicotomiche,
- quantitativa,
- qualitativa
- ordinale (ordinabili in senso SEMPRE CRESCENTE per convenienza nostra nei commenti)
- sconnessa (quando non c’è un ordine possibile) CASO ANOMALO!!! Quando una variabile presenta valori 0=’la peggior vita possibile’ 10= ‘la miglior vita possibile’ Oppure con 0=per niente 1= 2= … 10=molto SONO VARIABILI QUANTITATIVE (per verificare statistiche descrittive-> frequenze-> e vedi tutti i valori che può assumere una variabile) Analizza relazione fra due variabili: vedi se ci sono i mancanti (non risponde, non sa, ecc..), ma per scrupolo comunque controllare la frequenza. E’ MANCANTE QUALSIASI MODALITA’ DI RISPOSTA CHE NON ABBIA SENSO CON L’ETICHETTA!
Acquisizione file .sav file – apri - trovi il file .txt file - leggi dati testo - trovi il file – (quando c’è il tab è sicuro “larghezza delimitata”)
- Esercizio larghezza delimitata Passo 1 di 6 vai avanti spunti delimitata spuntare si o no in base a se i nomi delle variabili compaiono all’inizio del file numero riga a cui inizia il primo caso di dati – aumentare il numero fino a che il primo valore non compare sulla riga 1 della schermata scegliere il separatore adatto (in questo caso tabulatore) se nel passo 5 di 6 si trova un numero decimale con il ‘PUNTO’ e non con la virgola, cliccare la colonna di variabili interessata e modificare il formato dati, mettendo il formato VIRGOLA (si fa una colonna per volta) – con la virgola nei decimali non si tocca nulla. passo 6 di 6 non si fa nulla
- Esercizio larghezza fissa Nel blocco notes, i numeri si trovano alla destra della variabile ed è un indizio che fa capire che le variabili sono a una larghezza fissa Passo 1 vai avanti passo 2 larghezza fissa passo 3 numero riga da sistemare passo 4 sistemare le colonne del file , l’asta ATTACCATA ALLA DESTRA DEL NUMERO, nell’ultima non c’è bisogno di fare la colonna passo 5 vedere se ci sono dei punti nei decimali e sistemarli passo 6 nulla. .xls lo vedremo negli esercizi direttamente – più semplice
Unisci file: aggiungi casi/ variabili Aggiungi variabili quando abbiamo le stesse unità ma variabili differenti Aggiungi casi quando abbiamo le stesse variabili ma unità differenti Per scegliere se fare una cosa o l’altra bisogna aprire entrambi i file richiesti e valutare le variabili, vedere se sono le stesse o diverse, ma anche vedere se ci sono lo stesso numero di unità. ESERCIZIO aggiungi casi DATI-UNISCI FILE-AGGIUNGI CASI Prima schermata selezionare il file da unire Seconda schermata selezionare le variabili non appaiate che hanno nomi differenti ma significano la stessa cosa (età e age) premere su entrambe e cliccare ‘Associa’ In variabili non appaiate ci sono anche le altre variabili che sono presenti in uno o l’altro file, NON ASSOCIARE MA LASCIARLE DOVE SONO. Ti si apre il dataset unito dopo aver premuto ok
ESERCIZIO aggiungi variabili INDIZIO: quando è presente una variabile ‘ID’ è AGGIUNGI VARIABILE
Per prima cosa aprire entrambi i file e in ciascuno cliccare su DATI-ORDINA CASI-INSERIRE LA VARIABILE ‘ID’ IN ORDINA PER… CRESCENTE! Poi fare DATI-UNISCI FILE-AGGIUNGI VARIABILE Prima schermata selezionare il file da unire Sulla seconda schermata di aggiungi variabili, la cosa importante è cliccare sulla variabile ‘ID’ (o simile, che identifichi i rispondenti) e poi su ‘ confronta casi per chiave di ordinamento’. FARLO SEEEEEEMPRE QUANDO FAI AGGIUNGI VARIABILE poi lasciare su ‘ambedue i file forniscono casi’ e cliccare sulla freccia in basso a destra ( inserendo la variabile ‘ID’ come VARIABILE CHIAVE)
Ricodifica automatica/in variabili differenti Si fa RICODIFICA IN VARIABILE DIFFERENTE:
- se un’ordinale è ordinata in ordine sparso (variabile grado di istruzione 1=elementare 2=laurea3=medie 4=dottorato (1° USO)
- quando devi trasformare una variabile quantitativa in delle classi precise (date dalla prof) RICODIFICA IN VARIABILE DIFFERENTE (2°USO)
TRASFORMA- RICODIFICA IN VARIABILE DIFFERENTE- SELEZIONARE LA VARIABILE- DARE IL NOME- PREMERE VALORI VECCHI E NUOVI E METTERE L’ORDINE GIUSTO A SINISTRA I NUOVI NUMERI E A DESTRA I VECCHI E PREMERE SU AGGIUNGI – CLICCARE SU AVANTI SENZA INSERIRE MANCANTE DI SISTEMA O DEFINITO DALL’UTENTE (MA INSERENDOLI NON SI SBAGLIA SICURAMENTE) La nuova variabile non avrà le etichette – andare ad inserirle!! Se devo trasformare una quantitativa in classi (diventa quindi una qual ord) premere sempre trasforma –ric in var diff – selezioni la variaibile – selezioni intervallo e crei le classi definite dalla prof – successivamente creare le etichette in valore.
Si fa RICODIFICA AUTOMATICA
- per trasformare una stringa in qualitativa (o sconnessa o ordinale) (1° USO)
- quando hai una variabile ordinale ma decrescente per mettere in ordine crescente (2° USO)
TRASFORMA – RICODIFICA AUTOMATICA – SELEZIONI LA VARIABILE – DAI IL NUOVO NOME
– PREMI SU ‘RICODIFICA PARTENDO DA ..VALORE PIU’ ALTO’ – SEMPRE CLICCARE SU
‘CONSIDERA VALORI DELLE STRINGHE VUOTE COME MANCANTI DEFINITI DALL’UTENTE’
QUESTA RICODIFICA TI INSERISCE AUTOMATICAMENTE LE ETICHETTE
QUALSIASI VARIABILE CHE E’ IN DISORDINE (MA NON SCONNESSA) DEVE ESSERE
ORDINATA IN ORDINE CRESCENTE – SEEEEEEMPRE
Dividi Quando si deve ‘analizzare la relazione tra X e Y separatamente tra A e B’ DATI-DIVIDI-SELEZIONARE LA VARIABILE (che di solito è una dicotomica)- CONFRONTA GRUPPI
- PREMERE FRECCIA A DESTRA – prima di passare all’esercizio successiva ricordarsi di togliere il ‘DIVIDI’andando su dividi e premere su analizza tutti i casi, non creare gruppi.
Seleziona casi Quando si deve ‘analizzare la relazione tra X e Y solo per A’ DATI-SELEZIONA CASI-CLICCARE SU ‘SE LA CONDIZIONE è SODDISFATTA’- CLICCARE SU ‘SE’- POI SELEZIONI LA VARIABILE RICHIESTA( per esempio: studia i casi di chi possiede la macchina economica) – freccia a destra + inserire la formula (var=’valore richiesto’) – PREMERE ‘COPIA CASI SELEZIONATO IN UN NUOVO INSIEME DI DATI’ E DARE IL NUOVO NOME PER L’INSIEME DI DATI – UNA VOLTA FINITO L’ESERCIZIO BISOGNA CHIUDERE IL NUOVO DATASET CREATO E RITORNARE SULL’ORIGINALE. Eccezione: campione casuale di casi/basato su intervallo di tempo e di casi/ se lei lo richiede (seguire le istruzioni della schermata)
Categorizzazione visuale La utilizzo quando devo creare delle classi a caso (non specificate dalla prof) (meglio evitare di utilizzarla- se posso scegliere meglio fare ricodifica in variabili differenti)
/ Quantitat iva
Ordinale Sconnessa Dicotomica
Quantitat iva
Correlazio ne Bivariata Pearson
Correlazio ne Bivariata Spearman
Anova Univariata
Test T a campioni indipendenti
Ordinale Gamma Chi-quadrato e V di Cramer e residui standardizzati
Chi-quadrato e V di Cramer e residui standardizzati Sconness a
Chi-quadrato e V di Cramer
Chi-quadrato e V di Cramer
Dicotomi ca
Coefficiente di rischio
Se la Sign di Gamma >0.05 bisogna fare anche chi quadrato e i residui standardizzati
CORRELAZIONI BIVARIATE
ANALIZZA- CORRELAZIONE -BIVARIATE
Premere o Spearman o Pearson se bisogna utilizzare l’uno o l’altro. L’output è uguale per entrambi. Guardare la significatività del coefficiente:
- se la sign. è >0.05: ‘non esiste una relazione significativa fra le due variabili Alfa e Beta. quindi possiamo affermare che all’aumentare di Alfa, Beta non varia.’
- Se la sign. è < 0.05: ‘esiste una relazione significativa fra Alfa e Beta’. Bisogna guardare il valore sulla riga del coefficiente di correlazione/seconda colonna.
- Se il coefficiente è :
- 0.084 – ‘positiva, ma decisamente debole’
- 0.09 – ‘positiva, ma non molto rilevante’
- 0.19 – ‘positiva e rilevante’
- 0.37 – ‘positiva e rilevante’
- 0.52 – ‘positiva e decisamente rilevante’
- 0.62 – ‘positiva e molto rilevante’ Stessa cosa se negativa. Più si avvicina a +1 o -1, più è forte la relazione. Se è 0 – ‘la relazione è tendente all’indipendenza’ Facciamo che in questo caso il coeff è 0.37. Il commento continua così: ‘La relazione è positiva e rilevante. Dunque possiamo affermare che nel collettivo analizzato, all’aumentare di una variabile, l’altra aumenta.’
Correlazioni parziali Si studia se una variabile è in relazione con un'altra, al netto di una terza (o più) variabile. SOLO VARIABILI QUANTITATIVE ANALIZZA CORRELAZIONE PARZIALE Nella sezione ‘variabili’ inserire le due variabili da analizzare
Bisogna guardare la significatività relativa alla riga della ‘v di cramer’ Se la sign >0.05: ‘tra le due variabili non c’è una relazione significativa (le variabili sono indipendenti)’ Se la sign <0.05: ‘tra le due variabili c’è una relazione’
- Una volta scoperto se c’è la relazione, bisogna guardare la forza della relazione. Guardare il valore in corrispondenza della riga della ‘v di cramer’ 0<V<0.10 → ‘la relazione è molto debole’ 0.10<V<0.15 → ‘la relazione è abbastanza debole’ 0.15<V<0.25 → ‘la relazione è abbastanza forte’ 0.25<V<0.35 → ‘la relazione è forte’ V>0.35 → ‘la relazione è molto forte’ (mai i valori più alti di 1)
- Poi da commentare sono i residui standardizzati nella tavola di contingenza. Si commentano soltanto i valori che sono maggiori di +2 o minori di -2. Quelli positivi (>+2):ES. RELAZIONE FRA SESSO E IMPORTANZA DELLA FAMIGLIA - VALORE 2.3‘ABBASTANZA’ ‘frequentemente, chi è maschio dà abbastanza importanza alla famiglia’ Quelli negativi al posto di FREQUENTEMENTE sarebbe stato DIFFICILMENTE. Comunque bisogna commentare in base al senso logico su quale delle due variabili può influenzare l’altra.
GAMMA
ANALIZZA – STATISTICHE DESCRITTIVE – TAVOLE DI CONTINGENZA
Inserisco le variabili in righe e colonne premere statistiche e selezioni ‘gamma’, ma anche il chi quadrato celle: premere solo standardizzati
- La prima tabella da copiare è MISURE SIMMETRICHE Guardare la significatività del gamma. Se sign. >0.05: ‘non c’è relazione significativa tra le due variabili’ In questo caso vado a guardare il chi quadrato (e lo si commenta come sopra) Se sign. <0.05: ‘esiste una relazione significativa tra le due variabili’
- Guardare, quindi, il valore di gamma sulla colonna ‘VALORE’ (-1<gamma<+1) e ti dà la FORZA e la DIREZIONE.
- Se è -1 ‘la forma della relazione è inversa e molto forte. Quindi, sulla base del collettivo analizzato, possiamo affermare che all’aumentare di una variabile, l’altra diminuisce.’
- Se è +1 ‘la forma della relazione è diretta e molto forte. Quindi, sulla base del collettivo analizzato, possiamo affermare che all’aumentare di una variabile, l’altra aumenta.’
- Se è 0.12 o giù di lì ‘la forma della relazione è diretta e non molto forte. Quindi, sulla base del collettivo analizzato, possiamo affermare che all’aumentare di una variabile, l’altra aumenta.’
- Se è 0 ‘le due variabili sono indipendenti’
COEFFICIENTE DI RISCHIO E ODDS RATIO ANALIZZA – STATISTICHE DESCRITTIVE – TAVOLE DI CONTINGENZA Relazione fra essere molto orgoglioso della propria nazionalità ed essere indiano (bisogna creare le variabili). Inserisco le variabili in righe e colonne premere statistiche e selezioni ‘coefficiente di rischio ’. Guardare la tabella ‘stima di rischio’. Bisogna guardare l’intervallo di confidenza alla prima riga:
- Se all’interno dell’intervallo c’è 1 ’la relazione non è significativa’
- Se all’interno dell’intervallo non c’è 1 ‘la relazione è significativa’
COMMENTI : PRIMA MODALITA’ DI RISPOSTA DELLA PRIMA VARIABILE ‘PER’ LA PRIMA
MODALITA’ DI RISPOSTA DELLA SECONDA VARIABILE --- ‘RISPETTO’ ALLA SECONDA
MODALITA’ DI RISPOSTA DELLA SECONDA VARIABILE. (oppure seconda della prima per seconda della seconda rispetto alla prima della seconda) ‘ La probabilità di non essere indiano per chi non è molto orgoglioso della propria nazionalità è maggiore del 67% rispetto a chi è molto orgoglioso della propria nazionalità’ (‘la probabilità di essere indiano per chi è molto orgoglioso della propria nazionalità è maggiore del 67% rispetto a chi non è molto orgoglioso della propria nazionalità’) In questo caso non ha molto senso, bastava inserire la variabile orgoglioso in righe e indiano in colonne.
In questo caso il valore è > Se fosse < 1:
- 0.05 ‘la probabilità è 1/20 ’
- 0.10 ‘la probabilità è 1/10’
- 0.16 ‘la probabilità è quasi 1/5’
- 0.2 ‘la probabilità è 1/5’
- 0.25 ‘la probabilità è ¼’
- 0.3 ‘la probabilità è quasi 1/3’
- 0.35 ‘la probabilità è poco più di 1/3’
- 0.4 ‘la probabilità è quasi ½’
- 0.45 ‘la probabilità è quasi ½’
- 0.5 ‘la probabilità è ½’
- 0.6 ‘la probabilità è più di ½’
- 0.7 ‘la probabilità è più di ½’
- Quando è vicino all’1 (da o,8 in poi) si può dire ‘la probabilità è del 20% in meno’ Quando è maggiore di 2 ‘la probabilità è 2 volte superiore/2.5 superiore/4 volte superiore…
TEST T A CAMPIONI INDIPENDENTI
ANALIZZA – CONFRONTA MEDIE – TEST T A CAMPIONI INDIPENDENTI
Prima schermata inserire alla cella ‘variabile oggetto del test’ la variabile QUANTITATIVA Nella cella ‘variabili di raggruppamento’ la DICOTOMICA Su definisci i gruppi inserisci i valori che ti interessano della variabile (se qualitativa e chiede solo due risposte, la fai diventare dicotomica definendo i gruppi).
- Guardare subito la tabella ‘Test per campioni indipendenti’ nella parte ‘Test di Levene’ Se la sign. >0.05 ‘Il test di Levene indica che le varianze non sono significativamente diverse’ Se la sign. <0.05 ‘Il test di Levene indica che le varianze sono significativamente diverse’
- Poi guardare la parte riguardante il ‘test di uguaglianza delle medie’ Se la sign. >0.05 ‘le medie non sono significativamente diverse’ E TI FERMI QUI Se la sign. <0.05 ‘le medie sono significativamente diverse’
- Si va quindi a guardare la differenza tra medie.
‘commento soltanto le relazioni significative. Un canadese smette di studiare in media 5 anni dopo un cinese.’ E ovviamente continuare a commentare quelle significative.
le tabelle sono puramente esemplificative
- Se la sign. del Test di Levene <0.05 ‘Il test di Levene indica che le varianze sono significativamente diverse.’ Guardo la tabella ‘Test robusti per l’uguaglianza delle medie’
- Se la sign. è >0.05 ‘Sia Welch che Brown-Forsythe indicano che le medie non sono significativamente diverse.’ E NON FAI ALTRO
- Se la sign. è <0.05 ‘Sia Welch che Brown-Forsythe indicano che le medie sono significativamente diverse. Per capire come le medie sono diverse, guardo i test post-hoc per varianze diverse (Games- Howell).’ ‘commento soltanto le relazioni significative. Un canadese smette di studiare in media 5 anni dopo un cinese.’ E ovviamente continuare a commentare quelle significative.
Quando si commentano i sottoinsiemi omogenei? Quando o te lo chiede lei espressamente o quando dai test post-hoc non è chiara la relazione per via dei valori del sig. troppo vicini a 0.05. Guardi quando in caso di dubbio non trovi buone relazioni. Non lo sa commentare, ma non è mai successo. FARSI SPIEGARE IL TEST T A CAMPIONI APPAIATI DALLA PROF. LOGISTICA QUANDO SI HA UNA DICOTOMICA ANALIZZA - REGRESSIONE – LOGISTICA BINARIA Nella variabile dipendente è sempre la variabile dicotomica Le variabili covariate sono tutte le variabili che noi decidiamo di inserire nel modello perché potrebbero avere un nesso/relazione con la variabile dipendente. ***prima di inserire le covariate, controllare i missing e l’ordine. Andare su categoriche ed inserire tutte le variabili che non sono quantitative(ordinali, sconnesse e dicotomiche) e cliccare su CONTINUA (finale o iniziale lo vediamo dopo).
- Prima tabella da guardare è relativa al ‘BLOCCO 1’ e si chiama ‘Test omnibus dei coefficienti del modello’ e guardare la significatività corrispondente alla riga MODELLO a. Se sign. >0.05 bisogna ripetere il modello con altre variabili b. Se sign. <0.05 ‘Il test omnibus dei coefficienti del modello indica che il modello è significativo’.
- Seconda tabella è’Riepilogo del modello’ guardare il valore più alto tra i due R-quadrato. Se il valore (che corrisponde ad una percentuale) è molto basso o si ripete il modello o è sintomo che non si arriva ad una percentuale molto alta – 30/35% è abbastanza buona, ma anche più bassa.
‘la probabilità di Y(variabile dipendente) per X(variabile covariata) rispetto al residuo della variabile X è…’
- DICOTOMICA: guardare anche qui la tabella ‘Codifiche variabili categoriali’ e vedere quale delle due modalità di risposta è a residuo (valore ,000) e commentare dicendo: ‘la madre non fumatrice (valore 1,000) ha il doppio (valore 2,051) della probabilità della madre fumatrice (valore ,000) di avere un bambino sottopeso’ ‘la modalità di risposta a valore 1,000 ha la x% di probabilità in più/meno rispetto la modalità di risposta a valore ,000 (residuo) di Y ‘variabile dipendente’’
ANOVA A PIU’ VIE
QUANDO SI HA UNA QUANTITATIVA
ANALIZZA – MODELLO LINEARE GENERALIZZATO – UNIVARIATA
- variabile dipendente: la variabile quantitativa
- fattori fissi: le variabili qualitative (sia ordinali che sconnesse) e dicotomiche
- covariate: variabili quantitative Si preme su MODELLO premere su personalizzato selezionare tutte le variabili che compaiono sulla sinistra cliccare su TIPO e inserire ‘effetti principali’e cliccare la freccia a destra. In OPZIONI cliccare su ‘confronta effetti principali’ e ‘stime dei parametri’ selezionare tutte le variabili che troviamo sulla sinistra e premo la freccia a destra poi su ‘correzione intervallo di confidenza’ selezionare ‘Sidak’
- Prima tabella da guardare è ‘Test degli effetti fra soggetti’ e guardare la significatività del Modello corretto (prima riga).
- Se sign. >0.05 ripetere il modello con altre variabili
- Se sign. <0.05 ‘il modello è significativo’ Guardare R quadrato corretto (in fondo alla tabella) e commentare dicendo: ‘Il modello spiega la x% della variabile quantitativa’
- Seconda tabella ‘Stime dei parametri’ che serve a commentare solo le variabili QUANTITATIVE. Le quantitative le trovi alla fine della tabella. Si guarda la significatività e commentare solo quelle significative (se trovi variabili non significative si torna al modello e le si eliminano, ripetendo il modello) Se la sign. <0.05 si commenta così: ‘per ogni ‘unità di misura della variabile’ in più della variabile quantitativa covariata che si sta analizzando, la variabile quantitativa iniziale aumenta/diminuisce (dipende dal segno del valore ‘B’) (GUARDARE IL VALORE ‘B’) di x punti’.
- Per le altre variabili (ordinali, sconnesse e dicotomiche) si trovano varie tabelle per ogni singola variabile.
- Per le variabili dicotomiche si guarda solo la tabella ‘Stime’ Guardare tra le due modalità di risposta la media più alta e commentarla. ‘I maschi sono più soddisfatti delle femmine a parità di tutte le altre variabili’
- Per le variabili ordinali e sconnesse si guarda la tabella ‘confronti a coppie’ Guardare e commentare solo le significative. ESEMPIO SOTTOPESO ‘le madri bianche hanno in media x anni in più rispetto alle madri nere’ ANALISI FATTORIALE Serve per sintetizzare le variabili. Prima cosa da fare è verificare l’Alpha di Cronobach ANALIZZA SCALA ANALISI DI AFFIDABILITA’ Le variabili devono essere tutte quantitative. Bisogna verificare che i valori di ogni variabile si riferiscano allo stesso ordine. INSERIRE TUTTE LE VARIABILI DESIDERATE Premere statistiche premere su ‘scala se l’elemento è escluso’ ok Guardare la tabella ‘statistiche di affidabilità’ e valutare il valore dell’Alpha di Cronobach IL VALORE DEVE ESSERE MAGGIORE DI 0.
- Se Alpha di Cronobach <0.7 guardare la tabella ‘statistiche totali degli item’ sull’ultima colonna compare il valore dell’Alpha di Cronobach ottenibile se si elimina la variabile corrispondente si torna in ‘analisi di affidabilità’ e si elimina quella variabile (UNA PER VOLTA).
‘L’Alpha di Cronbach è <0.7 quindi ho eliminato la variabile X’
- Se Alpha di Cronobach >0.7 :’le variabili sono adatte per l’analisi fattoriale’ Quindi si parte con la fattoriale ANALIZZA RIDUZIONE DIMENSIONE FATTORIALE Inserire le variabili incluse nell’Alpha di Cronobach Cliccare su ‘estrazione’ e selezionare ‘grafico decrescente autovalori’ Cliccare su ‘rotazione’ e selezionare ‘varimax’ Cliccare su ‘opzioni’ e selezionare ‘ordinati per dimensione’ e ‘sopprimi coefficienti piccoli’ e scrivi 0.30 in basso a destra.
- OK Tabella ‘comunalità’ e controllare che il valore relativo alla colonna ‘estrazione’ sia >0.4, perché se è <0.4 vanno eliminate le variabili (‘La comunalità mostra un valore ‘estrazione’ <0.4 relativamente alla variabile X e l’ho eliminata’) Se tutte sono >0.4 , il commento è : ‘nella comunalità vedo che tutte le variabili di partenza sono state prese in considerazione e rientrano in modo soddisfacente nei fattori’ Copiare il ‘grafico decrescente autovalori’ Stabilire il GOMITO DELLA CURVA – per capire il numero di variabili da estrarre. Cercare i PRIMI DUE pallini all’interno del grafico che sono alla STESSA ALTEZZA (il primo di questi due pallini è il GOMITO). Le variabili da estrarre sono NUMERO DEL GOMITO -1. METODO ALTERNATIVO PER IL GOMITO Tabella ‘varianza totale spiegata’ colonna ‘pesi dei fattori non ruotati’ e guardare quando la percentuale cumulata >70%. Contare il numero di variabili – quello è il numero di variabili da estrarre La tabella ‘varianza totale spiegata’ : Prima colonna ‘autovalori iniziali – totale’ dà informazioni sulle variabili considerate di default da SPSS (spesso, però, il valore non corrisponde al gomito che si è trovato).
- Se il controllo non conferma il numero di variabili: ANALIZZA – RIDUZIONE DIMENSIONE – FATTORIALE Cliccare su ‘estrazione’ e su ‘numero fisso di fattori’ e scrivere il numero di variabili da estrarre! E ricopiare sul compito solo la NUOVA tabella ‘varianza totale spiegata’
- Se il controllo conferma il numero di variabili da estrarre commentare la tabella ‘varianza totale spiegata’ – commento: ‘la varianza cumulata delle variabili di origine spiegata dai primi X(numero gomito -1) fattori ruotati è del x%’ Guardare poi la tabella ‘Matrice di componenti ruotata’ Per ogni componente bisogna guardare in ciascuna colonna, le variabili che hanno valore >0. Fare un commento per ciascuna componente: ‘la prima componente principale (prima colonna) è fortemente correlata con: 1. nome variabile e valore
- nome variabile e valore
- …. ‘quindi desumo che il nome della prima componente principale è….’ FARLO PER TUTTI I COMPONENTI PRINCIPALI
ANALIZZA – RIDUZIONE DIMENSIONE – FATTORIALE Su’ punteggi’ si spunta ‘salva come variabili’ OK Ha creato quindi ‘numero gomito -1’ variabili - TUTTE QUANTITATIVE e le loro medie=
Analisi fattoriale nel caso poi ci serva per estrarre una sola variabile
ANALIZZA SCALA ANALISI DI AFFIDABILITA’
Le variabili devono essere tutte quantitative. Bisogna verificare che i valori di ogni variabile si riferiscano allo stesso ordine. INSERIRE TUTTE LE VARIABILI DESIDERATE Premere statistiche premere su ‘scala se l’elemento è escluso’ ok Guardare la tabella ‘statistiche di affidabilità’ e valutare il valore dell’Alpha di Cronobach IL VALORE DEVE ESSERE MAGGIORE DI 0.
ANALIZZA – CLASSIFICA - CLUSTER GERARCHICO
Sezione “Salva”, spuntare “Soluzione unica numero di cluster” e mettere il numero di cluster deciso sopra. Poi andare nella Sezione “Statistica” e mettere “Soluzione unica numero di cluster” e mettere il numero di cluster deciso sopra” (ricordarsi di spuntare “Programma di agglomerazione”). Questo passaggio ti crea la variabile cluster nel database. LA VARIABILE CLUSTER È UNA QUALITATIVA SCONNESSA. ANALIZZA - CONFRONTA MEDIE - MEDIE In “Variabili dipendenti” inserire tutte le variabili utilizzate nel cluster. In “Variabili indipendenti” inserire la variabile che ha creato il cluster. Copiare e commentare tabella “Report”:
- Cercare un nome per ogni gruppo, come? Guardando le medie di tutte le variabili di ogni gruppo commenti le medie dei gruppi (parti da quella con le medie più alte) dicendo se + più alta o più bassa di…..e decidi un nome per il gruppo.
- Cosi per tutti i gruppi.
Poi chiede spesso di fare una relazione tra la variabile Cluster e tutte le variabili e fai esercizio 1.
SCALING
ANALIZZA – SCALA – SCALING MULTIDIMENSIONALE (O PROXSCAL O ALSCAL)
Quando utilizziamo proxscal e quando alscal?
- Entrambi se il dataset che ti da lei è formato da dati (standard) – meglio PROXSCAL. Esempio 9luglio ANALIZZA – SCALA – PROXSCAL Sezione ‘formato dei dati’ selezionare ‘crea distanze dati’ definisci Selezionare le variabili richieste e premere la freccia a destra Sezione ‘Modello’ Selezionare la scala! (se abbiamo dei dati e li trasformiamo in distanze, come in questo caso, la scala è sempre a rapporto - A MENO CHE LEI NON DIA UN’ALTRA INDICAZIONE NEL COMPITO)
- La scala è a rapporto quando
- Devi trasformare i dati in distanze
- Le distanze sono con valori decimali
- La scala è ordinale quando
- L’ordine delle distanze trasformate è uguale all’ordine delle distanze originali
- La scala è a intervallo quando
- Non c’è lo zero assoluto In questo caso nel compito ha chiesto di usare esplicitamente la scala ordinale selezioniamo scala ordinale. Nella sezione Modello, sempre, in basso nella sezione ‘dimensione’ scrivere:
- 1 e 5 e poi verificare con il grafico il numero di dimensioni
- Direttamente 2 e 2 e poi guardare lo stress test Sezione ‘Grafici’ e selezionare ‘distanze originali con distanze trasformate’ e ‘distanze trasformate con distanze’
Sezione ‘Misura’- bisogna capire se bisogna standardizzare o no secondo i soliti principi, vedendo le variabili – se si deve standardizzare si preme ‘Punteggi Z’ nella sezione ‘standardizzazione’, altrimenti non si fa nulla. Prima tabella da commentare ‘Misure di stress e adattamento’ Guardare la riga ‘stress I’: se stress>0.2 :’significa che due dimensioni non sono sufficienti, allora aumento il numero di dimensioni’ se 0.1<stress<0.2 : ‘non c’è un grande adattamento’ se 0.05<stress<0.1 :’adattamento buono’ se 0.025<stress<0.05 :’buono adattamento’ se stress<0.025 :’adattamento ottimo’ Poi guardarla riga ‘dispersione spiegata’ ‘La quota di varianza spiegata dalle dimensioni utilizzate nella proiezione, rispetto alla varianza totale spiegata dalla matrice di prossimità, è del x%’ (se trovi 0.97545 la percentuale è 97%)
Poi guardare il ‘Grafico dei residui’ e commentare la vicinanza dei puntini alla bisettrice:
- Se segue la retta in modo preciso, conferma la bontà di adattamento’
- Se non la segue retta in modo preciso, conferma che non c’è un grande adattamento’
- A SECONDA DI QUELLO CHE DICE LO STRESS TEST
Poi guardare il grafico ‘Punti di oggetto – spazio comune’ Bisogna definire le dimensioni: per dimensione 1 confronti i pallini che sono più a sinistra con quelli che sono più a destra; per la dimensione 2 si confrontano i puntini che sono più in alto con quelli che sono più basso. Il commento come potrebbe essere. ‘Dimensione 1: da un lato abbiamo le variabili che indicano benessere economico ossia (e specificare il nome delle variabili), mentre dall’altro lato abbiamo ‘nomi variabili’. Quindi possiamo affermare che questa è una dimensione di benessere. ‘Dimensione 2: STESSA COSA in base al tipo di variabili e cosa rappresentano.
Se lo STRESS I >0. Se ci sono più di due dimensioni devo verificare quante effettivamente sono: Torno al modello - in sezione ‘Modello’ inserisco e 1 e 5 (sono obbligato a farlo quando stress I > 0.2) – in sezione ‘Grafici’ e selezionare ‘stress’ Guardare il grafico ‘decrescente autovalori’ Bisogna guardare il pallino dopo il quale la pendenza della retta è nulla il numero delle dimensioni parte da quel pallino. (nell’esempio sono 4) Si torna quindi nel modello e si inserisce 4 e 4 Si commenta e si fa tutto come prima. Le cose cambiano solamente nel grafico ‘Punti di oggetto – spazio comune’ : si vengono a creare, appunto, 4 dimensioni commentarle le singole dimensioni come prima: quelle di sinistra con quelle a destra. Prendere i quadrati subito adiacente alla dimensione, se il quadratino adiacente è vuoto, prendere quello più alto.
Quando il dataset non è costituito da dati, ma:
- da triangolo (superiore o inferiore) – PROXSCAL ANALIZZA – SCALA – PROXSCAL Inserire in ‘formato dei dati’ ‘i dati sono distanze’ DEFINISCI Inserire le variabili in ‘distanze’. Sezione ‘Modello’ e selezionare la Scala (a rapporto, ordinale, a intervallo)rapporto Inserire anche le dimensioni partendo sempre scrivendo 2 e 2. Dato che i dati si mostrano come un triangolo superiore, seleziono in ‘forma’-’ triangolo superiore’ Indicare anche se sono ‘dissimilarità’ o ‘similarità’
- similarità - se ‘a numeri alti corrisponde tanta vicinanza’
- dissimilarità – se ‘a numeri alti corrisponde lontananza’ SCRIVERE IL RAGIONAMENTO Il resto è uguale