















Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
guida pratica all'uso di spss
Tipologia: Guide, Progetti e Ricerche
1 / 23
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!
















SPSS è un software per certi aspetti molto sofisticato, e riuscire a sfruttare al massimo le sue potenzialità richiede notevoli competenze sia statistiche sia informatiche. Poiché questa guida è rivolta principalmente ad utilizzatori non esperti in entrambi i campi, come possono essere degli studenti universitari di psicologia, si cercherà di semplificare al massimo l'esposizione delle procedure e delle opzioni, in modo che una conoscenza di base dell'uso del computer sia sufficiente per apprendere le funzioni fondamentali del software.
SPSS richiede innanzitutto che i dati siano organizzati in base alla seguente regola:
Le informazioni relative al singolo soggetto devono comparire sulle RIGHE, quelle relative alle variabili sulle COLONNE
I dati possono essere inseriti direttamente in un file di SPSS, ma data la limitata distribuzione o disponibilità del software, spesso i dataset vengono costruiti a partire da fogli di calcolo (ad esempio, in Excel o in OpenOffice Calc ). SPSS è in grado di acquisire dati in una grande varietà di formati, compreso il .xls che contraddistingue i file di Excel. Se si utilizza OpenOffice Calc occorre evitare di salvare nel formato di default ( .ods ), per cui una volta inseriti i dati si consiglia di salvare
Salva come del formato .xls (Figura 1). Durante l'inserimento dei dati è fondamentale accertarsi che vi sia una colonna per ogni variabile oggetto di studio, e che in ogni cella di ogni colonna sia presente un solo dato. Se questo può sembrare ovvio per variabili come il genere, o la risposta ad un item di un test, può non esserlo nel caso in cui il soggetto possa scegliere più di una riposta fra quelle proposte, come nel caso della seguente domanda:
Quali sono i suoi generi cinematografici preferiti? (è possibile indicare più di una risposta) ! Animazione! Drammatico! Horror ! Avventura! Erotico! Musicale ! Biografico! Fantascienza! Storico ! Commedia! Fantasy/Fantastico! Thriller ! Documentario! Guerra! Western
Poiché i soggetti possono indicare più di una risposta, e la domanda è una sola, potremmo trovarci nella scomoda posizione di dover inserire nella stessa cella più di un valore (ad esempio Animazione; Fantasy/Fantastico). In questi casi occorre allora creare una variabile per ogni alternativa di risposta possibile (nel caso dell'esempio avremo quindi 15 variabili: Animazione, Avventura, Biografico. […], Western), e indicare con 1 se è stata scelta e con 0 se non è stata scelta
Figura 1 Salvataggio in formato Excel di un file in OpenOffice Calc
2), si eviti di fare la codifica "a mente" nel passaggio dal cartaceo al foglio elettronico, in quanto questa è una procedura ad alta probabilità di errore. Se la codifica numerica non è riportata nel cartaceo è quindi preferibile inserire il testo ed eseguire su. SPSS le ricodifiche necessarie. La prima colonna del dataset dovrebbe contenere il codice che deve essere assegnato al soggetto da chi inserisce i dati provenienti dai protocolli (che potranno essere questionari, batterie, test, etc.). Se per ragioni di rispetto della privacy non è possibile inserire nome e cognome del soggetto, occorre generare un codice anonimo oppure una stringa alfanumerica che non consenta a terzi di identificare con certezza il soggetto. Nel primo caso è fondamentale che il codice anonimo generato da chi inserisce i dati contenga un numero progressivo, così da poter mettere successivamente in ordine i protocolli, e una qualunque sigla che identifichi chi ha eseguito l'inserimento. Il modo più semplice, se chi inserisce si chiama Mario Rossi, è utilizzare le iniziali seguite da un numero: MR001, MR002, etc. Questa procedura è utile se in futuro ci sarà bisogno di ri-esaminare il cartaceo e/o interpellare chi ha inserito i dati. Se però le esigenze di ricerca impongono somministrazioni ripetute nel tempo e c'è necessità di appaiare i dati relativi agli individui, occorre mettere i soggetti in condizione di generare autonomamente ogni volta il proprio codice. Una possibile soluzione è quella di chiedere di inserire lettere o numeri relativi a caratteristiche immutabili (come l'iniziale del nome del padre e/o della madre) o relativamente immutabili (come le ultime tre cifre del numero di cellulare). Se il procedimento di generazione del codice è noto solo al ricercatore e al soggetto, chiunque altro possa venire in possesso del materiale non troverà che una sigla che, per quanto lo riguarda, può significare qualunque cosa. Per esempio, si può costruire una serie di caselle come quella in Figura 3, chiedendo di inserire nella prima casella l'iniziale del nome della madre, nella seconda l'iniziale del nome del padre e nelle ultime tre caselle le ultime tre cifre del numero di cellulare. Se quindi il numero di cellulare del soggetto Antonio Bianchi è 3331234567, suo madre si chiama Alessandra e suo padre Sergio, il codice sarà AS567. Naturalmente le informazioni su come generare il codice non devono per nessun motivo essere stampate sul foglio dove vengono inseriti i dati.
Figura 2 Codifica di dati testuali in caso di caselle numerate e non numerate
In questo modo ogni volta che dovremo raccogliere informazioni riguardo ad Antonio Bianchi non avremo il problema che il soggetto potrebbe non ricordarsi il proprio codice, dato che basta ripetere la procedura di generazione − sperando che non abbia cambiato numero di cellulare nel frattempo! Quando si inseriscono molti dati nel foglio elettronico, lo schermo scorre a destra e in basso, per cui la prima colonna e/o la prima riga, contenenti rispettivamente i codici dei soggetti e i nomi delle variabili, potrebbero non essere più visibili. Per facilitare l’inserimento mantenendo visibili queste informazioni, basta bloccare sul file di Excel la prima riga e la prima colonna. Si seleziona la casella B2, si va al menu Finestra e si seleziona Blocca Riquadri (Figura 4a). A questo punto il bordo destro della prima colonna e quello inferiore della prima riga saranno neri (Figura 4b), indicando che la colonna e la riga sono “bloccate”, ossia non scompariranno mai dalla visione anche quando le altre celle scorreranno. Per togliere il "blocco", basta ripetere la procedura selezionando questa volta Sblocca Riquadri. Una volta completato l'inserimento, il file dovrebbe apparire come nella parte di destra di Figura 11 (vedi oltre). Ricordatevi sempre di salvare il file e di chiudere Excel. A questo punto siamo pronti per l'importazione in SPSS.
Prima di illustrare la procedura per importare i nostri dati in SPSS, vediamo le caratteristiche principali del software. Una volta che avete lanciato il programma, vi si aprirà una finestra come quella in Figura 5. Lasciando selezionato Open an existing data source , e clickando su OK si aprirà una finestra che consentirà di rintracciare nelle proprie cartelle il file da aprire. Tutte le altre opzioni al momento non ci interessano, e di fatto non è necessario interagire con questa finestra per accedere al programma, tanto è vero che può essere esclusa dall'avvio del programma spuntando Don't show this dialog in the future e clickando su OK. Si accederà a questo punto alla finestra di editor dei dati.
Figura 3 Inserimento del codice auto-generato dal soggetto per somministrazioni ripetute. Le istruzioni su come riempire le caselle non devono essere presenti sul foglio
La finestra di editor dei dati appare come un foglio elettronico con le righe numerate e le colonne che recano l'intestazione var grigiata (Figura 6a). In basso a sinistra della finestra notiamo due linguette simili a quelle che identificano i vari fogli di una cartella di Excel : Data View e Variable View (Figura 6b). Data View è la matrice casi × variabili, mentre Variable View è il foglio che contiene le informazioni sulle variabili (Figura 7), della quale si parlerà più estesamente nella sezione 3. Ritornando al foglio Data View , notiamo come in alto sia presente il consueto menu di funzioni di comando.
a)
b) Figura 6 Editor dei dati di SPSS
di output o altri che non siano file di dati.
Figura 7 Foglio Variable View di SPSS
Figura 8 Menu File di SPSS
Figura 9 Finestra Open File di SPSS
Figura 10 Finestra Opening Excel Data Source di SPSS
Se non si sono verificati problemi, come ad esempio nomi "illegali" delle variabili o formati dei dati inattesi, dovremmo visualizzare i dati o nel foglio Variable View o in Data View (dipende dalla versione di SPSS). Se si sono verificati problemi di importazione, si apre automaticamente un nuovo file di output che riporta la natura dell'errore, come nel seguente esempio:
Warning. Command name: GET DATA (2101) The column contained no recognized type; defaulting to "Numeric[8,2]"
- Column #: 61
Warning. Command name: GET DATA (2103) The variable name (truncated to 8 bytes) conflicts with a previously defined variable.
- Variable Name #: "Specific"
- Conflicting Column #: 8
- Duplicate Column #: 10
Il primo messaggio indica che non è stato riconosciuto il tipo di variabile, il secondo che il nome della variabile è stato troncato perché eccedeva gli otto caratteri alfanumerici e/o conteneva caratteri non consentiti. Questi problemi sono comunque facilmente correggibili. Se ritorniamo al file .sav , e scegliamo il foglio Data View , possiamo confrontare l'aspetto del dataset in SPSS con quello in Excel (Figura 11)
Figura 11 Lo stesso dataset in SPSS (in alto) e in Excel (in basso)
Nella colonna Label , inoltre, il software inserisce i nomi delle variabili che non riesce a leggere quando il file viene importato, dopo aver assegnato un nome generico (ad esempio, VAR00001) nella colonna Name. La seconda colonna indica il tipo ( Type ) di variabile. SPSS consente di specificare fino a otto tipi di variabili, ma quelli che a noi interessano sono principalmente Numeric (numerico) e String (stringa di testo). Nel caso della Figura 12 notiamo come SPSS abbia letto correttamente come stringhe le variabili Codice, Genere, Tit_Stu, Profes, St_Civ, ma ci lascia perplessi il fatto che fra le variabili che rappresentano le risposte gli item del test ( test01 , test02 , etc.) una variabile sia indicata come stringa ( test08 ). Questo è dovuto probabilmente alla presenza di un dato anomalo (elemento di testo, o formato irriconoscibile per SPSS e quindi codificato come "?") in quella variabile. A questo punto, se anche correggiamo il problema, il formato della variabile rimane invariato. Per cambiarlo, dobbiamo selezionare la cella della colonna Type relativa alla variabile e
clickare sul piccolo tasto con i tre puntini ( ) che compare sulla destra della cella una volta selezionata. Si aprirà a questo punto il menu che permetterà di spuntare l'opzione Numeric. La colonna Width indica il numero di caratteri massimo che viene utilizzato per visualizzare la variabile. In questa sede, quindi, non è possibile modificare la larghezza della colonna così come appare nel foglio Data View : per questo, occorre modificare il valore nella colonna Columns , più a destra nel foglio. Nella colonna Decimals è possibile impostare il numero massimo di decimali da visualizzare − per le variabili indicate come stringhe di testo naturalmente il valore è immodificabile. Nella colonna Values si possono impostare le etichette per i diversi valori di una variabile categoriale. Supponiamo di aver codificato il genere come 0 = Femmina e 1 = Maschio, e di avere un dataset con i dati in formato numerico. In assenza di altre specificazioni, nelle tabelle di output SPSS riporterà queste categorie come 0 e 1. Se però vogliamo che venga visualizzato il nome della categoria corrispondente, occorre selezionare la cella della colonna Values corrispondente alla variabile e clickare sul tastino con i tre puntini. Si aprirà la finestra Value Labels (Figura 13) Nella finestra occorre inserire il valore numerico corrispondente ad una categoria nel campo Value e l'etichetta che vogliamo assegnare nel campo Value Label. Ogni volta che abbiamo riempito i due campi occorre clickare su Add per confermare l'assegnazione dell'etichetta. Se vogliamo cambiare o correggere un'etichetta, occorre selezionarla dal campo in basso dove sono elencate le etichette, modificare il valore o l'etichetta, e clickare su Change. Quando abbiamo terminato, premiamo OK per tornare al foglio con le variabili. A questo punto la cella della colonna Label non sarà più vuota.
Nella colonna Missing è possibile indicare quali valori devono essere interpretati come valori mancanti. Nella Sezione 1 avevamo visto come per un punteggio su scala Likert da 1 a 5 il valore 0, oppure il valore 9, potessero essere utilizzati come codici per i missing. Se lo abbiamo fatto, possiamo indicarlo in questa colonna. Selezioniamo la cella corrispondente alla variabile, clickiamo sul tastino con i tre puntini sulla destra, e si apre la finestra Missing Values (Figura 14). L'opzione Discrete Missing Values può essere utilizzata sia per variabili numeriche che di testo, e si possono inserire fino a tre diversi valori che rappresentano i missing. L'opzione Range plus one optional discrete missing value , invece, è disponibile solo per le variabili numeriche, e consente di definire come missing un intervallo di valori più un valore discreto. Se non viene indicato niente vengono considerate missing solo le celle vuote (nel gergo di SPSS sono indicati come System Missing ). Nella colonna Align è possibile selezionare l'allineamento del testo all'interno delle celle (Sinstra [ Left ], Destra [ Right ] e Centro [ Center ]), mentre nella colonna Measure è possibile specificare la scala di misura delle variabile (Nominale [ Nominal ], Ordinale [ Ordinal ] e Metrica [ Scale ]).
Figura 13 Finestra Value Labels
Figura 14 Finestra Missing Values
A questo punto possiamo eventualmente scegliere se ricodificare tutti i casi o solo alcuni. Se per assurdo volessimo ricodificare i valori solo per i maggiori di 25 anni, occorrerebbe clikare su If… e accedere alla finestra Recode into Same Variables: If Cases (Figura 16). In questa finestra, dopo aver spuntato Include if case satisfies condition , andremo a
selezionare la variabile Età dal campo di sinistra, la sposteremo con il tasto nel campo di destra, e aggiungeremo da tastiera la dicitura "> 25". Nel campo Functions sono disponibili numerose funzioni matematiche per definire condizioni più complesse. Per tornare alla finestra precedente basta clickare su Continue. Si tenga presente che a questo punto la trasformazione verrà applicata solo ai casi che soddisfano la condizione. In generale, comunque, si tende sempre a ricodificare tutti i casi. Per specificare le regole di ricodifica, nella finestra Recode into same variables dobbiamo clickare su Old and New Values. La nuova finestra che si apre ( Recode into same variables: Old and New Values , Figura 17) è divisa in due: sulla destra abbiamo i vecchi valori ( Old Value ), sulla destra i nuovi ( New Value ). In pratica, basta indicare nel campo Value di destra il valore da ricodificare e in quello di sinistra quello ricodificato, come illustrato in Figura 17, e clickare su Add. La ricodifica comparirà nel campo indicato come Old-->New. Per i casi più complessi è possibile utilizzare, dopo averle spuntate, le opzioni Range. Nella prima ( through ) si può specificare gamma di valori: ad esempio, ricodificare nella stessa categoria tutti casi con età comprese fra 20 e 25 anni; analogamente, Lowest
Figura 16 Finestra Recode into same variables: If cases
through permette di ricodificare con lo stesso valore tutti i valori inferiori a quello indicato, mentre through highest permette di ricodificare con lo stesso valori tutti i valori superiori a quello indicato. All other values permette di ricodificare tutti i valori che non soddisfano le condizioni già impostate. Anche in questo caso è importante ricordarsi di clickare sempre su Add dopo aver impostato la codifica. A questo punto basta clickare su Continue per tornare alla finestra iniziale e poi su OK per ottenere la ricodifica. I valori nella colonna Genere sono ora tutti 0 e 1. Nondimeno, come già suggerito in precedenza, occorre andare a modificare nel foglio Variable View il tipo di variabile (da String a Numeric ) e indicare le etichette per ogni categoria (colonna Values ). Per restare nel menu Transform , vediamo la funzione Compute. Questa funzione permette di applicare funzioni matematiche anche molto complesse ai dati delle variabili. Nel nostro caso, però, la utilizziamo per calcolare il punteggio totale di un test. In pratica, dobbiamo sommare, soggetto per soggetto, i valori delle variabili test01 , test02 , test03 … fino a test18. Per farlo, seguiamo il percorso Transform → Compute. La finestra che si apre ( Compute Variable , Figura 18) è simile a quella in Figura 16. Per prima cosa dobbiamo inserire il nome della variabile che rappresenterà il punteggio totale al test nel campo Target Variable. Clickando su Type & Label è possibile impostare l'etichetta ( Label ) della variabile e il tipo Type ( Numeric o String ). Per definire le operazioni da compiere, basta selezionare le variabili nel campo di sinistra, spostarle nel campo di destra
( Numeric Expression ) col tasto , e utilizzare la tastiera per inserire le operazioni.
Figura 17 Finestra Recode into same variables: Old and New Values
Altri comandi utili possono essere trovari nel menu Data. Ad esempio, il comando Sort Data permette di scegliere una variabile o più variabili in base ai valori delle quali ordinare, in senso ascendente o discendente, tutto il dataset. Il comando Select Cases consente di selezionare solo alcuni soggetti in base a diverse
Di default è spuntata l'opzione All cases (tutti i casi), ma è possibile specificare anche:
Figura 19 Finestra Select Cases
della finestra dell'editor dei dati risulterà barrato, oppure cancellati ( Deleted ), ossia vengono rimossi dal dataset. E' consigliabile eseguire quest'ultima opzione solo su una copia del dataset originario, dato che se un nuovo salvataggio del file comporterebbe la perdita definitiva dei dati relativi ai casi cancellati. Una volta impostate le condizioni di filtro con l'opzione Filtered per i casi non selezionati e premuto OK , i numeri corrispondenti ai casi non selezionati risulteranno barrati e in basso a destra sulla finestra dell'editor dei dati comparirà la dicitura Filter On. Significa che il filtro è attivo e che le analisi verranno realizzate solo sui casi selezionati (non barrati). Per riselezionare tutti i casi occorrerà ritornate alla finestra Select Cases e spuntare All Cases. Se invece si vogliono eseguire simultaneamente le stesse analisi su due o più gruppi di
(Figura 20). Supponiamo di volere realizzare le analisi separatamente per maschi e femmine. In questo caso non abbiamo bisogno di utilizzare la funzione filtro, selezionare i maschi, svolgere le analisi, poi selezionare le femmine e ripetere le analisi, ma basta seguire la seguente procedura: selezionare Compare Groups o Organize Output by Groups , e spostare nel campo Groups Based On la variabile che specifica i gruppi (in questo caso, genere). La differenza fra Compare Groups e Organize Output by Groups è che nel primo caso i risultati di ogni gruppo vengono presentati giustapposti tabella per tabella, così da permettere un confronto immediato, mentre nel secondo vengono presentate prima tutte le tabelle del primo gruppo, poi tutte quelle del secondo e così via. È consigliabile inoltre spuntare l'opzione Sort the file
Figura 20 Finestra Split File