Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Sintesi del libro L'ABC del programma SPSS, Sintesi del corso di Psicologia Generale

Guida ai comandi del programma SPSS 10.0

Tipologia: Sintesi del corso

2019/2020

In vendita dal 06/03/2020

rossella_medaglia
rossella_medaglia 🇮🇹

4.3

(15)

23 documenti

1 / 14

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
LABC del programma SPSS
Di Andrea Mastrolilli, Laura Petitta
Laura Borgogni e Patrizia Steca
Come avviarsi alla pratica
del pacchetto statistico
Sintesi di Rossella Medaglia
Capitolo 1. Presentazione di SPSS 10.0 per Windows
Non appena si apre il programma, appare una schermata simile ad un foglio
elettronico sulla quale è sovrapposta una finestra. Questa finestra consente di
scegliere tra sei diverse opzioni (Apri guida, Inserisci dati, Apri una query
esistente, Crea nuova query usando il Database Wizard, Apri una fonte di dati
esistente, Apri un altro tipo di documento). È anche possibile scegliere di non
vedere questa finestra di dialogo iniziale nelle applicazioni future, attivando
l’opzione Non mostrare questa finestra in futuro.
Le finestre di SPSS
Data Editor;
Output-Viewer (Risultati);
Syntax (Sintassi).
La prima finestra che viene aperta automaticamente quando si avvia una
sessione di SPSS e quella denominata Data Editor. Nel Data Editor è possibile
creare nuovi file di dati o modificare quelli esistenti; il Data Editor costituisce,
infatti, il foglio elettronico di SPSS che contiene i dati che devono essere
analizzati. I dati che verranno inseriti costituiscono il dataset (corpo dati) su cui
verranno eseguite le analisi statistiche.
La finestra Data Editor offre due modalità di visualizzazione dei dati:
Vista dati, che per ogni colonna visualizza i dati effettivi relativi ad una
variabile, quando presenti
Vista variabile, che visualizza per ogni riga una serie di informazioni di
definizione della variabile tra cui, ad es., il nome o l’etichetta che le sono
stati assegnati (Nome); il tipo di variabile: se stringa o dati numerici
(Tipo); di quanti caratteri è composta la variabile (Larghezza); il valore
assegnato ai dati mancanti (Mancante).
In entrambe le visualizzazioni sopra descritte è possibile aggiungere, modificare
ed eliminare le informazioni contenute nel file di dati, come in un qualsiasi foglio
elettronico.
Per inserire una nuova variabile, si seleziona la colonna accanto alla quale si
vuole inserire la variabile e successivamente: Dati Inserisci Variabile
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe

Anteprima parziale del testo

Scarica Sintesi del libro L'ABC del programma SPSS e più Sintesi del corso in PDF di Psicologia Generale solo su Docsity!

L’ABC del programma SPSS

Di Andrea Mastrolilli, Laura Petitta Laura Borgogni e Patrizia Steca Come avviarsi alla pratica del pacchetto statistico Sintesi di Rossella Medaglia

Capitolo 1. Presentazione di SPSS 10.0 per Windows

Non appena si apre il programma, appare una schermata simile ad un foglio elettronico sulla quale è sovrapposta una finestra. Questa finestra consente di scegliere tra sei diverse opzioni (Apri guida, Inserisci dati, Apri una query esistente, Crea nuova query usando il Database Wizard, Apri una fonte di dati esistente, Apri un altro tipo di documento). È anche possibile scegliere di non vedere questa finestra di dialogo iniziale nelle applicazioni future, attivando l’opzione Non mostrare questa finestra in futuro. Le finestre di SPSS  Data Editor;  Output-Viewer (Risultati);  Syntax (Sintassi). La prima finestra che viene aperta automaticamente quando si avvia una sessione di SPSS e quella denominata Data Editor. Nel Data Editor è possibile creare nuovi file di dati o modificare quelli esistenti; il Data Editor costituisce, infatti, il foglio elettronico di SPSS che contiene i dati che devono essere analizzati. I dati che verranno inseriti costituiscono il dataset (corpo dati) su cui verranno eseguite le analisi statistiche. La finestra Data Editor offre due modalità di visualizzazione dei dati:  Vista dati, che per ogni colonna visualizza i dati effettivi relativi ad una variabile, quando presenti  Vista variabile, che visualizza per ogni riga una serie di informazioni di definizione della variabile tra cui, ad es., il nome o l’etichetta che le sono stati assegnati (Nome); il tipo di variabile: se stringa o dati numerici (Tipo); di quanti caratteri è composta la variabile (Larghezza); il valore assegnato ai dati mancanti (Mancante). In entrambe le visualizzazioni sopra descritte è possibile aggiungere, modificare ed eliminare le informazioni contenute nel file di dati, come in un qualsiasi foglio elettronico. Per inserire una nuova variabile, si seleziona la colonna accanto alla quale si vuole inserire la variabile e successivamente: Dati  Inserisci Variabile

Del tutto simile è la procedura per l’inserimento di un nuovo soggetto. Si seleziona la riga sopra la quale si vuole inserire un nuovo soggetto e quindi: Dati  Inserisci caso Qualora si voglia annullare l’inserimento, di un soggetto o di una variabile, si possono annullare i comandi selezionando: Modifica  Annulla inserisci caso (o come in Word, la freccina volta a sinistra) Volendo invece eliminare un soggetto od una variabile si seleziona la corrispondente riga (o colonna nel caso della variabile) e si preme il tasto Canc della tastiera oppure: Modifica  Cancella Se si desidera taglia una riga o una colonna: Modifica  Taglia Se si vuole incollare in un’altra posizione la colonna o la riga tagliata, si posiziona il cursore nel punto del data editor prescelto e successivamente: Modifica  Incolla La finestra Viewer viene aperta automaticamente la prima volta che viene eseguita un’operazione che genera un Output. I risultati nel Viewer di solito sono riportati in tabelle la cui forma e contenuto dipende dal tipo di analisi effettuata e dalle impostazioni che sono state selezionate. A tal fine si può aprire una nuova finestra Viewer, dove copiare i risultati che interessano, mediante: File Nuovo  Risultato (output) Il Viewer è suddiviso in due riquadri, inizialmente vuoti, che dopo le analisi conterranno:  Il riquadro sinistro, una sintesi del contenuto dell’Output;  Il riquadro destro, le tabelle con i risultati delle analisi statistiche, i grafici elaborati e il testo dell’Output. La finestra Viewer consente di operare con estrema flessibilità e decidere quale parte dell’Output visualizzare; è infatti possibile: a. spostarsi nella lettura dei risultati; b. visualizzare o nascondere le tabelle e i grafici riportati; c. salvare e spostare/copiare elementi del Viewer in altre finestre di Output. Un’icona a libro aperto a fianco di un elemento del riquadro di sintesi indica che esso è correntemente visibile nel riquadro di visualizzazione. Per nascondere una tabella o un grafico senza eliminarli, è necessario cliccare sull’icona a forma di libro nel riquadro di sintesi. L’icona a forma di libro aperto si trasforma così in un’icona di libro chiuso, ad indicare che l’elemento è ora nascosto. Se si vogliono nascondere oltre alle tabelle dei risultati anche gli elementi riportati nel riquadro di sintesi, è possibile cliccare sulla casella a sinistra dell’elemento che si desidera nascondere, oppure evidenziare l’elemento e scegliere dai menù: Visualizza  Comprimi, in alternativa si può utilizzare il tasto-icona con il segno “meno” dalla barra degli strumenti in alto. Al contrario, se si vogliono visualizzare degli elementi che sono stati nascosti si utilizza il tasto-icona con il segno “più” oppure: Visualizza  Espandi.

Capitolo 2. Inserimento dei dati

Il pacchetto SPSS può elaborare dati che sono stati inseriti utilizzando vari programmi e formati, i più comuni dei quali sono: EXCEL, WORD. Per procedere all’inserimento dei dati (ricavati ad es. dalla somministrazione di un questionario) mediante un qualsiasi programma, bisogna prima predisporre la codifica degli stessi, ossia decidere che tipo di nome-etichetta assegnare a d ogni variabile (come ad es. le informazioni socio-demografiche, gli item) e che tipo di valori attribuire ad ogni alternativa della scala di risposta (che può essere a livello nominale, ordinale, ecc.). La codifica dei dati è un’operazione intermedia nel passaggio da un questionario compilato ad una matrice dati e dovrebbe seguire alcune regole che, oltre a facilitare l’inserimento dei dati, consentono una immediata lettura della matrice dati anche a chi non ha condotto personalmente le somministrazioni. Le scale di misura Quando misuriamo qualcosa, trasformiamo una serie di eventi in numeri, cioè cerchiamo di stabilire una corrispondenza biunivoca tra “numeri” ed “eventi”. La scala di misura è la funzione di relazione che stabiliamo tra il sistema empirico degli eventi e quello numerico. Le scale più utilizzate nella ricerca statistica sono: nominali, ordinali, ad intervalli e a rapporti equivalenti. Le prime due vengono definite “non parametriche”, mentre le seconde “parametriche”. N.B:  Scala Nominale: i valori dei dati rappresentano categorie senza alcun ordine intrinseco (ad es., categoria lavorativa o reparto di una società). Le variabili nominali possono essere valori di stringa (alfanumerici) o numerici che rappresentano categorie distinte (ad es., 1 = maschile, 2 = femminile).  Scala Ordinale: i valori dei dati rappresentano categorie con qualche ordine intrinseco (ad es., basso, medio, alto; molto favorevole, favorevole, contrario, molto contrario). Le variabili ordinali possono essere valori di stringa (alfanumerici) o numerici che rappresentano categorie distinte (ad es., 1 = basso, 2 = medio, 3 = alto).  Scala ad intervalli equivalenti: è un sistema di classificazione nel quale i valori dei dati consentono di stabilire una relazione di distanza tra più oggetti misurati, a partire da uno zero fissato in modo arbitrario e stabilendo una unità di misura costante. Le operazioni possibili sono sulle differenze tra i valori della scala: quello che rimane costante infatti è il rapporto tra i vari intervalli.  Scala a rapporti equivalenti: sistema di classificazione che, a differenza del precedente, consente di eseguire operazioni aritmetiche direttamente sui valori della scala, essendo l’origine della scala uno zero assoluto. Misura la quantità effettiva di una caratteristica: quello che rimane costante infatti è il rapporto tra i valori della scala. La codifica dei dati

Nella pianificazione della codifica dei dati è opportuno tenere presente alcune regole:  Le variabili devono essere rappresentate in formato numerico: se ad ogni variabile corrisponde un numero, si facilita la gestione dei dati;  I casi devono essere contraddistinti da un numero d’ordine: è bene assegnare ad ogni soggetto (caso) un numero identificativo progressivo in modo da avere una corrispondenza tra il soggetto del file dati ed il questionario relativo al medesimo soggetto. Per la scelta dei codici numerici da assegnare alle categorie di risposta si deve tenere presente che:  I codici devono essere mutuamente escludentesi, ovvero ogni risposta deve cadere in una sola categoria;  È consigliabile una coerenza nella scelta dei codici;  È consigliabile una omogeneità dei codici con il tipo di risposta rappresentato. I file che contengono i dati da sottoporre ad una elaborazione statistica con SPSS possono essere di diversi formati, tra i quali i più comunemente usati sono:  File creati con il programma Excel;  File in formato ascii, cioè solo testo senza formattazioni;  File dati nel formato SPSS (il dataset), ottenuti inserendo i dati direttamente nel Data Editor. È importante evitare “buchi” cioè caselle vuote nel file dati; se un soggetto non ha risposto ad alcuni item è bene inserire un valore prestabilito come valore mancante (di solito si inserisce il valore “9”). Se per inserire i dati rilevati con un questionario si intende utilizzare un programma di videoscrittura (ad es. Word) invece che un foglio elettronico di Excel, si dovrà procedere a costruire un file nel quale riportare per ogni riga i valori di tutte le variabili corrispondenti ad un caso. È importante ricordare che una volta creato il file dati, questo andrà salvato come File solo testo e non come documento Word. Si ricorda che la finestra dei dati è simile ad un foglio di lavoro Excel, con celle organizzate in righe e colonne. Le colonne contengono le variabili. Ciascuna colonna rappresenta una variabile o una caratteristica da misurare, come ad es. ogni voce del questionario. Le righe rappresentano i soggetti (i casi). Ogni persona che risponde a un questionario, ad es., rappresenta un caso. La cella è l’intersezione tra il caso e la variabile e contiene il valore del soggetto nella variabile corrispondente. L’immissione di dati numerici è un’operazione facile. Basta selezionare una cella, immettere il numero e utilizzare il mouse o le frecce direzionali per passare alla cella successiva. Se non è stato assegnato un nome alla variabile, l’Editor dei dati ne assegnerà automaticamente uno che comparirà nell’intestazione della colonna corrispondente. Definizione delle variabili

Capitolo 3. Apertura dei file dati

Con SPSS è possibile importare dati da file creati utilizzando diversi altri programmi; tra questi i più comuni e quelli maggiormente impiegati nelle ricerche in Psicologia sono i file Excel e i file di testo. Per aprire un file di dati in SPSS è necessario selezionare: FileApriDati Cliccando nel campo in basso a sinistra Tipo file, si apre un elenco che riporta tutte le possibili tipologie di file di diversi programmi. Volendo aprire un file di dati immessi con Excel, si seleziona, tra le alternative possibili nell’elenco, la voce con l’estensione del file di Excel (*.xls). Nella finestra Open File è presente il tasto Incolla. Questo può risultare di grande utilità in quanto serve a trascrivere su un file i comandi selezionati dall’inizio della sessione di lavoro tramite le icone o i menù. Un file dati importato da Excel può essere salvato in formato SPSS mediante il comando Salva come… dal menù File e riutilizzato in successive analisi, evitando di aprire nuovamente i dati Excel da sottoporre ad analisi. Se i dati che s’intende aprire sono in un file di testo semplice (con estensione *.txt), si seleziona: FileLeggi dati testuali (da importa dati)

La “pulizia” dei dati (screening)

Prima di procedere all’analisi dei dati è fondamentale controllare che nel loro inserimento non siano stati commessi errori. È bene procedere pertanto ad un controllo (screening) dei dati inseriti, verificando che non ci siano ad esempio valori non previsti dovuti ad errori di battitura, che non si sia omessa qualche variabile, che non ci siano spazi vuoti nel dataset, ecc. Ci sono numerosi modi per controllare la bontà e la precisione dell’inserimento dei dati; tra di essi, uno dei più comunemente utilizzati è l’ analisi delle frequenze. Prima di procedere all’analisi dei dati è fondamentale controllare che nel loro inserimento non siano stati commessi errori. È bene procedere pertanto ad un controllo (screening) dei dati inseriti, verificando che non ci siano ad esempio valori non previsti dovuti ad errori di battitura, che non si sia omessa qualche variabile, che non ci siano spazi vuoti nel dataset, ecc. Ci sono numerosi modi per controllare la bontà e la precisione dell’inserimento dei dati; tra di essi, uno dei più comunemente utilizzati è l’analisi delle frequenze. L’analisi delle frequenze ci consente di vedere quante persone hanno risposto in un determinato modo ad una certa variabile. La frequenza può essere calcolata su ogni tipo di variabile, indipendentemente dalla sua scala di misura e dall’ampiezza di tale scala. Si può, quindi, effettuare l’analisi delle frequenze per scale di tipo:  Nominale  Ordinale  Ad intervalli, come le variabili misurate con scale di tipo Likert (la scala impiegata per il questionario della ricerca adottata ad es.). Il calcolo delle frequenze, nell’ambito dello screening dei dati, ci consente di:  Verificare che i valori presenti rientrino nella gamma dei valori previsti per la variabile considerata;  Verificare l’eventuale presenza di casi mancanti;  Verificare la distribuzione delle risposte relative ad una specifica variabile. Per attivare l’analisi delle frequenze, procediamo come segue: AnalizzaStatistiche DescrittiveFrequenze È bene ricordare che nel caso di variabili che si basano su scale di tipo nominale o ordinale (come ad es. il sesso, il titolo di studio, la posizione in una graduatoria ecc.), non ha senso chiedere il calcolo di indicatori come la media o la deviazione standard, ma è certamente utile effettuare il calcolo delle frequenze, così come i valori massimo e minimo e il range di variazione delle risposte. Ogni tabella dell’Output ha il nome della variabile per la quale è stato richiesto il calcolo delle frequenze.

Capitolo 5. La trasformazione e le operazioni sui dati

Attraverso il comando Calcola è possibile eseguire delle operazioni aritmetiche tra le variabili. È possibile cioè applicare alcune operazioni (somma, media, ecc.) tra di esse o eseguire alcuni calcoli di tipo matematico sui dati a disposizione. L’impiego di questa istruzione è ampio: solitamente viene utilizzata per generare una nuova variabile che deriva dalla somma dei punteggi degli item che la costituiscono. Per attivare questa funzione si seleziona: TrasformaCalcola variabile La prima cosa da fare è digitare il nome (max 8 lettere) della nuova variabile da calcolare nel campo Etichetta della variabile. Si può procedere a questo punto in due modi:

  1. Nel campo di sinistra dove sono elencate le variabili si evidenziano una alla volta quelle che si desiderano, ad esempio, sommare e si portano nel campo Espressione numerica.
  2. Nel caso si vogliano eseguire funzioni particolari, come ad esempio la media dei valori degli item, queste possono essere selezionate dal campo Funzioni. Alla fine si preme il tasto OK e si ottiene nella finestra dei dati una nuova colonna con l’intestazione della nuova variabile. Avendo creato una nuova variabile, è consigliabile eseguire anche su di essa le analisi descrittive per verificare la sua distribuzione e le statistiche principali (media, deviazione standard, ecc.). Per far ciò si può procedere selezionando dal menù Analizza e dall’elenco Statistiche descrittive il comando Frequenze. A volte può essere necessario assegnare alle variabili valori differenti rispetto a quelli di partenza. Il caso più comune si verifica quando si vuole codificare un valore come missing (mancante). Per attivare il comando Ricodifica si seleziona: TrasformaRicodifica Si apre una tendina con due alternative:  Ricodifica nelle stesse variabili, per sostituire un valore assunto da un variabile con un altro, senza modificare il suo nome o l’etichetta;  Ricodifica in variabili differenti, per sostituire un valore assunto da un variabile con un altro, modificando il suo nome o l’etichetta e originando una nuova variabile in una nuova colonna. Il comando Ricodifica nelle stesse variabili è utile nel caso si voglia sostituire un valore assunto da una variabile con un altro valore (ad es. il valore mancante indicato con il “9”, con la media della variabile). In questo caso la ricodifica viene eseguita dal programma nel file dati attivo sostituendo, nella colonna relativa, la variabile da modificare con la nuova variabile ricodificata. I comandi da utilizzare sono:

TrasformaRicodificaNelle stesse variabili Per aggiungere al dataset nuove variabili costituite da variabili ricodificate si può utilizzare l’opzione “ Ricodifica in variabili differenti ” che, anche se leggermente più complessa della prima, è preferibile perché non modifica le variabili originali contenute nella finestra dati. In tal caso si aggiungeranno nuove variabili in fondo alla matrice dei dati in memoria, senza perdere così l’informazione contenuta nella variabile originaria, cosa che succede invece utilizzando la modalità “Ricodifica nelle stesse variabili”. Questa procedura è utilizzata solitamente per invertire le scale di risposta di alcune variabili (come ad es. domande di questionari formulate in negativo) e per effettuare la divisione in categorie di variabili continue. Selezionando: TrasformaRicodificaIn variabili diverse La prima cosa da fare è attribuire il nome alla nuova variabile che stiamo per creare. Alla fine delle impostazioni si preme Continua e, una volta nella finestra principale, OK per dar corso alla creazione della nuova variabile che apparirà automaticamente nella finestra dati nell’ultima colonna. L’ istruzione Conta serve a riassumere in una nuova variabile la frequenza con cui un dato valore è presente in una lista di variabili. Selezionando: TrasformaConta Le osservazioni mancanti possono creare problemi durante l’analisi dei dati e non è possibile eseguire correttamente alcune operazioni statistiche se i dati presentano valori mancanti. I nuovi nomi di variabile verranno attribuiti automaticamente dal programma nel dataset e saranno costituiti dai primi sei caratteri della variabile esistente dalla quale sono stati creati, seguiti da un trattino basso (“_”) e da un numero sequenziale. Per sostituire i valori mancanti si procede scegliendo dal menù: TrasformaSostituisci i valori mancanti Alcuni tra i metodi disponibili per sostituire i valori mancanti sono:  Media delle serie, consente di sostituire i valori mancanti con la media dell’intera serie di valori;  Media di punti vicini;  Mediana di punti vicini. Una volta impostati metodo e nome della nuova variabile si avvia la sostituzione attraverso il tasto OK. Può essere necessario effettuare delle analisi limitandole ad una sola parte del campione, ad esempio ad una determinata fascia di età, ad una particolare area

A) In quello di sinistra vengono riportate le variabili non appaiate, ossia le variabili che non sono presenti in entrambi i file da unire e che quindi può essere necessario escludere dal nuovo file dati unito. B) Nel campo di destra, Variabili nel nuovo file dati, sono riportate le variabili che saranno presenti nel nuovo file dati di lavoro, ovvero le variabili da includere nel nuovo file dati unito. Infine è possibile rimuovere dalla lista le variabili che non si desidera includere nel file unito attraverso il tasto con la freccia posto al centro della finestra. Alla fine delle operazioni si preme OK e si otterrà il file dati con il numero di casi aggiornato secondo quanto richiesto. L’opzione Aggiungi variabili consente di unire il file dati di lavoro con un file dati esterno contenente gli stessi casi, ma variabili diverse. Il programma esclude per default i nomi delle variabili del secondo file dati uguali ai nomi delle variabili del file dati di lavoro poiché si presume che tali variabili contengano informazioni duplicate. Per procedere si seleziona: DatiUnisci fileAggiungi variabili Rimanendo nel menù Dati, è disponibile un’altra istruzione molto utile, Ordina i casi , che ci permette di ordinare i casi o i soggetti, ovvero le righe del nostro file dati, sulla base dell’ordine assunto dai valori di una o più variabili del set di dati. È possibile ordinare i casi in modo crescente o decrescente. DatiOrdina casi All’interno della finestra si trova il consueto elenco variabili sulla sinistra e un campo centrale, denominato Scegli per, nel quale va riportata la variabile (o le variabili) in base alla quale si vuole ordinare i casi. È possibile selezionare più d’una variabile di ordinamento.

Capitolo 6. Frequenze incrociate (tabelle a doppia entrata)

Nel corso delle analisi che si conducono solitamente sui dati può essere necessario studiare la co-occorrenza di due o più frequenze , ovvero verificare l’andamento delle frequenze di due o più variabili per studiare quanto alla presenza di una certa modalità di risposta riguardante una variabile, si associa una modalità di risposta su un’altra variabile che ci interessa studiare in relazione alla prima. Questa statistica di associazione tra le variabili presenti in una ricerca può essere utile anche per verificare, dopo la somministrazione, se il campionamento della popolazione ha rispettato un determinato criterio prefissato (verificando ad es. se è presente lo stesso numero di maschi e femmine o di dirigenti ed impiegati, ecc.). Il comando Crosstabs (Tabelle di contingenza-Tabelle incrociate) Attraverso il comando Crosstabs è possibile incrociare, tramite tabella, due o più variabili della matrice dei dati allo scopo di ottenere un conteggio delle ricorrenze di determinati valori di una variabile confrontabili con quelli di un’altra variabile. AnalizzaStatistiche descrittiveTabelle incrociate L’elenco delle variabili presenti nella matrice dei dati è nel campo di sinistra, soltanto che ora dobbiamo selezionare due variabili, delle quali vogliamo incrociare le frequenze. In fondo alla finestra troviamo due opzioni attivabili:  Display clustered bar charts, per produrre un grafico a barre raggruppato per ogni combinazione di variabili di riga e di colonna;  Suppress tables, che mostra le statistiche associate alla tavola di contingenza, senza mostrare le tabelle. Statistics apre la finestra relativa alle statistiche che, per default, ci appare senza che sia attivata nessuna delle statistiche opzionali. Le prime due opzioni che si incontrano in alto sono:  Chi-quadrato;Correlazioni