






Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Il documento è composto dalla sintesi del libro proposto dai professori integrata agli appunti presi a lezione. Presenta tutta la forma teorica trattata e tutti i comandi da utilizzare passo-passo su SPSS, comprese immagini e spiegazioni di tutte le tabelle output. Insieme alla prima parte del corso, questo documento mi ha permesso di arrivare ad una valutazione di 30 e lode
Tipologia: Sintesi del corso
1 / 10
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!







Il questionario su cui lavoriamo è una rilevazione di opinioni sul movimento no TAV (progetto treno alta velocità torino-lione presentato in Val Susa). Presenta alcune domande generali (es la prima è una batteria sulle istituzioni), altre più specifiche relative a conoscenza e valutazione del TAV. Il questionario chiude con domande generali riferite ai partiti politici. Matrice dati caso x variabile riga: rispondente, colonna: variabili Elenco variabili contenute nel dataset: ognuna corrisponde a una domanda del questionario. Esempi di domande all’esame: Quando è utile ricodificare? Troppe modalità di risposta, quando sono orientate in un modo controintuitivo Cosa ci dice una correlazione? Con quale livello di scala di variabile si può testare una correlazione? Quali sono gli step da seguire prima di poter creare un indice quando si ha una batteria? controllo rispetto a come sono orientati gli item, capovolgerne alcuni… Cosa sono le tabelle di contingenza? Quando servono? Può servire per controllare di aver fatto bene le ricodifichi oppure per analizzare l’associazione tra due variabili attraverso il test del chi quadrato Che cosa è il chi quadrato? quando si usa? quali sono gli elementi importanti da considerare nella lettura del chi quadrato? La prima cosa che si guarda è la significatività e poi i residui standardizzati LA FINESTRA DATA EDITOR Prima finestra che si apre automaticamente, è il foglio elettronico che contiene i dati che devono essere analizzati. Da qui è possibile creare nuovi file di dati o modificare quelli esistenti. I dati inseriti costituiscono il dataset. Questa finestra è visionabile in 2 modalità: Data View (per ogni colonna visualizza i dati relativi a una variabile) e in modalità “Variable View” dove è possibile indicare le etichette delle variabili e delle loro modalità e i valori mancanti In questa finestra in alto è presente la barra menù con diversi comandi, i principali sono: “ file ” Dove troviamo operazioni relative all’apertura, salvataggio stampa e chiusura del file e del programma, “ edit ”, per modificare i dati nelle finestre (esempio selezionare, copiare o tagliare parti di dati o di output), “ view ”, che contiene opzioni tra le quali quelle per passare dalla visualizzazione dati alla visualizzazione variabili e viceversa, “ transform ”, che contiene una serie di comandi per la trasformazione dei dati e la creazione di nuove variabili, quella che utilizziamo di più è “ Analyze ” che consente di eseguire le principali funzioni di analisi dei dati. LA FINESTRA OUTPUT-VIEWER Riporta i risultati delle analisi statistiche eseguite. Di solito questi risultati sono riportati in tabelle. È diviso in due riquadri: uno contenente una sintesi del contenuto dell’output, un contenente le tabelle. La barra dei menù relativa a questa finestra contiene gli stessi comandi di quella precedente e in aggiunta: “ insert ” per inserire nell’output interruzioni di pagina, intestazioni, titoli, eccetera e “ format ” che consente di gestire l’allineamento grafico dell’output LA FINESTRA SYNTAX È un file di testo all’interno del quale si possono scrivere i comandi in linguaggio SPSS per preparare i dati e per eseguire su essi trasformazioni e analisi. L’attivazione della sintassi e quindi l’esecuzione dei comandi ce essa contiene avviene tramite il tasto Run (freccia verde). Rispetto alle precedenti finestre contiene in aggiunta il menù “ run” che consente di eseguire i comandi di sintassi. PRINCIPALI OPERAZIONI Inserimento dei dati e creazione di un file dati Informazioni sulle variabili: Nome : nome della variabile (che non può contenere spazi o iniziare con un numero non più lunghi di 25 caratteri) Etichetta : descrizione variabile. Valori : descrizioni delle modalità di risposta. Sono i numeri con cui ogni modalità di risposta è stata codificata, questi codici devono essere mutualmente escludentesi, è consigliabile una coerenza nella scelta dei codici (ad esempio se si è utilizzato 1 per la risposta sì di una variabile, lo stesso codice per le altre) ed è consigliata una omogeneità dei codici con il tipo di risposta rappresentato (1 per il valore più piccolo). Mancanti : possono essere valori mancanti discreti (valori che devono essere considerati come mancanti esempio indicati con dei 9) gamma dei valori mancanti (un continuum di valori da considerare come missing ad esempio tutti i valori superiori a 8) oppure una gamma dei valori mancanti +1 discreto. Le scale di misura : quando misuriamo qualcosa, trasformiamo una serie di eventi in numeri, la scala di misura è la funzione di relazione che stabiliamo tra pubblico degli eventi e quello numerico. Scala nominale: i valori dei dati rappresentano categorie senza alcun ordine, possono essere valori di stringa (alfanumerici) o numerici che rappresentano categorie distinte (ad esempio 1= femminile, 2= maschili), scala ordinale : i valori dei dati rappresentano categorie con qualche ordine intrinseco (ad esempio basso medio alto, favorevole contrario) possono essere valori di stringa o numerici (1=basso, 2=alto) la scala ad intervalli equivalenti : è un sistema di classificazione nel quale i valori consentono di stabilire una relazione di distanza tra più oggetti misurati, a partire da uno 0 fissato in modo arbitrario e stabilendo un’unità di misura costante. Non consente di sapere la quantità effettiva di una caratteristica misurata, ma stabilisce la loro posizione e la loro distanza. Scala a rapporti equivalenti: sistema di classificazione che a differenza del
precedente, consente di eseguire operazioni aritmetiche direttamente sui valori della scala, essendo l’origine della scala uno 0 assoluto. Misura la quantità effettiva di una caratteristica, quello che rimane costante infatti è il rapporto tra i valori della scala. Apertura di un file dati Con SPSS è possibile importare dati da file creati utilizzando diversi altri programmi. I più comunemente usati sono:
Istruzione dividi file: un altro metodo per condurre calcoli e analisi separatamente su specifiche parti del campione. Si possono presentare contemporaneamente i risultati per ogni sottogruppo oppure rappresentare i risultati separatamente per ogni sottogruppo. Istruzione unisci file: È possibile aggiungere nuovi casi (Consentendo di unire il file dati di lavoro con un secondo file dati contenente le stesse variabili, ma casi diversi) o nuove variabili al file originario (consente di unire file dati di lavoro con file dati esterno contenente stessi casi ma variabili diverse). Istruzione ordina casi: ci permette di ordinare i casi o i soggetti, ovvero le righe del nostro file dati, sulla base dell’ordine assunto dai valori di uno o più variabili del set di dati in modo crescente o decrescente. FREQUENZE INCROCIATE- Tabella di contingenza In base alla quale si possono confrontare in un’unica tabella le frequenze di due variabili per studiare quanto alla presenza di una certa modalità di risposta riguardante una variabile, si associa una modalità di risposta su un’altra variabile che ci interessa studiare in relazione alla prima. Servono ad analizzare l’associazione tra due variabili nominali (o massimo ordinali), il test per stabilire la significatività dell’associazione è il chi quadro. Consigliato il loro uso anche per controllare la correttezza di una ricodifica in variabili differenti Variabileanalizza statistiche descrittive tabelle di contingenza. Su righe “x_amp” su colonne “prov_To”. Emerge es. riga 1: chi aveva messo ampiezza centro 1 (meno di 5.000) sta nella colonna 1 di variabile provincia Torino (la prima colonna corrisponde a 1= stavano fuori torno) e così via. RELAZIONI TRA VARIABILI Associazione (CHI QUADRATO) È un indice statistico di associazione tra due variabili, utile per esaminare le distribuzioni dei valori assunti da variabili misurate a livello nominale. Si basa sulla quantificazione del rapporto tra le frequenze rilevate in ciascun gruppo di soggetti e le frequenze attese se fossero equamente distribuite tra i vari gruppi. È sempre superiore a 0 a meno che l’ipotesi nulla (le frequenze attese=quelle rilevate) sia vera e in quel caso sarà uguale a 0. Es. Genere (donna-uomo) e occupazione (occupato-disoccupato) Cosa succederebbe se non ci fosse una relazione? Se il genere non c’entrasse nulla con la disoccupazione/occupazione, avremmo un 25% in ognuna delle 4 situazioni. Quello che fa il chi quadro è un confronto tra le frequenze attese (25%) e quello che troviamo nei nostri dati (frequenze osservate). Il chi quadro calcola se la differenza tra le due frequenze è grande o piccola, se è grande è difficile che la differenza sia dovuto al caso, probabilmente quindi c’è una relazione. Il test della significatività misura la probabilità che l’ipotesi nulla sia vera e quindi quanto è attribuibile al caso. Significatività statistica : quanto i risultati sono attribuibili al caso? Un test è statisticamente significativo se il p-value è<0.05 non è dovuto al caso ma esiste effettivamente una relazione, un effetto tra le variabili (abbiamo il 5% di probabilità che la relazione che osserviamo sia attribuibile al caso). Questo si può osservare su SPSS. Abbiamo due variabili nominali: è vero che chi risiede in val di Susa si informa di più rispetto al TAV? Incrociamo variabile “vals” e “Info_Tav”
c’è quindi un’associazione significativa positiva fra la riga e colonna, se il residuo è minore di -2, nella cella in questione le frequenze osservate sono significativamente minori di quelle attese. Tra + e -2 non c’è associazione significativa. Quando >2 si andrà a interpretano le differenze: in questo caso i residui più alti sono quelli relativi alla riga 3 (quelli più informati) c’è relazione positiva tra informarsi molto e stare in val Susa e lo capiamo perché il residuo adattato ci mostra che in quella parte abbiamo più persone (frequenza osservata) rispetto a quello che ci saremmo aspettati (frequenza attesa) Utilizzi Chi quadro
- Bias dell’ottimismo irrealistico : tendenza a pensare che sia più probabile che ci accadano cose positive piuttosto che negative. Si può testare questo bias con due variabili: atteggiamento nei confronti del tav (d11ric) e quando secondo me sarà
tempo molto breve.
- Effetto del falso consenso Poi test chi quadro per test effetto del falso consenso : tendenza psicologica a credere che le proprie opinioni, valori e comportamenti siano più comuni e ampiamente condivisi di quanto non siano in realtà. Utilizzo d11ric (atteggiamenti nei confronti del Tav) e d20. (quanti abitanti fanno parte del movimento no Tav) I residui adattati ci dicono se siamo davanti ad un effetto del falso consenso: residuo adattato prima riga=6,3 statisticamente significativo. L’associazione tra l’essere favorevoli al Tav e la percezione di quanti sono contrari è positiva: conferma faso consenso. Controllando anche l’ultima riga (incrocio non favorevoli e percezione maggioranza valsusini ad essere contrari al movimento) emerge di nuovo una associazione positiva e in linea con l’effetto del falso consenso: la gente contraria pensa che maggior parte popolazione sia contraria io tendo a Pensare che la mia opinione sia diffusa CORRELAZIONE Chi quadro= statistica simmetrica, la relazione si può guardare da entrambi i lati, no causa effetto. Correlazione (r di Pearson) = tecnica statistica simmetrica Una correlazione è una misura del grado di concordanza tra due serie di valori. Il coefficiente di correlazione esprime la relazione tra due variabili. I valori che il coefficiente di correlazione può assumere sono quelli compresi tra -1 e +1. Il valore assoluto del coefficiente di correlazione indica l’intensità della relazione (0= nessuna,1= relazione lineare, perfetta) mentre il segno del coefficiente indica la direzione della relazione: positiva (all’aumentare della variabile a aumenta la variabile b), negativa (all’aumentare di a diminuisce b). Il coefficiente di correlazione più comunemente impiegato nella statistica applicata alle scienze sociali è quello di Pearson, rappresentato con una r. Come il chi quadro, ma l’r di Pearson si può calcolare solo quando le variabili coinvolte sono su un livello di scala cardinale. Quando invece entrambe le variabili sono su scala ordinale, oppure una ordinale e una su scala intervalli equivalenti si utilizza il coefficiente di Spearman. L’interpretazione del coefficiente r è una misura di associazione lineare che va fatta anche alla luce della sua significatività, tenendo presente che l’ipotesi nulla prevede una correlazione pari a zero. Vediamo se d11 (atteggiamenti nei confronti del tav) (ha 4 modalità di risposta: del tutto favorevole, abbastanza favorevole, abbastanza contrario, del tutto contrario ordinale ma si può considerare come cardinale) è correlata fiducia nel governo (d1.9) Frequenza dei due item: quando trattiamo item ordinali in che direzione sono orientati gli item (punteggi alti indicano fiducia o sfiducia? Nel nostro il d1.9 caso sfiducia) In questo caso possiamo ricodifica i valori (per orientare la direzione) o
Il valore iniziale (Initial) è sempre 1. Il valore estratto (Extraction) mostra quanto la variabile è rappresentata dal modello fattoriale. Valori più alti (ad esempio > .50) indicano che la variabile è ben spiegata dai fattori; valori molto bassi suggeriscono che la variabile non si integra bene nella struttura fattoriale. In altre parole, questa tabella ti permette di valutare se la soluzione fattoriale trovata cattura adeguatamente le relazioni tra le variabili originali. La tabella successiva è la Factor Matrix (matrice delle saturazioni non ruotate). Qui ogni colonna rappresenta un fattore estratto e ogni riga mostra la saturazione (grado di correlazione tra una variabile e ciascun fattore prima della rotazione) Questa matrice è spesso difficile da interpretare perché i fattori non sono ancora stati “semplificati” dalla rotazione, e quindi una variabile può saturare su più fattori e la struttura non sempre è chiara. Infine, l’ultima tabella importante è la Pattern Matrix (matrice dei pesi dopo la rotazione). Questa tabella riporta le saturazioni delle variabili sui fattori dopo la rotazione, ossia dopo che SPSS ha semplificato la struttura per renderla più interpretabile. Dopo la rotazione:ogni variabile tende a saturare fortemente su un solo fattore, le saturazioni più alte indicano una maggiore correlazione tra variabile e fattore, la struttura dei fattori diventa più chiara. UTILIZZO DELL’ALFA DI CRONBACH da usare con item Cardinali Il calcolo dell’attendibilità può assumere diversi significati: si può intendere la somiglianza dei risultati di uno strumento nel tempo (in questo caso è possibile somministrare allo stesso strumento agli stessi soggetti in tempi diversi e calcolare la stabilità delle risposte nel tempo), tra due strumenti paralleli (si può somministrare due strumenti paralleli agli stessi soggetti nello stesso tempo e verificarne la correlazione nelle risposte), o infine l’attendibilità all’interno di uno strumento, anche chiamata coerenza interna (Nel nostro caso possiamo considerare un gruppo di item associati ad un costrutto alla stregua di uno strumento di rilevazione del costrutto stesso). Per verificare quanto questa scala è attendibile, ovvero quanto è affidabile nel misurare ciò per cui è stata costruita e quanto gli item siano tra loro coerenti nel misurare tutti la stessa cosa si può utilizzare l’indice alpha di Cronbach. Esso è un indice basato sulla media delle correlazioni tra tutti gli item della scala, assume valore 1 in caso di coerenza perfetta tra gli item e 0 in caso di coerenza nulla. Per questo motivo, l’impiego di questo indice ha senso solo se gli item appartenenti alla scala misurano tutti lo stesso costrutto, cioè se la scala è unidimensionale. Creazione di un indice di sfiducia nelle istituzioni Quando ci troviamo davanti ad una batteria di dati con tanti item talvolta abbiamo bisogno di compattarli. Es vogliamo creare un indice complessivo sulla fiducia nell’istituzione a partire da 9 item (d1.1, d1.2, d1.3, d1.4, d1.5, d1.6, d1.7, d1.8, d1.9):
variabili speciali” selezionare Mean (e lanciarlo in alto con la freccia che va in su a sx) inserire nella parentesi gli item incolla lancia comando su sintassi tornare su foglio 1 per visualizzare la nuova variabile
Nel caso in cui si volesse cercare di capire la correlazione tra il d11 (item unico che esprime gli atteggiamenti verso il TAV) e il d18 (batteria di 10 item che misura gli atteggiamenti verso il TAV), una volta fatti tutti i passaggi precedenti si aggiunge il passaggio correlazioni. RELAZIONI CAUSALI La causalità: un ripasso Una variabile è causa di un’altra variabile se il variare della prima causa il variare della seconda. Ad esempio: