Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


L'abc del programma spss riassunto, Appunti di Psicologia Generale

L'abc del programma spss riassunto. Esame prof. Roccato unito

Tipologia: Appunti

2020/2021

Caricato il 22/02/2021

eleonora_guidi
eleonora_guidi 🇮🇹

4.3

(19)

10 documenti

1 / 13

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
L’ABC DEL PROGRAMMA SPSS
CAP. 2 L’INSERIMENTO DEI DATI
Le scale di misura
Quando misuriamo qualcosa trasformiamo una serie di eventi in numeri, cioè si stabilisce una
corrispondenza biunivoca tra “numeri” ed “eventi”. La scala di misura è la funzione di relazione che
stabiliamo tra il sistema empirico degli eventi e quello numerico.
Le scale di misura sono:
- Nominali (non parametrica): i valori rappresentano una categoria senza ordine
- Ordinali (non parametrica): i valori rappresentano categorie con qualche ordine
- Ad intervalli: i valori dei dati consentono di stabilire una relazione di distanza tra più oggetti
misurati, a partire da uno zero fissato in modo arbitrario
- A rapporti equivalenti: sistema di classificazione che permette di eseguire operazioni
aritmetiche sui valori della scala, essendo l’origine della scala uno zero assoluto.
La codifica dei dati
- Le variabili devono essere rappresentate in formato numerico
- I casi devono essere contraddistinti da un numero d’ordine
- I codici devono essere mutualmente escludentesi, ovvero ogni risposta deve cadere in una
sola categoria
- È consigliabile una coerenza nella scelta dei codici (1= si; 2= no).
- È consigliabile omogeneità dei codici (1=sempre valore più piccolo).
Inserimento dei dati con il programma Excel
Per inserire i dati con Excel si devono inserire i dati di ogni soggetto su una riga della griglia ed una
variabile per ogni colonna. È importante ricordarsi di:
- Numerare tutti i questionari e lasciare sempre la prima colonna per il numero d’ordine del
soggetto/questionario che si sta inserendo
- Nominare tutte le colone prima dell’inserimento con qualcosa che ricordi il contenuto della
colonna
- Controllare che tutti i soggetti abbiano un valore per ogni variabile.
Inserimento dei dati in Word
Si deve costruire un file in cui riportare per ogni riga i valori di tutte le variabili corrispondenti al
caso. Il file deve essere salvato come “File solo testo” di due tipi:
- Formato fisso
- Formato libero: le variabili sono registrare nello stesso ordine per ogni caso ma non per
forza nella stessa posizione
Inserimento dei dati direttamente in SPSS
La finestra dati è simile ad un foglio Excel. Le colonne contengono le variabili, le righe i soggetti
(casi).
Definizione delle variabili
Per definire il dataset bisogna codificare i dati, cioè tradurre le informazioni in dati: bisogna quindi
per prima cosa definire la prima variabile (colonna). Oltre a definire il tipo di dati è possibile
impostare anche le etichette (label) dei valori dei dati. Dopo aver definito il tipo di variabile:
- Definire l’etichetta della variabile
- Definire le etichette dei valori assumibili della variabile
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Anteprima parziale del testo

Scarica L'abc del programma spss riassunto e più Appunti in PDF di Psicologia Generale solo su Docsity!

L’ABC DEL PROGRAMMA SPSS

CAP. 2 L’INSERIMENTO DEI DATI

Le scale di misura Quando misuriamo qualcosa trasformiamo una serie di eventi in numeri, cioè si stabilisce una corrispondenza biunivoca tra “numeri” ed “eventi”. La scala di misura è la funzione di relazione che stabiliamo tra il sistema empirico degli eventi e quello numerico. Le scale di misura sono:

  • Nominali (non parametrica): i valori rappresentano una categoria senza ordine
  • Ordinali (non parametrica): i valori rappresentano categorie con qualche ordine
  • Ad intervalli: i valori dei dati consentono di stabilire una relazione di distanza tra più oggetti misurati, a partire da uno zero fissato in modo arbitrario
  • A rapporti equivalenti: sistema di classificazione che permette di eseguire operazioni aritmetiche sui valori della scala, essendo l’origine della scala uno zero assoluto. La codifica dei dati
  • Le variabili devono essere rappresentate in formato numerico
  • I casi devono essere contraddistinti da un numero d’ordine
  • I codici devono essere mutualmente escludentesi, ovvero ogni risposta deve cadere in una sola categoria
  • È consigliabile una coerenza nella scelta dei codici (1= si; 2= no).
  • È consigliabile omogeneità dei codici (1=sempre valore più piccolo). Inserimento dei dati con il programma Excel Per inserire i dati con Excel si devono inserire i dati di ogni soggetto su una riga della griglia ed una variabile per ogni colonna. È importante ricordarsi di:
  • Numerare tutti i questionari e lasciare sempre la prima colonna per il numero d’ordine del soggetto/questionario che si sta inserendo
  • Nominare tutte le colone prima dell’inserimento con qualcosa che ricordi il contenuto della colonna
  • Controllare che tutti i soggetti abbiano un valore per ogni variabile. Inserimento dei dati in Word Si deve costruire un file in cui riportare per ogni riga i valori di tutte le variabili corrispondenti al caso. Il file deve essere salvato come “File solo testo” di due tipi:
  • Formato fisso
  • Formato libero: le variabili sono registrare nello stesso ordine per ogni caso ma non per forza nella stessa posizione Inserimento dei dati direttamente in SPSS La finestra dati è simile ad un foglio Excel. Le colonne contengono le variabili, le righe i soggetti (casi). Definizione delle variabili Per definire il dataset bisogna codificare i dati, cioè tradurre le informazioni in dati: bisogna quindi per prima cosa definire la prima variabile (colonna). Oltre a definire il tipo di dati è possibile impostare anche le etichette (label) dei valori dei dati. Dopo aver definito il tipo di variabile:
  • Definire l’etichetta della variabile
  • Definire le etichette dei valori assumibili della variabile
  • Definire i valori mancanti per la variabile, in tre modi possibili: o Discrete missing values o Range of missing values o Range plus one discrete missing value (=gamma dei valori mancanti più uno discreto). A questo punto è possibile inserire i dati seguendo lo schema di codifica. CAP. 3 APERTURA DEI FILE Con SPSS è possibile importare dati da file creati utilizzando diversi programmi. CAP. 4 LA PULIZIA DEI DATI (SCREENING) L’analisi delle frequenze L’analisi delle frequenze ci consente di vedere quante persone hanno risposto in un determinato modo ad una certa variabile. La frequenza può essere calcolata su ogni tipo di variabile. Il calcolo delle frequenze consente di:
  • Verificare che i valori presenti rientrino nella gamma dei valori previsti per la variabile considerata
  • Verificare l’eventuale presenza di casi mancanti
  • Verificare la distribuzione delle risposte relative ad una specifica variabile. Nel caso di variabili che si basano su scale di tipo nominale o ordinale non ha senso il calcolo di indicatori come la media o la deviazione standard, ma è utile effettuare il calcolo delle frequenze, così come i valori massimo e minimo, e il range di variazione delle risposte. Da ricordare:
  • Skeweness e Kurtosis (asimmetria e curtosi) sono statistiche che servono per valutare se una variabile è distribuita normalmente. Per una distribuzione normale il valore delle statistiche è pari a 0. L’asimmetria misura come le osservazioni del campione si distribuiscono rispetto alla media della distribuzione normale; i valori negativi indicano maggiore concentrazione dei casi in valori superiori la media. La curtosi è invece la misura di quanto le osservazioni si trovino raggruppate nei valori estremi della distribuzione. Per grandi campioni i valori inferiori a 1 in valore assoluto sono accettati. Ricerca di errori Oltre ai valori previsti possono essere presenti valori anomali, che indicano presenza di errori nei dati, commessi probabilmente nella fase di inserimento. Outlier Gli outlier sono dei valori “anomali”, ovvero dei soggetti che presentano valori estremamente elevati o estremamente bassi in una variabile e che pertanto non contribuiscono ad una distribuzione normale della stessa. CAP. 5 LA TRASFORMAZIONE E LE OPERAZIONI SUI DATI L’istruzione Compute Attraverso questo comando è possibile eseguire delle operazioni aritmetiche tra le variabili. È possibile cioè applicare alcune operazioni (somma, media ecc) tra di esse o eseguire alcuni calcoli di tipo matematico sui dati a disposizione. Questa istruzione viene solitamente utilizzata per generare una nuova variabile che deriva dalla somma dei punteggi degli item che la costituiscono.

CAP. 6 FREQUENZE INCROCIATE

La funzione di crosstabs è utile per confrontare in un’unica tabella le frequenze di due variabili. Il comando Crosstabs È possibile incrociare, tramite tabella, due o più variabili della matrice dei dati allo scopo di ottenere un conteggio delle ricorrenze di determinati valori di una variabile confrontabili con quelli di un’altra variabile. Se s’inseriscono più variabili all’interno delle caselle la funzione Crosstabs analizzerà tutti gli incroci possibili tra le variabili per riga e per colonna. Le opzioni possibili sono il chi quadrato e le correlazioni. Chi quadrato È un test statistico utile per esaminare le distribuzioni dei valori assunti da variabili misurate a livello di scala nominale in diversi gruppi di soggetti. Si basa sulla quantificazione del rapporto tra le frequenze rilevate in ciascun gruppo di soggetti e le frequenze attese se le frequenze fossero equamente distribuite tra i vari gruppi. Il valore di questo indice è sempre superiore a 0. L’indice è pari a 0 quando l’ipotesi nulla è vera. Il test di significatività misura la probabilità che gli scostamenti intorno al valore reale dell’indice nella popolazione siano dovuti al caso. Se la significatività è inferiore a 0.05 si rifiuta l’ipotesi nulla a favore dell’ipotesi di una differenza tra frequenze teoriche e frequenze osservate. Risultati e lettura dell’Output Per visionare i risultati si può far uso della tabella riassuntiva denominata Case Processing Summary, che riassume i casi sottoposti ad analisi e li divide in tre colonne indicando su queste rispettivamente i casi validi, mancanti e totali. I residui standardizzati riportati nella tabella vanno interpretati secondo la seguente regola:

  • Se il residuo è maggiore di 2, nella cella in questione le frequenze osservate sono significativamente maggiori di quelle attese
  • Se il residuo è minore di - 2, nella cella in questione le frequenze osservate sono significativamente minori di quelle attese. CAP. 7 IL CALCOLO DELLE STATISTICHE DESCRITTIVE Le statistiche descrittive sono quei parametri che sintetizzano come sono distribuiti nel campione i valori che essa può assumere. Ciò consente al ricercatore di verificare quanto tali valori si distribuiscono secondo un andamento normale o si sbilanciano. Il calcolo della media è una statistica descrittiva di base e può essere definita come una misura di tendenza centrale, ovvero una misura che ci informa di come in media è un gruppo, pur non fornendo alcuna informazione su come siano distribuiti i punteggi da cui essa deriva.
  • Media: si definisce come la somma delle misure osservate diviso il numero delle osservazioni fatte e rappresenta quindi un indicatore che sintetizza il valore centrale di un insieme di dati, misurati a livello di scala a intervallo o a rapporti equivalenti
  • Deviazione standard: è anche chiamata scarto quadratico medio, è una misura della dispersione della media, ovvero di quanto i punteggi si discostano da questa
  • Varianza: è una misura della dispersione dei punteggi rispetto alla media. Si ottiene dal quadrato della deviazione standard. La varianza è pertanto la media aritmetica dei quadrati degli scarti dai punteggi originali rispetto alla media
  • Punteggio standardizzato: è il risultato della divisione tra lo scarto dalla media del campione di un determinato punteggio e la relativa deviazione standard. In tal modo si ottiene un punteggio con media zero e varianza parti a 1. La sua utilità risiede nei casi in cui è

necessario confrontare il punteggio di un soggetto rispetto al resto di un campione o quando si vuole operare con punteggi di variabili misurate su scale diverse. Il calcolo delle statistiche descrittive I punteggi standardizzati, una volta calcolati possono essere impiegati per individuare i soggetti outlier. Per far ciò si deve:

  • Standardizzare i punteggi relativi alla variabile da analizzare
  • Effettuare una distribuzione delle frequenze della nuova variabile standardizzata
  • Individuare i punteggi che corrispondono a un valore standardizzato maggiore di 3 in valore assoluto e considerarli come possibili valori anomali Ci sono diverse opzioni che permettono di effettuare altri calcoli:
  • Dispersion: per calcolare i valori minimo e massimo, l’intervallo e gli indici di dispersione
  • Distribution: per calcolare asimmetria e curtosi. Se sono minori di 1 gli indici indicano una buona approssimazione della distribuzione rispetto a quella normale
  • Display order: per ottenere le variabili nello stesso ordine con cui sono state selezionate CAP. 8 LA CORRELAZIONE La correlazione esprime la relazione tra due variabili, consentendo una valutazione sull’entità del legame tra esse ovvero il loro grado di indipendenza. Analisi correlazione:
  1. Scegliere il tipo di correlazione da effettuare ed attivare la relativa finestra (bivariata se vogliamo calcolare la correlazione tra due variabili, parziale se intendiamo anche controllare gli effetti che altre variabili possono esercitare sulla correlazione)
  2. Scegliere le variabili da correlare e le variabili di controllo se la correlazione è parziale
  3. Scegliere il tipo di coefficiente di correlazione da calcolare ed il test di significatività (ad una o due code a seconda se si conosce o meno il segno positivo o negativo della correlazione
  4. Analizzare i risultati controllando entità, segno e significatività delle correlazioni richieste Una correlazione è una misura del grado di concordanza tra due serie di valori. Il coefficiente di correlazione esprime la relazione tra due variabili, che può essere positiva, negativa oppure uguale a zero (=non c’è relazione). Il coefficiente più utilizzato è quello di Pearson (r). Il coefficiente di correlazione esprime una misura dell’associazione lineare tra due variabili. I valori che il coefficiente di correlazione può assumere sono tutti quelli compresi tra - 1 e +1. Il valore assoluto del coefficiente di correlazione indica l’intensità della relazione (0= nessuna correlazione, |1|= relazione lineare perfetta). La concordanza, invece, è la misura della varianza comune a due variabili che correlano e si ottiene elevando al quadrato il coefficiente di correlazione. I coefficienti di correlaizone sono:
  • Coefficiente r di Pearson: è adatto a variabili che siano misurate su scale a intervalli o a rapporti equivalenti
  • Coefficiente di Spearman: da utilizzare nel caso in cui entrambe le variabili siano misurate su scala ordinale oppure una sia misurata su scala ordinale e l’altra su scala ad intervalli equivalenti. Rappresenta la versione non parametrica della r di Pearson. Con esso i valori delle variabili vengono ordinati dal più piccolo al più grande per ciascun caso e sui ranghi viene calcolato il coefficiente di Pearson.

tra loro correlate, ad una o più dimensioni comuni alle variabili stesse, il cui numero p inferiore alle variabili originarie. Lo scopo dell’analisi fattoriale è quello di riassumere, semplificandola, tutta l’informazione contenuta (varianza) nelle relazioni di un insieme di variabili (matrice di correlazioni) attraverso l’identificazione (estrazione) di un numero ristretto di dimensioni (fattori). Queste dimensioni possono essere definite latenti, ovvero non sono direttamente misurabili, ma espressione di dimensioni derivate dalla misura di altre variabili specifiche, direttamente osservabili e misurabili. Attraverso l’analisi fattoriale si può indagare la dimensionalità sottostante ad un insieme di variabili (gli item di un questionario) e verificare se queste variabili possano essere riconducibili a specifici costrutti e pertanto considerate come misure valide per esprimerli e valutarli. L’analisi fattoriale esplorativa Questo tipo di analisi fattoriale ha come obiettivo quello di esplorare un insieme di variabili, di cui non si conoscono le dimensioni sottostanti, ovvero cercare di chiarire se esiste qualche configurazione sistematica nei dati. Con essa è quindi possibile ricondurre le relazioni osservate tra le variabili alla presenza di un numero incognito di fattori latenti. L’analisi fattoriale confermativa Questo tipo di analisi fattoriale è invece impiegata per verificare delle ipotesi. Essa esamina una specifica ipotesi relativa alla struttura delle relazioni tra le variabili. In quest’analisi, per decidere il numero di fattori che devono essere presenti nella soluzione finale ci si basa su una teoria o su risultati di ricerche precedenti. Validità interna La validità interna di uno strumento è in generale la verifica di quanto uno strumento misura con approssimazione accettabile il costrutto che intende misurare e non altri. Ricordare

  • Matrice di correlazione: riporta tutti i coefficienti di correlazione di un gruppo di variabili tra di loro
  • Fattore: corrisponde ad una dimensione o costrutto non misurabile direttamente che riassume la relazione tra un insieme di variabili originarie
  • Saturazione fattoriale: è il coefficiente che esprime solitamente la correlazione tra una variabile originaria misurata ed il fattore.
  • Autovalore: è la somma dei quadrati delle saturazioni delle variabili costituenti un fattore. L’autovalore diviso per il numero delle variabili costituenti un fattore è uguale alla proporzione di varianza totale spiegata dal fattore. Ogni fattore estratto ha un autovalore corrispondente. Nell’analisi delle componenti principali il primo fattore estratto è quello che ha l’autovalore più grande, ossia è il fattore che spiega la porzione maggiore di varianza dei dati, rispetto agli altri fattori
  • Comunalità (h^2 ): indica la proporzione di varianza della variabile spiegata dai fattori, calcolata elevando al quadrato la somma delle saturazioni fattoriali della variabile su tutti i fattori estratti. Estrazione dei fattori e rotazione Tra le metodologie più utilizzate per l’estrazione dei fattori ci sono l’analisi delle componenti principali (ACP), l’analisi dei fattori comuni, il metodo dei minimi quadrati e la massima verosimiglianza:
  • Tramite l’ACP vengono derivate dalle “n” variabili originarie un numero minore di nuove variabili che sono in grado di rappresentare una quota considerevole dell’informazione originaria, ovvero della varianza delle variabili originarie. Nell’ACP ogni componente estratta deriva da una combinazione lineare di tutte le variabili osservate; la prima componente principale è il fattore latente che spiega la più alta percentuale di varianza delle variabili.
  • Il metodo dei fattori comuni estrae dimensioni ipotetiche (i fattori comuni) che vengono stimate a partire dai dati; con questo tipo di analisi fattoriale si ottengono alcuni vantaggi dovuti: o Alla separazione tra la varianza comune e la varianza unica delle variabili o Alla ipoteticità del fattore che permette di spiegare le correlazioni tra le variabili senza dover essere completamente definito da esse.
  • Minimi quadrati generalizzati: è un metodo di estrazione dei fattori che minimizza la somma dei quadrati delle differenze tra la matrice di correlazione osservata e la matrice di correlazione riprodotta. Le correlazioni sono ponderate tramite l’inverso della loro unicità, così che alle variabili con elevata unicità viene dato meno peso rispetto a quelle con unicità inferiore l’unicità rappresenta l aperte di varianza di una variabile che non viene spiegata dai fattori che sono stati estratti
  • Il metodo della massima verosimiglianza produce stime dei parametri che più verosimilmente riproducono la matrice di correlazione osservata, se il campione è estratto da una popolazione che presenta una distribuzione normale delle variabili. Decidere quanti fattori estrarre Diversi sono i criteri di scelta:
  • Un criterio dipende da una specifica teoria di riferimento che orienta la ricerca
  • Un criterio raccomanda di estrarre tutti i fattori che presentano un autovalore maggiore di 1 ed è quello che il programma usa di default
  • Un criterio è quello dello scree-test: è un metodo che consente di tradurre graficamente la progressione descrescente delle grandezze degli autovalori associati ai fattori. Si può decidere di interrompere il processo di estrazione nel punto in cui la curva degli autovalori cambia decisamente pendenza fino a diventare piatta
  • Un criterio tiene conto empiricamente delle differenze o salti nell’entità degli autovalori, passando cioè dal valore più alto a quello successivo fino a quello più basso dove le differenze sono minime. Può capitare che le stesse variabili presentino saturazioni elevate su diversi fattori; ciò rende piuttosto difficile l’interpretazione dei risultati i quanto non si è in grado di stabilire a quale dei fattori estratti è riconducibile la variabile misurata. Per ovviare a questi inconvenienti si rende dunque necessaria una trasformazione della matrice delle saturazioni delle variabili nei fattori, in modo tale da consentire una migliore interpretazione degli stessi. Tale trasformazione viene effettuata rotando i fattori, cioè spostandone la posizione nello spazio. I due metodi principali di rotazione più usati sono Varimax e Direct Oblimin. Nell’output relativo alle due rotazioni si avranno differenti matrici delle saturazioni fattoriali:
  • Nella soluzione ortogonale la matrice che contiene la correlazione tra variabili e fattori esprime anche il peso che un fattore ha su ciascuna variabile
  • Nella soluzione obliqua invece le relazioni tra variabili e fattori sono riassunte attraverso diverse matrici: o La matrice struttura (structure matrix): contiene le correlazioni tra le variabili e i fattori che risulteranno tanto maggiori quanto più i fattori sono correlati tra loro

Calcolo dell’indice Alpha di Cronbach Per valutare l’attendibilità di una scala è importante considerare che valori di Alpha superiori a 0. sono da considerare ottimi, superiori a 0.80 molto buoni, superiori a 0.70 discreti, da .60 in giù scadenti. È inoltre importante tener presente che il valore dell’Alpha di Cronbach dipende dal numero di item della scala; tanto più numerosi sono gli item, tanto maggiore è il valore dell’Alpha, per questo si è soliti accettare anche valori intorno a 0.60 quando si valutano scale con un numero bassi di item (meno di 10) CAP. 11 LA REGRESSIONE LINEARE Analisi della regressione

  1. Indicare la variabile dipendente (criterio) e la variabile indipendente (predittore)
  2. Scegliere il metodo di inclusione delle variabili indipendenti nell’analisi, per indicare al programma se inserirle tutte insieme all’inizio oppure secondo un ordine che consideri la loro correlazione con la variabile dipendente e la varianza spiegata
  3. Avviare il calcolo ed analizzare i risultati nei termini di: significatività statistica del modello, coefficienti di regressione beta, percentuale di varianza spiegata r^2 corretto, indice di correlazione multipla R Definizione e scopo della regressione La regressione è una tecnica di analisi dei dati che ci aiuta a verificare a livello statistico le ipotesi teoriche di relazione di influenza tra variabili. Più precisamente è: una tecnica che esamina la relazione lineare tra una o più variabili esplicative (variabili indipendenti, VI) e una e una sola variabile criterio (variabile dipendente, VD). Quando si parla di regressione ci si riferisce a relazioni lineari tra variabili. Nel caso si ipotizzi la presenza di una sola variabile esplicativa, avremo una regressione semplice; nel caso di più variabili esplicative, la regressione sarà multipla. Lo studio della regressione lineare può avere duplice scopo:
  • Esplicativo: comprendere e ponderare gli effetti della VI sulla VD, sulla base di quanto previsto da un determinato modello teorico che orienta la ricerca
  • Predittivo: individuare una combinazione lineare di VI che predice in modo ottimale il valore assunto dalla VD Il calcolo e gli indici della regressione Statisticamente il punto di partenza della regressione è rappresentato da una matrice che riassume le correlazioni o covarianze tra: la VD e la VI; le VI stesse. Per procedere all’analisi le variabili devono rispettare i seguenti criteri:
  • VI e VD devono essere di tipo quantitativo
  • Per ciascun valore della VI, la distribuzione della VD deve essere normale
  • La varianza della distribuzione della VD deve essere costante per tutti i valori della VI La regressione calcola il valore del coefficiente che lega una variabile dipendente, o criterio, ad una variabile indipendente, o predittore. Nel caso di più variabili indipendenti verrà calcolato un coefficiente per ogni predittore separatamente e verrà fornito un indice complessivo che riporta la percentuale di varianza della VD spiegata dalle VI, ovvero quanto l’insieme die predittori riesce a spiegare la variabile criterio. Gli indici verranno descritti nel dettaglio nei paragrafi successivi. Qui anticipiamo che il punto di arrivo dell’analisi è rappresentato da:
  • Un insieme di parametri che riassumono la relazione tra VD e VI
  • Un valore che riassume l’impatto complessiv o della VI sulla VD in termini di varianza spiegata
  • Un’equazione lineare in cui la VD è uguale alla combinazione lineare delle VI Ricorda
  • Coefficienti di regressione non standardizzati (B): rappresentano la variazione attesa nella VD all’aumentare del valore della VI di una unità
  • Coefficienti standardizzati (Beta): a differenza dei precedenti, essendo standardizzati sono paragonabili tra loro. Più precisamente attraverso di essi si può quantificare il cambiamento che si verifica in una VD in conseguenza dei cambiamento di una deviazione standard nel valore di una VI, tenendo le altre costanti.
  • Indici R e R^2 : la R rappresenta la correlazione multipla fra predittori e criterio; R^2 corrisponde al quadrato di R e rappresenta la percentuale di varianza della variabile dipendente (criterio) spiegata dalle variabili indipendenti Strategie analitiche per la regressione Le principali strategie analitiche sono: regressione standard, regressione gerarchica, regressione statistica La differenza tra le tre riguarda l’ordine di entrata delle diverse VI nell’equazione di regressione e di conseguenza la percentuale di varianza in comune tra le variabili.
  • Nella regressione standard o simultanea tutte le VI vengono inserite nell’equazione allo stesso tempo. Ogni variabile indipendente è valutata per quanto aggiunge rispetto a quanto viene spiegato dalle altre. Ciò comporta che ad ogni VI corrisponde, nella spiegazione della VD, solo quella parte di variabilità che essa condivide unicamente con la variabile dipendente
  • Nella regressione gerarchica le VI vengono inserite nell’equazione secondo un ordine stabilito a priori da chi conduce la ricerca. In questo caso ogni VI è valutata per quanto aggiunge rispetto a quanto spiegato dalle altre inserite precedentemente. Le VI possono essere inserite da sole o per blocchi.
  • Nella regressione statistica l’ordine di ingresso delle VI nell’equazione è determinato esclusivamente da criteri statistici, che orientano anche l’inclusione o l’esclusione delle VI dall’equazione finale. La regressione statistica ha tre diverse versioni: o Forward: nell’equazione vengono inserite di volta in volta le VI che presentano la correlazione più elevata con la VD o Backward: in cui l’equazione inizialmente comprende tutte le VI inserite nell’analisi e ad ogni passaggio viene eliminata quella che non contribuisce sufficientemente alla spiegazione della VD o Stepwise: che rappresenta un compromesso tra le due precedenti. Inizialmente nessuna VI è inclusa e vengono aggiunte quelle con correlazione maggiore e ad ogni passaggio vengono eliminate quelle che non contribuiscono. Risultati e lettura dell’Output Gli indici che verranno forniti sono:
  • I coefficienti di regressione, associate delle statistiche “t” che servono a valutare la significatività
  • L’indice R che rappresenta la correlazione multipla fra predittori e criterio
  • La percentuale di varianza della variabile dipendente (criterio) spiegata dalle variabili indipendenti (R^2 )
  1. Interpretare correttamente il livello di significatività P associato al test. La P ci dice che il P% delle volte commetteremmo un errore a rifiutare l’ipotesi nulla; pertanto, minore è il valore di P, maggiore è il grado di sicurezza con cui possiamo rifiutarla
  2. Chiedersi quale rischio sia accettabile. La letteratura suggerisce i valori dell’alfa critico di 0.05 e 0.01 come valori soglia.
  3. Confrontare l’alfa critico con il valore P ottenuto dall’ANOVA. Se P è minore di alfa, possiamo rifiutare l’ipotesi nulla a favore di quella alternativa e si può affermare che le medie dei gruppi sottoposti ad analisi sono diverse in maniera significativa. Post- Hoc A differenza dei contrasti, nei post-hoc ogni media viene confrontata con tutte le altre. Si usano in genere quando non si ha motivo di selezionare solo alcuni confronti tra tutti quelli possibili. Anova fattoriale Nel disegno fattoriale vengono esaminate tutte le possibili combinazioni dei livelli dei fattori. Il disegno fattoriale più semplice è un disegno 2x2, composto da due fattori, ognuno dei quali presenta due differenti livelli. Un vantaggio dei disegni fattoriali rispetto all’ANOVA ONE-WAY consiste nella possibilità di rilevare l’effetto di interazione, cioè l’effetto congiunto tra le due o più variabili indipendenti sulla VD, risultato non ottenibile con analisi separate per ogni fattore che rilevano il solo effetto principale. L’effetto principale rappresenta l’effetto medio che una VI ha su una VD, indipendentemente dai valori delle altre VI. L’effetto di interazione invece si ha quando l’effetto che una VI ha sulla VD non è lo stesso per tutti i livelli di un’altra VI, ma è differente per i diversi livelli di quest’ultima. Indici e interazioni possibili Poiché l’ANOVA fattoriale è un’estensione dell’ANOVA ONE-WAY gli indici calcolati sono gli stessi: F di Fisher, P of F, devianza e varianza. La F di Fisher sarà calcolata per ciascun fattore. Con due fattori è possibile una sola interazione (anova a due vie), con tre fattori ci saranno 4 interazioni (anova a tre vie). Per accedere al calcolo dell’ANOVA fattoriale il programma impiega la procedura chiamata Modello lineare generalizzato (GLM) univariato: consente di analizzare, oltre agli effetti di più VI sulla VD, anche gli effetti di variabili covariate e le interazioni tra covariate e fattori. Le variabili covariate sono predittori di tipo quantitativo, utilizzati nell’analisi di regressione dove le variabili indipendenti (stimatori) vengono specificate come tali. Output dell’ANOVA fattoriale Nell’output saranno riportate le seguenti tabelle:
  4. Una che riporta le numerosità del campione suddivise in base alle modalità assunte dal campione
  5. Una che presenta i valori di media, la deviazione standard
  6. Una che riporta le componenti alle quali va attribuita la porzione della variazione nella VD, il calcolo della somma dei quadrati (devianza), i gradi di libertà, la somma dei quadrati relativa, la F di Fisher e l’indice eta-quadro.