Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Appunti di statistica - Introduzione all'uso della statistica, Sintesi del corso di Psicologia Generale

Appunti di psicologia sociale e statistica. Faccio riferimento al libro di statistica applicata alla psicologia sociale.

Tipologia: Sintesi del corso

2012/2013

In vendita dal 24/09/2013

Paola888
Paola888 🇮🇹

7 documenti

1 / 6

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Introduzione all’uso della statistica
Cap- 1
L’obiettivo della ricerca nelle scienze sociali è quello di descrivere, spiegare e predire il comportamento e le relazioni
esistenti tra vari aspetti di un comportamento o tra vari comportamenti.
Per fare questo, il ricercatore parte da un quesito derivante da un’osservazione o da una lacuna di una teoria,che guida
l’intera ricerca: Perché X si comporta nel modo Y”.
Affinché si possa effettuare una ricerca, il quesito deve essere trasformato in un’ipotesi di ricerca, che consiste in
un’affermazione del tipo “Se … allora”. L’ipotesi di ricerca deve essere verificabile, il che comporta:
• una chiara definizione dei concetti implicati;
• i concetti implicati devono essere verificabili;
• le ipotesi non devono essere circolari.
Una volta definita l’ipotesi, bisogna operazionalizzarla,ovvero, trasformare in definizioni operative le caratteristiche
oggetto di studio. La definizione operativa comporta anche la quantificazione di una caratteristica. La definizione
operativa deve sempre essere esplicitata. Il ricercatore deve essere consapevole che possono esserci più definizioni
operative dello stesso concetto, per questo egli deve si pone in atteggiamento critico rispetto al risultato del proprio lavoro.
Il ricercatore inoltre deve avere chiaro il tipo di relazione tra i concetti oggetti di studio per utilizzare il giusto livello
di’indagine.
• Quando non si fanno ipotesi circa la relazione tra le variabili, il livello dell’indagine è descrittivo. In questo caso,
l’obiettivo è di descrivere, nel miglior modo possibile, le variabili oggetto di studio e di fornire una rappresentazione di
ciò che avviene.
• Quando di ipotizza una compresenza sistematica delle variabili, senza ipotizzare una relazione causa-effetto tra queste, il
livello dell’indagine è correlazionale. In questo caso, l’obiettivo è di descrivere le relazioni tra le variabili.
• Quando si ipotizza una relazione causale tra le variabili, il livello dell’indagine è sperimentale. L’obbiettivo, in questo
caso, è di spiegare il comportamento in funzione di una causa.
Tipi di variabili
Una variabile è una qualsiasi caratteristica o attributo che può variare,ovvero che può assumere valori diversi o categorie
diverse. Relativamente al ruolo che assumono nella ricerca, si distinguono due tipi di variabili:
• le variabili indipendenti sono gli stimoli o eventi comportamentali che si ipotizza causino dei cambiamenti su altri
eventi o comportamenti. Il gruppo osservato in presenza della VI è detto gruppo sperimentale, il gruppo osservato in
assenza è detto gruppo di controllo.
• le variabili dipendenti sono le variazioni dei comportamenti che si suppone dipendano dalle modifiche delle variabili
indipendenti.
La validità è la migliore approssimazione disponibile alla Verità. Esistono quattro tipi fondamentali di validità.
• La validità interna indica il grado in cui le conclusioni tratte da una ricerca sono riconducibili alla relazione tra le
variabili in oggetto, escludendo altre possibili interpretazioni.
• La validità esterna si riferisce alla possibilità di estendere i risultati dell’indagine ad altri soggetti, luoghi e tempi diversi
da quelli della ricerca. È essenzialmente legata al campionamento dei soggetti.
• La validità di costrutto indica la capacità di tradurre in termini operativi le variabili oggetto di studio. Questo tipo di
validità è molto vicino alla validità interna.
• La validità statistica(o delle conclusioni statistiche) riguarda la probabilità che la relazione tra le variabili sia effettiva
e non dovuta al caso.
Per incrementare la validità interna e quella esterna il ricercatore dovrà pianificare accuratamente la ricerca. Nel disegno
sperimentale è presente una prima misura della variabile dipendente rilevata prima dell’esperimento vero e proprio(pre-
test) e una seconda misura rilevata dopo l’esperimento(post-test). Questo disegno consente di controllare molti dei fattori
che minacciano la sua validità. I disegni quasi sperimentali differiscono dai primi perché non è possibile assegnare i
soggetti alla varie condizioni ma si deve selezionarli in gruppi già esistenti. In questi casi la possibilità di controllo delle
variabili diminuisce e diminuisce anche la validità interna.
Per escludere la possibilità che i risultati dipendano dal caso è necessario avere delle ipotesi statistiche, cioè tradurre
ipotesi suscettibili di verifica probabilistica in base alla teoria statistica. Le ipotesi statistiche sono di due tipi:
• L’ipotesi nulla (H0) si riferisce al fatto che i risultati sono dovuti al caso quindi gli effetti della variabile indipendente
sono nulli.
• L’ipotesi alternativa (H1), o ipotesi di ricerca, si riferisce al fatto che i risultati non sono dovuti al caso e quindi la
variabile ha avuto un effetto specifico. L’obiettivo è escludere al prima e accettare la seconda. La verifica delle
ipotesi(cioè stabilire la credibilità della ricerca sulla popolazione) viene effettuata tramite le distribuzioni campionarie
(distribuzione teorica di frequenza relativa ad una statistica che viene costruita assumendo di aver estratto un numero
infinito di campioni) dei test statistici che si intendono utilizzare. All’interno di queste distribuzioni si sceglie il livello di
significatività (α) che corrisponde all’errore che il ricercatore accetta di fare nel trarre le sue conclusioni. Un livello di
significatività del 5% (α = .05) indica che si accetta il 5% di probabilità di commettere una errore nell’accettare l’ipotesi
alternativa e rifiutare l’ipotesi nulla. Per decidere se accettare come significativi i risultati di una ricerca, bisogna
confrontare il valore della statistica ottenuta con il valore critico previsto al livello di significatività prescelto (.05). Se il
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Appunti di statistica - Introduzione all'uso della statistica e più Sintesi del corso in PDF di Psicologia Generale solo su Docsity!

Introduzione all’uso della statistica

Cap- 1

L’ obiettivo della ricerca nelle scienze sociali è quello di descrivere, spiegare e predire il comportamento e le relazioni esistenti tra vari aspetti di un comportamento o tra vari comportamenti. Per fare questo, il ricercatore parte da un quesito derivante da un’osservazione o da una lacuna di una teoria,che guida l’intera ricerca: “ Perché X si comporta nel modo Y ”. Affinché si possa effettuare una ricerca, il quesito deve essere trasformato in un’ ipotesi di ricerca , che consiste in un’affermazione del tipo “ Se … allora ”. L’ipotesi di ricerca deve essere verificabile , il che comporta:

  • una chiara definizione dei concetti implicati;
  • i concetti implicati devono essere verificabili;
  • le ipotesi non devono essere circolari. Una volta definita l’ipotesi, bisogna operazionalizzarla,ovvero, trasformare in definizioni operative le caratteristiche oggetto di studio. La definizione operativa comporta anche la quantificazione di una caratteristica. La definizione operativa deve sempre essere esplicitata. Il ricercatore deve essere consapevole che possono esserci più definizioni operative dello stesso concetto, per questo egli deve si pone in atteggiamento critico rispetto al risultato del proprio lavoro. Il ricercatore inoltre deve avere chiaro il tipo di relazione tra i concetti oggetti di studio per utilizzare il giusto livello di’indagine.
  • Quando non si fanno ipotesi circa la relazione tra le variabili, il livello dell’indagine è descrittivo. In questo caso, l’obiettivo è di descrivere, nel miglior modo possibile, le variabili oggetto di studio e di fornire una rappresentazione di ciò che avviene.
  • Quando di ipotizza una compresenza sistematica delle variabili, senza ipotizzare una relazione causa-effetto tra queste, il livello dell’indagine è correlazionale. In questo caso, l’obiettivo è di descrivere le relazioni tra le variabili.
  • Quando si ipotizza una relazione causale tra le variabili, il livello dell’indagine è sperimentale. L’obbiettivo, in questo caso, è di spiegare il comportamento in funzione di una causa. Tipi di variabili Una variabile è una qualsiasi caratteristica o attributo che può variare,ovvero che può assumere valori diversi o categorie diverse. Relativamente al ruolo che assumono nella ricerca, si distinguono due tipi di variabili:
  • le variabili indipendenti sono gli stimoli o eventi comportamentali che si ipotizza causino dei cambiamenti su altri eventi o comportamenti. Il gruppo osservato in presenza della VI è detto gruppo sperimentale, il gruppo osservato in assenza è detto gruppo di controllo.
  • le variabili dipendenti sono le variazioni dei comportamenti che si suppone dipendano dalle modifiche delle variabili indipendenti. La validità è la migliore approssimazione disponibile alla Verità. Esistono quattro tipi fondamentali di validità.
  • La validità interna indica il grado in cui le conclusioni tratte da una ricerca sono riconducibili alla relazione tra le variabili in oggetto, escludendo altre possibili interpretazioni.
  • La validità esterna si riferisce alla possibilità di estendere i risultati dell’indagine ad altri soggetti, luoghi e tempi diversi da quelli della ricerca. È essenzialmente legata al campionamento dei soggetti.
  • La validità di costrutto indica la capacità di tradurre in termini operativi le variabili oggetto di studio. Questo tipo di validità è molto vicino alla validità interna.
  • La validità statistica(o delle conclusioni statistiche) riguarda la probabilità che la relazione tra le variabili sia effettiva e non dovuta al caso. Per incrementare la validità interna e quella esterna il ricercatore dovrà pianificare accuratamente la ricerca. Nel disegno sperimentale è presente una prima misura della variabile dipendente rilevata prima dell’esperimento vero e proprio(pre- test) e una seconda misura rilevata dopo l’esperimento(post-test). Questo disegno consente di controllare molti dei fattori che minacciano la sua validità. I disegni quasi sperimentali differiscono dai primi perché non è possibile assegnare i soggetti alla varie condizioni ma si deve selezionarli in gruppi già esistenti. In questi casi la possibilità di controllo delle variabili diminuisce e diminuisce anche la validità interna. Per escludere la possibilità che i risultati dipendano dal caso è necessario avere delle ipotesi statistiche , cioè tradurre ipotesi suscettibili di verifica probabilistica in base alla teoria statistica. Le ipotesi statistiche sono di due tipi:
  • L’ ipotesi nulla (H0) si riferisce al fatto che i risultati sono dovuti al caso quindi gli effetti della variabile indipendente sono nulli.
  • L’ ipotesi alternativa (H1), o ipotesi di ricerca, si riferisce al fatto che i risultati non sono dovuti al caso e quindi la variabile ha avuto un effetto specifico. L’obiettivo è escludere al prima e accettare la seconda. La verifica delle ipotesi(cioè stabilire la credibilità della ricerca sulla popolazione) viene effettuata tramite le distribuzioni campionarie (distribuzione teorica di frequenza relativa ad una statistica che viene costruita assumendo di aver estratto un numero infinito di campioni) dei test statistici che si intendono utilizzare. All’interno di queste distribuzioni si sceglie il livello di significatività (α) che corrisponde all’errore che il ricercatore accetta di fare nel trarre le sue conclusioni. Un livello di significatività del 5% (α = .05) indica che si accetta il 5% di probabilità di commettere una errore nell’accettare l’ipotesi alternativa e rifiutare l’ipotesi nulla. Per decidere se accettare come significativi i risultati di una ricerca, bisogna confrontare il valore della statistica ottenuta con il valore critico previsto al livello di significatività prescelto (.05). Se il

valore trovato è superiore al valore critico, vuol dire che esso si trova nella zona di rifiuto dell’ipotesi nulla, quindi, si può accettare l’ipotesi alternativa. Le distribuzioni campionarie variano anche in funzione dei gradi di libertà (numero di valori che sono liberi di variare quando si calcola un test statistico) della statistica specifica. Errori Quando si vogliono verificare delle ipotesi, è possibile commettere due tipi di errori:

  • L’errore di primo tipo si commette quando si respinge l’ipotesi nulla, ma questa è vera: si considera significativo un risultato che invece non lo è.
  • L’errore di secondo tipo si commette quando si accetta come vera l’ipotesi nulla, ma questa è falsa: si considera non significativo un risultato che invece lo è. La probabilità di commettere questi errori è legata alla potenza dell’analisi statistica, che è legata all’ampiezza dell’effetto che si vuole ottenere e può essere definita anche come capacità di evidenziare un effetto di determinata grandezza.

Cap-

Il concetto di misura prevede la rappresentazione di eventi ( variabili ) mediante dei numeri. A seconda delle caratteristiche della variabile oggetto di studio e delle proprietà dei numeri utilizzate per rappresentarla, avremo una diversa scala di misura. Le scale di misura si basano su tre elementi:

  • un sistema empirico (insieme di entità non numerico, ad es., persone, stimoli, item);
  • un sistema numerico ;
  • una regola che consente di passare da uno all’altro. La scala nominale Quando le variabili sono mutabili, che riguardano caratteristiche di tipo qualitativo e non quantitativo, si utilizza la suddivisione in categorie distinte,la misura consiste nell’attribuire numeri uguali ad elementi della stessa categoria. Il sistema numerico in questo caso è arbitrario e puramente simbolico. Scala ordinale Quando il sistema empirico è costituito da elementi che godono della stessa caratteristica ma in quantità diversa, allora il sistema numerico indica la posizione reciproca degli elementi. La regola sarà che assegno lo stesso numero a chi ha la stessa quantità di caratteristica e che i numeri indicano una graduatoria tra le quantità di caratteristica presenti. In questo caso, l’assegnazione dei numeri non è arbitraria, poiché le categorie presentano tra loro una relazione di ordine. Scala a intervalli equivalenti Quando nel sistema empirico è possibile stabilire un’unità di misura. I numeri indicano effettivamente la differenza tra le persone per una determinata caratteristica. In questo tipo di scala, lo zero è puramente simbolico. è la più utilizzata in psicologia. Scala razionale o a rapporti Quando nel sistema empirico è possibile identificare oltre all’unità di misura, anche un elemento di intensità nulla (zero assoluto), allora il sistema numerico godrà di tutte le proprietà dei numeri reali e la regola di trasformazione potrà comprendere anche l’uguaglianza del rapporto tra due elementi. Statistica descrittiva La statistica descrittiva consente di ottenere una descrizione del campione di soggetti o eventi in termini di variabili (anagrafiche, psicologiche), o combinazioni di variabili, scelte dal ricercatore in base agli obiettivi dello studio. La descrizione di un campione si articola in due momenti: la rilevazione e l’elaborazione dei dati. La fase di rilevazione consiste nella quantificazione, attraverso strumenti appropriati (osservazione del campione,questionari e test), dei valori che la variabile assume per i diversi elementi (soggetti) che costituiscono il campione esaminato. Alla fine di questa fase si ottengono i dati grezzi , cioè non ancora elaborati,non ci da informazioni sul campione esaminato. La fase di elaborazione consente di rappresentare e descrivere il campione, in base alle variabili di interesse. Elaborazione dei dati Rappresentazioni grafiche consentono di visualizzare la distribuzione di frequenza (numero di volte in cui si presenta un evento) delle diverse categorie o valori di una variabile all’interno di un campione. Tale composizione può essere espressa sia in termini di frequenza (contando il numero delle volte in cui un valore o una categoria appare nel campione) o di percentuale (dividendo la frequenza di una data categoria per il totale delle frequenze e moltiplicando il risultato per 100). Il grafico a barre si usa per la rappresentazione di variabili discrete (possono assumere un numero di valori finito), mettendo in ascissa le categorie e in ordinata le frequenze o le percentuali. Il grafico a torta si usa per le percentuali. L’istogramma si usa nel caso di variabili continue (possono assumere un numero infinito di valori), utilizzando tutti i valori che la variabile può assumere o raggruppando i dati in classi. Per tutti i grafici, è possibile raggruppare le categorie. Le misure di tendenza centrale danno informazioni relative al valore che meglio rappresenta la tendenza del campione per la variabile oggetto di studio. Le misure di variabilità danno un’indicazione di quanto i punteggi dei singoli soggetti si discostino dal valore centrale: maggiore è il valore, più variabilità ci sarà tra i punteggi. La media (X) e la varianza ( s 2) sono le più utilizzate, ma possono essere calcolate solo per le scale ad intervalli o rapporti. La media ( X o M ) viene calcolata sommando tutti i singoli punteggi e dividendo il risultato per la numerosità del campione. La varianza ( s 2) viene definita come la media dei quadrati degli scostamenti dalla media, ed è un indice della distanza media dei diversi punteggi dalla media del campione. Più piccolo è il valore, più i punteggi sono concentrati intorno alla media; più grande è il valore, più i punteggi sono “dispersi” intorno alla media. Si calcola sommando i quadrati degli scostamenti dalla media

confrontano a due a due le medie. Esistono vari tipi di confronti post hoc, di cui, uno dei più usati è LSD di Fisher ( Least Significant Difference, minima differenza significativa ), chiamato anche t protetto. Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student. Disegni entro i soggetti I disegni entro i soggetti sono disegni in cui si utilizzano gli stessi soggetti per tutte le condizioni sperimentali. Un esempio possono essere gli studi longitudinali, in cui si rileva la stessa variabile, sugli stessi soggetti, a intervalli di tempo. Anche in questo tipo di disegno il ricercatore è interessato a verificare l’ipotesi di differenza tra due o più medie, relative, però allo stesso gruppo di soggetti.

  • Per verificare questo tipo di ipotesi, si utilizza l’analisi della varianza per misure ripetute. Per verificare l’esistenza di una differenza tra le medie, il ricercatore calcola le medie relative alla variabile di interesse, ad esempio, prima e dopo il trattamento e trova che le due medie sono diverse. La scomposizione della variabilità totale, nei disegni entro i gruppi e diversa dalla scomposizione della variabilità nei disegni tra i gruppi. Le differenze individuali , in questo caso, non possono più influenzare la variabilità tra i gruppi, poiché i soggetti sono gli stessi. Inoltre, le differenze individuali vengono isolate, per cui la variabilità di errore diventerà più piccola, poiché contiene solo l’errore casuale. In questo modo, la statistica F , che si ottiene calcolando il rapporto tra la variabilità tra i gruppi e la variabilità d’errore, sarà più grande, con maggiori possibilità di risultare significativa. Ipotesi monodirezionale. L’ipotesi monodirezionale si ha quando l’ipotesi prevede una direzione precisa. In questo caso, il 5% di rischio (α = .05) va cercato in una sola coda della curva di distribuzione normale. Ipotesi a priori. Ipotesi bidirezionale. L’ipotesi bidirezionale si ha quando si ipotizza una differenza tra i gruppi, ma non la direzione della differenza stessa. In questo caso, il 5% di rischio va conteggiato suddividendolo in entrambe le code della curva di distribuzione normale: 2.5% da un estremo e 2.5% dall’altro.

Cap-

Quando si hanno scale nominali o ordinali, non è possibile calcolare il t , poiché non abbiamo medie, ma solo frequenze. In questi casi, per verificare se un evento si verifica, in due o più gruppi, con la stessa frequenza o meno, si usa il test del Chi2, la cui distribuzione è nota. Nel test Chi2 vi possono essere modi diversi di formulare l’ipotesi nulla. In tutti i casi l’ipotesi nulla fa affermazioni relative alla popolazione, da cui è stato effettuato un campionamento. Il test Chi2 verifica se vi è una differenza tra le frequenze osservate , ovvero quelle ottenute dalla rilevazione dei dati, e le frequenze attese (o frequenze teoriche), ovvero le frequenze che ci si aspetta di trovare. Se è vera l’ipotesi nulla, non si dovrebbe trovare alcuna differenza. Se, invece, è vera l’ipotesi alternativa, allora si dovrebbe trovare una differenza. Per ognuna delle categorie si calcola il quadrato della differenza tra le frequenze osservate e quelle attese, dividendo il risultato per le frequenze attese. Il Chi2 è dato dalla somma dei risultati di questa operazione, effettuata per ognuna delle categorie. Come nel caso del F, il fatto che il Chi2 sia significativo ci dice solo che almeno una frequenze osservata è diversa dalle frequenze attese, quindi, bisogna capire quali e quante frequenze sono diverse. Per fare questo bisogna calcolare i residui standardizzati ( R ) per ciascuna delle celle della tabella. Come abbiamo visto, per calcolare il Chi 2 bisogna confrontare le frequenze attese con quelle osservate. Il totale delle frequenze attese deve sempre corrispondere al totale delle frequenze osservate, il fatto che i due totali coincidano indica che nel calcolo delle frequenze attese non sono stati commessi errori. L’unica limitazione dell’uso del test Chi2 è che le frequenze attese devono essere abbastanza ampie. Il test chi2 su due variabili A volte si può essere interessati a verificare se esiste una relazione tra due variabili. In questo caso, l’ipotesi nulla prevede che se tra le due variabili non vi è alcuna relazione, allora le frequenze si distribuiranno in maniera casuale nelle celle. La formula per il calcolo del Chi2 non cambia, ma cambia il modo di organizzare i dati, che vengono disposti in una tabella a doppia entrata.

Cap-

La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme , ovvero, a covariare. Quando si parla di correlazione bisogna prendere in considerazione due aspetti: il tipo di relazione esistente tra due variabili e la forma della relazione. Per quanto riguarda il tipo di relazione , essa può essere lineare o non lineare

  • La relazione è di tipo lineare se, rappresentata su assi cartesiane, si avvicina alla forma di una retta. In questo caso, all’aumentare (o al diminuire) di X aumenta (diminuisce) Y.
  • La relazione è di tipo non lineare, se rappresentata su assi cartesiane, ha un andamento curvilineo (parabola o iperbole). In questo caso a livelli bassi e alti di X corrispondono livelli alti di Y; mentre a livelli intermedi di X corrispondono livelli bassi di Y. Per quanto riguarda la forma della relazione , si distinguono l’ entità e la direzione. La direzione può essere: positiva , se all’aumentare di una variabile aumenta anche l’altra. La direzione è negativa se all’aumentare di una variabile diminuisce l’atra. L’ entità si riferisce alla forza della relazione esistente tra due variabili. Quanto più i punteggi sono raggruppati attorno ad una retta, tanto più forte è la relazione tra due variabili. Se i punteggi sono dispersi in maniera uniforme,

invece, tra le due variabili non esiste alcuna relazione. Per esprimere la relazione esistente tra due variabili, in termini entità e direzione, si utilizza il coefficiente di correlazione, che può essere definito come un numero che sintetizza il rapporto tra X e Y. Tale coefficiente è standardizzato e può assumere valori che vanno da –1.00 (correlazione perfetta negativa) e +1.00 (correlazione perfetta positiva). Una correlazione uguale a 0 indica che tra le due variabili non vi è alcuna relazione. La correlazione non include il concetto di causa-effetto, ma solo quello di rapporto tra variabili. La correlazione ci permette di affermare che tra due variabili c’è una relazione sistematica , ma non che una causa l’altra. Esistono vari tipi di coefficienti di correlazione a seconda del tipo di scala della variabile. Il coefficiente di correlazione r di Pearson Tale coefficiente serve a misurare la correlazione tra variabili a intervalli o a rapporti equivalenti. È dato dalla somma dei prodotti dei punteggi standardizzati delle due variabili ( zxzy ) diviso il numero dei soggetti (o delle osservazioni). Accanto alla significatività del coefficiente di correlazione si usa calcolare il coefficiente di determinazione che misura l’ammontare di variabilità di una variabile spiegato dalla sua relazione con un’altra variabile. Nel caso specifico della correlazione il coefficiente r 2 indica la percentuale di varianza che hanno in comune due variabili. Il coefficiente r s di Spearman Tale coefficiente serve per misurare la correlazione tra due variabili di tipo ordinale. Il coefficiente r s di Spearman è un’approssimazione del coefficiente di Pearson. La relazione tra X e Y è espressa tenendo conto delle concordanti o differenti posizioni di ciascun soggetto nelle due graduatorie. Il coefficiente tau di Kendall Anche questo coefficiente serve per misurare la correlazione tra due variabili di tipo ordinale, ma è esente dal difetto del coefficiente rs. È possibile utilizzare i coefficienti di correlazione per ranghi su scale a intervalli o rapporti equivalenti nei casi in cui non è possibile applicare r di Pearson. Per fare questo bisogna trasformare il livello di misura della variabile, calcolando gli ordini di rango sui punteggi originali. L’ordine di rango è, comunque, meno sensibile della misura vera e propria. Inoltre, le statistiche basate sui ranghi sono meno potenti di quelle basate su misure continue. Il coefficiente rphi Questo coefficiente serve per misurare la correlazione tra due variabili di tipo categoriale, che abbiano solo due modalità di risposta (ad es., vero/falso, presente/assente). In questi casi, per calcolare la correlazione bisogna costruire una tabella a doppia entrata, con le due modalità di X e le due modalità di Y(2x2), che incrocia le risposte di X con quelle di Y, ottenendo quattro caselle. Il coefficiente rpbis (punto-biseriale) Si usa tale coefficiente se una sola delle due variabili è dicotomica (ad es., la risposta alla domanda X in un test, nei termini Giusto/Sbagliato, Vero/Falso), mentre l’altra è una variabile continua (ad es., il totale delle risposte giuste nel test). Questo coefficiente si basa sul confronto delle medie in Y (la variabile continua) relative ai soggetti che in X (la variabile dicotomica) hanno rispettivamente dato la risposta “giusta” ( Yg ) e la risposta “sbagliata” ( Ys ).

Cap-

La regressione prevede l’esistenza di una variabile antecedente, in base alla quale è possibile prevedere una variabile susseguente. La regressione non è in grado fornire una relazione causa-effetto tra due variabile, tuttavia, è possibile ipotizzare da un punto di vista strettamente teorico l’esistenza di una variabile indipendente che causa la variabile dipendente. Da un punto di vista grafico, la relazione tra due variabili viene espressa nello stesso modo in cui si esprime la correlazione, ovvero tramite un diagramma di dispersione. Per effettuare la stima della variabile dipendente (Y) in base alla variabile indipendente (X), si calcola l’equazione di regressione, che nel caso della regressione lineare è uguale all’equazione della retta: Y = a + bX. La retta di regressione è costruita in modo che sia la migliore retta tra tutte le possibili rette che possono passare attraverso i punti rappresentati nel diagramma di dispersione. Y è la variabile dipendente che si vuole stimare X è la variabile indipendente a è L’ intercetta che è la distanza tra l’origine degli assi e il punto in cui la retta taglia l’asse delle ordinate. b è Il coefficiente di regressione che indica l’inclinazione della retta, cioè l’angolo che la retta forma con l’asse delle ascisse. Nella sua forma standardizzata può assumere valori che vanno da -1.00 a +1.00. Tale valore indica l’incremento o il decremento che si verifica in Y per ogni unità di incremento o decremento di X. Se invece dei dati grezzi si usano i punteggi standardizzati (z), allora il coefficiente di regressione b diventa il coefficiente beta, che coincide con il coefficiente di correlazione. Si parla di regressione multipla quando sono presenti,oltre alla variabile dipendente, due o più variabili indipendenti. Lo scopo di questo modello è quello di analizzare l’influenza che ciascuna variabile indipendente esercita sulla variabile dipendente. Con il metodo posso-passo il procedimento di analisi viene effettuato in passi successivi, in ognuno dei quali si fa rientrare la variabile indipendente che spiega la maggior quantità di variabilità.

Cap-

L’analisi fattoriale fa riferimento ad una serie di tecniche che vengono utilizzate per studiare la struttura dei dati in base alle relazioni tra le variabili. L’obiettivo è di sintetizzare un numero elevato di informazioni, ovvero rappresentare p variabili mediante k nuove variabili ( fattori ) di numerosità inferiore alle precedenti(Esempio Big five test).