










































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Una introduzione alla psicometria, una disciplina che studia la misura di caratteristiche psicologiche. Viene discusso il tema principale, che riguarda la costruzione, validazione e taratura di strumenti di misura, e la misurazione in generale di fenomeni psicologici. Il documento include attributi qualitativi e quantitativi, misure di caratteri qualitativi e quantitativi discreti e continui, e l'uso di grafici come diagrammi a torta, diagrammi a rettangoli separati, istogrammi e grafici su coordinate cartesiane. Vengono inoltre introdotti indicatori di posizione come moda, mediana, quartili/percentili, media aritmetica e l'uso di indicatori di variabilità per descrivere meglio i caratteri.
Tipologia: Dispense
1 / 50
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!











































La statistica è un insieme di strumenti logici e matematico-probabilistici per la misura e il trattamento di grandi quantità di
informazioni configurabili come fenomeni di massa.
La sua conoscenza non solo è cruciale in ambito scientifico, ma fondamentale nella misurazione in psicologia e di non
trascurabile importanza nella vita quotidiana.
Uno strumento di supporto nei processi decisionali (specie in quelle situazioni in cui si devono prendere decisioni in condizione
di incertezza grazie all’apporto decisivo della teoria della probabilità).
La STATISTICA si può utilizzare in contesti molto differenti in psicologia:
La PSICOMETRIA è la disciplina che studia la misura di caratteristiche psicologiche à Tema principale è quello della costruzione,
validazione e taratura di strumenti di misura, e, più in generale, la misurazione di fenomeni psicologici.
La STATISTICA PSICOMETRICA si propone di fornire metodi e strumenti per la misurazione di fenomeni di natura psicologica
(come e cosa misurare)
L’operazionalizzazione del costrutto è di fondamentale
importanza!
Tabella formata dalle
osservazioni di tutti i caratteri
rilevati pe unità statistica
(unità statistica × caratteri)
Modalità = attributi
Sconnessi (scala nominale): comune di residenza, genere, patologia clinica ecc. Vale solo l’equivalenza (= o ¹)
Al posto di “A”, “B”, “C” si poteva scrivere α, β γ, 1,2,3 (ma i numeri valgono solo come etichette!)
Caratteristiche:
Al posto di “A”, “B”, “C” si poteva scrivere α, β γ, 1,2,3 (ma i numeri valgono solo come etichette!)
Caratteristiche:
Le etichette numeriche valgono per il loro ordine (non ha senso compiere operazioni tra di loro)
Modalità = misure
I numeri descrivono una proprietà oggettiva delle unità statistiche.
patologici messi in atto in un lasso di tempo)
Lo 0 è arbitrario, ma c’è un’unità di misura per cui le categorie si trovano alla stessa distanza.
Temperatura in Celsius, Q.I., scale di atteggiamento ecc. Vale equivalenza (= o ¹ ), ordinamento (< o >) e
differenza (+ o −).
Lo 0 `e assoluto, indica assenza del fenomeno. Peso, altezza, valori diagnostici. Vale equivalenza (= o ¹ ),
ordinamento (< o >), differenza (+ o −) e rapporto (× o ÷)
Organizzazione elementare delle osservazioni → elenchi di osservazioni.
Quando si hanno tanti dati → TABELLE DI FREQUENZA
x i
: modalità distinte del carattere X
f i
: frequenze (i = 1,... , k, dove k `e il numero delle categorie) n: totale delle osservazioni/unità statistiche
i
una data modalità (x i ): f i
f i
Si confrontano modalità che rappresentano i livelli o valori tipici.
Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo” → indice che riassume o descrive i
dati e dipende dalla scala di misura dei dati in oggetto
Indici di posizione tipici:
Ogni carattere statistico ha l’indice di posizione adeguato: non tutti gli indici si possono calcolare per ogni carattere → indice di
posizione adeguato.
Qualitativo sconnesso à Moda
Qualitativo ordinato à Mediana
Quantitativo à Media o Mediana
Modalità con la massima frequenza.
Mo(x) = max(f i ) (modalità con massimo valore di f i
N.B: SI PUÒ CALCOLARE PER OGNI CARATTERE, anche se di fatto viene calcolata solo per i caratteri qualitativi sconnessi o
nominali, in quanto per altri caratteri si possono calcolare altri indici più informativi.
Va detto che la frequenza max è x associato al valore x.
La moda è la modalità cui è associata la frequenza (o densità di frequenza nel caso di caratteri quantitativi in classi) massima e
NON il valore massimo!
Data la seguente distribuzione della variabile X
La moda non è 8 (la modalità con valore massimo) ma è 1 (cioè la modalità cui è associata la frequenza massima). La modalità 1
ha frequenza 2 al contrario di 2,4,8 che hanno frequenza 1.
Scala di misura: Tutte.
È l’unico indice di tendenza centrale per i dati qualitativi misurati su scala nominale
Indice descrittivo poco informativo.
Dobbiamo calcolare la DENSITÀ di frequenza. La moda è la classe con max(d i
Modalità / valore che occupa la posizione centrale o mediana (Pos Me ) nella distribuzione ordinata dei dati
Preceduta da almeno 50% dei casi e superata da almeno 50% dei casi.
Per individuare il valore centrale (per i qualitativi ordinati) si esamina la numerosità totale n:
Cosi troviamo la posizione della mediana, ma non il valore, quindi come si individua sulla distribuzione di frequenza la posizione
(n + 1)/2?
Sulla colonna delle FREQUENZE CUMULATE : si individua la prima
frequenza cumulata maggiore o uguale della posizione cercata.
In caso di caratteri quantitativi discreti , è il valore che occupa
(n+1)/2, come nel caso del qualitativo ordinato.
Mentre nel caso di caratteri quantitativi continui , si trova una CLASSE MEDIANA per cui tutti i suoi valori x ∈ [hi−1, hi ]
soddisfano la definizione. Per convenzione si prende il valore dato dalla formula:
Dove:
h i − 1 è il limite inferiore della classe mediana (la classe che contiene la PosMe)
i −1 è la frequenza cumulata della classe precedente la classe mediana
a i è l’ampiezza della classe che contiene PosMe
f i è la frequenza assoluta della classe che contiene PosMe
PosMe = n + ½
Scala di misura: ordinale, a intervalli, a rapporti (caratteri qualitativi ordinati e quantitativi).
Insieme alla moda è l’indice di tendenza centrale per i dati qualitativi misurati su scala ordinale.
Modalità / valori che dividono la distribuzione di frequenza ordinata in più parti (100).
Qual è il reddito familiare che divide il 25% dei più poveri dal restante 75%?
Qual è la soglia di reddito oltre cui sta la fascia dei più abbienti?
Quanti bambini di 6 anni pesano più di 25 kg?
Quartili à dividono in 4 parti la distribuzione
Decili à dividono in 10 parti la distribuzione
Percentili à dividono in 100 parti la distribuzione
Il percentile x p di ordine p è quella modalità che è:
Preceduta da almeno p% dei casi
Superata da almeno (1 − p)% dei casi
Per il calcolo di quartili, decili e percentili il procedimento è analogo a quello della Mediana, che di fatto è un caso particolare di
questi indici.
L’unica differenza riguarda il calcolo della Posizione (Pos). In generale la Posizione di ordine p (in centesimi) si ottiene:
Per il calcolo dei percentili (anche per i quartili) nel caso di caratteri quantitativi continui in classi, si adatta la formula della
mediana per caratteri continui, con opportuni valori della Posizione cercata. In genere, per caratteri continui, il percentile di
ordine p è:
Dove:
hi − 1 è il limite inferiore della classe percentile (la classe che contiene il percentile di ordine p)
= Corrisponde alla Mediana
Gli indici di posizioni sono utili per alcune informazioni sui caratteri appare tuttavia insufficiente.
Sintesi troppo spinta → perdita di informazioni.
Interessano anche indicatori della diversità (molteplicità) dei valori di un carattere.
Posizione + Variabilità
Indice di variabilità = quanto un carattere si scosta dalla media (solo per i caratteri quantitativi)
Il campo di variazione è la differenza tra il valore maggiore e quello minore della distribuzione di frequenza osservata.
Variazione = x max
Ma è poco informativo.
La differenza interquartile è data dalla differenza tra il terzo e il primo quartile.
Questo indice richiede una scala di misura metrica, quantificazione delle differenze tra valori.
3
1
Analogo al campo di variazione ma tiene conto soltanto dei valori che cadono tra il 1° e 3° quartile (cioè del 50% della
distribuzione).
La differenza interquartile non tiene conto di cosa accade all’interno della distribuzione (casi centrali) e agli estremi distribuzione
= poco informativo.
Si può ottenere un indice di dispersione che tenga conto del contributo dei singoli casi:
Si calcolano gli scarti dei valori osservati dalla media
Si fa una media di questi scarti
È la media degli scarti dalla media elevati al quadrato:
La varianza (ovviamente) non è mai negativa.
Radice quadrata della Varianza
Indice di dispersione con unità di misura uguale alla media.
Indica di quanto, mediamente, i dati osservati si discostano dalla
loro media.
Il coefficiente di variazione sintetizza il rapporto tra Media e Deviazione Standard.
Determina la dispersione dei dati osservati mediante l’uso della Media come unità di misura.
È un indicatore di variabilità relativa.
È particolarmente utile per confrontare due differenti distribuzioni.
Indice di variabilità assoluto Indice di variabilità relativo
Dipende dall’unità di misura Non dipende da nessuna unità di misura
È espresso nella stessa dimensione dei dati Non avendo unità di misura, non è esprimibile nella stessa
dimensione dei dati
Non è possibile confrontare la variabilità di distribuzione
diverse
È utile per confrontare la variabilità di distribuzioni diverse
Un punteggio all’interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un punteggio x=52 in
una scala di aggressività dice abbastanza poco sulla caratteristica del soggetto. Non si sa, cioè, se è poco o molto aggressivo o se
la sua aggressività è nella media.
Per variabili misurate su scale a rapporti un singolo valore è già più informativo (es. sappiamo cosa vuol dire avere 18 anni) à
anche con variabili di questo tipo un punteggio potrebbe non essere informativo delle caratteristiche del soggetto.
Se fosse un pigmeo sarebbe molto alto. Se fosse un watusso sarebbe nella media.
Per avere un'idea chiara del significato di un dato valore dobbiamo riferire il valore stesso alla distribuzione di punteggi del
gruppo di cui fa parte. Gli aspetti da tenere a mente sono due:
riferimento); i punteggi vengono quindi riferiti alla media e alla varianza di un gruppo
una scala comune o standard
La standardizzazione consente di definire la posizione di un soggetto all'interno di una distribuzione di frequenza e, dunque, di:
Standardizzare significa riferire la misura ad una scala standard di cui sono noti i parametri (media e varianza)
Gli indicatori di tendenza centrale e di dispersione (media e deviazione standard) possono essere utilizzati per ottenere la
standardizzazione delle misure.
Una delle scale di più comunemente utilizzate è detta “standard” o “z”, con media = 0 e varianza = 1.
Questa scala si ottiene trasformando i punteggi xi di una distribuzione in punteggi zi tramite la formula: zi= (xi – X-) /s
Dove zi sono detti anche punti z.
I punti z consentono di riferire una misura ad una scala standard con media = 0 e deviazione standard = 1. La trasformazione dei
valori come distanza dalla media in termini di deviazione standard (cioè usare la deviazione standard come unità di misura).
ESEMPIO: un soggetto ha ottenuto il punteggio di 30 sia in un test che misura l’ansia sia in uno che misura l’introversione;
come è possibile sapere se in certe situazioni il soggetto si dimostra più introverso o più ansioso?
È necessario utilizzare una scala comune sulla quale leggere i punteggi dei due test.
ij
: Frequenza congiunta definisce il numero di unità statistiche che possiedono congiuntamente la modalità i del
carattere X e la modalità j del carattere Y
i.
: Frequenza marginale di X definisce il numero di unità statistiche che possiedono la modalità i del carattere X
.j : Frequenza marginale di Y definisce il numero di unità statistiche che possiedono la modalità j del carattere Y
Numero di unità statistiche che possiedono la modalità i del carattere X (totale riga i-esima)
Numero di unità statistiche che possiedono la modalità j del carattere Y (totale colonna j-esima)
Dalla tabella a doppia entrata si ricavano due variabili statistiche MARGINALI
X = anno di nascita
Y = età lavorativa
Data una tabella a doppia entrata, è possibile costruire:
140 donne intervistate e classificate secondo le variabili Occupazione e Livello di
Istruzione
(10/55) · 100 = 18.2% delle
donne lavoratrici hanno un
livello di istruzione basso.
(15/40) · 100 = 37.5% delle donne con
livello di istruzione medio lavora
La DIPENDENZA o lo studio della RELAZIONE tra caratteri si possono analizzare tramite:
La CONNESSIONE equivale alla NON INDIPENDENZA: quando due variabili sono connesse tra loro, al variare di x c’è una
variazione non casuale in y.
Gli indici di connessione possono essere definiti come MISURA della DISTANZA DALLA INDIPENDENZA
Dove le frequenze teoriche fˆ ij descrivono la
situazione di indipendenza. La distanza tra queste due
tabelle mi indicano la connessione.
(non esistono frequenze teoriche = 0)
Massima indipedenza tra le due variabili.
X: località di villeggiatura (VD)
Y: fascia d’età (VI)
Nella tabella notiamo che nella prima riga troviamo i valori più alti e poi
vanno a decrescere quindi capiamo subito che le città d’arte sono le meno visitate, indipendentemente dalla fascia d’età. Lo
notiamo ancora di più calcolando le % di colonna:
Quindi possiamo dire che le due variabili quindi sono indipendenti tra di loro: al variare la fascia d’età non varia la scelta di
villaggio di villeggiatura.
Vengono definite frequenze teoriche assolute fˆ ij le frequenze ottenute come:
Sono le frequenze che definiscono la situazione di indipendenza.
Studio della relazione lineare tra due variabili quantitative x e y
(per relazione lineare si intende quanto le coppie di punti xi ;yi tendono a disporsi lungo una retta)
L’indice che misura il grado di correlazione tra due variabili è il COEFFICIENTE DI CORRELAZIONE LINEARE DI BRAVAIS-PEARSON
Il concetto di correlazione dipende dal concetto di covarianza, ossia la media dei prodotti degli scarti di ogni variabile dalla
propria media aritmetica :
formula operativa:
Grafico: scatter plot, grafico a dispersione
i
x
j
j
In questo quadrante ogni punto ha scarti dalla media + ⇒ prodotto +
è più spesso negativa se Cov < 0
In questo quadrante ogni punto ha scarto dalla media di Y negativo e ogni scarto dalla
media di X è positivo ⇒ prodotto −
à Relazione lineare inversa = al crescere x, y decresce e viceversa
Se due variabili correlano NON vuol dire che una è la causa dell’altra
si hanno 6 coppie di valori
Nell’esempio visto, la Covarianza risultava pari a +51, 5. L’unica informazione che ci fornisce questo dato è che tra le variabili X e
Y c’`e una tendenza alla linearità positiva.
Per determinare se questa tendenza è forte o debole (per misurare quindi l’intensità ) occorre normalizzare la covarianza, cioè
dividerla per il suo valore massimo à CORRELAZIONE
Sapendo che la covarianza è sempre compresa tra −s x
s y
e s x
s y
si ricava che: - 1 ≤ r ≤ 1
Sx per sy è il valore massimo che può raggiungere la covarianza
Assume valore +1 quando il legame tra le due variabili è perfettamente lineare e
diretto.
La retta che congiunge i punti ha coefficiente angolare positivo.
Assume valore −1 quando il legame tra le due variabili è perfettamente lineare ma
inverso.
La retta che congiunge i punti ha coefficiente angolare negativo.
Assume valore 0 in condizione di incorrelazione tra le due variabili
(non esiste un legame di tipo lineare tra le due variabili).
Ma questo non implica che le variabili non siano in relazione tra
loro... solo la loro relazione non è lineare!
Esempio di prima:
cov(X,Y) = 51. 5
Le variabili presentano una fortissima correlazione positiva
dove:
uguale zero (media di x a cui sottraggo il coefficiente angolare che moltiplica la media di x)
predetto di Y per un incremento unitario di X
Dato il modello lineare y
∗
=a+b·X , la stima dei parametri a e b avviene mediante un criterio
matematico chiamato criterio dei minimi quadrati.
È basato sulla minimizzazione di una funzione di perdita tra i valori realmente osservati y e i
valori teorici del modello y
∗
.
In base alla pendenza della
retta, per ogni cambiamenti
unitario in x, osserverò che la y
subisce dei cambiamenti +o-
evidenti.
Più è basso il coefficiente
angolare più la retta sarà piatta.
Coefficiente angolare : Intercetta:
Esempio di prima:
= 11; s x
= 132; s y
a= Y
− bX
L’equazione della retta di regressione è quindi: y = 5.15 + 0. 39 x
Si dimostra che l’indice che misura la bontà di adattamento di una retta di regressione è il coefficiente di determinazione r
2
Essendo −1 ≤ r ≤ +1 → 0 ≤ r
2
≤ +
0: situazione di INCORRELAZIONE : la retta di regressione non spiega nulla, i dati non presentano linearità
1: situazione di massima CORRELAZIONE : la retta di regressione spiega tutto, passa per i dati, i dati sono allineati (crescenti o
decrescenti).
Esempio di prima:
Il modello fornisce un’ottima previsione
PROBLEMA: In base al modello proposto (che si è rivelato un ottimo modello), prevedere il peso del bambino all’età di 48 mesi.
La retta ha equazione: Y = 5.15+0.39·X
Per poter utilizzare il modello in modo predittivo, occorre sostituire all’interno dell’equazione al posto dell’incognita X il valore
della variabile indipendente:
48
punto di coordinate (μ x
, μ y
) appartiene alla retta di regressione.
y
RETTA DI REGRESSIONE AL VARIARE DI r
correlazione negativa
In un gruppo di pazienti cerebrolesi si vuole valutare se la presenza di deficit del campo visivo `e in relazione con il lato della
lesione.
Lesione DX/SN=variabile dicotomica A
Deficit di campo visivo SI/NO=variabile dicotomica B
Si costruisce la tabella di contingenza 2x2 con le frequenze osservate
La generica tabella di contingenza 2 × 2
VARIABILI QUANTITATIVA (VDipendente) E VARIABILE QUALITATIVA (VIndipendente)
Grafico à Boxplot
L’indice statistico adeguato per valutare la
relazione tra una variabile quantitativa e
una qualitativa è η
2
, compreso tra 0 e 1,
dove 0 indica indipendenza e 1 massima
dipendenza.
Nell’esempio vale 0.683, ad indicare un
legame di dipendenza medio-alto.
La riga in mezzo ai rettangoli rosa è la
mediana.
I baffi sono il valore massimo e minimo
della distribuzione.
Al crescere della classe energetica cresce
anche il prezzo.
a DI CRONBACH – COERENZA INTERNA
Indice molto utilizzato in Psicometria per valutare la coerenza interna di un questionario composto da k item diversi.
Misura quanto gli item sono tra loro coerenti nel misurare un costrutto latente.
Ipotesi:
dove:
k: item di un questionario
s j
2
: varianza dell’item j-esimo
s x
2
: varianza dei punteggi totali di ogni individuo
Può variare solo tra 0 e 1. Fornisce indicazioni sul grado di intercorrelazione tra gli item del questionario.
Se gli item di uno stesso questionario sono altamente correlati tra di loro (consistenza interna alta) sarà possibile concludere che
ciascun item dà un reale contributo alla misura del costrutto in esame e che nell’insieme tutti gli item si riferiscono allo stesso
costrutto.
Se gli item sono scarsamente correlati tra loro (bassa consistenza interna) potremo dire che alcuni di questi non costituiscono
una misura soddisfacente del costrutto.
α di Cronbach indica in che percentuale la misura in oggetto riflette il costrutto sottostante.
Se una scala d’ansia ha un valore di α = 0.80 vuol dire che l’80% del punteggio ottenuto dal soggetto è attribuibile proprio
all’ansia.
Se la consistenza interna di una scala di depressione è α = 0.40 vuol dire che il 40% di un punteggio riflette realmente la
depressione ma il restante 60% misura altro (?!).
Linee guida:
Scala PGWBI del benessere (scala validata in italiano, composta da 22 item). Si considerino i seguenti 4 item, con scala di risposta
Likert a 6 passi:
Sono chiaramente variabili osservate riferite ad un stesso costrutto, l’ ansia.
Numero di item fratto il numero di item - 1, per 1 – la
somma delle varianze fratto la varianza totale.
10 bambini con difficoltà di apprendimento vengono sottoposti ad alcuni test di
natura medica, psicologica e psichiatrica. Per ogni bambino vengono rilevate 5
variabili
1
: presenza di una patologia psichiatrica (nelle modalità S=presenza, N=assenza)
2
: presenza di ereditarietà della suddetta patologia (S=presenza, N=assenza)
3
: punteggio in un test di apprendimento (in centesimi) X 4
: punteggio in un test sul
5 : graduatoria stabilita da medici dopo colloqui (1=bambino con maggiore
difficoltà, 10 bambino con minor difficoltà).
Stabilire il grado di correlazione (scegliendo l’indice appropriato) tra:
(variabile dipendente) e X 4
(variabile
indipendente) del tipo
3
=a+b·X 4