Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Psicometria: Analisi di strumenti per la misurazione di caratteristiche psicologiche, Dispense di Statistica Psicometrica

Una introduzione alla psicometria, una disciplina che studia la misura di caratteristiche psicologiche. Viene discusso il tema principale, che riguarda la costruzione, validazione e taratura di strumenti di misura, e la misurazione in generale di fenomeni psicologici. Il documento include attributi qualitativi e quantitativi, misure di caratteri qualitativi e quantitativi discreti e continui, e l'uso di grafici come diagrammi a torta, diagrammi a rettangoli separati, istogrammi e grafici su coordinate cartesiane. Vengono inoltre introdotti indicatori di posizione come moda, mediana, quartili/percentili, media aritmetica e l'uso di indicatori di variabilità per descrivere meglio i caratteri.

Tipologia: Dispense

2022/2023

In vendita dal 28/02/2024

veronica-monti-1
veronica-monti-1 🇮🇹

5 documenti

1 / 50

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
COS’È LA STATISTICA
La statistica è un insieme di strumenti logici e matematico-probabilistici per la misura e il trattamento di grandi quantità di
informazioni configurabili come fenomeni di massa.
La sua conoscenza non solo è cruciale in ambito scientifico, ma fondamentale nella misurazione in psicologia e di non
trascurabile importanza nella vita quotidiana.
Uno strumento di supporto nei processi decisionali (specie in quelle situazioni in cui si devono prendere decisioni in condizione
di incertezza grazie all’apporto decisivo della teoria della probabilità).
La STATISTICA si può utilizzare in contesti molto differenti in psicologia:
Analisi di un questionario
Misurazione di un fenomeno osservato
Misurazione di un fenomeno latente
La PSICOMETRIA è la disciplina che studia la misura di caratteristiche psicologiche à Tema principale è quello della costruzione,
validazione e taratura di strumenti di misura, e, più in generale, la misurazione di fenomeni psicologici.
La STATISTICA PSICOMETRICA si propone di fornire metodi e strumenti per la misurazione di fenomeni di natura psicologica
(come e cosa misurare)
L’operazionalizzazione del costrutto è di fondamentale
importanza!
UNITÀ STATISTICHE O SPERIMENTALI (CHI/COSA, L’OGGETTO DELL’INDAGINE)
- Popolazione/universo
- Campione
CARATTERI (COME’È FATTO L’OGGETTO SPERIMENTALE?)
- Qualitativi
- quantitativi
MODALITÀ DEL CARATTERE (COME SI MANIFESTA IL CARATTERE?)
- attributi → qualitative
- misure → quantitative
Tabella formata dalle
osservazioni di tutti i caratteri
rilevati pe unità statistica
(unità statistica × caratteri)
TIPI DI CARATTERE
QUALITATIVI / CATEGORICI
Sconnessi
Ordinati
QUANTITATIVI / METRICI
Discreti
Continui
CARATTERI QUALITATIVI SCONNESSI
Modalità = attributi
Sconnessi (scala nominale): comune di residenza, genere, patologia clinica ecc. Vale solo l’equivalenza (= o ¹)
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32

Anteprima parziale del testo

Scarica Psicometria: Analisi di strumenti per la misurazione di caratteristiche psicologiche e più Dispense in PDF di Statistica Psicometrica solo su Docsity!

COS’È LA STATISTICA

La statistica è un insieme di strumenti logici e matematico-probabilistici per la misura e il trattamento di grandi quantità di

informazioni configurabili come fenomeni di massa.

La sua conoscenza non solo è cruciale in ambito scientifico, ma fondamentale nella misurazione in psicologia e di non

trascurabile importanza nella vita quotidiana.

Uno strumento di supporto nei processi decisionali (specie in quelle situazioni in cui si devono prendere decisioni in condizione

di incertezza grazie all’apporto decisivo della teoria della probabilità).

La STATISTICA si può utilizzare in contesti molto differenti in psicologia:

➢ Analisi di un questionario

➢ Misurazione di un fenomeno osservato

➢ Misurazione di un fenomeno latente

La PSICOMETRIA è la disciplina che studia la misura di caratteristiche psicologiche à Tema principale è quello della costruzione,

validazione e taratura di strumenti di misura, e, più in generale, la misurazione di fenomeni psicologici.

La STATISTICA PSICOMETRICA si propone di fornire metodi e strumenti per la misurazione di fenomeni di natura psicologica

(come e cosa misurare)

L’operazionalizzazione del costrutto è di fondamentale

importanza!

UNITÀ STATISTICHE O SPERIMENTALI (CHI/COSA, L’OGGETTO DELL’INDAGINE)

  • Popolazione/universo
  • Campione

CARATTERI (COME’È FATTO L’OGGETTO SPERIMENTALE?)

  • Qualitativi
  • quantitativi

MODALITÀ DEL CARATTERE (COME SI MANIFESTA IL CARATTERE?)

  • attributi → qualitative
  • misure → quantitative

Tabella formata dalle

osservazioni di tutti i caratteri

rilevati pe unità statistica

(unità statistica × caratteri)

TIPI DI CARATTERE

QUALITATIVI / CATEGORICI

➢ Sconnessi

➢ Ordinati

QUANTITATIVI / METRICI

➢ Discreti

➢ Continui

CARATTERI QUALITATIVI SCONNESSI

Modalità = attributi

Sconnessi (scala nominale): comune di residenza, genere, patologia clinica ecc. Vale solo l’equivalenza (= o ¹)

Al posto di “A”, “B”, “C” si poteva scrivere α, β γ, 1,2,3 (ma i numeri valgono solo come etichette!)

Caratteristiche:

➢ Mutalmente escludentesi: Ogni unità statistica può avere solo una modalità

➢ Collettivamente esaustive: Tutte le unità statistiche devono appartenere a una modalità

CARATTERI QUALITATIVI ORDINATI

Al posto di “A”, “B”, “C” si poteva scrivere α, β γ, 1,2,3 (ma i numeri valgono solo come etichette!)

Caratteristiche:

➢ Mutalmente escludentesi: Ogni unità statistica può avere solo una modalità

➢ Collettivamente esaustive: Tutte le unità statistiche devono appartenere a una modalità

Le etichette numeriche valgono per il loro ordine (non ha senso compiere operazioni tra di loro)

CARATTERI QUANTITATIVI

Modalità = misure

I numeri descrivono una proprietà oggettiva delle unità statistiche.

➢ Discreti: insieme di modalità → insieme finito di soli numeri interi (e.g., numero di figli, numero di comportamenti

patologici messi in atto in un lasso di tempo)

➢ Continui: insieme di modalità → infinito, numeri reali (e.g., tempi di risposta a un esperimento)

SCALA AD INTERVALLI

Lo 0 è arbitrario, ma c’è un’unità di misura per cui le categorie si trovano alla stessa distanza.

Temperatura in Celsius, Q.I., scale di atteggiamento ecc. Vale equivalenza (= o ¹ ), ordinamento (< o >) e

differenza (+ o −).

SCALA A RAPPORTI

Lo 0 `e assoluto, indica assenza del fenomeno. Peso, altezza, valori diagnostici. Vale equivalenza (= o ¹ ),

ordinamento (< o >), differenza (+ o −) e rapporto (× o ÷)

TABELLE DI FREQUENZA

Organizzazione elementare delle osservazioni → elenchi di osservazioni.

Quando si hanno tanti dati → TABELLE DI FREQUENZA

x i

: modalità distinte del carattere X

f i

: frequenze (i = 1,... , k, dove k `e il numero delle categorie) n: totale delle osservazioni/unità statistiche

➢ frequenza assoluta : numero di unità statistiche che presentano una data modalità (x

i

➢ frequenza relativa (o percentuale): numero di unità statistiche sul totale che presentano

una data modalità (x i ): f i

f i

Si confrontano modalità che rappresentano i livelli o valori tipici.

Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo” → indice che riassume o descrive i

dati e dipende dalla scala di misura dei dati in oggetto

Indici di posizione tipici:

➢ Moda

➢ Mediana

➢ Quartili / percentili

➢ Media aritmetica

Ogni carattere statistico ha l’indice di posizione adeguato: non tutti gli indici si possono calcolare per ogni carattere → indice di

posizione adeguato.

Qualitativo sconnesso à Moda

Qualitativo ordinato à Mediana

Quantitativo à Media o Mediana

MODA

Modalità con la massima frequenza.

Mo(x) = max(f i ) (modalità con massimo valore di f i

N.B: SI PUÒ CALCOLARE PER OGNI CARATTERE, anche se di fatto viene calcolata solo per i caratteri qualitativi sconnessi o

nominali, in quanto per altri caratteri si possono calcolare altri indici più informativi.

Va detto che la frequenza max è x associato al valore x.

La moda è la modalità cui è associata la frequenza (o densità di frequenza nel caso di caratteri quantitativi in classi) massima e

NON il valore massimo!

Data la seguente distribuzione della variabile X

La moda non è 8 (la modalità con valore massimo) ma è 1 (cioè la modalità cui è associata la frequenza massima). La modalità 1

ha frequenza 2 al contrario di 2,4,8 che hanno frequenza 1.

Scala di misura: Tutte.

È l’unico indice di tendenza centrale per i dati qualitativi misurati su scala nominale

Indice descrittivo poco informativo.

MODA PER I DATI IN CLASSI

Dobbiamo calcolare la DENSITÀ di frequenza. La moda è la classe con max(d i

MEDIANA

Modalità / valore che occupa la posizione centrale o mediana (Pos Me ) nella distribuzione ordinata dei dati

Preceduta da almeno 50% dei casi e superata da almeno 50% dei casi.

Per individuare il valore centrale (per i qualitativi ordinati) si esamina la numerosità totale n:

Cosi troviamo la posizione della mediana, ma non il valore, quindi come si individua sulla distribuzione di frequenza la posizione

(n + 1)/2?

Sulla colonna delle FREQUENZE CUMULATE : si individua la prima

frequenza cumulata maggiore o uguale della posizione cercata.

In caso di caratteri quantitativi discreti , è il valore che occupa

(n+1)/2, come nel caso del qualitativo ordinato.

Mentre nel caso di caratteri quantitativi continui , si trova una CLASSE MEDIANA per cui tutti i suoi valori x ∈ [hi−1, hi ]

soddisfano la definizione. Per convenzione si prende il valore dato dalla formula:

Dove:

h i − 1 è il limite inferiore della classe mediana (la classe che contiene la PosMe)

F

i −1 è la frequenza cumulata della classe precedente la classe mediana

a i è l’ampiezza della classe che contiene PosMe

f i è la frequenza assoluta della classe che contiene PosMe

PosMe = n + ½

Scala di misura: ordinale, a intervalli, a rapporti (caratteri qualitativi ordinati e quantitativi).

Insieme alla moda è l’indice di tendenza centrale per i dati qualitativi misurati su scala ordinale.

PERCENTILI

Modalità / valori che dividono la distribuzione di frequenza ordinata in più parti (100).

Qual è il reddito familiare che divide il 25% dei più poveri dal restante 75%?

Qual è la soglia di reddito oltre cui sta la fascia dei più abbienti?

Quanti bambini di 6 anni pesano più di 25 kg?

Quartili à dividono in 4 parti la distribuzione

Decili à dividono in 10 parti la distribuzione

Percentili à dividono in 100 parti la distribuzione

Il percentile x p di ordine p è quella modalità che è:

Preceduta da almeno p% dei casi

Superata da almeno (1 − p)% dei casi

Per il calcolo di quartili, decili e percentili il procedimento è analogo a quello della Mediana, che di fatto è un caso particolare di

questi indici.

L’unica differenza riguarda il calcolo della Posizione (Pos). In generale la Posizione di ordine p (in centesimi) si ottiene:

PERCENTILI PER CARATTERI CONTINUI

Per il calcolo dei percentili (anche per i quartili) nel caso di caratteri quantitativi continui in classi, si adatta la formula della

mediana per caratteri continui, con opportuni valori della Posizione cercata. In genere, per caratteri continui, il percentile di

ordine p è:

Dove:

hi − 1 è il limite inferiore della classe percentile (la classe che contiene il percentile di ordine p)

= Corrisponde alla Mediana

INDICI DI VARIABILITÀ (O DI DISPERSIONE)

Gli indici di posizioni sono utili per alcune informazioni sui caratteri appare tuttavia insufficiente.

Sintesi troppo spinta → perdita di informazioni.

Interessano anche indicatori della diversità (molteplicità) dei valori di un carattere.

Posizione + Variabilità

Indice di variabilità = quanto un carattere si scosta dalla media (solo per i caratteri quantitativi)

CAMPO DI VARIAZIONE (O RANGE)

Il campo di variazione è la differenza tra il valore maggiore e quello minore della distribuzione di frequenza osservata.

Variazione = x max

  • x min

Ma è poco informativo.

DIFFERENZA INTERQUARTILE

La differenza interquartile è data dalla differenza tra il terzo e il primo quartile.

Questo indice richiede una scala di misura metrica, quantificazione delle differenze tra valori.

DI = Q

3

– Q

1

Analogo al campo di variazione ma tiene conto soltanto dei valori che cadono tra il 1° e 3° quartile (cioè del 50% della

distribuzione).

La differenza interquartile non tiene conto di cosa accade all’interno della distribuzione (casi centrali) e agli estremi distribuzione

= poco informativo.

VARIANZA

Si può ottenere un indice di dispersione che tenga conto del contributo dei singoli casi:

Si calcolano gli scarti dei valori osservati dalla media

Si fa una media di questi scarti

È la media degli scarti dalla media elevati al quadrato:

La varianza (ovviamente) non è mai negativa.

SCARTO QUADRATICO MEDIO (O DEVIAZIONE STANDARD)

Radice quadrata della Varianza

Indice di dispersione con unità di misura uguale alla media.

Indica di quanto, mediamente, i dati osservati si discostano dalla

loro media.

COEFFICIENTE DI VARIAZIONE

Il coefficiente di variazione sintetizza il rapporto tra Media e Deviazione Standard.

Determina la dispersione dei dati osservati mediante l’uso della Media come unità di misura.

È un indicatore di variabilità relativa.

È particolarmente utile per confrontare due differenti distribuzioni.

DEVIAZIONE STANDARD COEFFICIENTE DI VARIAZIONE

Indice di variabilità assoluto Indice di variabilità relativo

Dipende dall’unità di misura Non dipende da nessuna unità di misura

È espresso nella stessa dimensione dei dati Non avendo unità di misura, non è esprimibile nella stessa

dimensione dei dati

Non è possibile confrontare la variabilità di distribuzione

diverse

È utile per confrontare la variabilità di distribuzioni diverse

STANDARDIZZAZIONE

Un punteggio all’interno di una distribuzione è in realtà privo di significato se preso da solo. Sapere che un punteggio x=52 in

una scala di aggressività dice abbastanza poco sulla caratteristica del soggetto. Non si sa, cioè, se è poco o molto aggressivo o se

la sua aggressività è nella media.

Per variabili misurate su scale a rapporti un singolo valore è già più informativo (es. sappiamo cosa vuol dire avere 18 anni) à

anche con variabili di questo tipo un punteggio potrebbe non essere informativo delle caratteristiche del soggetto.

Esempio: un soggetto è alto 1.80m. è un soggetto alto o basso? à dipende dalla media della sua popolazione di riferimento.

Se fosse un pigmeo sarebbe molto alto. Se fosse un watusso sarebbe nella media.

Per avere un'idea chiara del significato di un dato valore dobbiamo riferire il valore stesso alla distribuzione di punteggi del

gruppo di cui fa parte. Gli aspetti da tenere a mente sono due:

➢ La scala di misura utilizzata: i punteggi di un test sono su scale a intervalli equivalenti prive dello zero (utilizzabile come

riferimento); i punteggi vengono quindi riferiti alla media e alla varianza di un gruppo

➢ Il confronto tra punteggi in test diversi: per confrontare misure ottenute con strumenti diversi è necessario riferirle ad

una scala comune o standard

La standardizzazione consente di definire la posizione di un soggetto all'interno di una distribuzione di frequenza e, dunque, di:

➢ Confrontare due prestazioni dello stesso soggetto entro due diverse distribuzioni

➢ Confrontare le prestazioni di soggetti diversi in differenti distribuzioni

Standardizzare significa riferire la misura ad una scala standard di cui sono noti i parametri (media e varianza)

Gli indicatori di tendenza centrale e di dispersione (media e deviazione standard) possono essere utilizzati per ottenere la

standardizzazione delle misure.

Una delle scale di più comunemente utilizzate è detta “standard” o “z”, con media = 0 e varianza = 1.

Questa scala si ottiene trasformando i punteggi xi di una distribuzione in punteggi zi tramite la formula: zi= (xi – X-) /s

Dove zi sono detti anche punti z.

I punti z consentono di riferire una misura ad una scala standard con media = 0 e deviazione standard = 1. La trasformazione dei

valori come distanza dalla media in termini di deviazione standard (cioè usare la deviazione standard come unità di misura).

ESEMPIO: un soggetto ha ottenuto il punteggio di 30 sia in un test che misura l’ansia sia in uno che misura l’introversione;

come è possibile sapere se in certe situazioni il soggetto si dimostra più introverso o più ansioso?

È necessario utilizzare una scala comune sulla quale leggere i punteggi dei due test.

➢ f

ij

: Frequenza congiunta definisce il numero di unità statistiche che possiedono congiuntamente la modalità i del

carattere X e la modalità j del carattere Y

➢ f

i.

: Frequenza marginale di X definisce il numero di unità statistiche che possiedono la modalità i del carattere X

➢ f

.j : Frequenza marginale di Y definisce il numero di unità statistiche che possiedono la modalità j del carattere Y

Numero di unità statistiche che possiedono la modalità i del carattere X (totale riga i-esima)

Numero di unità statistiche che possiedono la modalità j del carattere Y (totale colonna j-esima)

Dalla tabella a doppia entrata si ricavano due variabili statistiche MARGINALI

X = anno di nascita

Y = età lavorativa

MARGINALI:

Data una tabella a doppia entrata, è possibile costruire:

➢ Una tabella con le frequenze percentuali di riga

➢ Una tabella con le frequenze percentuali di colonna

140 donne intervistate e classificate secondo le variabili Occupazione e Livello di

Istruzione

FREQUENZE ASSOLUTE FREQUENZE PERCENUALI DI RIGA

(10/55) · 100 = 18.2% delle

donne lavoratrici hanno un

livello di istruzione basso.

FREQUENZE ASSOLUTE FREQUENZE PERCENTUALI DI COLONNA

(15/40) · 100 = 37.5% delle donne con

livello di istruzione medio lavora

STUDIO DELLE DIPENDENZE

La DIPENDENZA o lo studio della RELAZIONE tra caratteri si possono analizzare tramite:

➢ connessione principalmente per caratteri qualitativi

➢ modelli di regressione (solo per caratteri quantitativi) per descrivere analiticamente un carattere in funzione dell’altro

➢ correlazioni non parametriche per caratteri misti

CONNESSIONE

La CONNESSIONE equivale alla NON INDIPENDENZA: quando due variabili sono connesse tra loro, al variare di x c’è una

variazione non casuale in y.

Gli indici di connessione possono essere definiti come MISURA della DISTANZA DALLA INDIPENDENZA

Dove le frequenze teoriche fˆ ij descrivono la

situazione di indipendenza. La distanza tra queste due

tabelle mi indicano la connessione.

(non esistono frequenze teoriche = 0)

INDIPENDENZA STOCASTICA

Massima indipedenza tra le due variabili.

X: località di villeggiatura (VD)

Y: fascia d’età (VI)

Nella tabella notiamo che nella prima riga troviamo i valori più alti e poi

vanno a decrescere quindi capiamo subito che le città d’arte sono le meno visitate, indipendentemente dalla fascia d’età. Lo

notiamo ancora di più calcolando le % di colonna:

Quindi possiamo dire che le due variabili quindi sono indipendenti tra di loro: al variare la fascia d’età non varia la scelta di

villaggio di villeggiatura.

FREQUENZE TEORICHE

Vengono definite frequenze teoriche assolute fˆ ij le frequenze ottenute come:

Sono le frequenze che definiscono la situazione di indipendenza.

ESEMPIO:

CORRELAZIONE E REGRESSIONE

Studio della relazione lineare tra due variabili quantitative x e y

(per relazione lineare si intende quanto le coppie di punti xi ;yi tendono a disporsi lungo una retta)

L’indice che misura il grado di correlazione tra due variabili è il COEFFICIENTE DI CORRELAZIONE LINEARE DI BRAVAIS-PEARSON

COVARIANZA

Il concetto di correlazione dipende dal concetto di covarianza, ossia la media dei prodotti degli scarti di ogni variabile dalla

propria media aritmetica :

formula operativa:

Grafico: scatter plot, grafico a dispersione

QUALI VALORI PUÒ ASSUMERE?

La quantità (x

i

x

)(y

j

j

): è più spesso positiva se Cov > 0

In questo quadrante ogni punto ha scarti dalla media + ⇒ prodotto +

è più spesso negativa se Cov < 0

In questo quadrante ogni punto ha scarto dalla media di Y negativo e ogni scarto dalla

media di X è positivo ⇒ prodotto −

à Relazione lineare inversa = al crescere x, y decresce e viceversa

➢ la covarianza può assumere tutti i valori reali

➢ cov (XY ) > 0 indica una tendenza alla linearità positiva ( crescente )

➢ cov (XY ) < 0 indica una tendenza alla linearità negativa ( decrescente )

Se due variabili correlano NON vuol dire che una è la causa dell’altra

ESEMPIO:

si hanno 6 coppie di valori

QUINDI? COSA VUOL DIRE QUESTO DATO?

Nell’esempio visto, la Covarianza risultava pari a +51, 5. L’unica informazione che ci fornisce questo dato è che tra le variabili X e

Y c’`e una tendenza alla linearità positiva.

Per determinare se questa tendenza è forte o debole (per misurare quindi l’intensità ) occorre normalizzare la covarianza, cioè

dividerla per il suo valore massimo à CORRELAZIONE

COVARIANA NORMALIZZATA

Sapendo che la covarianza è sempre compresa tra −s x

s y

e s x

s y

si ricava che: - 1 ≤ r ≤ 1

Sx per sy è il valore massimo che può raggiungere la covarianza

R = +1:

Assume valore +1 quando il legame tra le due variabili è perfettamente lineare e

diretto.

La retta che congiunge i punti ha coefficiente angolare positivo.

R = - 1 :

Assume valore −1 quando il legame tra le due variabili è perfettamente lineare ma

inverso.

La retta che congiunge i punti ha coefficiente angolare negativo.

R=0:

Assume valore 0 in condizione di incorrelazione tra le due variabili

(non esiste un legame di tipo lineare tra le due variabili).

Ma questo non implica che le variabili non siano in relazione tra

loro... solo la loro relazione non è lineare!

ALTRI CASI:

Esempio di prima:

cov(X,Y) = 51. 5

Le variabili presentano una fortissima correlazione positiva

dove:

➢ a: intercetta , punto in cui la retta incontra l’asse delle Y , rappresenta il valore predetto di Y in corrispondenza di X

uguale zero (media di x a cui sottraggo il coefficiente angolare che moltiplica la media di x)

➢ b: coefficiente angolare (pendenza) inclinazione della retta, parametro della popolazione, rappresenta l’incremento

predetto di Y per un incremento unitario di X

➢ e: componente di errore.

RETTA DI REGRESSIONE

Dato il modello lineare y

=a+b·X , la stima dei parametri a e b avviene mediante un criterio

matematico chiamato criterio dei minimi quadrati.

È basato sulla minimizzazione di una funzione di perdita tra i valori realmente osservati y e i

valori teorici del modello y

.

COSA INDICA IL COEFFICIENTE ANGOLARE?

In base alla pendenza della

retta, per ogni cambiamenti

unitario in x, osserverò che la y

subisce dei cambiamenti +o-

evidenti.

Più è basso il coefficiente

angolare più la retta sarà piatta.

Coefficiente angolare : Intercetta:

Esempio di prima:

X

= 15; Y

= 11; s x

= 132; s y

= 20.667; cov = 51.

a= Y

− bX

L’equazione della retta di regressione è quindi: y = 5.15 + 0. 39 x

BONTÀ DI ADDATTAMENTO

Si dimostra che l’indice che misura la bontà di adattamento di una retta di regressione è il coefficiente di determinazione r

2

Essendo −1 ≤ r ≤ +1 → 0 ≤ r

2

≤ +

0: situazione di INCORRELAZIONE : la retta di regressione non spiega nulla, i dati non presentano linearità

1: situazione di massima CORRELAZIONE : la retta di regressione spiega tutto, passa per i dati, i dati sono allineati (crescenti o

decrescenti).

Esempio di prima:

Il modello fornisce un’ottima previsione

UTILIZZO PREDITTIVO

PROBLEMA: In base al modello proposto (che si è rivelato un ottimo modello), prevedere il peso del bambino all’età di 48 mesi.

La retta ha equazione: Y = 5.15+0.39·X

Per poter utilizzare il modello in modo predittivo, occorre sostituire all’interno dell’equazione al posto dell’incognita X il valore

della variabile indipendente:

Y

48

PROPRIETÀ DELLA RETTA DI REGRESSIONE

1. Passa per il punto delle medie marginali : dall’equazione esplicita si nota che il

punto di coordinate (μ x

, μ y

) appartiene alla retta di regressione.

2. Il segno del coefficiente angolare è dato da r:

se moltiplico e divido b

per σ

y

➢ Il segno del coefficiente angolare della retta di regressione dipende dal segno di r

RETTA DI REGRESSIONE AL VARIARE DI r

− 1 ≤ ρ < 0 coefficiente angolare < 0 ⇒ retta inclinata negativamente,

correlazione negativa

ρ=0 coefficiente angolare = 0 ⇒ incorrelazione

0 < ρ ≤ 1 coefficiente angolare > 0 ⇒ retta inclinata positivamente, correlazione positiva

ESEMPIO:

In un gruppo di pazienti cerebrolesi si vuole valutare se la presenza di deficit del campo visivo `e in relazione con il lato della

lesione.

Lesione DX/SN=variabile dicotomica A

Deficit di campo visivo SI/NO=variabile dicotomica B

Si costruisce la tabella di contingenza 2x2 con le frequenze osservate

La generica tabella di contingenza 2 × 2

VARIABILI QUANTITATIVA (VDipendente) E VARIABILE QUALITATIVA (VIndipendente)

Grafico à Boxplot

L’indice statistico adeguato per valutare la

relazione tra una variabile quantitativa e

una qualitativa è η

2

, compreso tra 0 e 1,

dove 0 indica indipendenza e 1 massima

dipendenza.

Nell’esempio vale 0.683, ad indicare un

legame di dipendenza medio-alto.

La riga in mezzo ai rettangoli rosa è la

mediana.

I baffi sono il valore massimo e minimo

della distribuzione.

Al crescere della classe energetica cresce

anche il prezzo.

a DI CRONBACH – COERENZA INTERNA

Indice molto utilizzato in Psicometria per valutare la coerenza interna di un questionario composto da k item diversi.

Misura quanto gli item sono tra loro coerenti nel misurare un costrutto latente.

Ipotesi:

➢ k item metrici o almeno su scale Likert a 5/7 passi

➢ Si calcolano le medie e le varianze di ogni item

➢ Si calcolano i punteggi totali di ogni soggetto e la varianza dei punteggi totali

dove:

k: item di un questionario

s j

2

: varianza dell’item j-esimo

s x

2

: varianza dei punteggi totali di ogni individuo

Può variare solo tra 0 e 1. Fornisce indicazioni sul grado di intercorrelazione tra gli item del questionario.

Se gli item di uno stesso questionario sono altamente correlati tra di loro (consistenza interna alta) sarà possibile concludere che

ciascun item dà un reale contributo alla misura del costrutto in esame e che nell’insieme tutti gli item si riferiscono allo stesso

costrutto.

Se gli item sono scarsamente correlati tra loro (bassa consistenza interna) potremo dire che alcuni di questi non costituiscono

una misura soddisfacente del costrutto.

α di Cronbach indica in che percentuale la misura in oggetto riflette il costrutto sottostante.

Se una scala d’ansia ha un valore di α = 0.80 vuol dire che l’80% del punteggio ottenuto dal soggetto è attribuibile proprio

all’ansia.

Se la consistenza interna di una scala di depressione è α = 0.40 vuol dire che il 40% di un punteggio riflette realmente la

depressione ma il restante 60% misura altro (?!).

Linee guida:

  • α ≤ 0 .60: inaccettabile
    1. 60 < α ≤ 0 .65: scarso/indesiderabile
    1. 65 < α ≤ 0 .70: appena accettabile
    1. 70 < α ≤ 0 .80: buono
  • α > 0 .80: ottimo

ESEMPIO:

Scala PGWBI del benessere (scala validata in italiano, composta da 22 item). Si considerino i seguenti 4 item, con scala di risposta

Likert a 6 passi:

➢ Nelle ultime 4 settimane, è stato infastidito da stati di tensione o perchè aveva i nervi a fior di pelle?

➢ Nelle ultime 4 settimane, è stato generalmente teso o ha provato tensione?

➢ Nelle ultime 4 settimane, è stato in ansia, preoccupato o arrabbiato?

➢ Nelle ultime 4 settimane, è stato o si è sentito sottoposto a stress o pressioni?

Sono chiaramente variabili osservate riferite ad un stesso costrutto, l’ ansia.

Numero di item fratto il numero di item - 1, per 1 – la

somma delle varianze fratto la varianza totale.

10 bambini con difficoltà di apprendimento vengono sottoposti ad alcuni test di

natura medica, psicologica e psichiatrica. Per ogni bambino vengono rilevate 5

variabili

X

1

: presenza di una patologia psichiatrica (nelle modalità S=presenza, N=assenza)

X

2

: presenza di ereditarietà della suddetta patologia (S=presenza, N=assenza)

X

3

: punteggio in un test di apprendimento (in centesimi) X 4

: punteggio in un test sul

Q.I.

X

5 : graduatoria stabilita da medici dopo colloqui (1=bambino con maggiore

difficoltà, 10 bambino con minor difficoltà).

CONSEGNA

Stabilire il grado di correlazione (scegliendo l’indice appropriato) tra:

  • La presenza di patologia e l’ereditarietà
  • La graduatoria di gravità e il test di apprendimento
  • Tra il test di apprendimento e il test del Q.I.
  • Stabilire poi un modello lineare (retta di regressione) tra le variabili X 3

(variabile dipendente) e X 4

(variabile

indipendente) del tipo

X

3

=a+b·X 4

  • Valutare l’adattamento del modello al punto precedente.