Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Correlazione e Regressione Lineare: Studio della Relazione tra Due Variabili Quantitative, Slide di Psicometria

Slide delle lezioni - tecniche statistiche di standardizzazione e statistica inferenziale

Tipologia: Slide

2018/2019

Caricato il 12/06/2019

GMAIL.COOP
GMAIL.COOP 🇮🇹

2.3

(3)

12 documenti

1 / 16

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
189
CORRELAZIONE E
REGRESSIONE
Statistica Psicometrica - Prof. Bonanomi
190
CORRELAZIONE
STUDIO DELLA RELAZIONE LINEARE
TRA DUE VARIABILI QUANTITATIVE XE Y
(per relazione lineare si intende quanto le coppie di punti xi;yitendono a
disporsi lungo una retta)
L’indice che misura il grado di correlazione tra due variabili è il
COEFFICIENTE DI CORRELAZIONE LINEARE
DI BRAVAIS-PEARSON
191
Cov(X,Y) = ( ) (M X X Y Y
=
=
( )( )
i j
i j
x X y Y
n
Per la sua definizione è necessario introdurre il concetto di
COVARIANZA
media dei prodotti degli scarti di ogni variabile
dalla propria media aritmetica
192
Come per la varianza, anche per la
covarianza esiste una formula operativa
Cov(X,Y) = M(XY)
X Y
=
=
( )
i j
i j x y X Y
n
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Anteprima parziale del testo

Scarica Correlazione e Regressione Lineare: Studio della Relazione tra Due Variabili Quantitative e più Slide in PDF di Psicometria solo su Docsity!

189

CORRELAZIONE E

REGRESSIONE

Statistica Psicometrica -

Prof. Bonanomi

CORRELAZIONE

STUDIO DELLA
RELAZIONE LINEARE
TRA DUE VARIABILI QUANTITATIVE
X
E
Y

(per relazione lineare si intende quanto le coppie di punti

xi

;yi

tendono a

disporsi lungo una retta)

L’indice che misura il grado di correlazione tra due variabili è il

COEFFICIENTE DI CORRELAZIONE LINEARE

DI BRAVAIS-PEARSON

191

Cov(X,Y) =

(^
M^
X^
X^
Y^
Y
^
−^
^

=^

(^

i^

j

i^

xj

X^

y^

Y

−^ n

∑ ∑

Per la sua definizione è necessario introdurre il concetto di

COVARIANZA

media dei prodotti degli scarti di ogni variabile

dalla propria media aritmetica

Come per la varianza, anche per la covarianza

esiste una

formula operativa

Cov(X,Y) = M(XY)

X

Y

=

=

(^

) i^

j

i^

j^

x y

X

Y

n^

−^

∑ ∑

193

ESEMPIO

Misuriamo il peso e l’età di un bambino in 6 momenti diversi Età:X(mesi)

Peso:Y(kg)

6 coppie di valori Proviamo arappresentarlegraficamente

ESEMPIO

ESEMPIO

•^

Ascissa X

: variabile

indipendente (età)

-^

Ordinata Y

: variabile

dipendente (peso)

Y

Rappresentazione in un diagramma cartesiano

(coordinate X,Y)

X

195

ESEMPIO X^ i^

Y^ j^

X^ i*

Y^ j

3

6

1 8

6

8

4 8

9

9

8 1

1 2

1 0

1 2 0

2 4

1 3

3 1 2

3 6

2 0

7 2 0

9 0

6 6

1 2 9 9

Cov(X,Y) = M(XY)

X
Y^
=^

(^

) i^

j

i^

x yj

X^
Y

n^

−^
⋅^

∑ ∑

=^
−^
=^
−^
⋅^

È tanto? È poco? Che informazioni fornisce questo dato?

la q u a n tità (x

− μ i

)(yX^

− μ j

)Y^

(+,+)

(-,-)

(+,-)

(-,+)

In questo quadrante ognipunto ha scarti dallamedia +

⇒⇒⇒⇒

prodotto +

y-μj

Y

x-μi

X

In questo quadrante ognipunto ha scarto dalla mediadi Y neg. e scarto dallamedia di X pos.

⇒⇒⇒⇒

prodotto

-

y-μj

Y

x-μi

X

Quali valori può assumere???

201

assume valore

-

quando il legame tra le due variabili è

perfettamente lineare ma inverso

.

La retta che congiunge i punti ha coefficiente angolare negativo

10080 60 40 20 00

1

2

3

4

5

pr e zz o

CASO PARTICOLARE r = -1 domanda

assume valore

+

quando il legame tra le due variabili è

perfettamente lineare e diretto

.

La retta che congiunge i punti ha coefficiente angolare positivo.

10080 60 40 20 00

1

2

3

4

5

pr e z z o

CASO PARTICOLARE domanda

r = +

203

ALTRI

ESEMPI

N.B: i dati nonstanno tuttisulla retta

|^ r

ESEMPIO precedente X^ i^

Y^ i^

X^ i*

Y^ i^

(^2) X i

(^2) Y i

3

6

1 8

9

3 6

6

8

4 8

3 6

6 4

9

9

8 1

8 1

8 1

1 2^

1 0

1 2 0

1 4 4

1 0 0

2 4^

1 3

3 1 2

5 7 6

1 6 9

3 6^

2 0

7 2 0

1 2 9 6

4 0 0

9 0

6 6

1 2 9 9

2 1 4 2

8 5 0

Cov(X,Y)

51.5=

2

2142

6

s^ X

=^

−^15

2 = 357 – 225 = 132

2

8506 s^ Y

=^

−^11

2 = 141.667 – 121 = 20.

cov(

,

)

51,

0, 986

132

X^ X YY

r^

s s =^

=^

=

Altissimacorrelazionepositiva

205

ESEMPIO precedente

25 20 15 10 5 00

5

10

15

20

25

30

35

40

La correlazione è molto forte, i punti tendono a disporsilungo una retta. Qual è l’equazione di questa retta?

Usi particolari di

r

in

psicologia

Calcolo dell’attendibilità

test – retest

Forme parallele di un test

Calcolo del coefficiente di equivalenza di due testparalleli

Attendibilità della capacità valutativa di due giudici

Consistenza interna di un questionario

Ecc. ecc. ecc..

Uso improprio della correlazione (Da una ricerca del New England Journal of Medicine)

207

Relazione diretta e indiretta

Cos’è una relazione diretta?

Cos’è una relazione indiretta?

Come si valuta un indice di correlazione?

Quando ha senso proseguire uno studio? IMPORTANZA DEL PORSI DELLE DOMANDE NEL FARERICERCA! LA STATISTICA SOSTIENE, NON ILLUMINA!!!

213

Regressione lineare

  • Studiare la relazione tra due variabili significa

descrivere in che modo una variabile “dipenda”da un’altra

e

bx

a

Y

i

i^

=

  • Descrizione di come una variabile

X

(variabile

INDIPENDENTE = “causa”

produce il variare di una variabile

Y

(variabile

DIPENDENTE= “effetto”

Parametri

dove

:^

a^

intercetta

, punto in cui la retta

incontra l’asse delle

Y,

rappresenta il

valore predetto

di Y in

corrispondenza di X uguale zero

b^

coefficiente angolare

inclinazione della retta, parametrodella popolazione, rappresenta^ l’incremento predetto

di Y per un

incremento unitario di X

e^

errore

215

Retta di regressione

Dato il modello lineare

y* = a + b·X

, la stima dei

parametri “a” e “b” avviene mediante un criterio

matematico chiamato

“ criterio dei minimi quadrati

E’ basato sulla minimizzazione di una funzione diperdita tra i valori realmente osservati

y

e i valori

teorici del modello

y*

X^1

X

2

X

3

X^4

X

5

X

Y

= dati campionari ^

= dati teorici

Retta di regressione

217

Stima dei Parametri

Si dimostra che:

2

cov(

,^

)

X Y X

b

s

= a

Y

bX

=^

Coefficiente

angolare

Intercetta

218

ESEMPIO precedente

Misuriamo il peso e l’età di un bambino in 6 momenti diversi Età:X(mesi)

Peso:Y(kg)

6 coppie di valori

ESEMPIO

25 20 15 10 5 00

5

10

15

20

25

30

35

219

ESEMPIO

Sono già stati calcolati alcuni indici; riepiloghiamoli:

2

2

15;

11;

132;

20, 667;cov

51,

X^

Y

X

Y^

s^

s

=^

=^

=^

=^

=

2

cov(

,^

)

X Y^ X

b

s

= a

Y

bX

=^

51,5^132

b

=

=^

0, 39

11

0,39 15

a

=

−^

⋅^

=

5,

La retta ha pertanto equazione:

Y=5,15+0,39X

220

Domanda

La retta che abbiamo appena trovato è un buon

modello? Spiega bene la variabilità dei dati? Si adatta

bene alla nuvola di punti che abbiamo disegnato?Ok, tra le infinite rette del piano è la migliore, ma a

livello generale è un modello valido?

Necessità di definire

un indicatore di adattamento

225

^^ b

=^

cov(XY)

(^2) σX

ρ^ =

cov(XY) σX

σ Y

se moltiplico e divido b

^

per

σ

Y

^^ b

=^ ρ

σ Y σX

* y

+Y

Y σX

 



x−μ

X

il segno del coefficiente angolare della rettadi regressione dipende dal segno di

r

2) Il segno del coefficiente angolare è dato da r

GRAFICAMENTE:

retta di regressione al variare di

ρρρρ coeff. ang.>

retta

coeff. ang.=0 inclinata positivamente =correlazione positiva

retta

coeff. ang.<0 parallela asse X =incorrelazione

retta

inclinata negativamente =correlazione negativa

Esempio output

regressione

227

Commentare il seguente output della regressione lineare ottenuto per valutare se il voto ad un esame possa dipendere dal numero di ore di studio.^ OUTPUT RIEPILOGO

Statistica della regressione R multiplo

0,

R al quadrato

0,

R al quadrato corretto

0,

Errore standard

6,

Osservazioni

20

Coefficienti

Intercetta

52,

Ore di studio

1,

Grafico a dispersione

12010080 60 40 20 00

5

10

15

20

25

30

35

Ore di studio

Voto

Voto

CORRELAZIONI NON

PARAMETRICHE

  • Spesso

capita

di

non

avere

a

disposizione

delle

misure di tipo metrico per le due variabili, X e Y,che si pensa possano essere associate

  • Se si hanno scale dicotomiche o ordinali, vi sono

una

varietà

di

coefficienti

concettualmente

simili

alla

r

di Pearson

  • I

coefficienti

non

parametrici

devono

essere

utilizzati anche quando una sola delle due variabiliin

relazione

non

raggiunge

il^

livello

metrico

di

misurazione

229

INDICE DI SPEARMAN

Nel caso in cui le due variabili sono misurate su scala

ordinale,

si^

utilizza

il^

coefficiente

rs

di

Spearman

, che fornisce un indice di correlazione

tra

ranghi

il^

rango

è

la

posizione

occupata

dall’unità statistica nella graduatoria ordinata crescente dei dati

E’ utilizzabile altresì quando una variabile è ordinata

e^

l’altra

è^

metrica,

previa

trasformazione

di

quest’ultima in ranghi.

La

prima

operazione

da

fare

è^

quindi

quella

di

ordinare

i dati e ottenere i ranghi.

L’indice

varia

da

a

esattamente

come

r

di

Pearson, ed ha medesima interpretazione.

INDICE DI SPEARMAN

(^

2 (^12)

n

i

i

s

d

r^

n^

= n

=^

−^

Dove:• d

è la differenza tra i ranghi per il soggetto i

i-mo

  • n

è il numero dei soggetti

+1: perfetta concordanza

positiva

-1: perfetta concordanza negativa

(massima discordanza!!)

0: indipendenza o

incorrelazione

231

Esempio

n=

10 alunni;

X =graduatoria (rango) in matematica stabilita dall’insegnante;

Y=

punteggio in un test di matematica soggetto

X^
Y
A^
B^
C^
D^
E^
F^
G^
H^
I^
L^

Occorre trasformarli

in ranghi

Esempio Spearman

s o g g e tto

X^

Y^

R an g o (Y )

d^ i

d^ i

2

A^

3

8 6

3

0

0

B^

5

5 6

4

1

1

C^

1

8 7

2

1

D^

4

4 3

7

9

E^

1 0

3 3

9

1

1

F^

2

9 1

1

1

1

G^

6

4 6

6

0

0

H^

8

4 2

8

0

0

I^

7

5 2

5

2

4

L^

9

2 4

1 0

1

n^ = 1 0

1 8

T o tale

(^

)^

(^

2 12

2

n

i i

s

d

r^

n^

= n

=^

−^

=^

−^

−^

⋅^

Correlazione molto forte

237

Esempio

Esempio

Si calcola il coefficiente

rphi

(^

)^

(^

)

(^

) (

)

6 0

4 0

3 0

1 0

.4 4 7

7 0

9 0

7 0

5 0

p h i

x^

x

r^

x^

x

=^

=

Lato lesione (var Y)

DEFICIT(var X)

DX (y1)

SN (y2)

TOTALI

SI (x1)

60

30

90

NO (x2)

10

40

50

TOTALI

70

70

140 (N)

Relazione tra una Quantitativa

(VD) e una Qualitativa (VI)

Relazione tra una Quantitativa

(VD) e una Qualitativa (VI)

239

L’indice

statistico

adeguato

per

valutare

la

relazione

tra

una

variabile

quantitativa

e^

una

qualitativa

è

Eta

quadro,

compreso

tra

e

dove

indica

indipendenza

e^

massima

dipendenza.Nell’esempio

vale

indicazione

di

un

legame di dipendenza medio-alto.

Indice molto utilizzato in Psicometria per valutare la coerenza interna di

un questionario composto da

k

item diversi.

Misura quanto gli item sono tra loro coerenti e quanto «misurano uno

stesso costrutto latente» Ipotesi:-^

k^ item metrici o almeno su scale Likert a 5/7 passi

-^

Si calcolano le medie e le varianze di ogni item

-^

Si^

calcolano

i

punteggi

totali

di

ogni

soggetto

e

la

varianza

dei

punteggi totali

Coerenza Interna –Alpha di Cronbach

241

Coerenza Interna –Alpha di Cronbach

242

-^

Può

assumere

valori

da

^0

a

1

e

fornisce

indicazioni

sul

grado

di

intercorrelazione tra gli item del questionario.

-^

Se gli item di uno stesso questionario sono altamente correlati tra di loro(consistenza interna alta) sarà possibile concludere che ciascun item dàun reale contributo alla misura del costrutto in esame e che nell’insiemetutti gli item si riferiscono allo stesso costrutto

-^

Se

gli

item

sono

scarsamente

correlati

tra

loro

(bassa

consistenza

interna) potremo dire che alcuni di questi non costituiscono una misurasoddisfacente del costrutto

-^

L’Alfa di Cronbach indica in che percentuale la misura in oggetto rifletteil costrutto sottostante:

Coerenza Interna –Alpha di Cronbach

243

-^

Se una scala d’ansia ha un valore di

α = 0.

vuol dire che l’80% del

punteggio ottenuto dal soggetto è attribuibile proprio all’ansia.

-^

Se la consistenza interna di una scala di depressione è

α = 0.

vuol

dire che il 40% di un punteggio riflette realmente la depressione ma ilrestante 60% misura altro (?!). INTERPRETAZIONE: < di 0.60 = inaccettabilecompreso tra 0.60 e 0.65 = indesiderabilecompreso tra 0.65 e 0.70 = appena accettabilecompreso tra 0.70 e 0.80 = buono> di 0.80 = ottimo

Coerenza Interna –Alpha di Cronbach

244

Scala PGWBI del benessere (scala validata in italiano, composta da 22item). Si considerino i seguenti 4 item, con scala di risposta Likert a 6passi: 1) Nelle ultime 4 settimane, è stato infastidito da stati di tensioneo perché aveva i nervi a fior di pelle?2) Nelle

ultime

4

settimane,

è

stato

generalmente

teso

o

ha

**provato tensione?

  1. Nelle**

ultime

4

settimane,

è

stato

in

ansia,

preoccupato

o

**arrabbiato?

  1. Nelle**

ultime

4

settimane,

è

stato

o

si

è

sentito

sottoposto

a

stress o pressioni? Sono chiaramente variabili osservate riferite ad un stesso costrutto,

L’ANSIA

Esempio

Alpha di Cronbach

RISULTATI

1. -0.252. +0.9153. +0.8344. a =

131.436 ; b = 2.