Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Analisi Statistica Bivariata: La Connessione, Slide di Psicometria

Slide delle lezioni - tecniche statistiche di standardizzazione e statistica inferenziale

Tipologia: Slide

2018/2019

Caricato il 12/06/2019

GMAIL.COOP
GMAIL.COOP 🇮🇹

2.3

(3)

12 documenti

1 / 8

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
160
ANALISI STATISTICA
BIVARIATA
LA CONNESSIONE
Statistica Psicometrica - Prof. Bonanomi
161
VARIABILE STATISTICA DOPPIA
Dati due caratteri X e Y e la loro distribuzione di frequenze
congiunte
fij = numero di unità statistiche che presentano la coppia di
modalità (xi, yj)
l’insieme (X,Y) delle terne
{xi, yj, fij} (i=1,2…,h; j=1,2,…,k)
è detto variabile/mutabile statistica doppia
162
Y
y
1
y
2
y
j
y
k
f
i.
x
1
f
11
f
12
: f
1.
x
2
f
21
f
22
: f
2.
: : :
X
x
i
f
ij
f
i.
: : :
x
h
: f
hk
f
h.
f
.j
f
.1
f
.2
f
.j
f
.k
n
frequenza
congiunta
frequenza
marginale
di X
frequenza
marginale di Y
TABELLA A DOPPIA ENTRATA /
TAVOLE DI CONTINGENZA
Numero totale di
unità statistiche
163
la frequenza congiunta fij definisce il numero
di unità statistiche che possiedono
congiuntamente la modalità idel carattere Xe
la modalità jdel carattere Y
la frequenza marginale fi. definisce il numero
di unità statistiche che possiedono la modalità i
del carattere X
la frequenza marginale f.j definisce il numero
di unità statistiche che possiedono la modalità j
del carattere Y
pf3
pf4
pf5
pf8

Anteprima parziale del testo

Scarica Analisi Statistica Bivariata: La Connessione e più Slide in PDF di Psicometria solo su Docsity!

ANALISI STATISTICA

BIVARIATA

LA CONNESSIONE

Statistica Psicometrica -

Prof. Bonanomi

VARIABILE STATISTICA DOPPIA

Dati due caratteri X e Y e la loro distribuzione di frequenzecongiuntef

ij

= numero di unità statistiche che presentano la coppia di

modalità (x

, yi

)j

l’insieme (X,Y) delle

terne

{x

, yi

, fj

ij

(i=1,2…,h; j=1,2,…,k)

è detto

variabile

mutabile statistica doppia

Y

y

1

y

2

y

j

y

k

f

i.

x

1

f

11

f

12

f

x

2

f

21

f

22

f

X

x

i^

f

ij

f

i.

x

h

f

hk

f

h.

f

.j

f

.

f

.

f

.j

f

.k

n

frequenzacongiunta

frequenzamarginaledi X

frequenzamarginale di Y

TABELLA A DOPPIA ENTRATA /TAVOLE DI CONTINGENZA

Numero totale diunità statistiche

  • la

frequenza congiunta

f

ij

definisce il numero

di

unità

statistiche

che

possiedono

congiuntamente la modalità

i

del carattere

X

e

la modalità

j

del carattere

Y

  • la

frequenza marginale

f

i.

definisce il numero

di unità statistiche che possiedono la modalità

i

del carattere

X

  • la

frequenza marginale

f

.j

definisce il numero

di unità statistiche che possiedono la modalità

j

del carattere

Y

Numero di unità statisticheche possiedono la modalità idel carattere

X (totale

riga i-ma) Numero di unità statisticheche possiedono la modalità jdel carattere Y (totalecolonna j-ma)

k
i
ij
j

f

f

=

h

j

ij

i

f

f

=

h

k

h

k

ij

i^

j

i^

j

i^

j

f

f

f

n

⋅^

=

=

=

∑ ∑

Nel caso di questa tabella:

Somma delle frequenze diRIGA

Somma delle frequenze diCOLONNA

Ma tutto dipende dalla posizione nella tabella di X e Y!!!

Y

y

1

y

2

y

j

y

k

f i.

x

1

f 1 1

f 1 2

f

x

2

f 2 1

f 2 2

f

X

x

i

f

ij

f i.

x

h

f

h k

f h.

f

.j

f .

f

.

f

.j

f

.k

n

k
i
ij
j

f

f

=

h
j
ij
i

f

f

=

X

Y

x

1

f

y

1

f .

x

2

f

y

2

f .

x

h

f

h.

y

k

f

.k

n

n

Dalla tabella a doppia entrata si ricavano:

2 variabili statistiche

MARGINALI

marginale X

marginale Y

V.S. UNIVARIATE DA UNA TABELLA

A DOPPIA ENTRATA

esempio:

X = anasc

Y = etalav Y

X

^18

f

i.

f

.j

Frequenze % di colonna

Basso
Medio
Alto
Casalinghe
Lavoratrici
Totale
Livello di istruzione

Il 37.5% delle donne con livello di istruzione medio lavora

Quale delle due ha senso?

RISPOSTA…?

E perchè?

Riflessione sul concetto di dipendenza, di variabilidipendenti e indipendenti, sul tipo di studio….

STUDIO DELLA DIPENDENZA

La

DIPENDENZA

o lo studio della

RELAZIONE

tra caratteri si possono analizzare tramite:

connessione

principalmente per caratteri qualitativi

modelli di regressione

(solo per caratteri quantitativi)per descrivere analiticamente un caratterein funzione dell’altro

correlazioni non parametriche

per caratteri misti

CONNESSIONE

La

CONNESSIONE

equivale alla NON

INDIPENDENZA!

ovvero tra le variabili X e Y c’è una forma di legamee relazione (connessione), cioè il variare diuna

implica

un

qualche

cambiamento

non

casuale nell’altra

Gli indici di connessione possono essere definiti come:

MISURA della DISTANZA DALLA INDIPENDENZA

confronto^ f

i.

f

i.

f

. j

f

. j

frequenze osservate

frequenze teoriche

$

ij f

ij f

Frequenze della situazione di indipendenza

INDIPENDENZA STOCASTICA

X: località di villeggiatura (VD)Y: fascia d’età (VI)

mare

monti

citta d'arte

Y
X

adolescenti

giovani

adulti

anziani

Distribuzioni assolute di colonne

Distribuzioni percentuali di colonna

Cosa si puònotare????

Al variare di Y lefrequenze percentualidi X
NON variano !!!

INDICI DI CONNESSIONE

INDICE CHI-QUADRATO DI

PEARSON

(assoluto e normalizzato)

INDICE CHI-QUADRATO

DI PEARSON

Basato sui valori delle contingenze e dellefrequenze teoriche Indice assoluto:

dove:

f

ij

= osservate

ij

f

= teoriche

c

ij

= contingenze

Casi limite:

minima connessione

= indipendenza

(^2) min

0

χ

=

(osservate = teoriche

)

massima connessione

= massima dipendenza

(

)

(

)

(^2) max

min

h

k

n

χ

=

N

=

χ

n

min

 



(h

1);(k

Indice normalizzato

per cui, ovviamente

N

indipendenza

stocastica

massima dipendenza

i

j

C

ij

2

^ n

ij

2

2

2

2

2

2

N

2

2

n

min

^ 



(h

1);(k

^ n

ij

c

ij

bassa connessione!