Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


PSICOEMTRIA DISPENSE, Dispense di Psicometria

RIASSUNTO LIBRO CORSO DI PSICOMETRIA

Tipologia: Dispense

2020/2021

Caricato il 12/06/2023

alice-grosso-2
alice-grosso-2 🇮🇹

6 documenti

1 / 8

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Capitolo 3 STATISTICA DESCRITTIVA MONOVARIATA
DISTRIBUZIONI DOPPIE DI FREQUENZA
Con i simboli xi e yj indichiamo due generiche modalità rispettivamente della
variabile x e della variabile y, le modalità di x saranno x1, x2..xi e le modalità di y
saranno y1,y2yiyj. Con le lettere I e J indichiamo il numero di modalità
rispettivamente della variabile X e Y. Possiamo definire quindi la distribuzione
doppia di frequenza di X e Y come la distribuzione che affianca una frequenza ad
ogni coppia (xi yj).
La doppia distribuzione di frequenza viene rappresentata con una tabella a doppia
entrata, ovvero la tabella di contingenza; dove nelle celle del riquadro centrale sono
riportate le frequenze di cella, ogni riga e ogni colonna costituisce una distribuzione
parziale, le frequenze riportate nella riga e nella colonna “totale” sono dette
frequenze marginali.
Su una tabella di contingenza si possono calcolare 3 tipi di frequenze:
1) Percentuali di riga
Si ottengono dividendo ciascun valore di cella per il rispettivo marginale di riga
e moltiplicando il risultato ottenuto per 100
2) Percentuali di colonna
Si ottengono dividendo ciascun valore di cella per il rispettivo marginale di
colonna e moltiplicando il risultato ottenuto per 100
3) Percentuali sul totale
Si ottengono dividendo ciascuna frequenza di cella per l’ampiezza del
collettivo e moltiplicando il risultato ottenuto per 100
La rappresentazione grafica di una distribuzione doppia di frequenze avviene
tramite
stereogramma dove c’è uno spazio a tre dimensioni (x, y, z) nel quale
vengono riportate sui primi due assi le modalità delle due variabili e sul terzo
le frequenze con cui ciascuna coppia di modalità si è presentata nel collettivo.
1
pf3
pf4
pf5
pf8

Anteprima parziale del testo

Scarica PSICOEMTRIA DISPENSE e più Dispense in PDF di Psicometria solo su Docsity!

DISTRIBUZIONI DOPPIE DI FREQUENZA

Con i simboli xi e yj indichiamo due generiche modalità rispettivamente della

variabile x e della variabile y, le modalità di x saranno x 1 , x 2 ..xi e le modalità di y

saranno y 1 ,y 2 …yi…yj. Con le lettere I e J indichiamo il numero di modalità

rispettivamente della variabile X e Y. Possiamo definire quindi la distribuzione doppia di frequenza di X e Y come la distribuzione che affianca una frequenza ad

ogni coppia (xi yj).

La doppia distribuzione di frequenza viene rappresentata con una tabella a doppia entrata, ovvero la tabella di contingenza ; dove nelle celle del riquadro centrale sono riportate le frequenze di cella, ogni riga e ogni colonna costituisce una distribuzione parziale, le frequenze riportate nella riga e nella colonna “totale” sono dette frequenze marginali. Su una tabella di contingenza si possono calcolare 3 tipi di frequenze: 1) Percentuali di riga Si ottengono dividendo ciascun valore di cella per il rispettivo marginale di riga e moltiplicando il risultato ottenuto per 100 2) Percentuali di colonna Si ottengono dividendo ciascun valore di cella per il rispettivo marginale di colonna e moltiplicando il risultato ottenuto per 100 3) Percentuali sul totale Si ottengono dividendo ciascuna frequenza di cella per l’ampiezza del collettivo e moltiplicando il risultato ottenuto per 100 La rappresentazione grafica di una distribuzione doppia di frequenze avviene tramite  stereogramma dove c’è uno spazio a tre dimensioni (x, y, z) nel quale vengono riportate sui primi due assi le modalità delle due variabili e sul terzo le frequenze con cui ciascuna coppia di modalità si è presentata nel collettivo.

Diagramma di dispersione , un diagramma cartesiano in cui i punti rappresentano i casi e le variabili costituiscono gli assi; in esso è del tutto assente l’informazione sulla distribuzione di frequenza congiunta L’analisi bivariata ha lo scopo di studiare la relazione tra le variabili. In una tabella di contingenza si ha indipendenza tra le variabili quando tutte le distribuzioni parziali contenenti le frequenze relative o percentuali sono uguali alla corrispondente distribuzione marginale. Possiamo calcolare la frequenza teorica effettuando il prodotto dei relativi marginali e dividendo il prodotto ottenuto per la numerosità totale del collettivo. La tabella di frequenza teoriche si ha in caso di totale indipendenza tra variabili; uno dei principali compiti della statistica bivariata consiste nel fornire misure per valutare quanto ci si allontana dalla condizione di totale indipendenza. L’ indipendenza può essere definita così: al crescere dei valori di una variabile non corrisponde un aumento o una diminuzione sistematica dei valori dell’altra. Se almeno una delle due variabili è cardinale possiamo definire un’indipendenza in media , possiamo definire che la variabile Y (cardinale) è indipendente in media dalla variabile X se, per ogni valore distinto di X, la media dei valori di Y è costante. La connessione mira ad evidenziare l’interdipendenza tra le due variabili Di una relazione tra variabili possiamo valutare il grado di concordanza , con questo termine si intendono concetti diversi in base al tipo di variabili:

  • concordanza tra variabili categoriali (condizioni) due variabili aventi lo stesso n° di modalità, e che ad ogni modalità di X corrisponda una sola modalità di Y e viceversa. Si ha tanta più concordanza quanto più le frequenze osservate si concentrano nella diagonale principale della matrice risultante dall’incrocio delle due variabili; si avrà tanta più discordanza quanto più le frequenze osservate nella diagonale saranno minori delle frequenze teoriche.
  • concordanza tra variabili ordinali e cardinali Oltre che sull’intensità ci informa sulla direzione della variazione di una variabile al variare dell’altra. Se al crescere di X cresce anche Y la misura avrà segno positivo, se al crescere di X, Y decresce la misura avrà segno negativo.

Alcune misure basate sul chi quadrato:

- Phi quadrato È una misura di connessione che consiste nel rapporto tra il valore del chi quadrato e la numerosità dei casi; è una misura simmetrica che assume come valore minimo lo 0. Sono invece asimmetriche le misure Misura la dipendenza da XeY e assume valore 1 nel caso di dipendenza perfetta Misura la dipendenza di Y da X anch’essa assume valore in caso di dipendenza perfetta Il T di schuprov È simmetrico e assume valore 1 nel caso di dipendenza reciproca perfetta. Misure non basate sul chi quadrato: coefficienti di incertezza Data una tabella di contingenza che incrocia due v. categoriali X e Y possiamo calcolare l’eterogeneità delle due distribuzioni marginali: l’eterogeneità della variabile X, Hx e l’eterogeneità di Y, Hy. Hx= Hy= La formula estesa alla distribuzione doppia di X e Y sarà Combinando le tre misure di eterogeneità otteniamo una misura simmetrica della relazione tra le due variabili possiamo quindi scrivere Dove Ixy detto coefficiente di incertezza assume valore 0 nel caso di assenza di relazione valore 1 se le due variabili hanno lo stesso n° di modalità,diversamente sarà inferiore a 1

OPERATORI DI CONCORDANZA

Si parla di concordanza nel caso di v. categoriali se tra le categorie delle due v. esiste un’affinità dal punto di vista logico. Per calcolare il K di Cohen si considerano solo le frequenze poste nella diagonale principale della tabella di contingenza, cioè quelle che riguardano l’incrocio tra le categorie affini; se le frequenze sono maggiori dei valori teorici si ha una concordanza, se invece sono inferiori si ha una discordanza. Più le frequenze della diagonale sono simili a quelle teoriche minore sarà la relazione tra le due categorie affini delle due variabili. K di Cohen Dove è la somma delle frequenze relative nella diagonale principale E dove è la somma delle frequenza teoriche Quando in ciascuna dicotomia i codici numerici indicano le differenze di grado si può ricorrere ad altre misure, tra le quali il Q di Yule Esso varia tra -1 (max discordanza) e +1 (max concordanza); lo 0 indica l’assoluta indipendenza delle due variabili Quando si valuta la concordanza tra dicotomia con modalità ordinate si può ricorrereal coefficiente di correlazione rphi Quando le frequenze sono concentrate nelle celle poste sulla diagonale principale cè max concordanza e il valore max che è pari a + Quando le celle poste sulla diagonale principale hanno frequenza pari a 0 c’è max discordanza e il valore minimo è pari a -

r assume valore min -1 e max +1 indipendentemente dall’unità di misura delle variabili r assume valore 0 quando le variabili sono linearmente indipendenti. Anche per le variabili cardinali si può valutare la relazione asimmetrica, attraverso il coefficiente b, esso è un coefficiente di regressione strettamente connesso alla covarianza e alla varianza x-> v. indipendente y->v. dipendente Questo coefficiente è quindi il rapporto tra la covarianza di XeY e la varianza della variabile considerata come indipendente. OPERATORI DI DETERMINAZIONE La determinazione è una misura asimmetrica, gli operatori che ne permettono una valutazione sono sia simmetrici che asimmetrici. Tanto è maggiore il grado di determinazione tanto più forte è la relazione.

  • Misure di RPE -> quando X e Y sono v. categoriali possiamo valutare la mutabilità riprodotta in termini di riduzione proporzionale dell’errore Con la misura lambda rapportiamola riduzione degli errori al n° di errori che avremmo commesso. È un operatore asimmetrico con valore min 0 e valore max 1, se le variabili sono indipendenti assume valore 0, ma può assumere valore 0 anche se non sono indipendenti. Questo non accade al tau di Goodman e Kruskal la misura varia tra 0 e 1 e rappresenta la percentuale di errori risparmiati.
  • Phi quadrato, è un coefficiente di determinazione quando le v. sono dicotomiche. Il suo valore varia tra 0 e 1 e può essre interpretato come percentuale di varianza riprodotta (nel caso di dicotomie con modalità ordinate) e di RPE o mutabilità riprodotta (nel caso di dicotomie non ordinate) - Rapporto di correlazione: E² usato nello studio di una relazione tra una v. cardinale e una v. categoriale o ordinale; consente di valutare quanto ci si allontana dalla situazione di indipendenza in media. I valori di Y vengono raggruppati in tanti gruppi quante sono le modalità di X, è possibile calcolare la media di ciascun gruppo: media parziale (Yk). La media generale invece è la media di Y calcolata sulla totalità delle osservazioni e la indichiamo con y; il rapporto di correlazione ci ppermette di valutare quanto la variabile x ci permette di prevedere i valori di y

TRE VARIABILI

La relazione tra X e Y viene detta spuria se essa svanisce con l’introduzione di una terza variabile, Z, che precede temporalmente o logicamente la v. indipendente X. Se la terza variabile non modifica la relazione tra le prime due l’ipotesi di causalità verrà rinforzata; se invece con la terza v. la relazione si annulla o quasi, diremo che si tratta di una relazione spuria. Ci sono 2 casi di relazione spuria tra v. cardinali:

  1. anche la v. di controllo è cardinale possiamo riscrivere la correlazione tra le due variabili originarie, rxy, come somma di due addendi, una componente genuina, gxy, e una spuria, ixy. Dove rxy= gxy+ixy ixy=rxz ryz gxy=rxy-ixy
  2. quando la v. di controllo è dicotomica per capire se la relazione causale è genuina o no si calcola il coeff. di correlazione nei due sottocampioni omogenei rispetto alla v. di controllo. Se sono prossimi a 0 la relazione è spuria. PRIMA DI COMMENTARE IN SENSO CAUSALE IL VALORE ASSUNTO DA UN QUALSIASI OPERATORE BIVARIATO E’ OPPORTUNO CHIEDERSI SE ESISTONO UNA O PIU’ TERZE VARIABILI CHE POSSONO MODIFICARE LA FORZA DELLA RELAZIONE ORIGINARIA.