Scarica Introduzione alla psicometria e più Prove d'esame in PDF di Statistica solo su Docsity! ELEMENTI DI PSICOMETRIA Una scala di misura si dice DISCRETA quando i valori sono completamente separati tra loro e non ci sono valori intermedi (tutte le scale qualitative: nominali e ordinali sono discrete). Una scala di misura si dice CONTINUA quando tra un valore e l’altro si possono inserire infinite possibili misurazioni. Scala NOMINALE: ciò che si sta misurando può essere solo diviso in categorie e gli eventuali valori numerici rappresentano la categoria di appartenenza, ogni elemento misurato può appartenere a una e una sola categoria. Es. genere, professione, orientamento politico. Scala ORDINALE: le varie categorie possono essere ordinate in maniera crescente o decrescente ma non è possibile stabilire quanta distanza separa ciascuna categoria. Es. status socio-economico, titolo di studio, classi di età. Scala a INTERVALLO: è possibile stabilire in maniera esatta la distanza tra una categoria e l’altra grazie al riferimento ad una specifica unità di misura. Esiste un punto di origine relativo sotto al quale è possibile scendere, perciò gli elementi misurati possono assumere sia valori positivi sia negativi. Es. test psicologici, temperatura. Scala a RAPPORTO: è possibile stabilire in maniera esatta la distanza tra una categoria e l’altra grazie al riferimento ad una specifica unità di misura. Esiste un punto di origine assoluto sotto al quale non è possibile scendere, perciò gli elementi misurati possono assumere solo valori positivi. Es. altezza, peso, età. La DISTRIBUZIONE DI FREQUENZA PER CLASSI si usa solo se i punteggi sono più di 15-20. Gli intervalli devono essere in numero compreso tra 8 e 15 e l’ampiezza di ogni intervallo deve essere pari a 2, 3, 5 o un numero multiplo di 5. Per stabilire l’ampiezza dell’intervallo si calcola la gamma di oscillazione(= massimo-minimo). Per es. se la gamma di oscillazione è pari a 20, faccio 20:2 (ampiezza scelta)=10 (n. di intervalli). Il valore minimo di ogni intervallo è incluso mentre il massimo è escluso. Es. intervallo: 7-11 va da 6,5 a 10,5. Il GRAFICO A BARRE (quello con barre separate da spazi) si usa per variabili discrete. L’ISTOGRAMMA ( quello con variabili non separate da spazi) si usa per variabili continue. In tutti i grafici la frequenza si mette sull’asse y e il punteggio sull’asse x. Nel DIAGRAMMA RAMO-FOGLIA i rami rappresentano gli intervalli di classe e le foglie sono i valori che cadono nell’intervallo di riferimento. Sui rami si mette solo il numero delle decine, mentre le foglie si indicano con l’unità. Se non ci sono decine le foglie si indicano con lo 0. Una distribuzione si dice SIMMETRICA se si può dividere in due metà speculari e ASIMETRICA se non si può dividere in due metà speculari. Una distribuzione ASIMMETRICA può esserlo a DESTRA(la maggior parte dei valori sono bassi, ma alcuni soggetti hanno un valore alto) o a SINISTRA (la maggior parte dei valori sono alti, ma alcuni soggetti hanno un valore basso). La MODALITA’ è il numero di massimi in una distribuzione. Una distribuzione può essere UNIMODALE (un solo massimo), BIMODALE (due massimi) o MULTIMODALE (più massimi). Una DISTRIBUZIONE NORMALE o GAUSSIANA è una distribuzione in cui la maggior parte dei punteggi si trova al centro e i punteggi estremi (alti o bassi) sono meno frequenti. E’ una distribuzione simmetrica e unimodale. Una distribuzione RETTANGOLARE o UNIFORME è una distribuzione in cui ciascun punteggio ha esattamente la stessa frequenza di tutti gli altri. Una DISTRIBUZIONE A CURVA J è una distribuzione in cui il punteggio più alto ha frequenza massima e la frequenza diminuisce mano a mano che ci si sposta verso punteggi più bassi o viceversa. La PROPORZIONE si calcola f/N e non deve essere mai superiore a 1, inoltre la somma delle proporzioni deve fare 1. La PERCENTUALE si calcola f/N x 100 e non deve mai essere superiore a 100, la somma delle percentuali deve fare 100. Se N 20 non ha senso calcolare la percentuale, inoltre è meglio non calcolare proporzioni e percentuali con variabili a intervallo/rapporto. I PERCENTILI dividono la distribuzione in 100 parti uguali. Il RANGO PERCENTILE è la percentuale di casi hanno ottenuto un punteggio pari o superiore a quello dato all’interno di uno specifico gruppo di riferimento. I DECILI dividono la distribuzione in 10 parti uguali. I QUARTILI dividono la distribuzione in 4 parti uguali. Per trovare la posizione dei quartili bisogna utilizzare le seguenti formule: Q1=(N+1)X1/4 Q2=(N+1)X2/4 Q3=(N+1)X3/4. Se la posizione trovata non è un intero si usa l’intero inferiore. Il primo quartile ha sotto di sé il 25% dei dati, il secondo ha sotto di sé il 50% dei dati e corrisponde alla mediana e il terzo ha sotto di sé il 75% dei dati. La MEDIA aritmetica è un indice di tendenza centrale che corrisponde alla somma di tutti i valori di una distribuzione divisa per la numerosità. Si indica con se riferita a un campione. La media è molto sensibile ai valori estremi presenti in una coda della distribuzione non controbilanciati da valori altrettanto estremi nell’altra coda. In tal caso la media fornisce informazioni distorte. Si utilizza con variabili Quantitative: A INTERVALLO/RAPPORTO. La MEDIANA è il punteggio centrale all’interno di una distribuzione di valori in cui i punteggi sono stati ordinati. Se il numero di punteggi è pari allora la mediana corrisponde alla semisomma dei due valori centrali, se il numero di punteggi è dispari allora la mediana corrisponde al valore centrale. La mediana si indica con mdn. Quando la distribuzione è simmetrica µ = mdn = mo. Quando la distribuzione è asimmetrica a sinistra µ mdn. Quando la distribuzione è asimmetrica a destra µ mdn. Questo perché la mediana non è sensibile ai punteggi estremi. Si utilizza con variabili ORDINALI. ottenere una figura: 12/52 ottenere un fante o un 8: 4/52+4/52=8/52 ottenere una carta inferiore a 6: 20/52 ottenere un asso o una carta di fiori: 4/52+13/52-(1/52)=16/52 ottenere una carta numerica pari oppure inferiore o uguale a 4: 20/52+16/52-(8/52)=28/52 Regola moltiplicativa (AND): La probabilità che accadano contemporaneamente due eventi A e B tra loro indipendenti è pari al prodotto delle singole probabilità P(AeB)=P(A)xP(B). Due eventi si dicono indipendenti quando la probabilità del primo non influenza quella del secondo. Es: Lanciando 4 monete qual è la probabilità di ottenere 4 teste simultaneamente? ½ x ½ x ½ x ½=1/4 Qual è la probabilità di estrarre un re da un mazzo di 52 carte e poi di estrarre un asso di cuori alla seconda estrazione, effettuata dopo aver riposto il re nel mazzo e aver rimescolato le carte? 4/52 x 1/52= 4/2704= 0,0015 Probabilità condizionata: La probabilità che si verifichino due eventi A e B tra loro dipendenti si calcola con: P(A/B)=P(A B)/P(B) ES:Qual è la probabilità che un asso, estratto da un mazzo di 52 carte, sia di cuori (1/52)/( P(asso) 4/52 P(carta di cuori) 14/52 P(asso di cuori) 1/52 Il CALCOLO COMBINATORIO consente di calcolare in quanti modi si può combinare una serie di oggetti. Il modo di enumerare le cose dipende dalla loro quantità totale=n, da quanti ne enumero alla volta=k, dalla possibilità che le cose si possano ripetere=c o non si possano ripetere=s. Le enumerazioni in cui importa l’ordine di comparsa si chiamano DISPOSIZIONI, quelle in cui non importa si chiamano COMBINAZIONI. Per effettuare un calcolo combinatorio è necessaria la nozione di FATTORIALE: prodotto di tutti i numeri a partire da n fino a 1, si indica con n! Es. fattoriale di 5: 5!=5x4x3x2x1 Per definizione 1!=1 0!=1 Disposizioni senza ripetizione: D(n,k,s)= n!/(n-k)! Es. devo fare una cena con 4 amici ma ho solo 3 sedie. Li invito due alla volta e tengo conto dell’ordine in cui li dispongo (destra,sinistra rispetto a me). Quante cene devo fare? D(4,2,s) =4x3x2x1/(4-2)!=24/2x1= 12 cene Permutazione: è una disposizione senza ripetizione in cui k=n D(n,k,s)=n! Es. in quanti modi possono disporsi 4 amici attorno a un tavolo? D(4,4,s)=4x3x2x1=24 Disposizione con ripetizione: D(n,k,c)= n alla k Es. in quanti modi possono cadere due dadi? D(6,2,c)= 6² =36 Combinazione senza ripetizione: C(n,k,s)=n! /K!(n-k) Es. Devo fare una cena con 4 amici ma ho solo 3 sedie. Li invito due alla volta senza tenere conto dell’ordine in cui li dispongo. Quante cene devo fare? C(4,2,s)= (4x3x2x1)/2(4-2)= 24/4=6 cene Combinazione con ripetizione: C(n,k,c)=(n+k-1)! /k!(n-1)! Es. In quanti modi possono cadere 2 dadi, se non importa l’ordine dei numeri? C(6,2,c)=(6+2-1)!/2(6-1)!= 7/2(5)!= 7x6x5!/2x5!= 7x6/2= 42/2=21 Una variabile si dice BINOMIALE quando è dicotomica, cioè assume solo due valori. Il test binomiale può essere applicato per verificare la distribuzione interna di una variabile dicotomica. Nel test binomiale H0 implica che la variabile si distribuisca secondo la proporzione attesa impostata, H1 implica che le proporzioni siano differenti. Quando voglio confrontare la distribuzione di due variabili dicotomiche appaiate all’interno di un campione, ma non posso usare il T test perché non sono certa di aver effettuato misurazioni precise, uso il TEST DEL SEGNO PER CAMPIONI APPAIATI (solo per variabili NOMINALI/ORDINALI). Per variabili quantitative utilizzo il test di Wilconox. Il CHI QUADRO (solo per variabili NOMINALI/ORDINALI) è una statistica che consente di: 1. INDIPENDENZA: Verificare se tra due variabili c’è un legame significativo. H0= le variabili sono indipendenti (non c’è nessun legame significativo), H1= le variabili non sono indipendenti (c’è un legame significativo). Il valore del Chi-quadro va confrontato con il Chi-quadro critico che si trova sulla TAVOLA H. Se X² < X²critico: accetto H0, Se X² ≥ X²critico rifiuto H0. 2. EQUIPROBABILITA’ : Verificare se una variabile si distribuisce casualmente. H0=la variabile si distribuisce casualmente (es. la probabilità di nati schizofrenici è uguale in tutti i periodi dell’anno), H1=la variabile non si distribuisce casualmente (la probabilità di nati schizofrenici cambia a seconda del periodo dell’anno). 3. MODELLO: verificare se una o due variabili si distribuiscono in base a un modello teorico definito. In questo caso vogliamo che X² non sia significativo cioè che sia < X² critico. Con il Chi Quadro è possibile capire se due variabili sono o meno indipendenti, nel caso in cui si rifiuta H0 e si stabilisce dunque che tra le variabili c’è un legame, il Chi Quadro non consente di stabilirne l’intensità del legame. Per risolvere il problema si può calcolare il COEFFICIENTE PHI φ. Esso è un indice di associazione che va da 0 a 1: più il valore si avvicina a 1 più l’associazione è forte. Va bene solo per variabili con due categorie. Se le variabili si dividono in più di due categorie si utilizza il COEFFICIENTE PHI DI CRAMER φC l