Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica Psicometrica dispense, Dispense di Statistica Psicometrica

Appunti completi del corso di Statistica Psicometrica con formule, esercizi ed esempi.

Tipologia: Dispense

2022/2023

In vendita dal 14/12/2022

paola-prencipe
paola-prencipe 🇮🇹

4.7

(18)

25 documenti

1 / 87

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA PSICOMETRICA
La STATISTICA è un insieme di strumenti LOGICI e MATEMATICI-PROBABILISTICI per la
MISURA e il TRATTAMENTO di grandi quantità d informazioni configurabili come FENOMENI
DI MASSA.
Si può utilizzare in contesti diversi in psicologia, come:
ANALISI di un QUESTIONARIO
MISURAZIONE di un FENOMENO osservato
Misurazione di un fenomeno LATENTE
La PSICOMETRIA è la disciplina che studia le caratteristiche PSICOLOGICHE-->il suo TEMA
PRINCIPALE è la COSTRUZIONE, VALIDAZIONE è TARATURA degli strumenti di misura e la
MISURAZIONE dei fenomeni psicologici.
La PSICOMETRIA cerca di COLLEGARE quello che si è osservato attraverso uno strumento
con un costrutto LATENTE (come la depressione, l’autostima...)-->essa si serve della
statistica per collegare cose osservabili con cose NON osservabili.
ELEMENTI DELLA RICERCA
Si definisce una POPOLAZIONE TARGET da cui si estrae un CAMPIONE RAPPRESENTATIVO da
cui si estraggono alcuni dati per fare delle INFERENZE e delle conclusioni.
Il campione rappresentativo è l’UNITA’ STATISTICA o SPERIMENTALE.
L'OGGETTO di studio all’interno dell’UNITA’ STATISTICA è il CARATTERE-->può avere una
natura QUALITATIVA o QUANTITATIVA:
QUALITATIVA: un carattere che una persona possiede oppure non possiede
(esempio: il colore biondo dei capelli)
QUANTITATIVA: non solo si può affermare se una persona POSSIEDE o meno una
caratteristica, ma si può anche definire il GRADO con il quale una persona possiede
quel CARATTERE.
Il CARATTERE può manifestarsi in varie MODALITA’:
Le MODALITA’ di caratteri di natura QUALITATIVA sono ATTRIBUTI
Le MODALITA’ di caratteri di natura QUANTITATIVA sono MISURE
I caratteri e le UNITA’ STATISTICHE sono collegati all’interno di una TABELLA:
I caratteri si inseriscono nelle COLONNE
Le UNITA’ STATISTICHE si mettono nelle RIGHE
altezza
età
Capelli
caratteri
Caratteri..
soggetto1
soggetto2
TIPI DI CARATTERI
I caratteri possono QUALITATIVI o CATEGORICI possono essere di due tipi diversi:
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57

Anteprima parziale del testo

Scarica Statistica Psicometrica dispense e più Dispense in PDF di Statistica Psicometrica solo su Docsity!

STATISTICA PSICOMETRICA

La STATISTICA è un insieme di strumenti LOGICI e MATEMATICI-PROBABILISTICI per la MISURA e il TRATTAMENTO di grandi quantità d informazioni configurabili come FENOMENI DI MASSA. Si può utilizzare in contesti diversi in psicologia, come:

  • ANALISI di un QUESTIONARIO
  • MISURAZIONE di un FENOMENO osservato
  • Misurazione di un fenomeno LATENTE La PSICOMETRIA è la disciplina che studia le caratteristiche PSICOLOGICHE-->il suo TEMA PRINCIPALE è la COSTRUZIONE, VALIDAZIONE è TARATURA degli strumenti di misura e la MISURAZIONE dei fenomeni psicologici. La PSICOMETRIA cerca di COLLEGARE quello che si è osservato attraverso uno strumento con un costrutto LATENTE (c ome la depressione, l’autostima... )-->essa si serve della statistica per collegare cose osservabili con cose NON osservabili. ELEMENTI DELLA RICERCA Si definisce una POPOLAZIONE TARGET da cui si estrae un CAMPIONE RAPPRESENTATIVO da cui si estraggono alcuni dati per fare delle INFERENZE e delle conclusioni. Il campione rappresentativo è l’UNITA’ STATISTICA o SPERIMENTALE. L'OGGETTO di studio all’interno dell’UNITA’ STATISTICA è il CARATTERE-->può avere una natura QUALITATIVA o QUANTITATIVA:
  • QUALITATIVA: un carattere che una persona possiede oppure non possiede (esempio: il colore biondo dei capelli)
  • QUANTITATIVA: non solo si può affermare se una persona POSSIEDE o meno una caratteristica, ma si può anche definire il GRADO con il quale una persona possiede quel CARATTERE. Il CARATTERE può manifestarsi in varie MODALITA’:
  • Le MODALITA’ di caratteri di natura QUALITATIVA sono ATTRIBUTI
  • Le MODALITA’ di caratteri di natura QUANTITATIVA sono MISURE I caratteri e le UNITA’ STATISTICHE sono collegati all’interno di una TABELLA:
  • I caratteri si inseriscono nelle COLONNE
  • Le UNITA’ STATISTICHE si mettono nelle RIGHE altezza età Capelli caratteri Caratteri.. soggetto soggetto

TIPI DI CARATTERI

I caratteri possono QUALITATIVI o CATEGORICI possono essere di due tipi diversi:

  • SCONNESSI: NON hanno un legame tra di loro e servono solo a categorizzare -->si usa la SCALA NOMINALE (es: regione di nascita) o I numeri valgono solo come ETICHETTE o I caratteri sconnessi devono essere MUTUALMENTE ESCUDENTESI: ogni unità può avere SOLO una MODALITA’ di quel carattere. (ES: una persona è nata solo in un comune) o Le MODALITA’ di un carattere sconnesso devono essere COLLETTIVAMENTE ESAUSTIVE: TUTTE le unità statistiche devono appartenere a UNA MODALITA’ (se anche solo un soggetto presenta una caratteristica diversa bisogna considerarla)
  • ORDINATI: è possibile stabilire un ORDINE (es: titolo di studio, gradimento di un prodotto, valutazione del dolore) --> vale sia l’EQUIVALENZA (= o =/) sia L’ORDINAMENTO (< o >) o Le etichette NUMERICHE valgono per il loro ORDINE ma NON ha senso compiere OPERAZIONI tra loro I caratteri QUANTITATIVI o EMPIRICI descrivono una proprietà OGGETTIVA delle unità statistica-->possono essere di 2 tipi:
  • DISCRETI: è un insieme FINITO di soli numeri interi (possono assumere solo determinati valori) (e s: n di figli, n di comportamenti patologici messi in atto in un lasso di tempi )
  • CONTINUI: è un insieme INFINITO composto da numeri REALI-->possono assumere TUTTI i valori all’interno di un insieme ( es: tempi di risposta a un esperimento) I caratteri quantitativi possono utilizzare 2 tipi di scale:
  • SCALE A INTERVALLI: lo 0 è arbitrario ma c’è una UNITA’ DI MISURA per cui le categorie si trovano alla STESSA DISTANZA--> vale l’EQUIVALENZA (= o =/), L’ORDINAMENTO (< o >) e la DIFFERENZA (+o-)
  • SCALE A RAPPORTI: lo 0 è ASSOLUTO e indica assenza del fenomeno--> vale l’EQUIVALENZA (= o =/), L’ORDINAMENTO (< o >), la DIFFERENZA (+o-) e il RAPPORTO (x o /) DISTRUBUZIONI DI FREQUENZA TIPI DI FREQUENZA
  • FREQUENZA ASSOLUTA: n di unità statistiche che presentano una certa modalità
  • FREQUENZA RELATIVA (o percentuale): n di unità statistiche sul TOTALE che presentano una data modalità.
  • FREQUENZE CUMULATE: n di unità statistiche che presentano una data modalità MINORE O UGUALE alla corrente (Fi o Fi%) Le distribuzioni di frequenza possono essere di 2 tipi:
  • SERIE STATISTICHE quando il carattere è di tipo QUALITATIVO
  • SERIAZIONI STATISTICHE quando il carattere è di tipo QUANTITATIVO CLASSI

CARATTERI QUANTITATIVI CONTINUI (O DISCRETI CON MODALITA’ IN CLASSE)

  • ISTOGRAMMA: in corrispondenza di ogni classe si disegna un rettangolo con base PROPORZIONALE all’AMPIEZZA della classe e altezza proporzionale alla FREQUENZA o alla DENSITA’ (se le classi sono di diversa ampiezza) INDICI DI POSIZIONE Gli INDICI SINTETICI evidenziano le caratteristiche essenziali della DISTRIBUZIONE del carattere (es: sono migliori gli studenti maschi o femmine?)
  • Si confrontano MODALITA’ che rappresentano i LIVELLI o VALORI TIPICI
  • Consentono di SINTETIZZARE un insieme di misure tramite un unico VALRE RAPPRESENTATICO--->è un indice che riassume o descrive i dati con un unico valore aritmetico Tra gli indici più ADEGUATI per i vari caratteri:
  • Carattere QUALITATIVO SCONNESSO: MODA
  • Carattere QUALITATIVO ORDINATO: MEDIANA
  • Carattere QUANTITATIVO: MODA o MEDIANA MODA La MODA è la modalità del carattere con la FREQUENZA MAGGIORE Mo(X) =max(fi)

Può essere calcolata per TUTTI i caratteri ma da informazioni rilevanti soprattutto per i CARATTERI QUALITATIVI SCONNESSI-->è un indice DESCRITTIVO ma POCO INFORMATIVO. Per calcolare la MODA per dati in classe con AMPIEZZE DIFFERENTI bisogna considerare la DENSITA’-->MODA=classe con DENSITA’ MAGGIORE MEDIANA La MEDIANA ( PosMe ) è il valore che TAGLIA esattamente in 2 la DISTRIBUZIONE:

  • È PRECEDUTA da almeno il 50% dei casi
  • È SUPERATA da almeno il 50% dei casi
  • Insieme alla moda è l’INDICE DI TENDENZA CENTRALE per i dati qualitativi misurati su scala ORDINALE PosMe= (n+1)/ Sulla colonna delle FREQUENZE CUMULATE si cerca la prima modalità che includa la posizione della mediana o quella subito maggiore (vedi esercizi sul quaderno) MEDIANA PER DATI QUANTITATIVI CONTINUI (CLASSI)
  1. All'inizio si trova la POSIZIONE della mediana PosMe= (n+1)/
  2. Successivamente si trova la CLASSE nella quale essa si trova
  3. Si calcola la MEDIANA con la formula: Me(X) = hI- 1 +( PosMe - (Fi-1))ai/fi Dove:
  • Hi-1 è il LIMITE INFERIORE della classe mediana (la classe che CONTIENE la PosMe )
  • Fi-1 è la FREQUENZA CUMULATA della classe PRECEDENTE la classe mediana
  • ai è l’AMPIEZZA della classe che CONTIENE PosMe PERCENTILI I PERCENTILI sono le MODALITA’/VALORI che dividono la distribuzione di frequenza ORINATA in più parti (esempio: qual è il reddito familiare che divide il 25% dei poveri dall’altro 75%?) Vengono utilizzati specialmente 3 TIPI:
  • QUARTILI: 3 valori che dividono in 4 parti la distribuzione
  • DECILI: 9 valori che dividono in 10 parti la distribuzione
  • PERCENTILI: 99 valori dividono in 100 parti la distribuzione Per trovare la POSIZIONE del percentile (PosP) _PosP=(n+1/100)P_* (percentili)

MEDIA

La media è il valore più PROBABILE tra i vari punteggi-->Può essere calcolata solo per caratteri QUANTITATIVI (con scala di misura a INTERVALLI o a RAPPORTI) Si indica con M(X) o con:

  • X (con un trattino sopra) per i CAMPIONI
  • μ per la POPOLAZIONE All'interno delle DISTRIBUZIONI di FREQUENZE la MEDIA si calcola con 𝑀(𝑋) = ∑ 𝐾 𝐼= 1 𝑥𝑖⋅ 𝑓𝑖 𝑛 In caso dei dati organizzati in CLASSE:
  • Si MOLTIPLICA la FREQUENZA f di ogni classe per il valore definito dal VALORE CENTRALE della classe-->valore centrale= somma degli estremi/
  • Si SOMMANO i valori ottenuti
  • Si DIVIDE per il numero dei CASI (n) D Vedi esercizi sul quaderno La distribuzione è NORMALE quando la MEDIA, la MODA e la MEDIANA corrispondono--

quando non accade si creano alcuni EFFETTI:

  • EFFETTO PAVIMENTO: la MEDIA è il valore MAGGIORE (è più a DESTRA rispetto alla mediana)-->è molto influenzata dai valori estremi in quando basta anche solo un VALORE più alto dei valori classici per cambiarla completamente
  • EFFETTO SOFFITTO: la MEDIA è il valore MINORE (è più a SINISTRA rispetto alla MEDIANA)

INDICI DI VARIABILITA’

Gli indici di posizioni sono utili per alcune informazioni sui caratteri ma son INSUFFICIENTI--

per avere delle informazioni complete bisogna considerare anche gli INDICATORI della DIVERSITA’ dei valori di un carattere.

L'INDICE DI VARIABILITA’ indica QUANTO si scosta una modalita’ di un certo carattere rispetto alla media. Tra i vari indici di variabilità per i caratteri QUANTITATIVI si possono trovare:

  • Il CAMPO DI VARIAZIONE
  • La DIFFERENZA INTERQUARTILE
  • LA VARIANZA
  • LO SCARTO QUADRATICO MEDIO (DEVIAZIONE STANDARD)
  • COEFFICIENTE DI VARIAZIONE CAMPO DI VARIAZIONE Il CAMPO di VARIAZIONE è la differenza tra il valore MASSIMO e il VALORE MINIMO-->NON da informazione su COME si comportano i valori o COME sono DISTRIBUITI. Variazione: VALmax-VALmin ESEMPIO: 11 ragazzi di 8 anni hanno ottenuto i seguenti punteggi: 23 45 34 57 48 38 28 54
  • Xmin: 23
  • Xmax: 57
  • Variazione: 57-23= 34 DIFFERENZA INTERQUARTILE La DIFFERENZA INTERQUARTILE è la differenza tra il TERZO e il PRIMO quartile DI=Q3-Q NON da informazione su COME sono distribuite le MODALITA’ agli ESTREMI della distribuzione-->è analogo al campo di variazione ma tiene conto solo dei valori che cafono tra il 1o e il 3o quartile (del 50% delle distribuzioni) Per calcolare la DIFFERENZA INTERQUARTILE:
  • Si calcola la POSIZIONE dei quartili Q1 e Q
  • Si trovano i QUARTILI legati a quella determinata posizione attraverso la FREQUENZE CUMULATA
  • Si fa la DIFFERENZA tra i due QUARTILI-->il 50% della distribuzione dei punteggi si trova tra essi. VARIANZA (INDICE DI DISPERSIONE) La VARIANZA misura QUANTO ogni singolo punteggio è DISTANTE dalla media.

La varianza possiede un'unità di misura DIVERSA da quella dei dati-->i dati sono elevati al quadrato. Per ritornare ad un'unità di misura uguale a quella della media si usa la DEVIAZIONE STANDARD: indica di quanto in media i dati si discostano dalla loro media: È possibile scrivere 𝑋 ± 𝑠 nel riportare le STATISTICHE descrittive di un gruppo di soggetti → Esempio: Si può dire che i 10 adolescenti al test di personalità ottengono una media di 6.4 ± 2. COEFFICIENTE DI VARIAZIONE Il COEFFICIENTE DI VARIAZIONE sintetizza il rapporto tra MEDIA e DEVIAZIONE STANDARD: è il rapporto tra DEVIAZIONE STANDARD e media:

  • Determina la DISPERSIONE dei dati osservati mediante l’uso della MEDIA come unità di misura
  • È un indicatore di variabilità RELATIVA-->permette di mettere a confronto la variabilità di due distribuzioni differenti
  • NON ha senso se preso da solo-->viene utilizzato per CONFRONTARE due diverse distribuzioni

La DEVIAZIONE STANDARD e il COEFFICIENTE di VARIAZIONE hanno alcune differenze: STANDARDIZZAZIONE Un punteggio all’interno di una distribuzione è PRIVO di SIGNIFICATO se preso da solo--

sapere se un soggetto ha ottenuto un punteggio di 52 sulla scala di AGGRESSIVITA’ dice abbastanza POCO sulle caratteristiche dell’oggetto.

Un soggetto ha ottenuto il punteggio di 30 sia in un test che misura l’ansia sia in uno che misura l’introversione; com’è possibile sapere se in certe situazioni il soggetto si dimostra più introverso o più ansioso? Lo stesso soggetto ha un uguale punteggio (30) anche alla scala di introversione; affermare che le due caratteristiche sono presenti in UGUAL misura è un ERRORE, poiché si deve tener conto del fatto che le due scale possono essere DIVERSE. Per poter confrontare le due misure occorre standardizzarle. RANGO PERCENTILE Il RANGO consiste nella POSIZIONE del soggetto. Il RANGO PERCENTILE RP(x) di un punteggio x è la PERCENTUALE di dati che assumono un valore UGUALE o MINORE di X. Se RP(x)=28, il soggetto i occupa la 28esima posizione percentuale della sequenza ordinata dei dati-->è PRECEDUTO dal 28% dei soggetti. 𝑅𝑃 = 𝑃𝑂𝑆 ⋅ 100 𝑛 + 1 POS= posizione occupata dal punteggio x nella sequenza ordinata crescente dei dati

VARIABILE STATISTICA DOPPIA

Dati 2 caratteri X e Y e la loro distribuzione di frequenza CONGIUNTR fij (numero di unità statistiche che presentano la coppia di modalità xi e xj), l’insieme (X,Y)delle terne xi , yj , fij (i = 1, 2... , h; j = 1, 2,... , k) è detto VARIABILE/MUTABILE STATISTICA DOPPIA

ATTENZIONE: non sempre ha senso calcolare entrambe->Bisogna cercare di capire quale variabile DIPENDE dall’altra (esempio: ha più senso analizzare la percentuale di sviluppare una malattia nei termini di quanta attività fisica compie la persona che analizzare la percentuale di attività fisica nei termini se la persona è malata o meno) STUDIO DELLE DIPENDENZE La DIPENDENZA o studio della RELAZIONE tra caratteri si possono analizzare tramite:

  • CONNESSIONE (principalmente per caratteri qualitativi)
  • MODELLI DI REGRESSIONI (per caratteri QUANTITATIVI) per descrivere analiticamente un carattere in funzione dell’altro.
  • CORRELAZIONI NON PARAMETRICHE per caratteri MISTI. CONNESSIONE La connessione equivale alla NON INDIPENDENZA: tra le variabili X e Y è presente una forma di LEGAME e RELAZIONE (CONNESSIONE)-->La variazione di una variabile implica un cambiamento NON CASUALE nell’altra variabile. Gli INDICI DI CONNESSIONE possono essere definiti come MISURA della distanza dalla INDIPENDENZA--> vanno a descrivere la DISTANZA dei dati osservati dalla situazione teorica di INDIPENDENZA

È necessario compiere un CONFRONTO tra

  • FREQUENZE TEORICHE: sono frequenze NON realmente osservate ma che descrivono la situazione di INDIPENDENZA
  • FREQUENZE OSSERVATE È possibile CALCOLARE le FREQUENZE TEORICHE attraverso la FORMULA: INDICI DI DIPENDENZA: FREQUENZE OSSERVATE-FREQUENZE TEORICHE 1)INDIPENDENZA STOTASTICA: MASSIMA INDIPENDENZA tra le variabili--> il verificarsi dell'uno NON modifica la probabilità del verificarsi dell'altro.

Il valore di 𝑥^2 (“CHI QUADRO”) NON può essere NEGATIVO. In caso di INDIPENDENZA STOTASTICA 𝑥^2 =0 in quanto la frequenza REALE è uguale alla frequenza TEORICA Sono presenti 2 CASI LIMITE:

  • MINIMA CONNESSIONE: Le variabili x e y sono completamente INDIPENDENTI tra di loro
  • MASSIMA CONNESSIONE: Le variabili x e y sono completamente DIPENDENTI tra di loro o h-1= numero di RIGHE- 1 o k-1= numero di COLONNE – 1 o Min : valore MINIMO che osservo facendo (il numero di righe – 1) e (il numero di colonne-1)--> min sarà il NUMERO MINORE tra i due 3)INDICE NORMALIZZATO (𝑥^2 𝑛): definisce l’INTENSITA’ della relazione tra le due variabili (è il rapporto tra il CHI QUADRO OSSERVATO e il CHI QUADRO MASSIMO)
  • Se l’INDICE NORMALIZZATO è MINORE di 30 l’INTENSITA’ della relazione è DEBOLE.
  • Se l’indice è tra un valore di 30 e 50 è considerata MEDIA
  • Se l’indice è SOPRA 50 è CONSIDERATA FORTE

Vedi esercizi sul quaderno IN SINTESI: PER CALCOLARE LA CONNESSIONE TRA DUE VARIABILI BISOGNA SEGUIRE ALCUNI PASSAGGI:

  • Calcolare le TABELLE di FREQUENZA CONGIUNTE e calcolare la % di RIGA o COLONNA più adeguata
  • Calcolare le FREQUENZE TEORICHE
  • Calcolare le FREQUENZE CONGIUNTE (frequenze REALI- frequenze TEORICHE)
  • Calcolare 𝑥^2 e 𝑥^2 max
  • Calcolare 𝑥^2 𝑁 -->𝑥^2 𝑁 = 𝑥^2 𝑥^2 𝑚𝑎𝑥