Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


APERTE TEORIE E TECNICHE DEI TEST B PROF BONFIGLIO SVOLTO DA SIMONE., Panieri di Psicometria

APERTE TEORIE E TECNICHE DEI TEST B PROF BONFIGLIO SVOLTO DA SIMONE.

Tipologia: Panieri

2025/2026

In vendita dal 09/05/2026

Simonex1
Simonex1 🇮🇹

4.8

(536)

224 documenti

1 / 33

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
APERTE TEORIE E TECNICHE DEI TEST B PROF BONFIGLIO SVOLTO DA SIMONE
LEZIONE 5
1. Spiega in che modo il dominio di contenuto influenza la costruzione di uno strumento osservativo.
QUANDO VOGLIAMO COSTRUIRE UN TEST, UNO DEI PRIMI PASSAGGI FONDAMENTALI È DEFINIRE
CON PRECISIONE COSA VOGLIAMO OSSERVARE E QUINDI IL DOMINIO DI CONTENUTO.
SI TRATTA DI UNA PORZIONE RAPPRESENTATIVA DEI COMPORTAMENTI CHE PERMETTE DI
VALUTARE E DESCRIVERE IL COSTRUTTO IN MODO VALIDO.
BISOGNA QUINDI RACCOGLIERE LE INFORMAZIONI DA FONTI DIVERSE (ES: LETTERATURA
SCIENTIFICA, INTERVISTE A ESPERTI DEL SETTORE ECC..)
QUANDO SI COSTRUISCE UN TEST, INFATTI, BISOGNA PRENDERE IN CONSIDERAZIONE, ITEM
(DOMANDE) CHE RAPPRESENTINO IL COSTRUTTO DA NOI SCELTO.
2. In che senso l’effetto osservatore può rappresentare un bias nella raccolta dei dati comportamentali?
QUANDO SI OSSERVA, SI POSSONO COMPIERE VARI ERRORI. IN PSICOLOGIA, INFATTI, MISURIAMO
COSTRUTTI NON DIRETTAMENTE OSSERVABILI E CHE SI MANIFESTANO IN MODI DIVERSI.
LA SOLA OSSERVAZIONE POTREBBER INDURRE IN ERRORE E QUINDI SERVE STABILIRE UN CRITERIO
PRECISO, CONDIVISO CHE PERMETTA DI DISTINGUERE TRA COMPORTAMENTI SIMILI TRA LORO MA
CON SIGNIFICATO MOLTO DIVERSO.
QUANDO NON SI HANNO ABBASTANZA INFORMAZIONI, SI POTREBBE NON CONSIDERARE O
CONSIDERARE IN MODO ERRATO IL CONTESTO E QUINDI NON VALUTARE LA SITUAZIONE NEI
MIGLIORI DEI MODI.
LEZIONE 6
3. Descrivi il concetto di prototipo e la sua funzione nella definizione degli indicatori osservabili.
PER VALUTARE I COMPORTAMENTI OSSERVABILI, SPESSO SI RICORRE A UN PROTOTIPO.
DESCRIVE QUINDI LE CARATTERISTICHE PER ESEMPIO DI UN DETERMINATO TIPO DI PERSONE.
ES IL PROTOTIPO DELLA PERSONA ESTROVERSA. SI USANO QUINDI DEGLI AGGETTIVI PER
RAPPRESENTARE GLI INDIVIDUI ESTROVERSI.
ES PERSONA ALLEGRA, COMUNICATIVA ECC..
I PROTOTIPI
individuare gli indicatori più pertinenti
evitare item irrilevanti o marginali
aiutano a creare scale che rispecchiano fedelmente la teoria di riferimento
permettono di rappresentare le diverse sfaccettature del costrutto senza dispersioni
evitano l’errore comune della sovrabbondanza di item.
un indicatore altamente rappresentativo del costrutto
un riferimento teorico essenziale per selezionare gli item
uno strumento che garantisce coerenza, equilibrio e validità di contenuto nella costruzione di un test psicologico.
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21

Anteprima parziale del testo

Scarica APERTE TEORIE E TECNICHE DEI TEST B PROF BONFIGLIO SVOLTO DA SIMONE. e più Panieri in PDF di Psicometria solo su Docsity!

APERTE TEORIE E TECNICHE DEI TEST B PROF BONFIGLIO SVOLTO DA SIMONE

LEZIONE 5

1. Spiega in che modo il dominio di contenuto influenza la costruzione di uno strumento osservativo. QUANDO VOGLIAMO COSTRUIRE UN TEST, UNO DEI PRIMI PASSAGGI FONDAMENTALI È DEFINIRE CON PRECISIONE COSA VOGLIAMO OSSERVARE E QUINDI IL DOMINIO DI CONTENUTO. SI TRATTA DI UNA PORZIONE RAPPRESENTATIVA DEI COMPORTAMENTI CHE PERMETTE DI VALUTARE E DESCRIVERE IL COSTRUTTO IN MODO VALIDO. BISOGNA QUINDI RACCOGLIERE LE INFORMAZIONI DA FONTI DIVERSE (ES: LETTERATURA SCIENTIFICA, INTERVISTE A ESPERTI DEL SETTORE ECC..) QUANDO SI COSTRUISCE UN TEST, INFATTI, BISOGNA PRENDERE IN CONSIDERAZIONE, ITEM (DOMANDE) CHE RAPPRESENTINO IL COSTRUTTO DA NOI SCELTO. 2. In che senso l’effetto osservatore può rappresentare un bias nella raccolta dei dati comportamentali? QUANDO SI OSSERVA, SI POSSONO COMPIERE VARI ERRORI. IN PSICOLOGIA, INFATTI, MISURIAMO COSTRUTTI NON DIRETTAMENTE OSSERVABILI E CHE SI MANIFESTANO IN MODI DIVERSI. LA SOLA OSSERVAZIONE POTREBBER INDURRE IN ERRORE E QUINDI SERVE STABILIRE UN CRITERIO PRECISO, CONDIVISO CHE PERMETTA DI DISTINGUERE TRA COMPORTAMENTI SIMILI TRA LORO MA CON SIGNIFICATO MOLTO DIVERSO. QUANDO NON SI HANNO ABBASTANZA INFORMAZIONI, SI POTREBBE NON CONSIDERARE O CONSIDERARE IN MODO ERRATO IL CONTESTO E QUINDI NON VALUTARE LA SITUAZIONE NEI MIGLIORI DEI MODI. **LEZIONE 6

  1. Descrivi il concetto di prototipo e la sua funzione nella definizione degli indicatori osservabili.** PER VALUTARE I COMPORTAMENTI OSSERVABILI, SPESSO SI RICORRE A UN PROTOTIPO. DESCRIVE QUINDI LE CARATTERISTICHE PER ESEMPIO DI UN DETERMINATO TIPO DI PERSONE. ES  IL PROTOTIPO DELLA PERSONA ESTROVERSA. SI USANO QUINDI DEGLI AGGETTIVI PER RAPPRESENTARE GLI INDIVIDUI ESTROVERSI. ES  PERSONA ALLEGRA, COMUNICATIVA ECC.. I PROTOTIPI individuare gli indicatori più pertinenti evitare item irrilevanti o marginali aiutano a creare scale che rispecchiano fedelmente la teoria di riferimento permettono di rappresentare le diverse sfaccettature del costrutto senza dispersioni evitano l’errore comune della sovrabbondanza di item. un indicatore altamente rappresentativo del costrutto un riferimento teorico essenziale per selezionare gli item uno strumento che garantisce coerenza, equilibrio e validità di contenuto nella costruzione di un test psicologico.

4. Ricostruisci brevemente le tappe principali della storia dei test psicologici. (DA FINIRE) IN CINA NEL 2200 AVANTI CRISTO SI INIZIARONO A USARE TEST PER SELEZIONARE IL PERSONALE. INIZIALMENTE I TEST ERANO ORALI SOTTO LA DINASTIA HAN 202 A.C. – 200 D.C. I TEST DIVENNERO ANCHE SCRITTI. 1370 D.C.  MASSIMO APICE DEL SISTEMA DI VALUTAZIONE CINESE. TRA IL 1700 E IL 1800  IL MONDO OCCIDENTALE INIZIA A USARE FORME PRIMITIVE DEI TEST BESSEL  1823  VALUTÓ DIFFERENZE NELLE OSSERVAZIONI TRA LUI E I SUOI COLLEGHI ASTRONOMI DI 1.0 FINO A 1.2 SECONDI. CARL FRIEDRICH GAUSS  1809  PRESENTA UNA TEORIA DEGLI ERRORI DI MISURA BASATA SU UNA DISTRIBUZIONE STATISTICA OGGI NOTA COME DISTRIBUZIONE NORMALE O GAUSSIANA FRANCIS GALTON (1822-1911)  GETTA LE BASI PER IL MODERNO CONCETTO STATISTICO DI CORRELAZIONE. STUDIA STATISTICAMENTE LE DIFFERENZE INDIVIDUALI. USA QUESTIONARI E SCALE PER RACCOGLIERE DATI PSICOLOGICI NELLE SUE RICERCHE ANTROPOLOGICHE. ADOLPHE QUÉTELET (1796-1874)  APPLICA LA PROBABILITÀ E LA STATISTICA UTILIZZATE PER LO STUDIO DELLA DISTRIBUZIONE DEGLI ERRORI IN ASTRONOMIA ALLE CARATTERISTICHE FISICHE E PSICOLOGICHE DELLE PERSONE JOSEPH JASTROW (1863-1944) E JAMES MCKEEN CATTELL (1860-1944)  HANNO INFLUENZATO E SONO STATI INFLUENZATI DA GALTON IN EUROPA  PARTICOLARE ATTENZIONE PER IL CONCETTO DI RITARDO MENTALE. ALFRED BINET E THÉODORE SIMON PRIMO TEST D’INTELLIGENZA VOLTO A INDIVIDUARE I BAMBINI CON RITARDO SUCCESSIVAMENTE  QUESTA SCALA VIENE RIVISTA A STANFORD I TEST PSICOLOGICI E QUELLI D’INTELLIGENZA  HANNO AVUTO UNA GRANDE EVOLUZIONE TRA LE DUE GUERRE, IN QUANTO, DIVENNERO FONDAMENTALI PER INDIVIDUARE LE CARATTERISTICHE DEI SOLDATI.

6. Qual è la relazione tra scopo del test e tipo di prestazione richiesta? SCOPO DEL TEST  IL PUNTO DI PARTENZA PER LA COSTRUZIONE DI UNO STRUMENTO PSICOLOGICO. DETERMIAN COME IL COSTRUTTO VERRÁ OPERAZIONALIZZATO E QUINDI QUALE PRESTAZIONE IL SOGGETTO DOVRÁ METTERE IN ATTO. SCOPO DEL TEST E PRESTAZIONE RICHIESTA  INTERDIPENDENTI. SE CAMBI UNO, CAMBI ANCHE L’ALTRO. **LEZIONE 8

  1. Quali sono i vantaggi e i limiti dell’integrazione dei risultati di test self-report con altre fonti di dati?** VANTAGGI DELL’INTEGRAZIONE
    1. MIGLIORA LA FORMULAZIONE DEL CASO CLINICO  POSSIAMO COGLIERE ASPETTI DIFFERENTI DEL FUNZIONAMENTO PSICOLOGICO DEL PAZIENTE. LE DISCREPANZE TRA I TEST CONSENTONO DI “AFFINARE LE FORMULAZIONI DI CASI E DI ADATTARE IL TRATTAMENTO TERAPEUTICO ALLE ESIGENZE DEL CLIENTE”.
    2. PERMETTE INFERENZE PIÙ ACCURATE SUL FUNZIONAMENTO NELLA VITA REALE  SECONDO IL MODELLO DI FINN, INTEGRARE I RISULTATI AIUTA A COMPRENDERE COME IL PAZIENTE FUNZIONI IN CONTESTI STRUTTURATI (DOVE I SELF-REPORT SONO PIÙ PREDITTIVI) E NON STRUTTURATI (DOVE EMERGONO MEGLIO I TEST DI PERFORMANCE). CIÒ “PERMETTE UNA COMPRENSIONE PIÙ ACCURATA DELLE LORO DIFFICOLTÀ IN DIVERSI CONTESTI”.
    3. FAVORISCE UN FEEDBACK PIÙ EMPATICO ED EFFICACE  CONSENTE DI PARTIRE DAI RISULTATI PIÙ VICINI ALLA CONSAPEVOLEZZA DEL CLIENTE (SELF-REPORT) PER POI INTRODURRE QUELLI MENO ACCESSIBILI (TEST PROIETTIVI). QUESTO APPROCCIO “RIDUCE LE RESISTENZE E PROMUOVE IL CAMBIAMENTO ATTRAVERSO IL FEEDBACK”.
    4. CONSIDERA L’ATTEGGIAMENTO DEL CLIENTE VERSO IL TEST  IL MODELLO DI FINN PERMETTE DI INTERPRETARE LE DISCREPANZE ANCHE ALLA LUCE DELLO STILE DI RISPOSTA E DEL LIVELLO DI APERTURA DEL PAZIENTE. CIÒ È UTILE “SOPRATTUTTO NEL MOMENTO IN CUI DEVONO SPIEGARE LE DISCREPANZE TRA I RISULTATI”. LIMITI DELL’INTEGRAZIONE
    5. POSSIBILI DISCREPANZE DOVUTE A VARIABILI ESTERNE  COME ATTEGGIAMENTO DEL RISPONDENTE, UMORE, GRADO DI CONSAPEVOLEZZA DEI PROPRI TRATTI, LIVELLO DI APERTURA NELLA COMPILAZIONE.
    6. DIFFERENZE STRUTTURALI TRA I METODI  BORNSTEIN PARLA DI “HETEROMETHOD CONVERGENCE PROBLEM”: STRUMENTI DIVERSI MISURANO LO STESSO COSTRUTTO CON LOGICHE DIFFERENTI, RENDENDO DIFFICILE OTTENERE CORRELAZIONI ELEVATE.
    7. NECESSITÀ DI COMPETENZE CLINICHE ELEVATE  IL MODELLO DI FINN RICHIEDE AL CLINICO CAPACITÀ DI VALUTARE L’ATTEGGIAMENTO DEL PAZIENTE, CONOSCENZA APPROFONDITA DEI DUE STRUMENTI, ABILITÀ NEL COLLEGARE RISULTATI APPARENTEMENTE INCOERENTI. CONCLUSIONE L’INTEGRAZIONE TRA TEST SELF-REPORT E TEST DI TIPICA PERFORMANCE OFFRE UN QUADRO PIÙ RICCO E SFACCETTATO DEL FUNZIONAMENTO PSICOLOGICO DEL PAZIENTE, MIGLIORANDO LA FORMULAZIONE DEL CASO, LA COMPRENSIONE DEL COMPORTAMENTO NEI DIVERSI CONTESTI E LA QUALITÀ DEL FEEDBACK CLINICO. RICHIEDE COMPETENZE ELEVATE, ATTENZIONE ALLE VARIABILI CHE INFLUENZANO LO STILE DI RISPOSTA E CONSAPEVOLEZZA DELLE DIFFERENZE METODOLOGICHE TRA GLI STRUMENTI.

8. Cosa rappresenta un diagramma a barre e quando è più opportuno utilizzarlo rispetto ad altri grafici? DIAGRAMMA A BARRE  RAPPRESENTA I VALORI ASSOCIATI A CATEGORIE DISCRETE E PERMETTE CONFRONTI IMMEDIATI. SI PREFERISCE AD ALTRI GRAFICI  QUANDO I DATI NON SONO CONTINUI. OBIETTIVO  CONFRONTO. SENZA UNA DIMENSIONE TEMPORALE OGNI CATEGORIA  ASSOCIATA A UNA BARRA. LUNGHEZZA O ALTEZZA DELLA BARRA  È PROPORZIONALE AL VALORE CHE RAPPRESENTA LE BARRE POSSONO ESSERE DISPOSTE VERTICALMENTE O ORIZZONTALMENTE. QUANDO È INDICATO QUESTO TIPO DI GRAFICO : 1. Devi confrontare categorie distinte 2. Vuoi evidenziare differenze tra gruppi. 3. I dati non rappresentano un andamento nel tempo. 4. Serve una rappresentazione semplice e immediata 5. Le categorie sono poche e ben definite **LEZIONE 9

  1. Quali caratteristiche deve avere un item per garantire chiarezza, centralità rispetto al costrutto e adeguatezza linguistica** QUALITÁ DI UN ITEM  DIPENDE DALLA SUA CAPACITÁ DI TRADURRE IN MODO FEDELE E COMPRENSIBILE E PERTINENTE IL COSTRUTTO TEORICO CHE SI INTENDE MISURARE.

1. CHIAREZZA  ITEM CHIARO:

DEVE ESSERE FACILMENTE COMPRENSIBILE AL LETTORE

EVITARE AMBIGUITÀ, FORMULAZIONI VAGHE O INTERPRETABILI IN MODI DIVERSI

UTILIZZARE UN LINGUAGGIO SEMPLICE, DIRETTO E PRIVO DI TECNICISMI NON NECESSARI

ESSERE COMPOSTO DA TERMINI NOTI ALLA POPOLAZIONE TARGET

ESSERE ACCOMPAGNATO DA ISTRUZIONI LIMPIDE E INEQUIVOCABILI, SOPRATTUTTO NEI TEST

AUTOSOMMINISTRATI, DOVE IL PARTECIPANTE NON PUÒ CHIEDERE CHIARIMENTI.

UN ITEM AMBIGUO PUÒ GENERARE RISPOSTE CASUALI O DISTORTE, COMPROMETTENDO LA

VALIDITÀ DELLA MISURAZIONE.

2. CENTRALITÁ RISPETTO AL COSTRUTTO : COERENZA TRA L’ITEM E CIÓ CHE IL TEST

INTENDE MISURARE. UN ITEM CENTRATO SUL COSTRUTTO DEVE:

LEZIONE 11

11. In che modo gli effetti distorcenti, come l’effetto alone e l’effetto contrasto, possono compromettere l’attendibilità di una valutazione? EFFETTO ALONE  QUANDO UN SINGOLO ELEMENTO SALIENTE INFLUENZA LA VALUTAZIONE COMPLESSIVA DI UN TRATTO O COMPORTAMENTO. CAUSA  UNA GENERALIZZAZIONE INDEBITA E PERDITA DI SPECIFICITÁ. GENERA QUINDI UNA VARIANZA SISTEMAITCA NON DESIDERATA. DANNI ALL’ATTENDIBILITÁ: riduzione della coerenza interna: item diversi vengono influenzati dallo stesso “alone”, producendo risposte artificialmente simili perdita di specificità: il test non discrimina più tra aspetti diversi del costrutto minore stabilità nel tempo: la valutazione cambia se cambia l’impressione generale, non il tratto reale. EFFETTO CONTRASTO  VALUTAZIONI INFLUENZATE DAL CONFRONTO CON STIMOLI CIRCOSTANTI. QUANDO LA VALUTAZIONE DI UN COMPORTAMENTO VIENE INFLUENZATA DAL CONFRONTO CON ALTRI COMPORTAMENTI E ITEM PRESENTI NEL CONTRASTO. DANNI ALL’ATTENDIBILITÁ: INSTABILITÀ DELLE RISPOSTE: LO STESSO ITEM PUÒ ESSERE VALUTATO DIVERSAMENTE A SECONDA DEGLI ITEM VICINI DISTORSIONE DELLA SCALA: IL SOGGETTO RISPONDE IN BASE AL CONFRONTO, NON ALLA PROPRIA ESPERIENZA RIDUZIONE DELLA COMPARABILITÀ TRA INDIVIDUI: PERSONE CON COMPORTAMENTI SIMILI POSSONO DARE RISPOSTE DIVERSE PERCHÉ CONFRONTANO L’ITEM CON CONTESTI PERSONALI DIFFERENTI. **12. Quali sono i limiti principali delle rilevazioni INVALSI per la valutazione del miglioramento delle scuole secondo Bruno Losito?

  1. IMPOSSIBILITÀ DI EFFETTUARE CONFRONTI DIACRONICI CERTI**  NON CONSENTONO QUINDI CONFRONTI AFFIDABILI NEL TEMPO. INOLTRE, GLI ITEM NON POSSONO ESSERE RIUTILIZZATI NELLE EDIZIONI SUCCESSIVE. 2. COPERTURA LIMITATA DEGLI AMBITI VALUTATI  VALUTANO INFATTI SOLO LE ABILITÁ DI LETTURA E QUELLE MATEMATICHE, NON VALUTANDO QUINDI L’EFFICACIA COMPLESSIVA DEL SISTEMA SCOLASTICO. 3.PREVALENZA DI DOMANDE A RISPOSTA CHIUSA  DIFFICOLTÁ NEL VALUTARE LE COMPETENZE COMPLESSE. 4.POCHI ITEM PER VALUTARE CONTENUTI E PROCESSI DIVERSI  NON È POSSIBILE COSTRUIRE SCALE DIFFERENZIATE (AD ESEMPIO, DISTINGUERE TRA COMPRENSIONE DEL TESTO E

GRAMMATICA), E SI OTTIENE UN UNICO PUNTEGGIO COMPLESSIVO CHE APPIATTISCE LA

COMPLESSITÀ DELLE ABILITÀ VALUTATE.

5. TEMPI TROPPO RAPIDI DI RESTITUZIONE E CORREZIONE  QUESTO PORTA A EVITARE LE

DOMANDE APERTE E QUINDI LIMITA IL TEST.

6. DIFFICOLTÁ DA PARTE DELLE STESSE SCUOLE NELL’USARE I RISULTATI  MOLTE SCUOLE

NON POSSIEDONO UNA CULTURA VALUTATIVA CONSOLIDATA; NON HANNO FIGURE INTERNE

FORMATE PER INTERPRETARE I DATI; NON DISPONGONO DI SUPPORTO ESTERNO ADEGUATO

LEZIONE 12

13. Quali sono le funzioni principali delle scale di validità nei test di personalità e come si collegano al concetto di desiderabilità sociale? SCALE DI VALIDITÁ NEI TEST DI PERSONALITÁ  INDIVIDUANO E CONTROLLANO GLI STILI DI RISPOSTA DISTORTI. SI TRATTA DI PATTERN SISTEMATICI CHE NON RIFLETTONO IL COSTRUTTO PSICOLOGICO OGGETTO DI MISURAZIONE, MA MODALITÁ CON CUI IL SOGGETTO AFFRONTA IL COMPITO DI RISPONDERE. 1. LA DESIDERABILITÁ SOCIALE  LE SCALE DI VALIDITÁ NASCONO PER RILEVARE QUESTA DISTORSIONE E SI TRATTA DELLA TENDENZA A RISPONDERE IN MODO MORALMENTE O SOCIALMENTE ACCETTABILE E NON CON LA PROPRIA OPINIONE. 2. RILEVARE LE VARIE FORME DI DISTORSIONE COME L’AUTOINGANNO E LA GESTIONE DELL’IMPRESSIONE  FACENTI PARTE DELLA DESIDERABILITÁ SOCIALE. LE DISTORSIONI POI POSSONO ESSERE CONSAPEVOLI, MA ANCHE INCONSAPEVOLI. 3. PROTEGGERE L’INTERPRETAZIONE DEI PUNTEGGI  QUINDI COMPRENDERE SE I PUNTEGGI SONO ATTENDIBILI O SE SONO IL RISULTATO DI STILI DI RISPOSTA DISTORTI. 4. IDENTIFICARE RISPOSTE FALSATE IN SENSO POSITIVO O NEGATIVO: PUNTEGGI ALTI NELLE SCALE DI VALIDITÀ INDICANO TENDENZA A NEGARE DIFETTI, PRESENTARSI COME “SANTARELLINI” O “SUPEREROI” PUNTEGGI BASSI INDICANO FALSIFICAZIONE IN SENSO NEGATIVO, TIPICA DI SOGGETTI AUTOCRITICI, OPPOSITIVI O CON COMPORTAMENTI ANTISOCIALI.

5. MIGLIORARE LA QUALITÁ PSICOMETRICA DEI TEST  AUMENTANDO L’ACCURATEZZA,

RIDUCENDO L’IMPATTO DEGLI STILI DI RISPOSTA, GARANTIRE CHE IL TEST MISURI

EFFETTIVAMENTE IL COSTRUTTO.

15. Perché la debole relazione tra le teorie dell’intelligenza e i test di intelligenza rappresenta un problema rilevante per la psicometria applicata? QUESTA DISTANZA COMPROMETTE LA VALIDITÁ TEORICA DEGLI STRUMENTI, LA CORRETTEZZA DELLE INTERPRETAZIONI CLINICHE E DIAGNOSTICHE.

  1. RISCHIO DI DEFINIZIONI CIRCOLARI E POVERTÀ TEORICA DEL COSTRUTTO  IL RISCHIO È CHE I TEST DEFINISCANO IL COSTRUTTO PIÚ CHE MISURARLO.
  2. I TEST MISURANO CIÓ CHE È FACILMENTE MISURABILE MA NON CIÓ CHE LA TEORIA CONSIDERA CENTRALE  QUESTI TEST NASCONO PER ESIGENZE PRATICHE E NON PER CONSOLIDARE LA TEORIA.
  3. L’UTILIZZO DEL QI È DI PRASSI, MA: PUÒ MASCHERARE PUNTI DI FORZA E DEBOLEZZA RILEVANTI NON È ATTENDIBILE QUANDO LA DISPERSIONE TRA SUBTEST È ELEVATA. UN SINGOLO INDICE RISCHIA DI GUIDAR DECISIONI CLINICHE, SCOLASTICHE E FORENSI, SENZA ESSERE UN INDICE COMPLETO PER DESCRIVERE IL PROFILO COGNITIVO.
  4. LE STRUTTURE FATTORIALI DEI TEST NON COINCIDONO CON QUELLE TEORICHE  IN ALCUNE POPOLAZIONI COME QUELLE DEI DSA O ADHD, EMERGONO PROFILI COGNITIVI SPECIFICI INCOMPATIBILI CON UNA VISIONE UNITARIA DELL’INTELLIGENZA. 5.CONSEGUENZE CLINICHE E DIAGNOSTICHE  RISCHIA DI PRODURRE DIAGNOSI IMPRECISE E INCOMPLETE, PUÒ PORTARE A INTERPRETAZIONI ERRATE DEL PROFILO COGNITIVO; LIMITA LA CAPACITÀ DEI TEST DI GUIDARE INTERVENTI EDUCATIVI O RIABILITATIVI. **LEZIONE 16
  5. Quali accorgimenti metodologici è necessario adottare nella costruzione di una web survey secondo le linee guida di qualità?** ACCORGIMENTI:
  6. DEFINIRE LO SCOPO E PROGETTARE  IDENTIFICARE IL COSTRUTTO DA MISURARE, SELEZIONARE ITEM COERENTI, VERIFICARE LA LORO ADEGUATEZZA.
  7. CAMPIONAMENTO E RECLUTAMENTO  EVITARE QUINDI BIAS DI CAMPIONAMENTO, USANDO DELLE SPECIFICHE STRATEGIE COME: USO DI SISTEMI DI RECLUTAMENTO ONLINE, USARE SOMMINISTRAZIONI MISTE CARATACEO E ANCHE ONLINE. 3.STRUTTURARE IL QUESTIONARIO E QUALITÁ DELL’INTERFACCIA  LA STRUTTURA DEL TEST È CRUCIALE PER EVITARE ERRORI COGNITIVI E MIGLIORARE LA QUALITÀ DELLE RISPOSTE. ISTRUZIONI CHIARE, RACCOGLIERE IL CONSENSO INFORMATO, USARE UN LAYOUT LEGGIBILE, USARE UN TONO ADEGUATO. PROGETTARE TUTTI GLI ASPETTI TECNICI DEL SURVEY ONLINE. ADATTARE IL SUVEY AI VARI DISPOSITIVI COME TABLET SMARTPHONE E PC. CONTROLLARE LA QUALITÁ DELLE RISPOSTE PER ESEMPIO USANDO ITEM FILTRO. TRASFORMARE UN QUESTIONARIO CARTACEO IN UNO ONLINE È SBAGLIATO, IN QUANTO RICHIEDONO PROCEDURE DI CREAZIONE E D’UTILIZZO DIVERSO.

LEZIONE 17

17. In che modo la destinazione d’uso del test influenza la valutazione della validità di contenuto degli item? Porta un esempio concreto. VALIDITÁ DI CONTENUTO  DIPENDE DA CHE UTILIZZO SI FA DEL TEST. SI TRATTA QUINDI DI UN INDICE CONDIZIONALE. SE USO UN ITEM CHE VUOLE VALUTARE L’ANSIA DA SEPARAZIONE, ESSO, SARÁ VALIDO IN UN TEST PER VALUTARE L’ANSIA DA SEPARAZIONE, MA NON IN UN TEST CHE VALUTI L’ANSIA IN GENERALE. 18. Spiega la differenza tra validità di contenuto e validità di facciata, indicando i criteri che rendono un item rappresentativo del costrutto. VALIDITÁ DI CONTENUTO  GRADO IN CUI GLI ITEM DI UN TEST SONO PERTINENTI E RAPPRESENTATIVI DEL COSTRUTTO CHE VUOLE MISURARE. SI FONDA SU: DEFINIZIONE CHIARA DEL COSTRUTTO ANALISI DELLA RILEVANZA DEGLI ITEM VERIFICA DELLA RAPPRESENTATIVITÀ DEL DOMINIO ADEGUATEZZA RISPETTO ALLA POPOLAZIONE TARGET COERENZA CON L’USO PREVISTO DEL TEST. VALIDITÁ DI FACCIATA  QUANTO UN TEST SEMBRA MISURARE CIÒ CHE DICHIARA DI MISURARE, AGLI OCCHI DEI RISPONDENTI O DEGLI UTILIZZATORI NON ESPERTI. ESSA PUÓ INFLUENZARE LA MOTIVAZIONE DEI PARTECIPANTI, ACCETTABILITÁ DEL TEST, CREDIBILITÁ PERCEPITA NEI CONTESTI APPLICATIVI. CRITERI CHE RENDONO UN ITEM RAPPRESENTATIVO: RILEVANZA  QUANDO UN ITEM È DIRETTAMENTE COLLEGATO AL CSOTRUTTO. RAPPRESENTATIVITÁ  IMPLICA «UN CAMPIONAMENTO CONCETTUALE CORRETTO DEL DOMINIO DA VALUTARE». UN ITEM RAPPRESENTATIVO: COPRE UNA PARTE ESSENZIALE DEL COSTRUTTO CONTRIBUISCE A RAPPRESENTARNE LE DIVERSE SFACCETTATURE NON LASCIA SCOPERTE DIMENSIONI FONDAMENTALI.

LEZIONE 20

20. Nel contesto della costruzione di un database per l’analisi dei dati psicologici, quali sono i principali criteri da rispettare per garantire la qualità e la coerenza del dataset? CRITERI: ORGANIZZAZIONE RIGOROSA DELLA MATRICE DI DATI  INFORMAZIONI SU UN SINGOLO CASO  RIGHE. INFORMAZIONI RELATIVE ALLE VARAIBILI  COLONNE. UNA SOLA INFORMAZIONE PER OGNI CELLA  GARANTISCE COERENZA E LEGGIBILITÁ. IN CASO DI DOMANDE CON RISPOSTE MULTIPLE, OCCORRE CREARE UNA VARIABILE PER OGNI OPZIONE E CODIFICARLA 0/1. GESTIONE CORRETTA DEI VALORI MANCANTI  ESSI DEVONO ESSERE CODIFICATI CON UN VALORE NUMERICAMENTE IMPOSSIBILE PER QUELLA VARIABILE. NOMI DELLE VARIABILI CHIARI E COMPATIBILI CON R  DEVONO COMPARIRE SOLO NELLA PRIMA RIGA. NON DEVE SUPERARE GLI 8 CARATTERI, NON DEVE INIZIARE CON UN NUMERO. EVITARE GLI SPAZI E I CARATTERI SPECIALI. CODIFICARE IN MODO COERENTE LE VARIABILI CATEGORIALI  È PREFERIBILE CODIFICARE LE CATEGORIE COME NUMERI. SE LA CODIFICA NON È PRESENTE SUL CARTACEO, È MEGLIO INSERIRE IL TESTO E RICODIFICARE SUCCESSIVAMENTE IN R, PER EVITARE ERRORI. IDENTIFICAZIONE UNIVOCA DEI PARTECIPANTI  LA PRIMA COLONNA DEVE CONTENERE UN CODICE IDENTIFICATIVO ANONIMO, UTILE PER: ORDINARE I PROTOCOLLI, GARANTIRE PRIVACY, GESTIRE SOMMINISTRAZIONI RIPETUTE COERENZA E CONTROLLO DURANTE L’INSERIMENTO  BLOCCARE LA PRIMA RIGA E LA PRIMA COLONNA NEL FOGLIO ELETTRONICO. VERIFICARE CHE TUTTE LE VARIABILI SIANO STATE INSERITE CORRETTAMENTE. ASSICURARSI CHE I FORMATI SIANO COERENTI (NUMERICO, TESTUALE, ECC.). PREPARAZIONE DEL FILE PER L’IMPORTANZE  IL FILE DEVE ESSERE SALVATO IN UN FORMATO COMPATIBILE (ES. .CSV), EVITANDO ELEMENTI CHE POSSANO CREARE PROBLEMI IN R. **LEZIONE 21

  1. Che cos’è il recall bias e in quali contesti di ricerca psicologica è particolarmente rilevante?** RECALL BIASERRORE SISTEMATICO CHE DERIVA DALLA DIVERSA ACCURATEZZA CON CUI LE PERSONE RICORDANO EVENTI O ESPERIENZE PASSATE.
    1. SCALE PSICOMETRICHE CON CONTENUTO COMPORTAMENTALE: MOLTI ITEM RICHIEDONO DI RICORDARE COMPORTAMENTI PASSATI, SPESSO RIFERITI A PERIODI LONTANI (ES. ADOLESCENZA). QUESTO RENDE LA STIMA VULNERABILE A DISTORSIONI.
    2. RACCOLTA DI DATI SOCIO-DEMOGRAFICI O ANAMNESTICI: AD ESEMPIO CONTESTI COME INCIDENTI STRADALI, FREQUENZA DELLE ABBUFFATE, USO DELLA CARTA DI CREDITO, CONSUMO DI ALCOL… IN QUESTI CASI, LA MEMORIA PUÒ ESSERE IMPRECISA O RICOSTRUITA.
    3. VALUTAZIONE DI COMPORTAMENTI FREQUENTI O POCO SALIENTI: EVENTI MOLTO FREQUENTI VENGONO COMPRESSI IN RAPPRESENTAZIONI GLOBALI, RENDENDO DIFFICILE IL CONTEGGIO ACCURATO.
    4. STUDI CHE COINVOLGONO TERZI OSSERVATORI: QUANDO LA FREQUENZA DEI COMPORTAMENTI È RIPORTATA DA GENITORI, INSEGNANTI O PARI, INTERVENGONO BIAS LEGATI A TEORIE IMPLICITE DELLA PERSONALITÀ E ALL’EURISTICA DELLA DISPONIBILITÀ.
    5. QUESTIONARI CON SCALE DI FREQUENZA: LA SCALA STESSA PUÒ INFLUENZARE LA STIMA: GLI ANCORAGGI DELLA SCALA MODIFICANO LA PERCEZIONE DELLA FREQUENZA MEDIA E QUINDI LA RISPOSTA.

LEZIONE 22

22. Perché è importante analizzare la varianza degli item nei test di prestazione tipica e quali problemi possono emergere se tale analisi viene trascurata? ANALISI DELLA VARIANZA DEGLI ITEMI NEI TEST DI PRESTAIZONE TIPICA  PERMETTE DI VALUTARE LA CAPACITÁ DISCRIMINATIVA DEGLI ITEM E LA QUALITÁ COMPLESSIVA DELLO STRUMENTO. NEI TEST DI PRESTAZIONE TIPICA NON ESISTONO RISPOSTE CORRETTE O ERRATE  QUINDI CI INTERISSIAMO ALLA VARIABILITÁ DELLE RISPOSTE RISPETTO ALL’ATTITUDINE O AL MODO ABITUALI DI PENSARE E SENTIRE. QUEST’ANALISI CONSENTE DI VALUTARE: CAPACITÁ DISCRIMINATIVA DELL’ITEM IDENTIFICARE EVENTUALI PROBLEMI DI FORMULAZIONE VERIFICARE L’USO EFFETTIVO DELLE CATEGORIE DI RISPOSTA INDIVIDUARE EFETTO DESIDERABILITÁ O BIAS IN GENERALE UN TEST NON ANALIZZATO RISCHIA DI DIVENTARE INCAPACE DI COGLIERE LE DIFFERENZE INDIVIDUALI. RITROVIAMO INOLTRE  DISTORSIONI DEI PUNTEGGI, VALIDITÁ DI COSTRUTTO DANNEGGIATA, DIFFICOLTÁ NELL’IDENTIFICARE ITEM PROBLEMTICI, ANALISI SUCCESSIVE COMPROMESSE. **LEZIONE 23

  1. Definisci e discuti il concetto di ridondanza tra item in un test psicologico. Quando è opportuno mantenere due item simili?** RIDONDANZA TRA ITE M PRESENZA DI ITEM CHE ANCHE SE FORMULATI IN MODO DIVERSO, VEICOLANO LA STESSA AFFERMAZIONE. OSSIA  DUE O PIÚ ITEM ALTAMENTE CORRELATI CHE MISURANO LA STESSA PORZIONE DI COSTRUTTO. PER RILEVARLA  SI MISURA LA CORRELAZIONE TRA ITEM ESSA NON È SEMPRE NEGATIVA. IN FASE DI COSTRUZIONE INIZIALE  È NORMALE INSERIRE ITEM MOLTO SIMILI PER TESTARE LA ROBUSTEZZA DI MISURAZIONE. SI USANO QUANDO: CI TROVIAMO NELLA FASE ESPLORATIVA  PERMETTONO DI VERIFICARE QUALE ITEM FUNZIONA MEGLIO. ITEM SIMILI  CONTRIBUISCONO ALLA COPERTURA TEORICA. AUMENTANO L’AFFIDABILITÁ INTERNA  SE NON ECCESSIVAMENTE SOVRAPPOSTI QUANDO POPOLAZIONE DI RIFERIMENTO  RICHIEDE RIDONDANZA 

PROCEDURA “È DIVERSA DALLA SOSTITUZIONE CON LA MEDIA” PERCHÉ SI BASA SULLA

COERENZA INTERNA DELLE RISPOSTE INDIVIDUALI.

LEZIONE 25

25. Quali sono le condizioni necessarie perché una misura possa essere considerata valida dal punto di vista del criterio? VALIDITÁ DI CRITERIO  DIPENDE DAL MODO IN CUI ESSO SI COLLEGA A UN INDICATORE ESTERNO RILEVANTE.

CRITERIO RILEVANTE E TEORICAMENTE FONDATO  DEVE RAPPRESENTARE IN MODO ADEGUATO

LA CARATTERISTICA CHE VUOLE MISURARE.

CRITERIO MISURABILE IN MODO ATTENDIBILE  UN CRITERIO INSTABILE, SOGGETTIVO O POCO

AFFIDABILE RIDUCE AUTOMATICAMENTE LA VALIDITÀ DEL TEST.

ADEGUATA ATTENDIBILITÀ INTER-OSSERVATORI QUANDO IL CRITERIO CONSISTE IN VALUTAZIONI

CLINICHE O COMPORTAMENTALI, È INDISPENSABILE CHE DIVERSI OSSERVATORI GIUNGANO A

GIUDIZI COERENTI.

LA RELAZIONE TRA TEST E CRITERIO DEVE ESSERE FORTE, COERENTE E INTERPRETABILE:  LA

VALIDITÀ DI CRITERIO SI BASA SULLA CORRELAZIONE TRA PUNTEGGI AL TEST E PUNTEGGI NEL

CRITERIO. NON BASTA CHE LA CORRELAZIONE SIA STATISTICAMENTE SIGNIFICATIVA: DEVE ESSERE

ANCHE SUFFICIENTEMENTE AMPIA DA AVERE VALORE PRATICO.

LA RELAZIONE DEVE ESSERE VALUTATA NEL MOMENTO APPROPRIATO (CONCORRENTE O

PREDITTIVO) LA VALIDITÀ DI CRITERIO ASSUME FORME DIVERSE A SECONDA DEL MOMENTO IN

CUI IL CRITERIO VIENE MISURATO: VALIDITÀ CONCORRENTE: TEST E CRITERIO MISURATI NELLO

STESSO MOMENTO; VALIDITÀ PREDITTIVA: IL CRITERIO È MISURATO SUCCESSIVAMENTE.

IL CRITERIO DEVE ESSERE DEFINITO E GIUSTIFICATO CONCETTUALMENTE LA SCELTA DEL

CRITERIO NON PUÒ ESSERE DATA PER SCONTATA: DEVE ESSERE MOTIVATA E COERENTE CON LO

SCOPO DEL TEST.

IL CRITERIO DEVE ESSERE ETICAMENTE APPROPRIATO E APPLICABILE NEL CONTESTO D’USO UN

CRITERIO INADEGUATO PUÒ PRODURRE ERRORI DECISIONALI, BIAS O CONSEGUENZE NEGATIVE

PER GLI INDIVIDUI VALUTATI.

LEZIONE 26

26. Quali sono le principali fonti di disaccordo tra osservatori nella valutazione inter-soggettiva, e come possono essere mitigate? DIFFERENZE NEI CRITERI SOGGETTIVI DI GIUDIZIO  QUANDO I GIUDICI APPLICANO CRITERI PERSONALI DIVERSI. RITROVIAMO DIFFERENZE NELLA CLASSIFICAZIONE NOMINALE E NELL’ATTRIBUZIONE DI PUNTEGGIO ORDINALI E METRICI. MITIGAZIONE  DEFINIZIONE CHIARA E CONDIVISA DEI CRITERI DI VALUTAZIONE, FORMAZIONE SPECIFICA DEI GIUDICI PER UNIFORMARE L’INTERPRETAZIONE DELLE CATEGORIE.

DIFFERENZE NELLE POSIZIONI RELATIVE ATTRIBUITE AI SOGGETTI  ATTENDIBILITÁ INTER-

OSSERVATORIO  COERENZA DEI RANGHI ATTRIBUITI DAI GIUDICI.

MITIGAZIONE  UTILIZZO DI SCALE PIÙ DETTAGLIATE (ALMENO 4–5 PUNTI) PER RIDURRE

L’AMBIGUITÀ

ADDESTRAMENTO CON ESEMPI ANCORATI (ANCHOR EXAMPLES) PER STABILIZZARE I RANGHI.

DIFFERNZE NEI PUNTEGGI ASSOLUTI ATTRIBUITI  ACCORDO, QUANDO GUIDICI DIVERSI

ATTRIBUISCANO ESATTAMENTE LO STESSO PUNTEGGIO.

MITIGAZIONE  SESSIONI DI CALIBRAZIONE PER ALLINEARE I LIVELLI MEDI DI SEVERITÀ

USO DI INDICI COME ICC (AGREEMENT) PER MONITORARE LA COERENZA E INTERVENIRE QUANDO

NECESSARIO.

PROBLEMI LEGATI ALLA SCALA DI MISURA  DISACCORDO POTREBBE AUMENTARE QUANDO LE

CATEGORIE SONO POCHE O POCO INFORMATIVE.

MITIGAZIONE  SCEGLIERE SCALE ADEGUATE ALLA COMPLESSITÀ DEL FENOMENO

EVITARE CATEGORIE TROPPO GENERICHE O AMBIGUE.

EFFETTI DELLE DISTRIBUZIONI MARGINALI E DELLA SIMMETRIA DELLE VALUTAZIONE 

COEFFICIENTE K DI COHEN INFLUENZATO DALLA DISTRIBUZIONE DELLE FREQUENZE MARGINALI.

CIÒ SIGNIFICA CHE I GIUDICI POSSONO SEMBRARE IN DISACCORDO ANCHE QUANDO LA

PROPORZIONE DI ACCORDI È ALTA, SEMPLICEMENTE PERCHÉ CLASSIFICANO I CASI IN MODO

SBILANCIATO.

MITIGAZIONE BILANCIARE LE CATEGORIE QUANDO POSSIBILE

INTERPRETARE GLI INDICI TENENDO CONTO DELLA DISTRIBUZIONE DEI DATI

UTILIZZARE INDICI ALTERNATIVI (ES. ICC O IOTA) QUANDO LA STRUTTURA DEI DATI LO RICHIEDE.

DISACCORDO SU PIÚ VARIABILI CONTEMPORANEAMENTE  QUANDO I GIUDICI VALUTANO PIÙ

DIMENSIONI, IL DISACCORDO PUÒ EMERGERE IN MODO NON UNIFORME.

MITIGAZIONE ANALIZZARE L’ACCORDO VARIABILE PER VARIABILE

UTILIZZARE INDICI MULTIVARIATI (IOTA) PER IDENTIFICARE PATTERN DI DISACCORDO

RIVEDERE LE VARIABILI PIÙ PROBLEMATICHE.

LEZIONE 28

28. Che cosa si intende per 'coerenza interna' e quali metodi vengono comunemente utilizzati per valutarla? ATTENDIBILITÁ  LA COERENZA INTERNA DELLA MISURA, LA SUA PRECISIONE E LA SUA STABILITÀ RISPETTO AL RUMORE GENERATO DAGLI ERRORI CASUALI COERENZA INTERNA  LA CAPACITÀ DEL TEST DI MISURARE IN MODO OMOGENEO IL COSTRUTTO DI INTERESSE, RIDUCENDO L’INFLUENZA DELL’ERRORE CASUALE PER VALUTARLA  SI CONFRONTANO FORME EQUIVALENTI DEI TEST. TEST  INTERAMENTE COERENTE QUANDO LA VARIANZA OSSERVATA RIFLETTE IN LARGA PARTE LA VARIANZA DEL PUNTEGGIO VERO. QUELLA PARTE DELLA VARIANZA CHE RIFLETTE REALMENTE LA CARATTERISTICA PSICOLOGICA OGGETTO DELLA MISURAZIONE. COERENZA INTERNA  VIENE STIMATA TRAMITE PROCEDURE CHE PERMETTONO VALUTARE QUANTO GLI ITEM SI COMPORINO COME INDICATORI DELLO STESSO TRATTO. PROCEDURE: CORRELAZIONE TRA FORME PARALLELE  DUE FORME SONO PARALLELE QUANDO «MISURANO ESATTAMENTE LO STESSO COSTRUTTO, HANNO LA STESSA DIFFICOLTÀ MEDIA E LA STESSA VARIANZA DEGLI ERRORI». LA COERENZA INTERNA PUÒ ESSERE STIMATA TRAMITE LA CORRELAZIONE TRA I PUNTEGGI DELLE DUE FORME, POICHÉ IN CONDIZIONI DI PERFETTO PARALLELISMO «IL COEFFICIENTE DI ATTENDIBILITÀ COINCIDE CON LA CORRELAZIONE TRA I DUE INSIEMI DI PUNTEGGI». CORRELAZIONE TRA FORME ESSENZIALMENTE TAU-EQUIVAENTI  QUANDO LE FORME MISURANO LO STESSO COSTRUTTO MA DIFFERISCONO PER UNA COSTANTE. ANCHE IN QUESTO CASO LA CORRELAZIONE TRA FORME PUÒ ESSERE UTILIZZATA, MA L’INTERPRETAZIONE DELL’ATTENDIBILITÀ DIVENTA PIÙ COMPLESSA PERCHÉ LE MEDIE POSSONO DIFFERIRE. MODELLI STRUTUTRALI (CFA, SEM) PER FORME CONGENERICHE  NELLA PRATICA I TEST SONO SPESSO CONGENERICI, CIOÈ «CONDIVIDONO SOLO PARTE DEL COSTRUTTO, O DIFFERISCONO ANCHE PER STRUTTURA DEGLI ERRORI E PESO DEGLI ITEM». IN QUESTO SCENARIO LA SEMPLICE CORRELAZIONE NON È PIÙ SUFFICIENTE: «RICHIEDE UN MODELLO STRUTTURALE CHE TENGA CONTO DEL DIVERSO CONTRIBUTO DI CIASCUN ITEM». ANALISI FATTORIALE E MODELLI DI EQUAZIONI STRUTTURALI  PERMETTONO DI STIMARE L’ATTENDIBILITÀ COME PROPORZIONE DI VARIANZA SPIEGATA DA UN FATTORE COMUNE LATENTE.

LEZIONE 29

29. Descrivi nell’uso delle forme parallele di un test può essere impiegata per valutare l’attendibilità di un test. USO DELLE FORME PARALLELE  METODO PER STIMARE L’ATTENDIBILITÁ ALL’INTERNO DELLA TEORIA CLASSICA DEI TEST. DUE FORME SONO CONSIDERATE PARALLELE QUANDO: «MISURANO ESATTAMENTE LO STESSO COSTRUTTO» «HANNO LA STESSA DIFFICOLTÀ MEDIA» «[HANNO] LA STESSA VARIANZA DEGLI ERRORI» PROCEDURE DELLE FORME PARALLELE : 1. Si somministrano le due versioni parallele dello stesso test allo stesso gruppo di persone 2. Si calcola la correlazione tra i punteggi delle due forme. In condizioni di perfetto parallelismo, «il coefficiente di attendibilità coincide con la correlazione tra i due insiemi di punteggi». 3. La correlazione ottenuta rappresenta una stima diretta dell’attendibilità. Questo perché, se le due forme sono realmente parallele, eventuali differenze tra i punteggi sono attribuibili esclusivamente all’errore casuale. 30. Che cosa si intende per 'relazione spuria' in psicometria, e quali rischi comporta nel processo di validazione dei costrutti? RELAZIONE SPURIA  QUANDO DUE VARIABILI MOSTRANO EMPIRICAMENTE UNA COVARIAZIONE, MA NESSUNA DELLE DUE È CAUSA DELL’ALTRA. ESSA, È SPESSO, DOVUTA ALLA PRESENZA DI UNA VARIABILE TERZA CHE INFLUENZA ENTRAMBE. RISCHI PER LA VALIDAZIONE DEI COSTRUTTI: FAR APPARIRE VALIDE RELAZIONI NON VALIDE COMPROMETTERE LA VALIDITÁ DI COSTRUTTO INTERPRETAZIONI DISTORTE DOVUTE AL PARADOSSO DI SIMPSON  LA RELAZIONE OSSERVATA NEL CAMPIONE TOTALE PUÒ ESSERE OPPOSTA A QUELLA PRESENTE NEI SOTTOGRUPPI. QUESTO PUÒ PORTARE A CONCLUSIONI COMPLETAMENTE FUORVIANTI SULLA STRUTTURA DEL COSTRUTTO E SULLE RELAZIONI TRA VARIABILI.