Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


FREQUENZE E DISTRIBUZIONI, Appunti di Psicometria

FREQUENZE E DISTRIBUZIONI modulo I

Tipologia: Appunti

2023/2024

In vendita dal 20/10/2025

vals9
vals9 🇮🇹

4.7

(3)

53 documenti

1 / 22

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
FREQUENZE E DISTRIBUZIONI
The Frequencies procedure provides statistics and graphical displays that are useful for
describing many types of variables.
Skewness. A measure of the asymmetry of a distribution. The normal distribution is
symmetric and has a skewness value of 0. A distribution with a significant positive
skewness has a long right tail. A distribution with a significant negative skewness has
a long left tail. As a guideline, a skewness value more than twice its standard error is
taken to indicate a departure from symmetry.
Kurtosis. A measure of the extent to which observations cluster around a central
point. For a normal distribution, the value of the kurtosis statistic is zero. Positive
kurtosis indicates that the observations cluster more and have longer tails than those
in the normal distribution, and negative kurtosis indicates that the observations cluster
less and have shorter tails.
La distribuzione normale (gaussiana) è definita dai valori
di MEDIA e VARIANZA:
Asimmetria e Curtosi
Indici di deviazione dalla normalità di una curva
CURTOSI Come si raggruppano le osservazioni
Distribuzione normale = 0
Se positiva => osservazioni più raggruppate al centro della curva e code
più sottili
Se negativa => osservazioni meno raggruppate al centro con code più
spesse
ASIMMETRIA (Skewness)
La curva normale è simmetrica = 0
Se positiva => osservazioni si concentrano nella coda di destra
Se negativa => osservazioni si concentrano nella coda di sinistra
NB. Un valore che risulta maggiore del doppio rispetto all’errore standard indica uno
scostamento significativo dalla normale simmetria
Curtosi negativa e positiva.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16

Anteprima parziale del testo

Scarica FREQUENZE E DISTRIBUZIONI e più Appunti in PDF di Psicometria solo su Docsity!

FREQUENZE E DISTRIBUZIONI

The Frequencies procedure provides statistics and graphical displays that are useful for describing many types of variables. Skewness. symmetric and has a skewness value of 0. A distribution with a significant positive A measure of the asymmetry of a distribution. The normal distribution is skewness has a long right tail. A distribution with a significant negative skewness has a long left tail. As a guideline, a skewness value more than twice its standard error is taken to indicate a departure from symmetry. Kurtosis. point. For a normal distribution, the value of the kurtosis statistic is zero. Positive A measure of the extent to which observations cluster around a central kurtosis indicates that the observations cluster more and have longer tails than those in the normal distribution, and negative kurtosis indicates that the observations cluster less and have shorter tails. La distribuzione normale (gaussiana) è definita dai valori di MEDIA e VARIANZA: Asimmetria e Curtosi Indici di deviazione dalla normalità di una curva

  • CURTOSI Come si raggruppano le osservazioni
    • Distribuzione normale = 0
    • Se positiva => osservazioni più raggruppate al centro della curva e code più sottili
    • Se negativa => osservazioni meno raggruppate al centro con code più spesse
  • ASIMMETRIA (Skewness)
    • La curva normale è simmetrica = 0
    • Se positiva => osservazioni si concentrano nella coda di destra
    • Se negativa => osservazioni si concentrano nella coda di sinistra NB. Un valore che risulta maggiore del doppio rispetto all’errore standard indica uno scostamento significativo dalla normale simmetria Curtosi negativa e positiva.

Skew negativa e positiva ASSUNZIONI DI NORMALITA’ 🧩 Gli autori confrontano la robustezza di due test di localizzazione su più campioni: Obiettivo dello studioANOVA F-test (parametrico), basato sull’assunzione di normalità Usano simulazioni Monte Carlo per capire come la normalità influenzi^ ^ Test di Kruskal–Wallis^ (non parametrico), che non richiede normalità dimensione del test (probabilità di errore di tipo I) e potenza sotto distribuzioni non normali. 🧩 Setup metodologico  Distribuzioni simulate usando la famiglia g-and-k di MacGillivray & Cannon, la quale consente di variare in modo indipendente skewness (g) e kurtosis (k).  Gruppi di campioni simulati con n = 15 e n = 30, con tre gruppi (μ vettore = (μ₁, μ₂, μ₃)).  Considerano: o μ = (0,0,0) → valutazione della dimensione effettiva del test. o μ ≠ (0,0,0) → valutazione della potenza. 🧩 Risultati principali

1. Dimensione del test (α reale)ANOVA distribuzione non è estremamente distorta. mantiene abbastanza bene la dimensione nominale (1%) finché la  In casi di skewness o kurtosi molto elevate, il F-test può atteso , aumentando o diminuendo l’α reale. deviare dal valoreKruskal–Wallis sotto forti deviazioni dalla normalità. mostra dimensione più stabile e meno soggetta a variazioni 2. Potenza   Per distribuzioni vicine alla normalità,Con deviazioni significative (soprattutto alta kurtosi), ANOVA ha potenza maggiore. Kruskal–Wallis diventa più potente.  ANOVA subisce un calo di potenza più marcato con code pesanti, mentre il metodo non parametrico si mantiene più affidabile. 🧩 Interpretazione e significato  In condizioni moderate, grazie alla robustezza asintotica. l’ANOVA è adeguata anche senza normalità perfetta,  In condizioni estreme di skewness o kurtosi elevata:

 segue una distribuzione asimmetrica (es. esponenziale, gamma). Un GLM è composto da 3 elementi:

  1. Distribuzione (es. binomiale, Poisson, gamma…) della variabile dipendente
  2. Funzione di link Collega la media di Y alla combinazione lineare dei predittori: g(μ)=β0+β1X1+…g(\mu) = \beta_0 + \beta_1X_1 + \dotsg(μ)=β0+β1X1+… dove ggg è la funzione di link e μ=E(Y)\mu = E(Y)μ=E(Y)
  3. Componente lineare Come nella regressione lineare: η=Xβ\eta = X\betaη=Xβ 🧩 Esempi di GLM Tipo di regressione Distribuzio ne Funzione di link Quando si usa? Lineare Normale Identità Y continua, distribuzione normale Logistica (logit) Binomiale Logit log p}log1−ppp1− p\log\frac{p}{1- Y binaria (es. sì/no) Poisson Poisson Logaritmica Conteggi (es. numero di errori) Gamma Gamma Inversa o logaritmica Dati positivi e asimmetrici 🧩 In sintesi Aspetto Regressione Lineare GLM Y deve essere normale? 👇 Sì 👇 No Varianza costante? 👇 Sì 👇 No (dipende da Y) Funzione di link? 👇 No (identità) 👇 Sì Applicazioni Limitate Molto ampie (logistica, conteggi, etc.) L’ relazione tra due o più variabilianalisi della regressione lineare. Lo scopo principale è è una tecnica statistica utilizzata per studiare la prevedere il valore di una variabile dipendente (Y) a partire dai valori di una o più variabili indipendenti (X). 🧩 1. Regressione lineare semplice

Definizione (Y), tramite una: studia la relazione tra una variabile indipendente (X) e una dipendente retta. Equazione della retta Y=β0+β1X+εY = \beta_0 + \beta_1X + \varepsilonY=β0: +β1X+ε  β0\beta_0β0: intercetta (valore di Y quando X = 0)   β1\beta_1β1ε\varepsilonε: errore (differenza tra valore osservato e valore previsto): coefficiente angolare (quanto cambia Y per ogni unità di X)

🧩 Estende il modello a 2. Regressione lineare multipla più variabili indipendenti : Y=β0+β1X1+β2X2+ beta_nX_n + \varepsilonY=β0⋯+βnXn++β1εY = \beta_0 + \beta_1X_1 + \beta_2X_2 + \dots + \X1+β2X2+⋯+βnXn+ε Serve a capire l’effetto di più fattori su una variabile dipendente (es: come età, dieta e attività fisica influenzano la memoria).

🧩 Perché il modello sia valido, devono essere rispettate alcune 3. Assunzioni della regressione lineare condizioni :

  1. Linearità : la relazione tra X e Y è lineare
    1. Indipendenza degli erroriOmogeneità della varianza (omoscedasticità)
  2. Normalità degli errori
  3. Assenza di multicollinearità (nella regressione multipla) 🧩 4. Indicatori principaliR² (coefficiente di determinazione) cambiamento in Y è spiegato da X : varia da 0 a 1 e indica quanto delp-value coefficiente è significativo): indica la significatività statistica dei coefficienti (se p < 0.05, il  Residui le assunzioni: differenze tra valori osservati e previsti; vanno analizzati per verificare

🧩 5. Utilizzi pratici  In psicologia: per prevedere comportamenti o punteggi ai test in base a fattori socio-demografici

 H₀: i due gruppi hanno la stessa media  H₁: le medie sono diverse Dopo aver calcolato il valore t e consultato una tabella (o usando un software), ottieni:  t = 2.  p = 0. 👇 Poiché p = 0.02 < 0.05 , rifiuti H₀: la differenza è significativa. 🧩 5. Attenzione a:Effetto pratico rilevante nella pratica : un risultato può essere statisticamente significativo ma (→ guarda anche l’ effect size , es. Cohen’s d) pocoErrore di I tipo (α) : rifiuti H₀ quando è vera (falso positivo)  Errore di II tipo (β) : non rifiuti H₀ quando è falsa (falso negativo) 🧩 6. In psicometria, il calcolo della significatività è usato per:  Verificare l’efficacia di un intervento o di un test   AnalizzareConfrontare la validità e l’affidabilità di uno strumento gruppi clinici vs non clinici  Esaminare la struttura fattoriale di un questionario (es. in analisi fattoriale) La soprattutto nei modelli di significatività del modello regressione è un concetto centrale nell’analisi statistica, (sia semplice che multipla). Serve a capire se il modello, nel suo complesso, spiega una parte significativa della variabilità della variabile dipendente.

🧩 1. Cos'è la significatività del modello? È una indipendenti ha un effetto significativo verifica globale per determinare se almeno una delle variabili sulla variabile dipendente. In pratica: Il tuo modello spiega qualcosa o è solo rumore casuale? 🧩 2. Test F nella regressione Per testare la significatività del modello si usa il regressione). test F (ANOVA del modello di 🧩 Formula generale del test F:

F=varianza spiegata dal modello}}{\text{varianza residua spiegata dal modellovarianza residua (errore)F = \frac{\text{varianza (errore)}}F=varianza Più è alto F → più il modello spiega la variabilità in Y meglio dell’errore casuale. residua (errore)varianza spiegata dal modello

🧩 3. Interpretazione del p-value associato al test Fp < 0.05 → il modello è significativo : almeno una delle variabili indipendenti spiega una parte significativa della varianza in Yp ≥ 0.05 spiegano → il modello meglio della media non è significativo , e le variabili indipendenti non

🧩 4. Collegamento con R²  Il varianza di Y è spiegato dal modello R² (coefficiente di determinazione) (^) .indica quanto del totale della  Ma anche se R² è alto , bisogna testarne la significatività con il test F.  Il test F verifica se quel valore di R² casuale. è abbastanza grande da non essere

🧩 Hai un modello di regressione multipla in cui prevedi il 5. Esempio pratico punteggio a un test di memoria in base a:  età   ore di sonnolivello di stress Il software (es. SPSS, R, JASP) ti dà:   R² = 0.32F = 6.  p = 0. 👇 la combinazione) Interpretazione: il modello è spiega in modo affidabile significativo (p < .05) → almeno una delle variabili (o parte della variazione nei punteggi al test. 🧩 6. Quando è utile la significatività del modello?  Per sapere se vale la pena considerare il modello  Nella costruzione di strumenti psicometrici

l’IC al 95% intervallo Medium non include zero. , il coefficiente è significativo anche a livello di

5. Diagnostica e potenziali problemi Attenzione a:  Multicollinearità aumenta — il p-value può risultare non significativo anche per variabili: se le variabili indipendenti sono correlate, l’errore standard effettivamente correlate. Si calcola il monitorare l’argomento Wikipedia. Variance Inflation Factor (VIF) per  Outlier influenti che in realtà non lo è nella popolazione. È utile usare diagnostica come: valori anomali possono rendere significativo un coefficiente

studentized residuals jmp.com+10arxiv.org+10stats.oarc.ucla.edu+10 o regressioni robuste.

🧩 Riepilogo tabellare Elemento Significato t individuale-test Test sul coefficiente βi\beta_iβi = 0 p-value Probabilità di t-valore estremo sotto H₀ p < α Il coefficiente è significativo Confidence Interval IC che non contiene zero → supporto ulteriore alla significatività Effect size Indica l’impatto reale della variabile VIF, residual plots Verifica di multicollinearità o outlier

🧩 In psicometria, la significatività dei parametri è utile per: Contesto psicometrico / applicativo  Validare che alla previsione di una variabile esterna (es. memoria, attenzione) ogni elemento (o punteggio fattoriale) di un test contribuisca  Se un coefficiente non è significativo, si può considerare di variabile dal modello o dal questionario rimuovere quella  Interpretare l’ cognitivi affidabilità predittiva di punteggi fattoriali su outcome clinici o L’ fondamentale per confrontare analisi della varianza (ANOVA) le medie tra due o più gruppi in psicometria è una tecnica statistica e verificare se le

differenze osservate sono statisticamente significative costruzione e validazione dei test, nello studio di differenze tra gruppi clinici/non clinici. È molto usata nella e nell’analisi degli item. 🧩 1. Cos’è l’ANOVA? L’ con la ANOVA (Analysis of Variance) variabilità interna ai gruppi confronta la. variabilità tra le medie dei gruppi Lo scopo è vedere altri. se almeno un gruppo differisce in modo significativo dagli Domanda tipica: “I punteggi medi a un test di ansia differiscono tra adolescenti, adulti e anziani?”

🧩 L’ANOVA confronta due fonti di varianza: 2. Come funziona?Varianza tra i gruppi (MS_between) differenza tra i gruppi → dovuta alla manipolazione o  Varianza entro i gruppi (MS_within) errori casuali → dovuta a differenze individuali o 🧩 F=MSbetweenMSwithinF = \frac{\text{MS}{\text{between}}}{\text{MS}{\ Si calcola il valore F: text{within}}}F=MSwithinMSbetween Se almeno un gruppo differisce in modo significativo F è sufficientemente grande , il p-value sarà < 0.05. , e quindi si può dire che

🧩 3. Tipi di ANOVA più comuni in psicometria Tipo di ANOVA Quando si usa ANOVA a una via Confronta una variabile dipendente in 2+ gruppi su variabile indipendente (es. genere, età) una sola

ANOVA a due vie Studia due variabili indipendenti (es. età e tipo di intervento)

ANOVA ripetute misure I partecipanti sono testati più volte (es. prima, durante e dopo una terapia)

MANOVA Come l’ANOVA ma con attenzione)^ più variabili dipendenti^ (es. memoria^ e

🧩 4. Applicazioni in psicometria

🧩 Riepilogo Concetto Spiegazione ANOVA Confronta medie tra 2 o più gruppi Statistica F Rapporto tra varianza tra i gruppi e varianza interna Significatività (p < .05) Indica che significativamente almeno un gruppo differisce Post-hoc Specifica quali gruppi sono diversi Effect size Indica quanto è forte la differenza I varianza (ANOVA) gradi di libertà (df) e nei e il modelli di regressione parametro F sono due concetti chiave nell’. Vediamoli in modo semplice e analisi della applicabile, anche al contesto psicometrico. 🧩 1. Cos’è il parametro F? Il valore  Varianza spiegata dal modello F è una statistica usata per confrontare (tra i gruppi) due varianze :  Varianza residua (entro i gruppi) F=MSbetweenMSwithinF = \frac{\text{MS}{\text{between}}}{\text{MS}{\ text{within}}}F=MSwithinMSbetween Dove:

 MS sta per mean square (media dei quadrati → una forma di varianza)

 Se varianza casuale → il modello è F è grande , vuol dire che la varianza spiegata è molto più alta della significativo

🧩 I (^) gradi di libertà2. Cosa sono i gradi di libertà (df)? rappresentano quante informazioni indipendenti sono disponibili per calcolare una stima (come la varianza). Nel contesto ANOVA, ci sono due tipi principali: Tipo di varianza Gradi di libertà Significato Tra i gruppi df1=k−1df_1 = k - 1df1 =k−1 kkk = numero di gruppi Entro i gruppi df2=N−kdf_2 = N - kdf2=N−k NNN = numero totale di osservazioni

Esempio: Se confronti 3 gruppi (k = 3) con 30 partecipanti totali (N = 30):   df1=3−1=2df_1 = 3 - 1 = 2df1df2=30−3=27df_2 = 30 - 3 = 27df2=3−1=2=30−3= Quindi: F(2, 27) 🧩 3. Interpretazione del test F Dopo aver calcolato F e identificato i df, puoi:   Trovare ilSe p < 0.05 p-value , si rifiuta l’ipotesi nulla → almeno un gruppo associato (di solito fornito da SPSS, JASP, R) è significativamente diverso 🧩 4. In psicometria, questo serve a:  Verificare differenze nei punteggi ai test tra gruppi (es. clinici vs non clinici)  Analizzare sperimentali) item di un test in base a gruppi (età, genere, condizioni  Valutare se un una variabile cognitiva o emotiva modello di regressione o di ANOVA è significativo nel predire

🧩 Esempio pratico: Stai studiando l'effetto di tre tipi di intervento mnemonico sul punteggio a un test.  Gruppi: A, B, C → k = 3 Allora:^ ^ Totale soggetti: 45 → N = 45  df1=3−1=2df_1 = 3 - 1 = 2df1=3−1= Il software ti restituisce:^ ^ df2=45−3=42df_2 = 45 - 3 = 42df2=45−3=  F(2, 42) = 4. 👇 Il modello è significativo (p < .05) →^ ^ p = 0.014 almeno un gruppo ha un effetto diverso sul punteggio. 🧩 Riepilogo finale

Ambito Esempio pratico Convergenza tra strumenti Valutare se punteggi di un nuovo test si correlano a uno già validato Modelli teorici Testare relazioni ipotizzate da teorie psicologiche 🧩 4. Indicatori chiave Indicatore Significato R² Percentuale di varianza spiegata dal modello (es. R² = 0.45 → il 45% della varianza in Y è spiegata da X) Coefficiente β Indica la forza e direzione della relazione tra X e Y p-value Se p < 0.05, il coefficiente è statisticamente significativo Standard error Indica quanto è precisa la stima di β Intervallo di confidenza Se non include 0, il coefficiente è significativo

🧩 Includi 5. Regressione multipla in psicometria più predittori per valutare il contributo relativo di ciascuno: Y=β0+β1X1+β2X2+ beta_nX_n + \varepsilonY=β0⋯+βnXn++β1εY = \beta_0 + \beta_1X_1 + \beta_2X_2 + \dots + \X1+β2X2+⋯+βnXn+ε Esempio: Prevedere la depressione (YYY) in base a punteggi su ansia, supporto sociale e autostima (X1,X2,X3X_1, X_2, X_3X1,X2,X3)

⚠️ 6. Assunzioni del modello (da verificare sempre!)

  1. Linearità tra predittori e variabile dipendente
    1. IndipendenzaOmoscedasticità degli errori (varianza costante degli errori)
  2. Normalità dei residui
  3. Assenza di multicollinearità loro) (variabili indipendenti non troppo correlate tra

🧩 7. Esempio pratico in ambito psicometrico

Vuoi vedere se il punteggio a un test sull’ansia predice i risultati a un compito di attenzione.   YYY: punteggio al compito di attenzioneXXX: punteggio al test d’ansia Hai questi risultati: 👇 Interpretazione:^ ^ β1=−0.42\beta_1 = -0.42β1=−0.42,^ p = 0.004 ,^ R² = 0.  La relazione è negativa (più ansia → peggiori performance)   ÈIl test d’ansia statisticamente significativa spiega il 18% della variabilità nelle prestazioni attentive

🧩 8. Confronto con altri strumentiRispetto alla correlazione cambia Y in base a X (non solo che sono associate), la regressione ti dice quanto e in che direzione  È alla base di modelli più complessi come: o Regressione logistica (per variabili categoriali) o Modelli a equazioni strutturali (SEM) o Analisi dei percorsi (path analysis) La automatica regressione lineare a step (o stepwise regression) usata per selezionare le variabili indipendenti più rilevanti è una procedura in un modello di regressione. È particolarmente utile in psicometria quando hai molti predittori e vuoi capire quali contribuiscono davvero alla spiegazione della variabile dipendente. 🧩 È una 1. Cos'è la regressione a step? tecnica iterativa che costruisce il modello aggiungendo o rimuovendo variabili una alla volta, sulla base della loro significatività statistica. 🧩 2. Tipi di regressione a step Tipo Descrizione breve Forward selection Parte da zero → aggiunge una variabile alla volta, scegliendo quella che migliora di più il modello Backward elimination Parte dal modello completo → rimuove la variabile meno significativa a ogni passo

🧩 6. Quando usarla in psicometria   Per costruire modelli predittivi a partire da molti item o fattoriNella selezione automatica di predittori da questionari complessi  Come analisi esplorativa (ma andrebbe poi validata con dati indipendenti!) 🧩 Riepilogo Vantaggi Svantaggi Automatizza la selezione Ignora il contesto teorico Utile con molti predittori Può portare a modelli instabili Fornisce modelli più parsimoniosi Sensibile ai dati specifici del campione In stabilisce un psicometria valore soglia , la determinazione delle soglie su uno strumento di misura (es. test, questionario) per (o cut-off ) è il processo con cui si

classificare ad esempio, clinico vs non clinicoi punteggi in categorie significative:, alto vs basso rischio, adeguato vs inadeguato.

🧩 1. A cosa serve una soglia in psicometria? Serve a indicare qualcosa di significativo. decidere quando un punteggio è sufficientemente alto o basso da Esempi:   Soglia diSoglia di cut-offinclusione in un test di depressione → identifica probabili casi clinici in un intervento cognitivo → esclude chi ha prestazioni adeguate  Soglia in test cognitivi per l’ all’età identificazione del declino patologico legato

🧩 2. Come si determinano le soglie? 🧩 a. Distribuzione statistica dei punteggiPercentili : es. soglia al 90° percentile = i punteggi sopra quel valore sono considerati “alti”  Deviazioni standard funzionamento deficitario: es. un punteggio < -1.5 DS dalla media può indicare un

👇 Esempio: se la media a un test di attenzione è 100, e la DS è 15:

 Punteggio sotto 77.5 → possibile deficit

🧩 b. Analisi ROC (Receiver Operating Characteristic) Metodo esterno molto usato (es. diagnosi psichiatrica) per trovare il in psicometria clinica. Si confronta lo strumento con un cut-off ottimale. criterio  Costruzione della curva ROC: si confrontano valori soglia sensibilità e specificità per vari  Si sceglie il punto che ottimizza entrambi (es. usando l’indice di Youden ) Indice text{Sensibilit di Youden=Sensibilitaà} + \text{Specificitˋ+Specificitaà} - 1Indiceˋ−1\text{Indice di Youden} = \ di Youden=Sensibilitaˋ+Specificitaˋ−

🧩 c. Criteri teorici o clinici In alcuni casi, le soglie sono definite da:  Linee guida cliniche (es. punteggi BDI ≥ 20 = depressione moderata)  Consensus tra esperti  Validazioni precedenti di quello strumento 🧩 3. Esempio pratico Usi il Beck Depression Inventory (BDI) : Punteg gio Interpretazione 0–13 Assenza/minima depressione 14–19 Depressione lieve 20–28 Moderata 29–63 Grave Le soglie qui sono diagnosi. clinicamente validate e aiutano nella classificazione e nella

⚠️ 4. Cosa considerare quando si fissano soglieContesto clinico o educativo da una soglia per “diagnosi” : una soglia per “intervento” può essere diversa  Tipo di strumento : test normativi vs test criteriali  Conseguenze pratiche : rischio di falsi positivi o falsi negativi