














Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
FREQUENZE E DISTRIBUZIONI modulo I
Tipologia: Appunti
1 / 22
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!















The Frequencies procedure provides statistics and graphical displays that are useful for describing many types of variables. Skewness. symmetric and has a skewness value of 0. A distribution with a significant positive A measure of the asymmetry of a distribution. The normal distribution is skewness has a long right tail. A distribution with a significant negative skewness has a long left tail. As a guideline, a skewness value more than twice its standard error is taken to indicate a departure from symmetry. Kurtosis. point. For a normal distribution, the value of the kurtosis statistic is zero. Positive A measure of the extent to which observations cluster around a central kurtosis indicates that the observations cluster more and have longer tails than those in the normal distribution, and negative kurtosis indicates that the observations cluster less and have shorter tails. La distribuzione normale (gaussiana) è definita dai valori di MEDIA e VARIANZA: Asimmetria e Curtosi Indici di deviazione dalla normalità di una curva
Skew negativa e positiva ASSUNZIONI DI NORMALITA’ 🧩 Gli autori confrontano la robustezza di due test di localizzazione su più campioni: Obiettivo dello studio ANOVA F-test (parametrico), basato sull’assunzione di normalità Usano simulazioni Monte Carlo per capire come la normalità influenzi^ ^ Test di Kruskal–Wallis^ (non parametrico), che non richiede normalità dimensione del test (probabilità di errore di tipo I) e potenza sotto distribuzioni non normali. 🧩 Setup metodologico Distribuzioni simulate usando la famiglia g-and-k di MacGillivray & Cannon, la quale consente di variare in modo indipendente skewness (g) e kurtosis (k). Gruppi di campioni simulati con n = 15 e n = 30, con tre gruppi (μ vettore = (μ₁, μ₂, μ₃)). Considerano: o μ = (0,0,0) → valutazione della dimensione effettiva del test. o μ ≠ (0,0,0) → valutazione della potenza. 🧩 Risultati principali
1. Dimensione del test (α reale) ANOVA distribuzione non è estremamente distorta. mantiene abbastanza bene la dimensione nominale (1%) finché la In casi di skewness o kurtosi molto elevate, il F-test può atteso , aumentando o diminuendo l’α reale. deviare dal valore Kruskal–Wallis sotto forti deviazioni dalla normalità. mostra dimensione più stabile e meno soggetta a variazioni 2. Potenza Per distribuzioni vicine alla normalità,Con deviazioni significative (soprattutto alta kurtosi), ANOVA ha potenza maggiore. Kruskal–Wallis diventa più potente. ANOVA subisce un calo di potenza più marcato con code pesanti, mentre il metodo non parametrico si mantiene più affidabile. 🧩 Interpretazione e significato In condizioni moderate, grazie alla robustezza asintotica. l’ANOVA è adeguata anche senza normalità perfetta, In condizioni estreme di skewness o kurtosi elevata:
segue una distribuzione asimmetrica (es. esponenziale, gamma). Un GLM è composto da 3 elementi:
Definizione (Y), tramite una: studia la relazione tra una variabile indipendente (X) e una dipendente retta. Equazione della retta Y=β0+β1X+εY = \beta_0 + \beta_1X + \varepsilonY=β0: +β1X+ε β0\beta_0β0: intercetta (valore di Y quando X = 0) β1\beta_1β1ε\varepsilonε: errore (differenza tra valore osservato e valore previsto): coefficiente angolare (quanto cambia Y per ogni unità di X)
🧩 Estende il modello a 2. Regressione lineare multipla più variabili indipendenti : Y=β0+β1X1+β2X2+ beta_nX_n + \varepsilonY=β0⋯+βnXn++β1εY = \beta_0 + \beta_1X_1 + \beta_2X_2 + \dots + \X1+β2X2+⋯+βnXn+ε Serve a capire l’effetto di più fattori su una variabile dipendente (es: come età, dieta e attività fisica influenzano la memoria).
🧩 Perché il modello sia valido, devono essere rispettate alcune 3. Assunzioni della regressione lineare condizioni :
🧩 5. Utilizzi pratici In psicologia: per prevedere comportamenti o punteggi ai test in base a fattori socio-demografici
H₀: i due gruppi hanno la stessa media H₁: le medie sono diverse Dopo aver calcolato il valore t e consultato una tabella (o usando un software), ottieni: t = 2. p = 0. 👇 Poiché p = 0.02 < 0.05 , rifiuti H₀: la differenza è significativa. 🧩 5. Attenzione a: Effetto pratico rilevante nella pratica : un risultato può essere statisticamente significativo ma (→ guarda anche l’ effect size , es. Cohen’s d) poco Errore di I tipo (α) : rifiuti H₀ quando è vera (falso positivo) Errore di II tipo (β) : non rifiuti H₀ quando è falsa (falso negativo) 🧩 6. In psicometria, il calcolo della significatività è usato per: Verificare l’efficacia di un intervento o di un test AnalizzareConfrontare la validità e l’affidabilità di uno strumento gruppi clinici vs non clinici Esaminare la struttura fattoriale di un questionario (es. in analisi fattoriale) La soprattutto nei modelli di significatività del modello regressione è un concetto centrale nell’analisi statistica, (sia semplice che multipla). Serve a capire se il modello, nel suo complesso, spiega una parte significativa della variabilità della variabile dipendente.
🧩 1. Cos'è la significatività del modello? È una indipendenti ha un effetto significativo verifica globale per determinare se almeno una delle variabili sulla variabile dipendente. In pratica: Il tuo modello spiega qualcosa o è solo rumore casuale? 🧩 2. Test F nella regressione Per testare la significatività del modello si usa il regressione). test F (ANOVA del modello di 🧩 Formula generale del test F:
F=varianza spiegata dal modello}}{\text{varianza residua spiegata dal modellovarianza residua (errore)F = \frac{\text{varianza (errore)}}F=varianza Più è alto F → più il modello spiega la variabilità in Y meglio dell’errore casuale. residua (errore)varianza spiegata dal modello
🧩 3. Interpretazione del p-value associato al test F p < 0.05 → il modello è significativo : almeno una delle variabili indipendenti spiega una parte significativa della varianza in Y p ≥ 0.05 spiegano → il modello meglio della media non è significativo , e le variabili indipendenti non
🧩 4. Collegamento con R² Il varianza di Y è spiegato dal modello R² (coefficiente di determinazione) (^) .indica quanto del totale della Ma anche se R² è alto , bisogna testarne la significatività con il test F. Il test F verifica se quel valore di R² casuale. è abbastanza grande da non essere
🧩 Hai un modello di regressione multipla in cui prevedi il 5. Esempio pratico punteggio a un test di memoria in base a: età ore di sonnolivello di stress Il software (es. SPSS, R, JASP) ti dà: R² = 0.32F = 6. p = 0. 👇 la combinazione) Interpretazione: il modello è spiega in modo affidabile significativo (p < .05) → almeno una delle variabili (o parte della variazione nei punteggi al test. 🧩 6. Quando è utile la significatività del modello? Per sapere se vale la pena considerare il modello Nella costruzione di strumenti psicometrici
l’IC al 95% intervallo Medium non include zero. , il coefficiente è significativo anche a livello di
5. Diagnostica e potenziali problemi Attenzione a: Multicollinearità aumenta — il p-value può risultare non significativo anche per variabili: se le variabili indipendenti sono correlate, l’errore standard effettivamente correlate. Si calcola il monitorare l’argomento Wikipedia. Variance Inflation Factor (VIF) per Outlier influenti che in realtà non lo è nella popolazione. È utile usare diagnostica come: valori anomali possono rendere significativo un coefficiente
🧩 Riepilogo tabellare Elemento Significato t individuale-test Test sul coefficiente βi\beta_iβi = 0 p-value Probabilità di t-valore estremo sotto H₀ p < α Il coefficiente è significativo Confidence Interval IC che non contiene zero → supporto ulteriore alla significatività Effect size Indica l’impatto reale della variabile VIF, residual plots Verifica di multicollinearità o outlier
🧩 In psicometria, la significatività dei parametri è utile per: Contesto psicometrico / applicativo Validare che alla previsione di una variabile esterna (es. memoria, attenzione) ogni elemento (o punteggio fattoriale) di un test contribuisca Se un coefficiente non è significativo, si può considerare di variabile dal modello o dal questionario rimuovere quella Interpretare l’ cognitivi affidabilità predittiva di punteggi fattoriali su outcome clinici o L’ fondamentale per confrontare analisi della varianza (ANOVA) le medie tra due o più gruppi in psicometria è una tecnica statistica e verificare se le
differenze osservate sono statisticamente significative costruzione e validazione dei test, nello studio di differenze tra gruppi clinici/non clinici. È molto usata nella e nell’analisi degli item. 🧩 1. Cos’è l’ANOVA? L’ con la ANOVA (Analysis of Variance) variabilità interna ai gruppi confronta la. variabilità tra le medie dei gruppi Lo scopo è vedere altri. se almeno un gruppo differisce in modo significativo dagli Domanda tipica: “I punteggi medi a un test di ansia differiscono tra adolescenti, adulti e anziani?”
🧩 L’ANOVA confronta due fonti di varianza: 2. Come funziona? Varianza tra i gruppi (MS_between) differenza tra i gruppi → dovuta alla manipolazione o Varianza entro i gruppi (MS_within) errori casuali → dovuta a differenze individuali o 🧩 F=MSbetweenMSwithinF = \frac{\text{MS}{\text{between}}}{\text{MS}{\ Si calcola il valore F: text{within}}}F=MSwithinMSbetween Se almeno un gruppo differisce in modo significativo F è sufficientemente grande , il p-value sarà < 0.05. , e quindi si può dire che
🧩 3. Tipi di ANOVA più comuni in psicometria Tipo di ANOVA Quando si usa ANOVA a una via Confronta una variabile dipendente in 2+ gruppi su variabile indipendente (es. genere, età) una sola
ANOVA ripetute misure I partecipanti sono testati più volte (es. prima, durante e dopo una terapia)
🧩 4. Applicazioni in psicometria
🧩 Riepilogo Concetto Spiegazione ANOVA Confronta medie tra 2 o più gruppi Statistica F Rapporto tra varianza tra i gruppi e varianza interna Significatività (p < .05) Indica che significativamente almeno un gruppo differisce Post-hoc Specifica quali gruppi sono diversi Effect size Indica quanto è forte la differenza I varianza (ANOVA) gradi di libertà (df) e nei e il modelli di regressione parametro F sono due concetti chiave nell’. Vediamoli in modo semplice e analisi della applicabile, anche al contesto psicometrico. 🧩 1. Cos’è il parametro F? Il valore Varianza spiegata dal modello F è una statistica usata per confrontare (tra i gruppi) due varianze : Varianza residua (entro i gruppi) F=MSbetweenMSwithinF = \frac{\text{MS}{\text{between}}}{\text{MS}{\ text{within}}}F=MSwithinMSbetween Dove:
Se varianza casuale → il modello è F è grande , vuol dire che la varianza spiegata è molto più alta della significativo
🧩 I (^) gradi di libertà2. Cosa sono i gradi di libertà (df)? rappresentano quante informazioni indipendenti sono disponibili per calcolare una stima (come la varianza). Nel contesto ANOVA, ci sono due tipi principali: Tipo di varianza Gradi di libertà Significato Tra i gruppi df1=k−1df_1 = k - 1df1 =k−1 kkk = numero di gruppi Entro i gruppi df2=N−kdf_2 = N - kdf2=N−k NNN = numero totale di osservazioni
Esempio: Se confronti 3 gruppi (k = 3) con 30 partecipanti totali (N = 30): df1=3−1=2df_1 = 3 - 1 = 2df1df2=30−3=27df_2 = 30 - 3 = 27df2=3−1=2=30−3= Quindi: F(2, 27) 🧩 3. Interpretazione del test F Dopo aver calcolato F e identificato i df, puoi: Trovare ilSe p < 0.05 p-value , si rifiuta l’ipotesi nulla → almeno un gruppo associato (di solito fornito da SPSS, JASP, R) è significativamente diverso 🧩 4. In psicometria, questo serve a: Verificare differenze nei punteggi ai test tra gruppi (es. clinici vs non clinici) Analizzare sperimentali) item di un test in base a gruppi (età, genere, condizioni Valutare se un una variabile cognitiva o emotiva modello di regressione o di ANOVA è significativo nel predire
🧩 Esempio pratico: Stai studiando l'effetto di tre tipi di intervento mnemonico sul punteggio a un test. Gruppi: A, B, C → k = 3 Allora:^ ^ Totale soggetti: 45 → N = 45 df1=3−1=2df_1 = 3 - 1 = 2df1=3−1= Il software ti restituisce:^ ^ df2=45−3=42df_2 = 45 - 3 = 42df2=45−3= F(2, 42) = 4. 👇 Il modello è significativo (p < .05) →^ ^ p = 0.014 almeno un gruppo ha un effetto diverso sul punteggio. 🧩 Riepilogo finale
Ambito Esempio pratico Convergenza tra strumenti Valutare se punteggi di un nuovo test si correlano a uno già validato Modelli teorici Testare relazioni ipotizzate da teorie psicologiche 🧩 4. Indicatori chiave Indicatore Significato R² Percentuale di varianza spiegata dal modello (es. R² = 0.45 → il 45% della varianza in Y è spiegata da X) Coefficiente β Indica la forza e direzione della relazione tra X e Y p-value Se p < 0.05, il coefficiente è statisticamente significativo Standard error Indica quanto è precisa la stima di β Intervallo di confidenza Se non include 0, il coefficiente è significativo
🧩 Includi 5. Regressione multipla in psicometria più predittori per valutare il contributo relativo di ciascuno: Y=β0+β1X1+β2X2+ beta_nX_n + \varepsilonY=β0⋯+βnXn++β1εY = \beta_0 + \beta_1X_1 + \beta_2X_2 + \dots + \X1+β2X2+⋯+βnXn+ε Esempio: Prevedere la depressione (YYY) in base a punteggi su ansia, supporto sociale e autostima (X1,X2,X3X_1, X_2, X_3X1,X2,X3)
⚠️ 6. Assunzioni del modello (da verificare sempre!)
🧩 7. Esempio pratico in ambito psicometrico
Vuoi vedere se il punteggio a un test sull’ansia predice i risultati a un compito di attenzione. YYY: punteggio al compito di attenzioneXXX: punteggio al test d’ansia Hai questi risultati: 👇 Interpretazione:^ ^ β1=−0.42\beta_1 = -0.42β1=−0.42,^ p = 0.004 ,^ R² = 0. La relazione è negativa (più ansia → peggiori performance) ÈIl test d’ansia statisticamente significativa spiega il 18% della variabilità nelle prestazioni attentive
🧩 8. Confronto con altri strumenti Rispetto alla correlazione cambia Y in base a X (non solo che sono associate), la regressione ti dice quanto e in che direzione È alla base di modelli più complessi come: o Regressione logistica (per variabili categoriali) o Modelli a equazioni strutturali (SEM) o Analisi dei percorsi (path analysis) La automatica regressione lineare a step (o stepwise regression) usata per selezionare le variabili indipendenti più rilevanti è una procedura in un modello di regressione. È particolarmente utile in psicometria quando hai molti predittori e vuoi capire quali contribuiscono davvero alla spiegazione della variabile dipendente. 🧩 È una 1. Cos'è la regressione a step? tecnica iterativa che costruisce il modello aggiungendo o rimuovendo variabili una alla volta, sulla base della loro significatività statistica. 🧩 2. Tipi di regressione a step Tipo Descrizione breve Forward selection Parte da zero → aggiunge una variabile alla volta, scegliendo quella che migliora di più il modello Backward elimination Parte dal modello completo → rimuove la variabile meno significativa a ogni passo
🧩 6. Quando usarla in psicometria Per costruire modelli predittivi a partire da molti item o fattoriNella selezione automatica di predittori da questionari complessi Come analisi esplorativa (ma andrebbe poi validata con dati indipendenti!) 🧩 Riepilogo Vantaggi Svantaggi Automatizza la selezione Ignora il contesto teorico Utile con molti predittori Può portare a modelli instabili Fornisce modelli più parsimoniosi Sensibile ai dati specifici del campione In stabilisce un psicometria valore soglia , la determinazione delle soglie su uno strumento di misura (es. test, questionario) per (o cut-off ) è il processo con cui si
🧩 1. A cosa serve una soglia in psicometria? Serve a indicare qualcosa di significativo. decidere quando un punteggio è sufficientemente alto o basso da Esempi: Soglia diSoglia di cut-offinclusione in un test di depressione → identifica probabili casi clinici in un intervento cognitivo → esclude chi ha prestazioni adeguate Soglia in test cognitivi per l’ all’età identificazione del declino patologico legato
🧩 2. Come si determinano le soglie? 🧩 a. Distribuzione statistica dei punteggi Percentili : es. soglia al 90° percentile = i punteggi sopra quel valore sono considerati “alti” Deviazioni standard funzionamento deficitario: es. un punteggio < -1.5 DS dalla media può indicare un
Punteggio sotto 77.5 → possibile deficit
🧩 b. Analisi ROC (Receiver Operating Characteristic) Metodo esterno molto usato (es. diagnosi psichiatrica) per trovare il in psicometria clinica. Si confronta lo strumento con un cut-off ottimale. criterio Costruzione della curva ROC: si confrontano valori soglia sensibilità e specificità per vari Si sceglie il punto che ottimizza entrambi (es. usando l’indice di Youden ) Indice text{Sensibilit di Youden=Sensibilitaà} + \text{Specificitˋ+Specificitaà} - 1Indiceˋ−1\text{Indice di Youden} = \ di Youden=Sensibilitaˋ+Specificitaˋ−
🧩 c. Criteri teorici o clinici In alcuni casi, le soglie sono definite da: Linee guida cliniche (es. punteggi BDI ≥ 20 = depressione moderata) Consensus tra esperti Validazioni precedenti di quello strumento 🧩 3. Esempio pratico Usi il Beck Depression Inventory (BDI) : Punteg gio Interpretazione 0–13 Assenza/minima depressione 14–19 Depressione lieve 20–28 Moderata 29–63 Grave Le soglie qui sono diagnosi. clinicamente validate e aiutano nella classificazione e nella
⚠️ 4. Cosa considerare quando si fissano soglie Contesto clinico o educativo da una soglia per “diagnosi” : una soglia per “intervento” può essere diversa Tipo di strumento : test normativi vs test criteriali Conseguenze pratiche : rischio di falsi positivi o falsi negativi