Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica: Teoria e Metodi - Prof. Benassi, Appunti di Psicometria

Una panoramica della teoria e dei metodi della statistica, inclusi i concetti di probabilità, l'errore statistico, la falsificazione di ipotesi, la significatività, la distribuzione normale, il t-test, il test del chi-quadro, l'analisi della varianza e la regressione lineare. Come applicare questi metodi per analizzare dati e rispondere a questioni empiriche.

Tipologia: Appunti

2019/2020

In vendita dal 26/05/2024

laetfrt
laetfrt 🇮🇹

28 documenti

1 / 26

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistica psicometrica
La psicometria è una parte della Psicologia, è la branca che si occupa di creare strumenti di misura e di
ricerca.
Definire le caratteristiche del metodo scientifico per distinguere le teorie scientifiche da quelle non
scientifiche.
Metodo scientifico:
- sottoposto a continue revisioni, soggetto a cambiamenti non è privo di errore;
- basato sulla logica;
- basato sulla misura dell’esperienza le leggi devono avere un fondamento nella realtà empirica;
- l’errore viene stimato attraverso tecniche statistiche (controllare le diverse fonti di variabilità che
caratterizzano i diversi fenomeni che si vogliono studiare).
Conoscere = misurare [associare alcune caratteristiche del fenomeno di studio (sistema empirico) a un
sistema di unità di misura (sistema numerico) mettere in relazione alcune proprietà degli eventi che
osserviamo con le proprietà dei numeri]. Riferirsi ad un sistema numerico che ha certe proprietà.
Cosa serve a definire lo strumento di misura?
Definizione teorica: costrutto = teoria operazionalizzabile, ovvero divisibile in parti o componenti misurabili
che stanno in relazione tra loro secondo relazioni specifiche. Un fenomeno può essere definito teoricamente
in diversi modi, ogni definizione teorica deve poter comprendere aspetti misurabili del fenomeno.
Strumento adatto: oggetto di misura.
- Uso della letteratura precedente;
- Conferenze;
- Scambi con altri ricercatori (scambio = veicolo + importante per capire qual è lo strumento migliore).
Isomorfismo: termine usato per definire la relazione tra il fenomeno e la sua misura due sistemi devono
aver rappresentate le stesse componenti e le stesse relazioni tra le componenti.
I fenomeni psicologici sono fenomeni empirici misurabili, quando se ne misura uno si stabilisce una
relazione tra esso e le sue componenti e lo strumento di misura e le sue componenti. Ci si aspetta che,
attraverso lo strumento, si possano rappresentare tutte le componenti del fenomeno, con le stesse
caratteristiche e relazioni (se così non fosse allora lo strumento sarebbe inadeguato). Questa condizione è
detta isomorfismo.
Tutti i fenomeni psicologici passano attraverso la teoria della misurazione = permette di valutare l’errore di
misura, cioè l’errore nel processo conoscitivo. Nel momento in cui una teoria è definita come non misurabile,
non può essere verificabile (perché non si può misurare l’errore) e di conseguenza non è considerabile
scientifica.
La logica formale o aristotelica è sufficiente per determinare la scientificità delle teorie poiché non considera
la verifica sperimentale. Stabilisce quali sono le connessioni tra le proposizioni che possono essere
considerate vere, ma non presuppone la necessità di una verifica.
Fa parte del ragionamento scientifico, ma non è il suo fondamento.
Gli strumenti in psicologia sono in continua revisione la conoscenza tende alla verità, ma non la
raggiunge mai appieno.
La mente umana e il contesto in cui agisce e si sviluppa sono in continuo cambiamento;
Gli strumenti devono adattarsi al cambiamento dell’oggetto di misura;
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a

Anteprima parziale del testo

Scarica Statistica: Teoria e Metodi - Prof. Benassi e più Appunti in PDF di Psicometria solo su Docsity!

Statistica psicometrica

La psicometria è una parte della Psicologia, è la branca che si occupa di creare strumenti di misura e di

ricerca.

Definire le caratteristiche del metodo scientifico per distinguere le teorie scientifiche da quelle non

scientifiche.

Metodo scientifico:

  • sottoposto a continue revisioni, soggetto a cambiamenti → non è privo di errore;
  • basato sulla logica;
  • basato sulla misura dell’esperienza → le leggi devono avere un fondamento nella realtà empirica;
  • l’errore viene stimato attraverso tecniche statistiche (controllare le diverse fonti di variabilità che

caratterizzano i diversi fenomeni che si vogliono studiare).

Conoscere = misurare [associare alcune caratteristiche del fenomeno di studio (sistema empirico) a un

sistema di unità di misura (sistema numerico) → mettere in relazione alcune proprietà degli eventi che

osserviamo con le proprietà dei numeri]. Riferirsi ad un sistema numerico che ha certe proprietà.

Cosa serve a definire lo strumento di misura?

Definizione teorica: costrutto = teoria operazionalizzabile, ovvero divisibile in parti o componenti misurabili

che stanno in relazione tra loro secondo relazioni specifiche. Un fenomeno può essere definito teoricamente

in diversi modi, ogni definizione teorica deve poter comprendere aspetti misurabili del fenomeno.

Strumento adatto: oggetto di misura.

  • Uso della letteratura precedente;
  • Conferenze;
  • Scambi con altri ricercatori (scambio = veicolo + importante per capire qual è lo strumento migliore).

Isomorfismo : termine usato per definire la relazione tra il fenomeno e la sua misura → due sistemi devono

aver rappresentate le stesse componenti e le stesse relazioni tra le componenti.

I fenomeni psicologici sono fenomeni empirici misurabili, quando se ne misura uno si stabilisce una

relazione tra esso e le sue componenti e lo strumento di misura e le sue componenti. Ci si aspetta che,

attraverso lo strumento, si possano rappresentare tutte le componenti del fenomeno, con le stesse

caratteristiche e relazioni (se così non fosse allora lo strumento sarebbe inadeguato). Questa condizione è

detta isomorfismo.

Tutti i fenomeni psicologici passano attraverso la teoria della misurazione = permette di valutare l’errore di

misura, cioè l’errore nel processo conoscitivo. Nel momento in cui una teoria è definita come non misurabile,

non può essere verificabile (perché non si può misurare l’errore) e di conseguenza non è considerabile

scientifica.

La logica formale o aristotelica è sufficiente per determinare la scientificità delle teorie poiché non considera

la verifica sperimentale. Stabilisce quali sono le connessioni tra le proposizioni che possono essere

considerate vere, ma non presuppone la necessità di una verifica.

Fa parte del ragionamento scientifico, ma non è il suo fondamento.

Gli strumenti in psicologia sono in continua revisione → la conoscenza tende alla verità, ma non la

raggiunge mai appieno.

− La mente umana e il contesto in cui agisce e si sviluppa sono in continuo cambiamento;

− Gli strumenti devono adattarsi al cambiamento dell’oggetto di misura;

− I metodi di validazione cambiano, quindi, strumenti che una volta venivano considerati validi

possono non risultarlo più.

[Intelligenza: capacità di comprendere e risolvere problemi attraverso il riconoscimento e l’organizzazione di

nessi tra oggetti e/o eventi dell’esperienza. Esistono diversi tipi di abilità intellettive specifiche controllate da

abilità di livello più generale, collegate fra loro e assimilabili ad un unico fattore generale o Fattore g.

Matrici progressive di Raven = strumenti per la misurazione del Fattore g (componente dell’intelligenza),

richiede principalmente la deduzione di relazioni tra elementi astratti. Il compito richiede di indovinare, tra

più alternative, quale parte completa la matrice visuo-spaziale rappresentata.

Processi cognitivi del Fattore g:

− Velocità di elaborazione delle informazioni;

− Funzioni esecutive;

− Attenzione controllata;

− Metacognizione;

− Memoria a lungo termine;

− Memoria a breve termine;

− Memoria di lavoro;

− Expertise.

Attenzione, elaborazione e pianificazione sono i processi cognitivi implicati nelle CPM.

Componente cristallizzata = manifestazioni legate ad apprendimenti culturali.

Componente fluida = il fattore g o super-capacità.]

Errori di misura:

− E. controllabili = sono dovuti al grado di conoscenza ed esperienza del ricercatore.

− E. sistematici = direzionali, teorici, strumentali o personali;

− E. non eliminabili = sono dovuti a cause irriconoscibili o alla casualità.

− E. asistematici = aleatori, dovuti alla casualità.

Gli errori si misurano attraverso la statistica, che discrimina la parte vera e la parte dovuta alla casualità

(errori controllabili ed errori non eliminabili).

Controllo dell’errore di misura:

− Metodi = controllo della precisione e affidabilità degli strumenti;

− Stima dell’errore = valutazione dell’apporto della casualità attraverso calcoli probabilistici.

Logiche dimostrative usate in psicologia:

LOGICA FREQUENTISTA o FISHERIANA o NHST (Null Hypothesis Significance Testing);

LOGICA FALSIFICAZIONISTA → Karl Popper

Criterio della demarcazione: è scientifica ogni teoria che può essere confutabile , ovvero quella che

nella sua formulazione logica permette la possibilità di essere falsificata.

La ricerca scientifica non inizia dall’osservazione, ma dai problemi che sono risolti attraverso la

dimostrazione empirica. La scienza avanza per tentativi ed errori.

Quando una teoria non prevede l’errore ma si propone come verità assoluta, non può essere

confutabile ovvero falsificabile. Accade quando: c’è una scarsa precisazione nella definizione delle

relazioni e della misura delle parti che la compongono, la teoria è incompleta o troppo complessa.

Dimostra che le differenze o le relazioni tra eventi non sono dovute al caso, ma sono attribuibili alle

differenze studiate.

Nella logica falsificazionista per ogni tipo di esperimento si stabilisce come ci si aspetta che si

distribuisca il caso.

Significatività (p) = probabilità di commettere un errore di I tipo (si respingere H0 quando essa

è vera ). Si stabilisce a priori quale probabilità di errore consideriamo accettabile per la verifica

(livello di significatività deciso dalla comunità scientifica 0.05 =5% o 0.01 =1%). A seconda di

quanto è la significatività si respinge (se p>0.05/0.01) o si accetta H0 (se p<0.05/0.01).

Il ricercatore sulla base dell’ipotesi decide di usare un test unidirezionale o bidirezionale.

Nel test unidirezionale la regione di rifiuto si trova in una sola coda della distribuzione (p<0.05),

mentre nel test bidirezionale la regione di rifiuto è divisa nelle due code della distribuzione

(p<0.025 per ogni coda).

Potenza di un test = probabilità di non respingere H0 quando essa è falsa , cioè la probabilità che

il ricercatore non commetta un errore di II tipo.

È data dal valore complementare all’errore di II tipo: 1 - β.

Maggiore è la potenza, maggiore è la probabilità di falsificare H0 nel caso in cui sia falsa.

Dipende da diversi fattori:

- Limite di significatività (più alto = più probabilità di falsificare = più potenza); - Minima differenza apprezzabile (più grande l’unità di misura = più differenza = meno fatica

nel trovare le differenze);

- Numerosità del campione (più grande il campione = più grande la potenza); - Varianza casuale (alta varianza casuale = diminuzione potenza).

Limiti della logica falsificazionista:

  1. Si falsifica l’ipotesi nulla non sulla base di una sua bassa probabilità, ma sulla base della bassa

probabilità dei dati se fosse vera l’ipotesi nulla. Non si rifiuta l’ipotesi nulla perché poco

probabile, ma perché, se fosse vera, sarebbe poco probabile ottenere risultati come quelli avuti

nell’esperimento.

  1. Spesso i ricercatori ritengono i risultati dei loro esperimenti interessanti anche, e a volte

soprattutto, per i risultati non significativi, erroneamente interpretati come dimostrazione di non

differenza. Un risultato non significativo è da considerare semplicemente come una non

dimostrazione dell’ipotesi di partenza.

Nonostante le critiche, non sono ancora stati prodotti test statistici alternativi.

− LOGICA BAYESIANA

La probabilità è definita come il grado di fiducia sul verificarsi di un evento. Il suo valore si

modifica rispetto a una probabilità a priori in funzione dei risultati sperimentali.

La coerenza è garantita dal rispetto degli assiomi sulla probabilità.

Due teorie:

- Soggettiva = la probabilità a priori viene stimata in base alla fiducia del soggetto sul

verificarsi dell’evento.

- Oggettiva = la probabilità a priori viene stimata oggettivamente in base alle conoscenze sul

fenomeno. Parte dalle stesse assunzioni della teoria soggettivista, ma il grado di

informazione deve avere un valore oggettivo e lo si affida agli esperti o all’ignoranza.

Legge della probabilità condizionata , Teorema di Bayes (probabilità di A essendo avvenuto B).

Nel caso in cui si abbia una stima preliminare di probabilità del verificarsi di un evento e quindi se si

hanno nuove informazioni su esso si può ottenere la probabilità a posteriori dell’evento.

→ permette di correggere una probabilità alla luce delle nuove informazioni sull’evento.

Il teorema di Bayes è una semplice formulazione matematica per il calcolo della probabilità

condizionata che afferma che la probabilità di A dato B è proporzionale alla probabilità di B dato A.

I due approcci (falsificazionista e bayesiana) si basano sul concetto di probabilità.

PROBABILITÀ (esistono diverse definizioni):

Tautologica = dato un insieme di eventi equiprobabili, la probabilità di un evento è data dal numero di

eventi favorevoli diviso il numero di eventi possibili → usa il concetto di probabilità per definirla.

Frequentista = la probabilità di un evento è la frequenza con cui esso si presenta in un numero molto

elevato di prove.

Questa definizione fa riferimento alla legge dei grandi numeri: al crescere del numero delle prove la

probabilità che la differenza fra p di E e la frequenza di E diventi molto piccola, tende a 1.

Assiomatica = la probabilità è definita dai suoi assiomi , ovvero delle regole che ne determinano il

funzionamento (assiomi = regole da accettare come vere senza bisogno di dimostrazioni).

Soggettiva = la probabilità di un evento E è la misura del grado di fiducia che un individuo coerente

attribuisce, secondo le sue informazioni, all’avverarsi di E.

( Coerenza: disponibilità dell’individuo ad attribuire a non-E, cioè al suo complementare, il valore 1-p.)

[Paradosso di Bertrand: calcolare la probabilità di trovare una corda casuale di una circonferenza più

lunga del lato del triangolo equilatero iscritto → diverse soluzioni a seconda delle informazioni.]

PROPRIETÀ DELLA PROBABILITÀ

La probabilità di un evento impossibile è zero. Non vale la proposizione inversa: se la probabilità è 0

l’evento non è necessariamente impossibile.

La probabilità di un evento certo è uno. Non vale la proposizione inversa: se la probabilità è 1 l’evento

non è necessariamente certo.

Probabilità condizionata: probabilità che avvenga A essendo avvenuto B → p(A|B).

Eventi indipendenti: A e B sono indipendenti quando l’avverarsi di uno non influenza l’avverarsi

dell’altro p(A|B) = p(A)

Eventi disgiunti: A e B sono eventi disgiunti se il verificarsi dell’uno esclude il verificarsi dell’altro.

Evento prodotto: evento in cui si verifica sia A che B → p(A&B) = p(A) x p(B|A).

Se A e B sono indipendenti p(A&B) = p(A) x p(B).

Evento somma: evento in cui si verifica A o B o, se non sono disgiunti, entrambi

p(A+B) = p(A) + p(B) - p(A&B).

Evento complementare: evento in cui non si verifica A → p(Ā) = 1- p(A).

Due approcci paralleli:

STATISTICA INFERENZIALE

Punto di partenza = teoria → ipotesi che si dimostra tramite l’esperimento.

Scopo = - Dimostrare vera l’ipotesi.

  • Dimostra se l’idea scientifica è considerabile “vera”, cioè accettabile dal punto di vista scientifico.
  • Saggia l’influenza di fattori sul funzionamento del fenomeno.
  • Prevede l’andamento e il comportamento dei fenomeni.

Riguarda concetti generali: dai risultati dell’esperimento prodotto in laboratorio o sul campo intende

proporre leggi di funzionamento generali valide per l’intera popolazione.

STATISTICA DESCRITTIVA

- Gli elementi dell’insieme sono, oltre che categorizzati, ordinati gerarchicamente seguendo una

relazione di asimmetria.

- È possibile mettere i punteggi in ordine dal più grande al più piccolo, ma non è possibile

quantificare la distanza fra gli elementi.

- La proprietà dei R corrispondente è l’ ordinalità. - Le operazioni statistiche possibili sono il calcolo delle frequenze e i test non parametrici.

SCALE A INTERVALLI :

- Oltre alla categorizzazione e alla gerarchizzazione si aggiunge anche la definizione della distanza

tra ogni elemento dell’insieme.

- C’è una costanza degli intervalli fra le diverse classi (cioè tra la distanza ). - Non viene definito lo zero assoluto, perché è una scala inventata dallo sperimentatore e zero è

quindi un valore arbitrario. Con queste scale sono possibili solo le operazioni di somma e

sottrazione.

- È possibile usare test statistici parametrici, nonostante lo zero non sia definito.

SCALE A RAPPORTO :

- Alla categorizzazione, gerarchizzazione e la costanza tra le classi è definito un valore di zero

assoluto non arbitrario.

- In questo caso sono applicabili le operazioni matematiche di moltiplicazione e divisione (ad

esempio si può calcolare la media).

- È possibile usare test statistici parametrici.

Scegliere tabelle e grafici:

  1. Decidere se i dati sono sotto forma di categorie nominali o numerici (punteggi).

  2. Evitare le variabili che ammettono diversi tipi di risposta in contemporanea.

I dati nominali mostrano la frequenza , cioè il numero di volte che la variabile si presenta nei dati.

La caratteristica principale delle tabelle e dei grafici di variabili nominali è che devono mostrare le frequenze

dei casi in ogni categoria considerata. Il compito non è comunicare tutti i dettagli possibili, ma evidenziare le

principali tendenze.

Nel tracciare le tabelle di frequenza è necessario elencare le categorie scelte e la frequenza dei casi

corrispondente ad ognuna di essa. Le frequenze possono essere espresse anche in frequenze percentuali ,

cioè la percentuale sul totale delle frequenze (o sul numero totale di casi).

A volte è preferibile trasformare le tabelle di frequenza in grafici a torta o a barre che sono facili da

comprendere.

Per costruire un grafico a torta si devono trasformare le frequenze in frequenze percentuali; si moltiplica

ogni frequenza percentuale per 3,6 ottenendo l’angolo della fetta corrispondente nel grafico. L’importante è

mantenere un numero ridotto di fette in modo che il grafico sia chiaro e immediato, per questo può essere

necessario accorpare insieme le categorie poco frequenti.

Nei grafici a barre le altezze delle barre rappresentano la frequenza (il numero di casi) di una categoria e

permettono di individuare velocemente le principali tendenze dei dati.

I dati numerici rappresentano l’assegnazione di un valore numerico in una misurazione.

La considerazione cruciale nel decidere quale tabella o grafico usare per le variabili quantitative riguarda il

numero dei diversi valori registrati per la variabile in esame.

Nei grafici/tabelle di frequenza , spesso, al fine di permettere una tabulazione più efficace, alcuni punteggi

possono essere raggruppati in fasce.

Molte variabili psicologiche hanno un range più piccolo di valori numerici, quindi, è abbastanza comune

usare domande con un numero limitato e predeterminato di risposte (es: item con risposta su scala Likert, che

va da molto d’accordo a molto in disaccordo).

Un istogramma è simile ad un grafico a barre, ma siccome rappresenta differenti punteggi di una

misurazione su scala numerica, le barre sono unite e non separate (come dovrebbero essere se

rappresentassero diverse categorie).

Per presentare i dati in maniera semplice e facile da apprendere, talvolta è utile usare fasce di punteggi

anziché valori individuali.

Descrizione numerica delle variabili

Indici di tendenza centrale:

MEDIA

È calcolata sommando tutti i punteggi e dividendo per il loro numero, ha senso usarla solo se i dati sono

distribuiti in modo simmetrico (i numeri non sono troppo distanti tra loro).

Lo stesso risultato si ottiene calcolando il Valore Atteso (E), definito come la somma dei punteggi

moltiplicati ciascuno per la propria probabilità.

Caso discreto: calcolare la probabilità di un dato su infiniti valori.

Caso indiscreto: calcolare la funzione di probabilità di un dato delimitata in un certo intervallo.

MEDIANA

Punteggio centrale di una serie di punteggi ordinati dal più piccolo al più grande, esso separa a metà le

frequenze dei casi.

MODA

Punteggio che si verifica più frequentemente , il più comune.

Può essere applicata per ogni tipo di dato, non solo punteggi ma anche dati nominali.

Media, mediana e moda coincidono esattamente solo quando la distribuzione è perfettamente simmetrica; in

generale, la presenza di simmetria rende i calcoli maggiormente accurati.

Indici di variabilità:

RANGE

Fornisce un’idea dell’ampiezza dell’ intervallo di oscillazione dei dati (generalmente si calcola facendo la

differenza tra il valore più grande e quello più piccolo). Esso viene solitamente espresso come singolo

numero o come intervallo.

Uno dei problemi nell’uso di questo indice è che esso è pesantemente influenzabile dai casi estremi.

Il range interquartile considera solo il range attorno alla mediana (si divide la distribuzione in quarti e si

considera il range dei due quarti centrali, ignorando i quarti estremi).

DEVIAZIONE DALLA MEDIA

Scarti dalla media = differenza tra ciascun punteggio e la media (deviazioni/oscillazioni).

È calcolata usando la media di una serie di punteggi e valutando quanto ogni punteggi si discosti da tale

media. Tali deviazioni vengono poi sommate tra loro (ignorando i segni), ottenendo il totale delle deviazioni

dalla media e dividendolo per il numero dei punteggi → somma degli scarti divisa per il numero degli

scarti.

DISTRIBUZIONE DI PROBABILITÀ

Se la variabile è discreta la probabilità è calcolata per ogni valore x discreto della variabile.

La funzione di distribuzione si ottiene sommando le probabilità di tutti i casi aventi un valore inferiore ad x.

Se la variabile è continua si deve calcolare la probabilità di un intervallo di valori.

Non è possibile calcolare la probabilità per ogni valore, perché la probabilità di un singolo valore della

variabile è nulla, dal momento che la probabilità di un valore su infiniti valori possibili da problemi di

calcolo.

La funzione di distribuzione è la densità di probabilità e rappresenta la probabilità che il valore x sia

compreso tra due valori, cioè in un intervallo infinitesimo.

DISTRIBUZIONE UNIFORME (distr. di prob.)

È relativa ad una variabile discreta o continua in cui ogni valore ha la stessa probabilità di accadere.

DISTRIBUZIONE BINOMIALE (distr. di prob.)

Il risultato di una prova può essere il successo p o l’insuccesso q con uguale probabilità: p=q= 1 /.

La variabile in cui si usa questa distribuzione è dicotomica (può avere solo due valori ).

Se p=q=1/2 la distribuzione è simmetrica ( p e q sono equiprobabili).

È possibile calcolare la probabilità di un evento successo date le n prove 𝑝 =

1

2

𝑛

) dove (

𝑛!

𝑠!

( 𝑛−𝑠

) !

Se la probabilità di successo p è diversa dalla possibilità di insuccesso q , allora la distribuzione è

asimmetrica e q = 1-p.

La probabilità di successi è data da 𝑝 = 𝑝

𝑠

𝑖

𝑛

𝑠

) → la probabilità di successo moltiplicata per la probabilità

di insuccesso per n su s fattoriale.

In questo caso la media è data dal numero delle prove per la probabilità (media = np ).

La varianza, invece, è data dal numero delle prove per la probabilità di successo per la probabilità di

insuccesso (varianza = npq ).

Si ottiene una distribuzione cumulativa quando la distribuzione asimmetrica ha una curva di crescita molto

più veloce, perché all’aumento della variabile la probabilità aumenta più rapidamente. La probabilità di un

valore è data dalla sua probabilità sommata alla probabilità di tutti i casi precedenti. L’ultimo valore

comprende, quindi, il 100% di probabilità.

Per falsificare l’ipotesi nulla (H0) il numero di prove n è importante, perché se è insufficiente per

raggiungere il livello critico che permette di trovare i casi estremi, allora non sarà possibile falsificare H0 e,

di conseguenza, verificare la propria idea.

DISTRIBUZIONE GAUSSIANA - CURVA NORMALE

Rappresenta una distribuzione di variabili/punteggi continui che vanno da +INFINITO A - INFINITO, ha

forma simmetrica a campana e media, moda e mediana coincidono con il picco centrale.

È il limite della distribuzione binomiale : al crescere del numero delle prove tutte le distribuzioni tendono a

quella Gaussiana.

Sperimentalmente si chiama curva degli errori , perché essi si addensano attorno al valore centrale in modo

simmetrico, anche dal punto di vista teorico, se si rappresentano gli errori come somma dei contributi

positivi e negativi, al crescere di n la curva diventa normale.

Le condizioni per definire la curva normale una curva degli errori sono:

  • Considerare l’errore come somma di molte componenti di uguale ampiezza.
  • Le diverse componenti devono essere indipendenti tra loro.
  • Ogni componente deve essere positiva o negativa con uguale probabilità.

È la distribuzione di probabilità con la massima entropia , cioè riesce a rappresentare il disordine, perché

contiene al suo interno la probabilità di infiniti valori compresi tra +∞ e - ∞.

Per definire la funzione di una distribuzione normale sono necessarie la media e la varianza , perché esse

definiscono la forma della distribuzione.

La distribuzione N è indicata con N(μ,σ

2

): μ è la media e σ

2

la varianza.

Più grande è la varianza e più la curva è allargata e schiacciata, cioè c’è più dispersione attorno alla media e

maggior variabilità.

La densità di probabilità , cioè l’area sottesa dalla curva, è sempre 1 perché 1 è la totalità delle probabilità

della variabile.

La distribuzione cumulativa normale è una curva che divide esattamente a metà il piano xy e il cui

andamento è speculare al punto centrale di essa, c’è una simmetria.

Con la funzione di distribuzione normale si è in grado di stabilire la probabilità di ciascun valore presente nel

campione, ma anche le probabilità di tutti gli altri valori che il campione potrebbe avere, quindi, di tutte le

probabilità della popolazione di riferimento.

Con solo la media e la varianza, la funzione permette di prevedere l’andamento di tutta la popolazione

(che può avere infiniti valori).

Curve distorte = i principali parametri che si occupano delle distorsioni nella curva normale.

Skewness

Misura quanto la curva si discosta dall’andamento simmetrico, cioè l’ asimmetria della variabile.

Asimmetria = 0 → Skewness = 0 → curva normale.

Skew negativa : curva con un rapido decremento a destra e uno lento a sinistra.

Skew positiva : curva con un lento decremento a destra e uno rapido a sinistra.

Curtosi

Misura quanto la curva si discosta dalla ripidità della curva normale.

Curtosi = 0 → curva normale.

Curva piatta: troppo lenta a scendere verso i valori meno probabili.

Curva ripida: troppo rapida a scendere verso i valori meno probabili.

Altri modi per valutare la normalità della distribuzione: test di Shapiro-Wilk e test di Kolmogorov-

Smirnov.

Test che indicano quanto la distribuzione sperimentale è diversa dalla curva normale, sono basati sulla

significatività.

Non si deve trovare un risultato significativo, perché vuol dire che non c’è differenza tra la distribuzione dei

dati sperimentali e la distribuzione dell’ipotesi nulla (gaussiana).

La distribuzione gaussiana è teorica e il ricercatore cerca di fare in modo che le distribuzioni sperimentali

siano più vicine possibili a quella normale , perché in questo modo è possibile usare i parametri di media e

varianza per analizzare le variabili.

Per controllare la vicinanza alla curva gaussiana si devono controllare gli indici di Skewness e Curtosi (che

devono essere vicini allo 0) o quelli ottenuti dai test di Shapiro-Wilk e di Kolmogorov-Smirnov.

DISTRIBUZIONE NORMALE STANDARD

Ha le stesse caratteristiche di simmetria di una distribuzione normale, ma con maggior variabilità e al

crescere del numero delle prove tende alla normale.

DISTRIBUZIONE F

È data dal rapporto di due variabili χ

2

divise per i rispettivi gradi di libertà → può avere solo valori

positivi.

È utile per l’analisi/il confronto delle varianze.

Tipi di relazioni tra variabili

Tipo A = entrambe le variabili sono punteggi numerici

È possibile rappresentarle in un grafico xy. Se i punti sono disposti approssimativamente su una linea retta è

possibile rappresentare anche questa linea detta retta di regressione.

Tipo B = entrambe le variabili sono categorie nominali.

È possibile rappresentare le frequenze (percentuali) osservate sia in una tabella che in un grafico a barre o a

torta.

Tipo C = una variabile è nominale e l’altra è un punteggio numerico.

È possibile rappresentare la frequenza (relativa) dei diversi livelli della variabile attraverso istogrammi.

COEFFICIENTE DI CORRELAZIONE

È un indice numerico che esprime la relazione tra due variabili quantitative , che graficamente si

rappresenta con una retta di regressione , perché è il modello migliore e quello più semplice.

Esso indica quanto i punti del grafico di dispersione (i dati) sono vicini alla retta.

Mostra quanto è forte la relazione (entità) e la sua direzione, cioè se è positiva o negativa; il coefficiente è

positivo se la retta ha pendenza positiva e negativo se ha pendenza negativa.

Una correlazione esprime solo un’ associazione , non stabilisce di per sé una relazione causale.

Il coefficiente di correlazione può assumere un qualunque valore compreso tra:

- - 1 = valore estremo che indica la perfetta relazione fra le due variabili ma inversa , all’aumentare di

una l’altra diminuisce.

- +1 = valore estremo che indica la perfetta relazione diretta fra due variabili, all’aumentare di una

aumenta anche l’altra.

- 0 = indica indipendenza fra due variabili, il variare di una non influisce sul variare dell’altra.

COEFFICIENTE DI CORRELAZIONE DI PEARSON

È solitamente il coefficiente più appropriato se le variabili sono gaussiane.

Per calcolare il coefficiente di correlazione è necessario l’indice di covarianza , che esprime quanto le due

variabili cambiano insieme , quanto condividono in termini di variabilità (al variare di una, varia anche

l’altra).

La covarianza si ottiene sommando gli scarti di una misura dalla propria media moltiplicati per i

corrispondenti scarti dell’altra misura dalla sua media, diviso i gradi di libertà 𝑐𝑜𝑣

(𝑥,𝑦)

(𝑥−𝑥̅ )(𝑦−𝑦̅ )

𝑁− 1

Il coefficiente si calcola dividendo la covarianza per il valore massimo teorico della covarianza, che si ha

quando tutti i punti giacciono sulla retta 𝑟 =

𝑐𝑜𝑣 (𝑥,𝑦)

√𝑣𝑎𝑟 (𝑥) √𝑣𝑎𝑟 (𝑦)

Il coefficiente di correlazione deve essere compreso tra - 1 e +1, il suo segno (positivo o negativo) dipende

dal segno della covarianza.

Il coefficiente di determinazione esprime in termini assoluti la correlazione tra x e y, cioè il coefficiente di

correlazione.

Si indica con R

2

e si ottiene elevando al quadrato il coefficiente r → valori compresi tra 0 e 1.

I valori che R

2

può avere mostrano la quantità/ percentuale di varianza spiegata dalla relazione tra le

variabili (es: se R

2

= 0.9, allora la correlazione tra le variabili spiega il 90% della varianza delle variabili).

COEFFICIENTE DI CORRELAZIONE rho DI SPEARMAN

Si usa quando la variabile è quantitativa ma non gaussiana , quindi non è possibile calcolare i valori di

media e varianza.

Esso viene calcolato con la stessa formula del coefficiente di correlazione di Pearson.

Invece di usare i dati grezzi, che non sarebbero distribuiti in modo gaussiano, li trasforma in modo tale che

sia possibile calcolare medie e varianze.

I dati sono sostituiti dai ranghi , cioè da valori assegnati alla variabile che esprimono l’ordine dei valori della

variabile.

Si mettono in ordine crescente i punteggi di x e y , si associa a ciascun valore un rango : al punteggio più

piccolo di x è assegnato il rango 1, al secondo più piccolo il rango 2 e così via; al punteggio più piccolo di y è

assegnato il rango 1, al secondo più piccolo il rango 2 e così via.

Se ci sono due punteggi uguali il rango è la media dei ranghi che avrebbero avuto se fossero stati separati.

Si controlla non più il valore delle variabili ma l’ordine, per questo il rho di Spearman è meno informativo

del r di Pearson.

L’analisi della correlazione serve quindi a misurare la forza e la direzione della relazione tra le due variabili

quantitative. Se le variabili sono gaussiane si usa il coefficiente r di Pearson (test parametrico), se non sono

gaussiane si usa il coefficiente rho di Spearman (test non parametrico).

CAMPIONE E POPOLAZIONE

La significatività statistica permette di fare delle inferenze, cioè di generalizzare il risultato dell’esperimento

alla popolazione.

Per popolazione si intende l’insieme di tutti i punteggi di una variabile.

Per campione si intende una parte ridotta della popolazione che permette di fare esperimenti.

Esistono molte tecniche di randomizzazione del campione , le due più usate sono:

  • L’estrazione del nome del soggetto dall’urna in cui sono stati riposti tutti i nomi dei possibili oggetti;
  • L’assegnazione di un numero a ciascun soggetto e l’estrazione di un numero casuale.

Estraendo da una popolazione un numero elevato di campioni tutti della stessa numerosità n , si nota che:

- La media ottenuta dal campione è sufficientemente adeguata a generalizzare il risultato, quindi è una

buona stima della media della popolazione.

- Il 95% delle medie dei campioni sta in un intervallo chiamato intervallo di confidenza. È una misura

dell’oscillazione casuale attorno al parametro che consente di generalizzare i dati.

- Il 95% dell’intervallo di confidenza offre l’intervallo delle medie dei campioni che occupa il 95%

intermedio della distribuzione delle medie dei campioni.

- All’ aumento della numerosità dei singoli campioni, le medie dei campioni si avvicinano alla media

delle medie, mentre diminuisce la variabilità della stima della media e gli intervalli di confidenza sono

più piccoli (meno oscillazione casuale).

SIGNIFICATIVITÀ dei COEFFICIENTI di CORRELAZIONE

Il coefficiente di correlazione , come tutti i parametri statistici stimati su un campione, è caratterizzato da

variabilità casuale.

L’ errore standard deve fare riferimento ad entrambi i gruppi e, dal momento che le numerosità potrebbero

essere diverse, esso deve essere bilanciato tra le due numerosità.

Per cui è dato dalla somma degli errori standard stimati sui singoli gruppi, quindi, il rapporto tra la somma

delle deviazioni standard e la radice quadrata della numerosità.

I gradi di libertà sono dati dalla somma dei gradi di libertà dei due campioni meno 2 (N 1

+ N

2

Se il valore ottenuto di t supera il limite indicato nella tabella di significatività in corrispondenza dei gradi

di libertà ( n- 2 ) si ritiene che la differenza tra le due medie sia statisticamente significativa quindi è

possibile falsificare H0 (t=0) e dimostrare H1.

Alla fine del t test si stabilisce l’esistenza della differenza tra i due gruppi, la sua grandezza e direzioni.

T test per punteggi correlati, dipendenti o appaiati

Si usa per confrontare le medie di uno stesso campione (sul quale sono state fatte due misurazioni) o le

medie provenienti da campioni correlati tra loro.

H1 è che le medie siano diverse , mentre H0 che siano uguali, cioè che la loro differenza sia zero.

𝑚𝑒𝑑𝑖𝑎 𝑑𝑒𝑙𝑙𝑒 𝑑𝑖𝑓𝑓𝑒𝑟𝑒𝑛𝑧𝑒

𝑒𝑟𝑟𝑜𝑟𝑒 𝑠𝑡𝑎𝑛𝑑𝑎𝑟𝑑 𝑑𝑒𝑙𝑙𝑒 𝑑𝑖𝑓𝑓𝑒𝑟𝑒𝑛𝑧𝑒

In questo t test si deve tener conto dell’appaiamento di dati, quindi, per prima cosa si calcolano le differenze

tra i punteggi di ogni coppia.

Poi si fa la media tra le differenze e la si divide per l’errore standard.

La deviazione standard delle differenze non è più relativa alla numerosità delle due prove, ma i gradi di

libertà sono dati dal numero delle coppie - 1.

Per cui l’errore standard è dato dal rapporto tra la radice quadrata della somma dei quadrati degli scarti e i

gradi di libertà (cioè la deviazione standard) fratto la radice quadrata della numerosità.

Nel t test dati appaiati siccome si misurano sempre gli stessi soggetti, c’è una sola fonte di variabilità.

Inoltre, nella formula dell’errore standard si ha a denominatore N-1 e non N- 2 (come nel caso del t test per

dati indipendenti), per cui la variabilità è minore e il valore del parametro elevato.

Per cui i t test per dati appaiati sono più potenti, cioè riescono con più facilità a falsificare H0.

Se il valore ottenuto di t supera il limite indicato nella tabella di significatività in corrispondenza dei gradi

di libertà ( n° coppie - 1 ) si ritiene che la differenza tra le due medie sia statisticamente significativa ,

quindi è possibile falsificare H0 (t=0) e dimostrare H1.

TEST DI LEVENE

Test usato per confrontare se i due gruppi hanno varianze omogenee tra loro, perché se le due varianze non

hanno la stessa entità non si possono comparare nel t test.

H1 è che le varianze dei gruppi sono significativamente diverse.

H0 è che le varianze dei gruppi sono uguali , che il loro rapporto sia pari a 1.

Se il test di Levene risulta significativo si esegue una correzione matematica che permette di correggere i

gradi di libertà per poter poi ricalcolare il parametro t.

TEST NON PARAMETRICI

Si applicano quando la variabile è qualitativa o quantitativa a distribuzione non gaussiana , quando le

variabili non consentono di calcolare i parametri di media e varianza.

Sono test meno potenti, ma più sicuri: quando si trovano delle differenze significative, esse sono grandi.

Test binomiale

Confronta se la probabilità di uno dei due valori di una variabile qualitativa dicotomica è diverso dall’altro.

Analisi della correlazione di Spearman

Trasforma i punteggi di variabili a distribuzione non gaussiana in ranghi e usa questi per calcolare la

correlazione tra variabili.

TEST DEL CHI-QUADRO

Misura l’ associazione tra variabili qualitative , si usa per dati relativi a variabili nominali (categorie) in cui

si calcolano le frequenze.

Le frequenze sono presentate in tabelle (dette di contingenza) in cui nelle righe si hanno i valori di una

variabile, nelle colonne i valori dell’altra variabile e nelle celle le combinazioni tra i valori di riga e quelli di

colonna.

H1 è che ci sia una relazione tra le variabili , che una variabile influisca sulla distribuzione delle frequenze

dell’altra.

H0 è che non ci sia una relazione, che le frequenze non sono influenzate dalla variabilità delle variabili,

quindi, che al cambiamento di una variabile l’altra mantiene le stesse proporzioni.

Le frequenze nella tabella sono espressione delle frequenze che si troverebbero nella popolazione generale,

con un certo margine di errore.

Per ottenere la stessa percentuale di frequenze per le due variabili, si calcolano le frequenze teoriche per

ogni cella: 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑧𝑎 𝑡𝑒𝑜𝑟𝑖𝑐𝑎 =

𝑡𝑜𝑡.𝑟𝑖𝑔𝑎 𝑥 𝑡𝑜𝑡.𝑐𝑜𝑙𝑜𝑛𝑛𝑎

𝑡𝑜𝑡𝑎𝑙𝑒 𝑔𝑒𝑛𝑒𝑟𝑎𝑙𝑒

Esse sono le frequenze che ci si aspetta nel caso in cui H0 sia vera , quindi, nel caso ci sia la stessa

proporzionalità nei totali di riga e di colonna.

La formula per calcolare il valore del chi-quadro è: 𝑥

2

( 𝑓𝑟𝑒𝑞.𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑡𝑒−𝑓𝑟𝑒𝑞.𝑡𝑒𝑟𝑜𝑐𝑖ℎ𝑒

)

2

𝑓𝑟𝑒𝑞. 𝑡𝑒𝑜𝑟𝑖𝑐ℎ𝑒

2

è dato dalla sommatoria delle differenze tra le frequenze sperimentali e quelle teoriche elevate al

quadrato, diviso le frequenze teoriche.

È un valore che esprime la distanza tra H0 e l’ipotesi sperimentale.

Più la differenza tra le frequenze è elevata e più la tabella del campione è significativamente diversa da

quella di H0.

Il risultato del chi-quadro va confrontato con la distribuzione chi-quadro per i gradi di libertà, si ottiene la

stima della significatività dell’esperimento, cioè quanto esso può essere considerato diverso da H0.

Il limite di falsificazione è in base ai gradi di libertà (tabella), se il valore del chi-quadro lo supera H0 è

falsificata , quindi, dal momento che c’è una relazione tra le due variabili, al cambiamento di una l’altra non

mantiene le stesse proporzioni.

I gradi di libertà nel calcolo del chi-quadro sono dati dal numero di combinazioni tra celle e colonne:

(numero di colonne - 1) x (numero di righe - 1).

Il test chi-quadro è un test approssimato i cui risultati sono attendibili solo se la numerosità delle singole

celle non è troppo ridotta. Nel caso di numerosità ridotta si ricorre all’uso della correzione di Yates.

Test del Segno

Usato per confrontare due serie di dati correlati al posto del t test per dati appaiati.

Il confronto si effettua sulle differenze fra seconda e prima prova, applicando la distribuzione binomiale

per valutare la diversità fra miglioramenti e peggioramenti.

ANALISI DELLA VARIANZA (ANOVA)

Serve al confronto tra varianze , dal punto di vista sperimentale è un test statistico che serve a confrontare

più gruppi , più condizioni sperimentali o più variabili dipendenti.

L’analisi della varianza può essere usata solo nel caso in cui le variabili dipendenti siano a distribuzione

gaussiana , perché su esse si deve calcolare la varianza.

È usato per controllare se la varianza del punteggio di un gruppo è significativamente maggiore rispetto alla

varianza del punteggio dell’altro gruppo.

H0 è che il rapporto tra le due varianze è pari a 1.

Il parametro F è dato dal rapporto tra varianze: 𝐹 =

𝑠𝑡𝑖𝑚𝑎 𝑑𝑒𝑙𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑎𝑔𝑔𝑖𝑜𝑟𝑒

𝑠𝑡𝑖𝑚𝑎 𝑑𝑒𝑙𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑖𝑛𝑜𝑟𝑒

La significatività del parametro F deve essere verificata tramite la consultazione di tabelle, per farlo è

necessario calcolare i gradi di libertà (numero totale dei casi del gruppo - 1).

ANOVA per confronto tra gruppi indipendenti

Serve a controllare se la variabilità dovuta ai gruppi contribuisce a spiegare la variabilità della variabile.

Il punteggio di ogni caso è la somma di una componente dovuta al gruppo (valore vero) e di una dovuta alla

variabilità soggettiva (errore causalità).

𝑠𝑡𝑖𝑚𝑎 𝑑𝑒𝑙𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 (𝑣𝑎𝑙𝑜𝑟𝑖 𝑣𝑒𝑟𝑖)

𝑠𝑡𝑖𝑚𝑎 𝑑𝑒𝑙𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 (𝑒𝑟𝑟𝑜𝑟𝑒− 𝑐𝑎𝑠𝑢𝑎𝑙𝑖𝑡à)

𝑆𝑆𝑄 𝑓𝑟𝑎 𝑖 𝑔𝑟𝑢𝑝𝑝𝑖 ⁄𝑔𝑑𝑙

𝑆𝑆𝑄 𝑖𝑛𝑡𝑒𝑟𝑛𝑎 𝑎𝑖 𝑔𝑟𝑢𝑝𝑝𝑖 ⁄𝑔𝑑𝑙

SSQ fra i gruppi = somma dei quadrati degli scarti dei gruppi.

Per valutare quanto la media dei gruppi si diversifica rispetto alla media generale (del campione), cioè

quanto i gruppi sono diversi tra loro.

Si ottiene attribuendo a ciascun soggetto il valore medio del suo gruppo e sottraendo questo valore alla media

generale.

Somma degli scarti fra la media di ciascun gruppo e le media generale elevati al quadrato.

Se c’è una differenza tra i gruppi:

  • più è grande e più c’è differenza tra la media di ogni gruppo e la media generale.
  • più è piccola e meno differenza c’è tra la media di ciascun gruppo e la media generale.

I gradi di libertà sono dati dal numero dei gruppi - 1.

SSQ interno ai gruppi = somma dei quadrati degli scarti interna ai gruppi.

È una stima della varianza errore , della variabilità casuale , cioè di quanto i dati sono diversi tra loro

indipendentemente dai gruppi.

Si ottiene calcolando le differenze tra il punteggio del soggetto e la media del gruppo.

Somma degli scarti fra i punteggi e la media del gruppo elevati al quadrato.

I gradi di libertà sono dati dal numero dei soggetti - numero dei gruppi.

Varianza totale = varianza dovuta ai gruppi + varianza dovuta ai soggetti (varianza errore).

Se il valore di F è maggiore del limite di significatività, indicato in una tabella, allora H0 è falsa.

Se F è maggiore di 1 , la variabilità dovuta ai gruppi è maggiore della variabilità dovuta ai soggetti , cioè

la variabilità è dovuta maggiormente alle differenze tra i gruppi rispetto alle differenze tra gli individui.

In caso ci siano più di due gruppi, l’analisi della varianza è usata al posto del confronto tra le singole medie,

perché nel confronto a due a due si avrebbe una stima sbagliata dell’errore casuale e perché non

consentirebbe di fare un’inferenza generale sull’esperimento.

Confronti multipli nell’ANOVA

Facendo un t test non si avrebbe una buona stima delle differenze dei singoli gruppi , anche l’analisi della

varianza fornisce significatività relativa alle differenze tra tutte le medie, perché non è possibile distinguere

quali medie differiscono significativamente dalle altre, per cui sono stati inventati i confronti multipli.

Sono test che applicano solo nel caso in cui i risultati del test della varianza sia significativo.

Ci sono due approcci distinti per valutare queste ulteriori descrizioni:

Confronti multipli o posthoc

Es: test di Bonferroni = si applica un t test e poi si fa una correzione (calcolo che corregge la

significatività).

Dal momento che aumentando il numero dei campioni si aumenta la stima dell’ errore alpha.

Se si stima tante volte la casualità quanti sono i confronti possibili, essa viene stimata tante volte , mentre

essa deve essere stimata solo una volta, perché è dovuta solo ad un esperimento.

Si corregge la significatività per la numerosità dei confronti , in questo modo, la soglia di significatività si

abbassa.

Scheffé = al posto del t test, calcola il parametro F relativo ai due gruppi pesandolo sulla numerosità dei

due gruppi.

Contrasti ortogonali - confronti pianificati

In questi test non si effettuano tutti i contrasti possibili, ma solo quelli che interessano l’ipotesi.

Sono chiamati ortogonali perché ogni confronto è matematicamente indipendente dagli altri.

Si pianificano i confronti da fare in modo che essi non contengano l’errore dovuto agli altri confronti.

In ogni confronto la somma degli scarti dovuta all’errore è conteggiata una volta sola.

Quindi, i confronti pianificati hanno una stima esatta della significatività , non hanno bisogno di correzioni.

Analisi della varianza per dati correlati o misure ripetute

Serve a confrontare delle condizioni sperimentali sugli stessi soggetti ( misure ripetute ) o misure effettuate

su campioni correlati.

L’analisi della varianza, rispetto al t test, può confrontare più di due condizioni ripetute.

Analizza situazioni in cui la variabile dipendente è quantitativa a distribuzione gaussiana , perché su essa

si devono calcolare media e varianza.

È un’analisi che permette di controllare meglio l’errore casuale , perché esso nelle misure ripetute è

calcolato come differenza tra i soggetti e non fa riferimento alle differenze di gruppo (perché non ci sono

gruppi).

Rispetto all’analisi della varianza per gruppi indipendenti ha un fattore di casualità in meno , quindi è un

test più potente , permette di trovare delle differenze anche quando queste sono più piccole.

La cosa importante è che quando questa analisi viene effettuata tutti i soggetti devono avere le stesse

ripetizioni , se un soggetto non ha una misurazione allora viene escluso.

H1 è che c’è una differenza tra le diverse misure ripetute, cioè se c’è un effetto dovuto alla ripetizione

sulla variabile dipendente.