Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Docsity AI

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Video Corsi

Preparati con lezioni e prove svolte basate sui programmi universitari!

Quiz

Rispondi a reali domande d’esame e scopri la tua preparazione

Docsity AINEW

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Maturità 2026

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

20 Punti

Per ogni documento caricato

Rispondi alle domande

5 Punti

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

Riassunto statistica psicometrica, Sintesi del corso di Statistica Psicometrica

Alma Mater Studiorum – Università di Bologna (UNIBO)Statistica Psicometrica

Prof. Mariagrazia Benassi

Si tratta delle domande fornite dalla prof, dalle quali lei attingerà all’esame con relative risposte.

Tipologia: Sintesi del corso

2019/2020

Caricato il 08/09/2021

valentina-vellani 🇮🇹

4.7

(9)

6 documenti

1 / 31

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

DOMANDE LOGICA FALSIFICAZIONISTA

1. Cosa è la significatività?

Per significatività si intende la probabilità di commettere un errore alfa,

ovvero un errore di I tipo per errore di I tipo si intende un falso

negativo, ovvero viene dimostrata falsa h0 (cioè l’ipotesi nulla) quando in

realtà è vera. Viene posto a priori un limite accettabile per i vari tipi di

errori= per l’errore alfa la soglia è del 5%, al di sotto del quale h1 (ipotesi

generale stabilita a priori) si dimostra vera. Se il dato preso in analisi si

trova al di sotto della soglia del 5% allora si farà un esperimento di

convalida, altrimenti di non convalida. Più la significatività è bassa e più

probabilità ci sono che venga dimostrata h1 senza commettere errori e

quindi la potenza è maggiore.

2. Cosa è l’ipotesi nulla?

L’ipotesi nulla è l’ipotesi complementare ad h1, la quale è invece l’ipotesi

che si vuole verificare. Per rendere vera h1, allora h0 deve essere

falsificata e per farlo sono usati i test statistici.

3. Come funziona la logica falsificazionista?

Secondo la logica falsificazionista, una teoria per essere controllabile e

quindi scientifica, deve essere confutabile. Essa parte dal presupposto che

l’ipotesi nulla sia vera e cerca di falsificarla dimostrando h1; si parte da

h0, poiché essa è unica, mentre di h1 ne esistono infinite.

4. Cosa sono gli errori alpha e beta?

Errore alphasi tratta di un falso negativo, ovvero viene falsificata h0

anche se in realtà è vera.

Errore beta si tratta di un falso positivo, poiché viene ritenuta e

dimostrata vera un h0 che in realtà è falsa.

5. Quali sono i limiti di significatività comunemente utilizzati e perchè

si usano tali limiti per la dimostrazione scientifica?

Come limiti di significatività vengono individuati il 5% (2,5% da un

estremo e 2,5 dall’estremo opposto), il quale supporta l’ipotesi falsificando

h0 si tratta, quindi, di risultati significativi, e il 95% supporta l’ipotesi

Scopri Sintesi del corso di Statistica Psicometrica Alma Mater Studiorum – Università di Bologna (UNIBO)

Documenti correlati

Statistica Psicometrica 2019/2020

(10)

Statistica Psicometrica

Statistica psicometrica - riassunto

Variabili (statistica psicometrica)

Appunti statistica psicometrica

dispense statistica psicometrica

Domande esame di Statistica Psicometrica

slide di statistica psicometrica

Dispensa completa Statistica psicometrica

Slides di statistica psicometrica

Appunti Statistica Psicometrica Benassi

(3)

domande statistica psicometrica Mariagrazia Benassi

(2)

Anteprima parziale del testo

Scarica Riassunto statistica psicometrica e più Sintesi del corso in PDF di Statistica Psicometrica solo su Docsity!

DOMANDE LOGICA FALSIFICAZIONISTA

Cosa è la significatività? Per significatività si intende la probabilità di commettere un errore alfa , ovvero un errore di I tipo  per errore di I tipo si intende un falso negativo, ovvero viene dimostrata falsa h0 (cioè l’ipotesi nulla) quando in realtà è vera. Viene posto a priori un limite accettabile per i vari tipi di errori= per l’errore alfa la soglia è del 5% , al di sotto del quale h1 (ipotesi generale stabilita a priori) si dimostra vera. Se il dato preso in analisi si trova al di sotto della soglia del 5% allora si farà un esperimento di convalida , altrimenti di non convalida. Più la significatività è bassa e più probabilità ci sono che venga dimostrata h1 senza commettere errori e quindi la potenza è maggiore.
Cosa è l’ipotesi nulla? L’ ipotesi nulla è l’ipotesi complementare ad h1, la quale è invece l’ipotesi che si vuole verificare. Per rendere vera h1, allora h0 deve essere falsificata e per farlo sono usati i test statistici.
Come funziona la logica falsificazionista? Secondo la logica falsificazionista , una teoria per essere controllabile e quindi scientifica, deve essere confutabile. Essa parte dal presupposto che l’ipotesi nulla sia vera e cerca di falsificarla dimostrando h1; si parte da h0, poiché essa è unica , mentre di h1 ne esistono infinite.
Cosa sono gli errori alpha e beta? Errore alpha si tratta di un falso negativo , ovvero viene falsificata h anche se in realtà è vera. Errore beta  si tratta di un falso positivo , poiché viene ritenuta e dimostrata vera un h0 che in realtà è falsa.
Quali sono i limiti di significatività comunemente utilizzati e perchè si usano tali limiti per la dimostrazione scientifica? Come limiti di significatività vengono individuati il 5% (2,5% da un estremo e 2,5 dall’estremo opposto), il quale supporta l’ipotesi falsificando h0 si tratta, quindi, di risultati significativi , e il 95% supporta l’ipotesi

nulla, poiché si tratta di risultati non significativi. I punteggi che si trovano nel 5% sono chiamati punteggi cut-off arbitrari , mentre quelli compresi nel 95% sono chiamati intermedi. Si usano questi limiti per la dimostrazione scientifica, poiché è l’unico modo di dimostrare per assurdo la teoria.

Cosa è la potenza? La potenza corrisponde alla probabilità di falsificare h0 , quando essa è realmente falsa quindi di non commettere l’errore beta. È, quindi, la probabilità che essendo l’ipotesi nulla falsa, io la riesca a falsificare. La potenza può essere calcolata sia a priori che a posteriori, attraverso la power analysis effettuata a priori si può calcolare la numerosità migliore affinchè si abbia un test sufficientemente potente, quindi che abbia una potenza circa dell’80%. La potenza dipende dal limite di significatività , infatti aumentando questo limite aumenterà anche la potenza. Dipende anche da diversi fattori: limite di significatività ( sarà più potente quel test che ha posto un limite di significatività più alto)+ minima differenza apprezzabile (se le differenze sono grandi allora più grande sarà la potenza del test) + numerosità del campione ( tanto più grande è il campione, tanto più si controlla la casualità e quindi sarà più grande la potenza del test) + varianza casuale (più bassa è la casualità più grande è la potenza del test).
Come sono legate potenza e significatività? Minore è la significatività, intesa come la probabilità di commettere un falso negativo, maggiore è la potenza del test.
Quali sono i limiti della logica falsificazionista? I limiti della logica falsificazionista sono:  La falsificazione di h0 non perché la sua ipotesi sia poco probabile , ma perché i miei dati sarebbero poco probabili se h0 fosse vera.  Vengono considerati significativi anche dati che non lo sono e vengono usati per falsificare.

Dare una definizione e spiegare l’utilizzo di media, varianza, moda mediana, quartili percentili, ranghi, deviazione standard Media = la media viene calcolata sommando tutti i punteggi e dividendo per il loro numero. La media ha senso se i dati sono distribuiti in modo simmetrico (ad esempio i dati gaussiani), altrimenti il significato statistico diventa diverso come nel caso della distribuzione bimodale. Mediana = è il punteggio centrale di una serie di punteggi ordinati dal più piccolo al più grande. Moda = è il punteggio che si verifica più frequentemente. Essa è l’unica misura che può essere applicata sia ai dati di tipo nominale che ai punteggi. Varianza = si tratta della misura di dispersione che considera tutti i punteggi; essa è legata alla variabilità. La varianza viene calcolata come la deviazione della media, ma ogni valore viene elevato al quadrato prima di essere sommato. Formula Quartili = si divide in 4 la distribuzione e si prendono i 2/4 centrali, per poi escludere i restanti 25% e da qui si possono calcolare gli outlier. Essi servono a valutare la variabilità dei dati. Percentili = è un metodo rapido per esprimere il punteggio di una persona rispetto alle altre. Si tratta di un tipo di distribuzione cumulativa. Ranghi = sono punteggi ordinati dal più piccolo al più grande a cui vengono assegnati dei ranghi partendo dal numero 1. Deviazione standard = è la quantità media della quale i punteggi differiscono dalla media essa viene misurata in modo relativo ai punteggi.
Quali sono le definizioni di probabilità? Esistono diverse definizioni: classica = dato un insieme di eventi equiprobabili la probabilità di un evento è data dal numero di eventi favorevoli : numero di eventi possibili. Questa definizione è però tautologica perché ha al suo interno il concetto di probabilità per definire la probabilità.

Def. Frequentista = la probabilità di un evento è la frequenza con cui esso si presenta in un numero elevato di prove. Questa definizione fa riferimento alla legge dei grandi numerial crescere del numero delle prove la probabilità che la differenza fra p di E e la frequenza di E diventi molto piccola tende ad 1. Def. Bayesiana = si può correggere la probabilità alla luce di nuove argomentazioni.

Cosa è la distribuzione di probabilità? È il modello che associa ad ogni valore della variabile un valore specifico di probabilità. Le variabili possono essere discrete o continue. La distribuzione di probabilità è l’insieme dei valori di probabilità che competono a ciascun valore della variabile. Funzione di distribuzione : funzione che rappresenta per ogni x la probabilità di ottenere un valore minore o uguale a x.
Quali sono le caratteristiche della distribuzione gaussiana o normale? Le caratteristiche della distribuzione gaussiana sono:

 Simmetrica

 Moda, media e mediana coincidono  Ha una massima entropia , ovvero è la distribuzione più casuale.  È definita da media e varianza  È la distribuzione binomiale al limite

Quali sono le caratteristiche della distribuzione z o normale standard? Si tratta di un tipo di distribuzione gaussiana particolare. Nella distribuzione z è possibile standardizzare i punteggi in modo da trasformarli in valori a media zero e varianza uguale a uno. Questa trasformazione permette di fare riferimento per tutti i punteggi a una sola curva normale, la curva z. Tutti i punteggi possono essere espressi in termini di deviazioni standard di cui si discostano dalla media il numero di deviazioni standard è

 È la distribuzione del rapporto fra le varianze di 2 campioni indipendenti

 Il confronto è basato sulle varianze campionarie

 Varia in base ai gradi di libertà  È la distribuzione di una variabile rapporto di due variabili x2 divise per i rispettivi gradi di libertà.

Cosa si intende per funzione di distribuzione? La funzione di distribuzione è la funzione cumulativa , la quale racchiude le informazioni di un fenomeno riguardanti la sua presenza o la sua distribuzione prima o dopo un determinato punto. Essa aggiunge i gradini dei dati precedenti a quelli successivi. Si tratta, quindi, della funzione che rappresenta per ogni x la probabilità di ottenere un valore minore o uguale a x.
Cosa si intende per densità di probabilità? È l’intervallo di valori entro cui si trova il valore di x di una distribuzione continua.
Che valori può assumere la probabilità? Essa viene espressa in decimali. La probabilità di un evento impossibile è 0 (valore di assenza di un evento che non è mai sperimentabile). Se però la probabilità è zero l’evento non è necessariamente impossibile. La probabilità di un evento certo è 1. Non si possono trovare probabilità più basse di 0 o più alte di 1.
Se a e b sono due eventi complementari e si conosce il valore di a, quale sarà il valore di b? Se ho a, non posso avere b, poiché due eventi sono complementari quando il verificarsi di uno esclude l’altro (uno dei due si verifica per forza). Posso solo dire che la probabilità di b è 1-p(a) ma non conosco il suo valore, poiché è uscito quello di a.

Quali sono gli indici per valutare se la distribuzione è gaussiana o non gaussiana? Per valutare se la distribuzione è gaussiana oppure no bisogna trovare la moda e vedere se i valori si distribuiscono intorno a questa  essi possono distribuirsi in modo simmetrico oppure no. Poi trovo anche media e mediana. La distribuzione è normale se la media e la mediana sono uguali e se l’asimmetria è compresa tra 2 e -2 e ha una forma a campana.
Cosa si intende per probabilità condizionata? La probabilità condizionata di un evento A rispetto ad un evento B è la probabilità che si verifichi A sapendo che B si è verificato. Essa esprime una correzione delle aspettative per A, dettata dall’osservazione di B. Formula
Che valore ha la probabilità di un evento certo? Un evento è certo quando è possibile stabilire con certezza che si verificherà. Tutti i casi sono favorevoli, poiché i casi possibili sono uguali a quelli favorevoli. P(E)=
Che valore ha la probabilità di un evento impossibile? Un evento è impossibile quando so per certo che non potrà mai realizzarsi. In questo caso, infatti, non ci sono casi favorevoli. P(E)=
Cosa valuta il teorema di Bayes? Il teorema di bayes deriva da 2 teoremi fondamentali , ovvero quello della probabilità composta e quello della probabilità assoluta. Esso viene impiegato per calcolare la probabilità di una causa che ha scatenato l’evento. H0 è la probabilità a priori e mi aspetto che l’evento studiato modifichi tale probabilità definendo la probabilità a posteriori, cioè H1. Il teorema di bayes è una formula matematica per il calcolo della probabilità condizionata che afferma che la probabilità di A dato B è proporzionale alla probabilità di B dato A. P (a/b)= p (b/a) x p(a) / p(b) Questa legge è utile quando dobbiamo studiare diverse probabilità connesse tra loro + la probabilità dell’evento quando ne conosciamo la frequenza.

L’intervallo di confidenza è un modo alternativo di visualizzare i risultati dell’inferenza statistica che sottolinea l’incertezza dei dati statistici. Rappresenta l’intervallo in cui, con una data probabilità, il parametro stimato potrebbe oscillare casualmente. Si utilizzano in genere intervalli di confidenza al 90% o al 95% e rappresentano l’intervallo in cui ci aspetteremmo di trovare il valore del parametro nel 90% o 95% delle volte.

Se devo confrontare due gruppi rispetto a una variabile gaussiana che test posso usare? Posso usare il T test.
Che differenza c’è fra t test per gruppi indipendenti e t test per dati appaiati? Nel t test per gruppi indipendenti vi è il confronto tra le medie dei punteggi di 2 gruppi separati di individui e 2 campioni. Nel t test per dati appaiati, invece, c’è solo un campione che viene confrontato con i gruppi di punteggi in cui ogni gruppo è campione della popolazione. Avviene, quindi, il confronto delle medie di 2 punti correlati.
Quando si applica il t test per gruppi indipendenti? Il t test per gruppi indipendenti si applica quando si devono confrontare gruppi diversi tra di loro, quindi, non appartenenti alla stessa popolazione. Esso implica l’errore standard. T= x1-x2/ errore standard
Come deve essere la distribuzione della variabile dipendente per poter applicare il t test? La distribuzione deve essere gaussiana.
Cosa confronta il t test per dati appaiati? Il t test per dati appaiati confronta le medie di 2 punteggi correlati. Nel t -test per dati appaiati, noto anche come t -test per prove ripetute, si procede calcolando

la differenze fra i punteggi di ogni coppia
La media delle differenze
l’errore standard delle differenze, dato da deviazione standard delle differenze / numerosità del campione (sotto radice) Il parametro t è dato da media delle differenze/ errore standard delle differenze
1. Come si ottiene il parametro t del t test per campioni indipendenti? Il parametro t del t test per campioni indipendenti si ottiene facendo: media del campione 1- media del campione 2 / errore standard della differenza delle media tra il campione 1 e il campione 2.
2. Come si ottiene il parametro t del t test per dati appaiati? Il parametro t del t test per dati appaiati si ottiene facendo: media del singolo campione – media delle medie campionarie / errore standard delle medie campionarie.
3. Quale è l’ipotesi nulla del t test per campioni indipendenti e per dati appaiati? L’ipotesi nulla del t test per campioni indipendenti e per dati appaiati è: l’assenza di relazioni tra le variabili.
4. Come si calcola la significatività del t test per campioni indipendenti e per dati appaiati? Per calcolare la significatività del t test per campioni indipendenti e per dati appaiati si trova il valore t , lo si confronta con quelli tabulati in apposite tabelle dal confronto tra il valore ottenuto e il valore tabulato si potrà definire se la differenza tra le due medie è significativa o no, cioè se è dovuta al caso o meno.
5. Che distribuzione utilizza il t test per la falsificazione di H0? Utilizza la distribuzione t.

Quale test statistico posso utilizzare per sapere se c’è una relazione fra due variabili qualitative? Si può usare il test del chi quadro.
Quale indice statistico si utilizza nel test del Chi quadro? Nel test del chi quadro si utilizzano frequenze attese e sperimentali. Nel test del chi quadro si parte quindi da un’ipotesi sperimentale e da un’ipotesi nulla. L’ipotesi sperimentale è che una variabile influisca sulla distribuzione delle frequenze dell’altra, mentre l’ipotesi nulla è che la distribuzione di frequenza di una variabile sia la stessa qualunque sia il valore, ovvero la categoria, dell’altra. A questo punto si calcolano le frequenze teoriche attraverso la formula: totale righe x totale colonne/ totale generale. Le frequenze teoriche sono quelle che ci aspettiamo nel caso sia vera l’ipotesi nulla. Si uniscono, poi, nella stessa tabella le frequenze teoriche e quelle osservate, successivamente si calcola il valore del chi quadro  Chi quadro= simbolo della sommatoria (frequenza osservata – frequenza attese) alla seconda/ frequenze attese. Infine, si confronta chi quadro con le tabelle di contingenza guardando i valori critici che sono ordinati in base ai gradi di libertà per capire se il test del chi quadro è significativo. I gradi di libertà sono dati dal numero di righe meno uno moltiplicato per il numero delle colonne meno uno.
Quale distribuzione si utilizza per il test del Chi quadro? Si usa la distribuzione chi quadro. La distribuzione Chi quadro è data dalla somma di variabili z elevate al quadrato.
Come si calcola il parametro Chi quadro del test del Chi quadro? Chi quadro= simbolo della sommatoria (frequenza osservata – frequenza attese) alla seconda/ frequenze attese. Frequenza attesa= frequenza colonna x frequenza riga/ frequenza totale

Cosa sono le tabelle o tavole di contingenza? Sono tavole dove si hanno tante righe quanto sono le categorie di una variabile e tante colonne quanto sono le categorie dell’altra variabile. Le tabelle a doppia entrata sono usate per rappresentare e analizzare le relazioni tra due o più variabili.
Come si calcola la significatività del test del Chi quadro? Per calcolare la significatività del chi quadro, si confronta chi quadro con le tabelle di contingenza guardando i valori critici che sono ordinati in base ai gradi di libertà. I gradi di libertà sono dati dal numero di righe meno uno moltiplicato per il numero delle colonne meno uno. Tuttavia, il test chi-quadro è un test approssimato i cui risultati sono attendibili solo se la numerosità delle singole celle non sono troppo ridotte. Nel caso di numerosità ridotta si può correggere il chi-quadro con il metodo di Yates. Un metodo ancora più attendibile è quello che va sotto il nome di test esatto di Fisher in cui viene calcolata le probabilità, nel caso sia vera l’ipotesi nulla, della tabella di frequenza ottenuta e di tutte le altre possibili tabelle ancora più lontane dall’ipotesi nulla. La somma di queste probabilità fornisce direttamente il valore della significatività. ANALISI DELLA CORRELAZIONE
Con che test si misura l’associazione fra due variabili quantitative? L’associazione fra due variabili quantitative si misura con il test della correlazione.
Quali relazioni analizza l’analisi della correlazione di Pearson? L’indice di correlazione di pearson si utilizza per determinare la forza e la direzione di una relazione lineare tra due variabili continue. Quindi, esso determina l’ adattamento del grafico alla miglior retta e la pendenza della retta. Se r= 1 allora x e y sono direttamente proporzionali, mentre se r= - essi sono inversamente proporzionali. Essa si usa per i punteggi ed è positiva se la correlazione è uguale, negativa se è uguale a -1 e non vi è alcuna relazione se è uguale a 0.

Cosa misura Rho nell’analisi della correlazione di Spearman? Rho nell’analisi della correlazione di spearman misura l’ adattamento del grafico alla miglior retta passante per i suoi punti e la pendenza della retta di regressione.
Come si rappresenta graficamente la relazione fra due variabili quantitative? La relazione tra due variabili quantitative si rappresenta attraverso il grafico di dispersione e l’ istogramma.
Quali sono le procedure per il calcolo di r? Per calcolare r si usa la covarianza , la quale viene corretta dividendola per la radice del prodotto delle varianze delle 2 variabili separate. Formula
Quali sono le procedure per il calcolo di Rho? Si calcola con la stessa formula di pearson, ma tra 2 serie di ranghi. Il coefficiente rho di Spearman viene calcolato con la stessa formula del coefficiente di correlazione di Pearson. I valori delle variabili vengono però sostituiti dai ranghi che si ottengono

ordinando i valori per ordine crescente
assegnando a ciascun valore il numero d’ordine (rango)
nel caso di valori uguali si assegna a ciascuno la media degli ordini

Come si fa a valutare la significatività del coefficiente di correlazione? Per valutare la significatività del coefficiente di correlazione si confronta il coefficiente di correlazione con una tabella , la quale però è basata sull’ampiezza del campione.

TEST DEI RANGHI

Quando si applicano i test dei ranghi e perché? I test dei ranghi si applicano quando si hanno test non parametrici e quando ci si vuole svincolare dalle ipotesi distributive. I test dei ranghi si applicano su test non parametrici, poiché mentre i test parametrici sono applicati a campioni dei quali si conoscono i parametri relativi alla distribuzione, quelli non parametrici sono usati quando non è noto il tipo di distribuzione. Si applicano quando la variabile non è gaussiana , ma è quantitativa e si applicano questi, perché quelli parametrici non si possono applicare siccome la variabile non è a distribuzione gaussiana. Abbiamo visto:  Test del segno  è utilizzato per confrontare due serie di dati correlati , ad esempio fra due prove ripetute e con punteggi che vanno da 1 a 10 e il confronto si effettua sulle differenze fra seconda e prima prova, applicando la Distribuzione Binomiale per valutare la diversità fra miglioramenti e peggioramenti.  Test di wilcoxon  Si basa sulla classificazione dei soggetti in base al valore assoluto della differenza ottenuta nelle due prove e utilizza il numero d’ordine (rango) dei soggetti come nuova variabile da sottoporre a verifica statistica. Tale variabile ha una distribuzione prossima ad una distribuzione normale standard che viene utilizzata per eseguire il test.  Test di mann-whitney  Si basa sulla classificazione dei soggetti in base all’ordine dei punteggi (rango) dato indipendentemente dai gruppi come nuova variabile da sottoporre a verifica statistica. Tale variabile ha una distribuzione prossima ad una distribuzione normale standard che viene utilizzata per eseguire il test. I passaggi sono analoghi al test dei ranghi di Wilcoxon ma il parametro è diverso
Se si devono confrontare due gruppi rispetto a una variabile quantitativa a distribuzione non gaussiana cosa si può applicare? Si può usare il test di mann whitney.

Cosa analizza il test dei ranghi di Mann Whitney? Il test dei ranghi di mann whitney serve a confrontare dati appaiati ed analizza se due campioni indipendenti appartengono alla stessa popolazione. ANOVA
Quando si applica l’analisi della varianza? L’analisi della varianza si applica quando si vuole confrontare un numero qualsiasi di gruppi e condizioni con un unico processo di falsificazione di H0, nonché quando le variabili sono nominali con variabile dipendente gaussiana , poiché bisogna calcolare media e varianza.
Quando si applica l’analisi della varianza per gruppi indipendenti? L’analisi della varianza per gruppi indipendenti si applica quando bisogna confrontare le medie di 2 o più gruppi. Essa si applica quando i gruppi sono indipendenti e al variare della condizione cambiano anche i soggetti.
Quando si applica l’analisi della varianza per misure ripetute? L’analisi della varianza per misure ripetute si applica quando si hanno dei dati correlati e il campione stesso viene posto in 2 o più condizioni sperimentali ogni soggetto funge, infatti, da controllo di se stesso.
Quale è l’ipotesi nulla dell’analisi della varianza per gruppi indipendenti? L’ipotesi nulla è che non ci sia nessuna differenza tra le varianze , ovvero che la varianza dei valori veri sia uguale alla varianza degli errori.
Quale è l’ipotesi nulla dell’analisi della varianza per misure ripetute? L’ipotesi nulla dell’analisi della varianza per misure ripetute è che non ci sia una differenza significativa tra le varie misurazioni alle diverse condizioni le diverse condizioni producono, infatti, lo stesso effetto sul campione.

Quanti effetti misura l’analisi della varianza a due vie per gruppi indipendenti? L’analisi della varianza a due vie per gruppi indipendenti misura gli effetti principali e di interazione.
Cosa è l’effetto interazione? L’effetto interazione è l’effetto derivante dalla combinazione di specifiche variabili l’interazione si calcola togliendo ad ogni punteggio quanto dovuto agli effetti principali; mentre l’effetto principale è l’effetto prodotto da ognuna delle 2 variabili indipendenti separatamente  la varianza degli effetti principali si calcola per ogni fattore:

raggruppando i soggetti secondo quel fattore e calcolando la varianza dovuta al fattore come nell’analisi della varianza a una via
il parametro F è dato dal rapporto fra la varianza così ottenuta e la varianza errore.

Come si misura l’effetto interazione? Si ha a che fare con l’effetto interazione quando abbiamo un anova a 2 o più vie , quindi quando abbiamo più condizioni sperimentali. Abbiamo l’effetto principale della 1 condizione sperimentale , poi l’effetto principale della 2 condizione sperimentale , l’ errore e l’effetto interazione. Si calcola la varianza dei 2 effetti principali, cioè la varianza dovuta alla differenza fra i gruppi (la varianza del 1 effetto è calcolata con un parametro f che fa un rapporto tra la varianza dovuta ai gruppi rispetto alla varianza dovuta alle differenze individuali e quindi dovuta all’errore casuale ) che si ottiene come stima calcolando la media dei valori che abbiamo, la differenza tra i punteggi e questi valori è l’errore. Utilizzando questi errori che possono essere positivi o negativi otteniamo la varianza stimata dell’errore , quindi la varianza rimanente è l’effetto interazione  NB= prima si calcolano gli effetti principali e per ogni sottogruppo si calcola il valore che spetterebbe al sottogruppo se ci fossero solo gli effetti principali e poi si calcola la differenza tra il valore sperimentale e il valore dovuto agli effetti principali= questa differenza per ogni sottogruppo è l’effetto interazione, quindi sommando tutti gli scarti dei sottogruppi rispetto a queste differenze tra effetti principali e dati sperimentali