Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Calcolo statistiche e valutazione normalità dati: distribuzioni e statistiche descrittive, Slide di Psicometria

Una introduzione alle statistiche descrittive, in particolare alla calcolazione della media e della deviazione standard, e alla distribuzione normale. Vengono presentate le caratteristiche della curva normale e spiegati i metodi per valutare se i dati sono normalmente distribuiti. Vengono inoltre introdotti gli indici di asimmetria e curtosi per valutare la simmetria e la forma della distribuzione.

Tipologia: Slide

2020/2021

Caricato il 07/11/2021

matildegulino
matildegulino 🇮🇹

4.5

(35)

50 documenti

1 / 6

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistiche descrittive
- Il calcolo delle statistiche descrittive di una variabile consiste nel misurare quei parametri, come la
media e la deviazione standard, che sintetizzano come sono distribuiti nel campione i valori che
essa può assumere
- Le statisitche descrittive sono una valutazione preliminare importante per controllare la
“normalità” della distribuzione, necessaria per procedere in molte delle eleaborazioni statisitiche
successive
Distribuzione normale
La curva normale o curva di Gauss è una distribuzione teorica di punteggi in una popolazione. Riguarda solo
le variabili mertriche continue, quindi le misure almeno su scale a intervalli equivalenti.
La curva normale è interamente definita dai parametri µ (la media che corrisponde al valore x con la
frequenza massima) e σ (devst). Poiché la distribuzione normale varia al variare di µ e σ si può parlare di
famiglia di distribuzioni normali con medie e deviazioni standard diverse.
Famiglia di distribuzioni normali con stessa media e deviazione standard diversa.
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Calcolo statistiche e valutazione normalità dati: distribuzioni e statistiche descrittive e più Slide in PDF di Psicometria solo su Docsity!

Statistiche descrittive

  • Il calcolo delle statistiche descrittive di una variabile consiste nel misurare quei parametri, come la media e la deviazione standard, che sintetizzano come sono distribuiti nel campione i valori che essa può assumere
  • Le statisitche descrittive sono una valutazione preliminare importante per controllare la “normalità” della distribuzione, necessaria per procedere in molte delle eleaborazioni statisitiche successive Distribuzione normale La curva normale o curva di Gauss è una distribuzione teorica di punteggi in una popolazione. Riguarda solo le variabili mertriche continue, quindi le misure almeno su scale a intervalli equivalenti. La curva normale è interamente definita dai parametri μ (la media che corrisponde al valore x con la

frequenza massima) e σ (devst). Poiché la distribuzione normale varia al variare di μ e σ si può parlare di

famiglia di distribuzioni normali con medie e deviazioni standard diverse. Famiglia di distribuzioni normali con stessa media e deviazione standard diversa.

Curva normale e distribuzione dei dati Se rappresentiamo un dato raccolto da un grafico poligonale di frequenza e la curva risultante non simula la curva di distribuzione normale (con tutte le sue caratteristiche), questi dati non sono normalmente distribuiti. Nello specifico, cosa andiamo a valutare? Inidici per testare la normalità: asimmetria e curtosi Asimmetria : misura l’asimmetria dei dati

  • Positiva o destra: coda destra più lunga
  • Negativa o sinistra: coda sinistra più lunga Cutorisi : misura il picco di distribuzione dei dati. La cutorsi della distribuzione normale è 0. Misure di forma della distribuzione Asimmetria: indice che informa circa il grado di simmetria o asimmetria di una distribuzione
  • Y = 0 distribuzione simmetrica
  • Y < 0 asimmetria negativa (mediana>media)
  • Y > 0 asimmetria positiva (mediana < media) Cutorsi: indice che permette di verificare se i dati seguono una distribuzione di tipo normale (simmetrica)
  • Β = 0 distribuzione normale
  • B < 0 distribuzione iponormale (rispetto alla distribuzione normale ha frequenza di densità minore per valori molto distanti dalla media)
  • B > 0 distribuzione ipernormale (rispetto alla distribuzione normale ha frequenza di densità maggiore per valori molto distanti dalla media)
  • H1 = le due medie sono significativamente differenti tra loro e ciò non è dovuto ad una variabilità casuale Il valore t è la differenza tra le medie pesata per deviazione standard e numerosità campionaria dele due distribuzioni. La probabilità p associata alla t rappresenta quanto è probabile (da 0 a 1) che il risultato ottenuto sia casuale. Per convenzione:
  • P> 0.05  risultato abbaastanza probabile da poter essere stato ottenuto casualmente, quindi considerato non significativo
  • P < 0.05  risultato poco probabile, assunto come non casuale e considerato singificativo T-test per campione singolo Obiettivo: verificare che la media di una certa variabile sia differente da un determinato valore. T-test per campioni indipendenti Obiettivo: verificare che la media di una certa variabile sia differente tra due campioni indipendenti. T-test per campioni appaiati Obiettivo: entro un solo campione, verificare che la media di una certa variabile sia differente dalla media di un’altra variabile. ANOVA Unitaria L’ANOVA (analisi della varianza) serve a verificare se le medie di 3 o più distribuzioni sono differenti tra loro o se sono da considerarsi uguali. Si basa sulla distribuzione F di Fisher, cioè su una distribuzione di probabilità che riflette il rapporto tra variabili aleatorie. Come qualsiasi test usato per la verifica di ipotesi, la ANOVA si basa sulla verifica di un’ipotesi alternativa (H1) contro un’ipotesi nulla (H0).
  • H0 = le medie sono uguali e qualsiasi differenza minima che possiamo riscontrare è dovuta al caso
  • H1 = le medie sono significativamente differenti tra loro e ciò non è dovuto ad una variabilità casuale La probabilità p associata alla F rappresenta quanto è probabile (da 0 a 1) che il risultato ottenuto sia casuale. Per convenzione:
  • p > 0.05  risultato abbastanza probabile da poter essere stato ottenuto casualmente, quindi considerato non significativo
  • p < 0.05  risultao poco probabile, assunto come non casuale e considerato significativo OBIETTIVO: verificare che la media di una certa variabile sia differente tra tre o più campioni differenti Le analisi basate sul confronto fra le medie delle variabili di interesse hanno prodotto poche differenze significative quindi  altro modo di esplorazione dei dati tramite correlazioni. Correlazione La correlazione è una misura del grado di concordanza tra due serie di valori. In altri termini, esprime la relazione tra due variabili, consentendo una valutazione sull’entitià del legame tra esse, ovvero il loro grado di indipendenza. Il coefficente di correlazione, in particolare, è una misura dell’associazione lineare tra due variabili:
  • positiva – all’aumentare della variabile A aumenta la variabile B
  • negativa – all’aumentare di A diminuisce B
  • uguale a 0 – non vi è relazione lineare tra le due variabili

Coefficiente di correlazione (r) Può assumere tutti i valori compresi tra -1 e +1. Il valore assoluto del coefficiente di correlazione indica l’intensità della relazione.

  • 0: nessuna relazione
  • 1: relazione lineare perfetta Il segno indica la direzione della relazione
  • Segno positivo: relazione positiva (all’aumentare di A aumenta B)
  • Segno negativo: relazione negativa (all’aumentare di A diminuisce B) Valori di r vicini a +1 indicano che le variabili hanno una forte relazione positiva, vicino a 0 che hanno poca relazione e vicini a -1 indicano una forte relazione negativa. Concordanza  È la misura della varianza comune a due veriabili che correlaziono (ossia quanta variabilità condividono le due variabili)  Si ottiene elevando al quadrato il coefficiente di correlazione Correlazione: step per le analisi  STEP 1 – scegliere le variabili da correlare  STEP 2 – scegliere il tipo di coefficiente di correlazione da calcolare e il test di significatività (a una o due code a seconda che si conosca o meno il segno negativo/positivo della correlazione)  STEP 3 – analizzare i risultati controllando: entitià, segno e significatività delle correlazioni richieste. Ricorda:
  • H0: correlazione = 0
  • H1: correlazione ≠ 0 Scelta del coefficiente di correlazione Il coefficiente di correlazione più comunemente impiegato nella statisitica applicata alle scienze sociali è quello di Pearson, rappresentato con una r. È adatto per variabili che siano misurate su scale ad intervalli o rapporti equivalenti. C Coefficiente di Sperman : da analizzare nel caso in cui le due variabili siano misurate su scala ordinale, o una su scala ordinale e l’altra su scala a intervalli, oppure misurate su scala ad intervalli uguali o a rapporti ma con distribuzione non normale. Rappresenta la versione non paramteica del coefficiente di Pearson, i valori delle due variabili vengono ordinati in ordine crescente per ciascun caso, e sui ranghi vine calcolato il coefficiente di Pearson. Coefficiente di Kendall : appropriato per variabili ordinali (si applica nelle stesse condizioni del coeffiente di Spearman), quando il numero di ranghi uguali è elevati.
  • r di Pearson  variabili misurate su scale a intervalli o rapporti equivalenti
  • rho di Spearman  variabili misurate su scale ordianli
  • Tau di Kendall  variabili misurate su scale ordianli quando il numero di ranghi uguali è elevato Correlazione – da ricordare Nella ricerca psicologica, usiamo le convenzioni proposte da Cohen per interpretare le dimensioni dell’effetto o effect size.