Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Riassunti Statistica Psicometrica, Dispense di Statistica

Dispense Statistica Psicometrica per corso di laurea triennale in psicologia

Tipologia: Dispense

2022/2023

Caricato il 13/12/2024

cristiana-pia-celentano
cristiana-pia-celentano 🇮🇹

1 documento

1 / 163

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Riassunti di Statistica
psicometrica
Università degli Studi di Napoli Federico II
Docente: Domenico Vistocco
Riassunti di: Michela Angius
PRIMA PROVA INTERCORSO
Anno accademico 2020/2021
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51
pf52
pf53
pf54
pf55
pf56
pf57
pf58
pf59
pf5a
pf5b
pf5c
pf5d
pf5e
pf5f
pf60
pf61
pf62
pf63
pf64

Anteprima parziale del testo

Scarica Riassunti Statistica Psicometrica e più Dispense in PDF di Statistica solo su Docsity!

Riassunti di Statistica

psicometrica

Università degli Studi di Napoli Federico II

Docente: Domenico Vistocco

Riassunti di: Michela Angius

PRIMA PROVA INTERCORSO

Anno accademico 2020/

Indice degli argomenti

1 Statistica e glossario di base 5

Che cos’è la statistica?

Diversi processi che danno origine ai dati statistici

Glossario di base

2 Popolazione, campione e unità statistica 7

3 Variabile statistica 8

Tipologie di variabili statistiche e operazioni possibili

Esempi di variabili statistiche

4 Analisi statistiche, tabella dei dati e serie 10

La matrice o tabella dei dati

Esempio di matrice dei dati

Serie grezza

Serie ordinata

5 Frequenze e distribuzioni di frequenze 12

La frequenza assoluta

Tabella di sintesi delle frequenze assolute

Esempio di frequenza assoluta

La frequenza relativa

Tabella di sintesi delle frequenze relative

Esempio di frequenze relative

La frequenza percentuale

La tabella di sintesi delle frequenze percentuali

Esempio di frequenze percentuali

Le frequenze assolute cumulate

Esempio di frequenze assolute cumulate

Le frequenze relative cumulate

Esempio di frequenze relative cumulate

Le frequenze percentuali cumulate

Esempio di frequenze percentuali cumulate

6 Classi e distribuzione per classi 19

Le classi di modalità

La tabella di frequenza per classi

La notazione degli intervalli

10 Forma ed indici di forma 51

La forma di una distribuzione

La simmetria di una distribuzione

Il ruolo degli scarti nella simmetria

L’asimmetria

L’indice di asimmetria di Fisher

L’indice di asimmetria di Hotelling-Solomon

L’indice di asimmetria di Yule-Bowley

La curtosi e l’indice di curtosi di Fisher

11 Analisi della varianza/devianza 60

La scomposizione della devianza

La statistica F di Fisher

L’indice eta quadro

12 Distribuzione normale e normalità 65

La distribuzione normale

Le caratteristiche della curva gaussiana

Media e varianza di una distribuzione normale

La distribuzione normale standardizzata

Il test chi quadro

Riassunti di Statistica Psicometrica 1. Statistica e glossario di base

LA STATISTICA

Cos’è e a cosa serve la statistica

La statistica è una disciplina scientifica che ha come finalità l’analisi dei dati per estrarre

informazioni utili a prendere le “migliori” decisioni.

I DIVERSI PROCESSI CHE DANNO ORIGINE AI DATI STATISTICI

Le diverse tipologie di indagini statistiche

Un’indagine statistica è uno studio che riguarda un collettivo statistico, le cui unità sono entità

(persone, imprese, abitazioni) individuabili e osservabili, chiamata popolazione reale o finita.

L’indagine statistica può essere:

 Censuaria: lo studio statistico è condotto con l’osservazione della totalità delle unità

statistiche di una popolazione;

 Campionaria: limitata a una parte delle unità della popolazione, ossia a un campione.

Divisione del campo della statistica metodologica

Il campo della statistica metodologica si divide in:

 Statistica descrittiva: quando i metodi statistici sono applicati a variabili rilevate sulla

popolazione. Si considera il campione quando l’intera popolazione non è conoscibile. Se

il campione è scelto secondo opportune metodologie allora le informazioni derivate

dall’analisi del campione sono estendibili all’intera popolazione entro un certo margine

di errore (rilevazione dati, costruzione distribuzioni di frequenza, presentazioni grafiche e

tabellari).

 Statistica inferenziale: quando i metodi statistici sono applicati a variabili rilevate sul

campione, e sono considerati validi sull’intera popolazione.

GLOSSARIO DI BASE

 Sommatoria:

 Frequenza assoluta: 𝑛

 Frequenza relativa: 𝑓

 Frequenza percentuale: 𝑝

 Frequenza assoluta cumulata: 𝑁

 Frequenza relativa cumulata: 𝐹

 Frequenza percentuale cumulata: 𝑃

 Ampiezza della classe: 𝐴

 Densità della classe: ℎ

 Classe: 𝐶

 Valore centrale della classe: 𝑥ො

Statistica e glossario di base

Riassunti di Statistica Psicometrica 2. Popolazione, campione e unità statistica

LA POPOLAZIONE, IL CAMPIONE E L’UNITÀ STATISTICA

Il collettivo statistico/popolazione

Il collettivo statistico (anche definito popolazione) è totalità dei casi individuali in cui il

fenomeno studiato si manifesta. È qualsiasi insieme rispetto al quale si realizza il fenomeno

oggetto di studio.

Il campione

Il campione è una parte della totalità dei casi che viene sottoposta a osservazione. È qualsiasi

sottoinsieme derivato da una popolazione e finalizzato allo studio del fenomeno.

L’unità statistica

L’unità statistica è un elemento della popolazione o del campione su cui si manifesta il

fenomeno.

Esempio di collettivo statistico, campione e unità statistica

Il Ministero dell’Istruzione decide di analizzare statisticamente i dati relativi alla preparazione

in lingua inglese dei bambini che studiano presso le scuole primarie italiane.

In questo caso di studio la totalità di bambini frequentanti le scuole primarie italiane sono il

collettivo statistico su cui il Ministero andrà a svolgere un’analisi censuaria.

Se il Ministero non possiede le risorse adatte per svolgere un’indagine sulla totalità di bambini

che compongono la popolazione statistica, sceglierà un numero di bambini più ristretto per

svolgere l’indagine; questo insieme più ristretto si definisce campione.

Ogni singolo bambino, al quale sottoporre l’indagine statistica sulla sua preparazione in lingua

inglese, rappresenta l’unità statistica dell’indagine.

Popolazione, campione e unità statistica

Riassunti di Statistica Psicometrica 3. Variabile statistica

LA VARIABILE STATISTICA E LE MODALITÀ

La variabile statistica

La variabile è l’aspetto misurabile del fenomeno che viene rilevato su ciascun elemento della

popolazione e/o campione. Le variabili sono lo strumento con cui si misura operativamente il

fenomeno.

Le modalità

La modalità è la manifestazione concreta (o osservazione) della variabile sulle unità. Le

modalità possono anche essere definite come i diversi modi con cui il carattere/variabile si

manifesta nelle unità statistiche del collettivo.

Esempio sulle variabili e sulle modalità

Una scuola elementare ha intenzione di analizzare il colore dei capelli e il colore degli occhi dei

suoi alunni.

In tale indagine le variabili statistiche che vengono analizzate dalla scuola sono:

 Il colore dei capelli;

 Il colore degli occhi.

Le modalità, per ciascuna variabile potrebbero essere:

 Per la variabile colore dei capelli: neri, castani, biondi, rossi;

 Per la variabile colore degli occhi: neri, marroni, verdi, azzurri, grigi, ecc..

LE TIPOLOGIE DI VARIABILI STATISTICHE

Tipologie di variabili statistiche e operazioni possibili

Le variabili statistiche possono essere:

Variabile statistica

Riassunti di Statistica Psicometrica 4. Analisi statistiche, tabella dei dati e serie

LE ANALISI STATISTICHE

Tipologie di analisi statistiche

Le analisi sui dati, svolte con lo studio della statistica, possono distinguersi in base al numero di

variabile coinvolte:

 Analisi univariate: con lo studio di una sola variabile statistica, con lo scopo di capire le

caratteristiche essenziali;

 Analisi bivariate: con lo studio di due variabili statistiche, lo scopo è di identificare le

possibili relazioni esistenti fra queste due;

 Analisi multivariate: studio di più di due variabili.

Esempi di analisi statistiche univariate e bivariate

Un’analisi statistica univariata può essere condotta sul peso di un campione di clienti di un fast

food, per studiare alcune caratteristiche essenziali, come il peso medio o la variabilità dei dati

raccolti.

Un’analisi bivariata può essere condotta – sempre sullo stesso campione di clienti di un fast food

  • tra il peso di questi e il numero di volte che essi si recano al fast food per mangiare o cenare.

L’obiettivo di tale analisi è scoprire se esistono relazioni statistiche tra queste due componenti.

LA TABELLA DEI DATI

La matrice o tabella dei dati

La matrice dei dati è una tabella che rappresenta i dati rilevati in funzione di un certo numero

di variabili (poste come colonne) e di un certo numero di unità (poste come righe).

È rappresentabile nel seguente modo:

X Y ... W ... Z

1 x 1

y 1

... w 1

... z 1

2 x 2

y 2

... w 2

... z 2

i x i

y i

... w 3

... z i

n x n

y n

... w n

... z n

Esempio di matrice dei dati

Possiamo rappresentare tramite una matrice dei dati le rilevazioni fatte su sei clienti del fast

food (le sei unità dell’analisi) riguardanti la loro età, il loro peso e il numero di volte che si sono

recati in un fast food nell’ultima settimana (le tre variabili statistiche dell’analisi):

Analisi statistiche, tabella dei dati e serie

Riassunti di Statistica Psicometrica 4. Analisi statistiche, tabella dei dati e serie

Unità Età Peso (in

kg)

Volte al

fast-food

LE SERIE

La serie grezza

La serie grezza è la rappresentazione in serie dei dati rilevati su un certo numero di unità

statistiche per una sola variabile.

Partendo da una matrice di dati è possibile estrapolare una serie grezza, prendendo

esclusivamente una variabile e i suoi relativi valori.

In una generica variabile X, la sua serie grezza è formata da:

x 1

x 2

... x i

... x n

Esempio di serie grezza

Partendo dalla matrice dei dati precedente è possibile estrapolare la serie grezza relativa all’età

delle sei unità statistiche:

Da notare che mentre nella matrice dei dati l’età era rappresentata in colonna, in questo

esempio la serie grezza è rappresentata in riga (le rilevazioni sono state capovolte).

Serie ordinata

Laddove ha senso è possibile definire una serie ordinata come una serie grezza le cui rilevazioni

vengono ordinate in modo:

 Crescente, quando: 𝑥

 Decrescente, quando: 𝑥

Esempio di serie ordinata

Possiamo ordinare in senso crescente la serie grezza dell’esempio precedente:

E in ordine decrescente:

Riassunti di Statistica Psicometrica 5. Frequenze e distribuzioni di frequenze

La frequenza relativa

La frequenza relativa associata alla modalità è la quota parte del collettivo su cui si osserva la

modalità.

La frequenza relativa si calcola come:

frequenza relativa =

frequenza assoluta della modalità

numero totale di unità

In formato algebrico:

Quindi, la somma di tutte le frequenze relative osservate è pari a 1:

௜ୀଵ

La tabella di sintesi delle frequenze relative

Avendo a disposizione la tabella di sintesi delle frequenze assolute è possibile aggiungere una

nuova colonna per rappresentare le frequenze relative:

Modalità Frequenza

assoluta

Frequenza

relativa

Modalità 1 n 1

f 1

Modalità 2 n 2

f 2

Modalità i n i

f i

Modalità k n k

f k

N 1

Esempio di frequenze relative

Continuando con l’esempio delle frequenze assolute, si ha:

Numero di

figli

Frequenza

assoluta

Frequenze

relative

Riassunti di Statistica Psicometrica 5. Frequenze e distribuzioni di frequenze

Procedimento:

  1. Sommare tutte le frequenze assolute (n i

), per ottenere il numero totale di unità:

  1. Per trovare il primo valore della frequenza relativa (f 1

) divideremo la prima frequenza

assoluta (n 1

) con il numero totale di unità (N):

  1. Svolgere il passo n. 2 per tutte le modalità e frequenze assolute.

Come possiamo osservare la sommatoria di tutte le frequenze relative è pari a 1:

La frequenza percentuale

La frequenza percentuale (p i

) è la versione in percentuale della frequenza relativa. Si ottiene

moltiplicando ogni frequenza relativa per cento:

da cui:

Quindi, la somma di tutte le frequenze percentuali è sempre uguale a 100:

௜ୀଵ

La tabella di sintesi delle frequenze percentuali

Avendo a disposizione la tabella di sintesi delle frequenze relative è possibile aggiungere una

nuova colonna per rappresentare le frequenze percentuali:

Modalità Frequenza

assoluta

Frequenza

relativa

Frequenza

percentuale

Modalità 1 n 1

f 1

p 1

Modalità 2 n 2

f 2

p 2

Modalità i n i

f i

p i

Modalità k n k

f k

p k

N 1 100

Esempio di frequenze percentuali

Continuando con l’esempio delle frequenze assolute, si ha:

Riassunti di Statistica Psicometrica 5. Frequenze e distribuzioni di frequenze

  1. La seconda frequenza assoluta cumulata è uguale alla somma della prima frequenza

assoluta e la seconda:

  1. La terza frequenza assoluta cumulata è uguale alla somma della prima frequenza

assoluta, la seconda e la terza:

  1. La quarta frequenza assoluta cumulata è uguale alla somma della prima frequenza

assoluta, la seconda, la terza e la quarta:

  1. La quinta (e ultima) frequenza assoluta cumulata è uguale alla somma della prima

frequenza assoluta, la seconda, la terza, la quarta e la quinta:

Si può notare come l’ultima frequenza assoluta cumulata coincide con il numero totale di unità:

Le frequenze relative cumulate

Riprendendo il concetto di frequenze assolute cumulate, definiamo le frequenze relative

cumulate (F i

) come la somma della frequenza relativa della modalità e di quelle delle modalità

che la precedono:

௝ୀଵ

Il metodo di calcolo sarà identico a quello delle frequenze assolute cumulate.

L’ultima frequenza relativa cumulata sarà pari a uno, ovvero alla sommatoria di tutte le

frequenze relative.

Esempio di frequenze relative cumulate

Continuando con l’esempio delle frequenze assolute e relative, si ha:

Numero di

figli

Frequenza

assoluta

Frequenze

relative

F. relativa

cumulata

Procedimento:

  1. La prima frequenza relativa cumulata è sempre uguale alla prima frequenza relativa

  2. La seconda frequenza relativa cumulata è uguale alla somma della prima frequenza

relativa e la seconda:

Riassunti di Statistica Psicometrica 5. Frequenze e distribuzioni di frequenze

  1. La terza frequenza relativa cumulata è uguale alla somma della prima frequenza

relativa, la seconda e la terza:

  1. La quarta frequenza relativa cumulata è uguale alla somma della prima frequenza

relativa, la seconda, la terza e la quarta:

  1. La quinta (e ultima) frequenza relativa cumulata è uguale alla somma della prima

frequenza relativa, la seconda, la terza, la quarta e la quinta:

Si può notare come l’ultima frequenza relativa cumulata è pari a uno:

Le frequenze percentuali cumulate

Riprendendo il concetto di frequenze assolute e relative cumulate, definiamo le frequenze

percentuali cumulate (Pi) come la somma della frequenza percentuale della modalità e di quelle

delle modalità che la precedono:

௝ୀଵ

Il metodo di calcolo sarà identico a quello delle frequenze assolute e relative cumulate.

L’ultima frequenza percentuale cumulata sarà pari a cento, ovvero alla sommatoria di tutte le

frequenze percentuali.

Esempio di frequenze percentuali cumulate

Continuando con l’esempio delle frequenze assolute, relative e percentuali, si ha:

Numero di

figli

Frequenza

assoluta

Frequenze

relative

Frequenze

percentuali

F. percentuali

cumulate

Procedimento:

  1. La prima frequenza percentuale cumulata è sempre uguale alla prima frequenza

percentuale

  1. La seconda frequenza percentuale cumulata è uguale alla somma della prima frequenza

percentuale e la seconda:

Riassunti di Statistica Psicometrica 6. Classi e distribuzione per classi

LE CLASSI STATISTICHE

Le classi di modalità

Se svolgendo un’analisi statistica ci imbattiamo in una numerosità del collettivo grande (ad

esempio in un’analisi censuaria), anche le modalità saranno altrettanto numerose, rendendo

complicato se non impossibile uno studio corretto dei dati rilevati.

Se le modalità fanno riferimento a variabili statistiche quantitative si possono raggruppare le

diverse rilevazioni in classi di modalità. Quindi, le classi ci aiutano ad ottenere una sintesi

efficace, ma distruttiva, di una molteplicità di dati, raggruppando le unità statistiche in base ad

un criterio di vicinanza.

Le classi devono essere:

 Esaustive: rappresentare tutte le rilevazioni in nostro possesso;

 Mutuamente esclusive: non possono contenere unità statistiche che sono

contemporaneamente in due classi diverse.

La tabella di frequenza per classi

Introducendo delle classi (le quali possono essere anche decise, nel modo migliore per

aumentare l’efficacia di sintesi, da noi) possiamo rappresentarle in tabella con il numero delle

frequenze assolute, relative e percentuali.

Questi valori vengono calcolati dalle lunghe serie grezze nello stesso modo delle distribuzioni

esposte in precedenza, aggregando i diversi dati in base alle delineazioni fatte nella definizione

delle classi.

Classe Frequenza

assoluta

Frequenza

relativa

Frequenza

percentuale

x 0

  • x 1

n 1

f 1

p 1

x 1

  • x 2

n 2

f 2

p 2

x i-

  • x i

n i

f i

p i

x k-

  • x k

n k

f k

p k

dove:

 x 0

: estremo inferiore della prima classe;

 x 1

: estremo superiore della prima classe.

La notazione degli intervalli

Ogni classe rappresenta un intervallo tra due modalità, tale intervallo può essere:

Classi e distribuzione per classi

Riassunti di Statistica Psicometrica 6. Classi e distribuzione per classi

 Chiuso a sinistra: l’estremo inferiore è incluso nella classe, il superiore no

 Chiuso a destra: l’estremo superiore è incluso nella classe, l’inferiore no

 Chiuso sia a sinistra che a destra: entrambi gli estremi sono inclusi nella classe

 Aperto sia a sinistra che a destra: nessuno dei due estremi è incluso nella classe

Esempio di una distribuzione per classi

L’ISTAT conduce un’indagine statistica sul fatturato di tutte le imprese italiane. Lo stesso ente

pubblico divide le modalità in classi come segue:

Classe di fatturato (in euro) Frequenza

assoluta

Frequenza

relativa

Frequenza

percentuale

L’ampiezza di una classe

L’ampiezza di una classe è la differenza tra l’estremo superiore e l’estremo inferiore della classe

stessa:

= estremo superiore

− estremo inferiore

Esempio dell’ampiezza di una classe

Riprendendo l’esempio dello studio dell’ISTAT sul fatturato delle imprese italiane, si ha:

Classe di fatturato (in euro) Ampiezza

Procedimento:

  1. L’ampiezza della prima classe viene calcolata come la differenza dell’estremo superiore

(100.000) e dell’estremo inferiore (0):