Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica: Unità, caratteri, distribuzione, media, linearità, mediana, variabilità, regre, Appunti di Psicometria

Una introduzione alla statistica, inclusi concetti come unità statistica, caratteri quantitativi e qualitativi, modalità, distribuzione unitaria, media aritmetica, proprietà media aritmetica, linearità, proprietà associativa, mediana, quantili, misure di variabilità e retta di regressione. Viene inoltre presentato il calcolo di media aritmetica, somma dei scarti e somma dei scarti quadrati.

Tipologia: Appunti

2020/2021

Caricato il 08/02/2021

amel
amel 🇮🇹

4.4

(35)

9 documenti

1 / 5

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistica: si occupa dei principi scientifici su cui si basa la raccolta (piano dell’esperienza), l’elaborazione (sintesi
dei dati per la comprensione del fenomeno) e l’utilizzazione (uso dei risultati nella pratica) delle informazioni
riguardanti fenomeni collettivi, raccolte con diversi criteri e sistemi
Statistica: demografica, economico-sociale, controllo statistico della qualità, psicometria
Statistica:
descrittiva: descrizione del fenomeno osservato
probabilità: valutazione dell’incertezza sul verificarsi di un evento
inferenza statistica: astrarre ciò che vale per un limitato numero di osservazioni (campione) a tutte le
possibili osservazioni (popolazione)
Definizioni:
collettivo statistico o popolazione: insieme di casi individuali in cui si manifesta il fenomeno oggetto di
studio
unita statistica: caso individuale componente del collettivo statistico oggetto di studio; unita semplice,
composte, multiple
carattere o variabile: informazione rilevata per ogni unita statistica
quantitativi:
discreti: assumono quantità finita, numerabile di valori
continui: assumono quantità non numerabili, ma continue di valori, possono assumere tutti i
valori in un intervallo
qualitativi:
ordinati: assumono un’ordinazione, le unita statistiche possono essere graduate
sconnessi: le modalità del carattere non possono essere ordinate
modalità: modo in cui il carattere si manifesta nelle unita statistiche del collettivo
Consideriamo un collettivo di N unita statistiche, dove si sia osservato il carattere X. Si chiama distribuzione
statistica semplice o unitaria, l’insieme delle osservazioni relative alle N unita del collettivo. In simboli, la
distribuzione semplice e’ indicata come
x1, x2,... , x n
, dove
x1
e’ l’osservazione del carattere x nell’unita
identificata dal numero 1,
x2
e’ l’osservazione del carattere x nell’unita identificata dal numero 2, e cosi via.
Proprietà sommatorie:
1. somma di costanti: se
x1=x2=...=k
, allora
i=1
n
xi=nk
2. cambio di scala: sia
x1, x2,... , x n
la distribuzione unitaria di X. Sia C una costante, allora:
i=1
n
cxi=c
i=1
n
xi
Dimostra
i=1
n
(xi+yi)=
i=1
n
xi+
i=1
n
yi
i=1
n
(xi+yi)
:
Distribuzione di frequenza: dato un carattere X, con modalità
x1, x2,... , x n
, si definisce frequenza assoluta
della modalità
xi(i=1,2 ,... , h)
il numero di unita statistiche che presentano il carattere x con modalità
xi
Frequenze assolute:
n10
i=1
h
ni=n
Frequenze relative:
fi0
i=1
h
fi=11
n
i=1
h
ni=1
nn=1
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Statistica: Unità, caratteri, distribuzione, media, linearità, mediana, variabilità, regre e più Appunti in PDF di Psicometria solo su Docsity!

Statistica: si occupa dei principi scientifici su cui si basa la raccolta (piano dell’esperienza), l’elaborazione (sintesi dei dati per la comprensione del fenomeno) e l’utilizzazione (uso dei risultati nella pratica) delle informazioni riguardanti fenomeni collettivi, raccolte con diversi criteri e sistemi

Statistica: demografica, economico-sociale, controllo statistico della qualità, psicometria

Statistica:

  • descrittiva: descrizione del fenomeno osservato
  • probabilità: valutazione dell’incertezza sul verificarsi di un evento
  • inferenza statistica: astrarre ciò che vale per un limitato numero di osservazioni (campione) a tutte le possibili osservazioni (popolazione)

Definizioni:

  • collettivo statistico o popolazione: insieme di casi individuali in cui si manifesta il fenomeno oggetto di studio
  • unita statistica: caso individuale componente del collettivo statistico oggetto di studio; unita semplice, composte, multiple
  • carattere o variabile: informazione rilevata per ogni unita statistica ◦ quantitativi: ▪ discreti: assumono quantità finita, numerabile di valori ▪ continui: assumono quantità non numerabili, ma continue di valori, possono assumere tutti i valori in un intervallo ◦ qualitativi: ▪ ordinati: assumono un’ordinazione, le unita statistiche possono essere graduate ▪ sconnessi: le modalità del carattere non possono essere ordinate
  • modalità: modo in cui il carattere si manifesta nelle unita statistiche del collettivo

Consideriamo un collettivo di N unita statistiche, dove si sia osservato il carattere X. Si chiama distribuzione statistica semplice o unitaria, l’insieme delle osservazioni relative alle N unita del collettivo. In simboli, la distribuzione semplice e’ indicata come x 1 , x 2 , ... , xn , dove x 1 e’ l’osservazione del carattere x nell’unita identificata dal numero 1, x 2 e’ l’osservazione del carattere x nell’unita identificata dal numero 2, e cosi via.

Proprietà sommatorie:

1. somma di costanti: se x 1 = x 2 =...= k , allora ∑

i = 1

n xi = nk

  1. cambio di scala: sia x 1 , x 2 , ... , xn la distribuzione unitaria di X. Sia C una costante, allora:

i = 1

n

cxi = c ∑

i = 1

n xi

Dimostra ∑

i = 1

n

( xi + yi )=∑

i = 1

n

xi +∑

i = 1

n

yi →∑

i = 1

n ( xi + yi ) :

i = 1

n

( xi + yi )=( x 1 + y 1 )+( x 2 + y 2 )+...+( xn + yn )=( x 1 + x 2 +...+ xn )+( y 1 + y 2 +...+ yn )=∑

i = 1

n

xi +∑

i = 1

n yi

Distribuzione di frequenza: dato un carattere X, con modalità x 1 , x 2 , ... , xn , si definisce frequenza assoluta della modalità (^) xi ( i =1,2 , ... , h ) il numero di unita statistiche che presentano il carattere x con modalità xi

Frequenze assolute:

• n 1 ≥ 0 • ∑

i = 1

h ni = n

Frequenze relative:

• fi ≥ 0 • ∑

i = 1

h f (^) i = 1 → 1

n ∑ i = 1

h ni = 1 n

n = 1

Grafici:

  • caratteri qualitativi: diagramma a barre e diagramma a torta
  • caratteri quantitativi discreti: diagramma ad aste
  • caratteri quantitativi continui istogramma

Media aritmetica: dato un carattere x quantitativo e data la distribuzione unitaria x 1 , x 2 , ... , xn , si definisce

media aritmetica: μ= 1

n ∑ i = 1

n xi

Proprietà media aritmetica:

  1. internalità (condizione di Cauchy): la media aritmetica assume sempre un valore compreso tra il più piccolo carattere e quello più grande

2. somma degli scarti da μ= 0 : ∑

i = 1

n

( xi − μ )= 0 →∑

i = 1

n

( xi − μ )=∑

i = 1

n xin μ= n μ− n μ= 0

  1. somma degli scarti^2 : minimizza le distanze euclidee

∀ C ∈ℝ , ∑

i = 1

n ( xic )^2 = minc = μ

d

dC ∑ i = 1

n ( xic )^2 = 0 → d

dC ∑ i = 1

n [( x 1 − c )^2 +( x 2 − c )^2 + ...+( xnc )^2 ]

2 ( x 1 − c )^2 −^1 ⋅(− 1 )+...+ 2 ( xnc )^2 −^1 ⋅(− 1 )= 0 − 2 ( x 1 + x 2 +...+ xn )− nc = 0

i = 1

n xinc = 0 ⇒ c =

i = 1

n xi

n

c = μ

  1. linearità: x 1 , x 2 , ... , xn , yi = a + bxi , con a , b ∈ℝ , allora: μ (^) y = a + b μ x

μ (^) y = 1

n ∑ i = 1

n yi = 1

n ∑ i = 1

n ( a + bxi )= 1 n

[ na + b ∑

i = 1

n xi ]=^1 n

na + 1 n

b ∑

i = 1

n xi = a + b ⋅^1

n ∑ i = 1

n xi = a + b μ

  1. proprietà associativa: se ho un collettivo statistico diviso in k gruppi disgiunti e indico con n 1 , n 2 , ... , nk la rispettiva numerosità, allora la media totale e’ pari a :

μ=

n 1 μ 1 + n 2 μ 2 +...+ nk μ k n

n

( x 1 +...+ xn 1 + y 1 +...+ yn 2 + z 1 + ...+ zn 3 )= 1

n ∑ i = 1

n xi + 1

n ∑ i = 1

n yi + 1

n ∑ i = 1

n zi =

n 1 μ 1 + n 2 μ 2 + n 3 μ 3 n

Mediana: e’ la modalità del carattere che occupa il “posto centrale” nella successione della distribuzione unitaria ordinata in ordine non decrescente; e’ quel valore che bipartisce la graduatoria delle osservazioni.

Quantili: permettono di dividere in N parti uguali la graduatoria delle osservazioni. Data una frazione

α∈[ 0 ; 1 ] , il quantile di ordine α e’ la più piccola modalità del carattere tale che F j − 1 ≤ α e F j ≥ α

Funzione di ripartizione empirica: la funzione di ripartizione empirica F(x) associa a ogni numero reale x la frequenza cumulata relativa alla modalità x della variabile, ossia la proporzione di unita con modalità inferiore o uguale a x. Proprietà:

  • sempre non decrescente: ∀ x
  • (^) limite x →+∞= F ( x )= 1
  • limite x →−∞= F ( x )= 0

Per rappresentare l’associazione tra due caratteri qualitativi viene usata la distribuzione doppia di frequenza (tabella di contingenza). Per calcolare l’associazione/dipendenza tra due caratteri qualitativi si utilizzano: χ^2 , ϕ^2 ,V di Cramer Per calcolare la dipendenza tra un carattere quantitativo e uno qualitativo, si utilizza l’indice di dipendenza in media η^2 ; indica quanta parte della variabilità di Y e’ spiegata dalle modalità di X

Probabilità:

  • ξ : esperimento casuale (aleatorio, stocastico); prova che può dare diversi esiti
  • Ε^ : eventi; possibili esiti di^ ξ
  • Ω : spazio campionario (o degli eventi); insieme di tutti gli E in un ξ (possibili realizzazioni dell’esperimento)

un evento E e’ un insieme di eventi elementari, ossia un sottoinsieme dello spazio campionario Ω esempio: ξ = “lancio una moneta 2 volte Ε = Testa o Croce Ω = {TT, TC, CC}

La probabilità e’ una funzione, P(), definita su una famiglia di sottoinsiemi Ω con proprietà:

  • P (Ω)= 1
  • (^) P ( A )≥ 0 , per ogni evento A
  • P ( A 1 ∪ A 2 ∪...)= P ( A 1 )+ P ( A 2 )+... , per ogni successione di eventi a 2 a 2 disgiunti
  • AB =∅⇒ P ( AB )= P ( A )+ P ( B )→ E 1 , E 2 , ... , tra loro disgiunti, allora P ( U i = 1

Ei )=∑

i = 1

P ( Ei ) ne deriva che: ▪ P (∅)= 0 ▪ P ( A )∈[ 0 , 1 ] ▪ (^) se AB , allora P ( A )≤ P ( B ) ▪ P ( AB )= P ( A )+ P ( B )− P ( AB ) ▪ P ( B )= 1 ⇒ P ( BA )= P ( A )→ P ( B )= 0 ⇒ P ( BA )= P ( A )

Teorema di Bayes: siano A 1 , A 2 , …, An una partizione di Ω e sia B un evento, allora:

P ( AiB )=

P ( BAi )⋅ P ( Ai )

i = 1

n P ( BAi )⋅ P ( Ai )

dato un effetto (evento), qual e’ la probabilità di una certa causa P ( Ai ) : probabilità a priori P ( BAi ) : verosomiglianza P ( AiB ) probabilità a posteriori denominatore: verosomiglianza marginale

Un variabile casuale X e’ una funzione che associa a ogni risultato dell’esperimento un valore numerico. Le variabili casuali sono distinte in:

  • discrete: possono assumere un insieme discreto di numeri realizzazioni
  • continue: possono assumere tutti i valori compresi in un intervallo reale

Variabili casuali discrete:

  • Distribuzione di Bernoulli: e’ un esperimento con due possibili esiti; viene indicata come XBernoulli ( θ) , dove il parametro θ corrisponde a^ P ( X = 1 )
  • Distribuzione binomiale: e’ una distribuzione di Bernoulli ripetuta n volte; viene indicata come XBinomiale ( θ ,n ) , dove θ e’ la probabilità di successo della singola prova e n e’ il numero di prove

Variabili casuali continue:

  • Distribuzione normale (gaussiana): è una distribuzione della probabilità continua di un fenomeno statistico intorno alla media; viene indicata come XN ( μ , σ) , dove μ definisce la posizione della distribuzione (il baricentro della campana), e σ la scala della distribuzione (larghezza della campana)
  • Distribuzione normale standardizzata: la distribuzione normale, a causa dei suoi parametri e’ difficile da utilizzare per i calcoli, si utilizza per tale motivo la standardizzata, la quale e’ una distribuzione normale che parametri^ μ=^0 e^ σ=^1

Inferenza statistica:

  • obiettivo: usare i dati rilevati su un campione della popolazione per fare delle affermazioni sulla popolazione da cui il campione e’ stato estratto
  • permette di estendere i risultati derivati da un campione rappresentativo (statistica) a un’intera popolazione (probabilità)
  • tutte le procedure inferenziali sono legate con l‘analisi probabilistica del fenomeno; gli strumenti probabilistici permettono di vedere dove il campione si colloca rispetto a un’ipotetica distribuzione di un fenomeno all’interno di una popolazione
  • in psicologia, l’inferenza e’ basata sull’approccio null hypothesis statistical significance testing (NHST): ◦ può essere considerato una fusione tra l’approccio di Fisher e quello di Neyman e Pearson ◦ idea alla base: prima dell’esperimento vengono definite due ipotesi complementari e esaustive, ipotesi nulla (status quo) e ipotesi alternativa ◦ calcolo di una funzione dei dati detta statistica test o stimatore: T ( x )= T (^) OSS ◦ confronto del valore osservato dalla statistica test TOSS con un valore critico fissato a priori TCRIT , la distribuzione teorica del fenomeno sull’intera popolazione. ◦ Sulla base del confronto si deciderà se rifiutare l’ipotesi nulla o se non la si potrà rifiutare
  • costruzione sistema di verifica di ipotesi: ◦ vengono definite due ipotesi contrapposte da sottoporre a verifica: H 0 e H 1H 0 , di natura puntuale, prevede l’assenza di un effetto rispetto al fenomeno di studio ◦ H 1 , prevede un effetto; può essere bidirezionale (ha un effetto di negazione, effetti diversi) o monodirezionale ( H 1 e’ meglio o peggio) → può essere unilaterale destra (> di un valore specificato), unilaterale sinistra (< di un valore specificato), bilaterale (diverso dal valore specificato) ◦ durante la costruzione del sistema di verifica bisogna tener conto degli errori: α , e’ la probabilità

di rifiutare H 0 dato che e’ vera; β , e’ la probabilità di non rifiutare H 0 dato che e’ falsa → si fissa,

a priori l’errore α , la decisione sarà errata nei confronti dell’errore di primo tipo al massimo di un valore pari a^ α^ , solitamente 0.05. Fissare l’errore garantisce al ricercatore che la propria decisione sarà sbagliata, nei termini dell’errore di primo tipo, al massimo nel 5% dei casi ◦ viene fatto un assunto secondo cui il fenomeno si distribuisce secondo una normale, segue una certa distribuzione probabilistica ◦ i parametri della distribuzione ( μ , σ ) non si conoscono, per stimarli si utilizza il dato osservato (campionario); si usano i dati a disposizione per dare una stima/approssimazione dei parametri della popolazione (stimatori) ◦ vengono definite le regioni critiche; la regione di rifiuto avrà l’area pari a α. Il limite dell’area, in caso di H 1 unilaterale destra e’ il quantile a livello 1 − α della distribuzione; in caso di H 1

unilaterale sinistra e’ il quantile a livello α ; se H 1 e’ bilaterale, la regione di rifiuto andrà da

−∞⇒ q^ α 2

e q 1 −^ α 2

⇒+∞ →solitamente si lavora con la normale standardizzata (unilaterale=1.64, bilaterale=1.96) ◦ si confronta il valore stimato rispetto a quella che e’ la curva si ipotizza descriva i dati; si osserva in quale regione il campione si colloca ◦ se il valore campionario cade nella regione di accettazione, si dirà che non si ha abbastanza evidenza sperimentale per rifiutare l’ipotesi nulla; se il valore cade nella regione di rifiuto, si rifiuta l’ipotesi nulla → rifiutare l’ipotesi nulla significa cambiare lo stato attuale delle cose