Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica Descrittiva: Frequenze, Distribuzioni e Grafici, Dispense di Matematica Generale

Slide date a lezione di statistica

Tipologia: Dispense

2019/2020

Caricato il 16/02/2023

cecilia-pantaleo
cecilia-pantaleo 🇮🇹

11 documenti

1 / 52

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Distribuzioni di frequenza
A meno che la numerosit´a della popolazione sia ridotta, ´e molto difficile
che i dati grezzi raccolti forniscano qualche informazione sul fenomeno in
studio finch´e non siano stati ordinati e sintetizzati in qualche modo.
Un primo modo per visualizzare sinteticamente l’insieme dei dati
individuali ´e ricorrere alla cosiddetta distribuzione di frequenza la quale
indica come le unit´a della popolazione si distribuiscono rispetto alle
modalit´a del carattere in esame.
Corso di Alta Formazione Danilo Alunni Fegatelli (danilo.alunnifegatelli@uniroma1.it).: Statistica Descrittiva :. 5/189
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34

Anteprima parziale del testo

Scarica Statistica Descrittiva: Frequenze, Distribuzioni e Grafici e più Dispense in PDF di Matematica Generale solo su Docsity!

Distribuzioni di frequenza

A meno che la numerosit´a della popolazione sia ridotta, ´e molto dicile che i dati grezzi raccolti forniscano qualche informazione sul fenomeno in studio finch´e non siano stati ordinati e sintetizzati in qualche modo.

Un primo modo per visualizzare sinteticamente l’insieme dei dati individuali ´e ricorrere alla cosiddetta distribuzione di frequenza la quale indica come le unit´a della popolazione si distribuiscono rispetto alle modalit´a del carattere in esame.

Frequenze assolute

Indichiamo col termine frequenza assoluta di una modalit´a di un carattere il numero delle volte che questa viene osservata nel collettivo.

La distribuzione di frequenze semplice associa alle modalit´a che pu´o assumere un carattere X le corrispondenti frequenze assolute.

La distribuzione di frequenze semplice del carattere X ´e rappresentata nella tabella riportata qui sotto.

X n (^) i a 1 n (^1)

a (^) j n (^) j

a (^) K n (^) K

Frequenze cumulate (1)

Se il carattere considerato ´e quantitativo o qualitativo ordinale, pu´o essere utile conoscere con quale frequenza le unit´a statistiche presentano una modalit´a inferiore o al pi´u uguale ad una certa modalit´a. Tale informazione ´e fornita dalle frequenze cumulate.

In generale, dato un carattere X con K modalit´a ordinate in senso crescente a (^) (1) a (^) (k) a (^) (K ) Si definisce frequenza assoluta cumulata e si indica con N (^) k , il numero di unit´a statistiche che presentano valore non superiore ( ) alla modalit´a a (^) (k) ; in simboli

N (^) k = n 1 + + n (^) k =

k

i=

n (^) i

Frequenze cumulate (2)

Analogamente son definite le frequenze relative cumulate indicate con F (^) k

F (^) k = f 1 + + f (^) k =

k

i=

f (^) i

e le frequenze percentuali cumulate indicate con P (^) k

P (^) k = p 1 + + p (^) k =

k

i=

p (^) i

Tipi di grafici

Vari tipi di grafici a secondo del tipo di carattere:

Diagramma a barre

Diagramma a torta

Diagramma a pettine

Istogramma

Diagramma a scatola (o boxplot)

...

Diagrammi a barre

Utilizzato per illustrare una distribuzione di frequenza per dati qualitativi nominali o qualitativi ordinali

Asse orizzontale: categorie in cui rientrano le osservazioni (modalit`a della variabile)

Asse verticale: frequenze assolute o relative di ciascuna modalit`a

Una barra verticale e tracciata al di sopra di ogni categoria, la cui altezza rappresenta la frequenza assoluta o relativa delle osservazioni aventi quella modalita

Diagrammi a barre: Esempio (1)

0 A AB B

Frequenza

0

5

10

15

20

Ogni modalita del carattere viene rappresentata da una barra verticale la cui altezzae proporzionale alla propria frequenza.

Diagrammi a torta

Per caratteri qualitativi nominali o ordinati ciclici

Ogni fetta corrisponde ad una modalit`a del carattere in esame

L’angolo al centro corrispondente ad ogni fetta e proporzionale alla frequenza della modalita che si sta rappresentando

Per la modalit`a j se la indichiamo con f (^) j la sua frequenza, l’angolo al centro corrispondente gj si ottiene come gj = f^ j^100360

Istogramma (1)

Utilizzato per illustrare distribuzioni di frequenza per caratteri quantitativi discreti o continui suddivisi in classi

Asse orizzontale: classi, cio`e i punti che separano l’intervallo dagli intervalli contigui

Asse verticale: densit`a di frequenza associata a ciascun intervallo

Una barra verticale `e tracciata al di sopra di ogni categoria in maniera tale che l’area sottesa dal rettangolo sia pari alla frequenza dell’intervallo.

Se tutti gli intervalli hanno la stessa ampiezza ... la densita di frequenzae proporzionale alle frequenze.

Istogramma (2)

Come detto l’istogramma `e costituito da rettangoli non distanziati, con basi uguali all’ampiezze delle classi e area pari alla corrispondente frequenza.

l’altezza del rettangolo `e uguale quindi al rapporto tra la frequenza e l’ampiezza di classe

Tale rapporto si chiama densit`a di frequenza.

h (^) j = n (^) j A (^) j

dove A (^) j `e l’ampiezza della classe j

Misure di tendenza centrale

La tendenza centrale e la misura piu appropriata per sintetizzare l’insieme delle osservazioni, se una distribuzione di dati dovesse essere descritta con un solo valore ed `e la prima indicazione della dimensione del fenomeno.

Questi indici servono per individuare il valore intorno al quale i dati sono raggruppati.

Principali indici di posizione:

Media

Mediana

Moda

Media ponderata: Esempio

Voti universitari

Supponiamo di avere svolto 5 esami con i seguenti voti:

Esane Voto CFU FISICA MEDICA 28 7 METODOLOGIA MEDICO SCIENTIFICA E SCIENZE UMANE 26 7 STATISTICA MEDICA 20 3 CHIMICA E PROPEDEUTICA BIOCHIMICA 30 8 ANATOMIA UMANA E CLINICA 28 4

La media ponderata per la variabile “voto” sulla quale i pesi sono definiti in base ai crediti formativi CFU.

X¯ =^28 7 + 26^ 7 + 20^ 3 + 30^ 8 + 28^4 7 + 7 + 3 + 8 + 4

Calcolo della mediana (3)

Distribuzione di frequenze Nel caso in cui i dati fossero disponibili come tabella di frequenza il calcolo della mediana va fatto sfruttando le frequenze cumulate e la funzione di ripartizione.

La mediana coincide infatti con la modalit`a per cui la frequenza cumulata relativa supera per la prima volta il valore 0.

Esempio: Numero di Figli n (^) i f (^) i F (^) i 0 8 0.148 0. 1 14 0.259 0. 2 20 0.370 0. 3 6 0.111 0. 4 4 0.074 0. 5 2 0.037 1. Totale 54 1 La mediana in questo caso `e quindi 2!

Quantili

La mediana pu`o essere interpretata come quel valore che divide in due la distribuzione. E un caso particolare di pi`` u generali indicatori chiamati quantili, che dividono una distribuzione in un numero di parti di ugual frequenza.

A seconda del numero di porzioni equivalenti al quale ci si riferisce, i quantili assumono nomi di↵erenti: se le porzioni sono quattro, si parla di quartili; se sono dieci si parla di decili; se sono cento si parla di percentili.