












































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Slide date a lezione di statistica
Tipologia: Dispense
1 / 52
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!













































A meno che la numerosit´a della popolazione sia ridotta, ´e molto di cile che i dati grezzi raccolti forniscano qualche informazione sul fenomeno in studio finch´e non siano stati ordinati e sintetizzati in qualche modo.
Un primo modo per visualizzare sinteticamente l’insieme dei dati individuali ´e ricorrere alla cosiddetta distribuzione di frequenza la quale indica come le unit´a della popolazione si distribuiscono rispetto alle modalit´a del carattere in esame.
Indichiamo col termine frequenza assoluta di una modalit´a di un carattere il numero delle volte che questa viene osservata nel collettivo.
La distribuzione di frequenze semplice associa alle modalit´a che pu´o assumere un carattere X le corrispondenti frequenze assolute.
La distribuzione di frequenze semplice del carattere X ´e rappresentata nella tabella riportata qui sotto.
X n (^) i a 1 n (^1)
a (^) j n (^) j
a (^) K n (^) K
Se il carattere considerato ´e quantitativo o qualitativo ordinale, pu´o essere utile conoscere con quale frequenza le unit´a statistiche presentano una modalit´a inferiore o al pi´u uguale ad una certa modalit´a. Tale informazione ´e fornita dalle frequenze cumulate.
In generale, dato un carattere X con K modalit´a ordinate in senso crescente a (^) (1) a (^) (k) a (^) (K ) Si definisce frequenza assoluta cumulata e si indica con N (^) k , il numero di unit´a statistiche che presentano valore non superiore ( ) alla modalit´a a (^) (k) ; in simboli
N (^) k = n 1 + + n (^) k =
k
i=
n (^) i
Analogamente son definite le frequenze relative cumulate indicate con F (^) k
F (^) k = f 1 + + f (^) k =
k
i=
f (^) i
e le frequenze percentuali cumulate indicate con P (^) k
P (^) k = p 1 + + p (^) k =
k
i=
p (^) i
Vari tipi di grafici a secondo del tipo di carattere:
Diagramma a barre
Diagramma a torta
Diagramma a pettine
Istogramma
Diagramma a scatola (o boxplot)
...
Utilizzato per illustrare una distribuzione di frequenza per dati qualitativi nominali o qualitativi ordinali
Asse orizzontale: categorie in cui rientrano le osservazioni (modalit`a della variabile)
Asse verticale: frequenze assolute o relative di ciascuna modalit`a
Una barra verticale e tracciata al di sopra di ogni categoria, la cui altezza rappresenta la frequenza assoluta o relativa delle osservazioni aventi quella modalita
0 A AB B
Frequenza
0
5
10
15
20
Ogni modalita del carattere viene rappresentata da una barra verticale la cui altezzae proporzionale alla propria frequenza.
Per caratteri qualitativi nominali o ordinati ciclici
Ogni fetta corrisponde ad una modalit`a del carattere in esame
L’angolo al centro corrispondente ad ogni fetta e proporzionale alla frequenza della modalita che si sta rappresentando
Per la modalit`a j se la indichiamo con f (^) j la sua frequenza, l’angolo al centro corrispondente gj si ottiene come gj = f^ j^100360
Utilizzato per illustrare distribuzioni di frequenza per caratteri quantitativi discreti o continui suddivisi in classi
Asse orizzontale: classi, cio`e i punti che separano l’intervallo dagli intervalli contigui
Asse verticale: densit`a di frequenza associata a ciascun intervallo
Una barra verticale `e tracciata al di sopra di ogni categoria in maniera tale che l’area sottesa dal rettangolo sia pari alla frequenza dell’intervallo.
Se tutti gli intervalli hanno la stessa ampiezza ... la densita di frequenzae proporzionale alle frequenze.
Come detto l’istogramma `e costituito da rettangoli non distanziati, con basi uguali all’ampiezze delle classi e area pari alla corrispondente frequenza.
l’altezza del rettangolo `e uguale quindi al rapporto tra la frequenza e l’ampiezza di classe
Tale rapporto si chiama densit`a di frequenza.
h (^) j = n (^) j A (^) j
dove A (^) j `e l’ampiezza della classe j
La tendenza centrale e la misura piu appropriata per sintetizzare l’insieme delle osservazioni, se una distribuzione di dati dovesse essere descritta con un solo valore ed `e la prima indicazione della dimensione del fenomeno.
Questi indici servono per individuare il valore intorno al quale i dati sono raggruppati.
Principali indici di posizione:
Media
Mediana
Moda
Voti universitari
Supponiamo di avere svolto 5 esami con i seguenti voti:
Esane Voto CFU FISICA MEDICA 28 7 METODOLOGIA MEDICO SCIENTIFICA E SCIENZE UMANE 26 7 STATISTICA MEDICA 20 3 CHIMICA E PROPEDEUTICA BIOCHIMICA 30 8 ANATOMIA UMANA E CLINICA 28 4
La media ponderata per la variabile “voto” sulla quale i pesi sono definiti in base ai crediti formativi CFU.
X¯ =^28 7 + 26^ 7 + 20^ 3 + 30^ 8 + 28^4 7 + 7 + 3 + 8 + 4
Distribuzione di frequenze Nel caso in cui i dati fossero disponibili come tabella di frequenza il calcolo della mediana va fatto sfruttando le frequenze cumulate e la funzione di ripartizione.
La mediana coincide infatti con la modalit`a per cui la frequenza cumulata relativa supera per la prima volta il valore 0.
Esempio: Numero di Figli n (^) i f (^) i F (^) i 0 8 0.148 0. 1 14 0.259 0. 2 20 0.370 0. 3 6 0.111 0. 4 4 0.074 0. 5 2 0.037 1. Totale 54 1 La mediana in questo caso `e quindi 2!
La mediana pu`o essere interpretata come quel valore che divide in due la distribuzione. E un caso particolare di pi`` u generali indicatori chiamati quantili, che dividono una distribuzione in un numero di parti di ugual frequenza.
A seconda del numero di porzioni equivalenti al quale ci si riferisce, i quantili assumono nomi di↵erenti: se le porzioni sono quattro, si parla di quartili; se sono dieci si parla di decili; se sono cento si parla di percentili.