























Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
1) Distribuzioni statistiche 2) Rappresentazioni grafiche 3) Numeri indici
Tipologia: Esercizi
1 / 31
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!
























1) Distribuzioni statistiche
2) Rappresentazioni grafiche
3) Numeri indici
1) Distribuzioni statistiche
1.1) In generale
In ogni indagine statistica, completata la rilevazione dei dati, si procede alla loro rappresentazione
in forma tabellare, pervenendo ad una distribuzione statistica.
Le distribuzioni costituiscono il primo “gradino” dell’analisi dei dati: su esse si svolgeranno tutte le
opportune indagini di approfondimento servendosi dei vari strumenti statistici.
Le distribuzioni sono dette unitarie se è stato rilevato nella popolazione un solo carattere; se invece,
come spesso accade, si rilevano più caratteri contemporaneamente, si avranno distribuzioni multiple
(doppie nel caso di due caratteri, triple nel caso di tre, ecc.). Nel primo caso, a seguito dello spoglio
dei dati ci si troverà di fronte ad una tabella di tipo unitario, nel secondo si avrà una matrice di dati.
Esempio 1
E’ stata rilevata l’età in anni compiuti di 10 studenti:
24 20 19 21 20 20 22 21 19 20.
Si tratta di una rilevazione di un solo carattere; la tabella unitaria che ne deriva è la seguente (gli
studenti sono stati indicati con le lettere dell’alfabeto):
Studenti Età A 24 B 20 C 19 D 22 E 20 F 20 G 23 H 22 I 19 L 20
Se invece si fossero rilevati, sempre su queste persone, tre caratteri simultaneamente, e cioè età (in
anni), altezza (in cm) e peso (in Kg), si sarebbe avuta la seguente matrice dei dati:
Studenti Età Altezza Peso A 24 168 65 B 20 176 75 C 19 173 76 D 22 184 75 E 20 177 62 F 20 180 81 G 23 171 69 H 22 173 70 I 19 175 75 L 20 171 60
Si nota facilmente che non è consigliabile seguire questa procedura (cioè elencare una ad una tutte
le unità del collettivo studiato) quando la popolazione è molto numerosa; oltre all’eccessiva lun-
ghezza delle matrici dei dati ci si troverebbe quasi sicuramente a dover indicare ripetutamente le
modalità dei caratteri che si presentano più volte.
Per ovviare a questo inconveniente e sintetizzare in modo adeguato le informazioni raccolte si ricor-
re alle distribuzioni di frequenza : in esse si tiene conto di quante volte le modalità dei caratteri
studiati si sono presentate nel collettivo osservato.
Riprendendo l’esempio con riferimento al carattere “età”, si nota che vi sono due studenti di 19 an-
ni, quattro di 20 e due di 21: con le distribuzioni di frequenza si sintetizzano queste informazioni
indicando che nel collettivo osservato due studenti hanno 19 anni, quattro ne hanno 20 e quattro ne
hanno 21. Così, mentre prima nella tabella comparivano i riferimenti a tutte le persone ed alle loro
età, ora se ne può predisporre un’altra in cui si indicano le diverse età (modalità) che si riscontrano
nel collettivo assieme al numero di unità che le presentano.
In altre parole è stato introdotto il concetto di frequenza assoluta : ad ogni modalità xj del carattere
X si associa il numero nj delle unità statistiche del collettivo che si sono manifestate con tale moda-
lità. La distribuzione di frequenza dell’esempio è la seguente:
Modalità xj Frequenze assolute nj 19 2 20 4 22 2 23 1 24 1
Si noti che nella distribuzione statistica unitaria la tabella ha tante righe quante sono le unità del col-
lettivo (nell’esempio sono 10). Invece la distribuzione di frequenza ha tante righe quante sono le di-
verse modalità del carattere (nell’esempio sono 5).
Naturalmente, essendo N il totale del collettivo e k le modalità che il carattere assume, si deve ave-
re:
k
j
N nj 1
nell’esempio si ha infatti:
5
1
j
nj
1.2) Distribuzioni e tipologia dei caratteri
La natura del carattere studiato influenza la forma delle distribuzioni, oltre ad imporre, in sede di
analisi, l’uso di strumenti diversi. In generale, i caratteri statistici si distinguono in:
A loro volta, i caratteri qualitativi si dividono in:
Invece i caratteri quantitativi si dividono in:
intermedie);
rattere può assumere).
DIPLOMA Classico^ Scientifico^ Tecnico
LAUREA
Giurisprudenza 48 24 30 102 Ingegneria 6 30 12 48 Statistica 12 24 6 42 Economia 36 18 54 108 102 96 102 300
Esempio 3 b
Caratteri “reddito mensile” (in euro) e “titolo di studio” (uno quantitativo e l’altro qualitativo) rile-
vati su 16 0 persone:
TITOLO Lic. element. Lic. media Diploma Laurea
0 - 1000 19 14 10 7 50 1000 – 2000 10 27 28 10 75 2000 - 3000 5 4 12 14 35 34 45 50 31 160
Esempio 3 c
Caratteri “numero figli” e “spesa alimentare mensile” in euro (entrambi quantitativi) rilevati su 2 00
famiglie:
0 – 200 8 9 5 2 24 400 – 600 18 23 11 5 57 600 – 800 12 28 19 10 69 800 - 1000 7 18 13 12 50 45 78 48 29 200
1.3 ) Frequenze relative
La frequenza relativa di una data modalità xj è pari al rapporto fra la corrispondente frequenza as-
soluta nj e il totale N del collettivo:
n f
j j
La frequenza relativa esprime la frazione dei casi osservati che presentano una data modalità del ca-
rattere; se si moltiplica per 100 tale frazione assume il significato di percentuale.
La somma di tutte le frequenze relative è pari ad uno (100% se ci si riferisce alle frequenze percen-
tuali).
Scopo del ricorso alle frequenze relative è rendere possibile il confronto fra distribuzioni dello stes-
so carattere ma di numerosità diversa.
Esempio 4
Calcolare le frequenze relative delle distribuzioni viste negli esempi 2 a , 2 b , 2 c.
2 a
Esame ( xj ) Frequenze assolute ( nj ) Economia aziendale 25 Matematica 75 Storia economica 150
Frequenza relativa della modalità “Economia aziendale”: 0 , 10 10 %
250
n f
Frequenza relativa della modalità “Matematica”: 0 , 30 30 %
250
n f
Frequenza relativa della modalità “Storia economica”: 0 , 60 60 % 250
n f
Somma delle frequenze relative: f 1 f 2 f 3 0 , 10 0 , 30 0 , 60 1
Somma delle frequenze percentuali: f 1 f 2 f 3 10 % 30 % 60 % 100 %
Interpretazione dei risultati:
In sintesi, la tabella precedente può essere arricchita con un’ulteriore colonna:
Esame ( xj ) nj fj
Economia aziendale 25 0, 10 Matematica 75 0,3 0 Storia economica 150 0, 250 1
2 b
Titolo ( xj ) Frequenze assolute ( nj ) Nessuno 4 Licenza elementare 28 Licenza media 54 Diploma 78 Laurea 36
Frequenza relativa della modalità nessun titolo: 0 , 02 2 % 200
n f
Frequenza relativa della modalità lic. elementare: 0 , 14 14 %
200
n f
Frequenza relativa della modalità lic. media: 0 , 27 27 %
200
n f
Frequenza relativa della modalità diploma: 0 , 39 39 % 200
n f
Frequenza relativa della modalità laurea: 0 , 18 18 % 200
n f
Somma delle frequenze relative: f 1 f 2 f 3 f 4 f 5 0 , 02 0 , 14 0 , 27 0 , 39 0 , 18 1
Quindi:
x (^) j n (^) j fj
Nessuno 4 0, Licenza elementare 28 0, Licenza media 54 0, Diploma 78 0, Laurea 36 0, 200 1
Per il secondo collettivo si ha invece:
n f
n f
n f
n f
n f
Si ha pertanto:
Primo collettivo
Secondo collettivo
x (^) j n (^) j f (^) j n (^) j fj
1 20 0,133 40 0, 2 60 0 ,400 120 0, 3 55 0,367 150 0, 4 10 0,067 70 0, 5 5 0,033 20 0, 150 1 400 1
Si veda cosa accade in corrispondenza della modalità 1 componente:
Che significa?
Nel secondo collettivo c’è un maggior numero in assoluto di famiglie con 1 componente, ma nel
primo l’incidenza di tali famiglie è più rilevante.
Dunque considerando anche le frequenze relative è stata rilevata un’informazione aggiuntiva molto
importante che non era possibile ricavare dall’analisi delle sole frequenze assolute.
Le stesse considerazioni valgono anche per la modalità 2 componenti.
1.4) Frequenze cumulate
(SOLO PER CARATTERI QUANTITATIVI E QUALITATIVI ORDINABILI)
Spesso è utile conoscere il numero o la proporzione di unità statistiche con modalità minore o ugua-
le ad una determinata modalità x (^) j , cioè quante unità possiedono un ammontare del carattere infe-
riore ad un dato valore.
Queste informazioni si ottengono considerando rispettivamente le FREQUENZE CUMULATE
ASSOLUTE e le FREQUENZE CUMULATE RELATIVE. In simboli, rispetto alla generica moda-
lità x (^) j , si ha:
j
i
N (^) j ni 1
Frequenze cumulate assolute
j
i
F (^) j fi 1
Frequenze cumulate relative
Esempio 6
Calcolare le frequenze cumulate (assolute e relative) delle distribuzioni degli esempi 2 b e 2 c.
2 b
x (^) j n (^) j fj
Nessuno 4 0, Licenza elementare 28 0, Licenza media 54 0, Diploma 78 0, Laurea 36 0, 200 1
Frequenze cumulate (assoluta e relativa) della prima modalità:
1
1
N n n i
i
1
1
i
F fi f
Frequenze cumulate della seconda modalità:
2
1
N n n n i
i
2
1
i
F fi f f
Frequenze cumulate della terza modalità:
3
1
N n n n n i
i
3
1
i
F fi f f f
Frequenze cumulate della quarta modalità:
4
1
N n n n n n i
i
4
1
i
F fi f f f f
Frequenze cumulate della quinta (e ultima) modalità:
5
1
N n n n n n n i
i
5
1
i
F fi f f f f f
Quindi:
x (^) j n (^) j f (^) j N (^) j Fj
Nessuno 4 0,02 4 0, Licenza elementare 28 0,14 32 0, Licenza media 54 0,27 86 0, Diploma 78 0,39 164 0, Laurea 36 0,18 200 1 200 1
4
1
N n n n n n N n i
i
4
1
i
F fi f f f f F f
Per l’ultima modalità:
N n n n n n n N n N i
5
1
5
5
1
i
F fi f f f f f F f
Quindi:
Si ha pertanto:
x (^) j n (^) j f (^) j N (^) j Fj
1 20 0,13 3 20 0, 2 60 0,400 80 0, 3 55 0,367 135 0, 4 10 0,067 145 0, 5 5 0,033 150 1 150 1
1.5) Distribuzioni per classi
Come detto, i caratteri continui possono manifestarsi con infinite modalità per cui, in sede di analisi,
si presentano serie difficoltà, dovute all’impossibilità pratica di redigere un elenco delle modalità.
Si procede quindi alla suddivisione in intervalli (CLASSI) delle modalità del carattere, operazione
necessaria per sintetizzare convenientemente le informazioni del collettivo.
Individuate le classi, si associa ad esse la frequenza assoluta (e, se del caso, le frequenze relative e
cumulate) con lo stesso significato visto nei casi precedenti.
E’ importante che le classi siano esaustive e disgiunte: devono cioè comprendere tutte le modalità
osservate, ed ogni modalità deve essere univocamente attribuita ad una sola classe.
Nella costruzione delle classi assume rilevanza la loro AMPIEZZA, che si ottiene dalla differenza
fra l’estremo superiore e l’estremo inferiore; a questo proposito possono prospettarsi due situazioni:
classi di UGUALE ampiezza;
necessità di fornire una sintesi più stringente delle informazioni: la distribuzione può presentarsi in
classi di DIVERSA ampiezza.
Gli esempi 3 b – 3 c hanno già anticipato casi in cui un carattere (rispettivamente reddito e spesa a-
limentare) è distribuito in classi.
Per indicare che l'estremo inferiore della classe è ESCLUSO, mentre quello superiore è INCLUSO,
si può utilizzare il simbolo – ׀ , oppure racchiudere gli estremi della classe nelle parentesi ( ]. Così,
nella classe di reddito 1000 – 2000 ׀, il reddito di 1000 euro esatti è escluso, mentre il reddito di
2000 euro esatti è incluso.
Invece i simboli ׀–, o le parentesi [ ), indicano che l'estremo inferiore della classe è INCLUSO,
mentre quello superiore è ESCLUSO.
Esempio 7
E’ stato rilevato il carattere “peso” (Kg) su 12 0 persone; dato l’alto numero di osservazioni, il carat-
tere viene presentato nelle seguenti classi:
Classi di Xi ni
50 ׀– 60 34 60 ׀– 70 22 70 ׀– 80 40 80 ׀– 90 24 120
Calcolare le frequenze relative e cumulate.
Anche se il carattere è presentato in classi per i calcoli richiesti non sorgono difficoltà aggiuntive ri-
spetto agli esempi precedenti, in quanto continuano ad applicarsi le stesse definizioni di prima; si ha
pertanto:
n f
n f
n f
n f
Quindi:
Classi di Xj n^ j f^ j N^ j Fj
׀ 50– 60 34 0 ,283 34 0, 60 ׀– 70 22 0,183 56 0, ׀ 70– 80 40 0,333 96 0, ׀ 80– 90 24 0,200 120 1 120 1
1.6 ) Distribuzioni multiple
In precedenza si è osservato che spesso nella pratica vengono rilevati più caratteri simultaneamente,
originando le distribuzioni multiple. Rinviando a quanto già detto sull’argomento, ora si concentra
l’attenzione sulle distribuzioni doppie: da esse possono ricavarsi varie distribuzioni semplici, in cui
si tiene ferma la modalità di un carattere e si osserva, condizionatamente a questa, la distribuzione
dell’altro carattere.
Esempio 9
Si riprende l’esempio 3 a
DIPLOMA Classico^ Scientifico^ Tecnico
LAUREA
Giurisprudenza 48 24 30 102 Ingegneria 6 30 12 48 Statistica 12 24 6 42 Economia 36 18 54 108 102 96 102 300
La prima riga della tabella è detta RIGA MADRE, e fornisce le modalità del carattere diploma.
La prima colonna della tabella è detta COLONNA MADRE e fornisce le modalità del carattere lau-
rea.
L’ultima riga e l’ultima colonna sono dette RIGA MARGINALE e COLONNA MARGINALE e
forniscono la distribuzione di un carattere indipendentemente da quella dell’altro. Ad esempio, dalla
colonna marginale si ricava che, su 30 0 persone, 102 sono laureate in giurisprudenza,48 in ingegne-
ria, 42 in statistica e 108 in economia INDIPENDENTEMENTE dal tipo di diploma che possiedo-
no.
Dalla tabella doppia si possono ricavare 9 distribuzioni semplici, di cui:
(diploma classico, scientifico, tecnico), ad esempio:
Laurea Dipl. Scient. Giurisprudenza 24 Ingegneria 30 Statistica 24 Economia 18 96
interpretazione: nel collettivo ci sono 96 persone con maturità scientifica: di queste, 24 sono laurea-
te in giurisprudenza, 30 in ingegneria, 24 in statistica, 18 in economia.
in giurisprudenza, ingegneria, statistica, economia), ad esempio:
Diploma Economia Classico 36 Scientifico 18 Tecnico 54 108
interpretazione: nel collettivo ci sono 108 laureati in economia: di questi, 36 hanno la maturità clas-
sica, 18 quella scientifica e 54 quella tecnica.
Diploma Freq. assolute Classico 102 Scientifico 96 Tecnico 102 300
interpretazione: nel collettivo ci sono 102 persone con maturità classica, 96 con maturità scientifica
e 102 con maturità tecnica, INDIPENDENTEMENTE dal tipo di laurea poi conseguito.
ginale
Laurea Freq. assolute Giurisprudenza 102 Ingegneria 48 Statistica 42 Economia 108 300
E’ pertanto possibile calcolare le frequenze relative e cumulate sia per la distribuzione doppia che
per tutte le distribuzioni semplici.
N.B: in questo esempio NON è possibile calcolare le frequenze cumulate perché i caratteri non sono
ordinabili.
Le frequenze relative per colonna sono:
DIPLOMA Classico Scientifico Tecnico
LAUREA
Giurisprudenza 0,471 0,25 0,294 0, Ingegneria 0,059 0,3125 0,118 0, Statistica 0,118 0,25 0,059 0, Economia 0,353 0,1875 0,529 0, 1 1 1 1
dove 0,471 = 48/ 102 ecc., 0,25 = 24 / 96 ecc. 0,294 = 30 / 102 e così via.
Interpretazione:
statistica e il 35,3% in economia
Le frequenze relative per riga sono:
DIPLOMA Classico Scientifico Tecnico
LAUREA
Giurisprudenza 0,471 0,235 0,294 1 Ingegneria 0,125 0,625 0,25 1 Statistica 0,286 0,571 0,143 1 Economia 0,333 0,167 0,50 1 0,34 0,32 0,34 1
Tabella b - Frequenze cumulate per riga:
FIGLI 0 1 2 3
0 - (^200 540 840 895 )
200 - (^400 350 1060 1525 )
400 – (^600 115 535 1055 )
600 – (^800 35 235 610 )
1040 2670 4085 5000
Tabella c - Frequenze relative per colonna:
FIGLI 0 1 2 3
SPESA
0 - 200 0,519 0,184 0,039 0,022 0, 200 - 400 0,337 0,436 0,329 0,268 0, 400 – 600 0,111 0,258 0,367 0,388 0, 600 – 800 0,033 0,122 0,265 0,322 0, 1 1 1 1 1
Tabella d - Frequenze cumulate per colonna
FIGLI 0 1 2 3
SPESA
0 - 200 540 300 55 20 915 200 - 400 890 1010 520 265 2685 400 – 600 1005 1430 1040 620 4095 600 – 800 1040 1630 1415 915 5000
E’ richiesta la frequenza cumulata indicata nella tabella d in corrispondenza delle modalità 1 figlio-
reddito (400-600), che è 1430; la percentuale è pari a:
(0,184 + 0,436 + 0,258) = 0,878 quindi 87,8%
La percentuale si ricava dalla tabella a in corrispondenza delle modalità 0 figli e reddito 200-400,
quindi è 0,198 cioè il 19,8%.
0 - 200 0,108 0,060 0,011 0,004 0, 200 - 400 0,070 0,142 0,093 0,049 0, 400 – 600 0,023 0,084 0,104 0,071 0, 600 – 800 0,007 0,040 0,075 0,059 0, 0,208 0,326 0,283 0,183 1
Esercizio 1.8)
Dati i valori riportati nella seguente tabella relativi ad un collettivo composto da 400 individui, dei
quali 24 0 maschi e 16 0 femmine:
Classi di età M % F% 10 - 20 10 10 20 - 35 25 20 35 - 55 35 30 55 - 65 30 40 Totale 100 100
Determinare:
a) il numero di individui maschi di età compresa fra i 20 e i 5 5 anni;
b) la percentuale di individui di entrambi i sessi di età 35.
Gli individui maschi di età compresa fra 20 e 55 anni costituiscono il 25% + 35% = 60% del totale
dei maschi; essendo quest’ultimo pari a 24 0 risulta:
2 40 * 60 / 100 = 144 individui
b)
Bisogna prima ricavare la frequenza assoluta di maschi e di femmine con più di 35 anni. In percen-
tuale, i maschi con più di 35 anni rappresentano il 35% + 30% = 65% del totale, mentre le femmine
il 30% + 40% = 70% del totale. Risulta dunque:
Maschi con più di 35 anni = 24 0 * 65 / 100 = 156
Femmine con più di 35 anni = 160 * 70 / 100 = 112
Totale individui con più di 35 anni = 156 + 11 2 = 268
Percentuale di individui con più di 35 anni = 268 / 4 00 * 100 = 67 %
Esercizio 1.9)
Un gruppo di 16 studenti è stato classificato in funzione del sesso e del voto riportato ad un esame,
come indicato nel seguente prospetto
M M F F M F M M F M F F M F F F
30 20 30 20 22 23 24 24 25 26 26 28 21 30 18 30
Costruire la distribuzione di frequenza bivariata, utilizzando i seguenti intervalli di classi di voto:
18 - 20, 21-23, 24-26, 27- 30
Risulta:
Voto M F Tot 18 - 20 1 2 3 21 - 23 2 1 3 24 - 26 3 2 5 27 - 30 1 4 5 Totale 7 9 16
Statistica 360° * 0,20 = 72° Matematica 360° * 0,14 = 50,4° Economia Az. 360° * 0,30 = 108° Diritto Privato 360° * 0,36 = 129,6°
2.2) Diagrammi a barre
Un altro tipo di rappresentazione utilizzabile per caratteri qualitativi e quantitativi è dato dai dia-
grammi a barre. Essi sono costituiti da una serie di rettangoli, aventi tutti la stessa base e con altezza
proporzionale alle frequenze corrispondenti a ciascuna modalità.
Esempio 2
Rappresentare tramite diagramma a barre la seguente distribuzione relativa ad un collettivo di stu-
denti classificati in base al numero di anni compiuti:
Anni compiuti Frequenze 18 5 19 9 20 7 21 4 23 1 24 2 28
0
1
2
3
4
5
6
7
8
9
10
18 19 20 21 22 23 24
2.3) Istogrammi (caratteri continui in classi)
Gli istogrammi costituiscono di gran lunga le rappresentazioni grafiche più importanti: sono dati da
rettangoli contigui con base pari all’ampiezza delle classi, mentre le aree sono uguali o proporziona-
li alle frequenze di classe.
A questo proposito sono prospettabili due situazioni:
In queste situazione le basi dei rettangoli sono tutte uguali, per cui basta che le altezze siano uguali
o proporzionali alle frequenze di classe perché lo siano anche le aree.
Esempio 3
Rappresentare con istogramma la seguente distribuzione:
Classi di Xi ni
50 – 60 44 60 – 70 32 70 – 80 50 80 - 90 34 160
0
10
20
30
40
50
60
50 - 60 60 - 70 70 - 80 80 - 90
Nell’istogramma appena disegnato:
infatti:
10 * 44 = 440 10 * 32 = 320 10 * 50 = 500 10 * 34 = 340
440 + 320 + 500 + 340 = 1600 con 1600 = 160 * 10
In questo caso le basi dei rettangoli sono diverse, per cui, per garantire la proporzionalità fra le aree
e le frequenze di classe, le altezze NON devono essere pari o proporzionali alle frequenze, ma alle
DENSITA’ di frequenza. Tali densità si ottengono dal rapporto fra la frequenza di classe e la corri-
spondente ampiezza:
i
i i a
n h