Scarica Lezione 1-2 Statistica e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!
Cos’è la statistica
• Statistiche: al plurale, sinonimo di dati
• Statistica: al singolare, è la disciplina che
analizza le statistiche, i dati, cercando di
estrarne informazioni utili
L’enorme mole di dati resi oggi disponibili
dalla digitalizzazione, rende la statistica
indispensabile in qualsiasi ambito. 1
3
Statistica e Economia
- Descrizione dello stato e dell’andamento nel
tempo dei fenomeni economici
- Analisi dei comportamenti degli operatori
economici
- Previsioni sulla dinamica degli aggregati
economici
- Analisi dei processi e dei risultati produttivi e
gestionali
- Valutazione delle condizioni del mercato
- Pianificazione delle strategie di marketing
- Scelta tra portafogli alternativi
- Previsioni sulla dinamica delle misure finanziarie 4
Statistica: maneggiare
con cautela
- Mark Twain: «Di solito la gente usa le statistiche
come un ubriaco usa un lampione: per
appoggiarsi più che come fonte di illuminazione»
- Di seguito alcuni esempi di procedimenti giusti e
sbagliati per analizzare i dati.
5
ESEMPIO 1:
Nascite e
cicogne
6 Numero di nati in funzione del numero di cicogne 0 200 400 600 800 1000 1200 1400 1600 1800 0 5000 10000 15000 20000 25000 30000 35000 Coppie di cicogne Numero di nati (in migliaia) Il grafico mostra chiaramente che i paesi con più cicogne sono quelli con la natalità più elevata, avvalorando la tesi che le cicogne portino i bambini! 7 Numero di nati in funzione del numero di cicogne 0 0, 0, 0, 0, 0, 0, 0 0,0002 0,0004 0,0006 0,0008 0, Coppie di cicogne/numero di abitanti Numero di nati/numero abitanti Un’analisi corretta deve tenere conto della diversa dimensione dei paesi considerati: in questo modo si conclude correttamente che non c’è relazione tra numero di cicogne e di nati. 8
ESEMPIO 2:
• “Gli automobilisti corretti? Solo l’8%”.
(Corriere della Sera del 25/08/2003)
• Dal titolo siamo portati a pensare che
quasi tutti gli automobilisti sono scorretti.
- Quando, molti anni fa, la John Hopkins
University (USA) iniziò ad accettare anche le
donne come studenti, qualcuno pensò di
riportare la notizia secondo la quale il 33,3%
delle studentesse aveva sposato un insegnante.
- Ma a quell’epoca le donne iscritte erano solo tre
ed una aveva sposato un professore
13
ESEMPIO 4: Esempio 5:
14 15 16
Esempio 6:
La letalità del Covid 19 in Italia (https://www.infodata.ilsole24ore.com/2020/03/15/coronavirus-piu-letale-italia-dati- spiegati-bene/)
- Le barre rappresentano il tasso di letalità, ovvero la percentuale di decessi sul totale dei contagiati, nei Paesi che, al 10 marzo 2020, avevano registrato almeno 100 casi complessivi ed almeno un decesso.
- La larghezza delle colonne fa riferimento al totale complessivo dei contagiati, dato utilizzato anche per ordinare le nazioni da sinistra verso destra.
- Come si può notare la barra più alta, che corrisponde ad un tasso di letalità maggiore, riguarda proprio l’Italia. Dove, al 10/03/2020, il 6,2% delle persone cui è stato diagnosticato il coronavirus è morta. In Cina siamo al 3,9%, in Iran al 3,6%, in Corea del Sud addirittura allo 0,7%. I dati sembrano dire che in Italia si muore di più. La realtà dei fatti, però, potrebbe essere diversa.
17
Il lessico della Statistica:
qualche definizione
- Statistica: insieme dei principi ai quali dovrebbero
ispirarsi la raccolta e l’elaborazione dei dati
concernenti fenomeni collettivi
- Statistica descrittiva: si occupa dell’analisi di un
fenomeno relativo a un certo gruppo di soggetti
(popolazione) sulla base di una rilevazione completa
delle informazioni (censimento). Tali informazioni
vengono sintetizzate tramite opportuni indici statistici.
- Inferenza statistica: basandosi su un campione
estratto dalla popolazione di interesse, trae
conclusioni sull’intera popolazione
18
• Popolazione: insieme di riferimento del
fenomeno oggetto di studio
• Unità statistica: singolo caso che compone la
popolazione
• Carattere: caratteristica oggetto di rilevazione
sulle unità statistiche che formano il collettivo
• Modalità di un carattere: diversi modi con cui il
carattere si manifesta nelle unità statistiche
19
Esempio
- Fenomeno collettivo che si intende studiare: rendimento degli studenti iscritti al corso di laurea EBAM dell’Università di Macerata nell’esame di Statistica, nell’A.A. 2014-
- Collettivo statistico: insieme degli studenti iscritti al corso di laurea EBAM dell’Università di Macerata nell’A.A. 2014-2015 e che hanno sostenuto l’esame di Statistica in quell’anno
- Unità statistica: singolo studente iscritto al corso di laurea EBAM dell’Università di Macerata nell’A.A. 2014-2015 e che ha sostenuto l’esame di Statistica in quell’anno
- Caratteri rilevati: sesso, regione di provenienza, tipo di scuola superiore, anno di corso, voto all’esame di statistica
- Matrice di dati: tabella con numero di righe pari al numero di unità statistiche e numero di colonne pari al numero di caratteri rilevati 20 Nome Sesso Regione Scuola superiore Anno Voto Verdi M. M Marche Lic. Scientifico II 26 Bianchi C. F Umbria Lic. Classico III 30 Rossi V. F Marche Ist. Tecnico F.C. 27 … … … … … … … … … … … … Unità statistiche Collettivo Caratteri Modalità
25
Rilevazioni statistiche
- Rilevazione statistica: insieme delle operazioni necessarie per il raccoglimento dei dati necessari ad un’indagine statistica
- A seconda del metodo, la rilevazione può essere:
- Sperimentale: il ricercatore controlla le condizioni sotto le quali si svolge l’osservazione
- Osservazionale: si osserva la realtà senza intervenire su di essa
- A seconda della complessità, la rilevazione può essere:
- Totale: si osservano tutte le unità della popolazione
- Parziale: si osserva un campione estratto dalla popolazione
- Tipici strumenti, di rilevazione sono:
- Intervista diretta
- Intervista telefonica
- Questionario postale
Esercizio
Il Dipartimento di Economia e Diritto ha necessità di ottenere informazioni riguardanti l’attitudine alla lettura degli studenti iscritti ai propri corsi di laurea e decide, per tale ragione, di realizzare un’indagine campionaria che risponda a queste esigenze.
- Supponendo di dover partecipare alla progettazione dell’indagine, si decida: (a) qual è il collettivo statistico oggetto di studio e l’unità statistica; (b) quali sono i caratteri che si ritengono più importanti per rispondere alle esigenze informative del Dipartimento e la loro natura, assieme alle corrispondenti modalità.
- Quale fonte di distorsione si introduce se si procede ad intervistare in modo casuale gli studenti che escono dalle lezioni. 26
Caso studio 1
27
I dati (fittizi) riportati nella tabella seguente sono estratti
dall’archivio dei clienti di una banca aggiornato al
31/12/2015. Per ciascun cliente sono stati registrati: il
sesso, l’età (in anni compiuti), l’ammontare del deposito
nel conto corrente (in Euro) ed un giudizio sulla
solvibilità (1= buona, 2=sufficiente, 3=scarsa).
I dati grezzi non forniscono informazioni, in quanto
scarsamente leggibili. Come estrarre informazioni utili
dai dati?
28 Cliente Sesso N.Comp. Deposito Giudizio … … … … … 1453 M 2 12.500 1 1454 M 3 43.780 2 1455 F 1 9.800 2 1456 M 2 11.345 3 1457 F 6 25.320 1 1458 M 2 12.500 1 1459 M 4 34.780 2 1460 F 1 9.800 2 1461 M 4 11.345 3 1462 F 3 25.320 1 1463 F 3 35.500 3 1464 F 2 12.500 2 1465 M 3 16.590 1 1466 M 2 5.650 2 1467 M 1 14.325 1 1468 F 2 11.080 3 1469 M 4 13.700 1 1470 F 5 19.240 2 1471 F 3 2.500 2 1472 M 2 37.340 3 … … … … …
29
Distribuzioni statistiche
- La rilevazione statistica produce come risultato la matrice dei dati Nome Sesso Regione Scuola superiore Anno Voto Verdi M. M Marche Lic. Scientifico II 26 Bianchi C. F Umbria Lic. Classico III 30 Rossi V. F Marche Ist. Tecnico F.C. 27 Gialli F. F Calabria Ist. Tecnico II 30 Neri A. M Marche Lic. Scientifico III 28
- Ogni colonna della matrice costituisce una distribuzione disaggregata secondo un singolo carattere. Si tratta dell’elencazione delle modalità osservate per ogni una unità x 1 , x 2 , …, xi, …,xn 30 - Una distribuzione di questo tipo si chiama semplice (rispetto ad un solo carattere) unitaria (unità per unità). x 1 , x 2 , …, xi, …,xn - Se si considerassero più caratteri congiuntamente avremmo una distribuzione multipla (es. doppia se si considerassero due caratteri) - Per sintetizzare una distribuzione disaggregata si fa uso di una distribuzione di frequenza che può essere semplice o multipla - Una distribuzione di frequenza semplice viene costruita associando a ognuna delle modalità distinte che sono state osservate, x 1 , x 2 , …, xi, …,xk la corrispondente frequenza assoluta che è pari al numero di unità statistiche che presentano quella modalità. Per la i-esima modalità, la frequenza assoluta viene indicata con ni. 31
- Una distribuzione di frequenza semplice viene rappresentata attraverso una tabella di questo tipo
Modalità (xi) Frequenze (ni)
x 1 n 1
x 2 n 2
xi ni
xk nk
Totale n
32
Esempio
- Dalla matrice di dati sugli studenti universitari, si possono ricavare 5 distribuzioni semplici secondo i caratteri: sesso, regione, scuola di provenienza, anno di corso e voto in Statistica.
- Per il carattere sesso, le modalità distinte sono M e F con frequenze pari, rispettivamente, a 2 e 3. La corrispondente distribuzione di frequenza è quindi:
Sesso (xi) Frequenze (ni)
M 2
F 3
Totale 5
Esercizio
Si considerino i dati del Caso Studio 1.
Si costruiscano le distribuzione doppie di frequenze
secondo i caratteri Sesso e Giudizio e secondo i
caratteri Numero di Componenti e Giudizio.
37 38
Suddivisione in classi
- Nel caso di un carattere quantitativo che assume
molte modalità (tipicamente continuo) è conveniente
considerare delle classi al posto delle singole
modalità distinte.
- Ogni classe viene identificata da due estremi (di
sinistra e di destra) che per la i-esima classe sono
indicati con ci-1 – ci.
- Le classi vanno scelte in modo che:
- il livello di sintesi sia adeguato
- siano tra loro disgiunte
- siano esaustive 39
- Una distribuzione di un carattere in classi viene rappresentata attraverso una tabella di questo tipo
Classi (ci-1 – ci) Frequenze (ni)
c 0 – c 1 n 1
c 1 – c 2 n 2
ci-1 – ci ni
ck-1 – ck nk
Totale n
40
Esempio
- Per il carattere voto in Statistica abbiamo la seguente distribuzione in classi.
Classi di voto ci-1 ci Frequenze (ni)
Totale - - 5
- In questo caso, al fine di avere estremi di classe coincidenti, si effettua la correzione per continuità: si sottrae 1/ all’estremo di sinistra di ogni classe e lo si aggiunge a quello di destra.
41
Esempio
- Popolazione residente per classi di età - Regione Marche - Censimento 2001 CLASSI DI ETÀ Popolazione residente (in migliaia) Meno di 15 189, 15-24 154, 25-34 216, 35-44 218, 45-54 193, 55-64 177, 65-74 168, 75 e più 152, Totale 1.470,
Esercizio
La seguente tabella riporta i dati relativi a 15 aziende agricole umbre (Id. Azienda) che hanno partecipato ad un bando per l’assegnazione di contributi da parte dell’Unione Europea. Si noti che il dato riguardante il Grado di innovazione nei processi dell’azienda (Innovazione) è stato codificato nel modo seguente: 1 = basso, 2 = medio, 3 = alto. Inoltre, il fatturato annuo di ciascuna azienda è espresso in migliaia di Euro. a) Qual è l’unità statistica? Quali sono i caratteri rilevati? E qual è la loro natura? b) Quali sono le modalità rilevate del carattere Grado di innovazione? Quali sono le modalità rilevate del carattere Anni di attività? c) Costruire la distribuzione doppia rispetto al Grado di innovazione e al fatturato (classi 0-5, 5-10, 10-15). 42 43 Id. Azienda 1 2 3 4 5 6 7 8 Anni di attività 3 8 13 2 11 18 6 1 Provincia PG TR TR PG TR PG PG PG Innovazione 1 3 2 1 1 2 1 2 Fatturato 5,1 6,8 10,3 14,7 3,5 8,9 11,3 4, Id. Azienda 9 10 11 12 13 14 15 Anni di attività 0 12 8 10 15 7 3 Provincia TR TR PG TR PG PG TR Innovazione 2 1 3 2 1 3 2 Fatturato 8,3 13,1 7 5,8 8,1 12,6 10,
Esercizio
Si considerino i dati del Caso Studio 1.
Si costruisca la distribuzione doppia di frequenze
secondo i caratteri Ammontare del Deposito e Giudizio.
Per il carattere Deposito si considerino le classi: Fino a
15.000, 15.000-30.000 e 30.000-45.000.
44
49
- Una distribuzione di frequenze assolute, relative e percentuali viene rappresentata attraverso una tabella di questo tipo
Modalità
(xi)
Frequenze
assolute (ni)
Frequenze
relative (fi)
Frequenze
percentuali (pi)
x 1 n 1 f 1 p 1
x 2 n 2 f 2 p 2
xi ni fi pi
xk nk fk pk
Totale n 1 100 50
Esempio
- Per il carattere voto in Statistica abbiamo la seguente
distribuzione in classi.
Classi di
voto
Frequenze
assolute (ni)
Frequenze
relative (fi)
Frequenze
percentuali (pi)
Totale 5 1 100
51
Esercizio
Una popolazione di 100 individui, di cui 60 donne e 40 uomini, viene intervistata circa le attitudini al fumo ottenendo le seguenti risposte: Uomini:0 0 1 0 0 0 1 0 1 1 1 0 0 0 0 1 0 0 1 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 1 1 0 0 1 0 Donne: 1 0 0 0 0 1 0 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 dove 1=fumatore e 0=non fumatore. a) Ricavare una tabella di distribuzione doppia b) Ricavare la distribuzione di frequenza relativa rispetto al carattere “Attitudine al fumo” separatamente per gli uomini e per le donne. c) Determinare la percentuale di fumatori tra gli intervistati.
Esercizio
Si considerino i dati del Caso Studio 1.
Si costruisca la distribuzione di frequenze relative e
percentuali secondo il carattere Giudizio, separatamente
per gli uomini e per le donne.
52
53
Frequenze cumulate
Famiglie per numero di componenti
- Italia Settentrionale - Censimento
NUMERO DI COMPONENTI Numero di famiglie (x 1000) 1 persona 2.883, 2 persone 3.048, 3 persone 2.352, 4 persone 1.667, 5 persone 391376 6 o più persone 106, Totale 10.449, - Quante sono le famiglie con al massimo due componenti? - Quante sono le famiglie con al massimo tre componenti? 54 Italia Settentrionale Italia Meridionale NUM. COMP. Num. famiglie Freq. ass. cum. Freq. rel. cum. Freq. perc. cum. Num. famiglie Freq. ass. cum. Freq. rel. cum. Freq. perc. cum. 1 2.883,250 2.883,250 0,276 27,593 1.482,466 1.482,466 0,208 20, 2 3.048,249 5.931,499 0,568 56,765 1.668,914 3.151,380 0,443 44, 3 2.352,645 8.284,144 0,793 79,280 1.412,246 4.563,626 0,641 64, 4 1.667,391 9.951,535 0,952 95,237 1.688,254 6.251,880 0,878 87, 5 391,376 10.342,911 0,990 98,983 665,876 6.917,756 0,972 97, 6 o più 106,299 10.449,210 1 100 201,511 7.119,267 1 100 Totale 10.449,210 7.119, 55
• Frequenza assoluta cumulata :
• Frequenza relativa cumulata:
• Frequenza percentuale cumulata:
56
- Una distribuzione di frequenze assolute, relative e percentuali cumulate viene rappresentata attraverso una tabella di questo tipo
Modalità
(xi)
Frequenze
assolute
cumulate
(Ni)
Frequenze
relative
cumulate
(Fi)
Frequenze
percentuali
cumulate
(Pi)
x 1 N 1 F 1 P 1
x 2 N 2 F 2 P 2
xi Ni Fi Pi
xk Nk Fk Pk
61
- Per una distribuzione di frequenza di un carattere qualitativo o quantitativo discreto, si utilizza un grafico a barre che consiste nel rappresentare, su un piano cartesiano, k barre di altezza n 1 ,…, nk in corrispondenza delle ascisse x 1 ,…, xk. Distribuzione degli studenti secondo il sesso 0 1 2 3 4 M F Frequenza
Esempio
Distribuzione degli studenti secondo il sesso 0 1 2 3 4 M F Frequenza 62
Esempi
Distribuzione delle famiglie residenti nell'Italia Settentrionale secondo il numero di componenti 0 500000 1000000 1500000 2000000 2500000 3000000 3500000 1 2 3 4 5 6 o più Numero di componenti Frequenza assoluta 63 Distribuzione delle famiglie residenti secondo il numero di componenti e la ripartizione geografica 0 500000 1000000 1500000 2000000 2500000 3000000 3500000 1 2 3 4 5 6 o più Numero di componenti Frequenza assoluta Italia Settentrionale Italia Meridionale 64 Distribuzione delle famiglie residenti secondo il numero di componenti e la ripartizione geografica 0, 0, 0, 0, 0, 0, 0, 0, 1 2 3 4 5 6 o più Numero di componenti Frequenza relativa Italia Settentrionale Italia Meridionale
Esercizio
Si considerino i dati del Caso Studio 1.
Si rappresenti graficamente la distribuzione di frequenze
secondo il carattere Numero di componenti.
Si rappresenti graficamente la distribuzione di frequenze
secondo il carattere Giudizio sulla solvibilità,
separatamente per Sesso.
65 66
- Nel caso di un carattere quantitativo in classi, la distribuzione viene rappresentata tramite un istogramma di frequenza costruito tramite una serie di rettangoli corrispondenti alle varie classi. Il rettangolo corrispondente alla j-esima classe ha: - base pari all’ampiezza della classe: - altezza pari alla densità di frequenza:
- L’altezza della classe (densità) corrisponde alla frequenza che compete a un sottointervallo di ampiezza unitaria nel caso di uniforme distribuzione delle unità nelle classi. L’istogramma permette quindi di confrontare tra loro classi di diversa ampiezza.
- La caratteristica fondamentale dell’istogramma è che l’area di ogni rettangolo corrisponde alla frequenza della classe a cui si riferisce: ai cici 1 i i i (^) a f h i i i i i i a f f a h a 67
Esempio
•Distribuzione in classi delle imprese della provincia di Macerata con meno di 50 addetti, secondo il numero di addetti – Censimento 2001 Classi di addetti Frequenze assolute 1 14. 2 9. 3--5 15. 6--9 9. 10--15 8. 16--19 4. 20--49 12. Totale: 74. 0 5000 10000 15000 20000 0 20 40 Classi di addetti Frequenza 68 Classi di addetti Frequenze assolute (ni) Ampiezza classi (ai) Densità di frequenza (hi) 1 14.349 1 14.349, (^2) 9.588 1 9.588, 3--5 15.263 3 5.087, 6--9 (^) 9.651 4 2.412, 10--15 8.837 6 1.472, 16--19 4.570 4 1.142, 20--49 (^) 12.653 30 421, Totale: 74.
73
Funzione di ripartizione
•La funzione di ripartizione, F(x) , fornisce la frequenza relativa delle osservazioni che presentano una modalità del carattere non superiore a x. Quindi si ha sempre:
F ^ ^ lim x F^ x^ 0 F^ ^ ^ lim^ x F^ x^ ^1
•Per un carattere qualitativo ordinato o quantitativo non in classi, la funzione di ripartizione è pari a:
k i i i x x F x x x x x F x 1
1 1 quindi, se x è compreso tra la modalità più piccola (x 1 ) e quella più grande (xk), F(x) è uguale alla frequenza cumulata (Fi) corrispondente alla più grande modalità (xi) minore o uguale a x. Altrimenti, F(x) = 0 o F(x) = 1. 74
Esempio
NUMERO DI COMPONENTI (xi) Numero di famiglie (ni) Frequenze relative (fi) Frequenze relative cumulate (Fi) 1 persona 2.883,250 0,276 0, 2 persone 3.048,249 0,292 0, 3 persone 2.352,645 0,225 0, 4 persone 1.667,391 0,160 0, 5 persone 391,376 0,037 0, 6 persone 106,299 0,010 1 Totale 10.449,210 1 •F(2) = 0,568; F(4) = 0,952; F(4,5) = 0,952. 75 •Nel caso di un carattere in classi (tipicamente continuo) ci si basa sull’ipotesi che in ogni classe ci sia uniforme distribuzione: si ha sempre la stessa frequenza in ogni sottointervallo della classe di ampiezza unitaria •In questo caso la funzione di ripartizione è pari a:
k i i i i i x c F h x c c x c x c F x 1
1 1 1 0 e quindi, se x è compreso tra l’estremo sinistro della prima classe (c 0 ) e l’estremo destro dell’ultima classe (ck), per il calcolo occorre innanzitutto individuare la classe che contiene x (ci-1 – ci) e poi F(x) = Fi-1 + hi(x - ci-1); altrimenti, F(x) = 0 oppure F(x) = 1. Si noti che se x è uguale all’estremo inferiore di classe (ci-1), si ha F(x)= Fi- 76
Esempio
•F(500) = 0,631179; F(450) = 0,482219 + 0,000596(450-250) = 0, Classi di fatturato (ci-1 – ci) Frequenze assolute (ni) Frequenze relative (fi) Frequenze relative cumulate (Fi) Densità (hi) 0--250 2156 0,482219 0,482219 0, 250--500 666 0,14896 0,631179 0, 500--1.000 517 0,115634 0,746813 0, 1.000--2.500 539 0,120555 0,867367 8,04E- 2.500--5.000 260 0,058153 0,92552 2,33E- 5.000--10.000 171 0,038246 0,963766 7,65E- 10.000--25.000 95 0,021248 0,985015 1,42E- 25.000--50.000 32 0,007157 0,992172 2,86E- 50.000--100.000 35 0,007828 1 1,57E- Totale 4471 1 Imprese attive al 31.12.2010 per classi di fatturato (migliaia di euro) - dati relativi aI bilanci anno 2009 - Comune di Padova
Esercizio
Si considerino i dati del Caso Studio 1.
Si consideri la distribuzione di frequenze secondo il
carattere Ammontare del Deposito. Si considerino le
classi: Fino a 10.000, 10.000-20.000, 20.000-30.000 e
Qual è il valore della funzione di ripartizione in 23.
a) usando i dati disaggregati
b) usando la distribuzione di frequenza.
Qual è quell’ammontare del deposito al di sotto del
quale troviamo il 60% dei clienti
a) usando i dati disaggregati
b) usando la distribuzione di frequenza.
77
Esercizio
Data la seguente distribuzione delle imprese della provincia di Terni, secondo il numero degli addetti (Fonte: Conoscere l’Umbria, Anno 2009):
- Si calcolino le frequenze relative, percentuali, relative cumulate e percentuali cumulate.
- Si rappresenti graficamente l’istogramma di frequenza chiudendo l’ultima classe a 100.
- Si calcoli, sotto l’ipotesi di uniforme distribuzione nelle classi: (a) la frequenza relativa delle imprese con un numero di addetti compreso tra 15 e 30, utilizzando la funzione di ripartizione; (b) la frequenza relativa delle imprese con un numero di addetti compreso tra 1 e 7, utilizzando le densità di frequenza e riportando il risultato nell’istogramma;
- Se facessimo un’unica classe con estremi 1-5, varrebbe l’ipotesi di uniforme distribuzione all’interno della classe? 78 Classi di addetti Frequenze (ni) (^1) 38. 2--5 23. 6--9 (^) 3. 10--19 2. 20 e oltre 1. 79
Rappresentazione grafica della
funzione di ripartizione
•Per un carattere qualitativo ordinato o quantitativo la funzione di ripartizione ha una forma “a gradini” ottenuta congiungendo i punti di coordinate (xi , Fi ), per i =1,…,k. •Nel caso di un carattere in classi si congiungono i punti i coordinate (ci ,Fi ) , i =1,…,k , e il punto (c 0 ,0) dando origine a una “spezzata”. •Rappresentando la funzione di ripartizione si mostra l’andamento delle frequenze cumulate al variare della modalità del carattere. 80
Esempi
NUMERO DI COMPONENTI (xi) Numero di famiglie (ni) Frequenze relative (fi) Frequenze relative cumulate (Fi) 1 persona 2.883,250 0,276 0, 2 persone 3.048,249 0,292 0, 3 persone 2.352,645 0,225 0, 4 persone 1.667,391 0,160 0, 5 persone 391,376 0,037 0, 6 persone 106,299 0,010 1 Totale 10.449,210 1 0 0, 0, 0, 0, 1 0 5 10 15 Numero componenti Frequenza c um ulata