Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Lezione 1-2 Statistica, Schemi e mappe concettuali di Statistica

Appunti del corso di Statistica presso UNIMC

Tipologia: Schemi e mappe concettuali

2021/2022

Caricato il 28/11/2024

rissunti1998
rissunti1998 🇮🇹

1 documento

1 / 22

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
Cos’è la statistica
Statistiche: al plurale, sinonimo di dati
Statistica: al singolare, è la disciplina che
analizza le statistiche, i dati, cercando di
estrarne informazioni utili
L’enorme mole di dati resi oggi disponibili
dalla digitalizzazione, rende la statistica
indispensabile in qualsiasi ambito.
12
3
Statistica e Economia
Descrizione dello stato e dell’andamento nel
tempo dei fenomeni economici
Analisi dei comportamenti degli operatori
economici
Previsioni sulla dinamica degli aggregati
economici
Analisi dei processi e dei risultati produttivi e
gestionali
Valutazione delle condizioni del mercato
Pianificazione delle strategie di marketing
Scelta tra portafogli alternativi
Previsioni sulla dinamica delle misure finanziarie 4
Statistica: maneggiare
con cautela
Mark Twain: «Di solito la gente usa le statistiche
come un ubriaco usa un lampione: per
appoggiarsi più che come fonte di illuminazione»
Di seguito alcuni esempi di procedimenti giusti e
sbagliati per analizzare i dati.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16

Anteprima parziale del testo

Scarica Lezione 1-2 Statistica e più Schemi e mappe concettuali in PDF di Statistica solo su Docsity!

Cos’è la statistica

• Statistiche: al plurale, sinonimo di dati

• Statistica: al singolare, è la disciplina che

analizza le statistiche, i dati, cercando di

estrarne informazioni utili

L’enorme mole di dati resi oggi disponibili

dalla digitalizzazione, rende la statistica

indispensabile in qualsiasi ambito. 1

3

Statistica e Economia

  • Descrizione dello stato e dell’andamento nel

tempo dei fenomeni economici

  • Analisi dei comportamenti degli operatori

economici

  • Previsioni sulla dinamica degli aggregati

economici

  • Analisi dei processi e dei risultati produttivi e

gestionali

  • Valutazione delle condizioni del mercato
  • Pianificazione delle strategie di marketing
  • Scelta tra portafogli alternativi
  • Previsioni sulla dinamica delle misure finanziarie 4

Statistica: maneggiare

con cautela

  • Mark Twain: «Di solito la gente usa le statistiche

come un ubriaco usa un lampione: per

appoggiarsi più che come fonte di illuminazione»

  • Di seguito alcuni esempi di procedimenti giusti e

sbagliati per analizzare i dati.

5

ESEMPIO 1:

Nascite e

cicogne

6 Numero di nati in funzione del numero di cicogne 0 200 400 600 800 1000 1200 1400 1600 1800 0 5000 10000 15000 20000 25000 30000 35000 Coppie di cicogne Numero di nati (in migliaia) Il grafico mostra chiaramente che i paesi con più cicogne sono quelli con la natalità più elevata, avvalorando la tesi che le cicogne portino i bambini! 7 Numero di nati in funzione del numero di cicogne 0 0, 0, 0, 0, 0, 0, 0 0,0002 0,0004 0,0006 0,0008 0, Coppie di cicogne/numero di abitanti Numero di nati/numero abitanti Un’analisi corretta deve tenere conto della diversa dimensione dei paesi considerati: in questo modo si conclude correttamente che non c’è relazione tra numero di cicogne e di nati. 8

ESEMPIO 2:

• “Gli automobilisti corretti? Solo l’8%”.

(Corriere della Sera del 25/08/2003)

• Dal titolo siamo portati a pensare che

quasi tutti gli automobilisti sono scorretti.

  • Quando, molti anni fa, la John Hopkins

University (USA) iniziò ad accettare anche le

donne come studenti, qualcuno pensò di

riportare la notizia secondo la quale il 33,3%

delle studentesse aveva sposato un insegnante.

  • Ma a quell’epoca le donne iscritte erano solo tre

ed una aveva sposato un professore

13

ESEMPIO 4: Esempio 5:

14 15 16

Esempio 6:

La letalità del Covid 19 in Italia (https://www.infodata.ilsole24ore.com/2020/03/15/coronavirus-piu-letale-italia-dati- spiegati-bene/)

  • Le barre rappresentano il tasso di letalità, ovvero la percentuale di decessi sul totale dei contagiati, nei Paesi che, al 10 marzo 2020, avevano registrato almeno 100 casi complessivi ed almeno un decesso.
  • La larghezza delle colonne fa riferimento al totale complessivo dei contagiati, dato utilizzato anche per ordinare le nazioni da sinistra verso destra.
  • Come si può notare la barra più alta, che corrisponde ad un tasso di letalità maggiore, riguarda proprio l’Italia. Dove, al 10/03/2020, il 6,2% delle persone cui è stato diagnosticato il coronavirus è morta. In Cina siamo al 3,9%, in Iran al 3,6%, in Corea del Sud addirittura allo 0,7%. I dati sembrano dire che in Italia si muore di più. La realtà dei fatti, però, potrebbe essere diversa.

17

Il lessico della Statistica:

qualche definizione

  • Statistica: insieme dei principi ai quali dovrebbero

ispirarsi la raccolta e l’elaborazione dei dati

concernenti fenomeni collettivi

  • Statistica descrittiva: si occupa dell’analisi di un

fenomeno relativo a un certo gruppo di soggetti

(popolazione) sulla base di una rilevazione completa

delle informazioni (censimento). Tali informazioni

vengono sintetizzate tramite opportuni indici statistici.

  • Inferenza statistica: basandosi su un campione

estratto dalla popolazione di interesse, trae

conclusioni sull’intera popolazione

18

• Popolazione: insieme di riferimento del

fenomeno oggetto di studio

• Unità statistica: singolo caso che compone la

popolazione

• Carattere: caratteristica oggetto di rilevazione

sulle unità statistiche che formano il collettivo

• Modalità di un carattere: diversi modi con cui il

carattere si manifesta nelle unità statistiche

19

Esempio

  • Fenomeno collettivo che si intende studiare: rendimento degli studenti iscritti al corso di laurea EBAM dell’Università di Macerata nell’esame di Statistica, nell’A.A. 2014-
  • Collettivo statistico: insieme degli studenti iscritti al corso di laurea EBAM dell’Università di Macerata nell’A.A. 2014-2015 e che hanno sostenuto l’esame di Statistica in quell’anno
  • Unità statistica: singolo studente iscritto al corso di laurea EBAM dell’Università di Macerata nell’A.A. 2014-2015 e che ha sostenuto l’esame di Statistica in quell’anno
  • Caratteri rilevati: sesso, regione di provenienza, tipo di scuola superiore, anno di corso, voto all’esame di statistica
  • Matrice di dati: tabella con numero di righe pari al numero di unità statistiche e numero di colonne pari al numero di caratteri rilevati 20 Nome Sesso Regione Scuola superiore Anno Voto Verdi M. M Marche Lic. Scientifico II 26 Bianchi C. F Umbria Lic. Classico III 30 Rossi V. F Marche Ist. Tecnico F.C. 27 … … … … … … … … … … … … Unità statistiche Collettivo Caratteri Modalità

25

Rilevazioni statistiche

  • Rilevazione statistica: insieme delle operazioni necessarie per il raccoglimento dei dati necessari ad un’indagine statistica
  • A seconda del metodo, la rilevazione può essere:
    • Sperimentale: il ricercatore controlla le condizioni sotto le quali si svolge l’osservazione
    • Osservazionale: si osserva la realtà senza intervenire su di essa
  • A seconda della complessità, la rilevazione può essere:
    • Totale: si osservano tutte le unità della popolazione
    • Parziale: si osserva un campione estratto dalla popolazione
  • Tipici strumenti, di rilevazione sono:
    • Intervista diretta
    • Intervista telefonica
    • Questionario postale

Esercizio

Il Dipartimento di Economia e Diritto ha necessità di ottenere informazioni riguardanti l’attitudine alla lettura degli studenti iscritti ai propri corsi di laurea e decide, per tale ragione, di realizzare un’indagine campionaria che risponda a queste esigenze.

  1. Supponendo di dover partecipare alla progettazione dell’indagine, si decida: (a) qual è il collettivo statistico oggetto di studio e l’unità statistica; (b) quali sono i caratteri che si ritengono più importanti per rispondere alle esigenze informative del Dipartimento e la loro natura, assieme alle corrispondenti modalità.
  2. Quale fonte di distorsione si introduce se si procede ad intervistare in modo casuale gli studenti che escono dalle lezioni. 26

Caso studio 1

27

I dati (fittizi) riportati nella tabella seguente sono estratti

dall’archivio dei clienti di una banca aggiornato al

31/12/2015. Per ciascun cliente sono stati registrati: il

sesso, l’età (in anni compiuti), l’ammontare del deposito

nel conto corrente (in Euro) ed un giudizio sulla

solvibilità (1= buona, 2=sufficiente, 3=scarsa).

I dati grezzi non forniscono informazioni, in quanto

scarsamente leggibili. Come estrarre informazioni utili

dai dati?

28 Cliente Sesso N.Comp. Deposito Giudizio … … … … … 1453 M 2 12.500 1 1454 M 3 43.780 2 1455 F 1 9.800 2 1456 M 2 11.345 3 1457 F 6 25.320 1 1458 M 2 12.500 1 1459 M 4 34.780 2 1460 F 1 9.800 2 1461 M 4 11.345 3 1462 F 3 25.320 1 1463 F 3 35.500 3 1464 F 2 12.500 2 1465 M 3 16.590 1 1466 M 2 5.650 2 1467 M 1 14.325 1 1468 F 2 11.080 3 1469 M 4 13.700 1 1470 F 5 19.240 2 1471 F 3 2.500 2 1472 M 2 37.340 3 … … … … …

29

Distribuzioni statistiche

  • La rilevazione statistica produce come risultato la matrice dei dati Nome Sesso Regione Scuola superiore Anno Voto Verdi M. M Marche Lic. Scientifico II 26 Bianchi C. F Umbria Lic. Classico III 30 Rossi V. F Marche Ist. Tecnico F.C. 27 Gialli F. F Calabria Ist. Tecnico II 30 Neri A. M Marche Lic. Scientifico III 28
  • Ogni colonna della matrice costituisce una distribuzione disaggregata secondo un singolo carattere. Si tratta dell’elencazione delle modalità osservate per ogni una unità x 1 , x 2 , …, xi, …,xn 30 - Una distribuzione di questo tipo si chiama semplice (rispetto ad un solo carattere) unitaria (unità per unità). x 1 , x 2 , …, xi, …,xn - Se si considerassero più caratteri congiuntamente avremmo una distribuzione multipla (es. doppia se si considerassero due caratteri) - Per sintetizzare una distribuzione disaggregata si fa uso di una distribuzione di frequenza che può essere semplice o multipla - Una distribuzione di frequenza semplice viene costruita associando a ognuna delle modalità distinte che sono state osservate, x 1 , x 2 , …, xi, …,xk la corrispondente frequenza assoluta che è pari al numero di unità statistiche che presentano quella modalità. Per la i-esima modalità, la frequenza assoluta viene indicata con ni. 31
  • Una distribuzione di frequenza semplice viene rappresentata attraverso una tabella di questo tipo

Modalità (xi) Frequenze (ni)

x 1 n 1

x 2 n 2

xi ni

xk nk

Totale n

32

Esempio

  • Dalla matrice di dati sugli studenti universitari, si possono ricavare 5 distribuzioni semplici secondo i caratteri: sesso, regione, scuola di provenienza, anno di corso e voto in Statistica.
  • Per il carattere sesso, le modalità distinte sono M e F con frequenze pari, rispettivamente, a 2 e 3. La corrispondente distribuzione di frequenza è quindi:

Sesso (xi) Frequenze (ni)

M 2

F 3

Totale 5

Esercizio

Si considerino i dati del Caso Studio 1.

Si costruiscano le distribuzione doppie di frequenze

secondo i caratteri Sesso e Giudizio e secondo i

caratteri Numero di Componenti e Giudizio.

37 38

Suddivisione in classi

  • Nel caso di un carattere quantitativo che assume

molte modalità (tipicamente continuo) è conveniente

considerare delle classi al posto delle singole

modalità distinte.

  • Ogni classe viene identificata da due estremi (di

sinistra e di destra) che per la i-esima classe sono

indicati con ci-1 – ci.

  • Le classi vanno scelte in modo che:
    • il livello di sintesi sia adeguato
    • siano tra loro disgiunte
    • siano esaustive 39
  • Una distribuzione di un carattere in classi viene rappresentata attraverso una tabella di questo tipo

Classi (ci-1 – ci) Frequenze (ni)

c 0 – c 1 n 1

c 1 – c 2 n 2

ci-1 – ci ni

ck-1 – ck nk

Totale n

40

Esempio

  • Per il carattere voto in Statistica abbiamo la seguente distribuzione in classi.

Classi di voto ci-1 ci Frequenze (ni)

Totale - - 5

  • In questo caso, al fine di avere estremi di classe coincidenti, si effettua la correzione per continuità: si sottrae 1/ all’estremo di sinistra di ogni classe e lo si aggiunge a quello di destra.

41

Esempio

  • Popolazione residente per classi di età - Regione Marche - Censimento 2001 CLASSI DI ETÀ Popolazione residente (in migliaia) Meno di 15 189, 15-24 154, 25-34 216, 35-44 218, 45-54 193, 55-64 177, 65-74 168, 75 e più 152, Totale 1.470,

Esercizio

La seguente tabella riporta i dati relativi a 15 aziende agricole umbre (Id. Azienda) che hanno partecipato ad un bando per l’assegnazione di contributi da parte dell’Unione Europea. Si noti che il dato riguardante il Grado di innovazione nei processi dell’azienda (Innovazione) è stato codificato nel modo seguente: 1 = basso, 2 = medio, 3 = alto. Inoltre, il fatturato annuo di ciascuna azienda è espresso in migliaia di Euro. a) Qual è l’unità statistica? Quali sono i caratteri rilevati? E qual è la loro natura? b) Quali sono le modalità rilevate del carattere Grado di innovazione? Quali sono le modalità rilevate del carattere Anni di attività? c) Costruire la distribuzione doppia rispetto al Grado di innovazione e al fatturato (classi 0-5, 5-10, 10-15). 42 43 Id. Azienda 1 2 3 4 5 6 7 8 Anni di attività 3 8 13 2 11 18 6 1 Provincia PG TR TR PG TR PG PG PG Innovazione 1 3 2 1 1 2 1 2 Fatturato 5,1 6,8 10,3 14,7 3,5 8,9 11,3 4, Id. Azienda 9 10 11 12 13 14 15 Anni di attività 0 12 8 10 15 7 3 Provincia TR TR PG TR PG PG TR Innovazione 2 1 3 2 1 3 2 Fatturato 8,3 13,1 7 5,8 8,1 12,6 10,

Esercizio

Si considerino i dati del Caso Studio 1.

Si costruisca la distribuzione doppia di frequenze

secondo i caratteri Ammontare del Deposito e Giudizio.

Per il carattere Deposito si considerino le classi: Fino a

15.000, 15.000-30.000 e 30.000-45.000.

44

49

  • Una distribuzione di frequenze assolute, relative e percentuali viene rappresentata attraverso una tabella di questo tipo

Modalità

(xi)

Frequenze

assolute (ni)

Frequenze

relative (fi)

Frequenze

percentuali (pi)

x 1 n 1 f 1 p 1

x 2 n 2 f 2 p 2

xi ni fi pi

xk nk fk pk

Totale n 1 100 50

Esempio

  • Per il carattere voto in Statistica abbiamo la seguente

distribuzione in classi.

Classi di

voto

Frequenze

assolute (ni)

Frequenze

relative (fi)

Frequenze

percentuali (pi)

Totale 5 1 100

51

Esercizio

Una popolazione di 100 individui, di cui 60 donne e 40 uomini, viene intervistata circa le attitudini al fumo ottenendo le seguenti risposte: Uomini:0 0 1 0 0 0 1 0 1 1 1 0 0 0 0 1 0 0 1 0 0 1 1 0 0 0 0 0 0 1 0 0 0 0 1 1 0 0 1 0 Donne: 1 0 0 0 0 1 0 0 1 1 0 0 0 0 1 0 0 1 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 dove 1=fumatore e 0=non fumatore. a) Ricavare una tabella di distribuzione doppia b) Ricavare la distribuzione di frequenza relativa rispetto al carattere “Attitudine al fumo” separatamente per gli uomini e per le donne. c) Determinare la percentuale di fumatori tra gli intervistati.

Esercizio

Si considerino i dati del Caso Studio 1.

Si costruisca la distribuzione di frequenze relative e

percentuali secondo il carattere Giudizio, separatamente

per gli uomini e per le donne.

52

53

Frequenze cumulate

Famiglie per numero di componenti

  • Italia Settentrionale - Censimento

NUMERO DI COMPONENTI Numero di famiglie (x 1000) 1 persona 2.883, 2 persone 3.048, 3 persone 2.352, 4 persone 1.667, 5 persone 391376 6 o più persone 106, Totale 10.449, - Quante sono le famiglie con al massimo due componenti? - Quante sono le famiglie con al massimo tre componenti? 54 Italia Settentrionale Italia Meridionale NUM. COMP. Num. famiglie Freq. ass. cum. Freq. rel. cum. Freq. perc. cum. Num. famiglie Freq. ass. cum. Freq. rel. cum. Freq. perc. cum. 1 2.883,250 2.883,250 0,276 27,593 1.482,466 1.482,466 0,208 20, 2 3.048,249 5.931,499 0,568 56,765 1.668,914 3.151,380 0,443 44, 3 2.352,645 8.284,144 0,793 79,280 1.412,246 4.563,626 0,641 64, 4 1.667,391 9.951,535 0,952 95,237 1.688,254 6.251,880 0,878 87, 5 391,376 10.342,911 0,990 98,983 665,876 6.917,756 0,972 97, 6 o più 106,299 10.449,210 1 100 201,511 7.119,267 1 100 Totale 10.449,210 7.119, 55

• Frequenza assoluta cumulata :

• Frequenza relativa cumulata:

• Frequenza percentuale cumulata:

56

  • Una distribuzione di frequenze assolute, relative e percentuali cumulate viene rappresentata attraverso una tabella di questo tipo

Modalità

(xi)

Frequenze

assolute

cumulate

(Ni)

Frequenze

relative

cumulate

(Fi)

Frequenze

percentuali

cumulate

(Pi)

x 1 N 1 F 1 P 1

x 2 N 2 F 2 P 2

xi Ni Fi Pi

xk Nk Fk Pk

61

  • Per una distribuzione di frequenza di un carattere qualitativo o quantitativo discreto, si utilizza un grafico a barre che consiste nel rappresentare, su un piano cartesiano, k barre di altezza n 1 ,…, nk in corrispondenza delle ascisse x 1 ,…, xk. Distribuzione degli studenti secondo il sesso 0 1 2 3 4 M F Frequenza

Esempio

Distribuzione degli studenti secondo il sesso 0 1 2 3 4 M F Frequenza 62

Esempi

Distribuzione delle famiglie residenti nell'Italia Settentrionale secondo il numero di componenti 0 500000 1000000 1500000 2000000 2500000 3000000 3500000 1 2 3 4 5 6 o più Numero di componenti Frequenza assoluta 63 Distribuzione delle famiglie residenti secondo il numero di componenti e la ripartizione geografica 0 500000 1000000 1500000 2000000 2500000 3000000 3500000 1 2 3 4 5 6 o più Numero di componenti Frequenza assoluta Italia Settentrionale Italia Meridionale 64 Distribuzione delle famiglie residenti secondo il numero di componenti e la ripartizione geografica 0, 0, 0, 0, 0, 0, 0, 0, 1 2 3 4 5 6 o più Numero di componenti Frequenza relativa Italia Settentrionale Italia Meridionale

Esercizio

Si considerino i dati del Caso Studio 1.

Si rappresenti graficamente la distribuzione di frequenze

secondo il carattere Numero di componenti.

Si rappresenti graficamente la distribuzione di frequenze

secondo il carattere Giudizio sulla solvibilità,

separatamente per Sesso.

65 66

  • Nel caso di un carattere quantitativo in classi, la distribuzione viene rappresentata tramite un istogramma di frequenza costruito tramite una serie di rettangoli corrispondenti alle varie classi. Il rettangolo corrispondente alla j-esima classe ha: - base pari all’ampiezza della classe: - altezza pari alla densità di frequenza:
  • L’altezza della classe (densità) corrisponde alla frequenza che compete a un sottointervallo di ampiezza unitaria nel caso di uniforme distribuzione delle unità nelle classi. L’istogramma permette quindi di confrontare tra loro classi di diversa ampiezza.
  • La caratteristica fondamentale dell’istogramma è che l’area di ogni rettangolo corrisponde alla frequenza della classe a cui si riferisce: ai  cici 1 i i i (^) a f h  i i i i i i a f f a h a  67

Esempio

•Distribuzione in classi delle imprese della provincia di Macerata con meno di 50 addetti, secondo il numero di addetti – Censimento 2001 Classi di addetti Frequenze assolute 1 14. 2 9. 3--5 15. 6--9 9. 10--15 8. 16--19 4. 20--49 12. Totale: 74. 0 5000 10000 15000 20000 0 20 40 Classi di addetti Frequenza 68 Classi di addetti Frequenze assolute (ni) Ampiezza classi (ai) Densità di frequenza (hi) 1 14.349 1 14.349, (^2) 9.588 1 9.588, 3--5 15.263 3 5.087, 6--9 (^) 9.651 4 2.412, 10--15 8.837 6 1.472, 16--19 4.570 4 1.142, 20--49 (^) 12.653 30 421, Totale: 74.

73

Funzione di ripartizione

•La funzione di ripartizione, F(x) , fornisce la frequenza relativa delle osservazioni che presentano una modalità del carattere non superiore a x. Quindi si ha sempre:

F ^  ^ lim x  F^ x^  0 F^ ^ ^ lim^ x F^ x^ ^1

•Per un carattere qualitativo ordinato o quantitativo non in classi, la funzione di ripartizione è pari a:

k i i i x x F x x x x x F x 1

1 1 quindi, se x è compreso tra la modalità più piccola (x 1 ) e quella più grande (xk), F(x) è uguale alla frequenza cumulata (Fi) corrispondente alla più grande modalità (xi) minore o uguale a x. Altrimenti, F(x) = 0 o F(x) = 1. 74

Esempio

NUMERO DI COMPONENTI (xi) Numero di famiglie (ni) Frequenze relative (fi) Frequenze relative cumulate (Fi) 1 persona 2.883,250 0,276 0, 2 persone 3.048,249 0,292 0, 3 persone 2.352,645 0,225 0, 4 persone 1.667,391 0,160 0, 5 persone 391,376 0,037 0, 6 persone 106,299 0,010 1 Totale 10.449,210 1 •F(2) = 0,568; F(4) = 0,952; F(4,5) = 0,952. 75 •Nel caso di un carattere in classi (tipicamente continuo) ci si basa sull’ipotesi che in ogni classe ci sia uniforme distribuzione: si ha sempre la stessa frequenza in ogni sottointervallo della classe di ampiezza unitaria •In questo caso la funzione di ripartizione è pari a:

k i i i i i x c F h x c c x c x c F x 1

1 1 1 0 e quindi, se x è compreso tra l’estremo sinistro della prima classe (c 0 ) e l’estremo destro dell’ultima classe (ck), per il calcolo occorre innanzitutto individuare la classe che contiene x (ci-1 – ci) e poi F(x) = Fi-1 + hi(x - ci-1); altrimenti, F(x) = 0 oppure F(x) = 1. Si noti che se x è uguale all’estremo inferiore di classe (ci-1), si ha F(x)= Fi- 76

Esempio

•F(500) = 0,631179; F(450) = 0,482219 + 0,000596(450-250) = 0, Classi di fatturato (ci-1 – ci) Frequenze assolute (ni) Frequenze relative (fi) Frequenze relative cumulate (Fi) Densità (hi) 0--250 2156 0,482219 0,482219 0, 250--500 666 0,14896 0,631179 0, 500--1.000 517 0,115634 0,746813 0, 1.000--2.500 539 0,120555 0,867367 8,04E- 2.500--5.000 260 0,058153 0,92552 2,33E- 5.000--10.000 171 0,038246 0,963766 7,65E- 10.000--25.000 95 0,021248 0,985015 1,42E- 25.000--50.000 32 0,007157 0,992172 2,86E- 50.000--100.000 35 0,007828 1 1,57E- Totale 4471 1 Imprese attive al 31.12.2010 per classi di fatturato (migliaia di euro) - dati relativi aI bilanci anno 2009 - Comune di Padova

Esercizio

Si considerino i dati del Caso Studio 1.

Si consideri la distribuzione di frequenze secondo il

carattere Ammontare del Deposito. Si considerino le

classi: Fino a 10.000, 10.000-20.000, 20.000-30.000 e

Qual è il valore della funzione di ripartizione in 23.

a) usando i dati disaggregati

b) usando la distribuzione di frequenza.

Qual è quell’ammontare del deposito al di sotto del

quale troviamo il 60% dei clienti

a) usando i dati disaggregati

b) usando la distribuzione di frequenza.

77

Esercizio

Data la seguente distribuzione delle imprese della provincia di Terni, secondo il numero degli addetti (Fonte: Conoscere l’Umbria, Anno 2009):

  1. Si calcolino le frequenze relative, percentuali, relative cumulate e percentuali cumulate.
  2. Si rappresenti graficamente l’istogramma di frequenza chiudendo l’ultima classe a 100.
  3. Si calcoli, sotto l’ipotesi di uniforme distribuzione nelle classi: (a) la frequenza relativa delle imprese con un numero di addetti compreso tra 15 e 30, utilizzando la funzione di ripartizione; (b) la frequenza relativa delle imprese con un numero di addetti compreso tra 1 e 7, utilizzando le densità di frequenza e riportando il risultato nell’istogramma;
  4. Se facessimo un’unica classe con estremi 1-5, varrebbe l’ipotesi di uniforme distribuzione all’interno della classe? 78 Classi di addetti Frequenze (ni) (^1) 38. 2--5 23. 6--9 (^) 3. 10--19 2. 20 e oltre 1. 79

Rappresentazione grafica della

funzione di ripartizione

•Per un carattere qualitativo ordinato o quantitativo la funzione di ripartizione ha una forma “a gradini” ottenuta congiungendo i punti di coordinate (xi , Fi ), per i =1,…,k. •Nel caso di un carattere in classi si congiungono i punti i coordinate (ci ,Fi ) , i =1,…,k , e il punto (c 0 ,0) dando origine a una “spezzata”. •Rappresentando la funzione di ripartizione si mostra l’andamento delle frequenze cumulate al variare della modalità del carattere. 80

Esempi

NUMERO DI COMPONENTI (xi) Numero di famiglie (ni) Frequenze relative (fi) Frequenze relative cumulate (Fi) 1 persona 2.883,250 0,276 0, 2 persone 3.048,249 0,292 0, 3 persone 2.352,645 0,225 0, 4 persone 1.667,391 0,160 0, 5 persone 391,376 0,037 0, 6 persone 106,299 0,010 1 Totale 10.449,210 1 0 0, 0, 0, 0, 1 0 5 10 15 Numero componenti Frequenza c um ulata