






Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
appunti di concentrazione e curva di lorenz
Tipologia: Dispense
1 / 11
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!







Un altro aspetto importante di una distribuzione statistica, affine alla variabilità, è quello che va sotto il nome di concentrazione. Un carattere misurabile può essere posseduto in quantità molto diverse dalle singole unità statistiche e quindi si può essere interessati a sapere come il totale delle intensità T di un carattere quantitativo sia ripartito fra n unità statistiche del collettivo oggetto di osservazione. Ad esempio, si consideri il numero di personal computer di ciascuna delle agenzie di una banca, le unità statistiche sono rappresentate dalle agenzie della banca. I PC, acquistati in un unico ordine, vengono distribuiti alle varie agenzie in quantità diverse relativamente all’importanza di ognuna. La concentrazione è forte se la maggior parte dei PC è stato collocato in un numero limitato di agenzie, mentre la concentrazione è debole se ogni agenzia ha avuto un numero pressoché identico di PC, nel caso in cui le agenzie abbiano lo stesso numero di PC si parlerà di equidistribuzione. Il problema, quindi, consiste nello stabilire se vi è concentrazione o equidistribuzione ed ora si intuisce il perché si è detto che la concentrazione è un aspetto affine della variabilità: infatti più la concentrazione è elevata più le intensità sono diverse da unità a unità più elevata è la variabilità del carattere. Tuttavia il concetto di concentrazione acquista maggiore pregnanza quando il carattere è trasferibile tra le unità del collettivo, in quanto in tal caso è possibile - almeno ipoteticamente - la sua accumulazione in una sola unità o è possibile passare una quantità materialmente (o anche idealmente) da un possessore ad un altro. Il numero di personal computer delle agenzie di una banca è trasferibile, in quanto come si è già detto i PC si possono disporre nelle varie agenzie in quantitativo diverso e si può, inoltre, ipotizzare che la direzione della banca decida in seguito di trasferire alcuni PC da un’agenzia all’altra.
Si consideri un carattere X quantitativo, non negativo, additivo e trasferibile e sia x 1 , x 2 , ..., xn l’insieme delle determinazioni delle sue n unità; si ordinano tali quantità in senso non decrescente:
x 1 x 2 ... xn e sia T l’intensità totale posseduta dalle n unità:
T = xi i 1
n
(^) = x 1 + x 2 + ... + xn.
In base a ciò si può dare la seguente definizione:
Si chiama concentrazione di n quantità x 1 , x 2 , ..., xn il modo con cui l’intensità totale T si
distribuisce fra le unità stesse.
È ovvio che si possono avere situazioni diverse: a) le n unità possono possedere quantità uguali (ogni agenzia ha lo stesso numero di PC); b) poche unità possono detenere una parte rilevante del totale e quindi le unità residue possedere una limitata frazione del totale (in base al giro d’affari o del numero dei dipendenti o degli sportelli si dispongono i PC); c) una unità può possedere il totale T e le altre n - 1 unità avere quindi zero (tutti i PC sono installati solo nella sede centrale); e a ciascuna di tali situazioni corrisponde una diversa concentrazione.
Si possono verificare due situazioni limite di come si può distribuire la quantità T fra n unità, che non sono sempre realmente possibili, alle quali corrispondono d ue concentrazioni limite:
T n
x
n
i i 1
n
= M
uguale alla media aritmetica e quindi x 1 = x 2 = ... = xn = M. Si dice allora che c’è equidistribuzione: concentrazione nulla = equidistribuzione.
È ovvio che nel caso di concentrazione nulla anche la variabilità è nulla: concentrazione nulla = variabilità nulla.
Se non si verifica l’equidistribuzione allora deve esistere un certo grado di concentrazione del carattere che può essere misurato mediante opportuni indic i, infatti, in generale non si ha né concentrazione nulla nè massima ed è estremamente utile disporre di una misura del grado di concentrazione di una distribuzione.
In una successione ordinata di dati si dice che c’è trasferibilità concentrativa quando l’unità i-ma perde una quantità h , la quale viene acquisita dalla j-ma unità, cioè il trasferimento è concentrativo se il valore diminuito era già, prima del trasferimento minore di quello che è stato aumentato. Se si ragiona sul numero dei PC ciò vuol dire che si è tolto ad una agenzia più piccola per dare ad una agenzia più
pi = qi i [1, ..., n] Se, invece, non vi è equidistribuzione deve aversi sempre: pi > qi i [1, ..., n-1] e pi = qi Dim.
q
x
x
im i nM
j 1 j
i
j 1 j
n i
dove mi è la media dei primi i termini, inoltre essendo i valori crescenti si ha m M
i < 1 per cui
< i n
= pi (^) Un carattere è tanto più concentrato quanto più sono elevate le differenze: pi - qi i [1, ..., n-1] pn - qn = 0. Nel caso di massima concentazione si ha: qi = 0 i [1, ..., n-1] e qn = 1. I punti (pi; qi) si possono rappresentare graficamente nel piano cartesiano, disponendo i valori equidistanziati pi sull’asse delle ascisse e i valori qi sull’asse delle ordinate. Congiungendo gli n punti consecutivi (pi; qi) con segmenti rettilinei si ottiene la spezzata di concentrazione:
che è compresa in un triangolo rettangolo isoscele OAB che ha i cateti unitari, infatti il punto A(pn; qn)A(1; 1); la spezzata si trova al di sotto della ipotenusa OA ed ha un andamento crescente, con concavità rivolta verso l’alto. Se il numero dei casi osservati è molto elevato, allora la spezzata di concentrazione tende ad una curva continua detta curva di concentrazione o curva di Lorenz. L’ipotenusa OA coincide con al bisettrice del 1° quadrante, infatti i suoi punti hanno ascissa e ordinata uguale: pi = qi : retta di equidistribuzione. Man mano che la curva di Lorenz si allontana dalla retta di equidistribuzione, cresce la concentrazione, cioè aumenta la differenza p (^) i - qi.
-- Il rapporto di concentrazione -- Una misura del grado di concentrazione è data dal rapporto di concentrazione R, introdotto dal Gini (1914). Il rapporto di concentrazione misura lo scostamento relativo della spezzata di concentrazione dalla retta di equidistribuzione, in quanto, la concentrazione varia all’allontanarsi o all’avvicinarsi della spezzata alla retta. Si ha la seguente definizione:
Il rapporto di concentrazione R è uguale al rapporto fra la somma dei segmenti di distanza del
segmento di equidistribuzione dalla spezzata e la somma delle ascisse della retta, esclusa l’ultima:
p
i 1 i^ i
n 1
i i 1
n 1
(4.1)
A ben vedere il denominatore di R si è ottenuto sotto l’ipotesi di massima concentrazione, in quanto le qi sono tutte nulle esclusa l’ultima che è uguale ad 1,
i 1
n 1
i 1
n 1
rispetto la distribuzione massimizzante.
Con semplici passaggi può anche essere scritto: R =
p q
p
q
p
i i 1
n 1 i i 1
n 1
i i 1
n 1
i i 1
n 1
i i 1
n 1
Oppure tenendo presente che p
1 2 (n 1) n
n
n(n 1) 2
n 1 i 1 i^2
n 1
si
può scrivere R = 1 -
n 1
q (^) i i 1
n
Il rapporto R è:
i. un numero puro, infatti, essendo il rapporto di due somme espresse nella stessa unità di misura, è adimensionale. ii. R è un indice normalizzato: 0 R 1 R = 0 nel caso di equidistribuzione, R = 1 nel caso di massima concentrazione.
Esercizio 4. La variabile X “reddito mensile” in milioni di lire è stata rilevata su 6 impiegati di una grande agenzia pubblicitaria nel 1996: 3,0 2,5 1,8 1,6 3,8 2,
L’area di massima concentrazione è: A (^) OAB = 1 2
L’area di concentrazione si ottiene per differenza di aree, infatti si sottrae all’area del triangolo OAB la somma delle aree dei trapezi rettangoli:
R a =
1 2
q q p p
1 2
q q p p
i 1 i^ i^1 i^ i^1
n
i i 1 i i 1 i 1
n
^ ^
(^2 )
Esercizio 4. Si calcoli R per la distribuzione del reddito dell’esercizio precedente. Svolgimento Avendo già calcolato qi e pi si consideri la seguente tabella:
pi pi - pi- 1 qi qi + qi- 1 (qi + qi- 1 )( pi - pi- 1 ) 1 2 3 4 5
0, 0, 0, 0, 0,
0, 0, 0, 0, 0,
0, 0, 0, 0, 0,
0, 0, 0, 0, 1,
0, 0, 0, 0, 0,
q q 2
i i (^1) (p (^) i p (^) i 1 )
6 1,000 0,167 1,000 1,745 0, Totale 0,
R a = 1 - 0,813 = 0,187.
Dall’esercizio evince che i risultati ottenuti con le formule (4.1) e (4.2) non sono coincidenti, infatti si ha: R a < R, in particolare:
R a = n 1 n
-- Il rapporto di concentrazione per dati raggruppati in classi --
Nel caso in cui si abbia una distribuzione il cui carattere quantitativo è suddiviso in classi di valori il rapporto di concentrazione non può essere calcolato con R, a meno che non si supponga l’equidistribuzione all’interno di ogni classe; quindi in tal caso per il calcolo della concentrazione si utilizza il metodo dei trapezi R a :
i 1
k
Considerando una distribuzione il cui carattere è suddiviso in k classi si ha:
p
n i i
dove Ci è la frequenza assoluta cumulata: Ci = n 1 + n 2 + + ni; si possono presentare due situazioni differenti:
Si = x (^) j J 1
i
q
x
x
i
i k
j 1 j
i
j j 1
k
i
j 1
Si xjnj
(^) k
j 1
j j
i
j 1 j j
k
i i x n
xn
S
q
p
C (^3) n
3 56 98 114 431
289 431
q
S (^3) S
3 5
67250 112875
0,596; q 3 + q 2 = 0,596 + 0,245 = 0,841; p 3 - p 2 = 0,691 - 0,357 = 0,334; R* = 1 - 0,842 = 0,158.
-- Relazione fra il rapporto R e le differenze medie assolute -- Si può calcolare il rapporto di concentrazione R seguendo una strada totalmente diversa: utilizzando le differenze medie assolute. Gini nel 1914 dimostrava che se si calcolano i rapporti:
max
R R max 2M^
in particolare l’ultima uguaglianza afferma:
il rapporto di concentrazione è uguale alla differenza semplice media, divisa per il doppio della
media.
dove: (^)
2 2
lunghezza della curva di Lorenz; lunghezza dell’ipotenusa OA; lunghezza massima della curva di Lorenz.
Esercizio 4. Si calcoli la concentrazione della distribuzione “numero di PC” in 28 agenzie di una grossa banca: Agenzia n. Computer 1 2 3 4
6 3 10 4
5 5 Svolgimento i xi pi Si qi 1 2 3 4 5
3 4 5 6 10
0, 0, 0, 0, 1,
3 7 12 18 28
0, 0, 0, 0, 1, Applicando il teorema di Pitagora ai triangoli rettangoli OPN, PQT,QUR,RVS e SZA:
dove: OP (ON) (PN) 0,04 0,0441 0, PQ PT QT 0,04 0,0196 0, QR QU UR 0,04 0,0342 0, RS RV VS 0,04 0,0441 0, SA SZ ZA 0,04 0,1296 0,
2 2 2 2 2 2 2 2 2 2
Quindi: = 0,29 + 0,24 + 0,27 + 0,29 + 0,41 = 1,
L = ^
2 2 2
0 086 0 586
, ,
Il rapporto di concentrazione del Gini è R = 0,285; invece se si calcola la concentrazione con il metodo dei trapezi si ha: R a = 0,228.