Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


studio di concentrazione statistica, Dispense di Statica

appunti di concentrazione e curva di lorenz

Tipologia: Dispense

2018/2019

Caricato il 27/02/2019

fabriziomisseri
fabriziomisseri 🇮🇹

5

(2)

2 documenti

1 / 11

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
76
-- La concentrazione --
Un altro aspetto importante di una distribuzione statistica, affine alla
variabilità, è quello che va sotto il nome di concentrazione.
Un carattere misurabile pessere posseduto in quantità molto diverse dalle
singole unità statistiche e quindi si può essere interessati a sapere come il totale delle
intensità T di un carattere quantitativo sia ripartito fra n unità statistiche del collettivo
oggetto di osservazione.
Ad esempio, si consideri il numero di personal computer di ciascuna delle
agenzie di una banca, le unità statistiche sono rappresentate dalle agenzie della banca.
I PC, acquistati in un unico ordine, vengono distribuiti alle varie agenzie in quantità
diverse relativamente all’importanza di ognuna. La concentrazione è forte se la
maggior parte dei PC è stato collocato in un numero limitato di agenzie, mentre la
concentrazione è debole se ogni agenzia ha avuto un numero pressoché identico di
PC, nel caso in cui le agenzie abbiano lo stesso numero di PC si parlerà di
equidistribuzione.
Il problema, quindi, consiste nello stabilire se vi è concentrazione o
equidistribuzione ed ora si intuisce il perché si è detto che la concentrazione è un
aspetto affine della variabili: infatti più la concentrazione è elevata più le
intensità sono diverse da unità a unità più elevata è la variabilità del carattere.
Tuttavia il concetto di concentrazione acquista maggiore pregnanza quando il
carattere è trasferibile tra le unità del collettivo, in quanto in tal caso è possibile -
almeno ipoteticamente - la sua accumulazione in una sola unità o è possibile passare
una quantità materialmente (o anche idealmente) da un possessore ad un altro.
Il numero di personal computer delle agenzie di una banca è trasferibile, in
quanto come si è g detto i PC si possono disporre nelle varie agenzie in
quantitativo diverso e si può, inoltre, ipotizzare che la direzione della banca decida in
seguito di trasferire alcuni PC da un’agenzia all’altra.
Si consideri un carattere X quantitativo, non negativo, additivo e trasferibile e
sia x1, x2, ..., xn l’insieme delle determinazioni delle sue n unità; si ord inano tali
quantità in senso non decrescente: x1 x2 ... xn
e sia T l’intensità totale posseduta dalle n unità:
T =
xi
i 1
n
= x1 + x2 + ... + xn.
In base a ciò si può dare la seguente definizione:
Si chiama concentrazione di n quantità x1, x2, ..., xn il modo con cui l’intensità tot ale T s i
distribuisce fr a le unità stesse.
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica studio di concentrazione statistica e più Dispense in PDF di Statica solo su Docsity!

-- La concentrazione --

Un altro aspetto importante di una distribuzione statistica, affine alla variabilità, è quello che va sotto il nome di concentrazione. Un carattere misurabile può essere posseduto in quantità molto diverse dalle singole unità statistiche e quindi si può essere interessati a sapere come il totale delle intensità T di un carattere quantitativo sia ripartito fra n unità statistiche del collettivo oggetto di osservazione. Ad esempio, si consideri il numero di personal computer di ciascuna delle agenzie di una banca, le unità statistiche sono rappresentate dalle agenzie della banca. I PC, acquistati in un unico ordine, vengono distribuiti alle varie agenzie in quantità diverse relativamente all’importanza di ognuna. La concentrazione è forte se la maggior parte dei PC è stato collocato in un numero limitato di agenzie, mentre la concentrazione è debole se ogni agenzia ha avuto un numero pressoché identico di PC, nel caso in cui le agenzie abbiano lo stesso numero di PC si parlerà di equidistribuzione. Il problema, quindi, consiste nello stabilire se vi è concentrazione o equidistribuzione ed ora si intuisce il perché si è detto che la concentrazione è un aspetto affine della variabilità: infatti più la concentrazione è elevata  più le intensità sono diverse da unità a unità  più elevata è la variabilità del carattere. Tuttavia il concetto di concentrazione acquista maggiore pregnanza quando il carattere è trasferibile tra le unità del collettivo, in quanto in tal caso è possibile - almeno ipoteticamente - la sua accumulazione in una sola unità o è possibile passare una quantità materialmente (o anche idealmente) da un possessore ad un altro. Il numero di personal computer delle agenzie di una banca è trasferibile, in quanto come si è già detto i PC si possono disporre nelle varie agenzie in quantitativo diverso e si può, inoltre, ipotizzare che la direzione della banca decida in seguito di trasferire alcuni PC da un’agenzia all’altra.

Si consideri un carattere X quantitativo, non negativo, additivo e trasferibile e sia x 1 , x 2 , ..., xn l’insieme delle determinazioni delle sue n unità; si ordinano tali quantità in senso non decrescente:

x 1  x 2  ...  xn e sia T l’intensità totale posseduta dalle n unità:

T = xi i 1

n 

(^)  = x 1 + x 2 + ... + xn.

In base a ciò si può dare la seguente definizione:

Si chiama concentrazione di n quantità x 1 , x 2 , ..., xn il modo con cui l’intensità totale T si

distribuisce fra le unità stesse.

È ovvio che si possono avere situazioni diverse: a) le n unità possono possedere quantità uguali (ogni agenzia ha lo stesso numero di PC); b) poche unità possono detenere una parte rilevante del totale e quindi le unità residue possedere una limitata frazione del totale (in base al giro d’affari o del numero dei dipendenti o degli sportelli si dispongono i PC); c) una unità può possedere il totale T e le altre n - 1 unità avere quindi zero (tutti i PC sono installati solo nella sede centrale); e a ciascuna di tali situazioni corrisponde una diversa concentrazione.

Si possono verificare due situazioni limite di come si può distribuire la quantità T fra n unità, che non sono sempre realmente possibili, alle quali corrispondono d ue concentrazioni limite:

    • Nel caso in cui la concentrazione è nulla l’intensità totale T è ripartita in modo uguale fra le n unità, cioè ognuna delle n unità possiede 1/n dell’ammontare complessivo T. In questo caso ogni unità avrà una quantità

T n

x

n

i i 1

n

 

 = M

uguale alla media aritmetica e quindi x 1 = x 2 = ... = xn = M. Si dice allora che c’è equidistribuzione: concentrazione nulla = equidistribuzione.

È ovvio che nel caso di concentrazione nulla anche la variabilità è nulla: concentrazione nulla = variabilità nulla.

    • La situazione di massima concentrazione si ha quando il totale T è posseduto da una sola unità, mentre le rimanenti n-1 unità hanno tutti una quantità nulla e cioè, ad esempio: x 1 = x 2 = ... = xn-1 = 0; xn = T In tal caso si ha anche massima variabilità: concentrazione massima = variabilità massima.

Se non si verifica l’equidistribuzione allora deve esistere un certo grado di concentrazione del carattere che può essere misurato mediante opportuni indic i, infatti, in generale non si ha né concentrazione nulla nè massima ed è estremamente utile disporre di una misura del grado di concentrazione di una distribuzione.

In una successione ordinata di dati si dice che c’è trasferibilità concentrativa quando l’unità i-ma perde una quantità h , la quale viene acquisita dalla j-ma unità, cioè il trasferimento è concentrativo se il valore diminuito era già, prima del trasferimento minore di quello che è stato aumentato. Se si ragiona sul numero dei PC ciò vuol dire che si è tolto ad una agenzia più piccola per dare ad una agenzia più

pi = qi  i [1, ..., n] Se, invece, non vi è equidistribuzione deve aversi sempre: pi > qi  i [1, ..., n-1] e pi = qi Dim.

q

x

x

im i nM

j 1 j

i

j 1 j

n    i 

dove mi è la media dei primi i termini, inoltre essendo i valori crescenti si ha m M

i < 1 per cui

< i n

= pi (^)  Un carattere è tanto più concentrato quanto più sono elevate le differenze: pi - qi  i [1, ..., n-1] pn - qn = 0. Nel caso di massima concentazione si ha: qi = 0  i [1, ..., n-1] e qn = 1. I punti (pi; qi) si possono rappresentare graficamente nel piano cartesiano, disponendo i valori equidistanziati pi sull’asse delle ascisse e i valori qi sull’asse delle ordinate. Congiungendo gli n punti consecutivi (pi; qi) con segmenti rettilinei si ottiene la spezzata di concentrazione:

che è compresa in un triangolo rettangolo isoscele OAB che ha i cateti unitari, infatti il punto A(pn; qn)A(1; 1); la spezzata si trova al di sotto della ipotenusa OA ed ha un andamento crescente, con concavità rivolta verso l’alto. Se il numero dei casi osservati è molto elevato, allora la spezzata di concentrazione tende ad una curva continua detta curva di concentrazione o curva di Lorenz. L’ipotenusa OA coincide con al bisettrice del 1° quadrante, infatti i suoi punti hanno ascissa e ordinata uguale: pi = qi : retta di equidistribuzione. Man mano che la curva di Lorenz si allontana dalla retta di equidistribuzione, cresce la concentrazione, cioè aumenta la differenza p (^) i - qi.

-- Il rapporto di concentrazione -- Una misura del grado di concentrazione è data dal rapporto di concentrazione R, introdotto dal Gini (1914). Il rapporto di concentrazione misura lo scostamento relativo della spezzata di concentrazione dalla retta di equidistribuzione, in quanto, la concentrazione varia all’allontanarsi o all’avvicinarsi della spezzata alla retta. Si ha la seguente definizione:

Il rapporto di concentrazione R è uguale al rapporto fra la somma dei segmenti di distanza del

segmento di equidistribuzione dalla spezzata e la somma delle ascisse della retta, esclusa l’ultima:

R =

 p^ q

p

i 1 i^ i

n 1

i i 1

n 1

(4.1)

A ben vedere il denominatore di R si è ottenuto sotto l’ipotesi di massima concentrazione, in quanto le qi sono tutte nulle esclusa l’ultima che è uguale ad 1,

quindi  p i qi

i 1

n 1  

 diventa pi

i 1

n 1 

. Il rapporto di concentrazione è un indice relativo

rispetto la distribuzione massimizzante.

Con semplici passaggi può anche essere scritto: R =

p q

p

q

p

i i 1

n 1 i i 1

n 1

i i 1

n 1

i i 1

n 1

i i 1

n 1

 

^ .

Oppure tenendo presente che p

1 2 (n 1) n

n

n(n 1) 2

n 1 i 1 i^2

n 1

 ^

si

può scrivere R = 1 -

n 1

q (^) i i 1

n  

Il rapporto R è:

i. un numero puro, infatti, essendo il rapporto di due somme espresse nella stessa unità di misura, è adimensionale. ii. R è un indice normalizzato: 0  R  1  R = 0 nel caso di equidistribuzione, R = 1 nel caso di massima concentrazione.

Esercizio 4. La variabile X “reddito mensile” in milioni di lire è stata rilevata su 6 impiegati di una grande agenzia pubblicitaria nel 1996: 3,0 2,5 1,8 1,6 3,8 2,

  1. Si costruisca la curva di Lorenz.
  2. Si calcoli il rapporto di concentrazione R.

L’area di massima concentrazione è: A (^) OAB = 1 2

L’area di concentrazione si ottiene per differenza di aree, infatti si sottrae all’area del triangolo OAB la somma delle aree dei trapezi rettangoli:

R a =

1 2

q q p p

1 2

q q p p

i 1 i^ i^1 i^ i^1

n

i i 1 i i 1 i 1

 n

 

   

^ ^    

(^2 )

Esercizio 4. Si calcoli R per la distribuzione del reddito dell’esercizio precedente. Svolgimento Avendo già calcolato qi e pi si consideri la seguente tabella:

pi pi - pi- 1 qi qi + qi- 1 (qi + qi- 1 )( pi - pi- 1 ) 1 2 3 4 5

0, 0, 0, 0, 0,

0, 0, 0, 0, 0,

0, 0, 0, 0, 0,

0, 0, 0, 0, 1,

0, 0, 0, 0, 0,

ARLTS =

UT RS

RU

q q 2

i i (^1) (p (^) i p (^) i 1 )

6 1,000 0,167 1,000 1,745 0, Totale 0,

R a = 1 - 0,813 = 0,187.

Dall’esercizio evince che i risultati ottenuti con le formule (4.1) e (4.2) non sono coincidenti, infatti si ha: R a < R, in particolare:

R a = n 1 n

R.

-- Il rapporto di concentrazione per dati raggruppati in classi --

Nel caso in cui si abbia una distribuzione il cui carattere quantitativo è suddiviso in classi di valori il rapporto di concentrazione non può essere calcolato con R, a meno che non si supponga l’equidistribuzione all’interno di ogni classe; quindi in tal caso per il calcolo della concentrazione si utilizza il metodo dei trapezi R a :

R* = 1 -         

 q^ i q^ i 1 p^ i pi 1

i 1

k

Considerando una distribuzione il cui carattere è suddiviso in k classi si ha:

p 

C

n i i

dove Ci è la frequenza assoluta cumulata: Ci = n 1 + n 2 +  + ni; si possono presentare due situazioni differenti:

  1. è disponibile, oltre che la frequenza, l’intensità xi del carattere per ogni classe, quindi per il calcolo delle intensità cumulate Si si utilizzano le intensità del carattere presenti nella tabella (esercizio 4.8):

Si = x (^) j J 1

i 

 e  

q

S

S

x

x

i

i k

j 1 j

i

j j 1

k

  1. è disponibile solo la frequenza, allora le intensità globali del carattere di ogni classe vengono calcolate moltiplicando la frequenza per il valore centrale xi di ciascuna classe (esercizio 4.9):

i

j 1

Si xjnj

 (^)  k

j 1

j j

i

j 1 j j

k

i i x n

xn

S

S

q

     p 

C (^3) n

3 56 98 114 431

289 431

= 0,691; S  3 5600+22050+39600 = 67250;  

  q 

S (^3) S

3 5

67250 112875

0,596; q 3 + q 2 = 0,596 + 0,245 = 0,841; p 3 - p 2 = 0,691 - 0,357 = 0,334; R* = 1 - 0,842 = 0,158.

-- Relazione fra il rapporto R e le differenze medie assolute -- Si può calcolare il rapporto di concentrazione R seguendo una strada totalmente diversa: utilizzando le differenze medie assolute. Gini nel 1914 dimostrava che se si calcolano i rapporti:

 

max

R R max 2M^

  R

in particolare l’ultima uguaglianza afferma:

il rapporto di concentrazione è uguale alla differenza semplice media, divisa per il doppio della

media.

  • Indice di Amato - Un altro indice sintetico normalizzato della concentrazione è quello proposto da Amato nel 1968, che si basa sulla lunghezza della curva di Lorenz:

L

dove: (^) 

2 2

lunghezza della curva di Lorenz; lunghezza dell’ipotenusa OA; lunghezza massima della curva di Lorenz.

Esercizio 4. Si calcoli la concentrazione della distribuzione “numero di PC” in 28 agenzie di una grossa banca: Agenzia n. Computer 1 2 3 4

6 3 10 4

5 5 Svolgimento i xi pi Si qi 1 2 3 4 5

3 4 5 6 10

0, 0, 0, 0, 1,

3 7 12 18 28

0, 0, 0, 0, 1, Applicando il teorema di Pitagora ai triangoli rettangoli OPN, PQT,QUR,RVS e SZA:

dove: OP (ON) (PN) 0,04 0,0441 0, PQ PT QT 0,04 0,0196 0, QR QU UR 0,04 0,0342 0, RS RV VS 0,04 0,0441 0, SA SZ ZA 0,04 0,1296 0,

2 2 2 2 2 2 2 2 2 2

                        

Quindi:  = 0,29 + 0,24 + 0,27 + 0,29 + 0,41 = 1,

 L = ^   

2 2 2

0 086 0 586

, ,

Il rapporto di concentrazione del Gini è R = 0,285; invece se si calcola la concentrazione con il metodo dei trapezi si ha: R a = 0,228.