Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Distribuzioni di Frequenza e Statistiche Descrittive di Caratteri Discreti - Prof. De Giov, Dispense di Statistica

Come calcolare la distribuzione di frequenza, la media, la varianza e lo scostamento quadratico medio (deviazione standard) di un carattere discreto, utilizzando come esempio una distribuzione unitaria di 10 unità. Viene inoltre illustrato come organizzare due caratteri qualitativi nella tabella di contingenza e come calcolare l'indice cramer per verificare la dipendenza tra i due caratteri.

Tipologia: Dispense

2018/2019

Caricato il 11/06/2019

valerio.difonso.5
valerio.difonso.5 🇮🇹

4.4

(16)

12 documenti

1 / 17

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Richiami di Statistica Descrittiva
(Livia De Giovanni)
Icaratteri sono le grandezze rilevate su Nunità statistiche di un collettivo. Il carattere rilevato
sulle unità si presenta con diverse modalità. A seconda delle modalità che assume il carattere
può essere di tipo qualitativo (le modalità sono denominazioni) - nominale (non ordinabile) o
ordinabile - o quantitativo (le modalità sono numeri) - discreto (naturali) o continuo (reali) -. I
caratteri quantitativi prendono anche il nome di variabili e le loro modalità sono anche indicate
come valori. L’associazione della modalità di un carattere Xa ciascuna unità di un insieme di
Nunità origina la distribuzione unitaria univariata del carattere Xnelle unità {x1, x2, . . . xN}.
L’associazione delle modalità di più caratteri su ciascuna unità origina la distribuzione unitaria
multivariata. In tabella la tabella dei dati relativa a 4 caratteri ed Nunità, mij modalità del
carattere jrilevato sull’unità i.
unità carattere 1 carattere 2 carattere 3 carattere 4
1m11 m12 m13 m14
2m21 m22 m23 m24
... ... ... ... ...
imi1mi2mi3mi4
... ... ... ... ...
NmN1mN2mN3mN4
La distribuzione di frequenza secondo un carattere consiste nell’associare a ciascuna modalità
xidel carattere Xche assume kmodalità distinte il numero assoluto ni, relativo fi(la frazione
sul totale delle unità ni/N) o percentuale pi(la frazione sul totale delle unità moltiplicato per
100 fi100) di unità che presentano quella modalità. La frequenza cumulata Fi(i=, ..., k)
indica la somma delle frequenze relative fino alla modalità xinella distribuzione di frequenza
ordinata. La distribuzione di frequenza di caratteri quantitativi continui prevede che le modalità
siano raggruppate in classi. In tale caso oltre alla frequenza assoluta della classe si introduce la
densità di frequenza (assoluta o relativa) della classe che si ottiene dal rapporto tra la frequenza
(assoluta o relativa) della classe e l’ampiezza della classe (numero di modalità all’interno della
classe).
Nelle serie storiche eterritoriali le unità statistiche sono rispettivamente unità temporali o
territoriali.
X nifi=ni/N pi=fi100 Fi=f1+... +fi
x1n1f1p1F1=f1
x2n2f2p2F2=f1+f2
... ... ... ... ...
xinifipiFi=f1+f2+...fi
... ... ... ... ...
xknkfkpkFk=f1+f2+...fk= 1
N1 100
La distribuzione di frequenza può evidenziare alte frequenze sulle modalità piccole (coda a destra)
o grandi (coda a sinistra) della distribuzione o simmetria (frequenze uguali in corrispondenza di
modalità corrispondenti piccole o grandi).
Le rappresentazioni grafiche sono il disegno della distribuzione di frequenza. In relazione alla
natura del carattere - qualitativo o quantitativo
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Anteprima parziale del testo

Scarica Distribuzioni di Frequenza e Statistiche Descrittive di Caratteri Discreti - Prof. De Giov e più Dispense in PDF di Statistica solo su Docsity!

Richiami di Statistica Descrittiva

(Livia De Giovanni)

I caratteri sono le grandezze rilevate su N unità statistiche di un collettivo. Il carattere rilevato sulle unità si presenta con diverse modalità. A seconda delle modalità che assume il carattere può essere di tipo qualitativo (le modalità sono denominazioni) - nominale (non ordinabile) o ordinabile - o quantitativo (le modalità sono numeri) - discreto (naturali) o continuo (reali) -. I caratteri quantitativi prendono anche il nome di variabili e le loro modalità sono anche indicate come valori. L’associazione della modalità di un carattere X a ciascuna unità di un insieme di N unità origina la distribuzione unitaria univariata del carattere X nelle unità {x 1 ; x 2 ; : : : xN }. L’associazione delle modalità di più caratteri su ciascuna unità origina la distribuzione unitaria multivariata. In tabella la tabella dei dati relativa a 4 caratteri ed N unità, mij modalità del carattere j rilevato sull’unità i.

unità carattere 1 carattere 2 carattere 3 carattere 4 1 m 11 m 12 m 13 m 14 2 m 21 m 22 m 23 m 24 ... ... ... ... ... i mi 1 mi 2 mi 3 mi 4 ... ... ... ... ... N mN 1 mN 2 mN 3 mN 4

La distribuzione di frequenza secondo un carattere consiste nell’associare a ciascuna modalità xi del carattere X che assume k modalità distinte il numero assoluto ni, relativo fi (la frazione sul totale delle unità ni=N ) o percentuale pi (la frazione sul totale delle unità moltiplicato per 100 fi ∗ 100 ) di unità che presentano quella modalità. La frequenza cumulata Fi (i =; :::; k) indica la somma delle frequenze relative fino alla modalità xi nella distribuzione di frequenza ordinata. La distribuzione di frequenza di caratteri quantitativi continui prevede che le modalità siano raggruppate in classi. In tale caso oltre alla frequenza assoluta della classe si introduce la densità di frequenza (assoluta o relativa) della classe che si ottiene dal rapporto tra la frequenza (assoluta o relativa) della classe e l’ampiezza della classe (numero di modalità all’interno della classe). Nelle serie storiche e territoriali le unità statistiche sono rispettivamente unità temporali o territoriali.

X ni fi = ni=N pi = fi ∗ 100 Fi = f 1 + ::: + fi x 1 n 1 f 1 p 1 F 1 = f 1 x 2 n 2 f 2 p 2 F 2 = f 1 + f 2 ... ... ... ... ... xi ni fi pi Fi = f 1 + f 2 + :::fi ... ... ... ... ... xk nk fk pk Fk = f 1 + f 2 + :::fk = 1 N 1 100

La distribuzione di frequenza può evidenziare alte frequenze sulle modalità piccole (coda a destra) o grandi (coda a sinistra) della distribuzione o simmetria (frequenze uguali in corrispondenza di modalità corrispondenti piccole o grandi). Le rappresentazioni grafiche sono il disegno della distribuzione di frequenza. In relazione alla natura del carattere - qualitativo o quantitativo

Il calcolo dei valori medi (indici di posizione) secondo un carattere consiste nel sostituire alla distribuzione di frequenza secondo un certo carattere una modalità rappresentativa dell’intera distribuzione. Essi corrispondono a diverse definizioni di rappresentatività. La moda è la modalità di massima frequenza. Si può calcolare per ogni tipo di carattere. La mediana è la modalità che occupa la posizione centrale nella distribuzione ordinata; nel caso di N dispari è la modalità associata all’unità in posizione (N + 1)= 2 nella distribuzione ordinata, nel caso di N pari le mediane sono le modalità associate alle unità nelle posizioni N= 2 e N=2 + 1 (o la loro semisomma) nella distribuzione ordinata. La modalità mediana è tale che il 50% delle unità ha una modalità minore o uguale e il 50% maggiore o uguale. Il primo quartile è la modalità tale che il 25% delle unità ha una modalità minore o uguale e il 75% maggiore o uguale; il secondo quartile coincide con la mediana; il terzo quartile è la modalità tale che il 75% delle unità ha una modalità minore o uguale e il 25% maggiore o uguale. I quartili si possono calcolare per i caratteri qualitativi ordinabili o quantitativi. I tre quartili dividono le unità in 4 sottoinsiemi contenenti ciascuno il 25% delle unità. In generale il percentile di ordine è la modalità tale che l’ % delle unità ha una modalità minore o uguale e l’(1- )% maggiore o uguale. La media aritmetica è la modalità di equiripartizione del carattere tra le unità. Si può calcolare per i caratteri quantitativi. La media aritmetica di una variabile X è indicata con  se è calcolata su tutte le unità di interesse; con x¯ se è calcolata su un sottoinsieme delle unità. La mediana e il primo e terzo quartile si ottengono sulla base delle frequenze cumulate relative nella distribuzione ordinata di frequenza considerando la prima modalità per la quale si raggiunge il valore 0,25 (primo quartile), 0,5 (secondo quartile o mediana), 0,75 (terzo quartile). La media aritmetica presenta le seguenti proprietà:

  1. interna: è compresa tra il minimo e il massimo valore della distribuzione;

  2. la somma degli scarti dalla media è zero;

  3. è la modalità rispetto alla quale è minima la somma dei quadrati degli scarti

∑N

i=1(xi^ −^ c) 2 per qualunque c reale;

  1. la media della trasformazione lineare di una variabile X è uguale alla trasformazione lineare della media della variabile X se alla distribuzione di X {x 1 ; x 2 ; : : : xN } si sostituisce la distribuzione di Y = aX + b {y 1 = ax 1 + b; y 2 = ax 2 + b; : : : yN = axN + b} con a e b reali;

  2. associativa: data una distribuzione unitaria {x 1 ; x 2 ; : : : xN }, ed una sua partizione in due (o più) distribuzioni parziali {x 1 ; x 2 ; : : : xm} e {xm+1; xm+2; : : : xN }, rispettivamente di N e N − m unità, la media è associativa se, indicata con x¯ la media aritmetica calcolata sulle N modalità, ¯xm la media aritmetica calcolata sulle m modalità, e x¯N −m la media aritmetica calcolata sulle N − m modalità, risulta x¯ = m·¯xm+(N N^ −m)·¯xN^ −m

Le proprietà 1 ) e 4 ) risultano valide anche per la moda e per la mediana. Disponendo della distribuzione unitaria di un carattere quantitativo discreto X rilevato su un insieme di N = 10 unità si riportano la distribuzione di frequenza, la rappresentazione grafica e i valori medi (con Ni si indica la frequenza cumulata assoluta della modalità xi).

{ (^) x 1 1 ; (^) x 0 2 ; (^) x 1 3 ; (^) x 1 4 ; (^) x 1 5 ; (^) x 2 6 ; (^) x 2 7 x^2 8 ; (^) x 3 9 ; (^) x 3 10

In figura sono rappresentate (dal basso in alto) 4 distribuzioni unitarie di modalità (0,3,5,7,10), (3,4,5,6,7), (0,0,0,1,24), (0,2,6,7,10). Le 4 distribuzioni hanno la stessa media aritmetica pa- ri a 5, ma diversa variabilità. Lo scostamento quadratico medio delle 4 distribuzioni risulta, rispettivamente, 3,41; 1,41; 9,51; 3,58.

0000 5555 10101010 15151515 20202020 25252525

Come esempio di calcolo la media e la varianza della prima distribuzione risultano:

media = (0 + 3 + 5 + 7 + 10)=5 = 5

varianza = ((0 − 5)^2 + (3 − 5)^2 + (5 − 5)^2 + (7 − 5)^2 + (10 − 5)^2 )=5 = 11; 63

Lo scostamento quadratico medio o deviazione standard si ottiene dalla radice quadrata della varianza:

scostamento quadratico medio =

Utilizzando la distribuzione di frequenza la media e lo scarto quadratico medio risultano:

media aritmetica =

N

∑^ k

i=

xini =

∑^ k

i=

xifi

varianza =

N

∑^ k

i=

(xi − media)^2 ni =

∑^ k

i=

(xi − media)^2 fi

Con riferimento alla distribuzione di frequenza relativa alle 10 unità la media risulta 0 ·1+1·4+2 10 ·3+3·^2 = 16 10 = 1;^6 ; la varianza^

(0− 1 ,6)^2 ·1+(1− 1 ,6)^2 ·4+(2− 1 ,6)^2 ·3+(3− 1 ,6)^2 · 2 10 =^

8 , 4 10 = 0;^84 e lo scostamento qua- dratico medio o deviazione standard

0 ; 84 = 0; 92. Se trasformassimo linearmente le modalità con a = 2 e b = 1 (la trasformazione lineare di 2 sarebbe 5 = 2 · 2 + 1) la media aritmetica risulterebbe 4 ; 2 = 1; 6 · 2 + 1 e la varianza 3 ; 36 = 2^2 · 0 ; 84. Dividendo la distribuzione nelle due distribuzioni parziali di m = 6 e N − m = 4 unità:

{ (^) x 1 1 ; (^) x 0 2 ; (^) x 1 3 ; (^) x 1 4 ; (^) x 1 5 ; (^) x 2 6 }{ (^) x 2 7 x^2 8 ; (^) x 3 9 ; (^) x 3 10

per la proprietà associativa risulta ¯x = 1; 6 = 1 ,^0 (6+4)·6+2,^5 ·^4 avendo indicato con 1,0 e 2,5 le medie delle due distribuzioni parziali. Pertanto l’intera distribuzione secondo un carattere quantitativo si può sintetizzare nei seguenti modi:

  1. riassunto a due numeri (media aritmetica, deviazione standard) e grafico ad aste (o a bastoncini);

  2. riassunto a 5 numeri (minima modalità, massima modalità, primo secondo e terzo quartile) e boxplot (scatola avente per estremi il primo e terzo quartile e linee o baffi in corrisponden- za della minima e massima modalità). La distanza tra gli estremi della scatola corrisponde allo scarto interquartile, la distanza tra i baffi al range. La posizione della mediana all’in- terno della scatola mostra la presenza di coda a destra (mediana vicina al primo quartile in basso nella scatola), di coda a sinistra (mediana vicina al terzo quartile in alto nella scatola) o di simmetria (mediana al centro della scatola).

x

0 1 2

x

0 1 2

x

0 1 2

In figura sono rappresentate tre distribuzioni che assumono i valori (0, 1, 2) con frequenze relative (0,51; 0,25; 0,24), (0,25; 0,50; 0,25), (0,24; 0,25; 0,51). La prima presenta coda a destra, la seconda è simmetrica (in una definizione più precisa di simmetria le modalità equidistanti dalla mediana hanno la stessa frequenza), la terza presenta coda a sinistra. Nella prima la media aritmetica pari a 0,73 ( 0 ; 73 = 0 · 0 ; 51 + 1 · 0 ; 25 + 2 · 0 ; 24 ) risulta maggiore della mediana pari a 0, nella seconda la media aritmetica pari a 1 coincide con la mediana, nella terza la media aritmetica pari a 1,27 risulta minore della mediana pari a 2. L’analisi dei boxplot evidenzia che nella prima la mediana coincide con il primo quartile (e con il minimo valore), nella seconda la mediana è a metà tra il primo e il terzo quartile, nel terzo coincide con il terzo quartile (e con il massimo valore).

X/ Y Si No Tot Centro 28,54 0,00 28, Nord 0,00 67,71 67, Sud e Isole 52,09 0,00 52, Tot 80,63 67,71 148,

vu u t 1 N

∑^ s

i=

∑^ t

j=

(nij − ˆnij )^2 ˆnij

Le nˆij sono le frequenze congiunte che si avrebbero nel caso di indipendenza, cioè se tutte le distribuzioni condizionate percentuali fossero uguali alla marginale percentuale. Queste sono anche dette frequenze interne della tabella di indipendenza e si trovano nel modo seguente:

ˆnij =

ni 0 · n 0 j N

La tabella di indipendenza risulta:

X/ Y Si No Tot Centro 24,67 3,87 28, Nord 58,53 9,18 67, Sud e Isole 45,03 7,06 52, Tot 128,23 20,11 148,

Si può notare che la somma per riga e colonna delle frequenze di indipendenza ricostituisce i totali di riga e colonna della tabella delle frequenze congiunte osservate. L’indice Ψ è risulta:

[

(24; 56 − 24 ; 67)^2

(3; 98 − 3 ; 87)^2

(55; 32 − 58 ; 53)^2

]

[

(12; 39 − 9 ; 18)^2

(48; 35 − 45 ; 03)^2

(3; 7 − 7 ; 06)^2

]

in cui 3,12 è il valore dell’indice ^2. L’indice C di Cramer si ottiene con la seguente formula ed indica la presenza di una debole dipendenza tra i due caratteri:

C =

min((s − 1); (t − 1))

min(3 − 1)(2 − 1)

La verifica delle modalità che si associano si ottiene o dal confronto tra frequenze congiunte osservate e di indipendenza (se le frequenze osservate sono superiori a quelle di indipenden- za le modalità dei due caratteri si attraggono, viceversa si respingono) o dal confronto tra le distribuzioni condizionate percentuali di Y rispetto ad X e la marginale percentuale di Y. Risulta:

  • si respingono le coppie "Nord" e "Si" e "Sud e Isole" e "No"; si respingono molto debol- mente anche "Centro" e "Si"
  • si attraggono le coppie "Nord" e "No" e "Sud e Isole" e "Si"; si attraggono molto debol- mente anche "Centro" e "No"

L’analisi di correlazione consiste nel valutare se tra due variabili quantitative esista una relazione lineare reciproca. Tale relazione è misurata dal coefficiente di correlazione, che assume valori compresi nell’intervallo (-1,1) assumendo valore 1 nel caso di perfetta relazione crescente e -1 nel caso di perfetta relazione decrescente. Il nucleo del coefficiente di correlazione è la covarianza, la media dei prodotti degli scarti dalle medie, che assume segno positivo o negativo a seconda che le variabili presentino concordanza o discordanza nelle variazioni rispetto alle medie.

1 2 3 4 5 6

2

3

4

5

6

7

X

Y

1 2 3 4 5 6

2

3

4

5

X

Y

1 2 3 4 5 6

2

3

4

5

X

Y

In figura sono rappresentate tre distribuzioni doppie secondo due caratteri quantitativi X e Y caratterizzate la prima da un valore del coefficiente di correlazione pari a 0,95 (a valori di X inferiori (superiori) alla media aritmetica corrispondono valori di Y inferiori (superiori) alla media aritmetica); la seconda da un valore del coefficiente di correlazione pari a -0,97; la terza da un valore del coefficiente di correlazione pari a 0.

L’analisi di regressione consiste nel valutare se una variabile Y dipenda da una variabile X mediante una relazione lineare. Si consideri la distribuzione doppia secondo le variabili Y (fat- turato in milioni di euro) e X (investimenti in centinaia di migliaia di euro) di 5 unità statistiche (imprese):

X Y 4 9 5 6 3 6 8 3 7 4

Il modello di regressione semplice è dato dalla relazione lineare:

Yi = 0 + 1 Xi + ϵi

in cui 0 rappresenta l’intercetta e 1 il coefficiente di regressione (pendenza o coefficiente an- golare) della retta di regressione; ϵi è definito residuo o errore e riflette le imperfezioni della relazione lineare ed eventuali variabili esplicative omesse. La stima dei coefficienti di regressione si ottiene attraverso il metodo di stima dei minimi quadrati, che consiste nel ricercare le stime di 0 e 1 che rendono minima la seguente espressione:

ed il denominatore utilizzando la colonna (X − X¯)^2 :

DX =

∑^ N

i=

(xi − x¯)^2 = (1; 96 + 0; 16 + 5; 76 + 6; 76 + 2; 56) = 17; 2

Una volta definite tali quantità si può procedere alla stima del coefficiente di regressione:

b 1 =

e dell’intercetta:

b 0 = 5; 6 − (− 0 ; 88 × 5 ; 4) = 10; 35

Per verificare l’idoneità del modello a rappresentare la relazione statistica tra le variabili Y e X viene introdotto un indice che misura la bontà di adattamento della retta di regressione ai punti osservati. Tale indice, noto come coefficiente di determinazione (r^2 ), è dato da:

r^2 =

DSL

DY

DRL

DY

in cui DY è la devianza di Y , DSL =

∑N

i=1( ˆyi^ −^ y¯)

2 , DRL = ∑N

i=1(yi^ −^ yˆi) (^2) e yˆi = b 0 + b 1 xi.

Ad esempio y ˆ 1 = 10; 35 − 0 ; 88 × x 1 = 10; 35 − 0 ; 88 × 4 = 6; 83 DSL = 1; 51 + 0; 12 + 4; 45 + 5; 24 + 1; 99 = 13; 31

DY =

∑^ N

i=

(yi − y¯)^2 = (11; 56 + 0; 16 + 0; 16 + 6; 76 + 2; 56) = 21; 2

r^2 =

In modo analogo l’indice di bontà di adattamento è calcolabile come:

r^2 =

C XY^2

DX DY

17 : 2 × 21 : 2

Il valore assunto dall’indice denota un discreto adattamento della retta di regressione ai punti osservati. Infatti il 63% della variabilità di Y è spiegata dalla retta di regressione. E’ possibile utilizzare il modello a scopo previsivo come conseguenza del discreto valore ottenuto dell’indice di adattamento: y ˆ(9) = 10: 35 − 0 : 88 × 9 = 2: 43

I confronti consentono di comparare due grandezze a e b. Mentre la differenza a − b risulta espressa nella stessa unità di misura di a e b, il rapporto b=a può essere visto come la soluzione in x della proporzione b=a = x= 1. Con questa lettura, il rapporto si interpreta come il numero di unità di grandezza al numeratore per ogni unità di grandezza al denominatore. Risolvendo invece la proporzione b=a = x= 100 il rapporto b=a ∗ 100 si interpreta come il numero di unità di grandezza al numeratore per ogni 100 unità di grandezza al denominatore. Ha inoltre senso stabilire variazioni ottenibili come (b − a) a

b a

o (b − a) a

b a

Si descrivono i rapporti di composizione, i rapporti di coesistenza, i rapporti di derivazione, i numeri indici. Si consideri la seguente distribuzione di quantità che rappresenta la spesa mensile per le famiglie secondo la categoria di consumo per ripartizione territoriale-anno 1987 (Fonte ISTAT).

Categoria di consumo Nord Centro Sud valore % valore % valore % Pane e cereali 70.708 15,0 75.118 ... 74. ... Carne 136.232 28,9 174.058 ... 137. ... Pesce 22.252 4,7 40.486 ... 43. ... Latte, formaggi e uova 64.048 13,6 63.783 ... 61. ... Olii e grassi 26.112 5,5 34.902 ... 31. ... Patate, frutta e ortaggi 71.947 15,3 87.062 ... 67. ... Zucchero, the, caffè, cacao 32.406 6,9 34.127 ... 34. ... Bevande 47.674 10,1 44.253 ... 35. ... Totale 471.379 100,0 553.789 ... 485. ...

Il rapporto di composizione è la quantità ottenuta dividendo, per ciascuna ripartizione, il valore della categoria per il totale di colonna e moltiplicando tale quantità per 100. In questo modo è facile notare che la prima percentuale, 15,0 %, è data da (70.708/471.379)100; in modo analogo la seconda percentuale, 28,9% è data da (136.232/471.379)100 e via di seguito. Calcolo analogo dovrà essere fatto per trovare i rapporti di composizione per il Centro e il Sud. I risultati sono riportati nella tabella seguente.

Categoria di consumo Nord Centro Sud valore % valore % valore % Pane e cereali 70.708 15,0 75.118 13,6 74.702 15, Carne 136.232 28,9 174.058 31,4 137.098 28, Pesce 22.252 4,7 40.486 7,3 43.696 9, Latte, formaggi e uova 64.048 13,6 63.783 11,5 61.901 12, Olii e grassi 26.112 5,5 34.902 6,3 31.486 6, Patate, frutta e ortaggi 71.947 15,3 87.062 15,7 67.355 13, Zucchero, the, caffè, cacao 32.406 6,9 34.127 6,2 34.005 7, Bevande 47.674 10,1 44.253 8,0 35.679 7, Totale 471.379 100,0 553.789 100,0 485.922 100,

Il rapporto di coesistenza permette un confronto diretto tra le modalità della distribuzione. E’ una quantità ottenuta dividendo due modalità di interesse e moltiplicando il valore ottenuto per

  1. Ne segue che per calcolare il rapporto di coesistenza tra la categoria di consumo “Pane e cereali” e la categoria di consumo “Carne” si dovrà dividere il valore di spesa della categoria

c) L’indice (o quoziente) di mortalità equivale al numero di morti diviso il numero di residenti moltiplicato per 1.000. Tale indice è un rapporto di derivazione essendo il rapporto tra un fenomeno di movimento (numero di morti) e il fenomeno che lo ha generato e che rappresenta il suo antecedente logico (numero di residenti). Così, ad esempio, il quoziente di mortalità per il Piemonte sarà pari a (48.715/4.383.330)1.000=11,1; per il Trentino Alto Adige tale quoziente sarà (8.157/881.112)1.000=9,3 e così via. Gli altri quozienti sono riportati nella tabella successiva.

Regioni Matrimoni Nati vivi Morti Residenti Quoziente Quoziente Quoziente di nuzialità di natalità di mortalità Piemonte 20.396 31.571 48.715 4.383.330 4,7 7,2 11, Valle d’Aosta 533 841 1.206 114.090 4,7 7,4 10, Lombardia 43.542 72.217 81.017 8.881.595 4,9 8,1 9, Trentino-A.A. 4.810 8.928 8.157 881.112 5,5 10,1 9, Veneto 22.753 35.581 39.377 4.373.890 5,2 8,1 9, Friuli-V.G. 5.467 8.421 14.987 1.212.400 4,5 6,9 12, Liguria 8.033 10.927 22.819 1.754.267 4,6 6,2 13, Emilia Romagna 16.447 25.623 42.748 3.927.607 4,2 6,5 10, Toscana 16.600 25.419 39.330 3.569.923 4,6 7,1 11, Umbria 4.023 6.602 8.438 818.039 4,9 8,1 10, Marche 6.755 11.775 13.663 1.427.761 4,7 8,2 9, Lazio 27.546 49.749 43.860 5.126.698 5,4 9,7 8, Abruzzo 6.647 11.814 11.613 1.256.059 5,3 9,4 9, Molise 1.779 3.472 3.199 334.438 5,3 10,4 9, Campania 37.787 80.929 42.978 5.710.929 6,6 14,2 7, Puglia 25.516 51.697 30.101 4.034.574 6,3 12,8 7, Basilicata 3.748 6.842 5.161 620.883 6,0 11,0 8, Calabria 12.631 25.888 16.840 2.143.013 5,9 12,1 7, Sicilia 31.265 66.119 44.872 5.126.708 6,1 12,9 8, Sardegna 9.050 17.914 12.658 1.651.218 5,5 10,8 7,

Si consideri la serie storica relativa ai matrimoni celebrati in Italia tra il 1980 e il 1988. La tabella precedente riporta per ogni anno l’intensità del fenomeno matrimoni.

Anno N. di matrimoni 1980 322. 1981 316. 1982 312. 1983 300. 1984 298. 1985 295. 1986 296. 1987 305. 1988 315.

a) Il numero indice semplice a base fissa dell’anno t detto It|l si calcola dividendo il numero di matrimoni di quell’anno at per il numero di matrimoni celebrati nell’anno considerato come base (1980) al e moltiplicando tale quantità per 100.

It|l =

at al

Per il primo anno tale valore sarà necessariamente uguale a 100 essendo il 1980 l’anno base. Per il 1981 il numero indice verrà calcolato come (316.953/322.968)100= 98,14; per il 1982 si avrà (312.494/322.968)100= 96,76 e così via. Tali valori restituiscono il numero di matrimoni celebrati nell’anno di interesse ogni 100 matrimoni celebrati nel 1980.

Anno N. di matrimoni N. indice 1980= 1980 322.968 100, 1981 316.953 98, 1982 312.494 96, 1983 300.855 93, 1984 298.028 92, 1985 295.990 91, 1986 296.539 91, 1987 305.328 94, 1988 315.447 97,

b) Le variazioni percentuali si calcolano, a partire dai numeri indice a base fissa, sottraendo 100 ai singoli numeri indice vt|l = It|l − 100.

Anno N. indice 1980=100 Variazione percentuale 1980 100,00 - 1981 98,14 -1, 1982 96,76 -3, 1983 93,15 -6, 1984 92,28 -7, 1985 91,65 -8, 1986 91,82 -8, 1987 94,54 -5, 1988 97,67 -2,

un dato anno per il numero di matrimoni dell’anno precedente e moltiplicando il valore ottenuto per 100. Formalmente it = (^) atat− 1 ∗ 100. Per il primo anno non si potrà calcolare il numero indice a base mobile. Per l’anno 1981, invece, il numero indice a base mobile sarà (316.953/322.968)100= 98,14. Per il 1982 si avrà (312.494/316.953)100= 98,59 e cosà via. Le quantità ottenute indicano il numero di matrimoni celebrati in un dato anno ogni 100 matrimoni celebrati nell’anno precedente.

Anno N. di matrimoni N. indice a base mobile 1980 322.968 - 1981 316.953 98, 1982 312.494 98, 1983 300.855 96, 1984 298.028 99, 1985 295.990 99, 1986 296.539 100, 1987 305.328 102, 1988 315.447 103,

Le variazioni percentuali risultano:

Anno N. indice a base mobile Variazione percentuale 1980 - - 1981 98,14 (98,14-100)=-1, 1982 98,59 (98,59-100)=-1, 1983 96,28 (96,28-100)=-3, 1984 99,06 (99,06-100)=-0, 1985 99,32 (99,32-100)=-0, 1986 100,19 (100,19-100)= 0, 1987 102,96 (102,96-100)= 2, 1988 103,31 (103,31-100)= 3,

Anno N. di matrimoni Variazione percentuale 1980 322.968 -

1981 316.953 (316.^953322 −. 968322 .968)∗ 100 = − 1 ; 86

1982 312.494 (312.^494316 −. 953316 .953)∗ 100 = − 1 ; 41

1983 300.855 (300.^855312 −. 494312 .494)∗ 100 = − 3 ; 72

1984 298.028 (298.^028300 −. 855300 .855)∗ 100 = − 0 ; 94

1985 295.990 (295.^990298 −. 028298 .028)∗ 100 = − 0 ; 68

1986 296.539 (296.^539295 −. 990295 .990)∗ 100 = 0; 19

1987 305.328 (305.^328296 −. 539296 .539)∗ 100 = 2; 96

1988 315.447 (315.^447305 −. 328305 .328)∗ 100 = 3; 31

I numeri indici complessi sono un’applicazione del concetto di valore medio utile quando occorre sintetizzare con un unico valore una distribuzione di numeri indici semplici riferiti ad uno stesso arco di tempo in serie storiche omogenee. Il caso più comune riguarda il calcolo della variazione media dei prezzi di gruppi di beni appartenenti ad uno stesso settore merceologico.

La seguente tabella riporta l’andamento dei prezzi (in euro) del canone di 4 servizi di telecomu- nicazioni tra il 2004 e il 2006 e il numero di clienti (in migliaia) rilevati nei 4 servizi in ciascuno degli anni considerati. Determinare l’indice di Laspeyres con base 2004, e calcolare la variazione dei prezzi dei servizi tra il 2004 e il 2006.

Servizio Prezzo 2004 Clienti 2004 prezzo 2006 Clienti 2006 A 56 9 65 10 B 48 15 52 16 C 40 10 42 14 D 30 6 35 47

Siano p 1 b; p 2 b; : : : ; pkb e p 1 t; p 2 t; : : : ; pkt i prezzi di k beni rispettivamente al tempo base b e al tempo t e q 1 b; q 2 b; : : : ; qkb le quantità scambiate di ciascun bene al tempo base b. E’ possibile cal- colare per ciascun bene i il numero indice semplice corrispondente unitario pit=pib o percentuale It|b = pit=pib ∗ 100. L’indice di Laspeyres (IL) è una media aritmetica dei numeri indici semplici di ciascun bene con un sistema di ponderazione costituito dalla spesa sostenuta per ciascun bene al tempo base pib · qib.

IL =

∑k i=

pit pib ·^ pibqib ∑k i=1 pibqib

∑k ∑i=1^ pitqib k i=1 pibqib

Considerando i prezzi del 2004 come i prezzi del bene al tempo base, i prezzi del 2006 come i prezzi dei beni al tempo t, i clienti 2004 come le quantità riferite al tempo base e i clienti 2006 come le quantità riferite al tempo t, i numeri indici semplici saranno:

I 04 | 06 A = 65=56 = 1; 16 I 04 | 06 B = 52=48 = 1; 08 I 04 | 06 C = 42=40 = 1; 05 I 04 | 06 D = 35=30 = 1; 17

e di conseguenza

IL =

Analogamente, applicando la formula semplificata l’indice di Laspeyres sarà:

IL =

I prezzi, complessivamente, sono aumentati di 110 ; 6 − 100 = 10; 6%