Esercizi svolti di statistica descrittiva e probabilità, Esercitazioni e Esercizi di Probabilità e Statistica. Università degli Studi di Salerno
ley
ley

Esercizi svolti di statistica descrittiva e probabilità, Esercitazioni e Esercizi di Probabilità e Statistica. Università degli Studi di Salerno

PDF (652 KB)
110 pagine
50Numero di download
1000+Numero di visite
95%su 59 votiNumero di voti
31Numero di commenti
Descrizione
esercizi svolti di statistica descrittiva e probabilità
100 punti
Punti download necessari per scaricare
questo documento
Scarica il documento
Anteprima3 pagine / 110
Questa è solo un'anteprima
3 pagine mostrate su 110 totali
Scarica il documento
Questa è solo un'anteprima
3 pagine mostrate su 110 totali
Scarica il documento
Questa è solo un'anteprima
3 pagine mostrate su 110 totali
Scarica il documento
Questa è solo un'anteprima
3 pagine mostrate su 110 totali
Scarica il documento
esercizi.dvi

Esercizi di Statistica

Selezione di esercizi proposti durante le esercitazioni

dei corsi di Statistica tenute presso

la Facoltà di Economia dell’Università di Salerno

Versione del 16 settembre 2010

Per fornire un contributo al miglioramento del presente volume, segnalare eventuali errori in esso contenuti a: Marcella Niglio, e-mail: [email protected] o a Marialuisa Restaino: [email protected]

2

Indice

1 Statistica Descrittiva 4

1.1 Distribuzioni di frequenza e rappresentazioni grafiche . . . . . . . . . . . . . . . . . 4 1.2 Indici statistici descrittivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.3 Concentrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 1.4 Distribuzioni Doppie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 1.5 Numeri Indici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 1.6 Interpolazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 1.7 Esercizi Proposti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

2 Calcolo delle Probabilità 51

2.1 Calcolo delle probabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 2.2 Variabili Casuali Discrete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.3 Variabili Casuali Continue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 2.4 Esercizi Proposti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

3 Inferenza Statistica 76

3.1 Stime puntuali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 3.2 Test delle ipotesi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 3.3 Intervalli di confidenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 3.4 Esercizi Proposti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

4 Il Modello di Regressione 92

4.1 Modello di Regressione Lineare Semplice . . . . . . . . . . . . . . . . . . . . . . . . 92

5 Tracce di esame 98

3

Capitolo 1

Statistica Descrittiva

1.1 Distribuzioni di frequenza e rappresentazioni grafiche

Esercizio 1 La società Gamma s.p.a., dopo aver effettuato una ricerca di personale qualificato per coprire la posizione di responsabile delle relazioni con l’estero, ha ricevuto 20 curriculum vitae da cittadini sia italiani che stranieri. Alcune informazioni, ritenute particolarmente rilevanti dalla società, sono sintetizzate nella seguente tabella:

Livello minimo unità genere età cittadinanza di reddito mensile Anni di esperienza

desiderato lavorativa

1 M 28 italiana 2.3 2 2 M 34 inglese 1.6 8 3 F 46 belga 1.2 21 4 M 26 spagnola 0.9 1 5 F 37 italiana 2.1 15 6 F 29 spagnola 1.6 3 7 M 51 francese 1.8 28 8 F 31 belga 1.4 5 9 F 39 italiana 1.2 13 10 M 43 italiana 2.8 20 11 F 58 italiana 3.4 32 12 F 44 inglese 2.7 23 13 F 25 francese 1.6 1 14 M 23 spagnola 1.2 0 15 F 52 italiana 1.1 29 16 F 42 tedesca 2.5 18 17 F 48 francese 2 19 18 F 33 italiana 1.7 7 19 M 38 tedesca 2.1 12 20 M 46 italiana 3.2 23

Tabella 1.1: Dati raccolti su 20 candidati a seguito di una ricerca di personale qualificato

4

ESERCIZI DI STATISTICA

1. Definire quali sono le l’unità statistiche oggetto di rilevazione.

2. Identificare quali sono le variabili e le mutabili osservate.

3. Costruire, per tutte le variabili e mutabili, le corrispondenti distribuzioni di frequenza (per le variabili continue costruire distribuzioni di frequenza con quattro classi di modalità di uguale ampiezza).

4. È possibile calcolare le frequenze relative cumulate per tutte le variabili e mutabili oppure è necessario che si disponga solo di dati quantitativi?

2

Soluzione

1. Le unità statistiche della rilevazione sono gli individui rispondenti alla ricerca di personale qualificato effettuata dalla società Gamma.

2. Le mutabili sono: genere e cittadinanza; le variabili sono: età, livello minimo di reddito mensile desiderato, anni di esperienza lavorativa.

3. Le distribuzioni di frequenza delle due mutabili sono:

Genere xi ni M 8 F 12

Totale 20

Cittadinanza xi ni

italiana 8 inglese 2 belga 2

spagnola 3 francese 3 tedesca 2

Totale 20

Per le restanti variabili età, livello minimo di reddito mensile desiderato ed anni di esperienza lavorativa, sono costruite tre distribuzioni di frequenza con quattro classi di modalità. In particolare, dopo aver calcolato l’ampiezza della classe per le tre variabili:

h = max(x) −min(x)

4

si ottiene:

Età (h = 8.75) classi ni 23| − |31.75 6 31.75− |40.5 5 40.50− |49.25 6 49.25− |58 3 Totale 20

Livello min. reddito (h = 0.625) classi ni 0.9| − |1.525 6 1.525− |2.15 8 2.15− |2.775 3 2.775− |3.4 3 Totale 20

Anni esperienza (h = 8) classi ni 0| − |8 8 8− |16 3 16− |24 6 24− |32 3 Totale 20

5

CAPITOLO 1. STATISTICA DESCRITTIVA

4. Le frequenze relative cumulate possono essere calcolate sia quando si hanno in esame le variabili che le mutabili in quanto hanno ad oggetto le sole frequenze.



Esercizio 2 Utilizzando le distribuzioni di frequenza costruite nell’esercizio 1 per le variabili età, livello minimo di reddito mensile desiderato e per la mutabile cittadinanza:

1. Calcolare le rispettive frequenze relative e frequenze relative cumulate.

2. Valutare se più del 70% delle unità statistiche ha un’età inferiore a 40 anni.

3. Valutare se almeno il 20% accetterebbe l’impiego qualora gli venisse offerto un reddito mensile pari a 1525Euro.

4. È possibile affermare che più del 30% dei curriculum ricevuti proviene da candidati inglesi?

2

Soluzione

1. Le frequenze relative e relative cumulate delle tre distribuzioni sono:

Età classi ni fi Fi 23| − |31.75 6 0.3 0.3 31.75− |40.5 5 0.25 0.55 40.50− |49.25 6 0.3 0.85 49.25− |58 3 0.15 1 Totale 20

Livello minimo di reddito classi ni fi Fi 0.9| − |1.525 6 0.3 0.3 1.525− |2.15 8 0.4 0.7 2.15− |2.775 3 0.15 0.85 2.775− |3.4 3 0.15 1 Totale 20

Cittadinanza xi ni fi Fi italiana 8 0.4 0.4 inglese 2 0.1 0.5 belga 2 0.1 0.6 spagnola 3 0.15 0.75 francese 3 0.15 0.9 tedesca 2 0.1 1

Totale 20

2. Dalla distribzione di frequenza Età, si osserva che in corrispondenza della classe 31.75−|40.5 la frequenza relativa cumulata Fi = 0.55, ovvero il 55% delle unità statistiche ha un’età ≤ 40.5 anni. Quindi dalla verifica risulta che meno del 70% delle unità statistiche ha un’età inferiore a 40 anni e quindi l’affermazione è falsa.

6

ESERCIZI DI STATISTICA

3. Dalla prima frequenza relativa cumulata della distribuzione Livello minimo di reddito si osserva che il 30% accetterebbe l’impiego con un reddito ≤ 1525Euro. Quindi è possibile solo affermare che più del 20% accoglierebbe la proposta di impiego se venisse offerto un reddito ≤ 1525Euro mentre non si è in grado di individuare la percentuale di coloro che accetterebbero l’impiego con un reddito minimo pari a 1525Euro.

4. L’affermazione è falsa in quanto, osservando le frequenze relative della distribuzione Cittadi- nanza, solo il 10% dei curriculum ricevuti proviene da candidati di cittadinanza inglese.



Esercizio 3 Utilizzando i dati e le distribuzioni di frequenza dell’Esercizio 1:

1. Rappresentare graficamente i caratteri Cittadinanza e Livello minimo di reddito desiderato utilizzando rispettivamente un diagramma a nastri ed un istogramma di frequenze.

2. Rappresentare la funzione di ripartizione della variabile Livello minimo di reddito desiderato

2

Soluzione

1. Il diagramma a nastri della mutabile Cittadinanza è rappresentato nel seguente grafico:

italiana inglese belga spagnola francese tedesca

cittadinanza

0

2

4

6

8

n

Figura 1.1: Diagramma a nastri della mutabile Cittadinanza

mentre per rappresentare l’istogramma della variabile Livello minimo di reddito desiderato è necessario il preliminare calcolo dell’intensità associata a ciascuna classe:

hi = ni

(xi − xi−1) i = 1, . . . , k

con k il numero di classi, ed i cui valori sono riportati in tabella:

7

CAPITOLO 1. STATISTICA DESCRITTIVA

Livello minimo di reddito classi ni hi 0.9| − |1.525 6 9.6 1.525− |2.15 8 12.8 2.15− |2.775 3 4.8 2.775− |3.4 3 4.8

La rappresentazione grafica dell’istogramma è quindi:

0.900 1.525 2.150 2.775 3.400

reddito

0

2

4

6

812.

9.6

6.4

hi

3.2

Figura 1.2: Istogramma della variabile Livello minimo di reddito

2. La funzione di ripartizione richiede l’utilizzo delle informazioni contenute nella distribuzione di frequenze Livello minimo di reddito di cui all’esercizio 2, da cui segue la rappresentazione:

0 1 2 3 4 reddito

0.0

0.2

0.4

0.6

0.8

1.0

F i

Figura 1.3: Funzione di ripartizione empirica della variabile Livello minimo di reddito



Esercizio 4 La società Stat s.p.a. ha effettuato un’indagine su una popolazione di 15 famiglie sulle quali ha rilevato tre caratteri: la zona di residenza, il reddito medio mensile familiare ed il numero di componenti in età lavorativa, i cui dati sono riportati nella Tabella 1.2.

8

ESERCIZI DI STATISTICA

1. Costruire le distribuzioni di frequenza dei tre caratteri osservati (si costruisca la distribuzione della variabile RM con quattro classi di modalità di uguale ampiezza).

2. Rappresentare graficamente le variabili RM ed NL.

Reddito medio N. componenti in età Unità Residenza (×1000Euro) lavorativa

(Res) (RM) (NL) 1 Nord 4.25 2 2 Centro 1.78 1 3 Nord 10.5 3 4 Sud 6.11 3 5 Sud 3.56 2 6 Centro 8.3 4 7 Sud 1.52 1 8 Nord 2.3 0 9 Centro 1.5 1 10 Nord 4.3 2 11 Sud 1.65 0 12 Sud 3.33 2 13 Centro 1.4 1 14 Sud 6.04 4 15 Nord 7.89 3

Tabella 1.2: Dati relativi alla zona di residenza, al reddito medio mensile familiare ed al numero di componenti in età lavorativa di 15 famiglie intervistate

2

Soluzione

1. Le tre distribuzioni richieste per le variabili in esame sono le seguenti:

Residenza xi ni

Nord 5 Centro 4 Sud 6

Totale 15

Reddito medio (h = 2.275) classi ni

1.4| − |3.675 8 3.675− |5.95 2 5.95− |8.225 3 8.225− |10.5 2

Totale 15

N. età lavorativa xi ni 0 2 1 4 2 4 3 3 4 2

Totale 15

2. Le rappresentazioni grafiche opportune per i dati in esame sono il diagramma a nastri per la variabile NL e l’istogramma per la variabile RM presentate in Figura 1.4.

9

CAPITOLO 1. STATISTICA DESCRITTIVA

0 1 2 3 4

NL

0

1

2

3

4

n i

1.400 3.675 5.950 8.225 10.500

RM

0

2

4

6

83.52

2.64

0.88

hi 1.76

Figura 1.4: Diagramma a nastri della variabile NL ed istogramma della variabile RM



1.2 Indici statistici descrittivi

Esercizio 5 Utilizzando le distribuzioni di frequenza costruite nell’esercizio 1:

1. Calcolare la media di tutte le variabili quantitative.

2. L’età media delle unità statistiche è maggiore di 30?

3. La media degli Anni di esperienza lavorativa maturata dalle unità statistiche è almeno pari a 10?

4. Calcolare il valore mediano del Livello minimo di reddito mensile desiderato.

5. Calcolare la mediana dell’Età delle unità statistiche.

6. Calcolare la moda della variabile Anni di esperienza lavorativa

7. Assumendo di aver creato per la variabile Anni di esperienza lavorativa la seguente dis- tribuzione di frequenze con 4 classi di modalità di differente ampiezza:

classi ni 0| − |9 8 9− |17 3 17− |23 6 23− |32 3

definire la classe modale e calcolare la moda.

2

10

ESERCIZI DI STATISTICA

Soluzione

1. Il calcolo delle medie delle distribuzioni di frequenza in classi richiede il preliminare calcolo del valore centrale di ciascuna classe come riportato nel seguito:

Età classi ni ci ci × ni 23| − |31.75 6 27.375 164.250 31.75− |40.5 5 36.125 180.625 40.50− |49.25 6 44.875 269.250 49.25− |58 3 53.625 160.875 Totale 20 775

µ = 1N

k ∑

i=1

ci × ni = 38.75

Livello minimo di reddito classi ni ci ci × ni 0.9| − |1.525 6 1.213 7.278 1.525− |2.15 8 1.838 14.704 2.15− |2.775 3 2.463 7.389 2.775− |3.4 3 3.088 9.264 Totale 20 38.635

µ = 1N

k ∑

i=1

ci × ni = 1.932

Anni di esperienza lavorativa classi ni ci ci × ni 0| − |8 8 4 32 8− |16 3 12 36 16− |24 6 20 120 24− |32 3 28 84 Totale 20 272

µ = 1N

k ∑

i=1

ci × ni = 13.6

2. La media dell’Età delle unità statistiche è pari a 38.750, quindi risulta maggiore di 30.

3. Il numero di Anni di esperienza lavorativa è pari a 13.6 quindi supera gli almeno 10 anni richiesti dal quesito.

4. Il valore della mediana del Livello minimo di reddito è approssimato utilizzando la seguente formula:

Me ≈ xi−1 + (xi − xi−1) 0.5− Fi−1 Fi − Fi−1

Quindi identificata la classe mediana, xi−1 − |xi : Fi ≥ 0.5, data da 1.525 − |2.15, il valore approssimato della mediana è:

Me ≈ 1.525 + (2.15− 1.525)0.5− 0.3 0.7− 0.3 = 1.837

5. Per il calcolo della mediana della variabile Età valgono le stesse considerazioni fatte al punto precedente, quindi:

Me ≈ 31.75 + (40.5− 31.75) 0.5− 0.3 0.55− 0.3 = 38.75

11

CAPITOLO 1. STATISTICA DESCRITTIVA

6. La moda della variabile Anni di esperienza lavorativa è pari al valore centrale della classe modale 0| − |8, ovvero Mo = 4

7. Per individuare la classe modale in presenza di classi di diversa ampiezza, è necessario cal- colare l’intensità associata a ciascuna classe xi−1 − |xi, data da:

hi = ni

(xi − xi−1) i = 1, . . . , k

quindi

Anni di esperienza lavorativa classi ni hi 0| − |9 8 0.89 9− |17 3 0.38 17− |23 6 1.00 23− |32 3 0.33 Totale 20

da cui emerge che la classe modale è 17−|23 perchè ad essa è associata la massima intensità, ed il valore approssimato della moda è:

Mo ≈ (xi−i + xi) 2

= 17 + 23

2 = 20



Esercizio 6 Utilizzando i dati in Tabella 1.1 relativi alla variabile Livello minimo di reddito e la corrispondente distribuzione di frequenze nell’esercizio 1:

1. Calcolare i quartili della variabile in esame.

2. Rappresentarne il box-plot.

3. Sono presenti valori eccezionali nei dati?

4. Assumendo che la società Gamma s.p.a. in occasione di un’altra ricerca di personale qualifi- cato abbia rilevato i seguenti livelli minimi di reddito desiderati da ulteriori 20 candidati:

V2 : 4.4 5.2 2.9 2.9 2.9 4.1 1.5 2.9 2.9 0.7 4.8 1.5 2.9 1.5 3.4 5.9 0.7 5.9 8.7 2.9

Rappresentare i box-plot paralleli della variabile Livello minimo di reddito desiderato in Tabella 1.1 (V 1) e della nuova variabile riportata (V 2).

2

12

ESERCIZI DI STATISTICA

Soluzione

1. Il calcolo dei quartili in presenza di una distribuzione di frequenze per classi di modalità richiede nuovamente l’impiego di formule di approssimazione:

Q1 ≈ xi−1 + (xi − xi−1) 0.25− Fi−1 Fi − Fi−1

Q3 ≈ xi−1 + (xi − xi−1) 0.75− Fi−1 Fi − Fi−1

Segue quindi che i quartili richiesti assumono i seguenti valori:

Q1 = 1.421 Q2 ≡ Me = 1.837 Q3 = 2.358

2. La rappresentazione grafica, mediante box-plot, della variabile Livello minimo di reddito desiderato richiede l’impiego dei quartili appena calcolati e di ulteriori informazioni riportate nel seguito:

min(x) = 0.9 max(x) = 3.4

h1 = Q1 − 1.5(Q3 −Q1) = 0.015 H2 = Q3 + 1.5(Q3 −Q1) = 3.763

da cui segue il grafico in Figura 1.5.

Figura 1.5: Box plot del Reddito Desiderato

3. Dal grafico in Figura 1.5 emerge che non sono presenti valori eccezionali nella serie osservata, infatti h1 < min(x) ed H2 > max(x).

4. La rappresentazione mediante box-plot paralleli delle due variabili richiede il preliminare calcolo dei quartili e dei valori cardine della variabile V 2, nonchè la conoscenza del minimo

13

CAPITOLO 1. STATISTICA DESCRITTIVA

e del massimo valore assunto da V 2 come già fatto in precedenza per V 1. Tali valori sono pari a:

min(x) = 0.7 Q1 = 2.21 Q2 = Me = 2.9 Q3 = 4.6 max(x) = 8.7 h1 = −1.38 H2 = 8.19

mentre la rappresentazione grafica richiesta è presentata in Figura 1.6.

Emerge immediatamente che V 2 presenta un valore eccezionale, contrassegnato con un as- terisco, in corrispondenza del livello di reddito desiderato 8.7.

Figura 1.6: Box plot paralleli di V1 e V2



Esercizio 7 Utilizzando i dati in tabella 1.1:

1. Calcolare la varianza della variabile Livello minimo di reddito desiderato avvalendosi della distribuzione di frequenze precedentemente costruita per tale variabile nell’esercizio 1.

2. Calcolare la varianza della serie di dati Anni di esperienza lavorativa

3. Utilizzando la serie di dati della variabile Età, calcolare la varianza dell’età delle prime 10 unità statistiche. In seguito, calcolare la varianza delle successive 10 ed ultime unità statistiche.

4. La variabilità dell’età delle prime 10 unità statistiche è maggiore della variabilità dell’età delle ultime 10 unità?

5. Se si standardizza la variabile Livello minimo di reddito desiderato, quale valore assumono la media e la varianza?

6. È possibile affermare che la mutabile cittadinanza ha un’elevata eterogeneità?

2

14

ESERCIZI DI STATISTICA

Soluzione

1. Il calcolo della varianza della variabile Livello minimo di reddito è effettuato ricorrendo alla seguente formula:

σ2 = 1

N

k ∑

i=1

(ci − µ)2ni = µ2 − µ2 con µ2 = 1

N

k ∑

i=1

c2ini

A tale scopo è costruita la tabella che segue:

Livello minimo di reddito classi ni ci c

2 i × ni

0.9| − |1.525 6 1.213 8.828 1.525− |2.15 8 1.838 27.026 2.15− |2.775 3 2.463 18.199 2.775− |3.4 3 3.088 28.607 Totale 20 82.660

da cui emerge che µ2 = 4.133 mentre la varianza è pari a σ 2 = 4.133− (1.932)2 = 0.4.

2. La varianza della serie di dati Anni di esperienza lavorativa è calcolata con:

σ2 = 1

N

N ∑

i=1

(xi − µ)2 = 100.2

3. Utilizzando la serie di dati Età, segue che la varianza della prima sottoserie data da:

28 34 46 26 37 29 51 31 39 43

è pari a σ21 = 62.44 mentre la seconda sottoserie:

58 44 25 23 52 42 48 33 38 46

ha varianza σ22 = 114.69

4. L’affermazione è falsa in quanto la variabilità della seconda sottoserie è maggiore della va- riabilità della prima sottoserie risultando σ22 > σ

2 1 .

5. La media della variabile Livello minimo di reddito desiderato standardizzata è pari a 0 mentre la varianza è 1.

6. L’eterogeneità della mutabile cittadinanza è possibile misurarla con l’indice di mutabilità del Gini o con l’indice di entropia di Shannon, rispettivamente pari a:

MGr = k

k − 1

[

1− k ∑

i=1

f2i

]

Hr = − k ∑

i=1

filog(fi)

log(k)

15

CAPITOLO 1. STATISTICA DESCRITTIVA

con k il numero di modalità per il cui calcolo si utilizzano le informazioni nella seguente tabella:

Cittadinanza xi ni fi f

2 i log(fi) fi log(fi)

italiana 8 0.4 0.16 -0.40 -0.16 inglese 2 0.1 0.01 -1.00 -0.10 belga 2 0.1 0.01 -1.00 -0.10

spagnola 3 0.15 0.02 -0.82 -0.12 francese 3 0.15 0.02 -0.82 -0.12 tedesca 2 0.1 0.01 -1.00 -0.10

Totale 20 0.23 -0.70

da cui segue che l’indice di mutabilità del Gini è: MGr = 6 5 (1− 0.23) = 0.924

mentre l’indice di entropia di Shannon è: Hr = 0.70

log(6) = 0.90

Dai risultati precedenti è possibile affermare che il fenomeno presenta elevata eterogeneità.



Esercizio 8 Utilizzando i dati in Tabella 1.1:

1. Misurare l’asimmetria della variabile Livello minimo di reddito desiderato avvalendosi della corrispondente distribuzione di frequenze.

2. Osservando i box plots in Figura 1.5: le due variabili V 1 e V 2 presentano uguale asimmetria e variabilità?

3. La distribuzione della variabile Livello minimo di reddito desiderato può dirsi leptocurtica?

2

Soluzione

1. L’asimmetria della distribuzione della variabile Livello minimo di reddito desiderato è possi- bile misurarla con indici robusti e non robusti. Qualora si preferiscano questi ultimi ci si può avvalere dell’indice di asimmetria di Fisher:

γ1 = 1

Nσ3

k ∑

i=1

(xi − µ)3ni

mentre un esempio di indice robusto è la differenza interquartile:

DIr = (Q3 −Q2)− (Q2 −Q1) (Q3 −Q2) + (Q2 −Q1)

16

ESERCIZI DI STATISTICA

Il calcolo di γ1 richiede l’utilizzo dei dati nella tabella che segue:

Livello minimo di reddito classi ni ci (ci − µ)3 × ni 0.9| − |1.525 6 1.213 -2.23 1.525− |2.15 8 1.838 -0.007 2.15− |2.775 3 2.463 0.449 2.775− |3.4 3 3.088 4.634 Totale 20 2.846

ed inoltre risultando, dall’esercizio n. 7, che √ σ2 =

√ 0.4 = 0.632, segue che: γ1 =

2.846 20×0.6323 = 0.564.

Il calcolo della differenza interquartile richiede l’utilizzo dei quartili calcolati in precedenza e

quindi DIr = (2.358−1.837)−(1.837−1.421) (2.358−1.837)+(1.837−1.421) = 0.112.

2. L’esame dei box-plots evidenzia come la variabile V 2 presenta maggiore variabilità, misurata in termini di differenza tra quartili, rispetto alla V 1 mentre entrambe mostrano asimmetria positiva come è immediatamente valutato dall’ osservazione della posizione della mediana nei box rappresentati.

3. Per poter rispondere al quesito è necessario calcolare l’indice di curtosi:

γ2 = 1

Nσ4

k ∑

i=1

(xi − µ)4ni − 3

dove, da calcoli precedenti, µ = 1.931 e σ = 0.634.

Per rendere più agevole il calcolo di γ2, può essere utile avvalersi dei dati nella seguente tabella:

Livello minimo di reddito classi ni ci (ci − µ)4 × ni 0.9| − |1.525 6 1.213 1.603 1.525− |2.15 8 1.838 0.001 2.15− |2.775 3 2.463 0.239 2.775− |3.4 3 3.088 5.357 Totale 20 7.2

da cui segue che: γ2 = 7.2

20×0.6344 − 3 = −0.744 Dai risultati ottenuti è possibile affermare che la distribuzione della variabile Livello minimo di reddito non è leptocurtica ma bens̀ı platicurtica in quanto l’indice di curtosi γ2 è pari a -0.744. Quindi l’affermazione è falsa.



17

CAPITOLO 1. STATISTICA DESCRITTIVA

Esercizio 9 La società Stat di cui all’esercizio 4 desidera fornire al committente dell’indagine maggiori dettagli descrittivi sui dati presentati in Tabella 1.2, a tale scopo:

1. Calcolare la media e la varianza delle variabili RM ed NL utilizzando le distribuzioni di frequenza precedentemente costruite.

2. Rappresentare il box plot della variabile RM e commentarlo opportunamente

3. Assumendo che per particolari incentivi governativi il reddito mensile medio familiare subisce la seguente trasformazione lineare:

RMN = 0.3 + 1.15×RM

calcolare la media e la varianza di RMN .

4. Misurare l’asimmetria e la curtosi della variabile RM utilizzando indici non robusti.

5. Misurare l’eterogeneità della variabile Res.

2

Soluzione

1. Il calcolo della media e della varianza delle due variabili è effettuato utilizzando i dati in tabella:

Reddito medio - RM classi ni ci ci × ni c2i × ni

1.4| − |3.675 8 2.538 20.304 51.528 3.675− |5.95 2 4.813 9.626 46.330 5.95− |8.225 3 7.088 21.264 150.720 8.225− |10.5 2 9.363 18.726 175.332

Totale 15 69.920 423.910

N. età lavorativa - NL xi ni xi × ni x2i × ni 0 2 0 0 1 4 4 4 2 4 8 16 3 3 9 27 4 2 8 32

Totale 15 29 79

Da cui segue che le medie sono pari a:

µRM = 1

N

k ∑

i=1

ci × ni = 4.66 µNL = 1

N

N ∑

i=1

xi × ni = 1.93

mentre le varianze sono:

σ2RM = µ2RM−µ2RM = 28.261−4.6612 = 6.536 σ2NL = µ2NL−µ2NL = 5.267−1.9333 = 1.536

2. Il grafico richiesto è riportato in Figura 1.7 da cui emerge l’assenza di valori eccezionali nella variabile di interesse. Inoltre, tenuto conto della posizione delle mediana nel box, è chiaramente visibile la presenza di asimmetria positiva nei dati.

18

ESERCIZI DI STATISTICA

Figura 1.7: Box plot della variabile RM

3. Per la soluzione del presente quesito è necessario utilizzare alcune note regole sulle trasformate lineari di variabili. In particolare si dimostra che data la trasformata lineare y = a+ bx con media e varianza di x note e rispettivamente indicate con µx e σ

2 x, la media e la varianza di

y sono calcolare con:

µy = a+ bµx σ 2 y = b

2σ2x

Quindi nel caso in esame, poichè è noto che µRM = 4.661 e σ 2 RM = 6.536, allora:

µRMN = 0.3 + 1.15× µRM = 5.660 σ2RMN = 1.15 2 × σ2RM = 8.644

4. Per la misura dell’asimmetria e della curtosi della variabile RM mediante indici non robusti γ1 e γ2, si utilizzano i dati della corrispondente distribuzione di frequenze alla quale si ag- giungono alcune colonne:

Reddito medio - RM classi ni ci ci × ni (ci − µ)3 × ni (ci − µ)4 × ni

1.4| − |3.675 8 2.538 20.304 -76.549 162.514 3.675− |5.95 2 4.813 9.626 0.007 0.001 5.95− |8.225 3 7.088 21.264 42.887 104.088 8.225− |10.5 2 9.363 18.726 207.911 977.598

Totale 15 69.913 174.256 1244.201

Dalle elaborazioni precedenti risulta inoltre che la media e lo scarto quadratico medio della variabile RM sono rispettivamente µRM = 4.661 e σRM = 2.557, quindi:

γ1 = 174.256

15× 2.5573 = 0.695 γ2 = 1244.201

15× 2.5574 − 3 = −1.06

19

CAPITOLO 1. STATISTICA DESCRITTIVA

5. La misura dell’eterogenietà è effettuata in questo caso con l’indice di mutabilità del Gini

MGr = k

k − 1

(

1− k ∑

i=1

f2i

)

per il cui calcolo si utilizzano i dati nella seguente tabella:

Residenza xi ni fi f

2 i

Nord 5 0.33 0.11 Centro 4 0.27 0.07 Sud 6 0.40 0.16

Totale 15 0.34

Quindi l’indice relativo MGr = 0.987 ed evidenzia la presenza di elevata eterogenietà nella mutabile osservata.



1.3 Concentrazione

Esercizio 10 Utilizzando i dati della variabile Livello minimo di reddito nell’esercizio 1 e la corrispondente distribuzione di frequenze:

1. Misurarne la concentrazione e rappresentare la corrispondente curva di Lorenz.

2. È possibile affermare che il Livello minimo di reddito è equidistribuito?

2

Soluzione

1. La misura della concentrazione del livello minimo di reddito tramite la distribuzione per classi di modalità precedentemente costruita richiede il calcolo del rapporto di concentrazione:

R = 1− k ∑

i=1

(pi − pi−1)(qi + qi−1)

con pi = 1 N

i ∑

j=1

nj e qi = 1

i ∑

j=1

cjnj per i = 1, 2, . . . , k.

Ricordando che la media del livello minimo di reddito è pari a µ = 1.932 (esercizio 5), segue

che il denominatore delle qi è N · µ = k ∑

i=1

ci · ni = 38.635.

20

ESERCIZI DI STATISTICA

Utilizzando le formule precedenti, si passa al calcolo delle pi e delle qi, come riportato in tabella, e dei termini della sommatoria del rapporto di concentrazione.

Livello minimo di reddito classi ni ci ci · ni pi qi pi − pi−1 = fi qi + qi−1 (qi + qi−1)fi 0.9| − |1.525 6 1.213 7.278 0.300 0.188 0.30 0.188 0.056 1.525− |2.15 8 1.838 14.704 0.700 0.569 0.40 0.757 0.303 2.15− |2.775 3 2.463 7.389 0.850 0.760 0.15 1.329 0.199 2.775− |3.4 3 3.088 9.264 1 1 0.15 1.760 0.264 Totale 20 38.635 0.822

Segue quindi che R = 1− 0.822 = 0.178, ovvero il fenomeno presenta bassa concentrazione. Impiegando i dati in tabella è possibile rappresentare la curva di Lorenz (Figura 1.8) che dà evidenza grafica dei risultati numerici riportati.

Figura 1.8: Curva di Lorenz

2. I dati osservati immediatamente escludono la possibilità che il livello minimo di reddito sia equidistribuito in quanto la condizione teorica che deve verificarsi in questa circostanza è che:

x1 = x2 = ... = xN = µ

Quindi l’affermazione è falsa.



Esercizio 11 È stata misurata la quantità di nitrati (in mg) contenuta in un litro di 10 tipologie di acque com- mercializzate da un punto vendita, ottenendo i seguenti dati:

15 29 11 18 21 17 34 19 28 41

21

CAPITOLO 1. STATISTICA DESCRITTIVA

1. Misurare la concentrazione dei nitrati delle acque analizzate e rappresentare la spezzata di Lorenz.

2. Può affermarsi che la concentrazione dei nitrati delle acque analizzate è elevata?

2

Soluzione

1. La misura della concentrazione della serie di dati in esame richiede il preliminare ordinamento, in modo non decrescente, dei dati ed il calcolo dell’indice di concentrazione del Gini:

Rg =

N−1 ∑

i=1

(pi − qi) N−1 ∑

i=1

pi

con pi = i

N e qi =

1

i ∑

j=1

xj

A tale scopo si costruisce la seguente tabella:

i x(i) pi qi (pi − qi) 1 11 0.1 0.047 0.053 2 15 0.2 0.111 0.089 3 17 0.3 0.184 0.116 4 18 0.4 0.261 0.139 5 19 0.5 0.343 0.157 6 21 0.6 0.433 0.167 7 28 0.7 0.553 0.147 8 29 0.8 0.677 0.123 9 34 0.9 0.823 0.077 10 41 1 1

Totale 233

da cui emerge che Nµ = N ∑

i=1

xi = 233 mentre l’indice di concentrazione del Gini è Rg =

1.068 4.5 = 0.237.

La spezzata di Lorenz del fenomeno in esame, che assume la caratteristica forma a gradini, è rappresentata in Figura 1.9.

2. Dai risultati del precedente quesito (indice del Gini) è possibile osservare che i nitrati delle acque analizzate sono poco concentrati quindi nessuna delle acque in esame presenta un livello di nitrati molto più elevato rispetto alle altre.



Esercizio 12 La società Stat, utilizzando i dati in Tabella 1.2, vuole fornire alcuni dettagli sulla concentrazione dei redditi delle 15 famiglie intervistate.

22

ESERCIZI DI STATISTICA

Figura 1.9: Spezzata di Lorenz

1. Misurare la concentrazione dei redditi medi (RM) e rappresentare la corrispondente curva di Lorenz (a tale scopo impiegare la distribuzione di frequenze per classi della variabile RM costruita in precedenza);

2. Il reddito medio presenta maggiore concentrazione al Nord o al Sud?

2

Soluzione

1. La misura della concentrazione della variabile RM richiede il calcolo del rapporto di concen- trazione. A tal fine, come già precedentemente descritto nell’esercizio 10, si utilizzano i dati nella tabella seguente:

Reddito medio - RM classi ni ci ci × ni pi qi pi − pi−1 = fi qi − qi−1 (qi − qi−1)fi

1.4| − |3.675 8 2.538 20.304 0.533 0.290 0.533 0.290 0.155 3.675− |5.95 2 4.813 9.626 0.666 0.428 0.133 0.718 0.095 5.95− |8.225 3 7.088 21.264 0.866 6 0.732 0.200 1.160 0.232 8.225− |10.5 2 9.363 18.726 1 1 0.133 1.732 0.230

Totale 15 69.920 0.712

da cui segue che il rapporto di concentrazione R = 1− 0.712 = 0.288. La curva di Lorenz associata al fenomeno è rappresentata in Figura 1.10 e conferma, anche graficamente, la contenuta concentrazione del reddito medio tra le famiglie intervistate.

23

CAPITOLO 1. STATISTICA DESCRITTIVA

Figura 1.10: Curva di Lorenz

2. Per poter rispondere al quesito proposto è necessario misurare la concentrazione del reddito medio delle famiglie residenti al Nord ed al Sud costruendo quindi opportune serie di dati estratte dalla Tabella 1.2 mediante le quali calcolare l’indice di concentrazione del Gini.

NORD i x(i) pi qi pi − qi 1 2.30 0.2 0.079 0.121 2 4.25 0.4 0.224 0.176 3 4.30 0.6 0.371 0.229 4 7.89 0.8 0.641 0.159 5 10.50 1 1

Totale 29.24 0.685

SUD i x(i) pi qi pi − qi 1 1.52 0.167 0.068 0.099 2 1.65 0.333 0.142 0.191 3 3.33 0.500 0.292 0.208 4 3.56 0.667 0.452 0.215 5 6.04 0.833 0.724 0.109 6 6.11 1 0.999

Totale 22.21 0.822

da cui segue che l’indice di concentrazione del Gini delle due sottopopolazioni è rispettiva- mente:

Rg,NORD = 0.685

2.0 = 0.343 Rg,SUD =

0.822

2.5 = 0.329

quindi la concentrazione dei redditi delle famiglie del Nord e del Sud intervistate è simile.



24

ESERCIZI DI STATISTICA

1.4 Distribuzioni Doppie

Esercizio 13 Utilizzando le serie di dati in Tabella 1.1:

1. Costruire una distribuzione di frequenze doppia per le variabili Genere e Cittadinanza.

2. La presenza di mutabili nella tabella precedentemente costruita, rende impossibile la misura dell’intensità del legame associativo? Motivare la risposta.

3. Costruire una distribuzione di frequenze doppia per le variabili Livello minimo di reddito ed Anni di esperienza utilizzando, per ambo le variabili, 4 classi di modalità della stessa ampiezza.

2

Soluzione

1. La distribuzione di frequenze richiesta è la seguente:

Cittadinanza Genere belga francese inglese italiana spagnola tedesca

F 2 2 1 5 1 1 12 M 0 1 1 3 2 1 8

2 3 2 8 3 2 20

2. L’intensità del legame associativo è misurato con l’indice di Cramer Φ2. Esso per costruzione richiede il solo utilizzo delle frequenze della distribuzione e quindi è possibile calcolarlo sia quando nella distribuzione doppia si hanno ad oggetto mutabili che variabili.

3. La distribuzione di frequenze doppia delle variabili Livello minimo di reddito ed Anni di esperienza è:

Anni di esperienza Reddito minimo 0| − |8 8− |16 16− |24 24− |32 0.9| − |1.525 3 1 1 1 6 1.525− |2.15 4 2 1 1 8 2.15− |2.775 1 0 2 0 3 2.775− |3.4 0 0 2 1 3

8 3 6 3 20



Esercizio 14 Avvalendosi della distribuzione doppia delle variabili Livello minimo di reddito ed Anni di espe- rienza costruita nel precedente esercizio:

25

questo eserciziario è ottimo,ti spiega pari passo i vari esercizi di statistica, dalle cose piu semplici a quelle più complesse. io mi sono trovata davvero molto bene lo consiglio a tutti :)
Decisamente ottimo! Grazie!
veramente utile...grazie
Grazie =)
1-5 di 31
Questa è solo un'anteprima
3 pagine mostrate su 110 totali
Scarica il documento