Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Boxplot e Indici di Forma: Analisi della Variabilità e Identificazione di Valori Anomali, Dispense di Statistica Economica

Dispense di statistica

Tipologia: Dispense

2018/2019

Caricato il 12/02/2019

giovanni-baino
giovanni-baino 🇮🇹

30 documenti

1 / 10

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Anno accademico 2018-’19
Federico II
Università degli Studi di Napoli
Scienze Economiche e Statistiche
Dipartimento di
Statistica (Clec, A-K)
marco gherghi
Corso di
L06
Boxplot e Indici di forma
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica Boxplot e Indici di Forma: Analisi della Variabilità e Identificazione di Valori Anomali e più Dispense in PDF di Statistica Economica solo su Docsity!

Anno accademico 2018-’

Federico II

Università degli Studi di Napoli

Scienze Economiche e Statistiche

Dipartimento di

Statistica (Clec, A-K)

marco gherghi [email protected] Corso di L Boxplot e Indici di forma

Dipartimento di Scienze Economiche e Statistiche – Corso di Laurea in Economia e Commercio

  • Gli indici di posizione e di variabilità di una distribuzione di frequenza non esauriscono le informazioni contenute nei dati;
  • Due variabili statistiche possono avere la stessa posizione e la stessa variabilità ma differire per il peso dei valori più grandi o più piccoli rispetto al valore centrale, a causa del comportamento

differenziato delle code della distribuzione (Piccolo, Statistica , pag. 121 ).

Distribuzione simmetrica rettangolare Distribuzione simmetrica campanulare Media=Mediana=Moda Media=Mediana=Moda Distribuzione asimmetrica positiva Distribuzione asimmetrica negativa Moda<Mediana<Media Media<Mediana<Moda Gli indici di forma

Dipartimento di Scienze Economiche e Statistiche – Corso di Laurea in Economia e Commercio I valori "anomali" Media= 28,5 anni Q 1 = 26 anni Mediana= 27 anni Q 3 = 29 anni Età Frequenza 25 3 26 6 27 8 28 5 29 5 30 3 61 1 TOT 31

Valori anomali:

La caratterizzazione di un valore come “ anomalo ” è, ovviamente, assolutamente arbitraria; non esistono criteri “oggettivi” per definire un valore come anomalo. D’altra parte, è chiaro che un valore anomalo si troverà nelle code della distribuzione ordinata, quindi o molto più a destra di Q 3 o molto più a sinistra di Q 1.

Dipartimento di Scienze Economiche e Statistiche – Corso di Laurea in Economia e Commercio I valori "anomali" Media= 28,5 anni Q 1 = 26 anni Mediana= 27 anni Q 3 = 29 anni DI = Differenza interquartile (Q 3 - Q 1 ) = 3 anni Un metodo empirico generalmente accettato definisce questa distanza come un multiplo della differenza interquartile (Q 3 - Q 1 ). Più precisamente, un dato viene considerato come anomalo se si trova a sinistra di Q 1 o a destra di Q 3 per più di 1 , 5 volte la differenza interquartile. Età Frequenza 25 3 26 6 27 8 28 5 29 5 30 3 61 1 TOT 31

Valori anomali:

La caratterizzazione di un valore come “ anomalo ” è, ovviamente, assolutamente arbitraria; non esistono criteri “oggettivi” per definire un valore come anomalo. D’altra parte, è chiaro che un valore anomalo si troverà nelle code della distribuzione ordinata, quindi o molto più a destra di Q 3 o molto più a sinistra di Q 1. Nel nostro esempio questi limiti valgono rispettivamente: Q 1 − ( 1 , 5 × DI ) = 26 − ( 1 , 5 × 3 ) = 21 , 5 Q 3 + (^) ( 1 , 5 × DI ) = 29 − (^) ( 1 , 5 × (^3) ) = 33 , 5 da cui risulta che non ci sono valori anomali nella coda sinistra (non ci sono valori inferiori a 21 , 5 anni), mentre se ne trova uno nella coda destra ( 61 anni).

Dipartimento di Scienze Economiche e Statistiche – Corso di Laurea in Economia e Commercio Età Frequenza 25 3 26 6 27 8 28 5 29 5 30 3 61 1 TOT 31 Media= 28,5 anni Q 1 = 26 anni Mediana= 27 anni Q 3 = 29 anni DI = Differenza interquartile (Q 3 - Q 1 ) = 3 anni 25 26 27 28 29 30 % (^30) 20 10 0 24 25 26 27 28 29 30 31 Un riepilogo grafico sulla variabilità: il boxplot

Dipartimento di Scienze Economiche e Statistiche – Corso di Laurea in Economia e Commercio Esempi di Boxplot (Indagine del Sole 24ore sulla "Qualità della vita" nelle Province italiane, anno 2007) Reddito p.c. (in €) Reddito p.c. (in €, per Zona geografica)

Dipartimento di Scienze Economiche e Statistiche – Corso di Laurea in Economia e Commercio Esempi di Boxplot (Indagine del Sole 24ore sulla "Qualità della vita" nelle Province italiane, anno 2007) Reddito p.c. e Consumi p.c. (in €) Reddito p.c. e Consumi p.c. (in €, per Zona geografica)