Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Misure di Variabilità e Concentrazione in Statistica: Guida Dettagliata, Appunti di Statistica

Una panoramica completa delle misure di variabilità in statistica, esaminando concetti chiave come scostamento semplice medio, scostamento quadratico medio, varianza, devianza, differenza semplice media, campo di variazione, differenza interquartile, indici di variabilità percentuali e indici di concentrazione come l'indice di gini e la curva di lorenz. Il testo include formule operative e proprietà degli indici, offrendo una guida dettagliata per l'analisi della variabilità nei dati statistici. Anche le misure di eterogeneità e le loro applicazioni, fornendo una solida base per comprendere e applicare le tecniche statistiche. Utile per studenti universitari e professionisti che necessitano di una comprensione approfondita delle misure di variabilità e concentrazione.

Tipologia: Appunti

2023/2024

Caricato il 08/07/2025

valentina-giacci
valentina-giacci 🇮🇹

2 documenti

1 / 7

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Variabilità
Per variabilità si intende l’attitudine dei fenomeni, naturali e sociali, a manifestarsi in
modi differenti. Costituisce la ragione stessa dell’esistenza della Statistica. Tutta la
metodologia statistica ha a che fare con la variabilità, per
- neutralizzarla, con le medie, che mirano a far emergere “il costante nel variabile”
- misurarla, con gli indici di variabilità
- spiegarla, con le tecniche della regressione e, in generale, con i metodi
dell’inferenza statistica.
Scostamento semplice medio
Data la distribuzione disaggregata , si chiama scostamento semplice
𝑥1,𝑥2,...,𝑥𝑁
medio la media aritmetica degli scarti dalla media presi in valore assoluto
Tale misura si annulla in caso di assenza di variabilità, ed è tanto maggiore quanto
maggiore è la ‘’distanza media’’ degli elementi della distribuzione dalla loro media.
Data invece una distribuzione di frequenze, la formula diventa
Scostamento quadratico medio
Data la distribuzione disaggregata , si chiama scostamento quadratico
𝑥1,𝑥2,...,𝑥𝑁
medio odeviazione standard la media quadratica degli scarti
(𝑥1µ),(𝑥2µ),...,(𝑥𝑁µ)
(FORMULA OPERATIVA)
Data invece una distribuzione di frequenze, la formula diventa
pf3
pf4
pf5

Anteprima parziale del testo

Scarica Misure di Variabilità e Concentrazione in Statistica: Guida Dettagliata e più Appunti in PDF di Statistica solo su Docsity!

Variabilità

Per variabilità si intende l’attitudine dei fenomeni, naturali e sociali, a manifestarsi in modi differenti. Costituisce la ragione stessa dell’esistenza della Statistica. Tutta la metodologia statistica ha a che fare con la variabilità, per

  • neutralizzarla, con le medie, che mirano a far emergere “il costante nel variabile”
  • misurarla, con gli indici di variabilità
  • spiegarla, con le tecniche della regressione e, in generale, con i metodi dell’inferenza statistica.

● Scostamento semplice medio

Data la distribuzione disaggregata 𝑥 1 , 𝑥 2 ,..., 𝑥𝑁, si chiama scostamento semplice medio la media aritmetica degli scarti dalla media presi in valore assoluto Tale misura si annulla in caso di assenza di variabilità, ed è tanto maggiore quanto maggiore è la ‘’distanza media’’ degli elementi della distribuzione dalla loro media. Data invece una distribuzione di frequenze, la formula diventa

● Scostamento quadratico medio

Data la distribuzione disaggregata 𝑥 1 , 𝑥 2 ,..., 𝑥𝑁, si chiama scostamento quadratico medio o deviazione standard la media quadratica degli scarti (𝑥 1 − μ), (𝑥 2 − μ),..., (𝑥 𝑁 − μ) (FORMULA OPERATIVA) Data invece una distribuzione di frequenze, la formula diventa

Si può dimostrare che la deviazione standard per una distribuzione di frequenze può essere posta nella forma PROPRIETÀ DEGLI INDICI 𝑆μ eσ

  • Assumono il valore 0 nel caso di assenza di variabilità
  • Non cambiano se a ciascun termine della distribuzione si aggiunge una quantità costante positiva o negativa
  • La moltiplicazione di ciascun termine della distribuzione per una costante, positiva o negativa, ha come conseguenza la moltiplicazione degli indici per il valore assoluto della costante

● Varianza e devianza

Il quadrato della deviazione standard si chiama varianza La somma dei quadrati degli scarti dalla media (numeratore della varianza) si chiama devianza

● Differenza semplice media

Sia 𝑥 1 , 𝑥 2 ,..., 𝑥𝑁una distribuzione disaggregata. Si chiama differenza semplice media della distribuzione la media aritmetica delle differenze in valore assoluto 𝑥 , tra le coppie di termini della distribuzione: 𝑖

| (^) 𝑗|

Le differenze sono a due a due uguali in quanto, per ogni coppia 𝑖, 𝑗, (^) |𝑥 (^) 𝑖 − 𝑥𝑗| = (^) |𝑥 (^) 𝑗 − 𝑥𝑖|. Ne segue che possiamo riscrivere la formula che semplifica i calcoli Data invece una distribuzione di frequenze, la formula diventa

Date una distribuzione disaggregata per un carattere trasferibile 𝑥 1 , 𝑥 2 ,..., 𝑥𝑁e una distribuzione disaggregata corrispondente con termini ordinati 𝑦 1 , 𝑦 2 ,..., 𝑦𝑁, il totale della distribuzione è 𝑖= 𝑁 ∑ 𝑥𝑖 = 𝑖= 𝑁 ∑ 𝑦𝑖 = 𝑁 · μ Qual è il grado di disuguaglianza dei termini della distribuzione? → risposta basata sul confronto della distribuzione data con le due situazioni estreme seguenti, a parità di totale:

  1. Disuguaglianza minima → 𝑦 (EQUIDISTRIBUZIONE) 1

2

𝑁 = μ

  1. Disuguaglianza massima → 𝑦 1 = 𝑦 2 =... = 𝑦𝑁−1 = 0 e 𝑦𝑁 = 𝑁 × μ(MASSIMA CONCENTRAZIONE) vedi esempi ● Indice di Gini Indicato con 𝐴𝑖 = 𝑦 1 + 𝑦 2 +... + 𝑦𝑖l’ammontare del carattere posseduto dalle i unità “più povere”, i rapporti 𝑄 1 = rappresentano la frazione 𝐴 1 𝐴𝑁^ , 𝑄 2 =^ 𝐴 2 𝐴𝑁^ , 𝑄 3 =^ 𝐴 3 𝐴𝑁^ ,..., 𝑄𝑁−1 =^ 𝐴𝑁− 𝐴𝑁 del totale del carattere posseduta dalla prima unità, dalle prime due unità, dalle prime tre unità, …, dalle prime N - 1 unità, 𝐴𝑁 = 𝑁 × 𝜇. Si definisca poi 𝑃𝑖 = che rappresenta la frazione di unità in cui. 𝑖 𝑁 , 𝑖 = 1, 2,...^ 𝑋 ≤ 𝑥(𝑖) Nel caso di equidistribuzione, 𝐴𝑖 = 𝑖 · μ e quindi 𝑄𝑖 = , cioè 𝑖·μ 𝑁·μ = 𝑃𝑖 =^ 1 𝑁 𝑄 1 = 1·μ 𝑁·μ =^ 1 𝑁 = 𝑃 1 𝑄 2

2·μ 𝑁·μ =^ 2 𝑁 = 𝑃 2 𝑄 3 = 3·μ 𝑁·μ =^ 3 𝑁 = 𝑃 3 Le differenze tra 𝑃𝑖 e 𝑄𝑖che seguono danno un’idea del grado di concentrazione ( 𝑃 1 − 𝑄 1 ) + (𝑃 2 − 𝑄 2 ) +... (𝑃𝑁−1 − 𝑄𝑁−1 ) Quanto più le 𝑄 differiscono dalle tanto maggiore è la 𝑖

𝑖

disuguaglianza nei dati. (FORMULA OPERATIVA)

PROPRIETÀ DELL’INDICE DI GINI

  • Assume valori nell’intervallo [0, 1]: è uguale a 0 nel caso di equidistribuzione, è uguale a 1 nel caso di massima concentrazione
  • Diminuisce se si aggiunge a ogni termine della distribuzione una quantità positiva
  • Non cambia se ogni termine della distribuzione è moltiplicato per una costante positiva
  • Aumenta a seguito di un trasferimento di intensità da una data unità a un’unità che presenta modalità non inferiore ● Curva di concentrazione o curva di Lorenz Si pongano sull’asse delle ascisse i valori di 𝑃e sull’asse delle ordinate le corrispondenti 𝑖 𝑄𝑖. Si individuino i punti di coordinate (𝑃𝑖, 𝑄𝑖), 𝑖 = 1, 2,..., 𝑁. La curva che si ottiene unendo con segmenti di retta le coppie di punti contigui si chiama curva di concentrazione (detta anche di curva di Lorenz ). L’interpretazione geometrica dell’indice G è l’area compresa la curva di Lorenz e il segmento di equidistribuzione Sia 𝑆la superficie racchiusa tra il segmento di equidistribuzione e la curva di concentrazione. Sia 𝑚𝑎𝑥(𝑆) = il massimo di , dato dall’area racchiusa tra il 𝑁− 2𝑁 𝑆 segmento di equidistribuzione e la curva di massima concentrazione. Allora, il rapporto di concentrazione G può essere espresso come 𝐺 = 𝑆 𝑚𝑎𝑥(𝑆) Nel caso di massima concentrazione la curva coincide con ABC Nel caso di equidistribuzione la curva si riduce al segmento AC
  • massima eterogeneità quando le modalità hanno tutte la stessa frequenza Classi Frequenze 𝑥 1 N/k 𝑥 2 N/k … … 𝑥𝑖 N/k 𝑥 𝑘 N/k Tot. N ● Indici di Gini ed entropia 𝑒 1 = 1 − → ha il suo minimo in 0 (omogeneità) e il suo massimo in 𝑖= 𝑘 ∑ 𝑓𝑖 (^2) 𝑘− 𝑘 (massima eterogeneità). 𝑒 → ha il suo minimo in 0 (omogeneità) e il suo massimo in 2

𝑖= 𝑘 ∑ 𝑓 𝑖

𝑖

(massima eterogeneità)