




































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Una panoramica dettagliata sull'analisi dei rapporti statistici e dei numeri indici. Vengono esaminati i rapporti statici di derivazione, i numeri indici semplici e composti, e le tecniche per cambiare la base dei numeri indici. Inoltre, il documento affronta l'analisi delle distribuzioni, le medie di posizione e algebriche, e la variabilità statistica, offrendo esempi pratici e definizioni chiare per una comprensione approfondita della materia. Infine, vengono descritti gli indici dei prezzi al consumo e la rivalutazione monetaria.
Tipologia: Appunti
1 / 76
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





































































La statistica tradizionale comprende la statistica descrittiva e inferenziale. Nella statistica descrittiva si usano tutti gli strumenti necessari per studiare, descrivere i fenomeni collettivi, mentre nella statistica inferenziale si usano gli strumenti necessari per esporre i risultati, osservati su un campione, alla popolazione.
STATISTICA DESCRITTIVA Si occupa di descrivere la realtà dei fenomeni collettivi (fenomeni demografici, andamento della temperatura di una città, soddisfazione dei clienti, efficacia di una terapia medica…) Definisce indicatori di sintesi (es. la media, la moda) e metodi complessi di analisi (come quelli proposti dalla scuola italiana di Statistica nel corso dell’Ottocento e del Novecento) Nella statistica descrittiva si possono usare tabelle, grafici, sintesi (metodi semplici) oppure metodi più complessi.
STATISTICA INFERENZIALE Fornisce i metodi con cui riferire all’intera popolazione le sintesi quantitative dei dati osservati su un campione di osservazioni. Esempio: conoscendo la % di fumatori di un campione di adolescenti di una città, si può dire che la % di fumatori su tutti gli adolescenti della città è compresa tra x e y con una probabilità del 95% → ruolo centrale del calcolo delle probabilità
STATISTICA TRADIZIONALE In entrambi i casi i dati sono gli ingredienti, i metodi matematici sono gli strumenti e l’ informatica è sempre più importante. Oggi sono a disposizione molti dati, si parla quindi di big data ovvero dati complessi, in quanto sono vari (numeri, testi, immagini,...), i dati devono essere veri e arrivano moltissimi dati in poco tempo. I big data sono caratterizzati da 3V → velocità, varietà, veridicità. C’è il rischio che i dati siano troppi, per questo si parla di data mining ovvero trovare i dati utili tra la molteplicità di dati al fine di ricavare informazioni. Grazie alla capacità di calcolo nasce la data science che unisce la matematica alla statistica, informatica quindi ai data analyst. Una volta raccolti i dati, essi vanno comunicati ad esempio ai manager delle imprese. I dati raccolti fanno da supporto alle decisioni che poi si prenderanno, non sono lo strumento finale. La data visualization permette di trasformare i dati raccolti in immagini o altri metodi che rendono possibile capire il risultato e quindi la decisione. Dietro ai dati ci sono le persone e quindi non si hanno dati certi, bensì si parla di incertezza.
AMBITI DI APPLICAZIONE In azienda è importante avere un metodo che si basa sui dati, per questo si parla di data-oriented e non più data-driven in quanto le decisioni non sono prese in automatico con i dati ma ci sono altri strumenti che conducono alla decisione finale. Nella società si analizzano i fenomeni collettivi (ad esempio su una scala da 0 a 100 si misurano i livelli di felicità nelle varie regioni). Nell’ economia ci sono degli indicatori economici che mostrano ad esempio i tagli della spesa pubblica, oppure la ricchezza …
Banca che raccoglie informazione sui propri clienti e poi crea un profilo di rischio assegnando ad ogni cliente uno score ovvero il grado di solvibilità. Finanza ormai si parla di fin-tech e insurtech (quindi in campo assicurativo) da dove ormai derivano i dati. Smart-city ad esempio si studia il traffico Medicina i farmaci che vengono messi in commercio solo dopo aver superato test di efficacia e tollerabilità che si fondano sulla statistica; le possibili terapie per determinate malattie vengono studiate utilizzando la statistica. Genetica, analisi sensoriale, sport, arte e cultura.
Quindi la statistica si occupa di predisporre adeguati metodi quantitativi per: ● raccogliere e organizzare ● elaborare e sintetizzare ● analizzare e interpretare dati e informazioni utili per esaminare i fenomeni reali. Si parla quindi di statistica 4. ovvero l’insieme di metodi e dei sistemi di aggregazione e visualizzazione che trasformano i dati in informazioni.
OBIETTIVI DELLA STATISTICA I metodi statistici sono proposti e studiati per l’analisi dei fenomeni che si manifestano in una collettività. Con le analisi statistiche ci si propone di individuare, descrivere, interpretare e prevedere la regolarità che sono alla base dei fenomeni e ci deve essere anche varietà dei dati con le analisi statistiche al fine di spiegare i fenomeni di interesse.
TERMINOLOGIA La popolazione o collettivo statistico è l’insieme dei dati, delle unità singole che si vogliono studiare e non sono per forza persone (aziende, fenomeni, …). Un campione è il sottoinsieme della popolazione. L’ unità statistica è il singolo soggetto, la singola unità su cui si vuole osservare il fenomeno. Il carattere è la caratteristica del fenomeno d’interesse sulle singole unità statistiche. I modi con cui il carattere si manifesta il carattere sulle singole unità statistiche sono le modalità , un carattere ne presenta di diverse. Per conoscere e/o comprendere un fenomeno, è quindi necessaria l’osservazione intenzionale di una molteplicità di casi individuali (popolazione o collettivo statistico). Ad esempio, l’età è il carattere, le modalità sono gli anni quindi 20,21,22,... anni compiuti. La rilevazione di uno o più caratteri consente di classificare, raggruppare le unità statistiche che formano la popolazione o il campione. Quindi ci sono attività di rilevazione e di classificazione.
REQUISITI DELLE MODALITÀ Le modalità di un carattere devono essere:
Scale per i caratteri qualitativi:
Scale per i caratteri quantitativi:
TRASFORMAZIONI DI VALORI X IN VALORI Y Trasformazione lineare → Y = a + bX con a e b costanti, serve per degli indicatori che si vogliono convertire. Casi particolari della trasformazione lineare:
GERARCHIA DELLE SCALE La scala ordinale ha le priorità della scala nominale e in più ha modalità ordinabili. La scala ad intervalli ha le proprietà della ordinale e in più ha modalità numeriche. La scala di rapporti ha le proprietà della scala ad intervalli e in più ha uno zero assoluto. Gli strumenti statistici predisposti per caratteri rilevati su una data scala possono essere applicati ai caratteri rilevati su scale superiori MA non vale il viceversa. Tutto ciò che si fanno sulle scale più basse, posso farlo anche nelle scale più alte ma NON viceversa.
Quando i dati statistici non ammettono un confronto diretto è necessario fare ricorso ad opportune elaborazioni degli stessi. Possono trovare impiego i rapporti statistici. Il rapporto statistico è il rapporto tra due dati, di cui almeno uno statistico. Indicano quanta parte del numeratore spetta idealmente a un’unità del denominatore. Bisogna fare attenzione all’unità di misura → numeratore/denominatore (es. ab/km)
FOCUS 1: I RAPPORTI STATISTICI DI COMPOSIZIONE (o di parte al tutto) Rapporti statistici → sono il rapporto tra due dati, di cui almeno uno di natura statistica. Indicano quanta parte del numeratore spetta idealmente ad un’unità del denominatore. Servono a confrontare fenomeni rilevati in circostanze differenti.
Rapporti di composizione (o di parte al tutto) 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡à (𝑜 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑧𝑎) 𝑝𝑎𝑟𝑧𝑖𝑎𝑙𝑒𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡à (𝑜 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑧𝑎) 𝑡𝑜𝑡𝑎𝑙𝑒 (× 100)
Esempio 1 L’azienda Beta produce televisori LCD, distribuiti sul mercato mediante centri commerciali e negozi di elettronica. Per valutare la propria presenza sul mercato, l’azienda Beta ha raccolto i seguenti dati: Regione N° tot di punti vendita N° punti vendita trattano i televisori Beta Lombardia 980 637 Veneto 776 582
Nel confronto dobbiamo tenere conto delle diverse dimensioni dei due mercati. A tale fine, possiamo impiegare i seguenti rapporti (indice di penetrazione del prodotto nel mercato): Lombardia 637/980 = 0.65 65% Veneto 582/776 = 0.75 75%
FOCUS 2: I RAPPORTI STATISTICI DI DENSITÀ
I rapporti di densità (^) 𝑑𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛𝑒 𝑐𝑎𝑚𝑝𝑜 𝑑𝑖 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑧𝑖𝑜𝑛𝑒𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡à 𝑑𝑖 𝑢𝑛 𝑓𝑒𝑛𝑜𝑚𝑒𝑛𝑜
Esempio Per confrontare l’addensamento della popolazione in due regioni sono disponibili i seguenti dati: Regione Popolazione residente Superficie in Km^2 Lombardia 10.008.349 23. Veneto 4.915.123 18.
Nel confronto dobbiamo tener conto delle diverse dimensioni (superfici) delle due regioni. Possiamo impiegare i rapporti: Lombardia 10.008.349/23.872 = 419 ab./km^2 Veneto 4.915.123/18.364 = 267 ab./km^2
Ricordiamo che secondo Chisini, una media è una sintesi di differenti valori che, se sostituita a tali singoli valori, non altera la visione d’insieme di un altro fenomeno che da tali valori dipende. Con il metodo di Chisini si possono quindi trovare medie diverse, a seconda degli obiettivi dell’analisi.
Procedura
Medie funzionali M 1 → sostituito alle singole osservazioni, ne lascia invariata la somma M-1 → sostituito alle singole osservazioni, ne lascia invariata il prodotto M 0 → sostituito alle singole osservazioni, ne lascia invariata la somma dei quadrati Con il metodo di Chisini, è possibile individuare altre medie funzionali
Esempio Una merce viene venduta in N mercati. Siamo pi e qi rispettivamente il prezzo unitario e la quantità venduta nel mercato i-esimo. Si assuma valida per ogni mercato la seguente curva di domanda q = k*p-α^ k > 0, α > 0 Fornire l’espressione analitica del prezzo medio unitario che lascia invariata la quantità di merce complessivamente venduta negli N mercati.
complessivamente venduta negli N mercati: ∑ 𝑥𝑖 = ∑ 𝑘 · 𝑥𝑖 −α
∑ 𝑘 · 𝑝^ - 𝛼
-α (^) → →
∑𝑝𝑖−α 𝑁 =^ 𝑝^
Σ𝑝𝑖−α 𝑁 =^
1
α = 1 𝑝 α^ 𝑝 α^ = 𝑁 ∑𝑝𝑖−α
e l’espressione analitica del prezzo medio risulta: 𝑝 = 𝑁 ∑𝑝𝑖−α
1 α
NUMERI INDICI → rapporti ● semplici → servono a confrontare le intensità di un solo fenomeno in tempi o luoghi diversi (serie storica di un fenomeno, e vogliamo confrontare i vari dati dei vari anni, oppure fenomeno in luoghi diversi e vogliamo confrontarli) (index number) ● composti → servono a confrontare un fenomeno più complesso che risulta dal concorso di più componenti , sempre in luoghi o tempi diversi. Sono praticamente delle medie dei numeri indici semplici.
Esempio Serie storica 2016-19 degli acquisti in Bitcoin da parte di un trader (valori in euro). Possiamo valutare come il fenomeno è variato nel tempo calcolando numeri indici a base fissa e/o a base mobile.
Numeri indici a base fissa (NIbf) Li otteniamo eseguendo il rapporto tra ogni singola osservazione xt con un termine della serie storica xb che viene mantenuto fisso ( base fissa ):
t = 0, 1, 2, …
Essendo numeri puri , consentono di confrontare fenomeni con diversi ordini di grandezza Se, ad esempio, scegliamo come base il dato dell’anno iniziale, abbiamo:
t = 2016, 2017, 2018, 2019
𝑥𝑡 𝑥𝑏^ =^
𝑥𝑡 𝑥 2016 =^
𝑥𝑡 352,
2016 → 2016 I 2016 = 352,5/352,5 = 1 2017 → 2016 I 2017 = 373,3/352,5 = 1, Variazione 1,0590 - 1 = + 0,059 → + 5,9% dal 2016 al 2017 l’ammontare dell’acquisto di bitcoin del traider è aumentato del 5,9% 2018 → 382,0/352,5 = 1,0837 → incremento di 8,37% nel 2018 rispetto al 2016 2019 → 294,2/352,5 = 0,8346 → minore di 1, questo segnala che il numeratore è minore del denominatore, quindi tra il ‘16 e il ‘19 c’è stato un decremento del 0,8346 - 1 = - 0,
tra il 2016 e il 2017 gli acquisti di Bitcoin sono aumentati del 5,9% [(1,059 -1)*100 = 5,9] I numeri indici sono valori positivi e possono essere superiori o inferiori a 1, a seconda di un incremento o decremento.
La stessa formula posso scriverla come (y 2022 / y 2021 ) - 1 = 210/200 - 1 = + 0. Il rapporto y 2022 /y 2021 è un numero indice, e lo chiamiamo I del 2022, su base del 2021 ( 2021 I 2022 = 210/200 = 1.05 → numero indice semplice).
Per fare un confronto nel tempo equo dobbiamo usare i numeri indici, che possono essere a base fissa o mobile. Come visto prima i numeri indici a base fissa sono il rapporto tra la singola osservazione e la serie storica al tempo b (base) decisa da noi. (^) bIt = xt / xb La base viene mantenuta fissa perché stiamo pensando di calcolare questi numeri indici tante volte, quindi si parte dal primo anno dove mi colloco e calcolo l’indice, poi continuo a spostarmi negli anni successivi, mantenendo la stessa base.
Numeri indici a base mobile (NIbm) Li otteniamo eseguendo il rapporto tra ogni singola osservazione xt con un termine della serie storica → xt-1 ovvero il termine del periodo immediatamente precedente, che quindi cambia ogni volta ( base mobile ):
t = 1, 2, …
Formula xt/xt-1 → dato dell’anno fratto dato anno precedente. Al pedice di sinistra ho t-1, non più b dell’anno base. Essendo numeri puri , consentono di confrontare fenomeni con diversi ordini di grandezza. Nel primo anno, il tempo precedente sarebbe t0 che non posso calcolare → non disponibile (ND)
2018 → 382/373,3 = 1,0233 → nel 2018 rispetto al 2017 c’è stato un incremento del 2,33% degli acquisti di bitcoin del trader
Anche l’interpretazione di un NIbm avviene quindi avviene quindi attraverso la corrispondente variazione relativa ( congiunturale ) a cui è collegato dalla relazione:
ovvero
Numeri indici e variazioni I numeri indici (sia a base fissa che mobile) sono sempre positivi , anche quando segnalano una diminuzione → il discriminante è 1 che fa determinare se è una riduzione o un aumento.
Le variazioni (tendenziali e congiunturali) hanno, invece, un segno positivo o negativo (se diverse da zero). Nell’anno base indice 1, variazione 0, con base mobile è nd sia indice che variazione
Cambiamento della base Abbiamo visto nell’esempio che, se disponiamo di una serie storica di dati, ricaviamo agevolmente sia i NIbf sia i NIbf con basi differenti. Possiamo così soddisfare le varie esigenze di lettura delle variazioni congiunturali o tendenziali. Nella realtà molte volte non ho i dati x su cui fare i rapporti quindi non disponiamo dei dati originari. Conosciamo, invece, i NI (bf o bm) o le corrispondenti variazioni, quindi per capire l’evoluzione nel tempo devo leggere e i numeri indici e manipolarli. In questi casi esistono 3 regole che permettono di lavorare con i numeri indici, ricavando indirettamente delle informazioni. Queste regole sono: ● cambiare la base dei NIbf ● trasformare la base da fissa a mobile ● trasformare la base da mobile a fissa
Ho i dati in base 2018 = 1, voglio sapere con base 2016 = 1, bisogna quindi manipolare i dati che abbiamo.
Esempio riassuntivo Indicatori di mobilità dell’occupazione in una data regione nel periodo 2014-19 (dati per 1000 occupati) Numeri indici degli ingressi
Indici di mobilità occupazionale
La distribuzione di frequenze di un carattere è una tabella che mostra in modo efficace e sintetico i risultati delle operazioni di classificazione e conteggio delle unità della popolazione. Sono tabelle per sintetizzare le operazioni di classificazione e conteggio delle unità della popolazione, prendo le unità statistiche e le classifico nelle diverse modalità, poi si conta. !! A seconda del tipo di carattere, se ne possono effettuare diverse elaborazioni e rappresentazioni !! (caratteri qualitativi e quantitativi!!)
CARATTERE QUALITATIVO Tutto ciò che possiamo fare sui caratteri nominali sicuramente è possibile farlo sui caratteri successivi. Si parte seguendo la gerarchia nelle scale. Il carattere prende il nome di MUTABILE STATISTICA NOMINALE = carattere qualitativo
Esempio) distribuzione di 180 progetti di blockchain per settore Abbiamo una tabella che ha due colonne, nella prima colonna abbiamo il nome del carattere (settore) e le sue modalità (finanza, PA, agrifood), nell’altra colonna abbiamo le frequenze (frequenze) con i numeri → frequenze assolute, sono il risultato delle operazioni di classificazione e conteggio. Quindi 90 è la frequenza assoluta associata alla modalità finanza del carattere settore, e indica il numero di progetti di finanza. Es. 54 → frequenza: numero di volte che la modalità PA si presenta nella popolazione. La somma delle frequenze è 180, che è il totale dei progetti.
Settore Frequenze
Finanza 90
PA 54
Agrifood 36
Totale 180
Altro grafico che si può costruire è il grafico a barre, di solito si usa quello a barre orizzontali. Pictogramma → l’ordine è arbitrario, non c’è un ordine, perché le modalità non sono ordinabili, non ho un criterio
Confronti tra distribuzioni Le frequenze relative → si rendono necessarie quando bisogna fare dei confronti. Quando si calcolano i risultati sono dei rapporti statistici di composizione o di parte al tutto, prendo una parte e la rapporto al suo tutto, così da avere il peso di quel 90 sul totale del 180. Permettono di valutare l’ importanza di ogni modalità, e inoltre, permetto di fare dei confronti tra popolazioni di diverse numerosità. Depuro la frequenza assoluta dall’effetto del totale, che appunto, può essere diverso in diverse popolazioni.
Nel regno unito i numeri di progetti sono maggiori rispetto all’Italia, ma bisogna vedere se le varie modalità sono maggiori per il semplice fatto che in totale siano maggiori i prodotti, o se a parità di condizioni sono effettivamente maggiori. Per questo bisogna usare un rapporto statistico e si calcolano le frequenze relative. Le due popolazioni hanno numerosità diverse, ma con le freq. relative, vedo che la PA nel Regno Unito pesa di più che in italia (doppio), mentre Agrifood pesa la metà nonostante il numero assoluto fosse più alto che in italia.
Esempio - distribuzione di 150 impiegati per titolo di studio A sinistra colonna del carattere con le sue modalità (esaustive e incompatibili), le modalità sono assolute, e il totale fa 150. Per rappresentare questa tabella il grafico a torta non è consigliabile, ma è preferibile un grafico a barre verticali, in quanto possiamo mettere in ordine le modalità → licenza media - diploma - laurea. L’altezza della barra rispecchia la frequenza, ed è possibile farlo anche con freq. relative.
Non è un piano cartesiano, inoltre, le barre sono equidistanziate, non abbiamo numeri, la distanza non riflette nulla, non c’è una misurazione numerica sono solo parole.
Frequenze cumulate Poiché le modalità sono ordinate , possiamo calcolare le frequenze cumulate.
Per le frequenze cumulate posso fare il calcolo solo perché le modalità sono ordinate, altrimenti non ha senso fare questo calcolo. Riscrivo la tabella mettendo le modalità in ordine crescente. Le frequenze cumulate della prima riga è uguale, alla seconda modalità la cumulata si ottiene sommando la cumulata appena scritta (36) + fr. assoluta della riga in cui scrivo (36+72=108). All’ultima riga avrò il totale delle frequenze assolute. 108 è il numero di persone che hanno al massimo/al più il diploma.
Frequenze retrocumulate Poiché le modalità sono ordinate , possiamo calcolare le frequenze retrocumulate
FORMULE DI CALCOLO Frequenze assolute cumulate
Sommatoria per j che va da 1 a i, di nj i indica la generica riga, essendo che come ultimo addendo ci sia la i, mi impedisce di utilizzare la i anche come pedice generico
Frequenze assolute retrocumulate
Relazione:
Frequenze relative (o percentuali) cumulate
Frequenze relative (o percentuali) retrocumulate Parto dalla i, fino ad arrivare all’ultima p
Relazione:
LEZIONE 5 13/ RAPPRESENTAZIONI GRAFICHE Diagramma a bastoncini (o diagramma ad aste) Il punto che nel piano cartesiano corrisponde alla generica coppia (xi ; ni) o (xi ; fi) è proiettato sull’asse delle ascisse. L’altezza dei bastoncini così ottenuti corrisponde alla frequenza assoluta o relativa.
Diagramma a gradini (cumulo) Dal punto che rappresenta la generica coppia (xi ; Ni) o (xi ; Fi) si traccia verso destra un segmento orizzontale di lunghezza pari a 1. L’altezza di un gradino corrisponde alla frequenza assoluta o relativa.
Sono 0 le aziende che hanno -1 distretto di data analysts. Tra il 59 e il 94, c’è un numero di aziende che hanno 4 data analysts, quindi 80 aziende hanno al massimo 4 data analysts (non sono tutte quelle che hanno al massimo 4 d.a.)
Diagramma a gradini (retrocumulo) Dal punto che rappresenta la generica coppia (xi ; N̅) o (xi ; F̅i) si traccia verso sinistra un segmento orizzontale di lunghezza pari a 1. L’altezza di un gradino corrisponde alla frequenza assoluta o relativa.
Quando il carattere presenta un numero rilevante di modalità, è preferibile raggrupparle in classi ( intervalli ) incompatibili ed esaustive. Ciò comporta evidentemente una certa perdita di informazioni.