Prepara i tuoi esami
Ottieni punti
Guide e consigli
Vendi su Docsity
Docsity AI

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Guide e consigli

Vendi su Docsity

Accedi Registrati

Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity

Cerca documenti

Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity

Cerca la tua università

Trova i documenti specifici per gli esami della tua università

Preparati con lezioni e prove svolte basate sui programmi universitari!

Rispondi a reali domande d’esame e scopri la tua preparazione

Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali

Studia con prove svolte, tesine e consigli utili

Esplora domande

Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te

Argomenti di studio

Esplora i documenti più scaricati per gli argomenti di studio più popolari

Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium

Condividi documenti

Per ogni documento caricato

Rispondi alle domande

per ogni risposta data (max 1 al giorno)

Tutti i modi per ottenere punti gratis

Ottieni punti subito

Scegli un piano Premium con tutti i punti di cui hai bisogno

Opportunità di studio

Scegli il tuo prossimo programma di studio

Entra in contatto con le migliori università del mondo e scegli il tuo percorso di studi

Classifica delle migliori università

Scopri le migliori università italiane secondo gli studenti

Community

Chiedi alla community

Chiedi aiuto alla community e sciogli i tuoi dubbi legati allo studio

Guide Gratuite

I nostri eBook salva studente

Scarica gratuitamente le nostre guide sulle tecniche di studio, metodi per gestire l'ansia, dritte per la tesi realizzati da tutor Docsity

Statistica: Analisi dei Rapporti Statistici e Numeri Indici, Appunti di Statistica

Università degli Studi di Brescia (UNIBS)Statistica

Una panoramica dettagliata sull'analisi dei rapporti statistici e dei numeri indici. Vengono esaminati i rapporti statici di derivazione, i numeri indici semplici e composti, e le tecniche per cambiare la base dei numeri indici. Inoltre, il documento affronta l'analisi delle distribuzioni, le medie di posizione e algebriche, e la variabilità statistica, offrendo esempi pratici e definizioni chiare per una comprensione approfondita della materia. Infine, vengono descritti gli indici dei prezzi al consumo e la rivalutazione monetaria.

Tipologia: Appunti

2023/2024

Caricato il 01/11/2025

francesca-zecchini-6 🇮🇹

1 documento

1 / 76

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1

LEZIONE 1-2 28/02

CHE COS'È LA STATISTICA

La statistica tradizionale comprende la statistica descrittiva e inferenziale.

Nella statistica descrittiva si usano tutti gli strumenti necessari per studiare, descrivere i

fenomeni collettivi, mentre nella statistica inferenziale si usano gli strumenti necessari per

esporre i risultati, osservati su un campione, alla popolazione.

STATISTICA DESCRITTIVA

Si occupa di descrivere la realtà dei fenomeni collettivi (fenomeni demografici, andamento

della temperatura di una città, soddisfazione dei clienti, efficacia di una terapia medica…)

Definisce indicatori di sintesi (es. la media, la moda) e metodi complessi di analisi (come

quelli proposti dalla scuola italiana di Statistica nel corso dell’Ottocento e del Novecento)

Nella statistica descrittiva si possono usare tabelle, grafici, sintesi (metodi semplici) oppure

metodi più complessi.

STATISTICA INFERENZIALE

Fornisce i metodi con cui riferire all’intera popolazione le sintesi quantitative dei dati

osservati su un campione di osservazioni.

Esempio: conoscendo la % di fumatori di un campione di adolescenti di una città, si può dire

che la % di fumatori su tutti gli adolescenti della città è compresa tra x e y con una probabilità

del 95% → ruolo centrale del calcolo delle probabilità

STATISTICA TRADIZIONALE

In entrambi i casi i dati sono gli ingredienti, i metodi matematici sono gli strumenti e

l’informatica è sempre più importante.

Oggi sono a disposizione molti dati, si parla quindi di big data ovvero dati complessi, in

quanto sono vari (numeri, testi, immagini,...), i dati devono essere veri e arrivano moltissimi

dati in poco tempo. I big data sono caratterizzati da 3V → velocità, varietà, veridicità.

C’è il rischio che i dati siano troppi, per questo si parla di data mining ovvero trovare i dati

utili tra la molteplicità di dati al fine di ricavare informazioni.

Grazie alla capacità di calcolo nasce la data science che unisce la matematica alla statistica,

informatica quindi ai data analyst.

Una volta raccolti i dati, essi vanno comunicati ad esempio ai manager delle imprese. I dati

raccolti fanno da supporto alle decisioni che poi si prenderanno, non sono lo strumento finale.

La data visualization permette di trasformare i dati raccolti in immagini o altri metodi che

rendono possibile capire il risultato e quindi la decisione.

Dietro ai dati ci sono le persone e quindi non si hanno dati certi, bensì si parla di incertezza.

AMBITI DI APPLICAZIONE

In azienda è importante avere un metodo che si basa sui dati, per questo si parla di

data-oriented e non più data-driven in quanto le decisioni non sono prese in automatico con i

dati ma ci sono altri strumenti che conducono alla decisione finale.

Nella società si analizzano i fenomeni collettivi (ad esempio su una scala da 0 a 100 si

misurano i livelli di felicità nelle varie regioni).

Nell’economia ci sono degli indicatori economici che mostrano ad esempio i tagli della spesa

pubblica, oppure la ricchezza …

1

pf3

pf4

pf5

pf8

pf9

pfa

pfd

pfe

pff

pf12

pf13

pf14

pf15

pf16

pf17

pf18

pf19

pf1a

pf1b

pf1c

pf1d

pf1e

pf1f

pf20

pf21

pf22

pf23

pf24

pf25

pf26

pf27

pf28

pf29

pf2a

pf2b

pf2c

pf2d

pf2e

pf2f

pf30

pf31

pf32

pf33

pf34

pf35

pf36

pf37

pf38

pf39

pf3a

pf3b

pf3c

pf3d

pf3e

pf3f

pf40

pf41

pf42

pf43

pf44

pf45

pf46

pf47

pf48

pf49

pf4a

pf4b

pf4c

Scopri Appunti di Statistica Università degli Studi di Brescia (UNIBS)

Documenti correlati

Sbobina Indici statistici

Costruzione indici statistici

(1)

Lezione 2: Rapporti Statistici e Indici

INDICI STATISTICI . INDICI STATISTICI. INDICI STATISTICI .

Rapporti statistici: definizione, tipi e calcolo di indici

Rapporti statistici e numeri indici, Statistica per il turismo, Università di Padova

Introduzione ai Numeri Indici e ai Rapporti Statistici - Prof. D'agata

(1)

Indici statistici

(1)

Indicatori statistici: indici assoluti, relativi e rapporti

indici statistici descrittivi

Esercitazione di statistica

lucidicorso8-numeri indici

Anteprima parziale del testo

Scarica Statistica: Analisi dei Rapporti Statistici e Numeri Indici e più Appunti in PDF di Statistica solo su Docsity!

LEZIONE 1-2 28/

CHE COS'È LA STATISTICA

La statistica tradizionale comprende la statistica descrittiva e inferenziale. Nella statistica descrittiva si usano tutti gli strumenti necessari per studiare, descrivere i fenomeni collettivi, mentre nella statistica inferenziale si usano gli strumenti necessari per esporre i risultati, osservati su un campione, alla popolazione.

STATISTICA DESCRITTIVA Si occupa di descrivere la realtà dei fenomeni collettivi (fenomeni demografici, andamento della temperatura di una città, soddisfazione dei clienti, efficacia di una terapia medica…) Definisce indicatori di sintesi (es. la media, la moda) e metodi complessi di analisi (come quelli proposti dalla scuola italiana di Statistica nel corso dell’Ottocento e del Novecento) Nella statistica descrittiva si possono usare tabelle, grafici, sintesi (metodi semplici) oppure metodi più complessi.

STATISTICA INFERENZIALE Fornisce i metodi con cui riferire all’intera popolazione le sintesi quantitative dei dati osservati su un campione di osservazioni. Esempio: conoscendo la % di fumatori di un campione di adolescenti di una città, si può dire che la % di fumatori su tutti gli adolescenti della città è compresa tra x e y con una probabilità del 95% → ruolo centrale del calcolo delle probabilità

STATISTICA TRADIZIONALE In entrambi i casi i dati sono gli ingredienti, i metodi matematici sono gli strumenti e l’ informatica è sempre più importante. Oggi sono a disposizione molti dati, si parla quindi di big data ovvero dati complessi, in quanto sono vari (numeri, testi, immagini,...), i dati devono essere veri e arrivano moltissimi dati in poco tempo. I big data sono caratterizzati da 3V → velocità, varietà, veridicità. C’è il rischio che i dati siano troppi, per questo si parla di data mining ovvero trovare i dati utili tra la molteplicità di dati al fine di ricavare informazioni. Grazie alla capacità di calcolo nasce la data science che unisce la matematica alla statistica, informatica quindi ai data analyst. Una volta raccolti i dati, essi vanno comunicati ad esempio ai manager delle imprese. I dati raccolti fanno da supporto alle decisioni che poi si prenderanno, non sono lo strumento finale. La data visualization permette di trasformare i dati raccolti in immagini o altri metodi che rendono possibile capire il risultato e quindi la decisione. Dietro ai dati ci sono le persone e quindi non si hanno dati certi, bensì si parla di incertezza.

AMBITI DI APPLICAZIONE In azienda è importante avere un metodo che si basa sui dati, per questo si parla di data-oriented e non più data-driven in quanto le decisioni non sono prese in automatico con i dati ma ci sono altri strumenti che conducono alla decisione finale. Nella società si analizzano i fenomeni collettivi (ad esempio su una scala da 0 a 100 si misurano i livelli di felicità nelle varie regioni). Nell’ economia ci sono degli indicatori economici che mostrano ad esempio i tagli della spesa pubblica, oppure la ricchezza …

Banca che raccoglie informazione sui propri clienti e poi crea un profilo di rischio assegnando ad ogni cliente uno score ovvero il grado di solvibilità. Finanza ormai si parla di fin-tech e insurtech (quindi in campo assicurativo) da dove ormai derivano i dati. Smart-city ad esempio si studia il traffico Medicina i farmaci che vengono messi in commercio solo dopo aver superato test di efficacia e tollerabilità che si fondano sulla statistica; le possibili terapie per determinate malattie vengono studiate utilizzando la statistica. Genetica, analisi sensoriale, sport, arte e cultura.

Quindi la statistica si occupa di predisporre adeguati metodi quantitativi per: ● raccogliere e organizzare ● elaborare e sintetizzare ● analizzare e interpretare dati e informazioni utili per esaminare i fenomeni reali. Si parla quindi di statistica 4. ovvero l’insieme di metodi e dei sistemi di aggregazione e visualizzazione che trasformano i dati in informazioni.

OBIETTIVI DELLA STATISTICA I metodi statistici sono proposti e studiati per l’analisi dei fenomeni che si manifestano in una collettività. Con le analisi statistiche ci si propone di individuare, descrivere, interpretare e prevedere la regolarità che sono alla base dei fenomeni e ci deve essere anche varietà dei dati con le analisi statistiche al fine di spiegare i fenomeni di interesse.

TERMINOLOGIA La popolazione o collettivo statistico è l’insieme dei dati, delle unità singole che si vogliono studiare e non sono per forza persone (aziende, fenomeni, …). Un campione è il sottoinsieme della popolazione. L’ unità statistica è il singolo soggetto, la singola unità su cui si vuole osservare il fenomeno. Il carattere è la caratteristica del fenomeno d’interesse sulle singole unità statistiche. I modi con cui il carattere si manifesta il carattere sulle singole unità statistiche sono le modalità , un carattere ne presenta di diverse. Per conoscere e/o comprendere un fenomeno, è quindi necessaria l’osservazione intenzionale di una molteplicità di casi individuali (popolazione o collettivo statistico). Ad esempio, l’età è il carattere, le modalità sono gli anni quindi 20,21,22,... anni compiuti. La rilevazione di uno o più caratteri consente di classificare, raggruppare le unità statistiche che formano la popolazione o il campione. Quindi ci sono attività di rilevazione e di classificazione.

REQUISITI DELLE MODALITÀ Le modalità di un carattere devono essere:

incompatibili (non sovrapposte) → la stessa unità statistica non può essere messa in relazione (classificata) con più di una modalità
esaustive → le modalità elencate devono rappresentare tutti i possibili modi di essere del carattere, così che tutte le unità statistiche del collettivo possano essere classificate; tutte le modalità osservabili devono essere elencate

Scale per i caratteri qualitativi:

nominali → le modalità sono sconnesse o non riordinabili e quindi confrontando due modalità si può solo dire se sono uguali o diverse (es: denominazione sociale → spa, srl, sas non si può dire se sono ordinate ma solo se sono uguali o diversi)
ordinali → le modalità sono ordinabili e quindi in sequenza logica, confrontando due modalità si può dire se precede, è nello stesso posto o segue l’altra. Alcune volte si hanno dei numeri che non sono numeri ma semplicemente etichette che esprimono qualcosa attraverso numeri (esempio: grado di istruzione → licenza elementare, media, diploma, laurea triennale, magistrale…)

Scale per i caratteri quantitativi:

ad intervalli → le modalità sono numeri riferiti ad uno zero arbitrario (l’origine è convenzionale, non è per forza segno di assenza). Non si possono confrontare le modalità con il rapporto ma SOLO le modalità con le differenze. Esempi di scale ad intervalli: temperatura (scala celsius, scala fahrenheit…) terremoto (scala Mercalli, scala Richter…). Non si può dire ad es. che la temperatura è il doppio in una città piuttosto che in un’altra. Con la scala Kelvin si possono fare sia rapporti sia differenze in quanto lo zero è assoluto
di rapporti → le modalità sono numeri riferiti ad uno zero assoluto (assenza del fenomeno) quindi si possono confrontare le modalità anche con il rapporto oltre che con le differenze (si può dire che un’azienda ha il doppio del capitale sociale oppure che ha una differenza di capitale sociale di tot.) Esempio scale ad intervalli - vedi slide

TRASFORMAZIONI DI VALORI X IN VALORI Y Trasformazione lineare → Y = a + bX con a e b costanti, serve per degli indicatori che si vogliono convertire. Casi particolari della trasformazione lineare:

traslazione → quando b=1 quindi Y = a+X NON dipende da X
trasformazione di scala → a=0 quindi Y = bX con b>0 (IVA) e viene detta costante di proporzionalità Esempio - vedi slide

GERARCHIA DELLE SCALE La scala ordinale ha le priorità della scala nominale e in più ha modalità ordinabili. La scala ad intervalli ha le proprietà della ordinale e in più ha modalità numeriche. La scala di rapporti ha le proprietà della scala ad intervalli e in più ha uno zero assoluto. Gli strumenti statistici predisposti per caratteri rilevati su una data scala possono essere applicati ai caratteri rilevati su scale superiori MA non vale il viceversa. Tutto ciò che si fanno sulle scale più basse, posso farlo anche nelle scale più alte ma NON viceversa.

LEZIONE 3 06/

RAPPORTI STATISTICI

Quando i dati statistici non ammettono un confronto diretto è necessario fare ricorso ad opportune elaborazioni degli stessi. Possono trovare impiego i rapporti statistici. Il rapporto statistico è il rapporto tra due dati, di cui almeno uno statistico. Indicano quanta parte del numeratore spetta idealmente a un’unità del denominatore. Bisogna fare attenzione all’unità di misura → numeratore/denominatore (es. ab/km)

FOCUS 1: I RAPPORTI STATISTICI DI COMPOSIZIONE (o di parte al tutto) Rapporti statistici → sono il rapporto tra due dati, di cui almeno uno di natura statistica. Indicano quanta parte del numeratore spetta idealmente ad un’unità del denominatore. Servono a confrontare fenomeni rilevati in circostanze differenti.

Rapporti di composizione (o di parte al tutto) 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡à (𝑜 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑧𝑎) 𝑝𝑎𝑟𝑧𝑖𝑎𝑙𝑒𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡à (𝑜 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑧𝑎) 𝑡𝑜𝑡𝑎𝑙𝑒 (× 100)

Esempio 1 L’azienda Beta produce televisori LCD, distribuiti sul mercato mediante centri commerciali e negozi di elettronica. Per valutare la propria presenza sul mercato, l’azienda Beta ha raccolto i seguenti dati: Regione N° tot di punti vendita N° punti vendita trattano i televisori Beta Lombardia 980 637 Veneto 776 582

Nel confronto dobbiamo tenere conto delle diverse dimensioni dei due mercati. A tale fine, possiamo impiegare i seguenti rapporti (indice di penetrazione del prodotto nel mercato): Lombardia 637/980 = 0.65 65% Veneto 582/776 = 0.75 75%

FOCUS 2: I RAPPORTI STATISTICI DI DENSITÀ

I rapporti di densità (^) 𝑑𝑖𝑚𝑒𝑛𝑠𝑖𝑜𝑛𝑒 𝑐𝑎𝑚𝑝𝑜 𝑑𝑖 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑧𝑖𝑜𝑛𝑒𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡à 𝑑𝑖 𝑢𝑛 𝑓𝑒𝑛𝑜𝑚𝑒𝑛𝑜

Esempio Per confrontare l’addensamento della popolazione in due regioni sono disponibili i seguenti dati: Regione Popolazione residente Superficie in Km^2 Lombardia 10.008.349 23. Veneto 4.915.123 18.

Nel confronto dobbiamo tener conto delle diverse dimensioni (superfici) delle due regioni. Possiamo impiegare i rapporti: Lombardia 10.008.349/23.872 = 419 ab./km^2 Veneto 4.915.123/18.364 = 267 ab./km^2

FOCUS 5: I RAPPORTI STATISTICI DI DURATA E DI RIPETIZIONE

Ricordiamo che secondo Chisini, una media è una sintesi di differenti valori che, se sostituita a tali singoli valori, non altera la visione d’insieme di un altro fenomeno che da tali valori dipende. Con il metodo di Chisini si possono quindi trovare medie diverse, a seconda degli obiettivi dell’analisi.

Procedura

scrivere la funzione invariante , funzione delle singole osservazioni xi
sostituire, nella funzione invariante, le singole osservazioni xi con un valore costante x̄
porre l’uguaglianza tra le funzioni in 1. e 2.
risolvere l’equazione ottenuta per x̄ La formula analitica ottenuta rappresenta la media funzionale secondo Chisini

Medie funzionali M 1 → sostituito alle singole osservazioni, ne lascia invariata la somma M-1 → sostituito alle singole osservazioni, ne lascia invariata il prodotto M 0 → sostituito alle singole osservazioni, ne lascia invariata la somma dei quadrati Con il metodo di Chisini, è possibile individuare altre medie funzionali

Esempio Una merce viene venduta in N mercati. Siamo pi e qi rispettivamente il prezzo unitario e la quantità venduta nel mercato i-esimo. Si assuma valida per ogni mercato la seguente curva di domanda q = k*p-α^ k > 0, α > 0 Fornire l’espressione analitica del prezzo medio unitario che lascia invariata la quantità di merce complessivamente venduta negli N mercati.

La funzione invariante, funzione delle singole osservazioni xi è la quantità

complessivamente venduta negli N mercati: ∑ 𝑥𝑖 = ∑ 𝑘 · 𝑥𝑖 −α

Sostituiamo, nella funzione invariante, le singole osservazioni pi con un valore costante 𝑝

∑ 𝑘 · 𝑝^ - 𝛼

Poniamo l’uguaglianza ∑ 𝑘 · 𝑝𝑖 -𝛼 −α = ∑ 𝑘 · 𝑝
Risolviamo per 𝑝 𝑘∑ 𝑝𝑖 = - 𝛼^ → = - 𝛼^ → = - 𝛼 −α 𝑘∑ 𝑝 ∑ 𝑝𝑖 −α ∑ 𝑝 ∑ 𝑝𝑖 −α 𝑁 · 𝑝

-α (^) → →

∑𝑝𝑖−α 𝑁 =^ 𝑝^

Σ𝑝𝑖−α 𝑁 =^

1

α = 1 𝑝 α^ 𝑝 α^ = 𝑁 ∑𝑝𝑖−α

e l’espressione analitica del prezzo medio risulta: 𝑝 = 𝑁 ∑𝑝𝑖−α

1 α

NUMERI INDICI → rapporti ● semplici → servono a confrontare le intensità di un solo fenomeno in tempi o luoghi diversi (serie storica di un fenomeno, e vogliamo confrontare i vari dati dei vari anni, oppure fenomeno in luoghi diversi e vogliamo confrontarli) (index number) ● composti → servono a confrontare un fenomeno più complesso che risulta dal concorso di più componenti , sempre in luoghi o tempi diversi. Sono praticamente delle medie dei numeri indici semplici.

Esempio Serie storica 2016-19 degli acquisti in Bitcoin da parte di un trader (valori in euro). Possiamo valutare come il fenomeno è variato nel tempo calcolando numeri indici a base fissa e/o a base mobile.

Numeri indici a base fissa (NIbf) Li otteniamo eseguendo il rapporto tra ogni singola osservazione xt con un termine della serie storica xb che viene mantenuto fisso ( base fissa ):

t = 0, 1, 2, …

Essendo numeri puri , consentono di confrontare fenomeni con diversi ordini di grandezza Se, ad esempio, scegliamo come base il dato dell’anno iniziale, abbiamo:

t = 2016, 2017, 2018, 2019

𝑥𝑡 𝑥𝑏^ =^

𝑥𝑡 𝑥 2016 =^

𝑥𝑡 352,

2016 → 2016 I 2016 = 352,5/352,5 = 1 2017 → 2016 I 2017 = 373,3/352,5 = 1, Variazione 1,0590 - 1 = + 0,059 → + 5,9% dal 2016 al 2017 l’ammontare dell’acquisto di bitcoin del traider è aumentato del 5,9% 2018 → 382,0/352,5 = 1,0837 → incremento di 8,37% nel 2018 rispetto al 2016 2019 → 294,2/352,5 = 0,8346 → minore di 1, questo segnala che il numeratore è minore del denominatore, quindi tra il ‘16 e il ‘19 c’è stato un decremento del 0,8346 - 1 = - 0,

tra il 2016 e il 2017 gli acquisti di Bitcoin sono aumentati del 5,9% [(1,059 -1)*100 = 5,9] I numeri indici sono valori positivi e possono essere superiori o inferiori a 1, a seconda di un incremento o decremento.

La stessa formula posso scriverla come (y 2022 / y 2021 ) - 1 = 210/200 - 1 = + 0. Il rapporto y 2022 /y 2021 è un numero indice, e lo chiamiamo I del 2022, su base del 2021 ( 2021 I 2022 = 210/200 = 1.05 → numero indice semplice).

Per fare un confronto nel tempo equo dobbiamo usare i numeri indici, che possono essere a base fissa o mobile. Come visto prima i numeri indici a base fissa sono il rapporto tra la singola osservazione e la serie storica al tempo b (base) decisa da noi. (^) bIt = xt / xb La base viene mantenuta fissa perché stiamo pensando di calcolare questi numeri indici tante volte, quindi si parte dal primo anno dove mi colloco e calcolo l’indice, poi continuo a spostarmi negli anni successivi, mantenendo la stessa base.

Numeri indici a base mobile (NIbm) Li otteniamo eseguendo il rapporto tra ogni singola osservazione xt con un termine della serie storica → xt-1 ovvero il termine del periodo immediatamente precedente, che quindi cambia ogni volta ( base mobile ):

t = 1, 2, …

Formula xt/xt-1 → dato dell’anno fratto dato anno precedente. Al pedice di sinistra ho t-1, non più b dell’anno base. Essendo numeri puri , consentono di confrontare fenomeni con diversi ordini di grandezza. Nel primo anno, il tempo precedente sarebbe t0 che non posso calcolare → non disponibile (ND)

2017 → 2016 I 2017 = 373,3 / 352,5 = 1,

2018 → 382/373,3 = 1,0233 → nel 2018 rispetto al 2017 c’è stato un incremento del 2,33% degli acquisti di bitcoin del trader

Anche l’interpretazione di un NIbm avviene quindi avviene quindi attraverso la corrispondente variazione relativa ( congiunturale ) a cui è collegato dalla relazione:

ovvero

Numeri indici e variazioni I numeri indici (sia a base fissa che mobile) sono sempre positivi , anche quando segnalano una diminuzione → il discriminante è 1 che fa determinare se è una riduzione o un aumento.

Le variazioni (tendenziali e congiunturali) hanno, invece, un segno positivo o negativo (se diverse da zero). Nell’anno base indice 1, variazione 0, con base mobile è nd sia indice che variazione

Cambiamento della base Abbiamo visto nell’esempio che, se disponiamo di una serie storica di dati, ricaviamo agevolmente sia i NIbf sia i NIbf con basi differenti. Possiamo così soddisfare le varie esigenze di lettura delle variazioni congiunturali o tendenziali. Nella realtà molte volte non ho i dati x su cui fare i rapporti quindi non disponiamo dei dati originari. Conosciamo, invece, i NI (bf o bm) o le corrispondenti variazioni, quindi per capire l’evoluzione nel tempo devo leggere e i numeri indici e manipolarli. In questi casi esistono 3 regole che permettono di lavorare con i numeri indici, ricavando indirettamente delle informazioni. Queste regole sono: ● cambiare la base dei NIbf ● trasformare la base da fissa a mobile ● trasformare la base da mobile a fissa

cambiamento della base fissa Resto nel caso della base fissa, ma cambio la base. Quindi si utilizzano dei rapporti per esprimere i NIbf di una vecchia base ( vb ) in NIbf si una nuova base ( nb ). I rapporti sono:

Ho i dati in base 2018 = 1, voglio sapere con base 2016 = 1, bisogna quindi manipolare i dati che abbiamo.

passaggio da base fissa a base mobile Per esprimere i NIbf in NIbm, utilizziamo i rapporti

Esempio riassuntivo Indicatori di mobilità dell’occupazione in una data regione nel periodo 2014-19 (dati per 1000 occupati) Numeri indici degli ingressi

Indici di mobilità occupazionale

LEZIONE 4 10/

DISTRIBUZIONI DI FREQUENZE

La distribuzione di frequenze di un carattere è una tabella che mostra in modo efficace e sintetico i risultati delle operazioni di classificazione e conteggio delle unità della popolazione. Sono tabelle per sintetizzare le operazioni di classificazione e conteggio delle unità della popolazione, prendo le unità statistiche e le classifico nelle diverse modalità, poi si conta. !! A seconda del tipo di carattere, se ne possono effettuare diverse elaborazioni e rappresentazioni !! (caratteri qualitativi e quantitativi!!)

CARATTERE QUALITATIVO Tutto ciò che possiamo fare sui caratteri nominali sicuramente è possibile farlo sui caratteri successivi. Si parte seguendo la gerarchia nelle scale. Il carattere prende il nome di MUTABILE STATISTICA NOMINALE = carattere qualitativo

Esempio) distribuzione di 180 progetti di blockchain per settore Abbiamo una tabella che ha due colonne, nella prima colonna abbiamo il nome del carattere (settore) e le sue modalità (finanza, PA, agrifood), nell’altra colonna abbiamo le frequenze (frequenze) con i numeri → frequenze assolute, sono il risultato delle operazioni di classificazione e conteggio. Quindi 90 è la frequenza assoluta associata alla modalità finanza del carattere settore, e indica il numero di progetti di finanza. Es. 54 → frequenza: numero di volte che la modalità PA si presenta nella popolazione. La somma delle frequenze è 180, che è il totale dei progetti.

Settore Frequenze

Finanza 90

PA 54

Agrifood 36

Totale 180

Altro grafico che si può costruire è il grafico a barre, di solito si usa quello a barre orizzontali. Pictogramma → l’ordine è arbitrario, non c’è un ordine, perché le modalità non sono ordinabili, non ho un criterio

Confronti tra distribuzioni Le frequenze relative → si rendono necessarie quando bisogna fare dei confronti. Quando si calcolano i risultati sono dei rapporti statistici di composizione o di parte al tutto, prendo una parte e la rapporto al suo tutto, così da avere il peso di quel 90 sul totale del 180. Permettono di valutare l’ importanza di ogni modalità, e inoltre, permetto di fare dei confronti tra popolazioni di diverse numerosità. Depuro la frequenza assoluta dall’effetto del totale, che appunto, può essere diverso in diverse popolazioni.

Nel regno unito i numeri di progetti sono maggiori rispetto all’Italia, ma bisogna vedere se le varie modalità sono maggiori per il semplice fatto che in totale siano maggiori i prodotti, o se a parità di condizioni sono effettivamente maggiori. Per questo bisogna usare un rapporto statistico e si calcolano le frequenze relative. Le due popolazioni hanno numerosità diverse, ma con le freq. relative, vedo che la PA nel Regno Unito pesa di più che in italia (doppio), mentre Agrifood pesa la metà nonostante il numero assoluto fosse più alto che in italia.

MUTABILE STATISTICA ORDINALE

Esempio - distribuzione di 150 impiegati per titolo di studio A sinistra colonna del carattere con le sue modalità (esaustive e incompatibili), le modalità sono assolute, e il totale fa 150. Per rappresentare questa tabella il grafico a torta non è consigliabile, ma è preferibile un grafico a barre verticali, in quanto possiamo mettere in ordine le modalità → licenza media - diploma - laurea. L’altezza della barra rispecchia la frequenza, ed è possibile farlo anche con freq. relative.

Non è un piano cartesiano, inoltre, le barre sono equidistanziate, non abbiamo numeri, la distanza non riflette nulla, non c’è una misurazione numerica sono solo parole.

Frequenze cumulate Poiché le modalità sono ordinate , possiamo calcolare le frequenze cumulate.

Per le frequenze cumulate posso fare il calcolo solo perché le modalità sono ordinate, altrimenti non ha senso fare questo calcolo. Riscrivo la tabella mettendo le modalità in ordine crescente. Le frequenze cumulate della prima riga è uguale, alla seconda modalità la cumulata si ottiene sommando la cumulata appena scritta (36) + fr. assoluta della riga in cui scrivo (36+72=108). All’ultima riga avrò il totale delle frequenze assolute. 108 è il numero di persone che hanno al massimo/al più il diploma.

Frequenze retrocumulate Poiché le modalità sono ordinate , possiamo calcolare le frequenze retrocumulate

Quante sono le aziende con non più di 3 data analysts? 5+22+32 = 59 stiamo calcolando una frequenza cumulata assoluta N 3 Le aziende con non più di 3 data analysts sono 59
Che peso hanno le aziende con almeno 3 data analysts? 0,066+0,150+0,292+0,267=0,775 stiamo calcolando una frequenza retrocumulata relativa F- Le aziende con almeno 3 data analysts sono il 77,5% del totale

FORMULE DI CALCOLO Frequenze assolute cumulate

Sommatoria per j che va da 1 a i, di nj i indica la generica riga, essendo che come ultimo addendo ci sia la i, mi impedisce di utilizzare la i anche come pedice generico

Frequenze assolute retrocumulate

Relazione:

Frequenze relative (o percentuali) cumulate

Frequenze relative (o percentuali) retrocumulate Parto dalla i, fino ad arrivare all’ultima p

Relazione:

LEZIONE 5 13/ RAPPRESENTAZIONI GRAFICHE Diagramma a bastoncini (o diagramma ad aste) Il punto che nel piano cartesiano corrisponde alla generica coppia (xi ; ni) o (xi ; fi) è proiettato sull’asse delle ascisse. L’altezza dei bastoncini così ottenuti corrisponde alla frequenza assoluta o relativa.

Diagramma a gradini (cumulo) Dal punto che rappresenta la generica coppia (xi ; Ni) o (xi ; Fi) si traccia verso destra un segmento orizzontale di lunghezza pari a 1. L’altezza di un gradino corrisponde alla frequenza assoluta o relativa.

Sono 0 le aziende che hanno -1 distretto di data analysts. Tra il 59 e il 94, c’è un numero di aziende che hanno 4 data analysts, quindi 80 aziende hanno al massimo 4 data analysts (non sono tutte quelle che hanno al massimo 4 d.a.)

Diagramma a gradini (retrocumulo) Dal punto che rappresenta la generica coppia (xi ; N̅) o (xi ; F̅i) si traccia verso sinistra un segmento orizzontale di lunghezza pari a 1. L’altezza di un gradino corrisponde alla frequenza assoluta o relativa.

VARIABILE STATISTICA DISCRETA PER CLASSI

Quando il carattere presenta un numero rilevante di modalità, è preferibile raggrupparle in classi ( intervalli ) incompatibili ed esaustive. Ciò comporta evidentemente una certa perdita di informazioni.