Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Metodo analisi statistica distribuzioni: interpolazione valori teorici ed empirici., Appunti di Statistica

Un metodo statistico per analizzare distribuzioni di dati attraverso l'interpolazione tra valori teorici e empirici. Il metodo coinvolge la trasformazione di valori in logaritmici, la determinazione di rapporti statistici e l'analisi di medie aritmetica, geometrica e quadratica. Vengono inoltre introdotti concetti come media aritmetica interna, progressione geometrica, dispersione, scarto semplice medio, devianza, asimmetria e indice di disnormalità.

Tipologia: Appunti

2019/2020

Caricato il 07/06/2020

roberta-russi
roberta-russi 🇮🇹

3 documenti

1 / 47

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
La statistica è una disciplina strumentale, cioè una disciplina che offre degli strumenti e dei metodi che
servono allo studio dei fenomeni. La statistica studia i fenomeni atipici che nel loro manifestarsi hanno delle
modificazioni e quindi non sono mai uguali. Queste variazioni sono oggetto del nostro interesse. La
statistica si occupa di tutti i tipi di fenomeni ed è presente in tutti i tipi di settori. I campi di probabilità
hanno una base statistica che ci dice quale sarà l’evoluzione. L’oggetto della nostra indagine è l’unità
statistica. L’unità statistica può essere semplice o composta. Quella semplice è quella che ha una sua
individuazione, cioè distinta dalle altre. L’insieme delle unità semplici forma una unità complessa. L’unità
multipla è formata dall’insieme di più unità semplici unite tra loro da più vincoli. Il collettivo statistico è
l’insieme delle unità statistiche che formano la base a cui fare riferimento per l’indagine statistica. Il
collettivo può essere finito, infinito o indeterminato. In quello finito sappiamo esattamente calcolare
l’ammontare del collettivo. Inoltre sappiamo calcolare il valore iniziale e quello finale. In quello infinito, non
siamo in grado di stabilire l’ammontare del collettivo. In quello indeterminato, abbiamo un valore iniziale e
finale ma non riusciamo a calcolare con esattezza l’aumentare preciso. Possiamo solo stimare per
approssimazione. L’unità si riferisce ad un carattere. Il carattere è l’oggetto del nostro interesse ed è
affiancato dal concetto della modalità. La modalità è il modo di essere del carattere e cioè come il carattere
si manifesta. Se il carattere è il sesso, la modalità sarà maschio o femmina. Affianco alle modalità abbiamo
l’ammontare ovvero la frequenza. La frequenza ci dice quante volte la modalità del carattere si ripete.
L’intensità è l’ammontare del carattere qualitativo. Il carattere può essere quantitativo o qualitativo. Il
carattere quantitativo attiene all’aspetto della quantità, mentre quello qualitativo si attiene a quello della
qualità. I caratteri quantitativi si dividono in discreti e continui. Quelli qualitativi si dividono in rettilinei,
ciclici e disconnessi. Inoltre ci sono i caratteri geografici e storici. I caratteri quantitativi discreti vengono
rappresentati da una unità singola e non presentano valori intermedi tra due unità. I caratteri quantitativi
continui, attengono all’aspetto quantitativo ma assumono infinite modalità, possono essere possibili valori
di un intervallo e assumono una classe di valori. Inoltre ci possono essere dei valori intermedi tra due unità.
I caratteri qualitativi rettilinei si presentano con delle modalità che sono ordinabili con una modalità iniziale
e una finale che non possono essere sovvertiti. I caratteri qualitativi ciclici, presentano delle modalità con
un ciclo chiuso che si ripresenta periodicamente e presenta valori ordinabili. I caratteri qualitativi
disconnessi, sono tutti quei caratteri che non hanno una modalità ordinabile e in cui l’individuo decide
quale sia l’inizio e la fine. Ad esempio le professioni hanno un ordine aperto. I caratteri possono essere
geografici quando si riferiscono a serie territoriali o storici quando si riferiscono a una serie storica. Mentre
quelli geografici si riferiscono al luogo, quelli storici si riferiscono al tempo. Ad esempio le professioni hanno
un ordine aperto. Assegniamo alla modalità del carattere la X e alla frequenza la N. L’intervallo classe
racchiude un ambito di frequenza. La classe chiusa, è quella che ha un valore iniziale e finale (0 è il valore
iniziale, 10 è quello finale nell’esempio di una classe che va da 0 a 10). Quindi ci sono caratteri che hanno la
stessa modalità ma con frequenza da 0-10. Nella classe aperta invece, prendo tutti i valori che vanno da 0 a
10. In quella aperta, quindi, abbiamo la necessità di definire quale sia il valore iniziale della classe prima di
utilizzarla. Se non dovessimo porre dei limiti alla classe, non riusciremmo a rappresentare dei grafici o ad
applicare delle formule perché non sapremmo quali valori prendere. Nella nostra indagine statistica, la
segmentazione dei dati deve essere il più possibile omogenea. Bisogna quindi leggere attentamente il
fenomeno. Maggiore sarà l’omogeneità, meglio avremo la nostra rappresentazione grafica. Più le classi
avranno ampiezza uguale, meglio sarà per la nostra rappresentazione grafica. La classe è data dalla
variazione del carattere o anche dalla differente differenziazione della modalità del carattere. Questo dà
luogo all’intervallo. La distribuzione è la ripartizione delle modalità del carattere secondo un certo
elemento ordinatore che è il carattere.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f

Anteprima parziale del testo

Scarica Metodo analisi statistica distribuzioni: interpolazione valori teorici ed empirici. e più Appunti in PDF di Statistica solo su Docsity!

La statistica è una disciplina strumentale, cioè una disciplina che offre degli strumenti e dei metodi che servono allo studio dei fenomeni. La statistica studia i fenomeni atipici che nel loro manifestarsi hanno delle modificazioni e quindi non sono mai uguali. Queste variazioni sono oggetto del nostro interesse. La statistica si occupa di tutti i tipi di fenomeni ed è presente in tutti i tipi di settori. I campi di probabilità hanno una base statistica che ci dice quale sarà l’evoluzione. L’oggetto della nostra indagine è l’unità statistica. L’unità statistica può essere semplice o composta. Quella semplice è quella che ha una sua individuazione, cioè distinta dalle altre. L’insieme delle unità semplici forma una unità complessa. L’unità multipla è formata dall’insieme di più unità semplici unite tra loro da più vincoli. Il collettivo statistico è l’insieme delle unità statistiche che formano la base a cui fare riferimento per l’indagine statistica. Il collettivo può essere finito, infinito o indeterminato. In quello finito sappiamo esattamente calcolare l’ammontare del collettivo. Inoltre sappiamo calcolare il valore iniziale e quello finale. In quello infinito, non siamo in grado di stabilire l’ammontare del collettivo. In quello indeterminato, abbiamo un valore iniziale e finale ma non riusciamo a calcolare con esattezza l’aumentare preciso. Possiamo solo stimare per approssimazione. L’unità si riferisce ad un carattere. Il carattere è l’oggetto del nostro interesse ed è affiancato dal concetto della modalità. La modalità è il modo di essere del carattere e cioè come il carattere si manifesta. Se il carattere è il sesso, la modalità sarà maschio o femmina. Affianco alle modalità abbiamo l’ammontare ovvero la frequenza. La frequenza ci dice quante volte la modalità del carattere si ripete. L’intensità è l’ammontare del carattere qualitativo. Il carattere può essere quantitativo o qualitativo. Il carattere quantitativo attiene all’aspetto della quantità, mentre quello qualitativo si attiene a quello della qualità. I caratteri quantitativi si dividono in discreti e continui. Quelli qualitativi si dividono in rettilinei, ciclici e disconnessi. Inoltre ci sono i caratteri geografici e storici. I caratteri quantitativi discreti vengono rappresentati da una unità singola e non presentano valori intermedi tra due unità. I caratteri quantitativi continui, attengono all’aspetto quantitativo ma assumono infinite modalità, possono essere possibili valori di un intervallo e assumono una classe di valori. Inoltre ci possono essere dei valori intermedi tra due unità. I caratteri qualitativi rettilinei si presentano con delle modalità che sono ordinabili con una modalità iniziale e una finale che non possono essere sovvertiti. I caratteri qualitativi ciclici, presentano delle modalità con un ciclo chiuso che si ripresenta periodicamente e presenta valori ordinabili. I caratteri qualitativi disconnessi, sono tutti quei caratteri che non hanno una modalità ordinabile e in cui l’individuo decide quale sia l’inizio e la fine. Ad esempio le professioni hanno un ordine aperto. I caratteri possono essere geografici quando si riferiscono a serie territoriali o storici quando si riferiscono a una serie storica. Mentre quelli geografici si riferiscono al luogo, quelli storici si riferiscono al tempo. Ad esempio le professioni hanno un ordine aperto. Assegniamo alla modalità del carattere la X e alla frequenza la N. L’intervallo classe racchiude un ambito di frequenza. La classe chiusa, è quella che ha un valore iniziale e finale (0 è il valore iniziale, 10 è quello finale nell’esempio di una classe che va da 0 a 10). Quindi ci sono caratteri che hanno la stessa modalità ma con frequenza da 0-10. Nella classe aperta invece, prendo tutti i valori che vanno da 0 a

  1. In quella aperta, quindi, abbiamo la necessità di definire quale sia il valore iniziale della classe prima di utilizzarla. Se non dovessimo porre dei limiti alla classe, non riusciremmo a rappresentare dei grafici o ad applicare delle formule perché non sapremmo quali valori prendere. Nella nostra indagine statistica, la segmentazione dei dati deve essere il più possibile omogenea. Bisogna quindi leggere attentamente il fenomeno. Maggiore sarà l’omogeneità, meglio avremo la nostra rappresentazione grafica. Più le classi avranno ampiezza uguale, meglio sarà per la nostra rappresentazione grafica. La classe è data dalla variazione del carattere o anche dalla differente differenziazione della modalità del carattere. Questo dà luogo all’intervallo. La distribuzione è la ripartizione delle modalità del carattere secondo un certo elemento ordinatore che è il carattere.

L’intensità del carattere è l’ammontare delle singole modalità. L’indagine statistica si divide in 4 punti. Il primo punto è la rilevazione. In questa fase, siamo in possesso di quel complesso di operazioni che portano alla conoscenza dei dati relativi alle modalità di uno o più caratteri di un collettivo statistico e andiamo a determinare i presupposti della nostra indagine. La rilevazione è caratterizzata da 2 aspetti che sono i costi e la determinazione del piano di rilevazione. Il secondo punto consiste nella raccolta dei dati. In questa fase bisogna stabilire l’obiettivo da raggiungere, stabilire i mezzi con cui operare l’indagine, definire l’unità di misura, stabilire se utilizzare dei questionari o delle schede, definire l’ampiezza dell’indagine e a quale collettivo fa riferimento, stabilire l’epoca in cui si volge l’indagine, il tempo necessario per svolgerla e soprattutto il costo dell’indagine. Questi sono prodromici alla realizzazione dell’indagine. Dopo aver stabilito il piano di lavoro, stabiliamo quanta gente intervistare. Questa scelta viene stabilita in relazione all’obiettivo, per stabilire l’ampiezza del collettivo e capire il campione da usare. L’indagine campionaria è utile per desumere dal campione stesso un'informazione relativa all'intera popolazione e quindi il campione deve essere rappresentativo. L’indagine a tappeto invece coinvolge tutti gli elementi del collettivo. Di solito vengono utilizzate maggiormente le indagini campionarie. Dopo la raccolta dei dati abbiamo la fase dell’elaborazione. In questa fase andiamo a sintetizzare e trasferire i dati raccolti in alcuni grafici o tabelle avendo così una percezione più immediata del fenomeno. In seguito bisogna operare l’esposizione dei dati. Successivamente troviamo la fase dell’interpretazione durante la quale il fenomeno viene studiato e viene definita la dimensione del medesimo. Le rilevazioni possono essere totali o parziali. Quelle parziali possono essere rappresentative e non rappresentative. In quelle rappresentative, l’analisi dei dati tiene conto delle parti del collettivo. In quelle non rappresentative invece non vengono abbracciate tutte le parti del collettivo e quindi non possono rappresentarlo interamente. Nelle rilevazioni automatiche, i dati vengono forniti mediante dichiarazioni spontanee e quindi senza l’utilizzo di interviste (es. le rilevazioni dell’ufficio di stato civile per le nascite, i morti, i matrimoni, ecc.). Nelle rilevazioni riflesse invece i dati vengono raccolti da appositi rilevatori (es. il censimento). Alla base delle indagini vengono operate delle scelte come ad esempio la determinazione in maniera propedeutica dell’unità di misura dei caratteri quantitativi. Possiamo utilizzare delle fonti statistiche ovvero delle fonti di dati a cui fare riferimento in caso di indagine non professionale. L’ISTAT svolge una serie di indagini in tutti i settori. Svolgono analisi periodiche e continuative per poter monitorare al meglio i fenomeni tendenziali. L’ISTAT inoltre svolge analisi con cadenza mensile e annuale. Le analisi decennali riguardano solo il censimento. L’ISTAT è strettamente collegata con la CEE che ha sede a Bruxelles, dove con l’aiuto di studiosi dei vari paesi vengono determinati gli indici di spesa della comunità europea. Questi dati inoltre sono necessari per una corretta programmazione economica. Le statistiche mondiali vengono effettuate da organizzazioni come l’ONU e la croce rossa. CONFINDUSTRIA invece, provvede personalmente alle proprie statistiche e fornisce alla dirigenza i dati necessari per affrontare i problemi di natura economica. L’attendibilità delle fonti deve essere massima. Quando si pubblica un numero bisogna prima effettuare delle verifiche. In ordine al tempo vengono effettuate delle indagini occasionali che si fanno per un determinato evento e quelle periodiche che vengono fatte ad intervalli determinati di tempo annuali o mensili. Nelle rilevazioni continue, le rilevazioni vengono registrate man mano che i fenomeni si verificano (es. dati anagrafici e di morte). Le rilevazioni generali sono racchiuse nell’annuario statistico italiano mentre quelle speciali sono relative ad un determinato settore. Il fenomeno può essere di stato o di flusso. Quello di stato è quel fenomeno che viene fotografato in un istante particolare. Quello di flusso è un fenomeno che non può essere verificato in un istante ma solo in un intervallo di tempo e quindi è possibile verificarlo solo in un arco temporale (es. l’immigrazione). Bisogna semplificare la lettura dei dati per renderli significativi e corrispondenti alla realtà e bisogna dargli una valenza tecnica per rappresentare in piccolo l’intero collettivo di riferimento. Più ampio sarà il campionario maggiore sarà la validità. La frazione del campionamento esprime il rapporto fra le unità del campione e le unità del collettivo totale. Si indica con 𝑛 𝑁 la frazione di campione e con 𝑁 𝑛 l’intervallo di campione che esprime l’intervallo tra ciascuna unità prescelta e quella successiva rispetto all’insieme ordinato di tutto il collettivo. Le scelte possono essere sistematiche e casuali. In quelle casuali le scelte vengono effettuate casualmente e soggettivamente. Il risultato quindi potrebbe presentare degli

Possiamo riscontrare 3 tipologie di errori in alcune fasi della rilevazione. L’errore numero 1 avviene nell’assunzione di dati. Questi errori sono causati da imperfezioni nei questionari attraverso gli strumenti utilizzati (es. poca chiarezza nell’esposizione della domanda oppure una proposizione della domanda tale che potrebbe generare conclusioni non in linea con la domanda). L’errore numero 2 sono le risposte imperfette sia nell’intervista che nelle domande poiché l’argomento trattato potrebbe essere intimo e personale e quindi otterremo delle risposte imprecise. L’errore numero 3 consiste negli errori commessi da chi materialmente svolge l’indagine e che altera un dato e da chi riporta una approssimazione nella risposta. Si possono commettere errori anche durante lo spoglio dei dati ovvero quando i dati raccolti vengono letti e inseriti nella tabella di spoglio. Questi tipi di errori possono dipendere da un’errata interpretazione delle risposte o di alcuni dati riportati male nel questionario, da un’errata attribuzione del dato (ciò rappresenta un errore di posizionamento) oppure da errori di arrotondamento. Tra quelli relativi alla grandezza da osservare gli errori possono essere accidentali quando dipendono da circostanze fortuite. Sono ad esempio affetti da errori accidentali quei dati statistici ottenuti mediante stime, le quali possono risultare in eccesso o in difetto e gli errori di misura commessi nella misurazione di una grandezza, costanti quando si commettono con la stessa intensità in tutte le osservazioni, sistematici quando è proporzionale alla grandezza osservata, di distribuzione quando vi è uno spostamento di frequenza da un gruppo ad un altro. Metodi per correggere questi errori. Il procedimento diretto serve per correggere gli errori di natura accidentale o errori sistematici risalendo alle fonti statistiche per aver certezza sui dati rilevati. Un procedimento per ridurre o eliminare errori dovuti a spostamenti di frequenze e di intensità tra le modalità è quello dell'ingrandimento delle classi che consiste nel riunire più dati in un'unica classe in modo da fare avvenire fra gli errori una certa compensazione. Mediante l’utilizzo di questo metodo si riduce però la possibilità di studiare il fenomeno. Attraverso il metodo della perequazione grafica si rappresentano nel piano cartesiano i valori delle frequenze e tracciando poi una linea continua o una curva perequatrice che passi tra questi estremi riusciamo ad indicare l'andamento evolutivo del fenomeno nel periodo di tempo osservato. Affinché la linea o la curva perequatrice siano perfette, bisogna osservare 3 punti. 1) La curva deve avere un andamento regolare in ogni suo punto. 2) Il numero delle differenze positive dei valori perequati deve essere uguale al numero delle differenze negative dei medesimi. Inoltre ci deve essere una sostanziale equivalenza trai i due, rispetto al valore medio dato. 3) Vi deve essere nell’andamento della curva, una alternazione tra valori positivi e negativi. Può capitare che nell’ambito dell’indagine, si verifichino delle mancanze di dati. Questi vuoti vengono chiamati lacune. Se c’è bisogno di fare un’operazione di valutazione dei dati che presentano intervalli a sinistra e a destra, posso colmarli analogamente andando a prendere quei valori dello stesso bene in un altro luogo. Il metodo dell’interpolazione è compreso nella parte della rappresentazione analitica. In questo metodo possiedo dei valori empirici e uso una serie di valori teorici che vanno a sostituire quelli empirici e tracciano una interpolazione tra quelli empirici andando a rettificare l’andamento dei valori empirici con quelli teorici più vicini a quelli empirici. I valori teorici determinati da una scelta matematica saranno uguali a quelli empirici. La nostra rappresentazione analitica sarà perfetta e servirà a correggere quei possibili picchi che sono una anomalia.

Osserviamo due grandezze X grande e X piccolo. La differenza tra i due è uguale alla differenza tra il valore assoluto e l'ammontare del fenomeno che viene chiamato errore di x o scarto di X rispetto a x. Lo scarto può essere positivo, negativo o nullo. L'errore in valore assoluto considera il risultato dello scarto prescindendo da quello che è il valore del segno. Il valore algebrico è esente dal più e dal meno. Con X−X X si esprime l'errore relativo di X. Le modalità del carattere vengono espresse con Xi. La modalità esprime l'intensità del carattere della frequenza relativa. La frequenza relativa si riferisce alle differenti intensità del carattere. Se dovessi sommare tutte le singole frequenze relative avrei la frequenza totale. Successivamente trasferiamo i dati dalla tabella di spoglio alla tabella per leggere i dati del fenomeno. Xi può essere un valore continuo, numerico, discreto. Il valore finale meno il valore iniziale è uguale a Xi+1 - Xi. Utilizzando la divisione per classi avremmo tante classi con tante ampiezze. Quando abbiamo classi uguali è più facile studiare il fenomeno perché all'interno delle classi i valori si distribuiscono normalmente. Le tabelle riportano valori quantitativi. In una tabella in cui è presente il dato temporale le modalità del dato temporale sono quelle a cui il valore numerico viene a riferirsi. Mentre la tabella singola riporta un solo carattere, quella multipla riesce contemporaneamente a tabulare l'andamento di più prodotti riferiti ad un lasso temporale. Se invece dovessimo avere una tabella in cui parliamo di regioni non ci riferiremo più all'unità di tempo ma ad una unità spaziale. Se il valore numerico dovesse essere percentuale affianchiamo il simbolo della percentuale accanto a quello della frequenza. Le tabelle si integrano rispetto al valore da tabulare. Le tabelle miste sono quelle tabelle che riescono a tabulare contemporaneamente due valori differenti che attengono a caratteri diversi. Nella tabella doppia il valore n1 avrà corrispondenza per il valore X1 e Y1 e le frequenze parziali saranno per riga e per colonna. Le tabelle ci permettono di confrontare la distribuzione di due caratteri che hanno in comune le frequenze. Inoltre le tabelle mettono in correlazione due caratteri dello stesso o differente fenomeno. Le tabelle singole possono contenere qualsiasi tipo di carattere e possono avere una variabile divisa in classi. Le tabelle doppie invece mettono in relazione l'andamento della variabile X con quello della variabile y. Ad esempio al variare del reddito cambia la spesa. La variabile può essere di due modi. La prima è la variabile indipendente dall'andamento del carattere mentre la seconda è la variabile che varia in relazione all'altra variabile. I caratteri quantitativi danno luogo a variabili statistiche. Quelli qualitativi invece danno luogo a mutabili statistiche. Se le classi dovessero avere ampiezze differenti, la base delle caselle dell'istogramma saranno diverse. Con la formula 𝑦 = ni nN esprimiamo la frequenza relativa la cui somma è sempre uguale^ a 1. Con la formula^ 𝑃𝑖^ =^ ni nN x 100 esprimiamo la frequenza percentuale che è sempre uguale a 100. La funzione relativa mette a confronto il peso della frequenza N rispetto a quello della frequenza assoluta. Il rapporto tra frequenza relativa e frequenza assoluta è uguale alla frequenza percentuale. La lettura deve essere più sintetica è immediata dell'unità rispetto a tutto. Le serie storiche possono essere di stato o di flusso. Quelle di Stato ci danno la rappresentazione del fenomeno in una serie di istanti di tempo. Quelle di flusso invece ci danno la rappresentazione del fenomeno in un intervallo di tempo. In una serie territoriali invece le n osservazioni vengono ad essere riferite ad una stessa unità territoriale che rappresenta la modalità a cui corrisponderà una frequenza e una intensità.

Nella rappresentazione grafica abbiamo le classi di valori X e Xi+1. Indichiamo con x1 è X2 i valori iniziali e valori finali delle classi. Indichiamo con ni la frequenza. Attraverso l'istogramma noi rappresentiamo determinate ampiezze di classi indicate con di. Di = Xi+ 1 meno xi. Determiniamo Hi facendo il rapporto tra frequenza e ampiezza delle classi. Poniamo Hi sull'asse delle ordinate e Xi ed Xi+1 sull'asse delle ascisse. Dopo aver determinato l'altezza del l'istogramma se abbiamo classi uguali avremmo basi uguali. Determiniamo il valore centrale della classe indicato con Vc che divide esattamente in due parti uguali i valori di una classe. Il valore iniziale più il valore finale diviso 2 è uguale a Xi+Xi + 1 / 2. Mentre il grafico ci dà un ammontare dei valori distribuiti per ogni singola classe, il tracciato rappresenta l'andamento del fenomeno considerando i valori medi di ciascuna classe. La piramide della popolazione non ha un andamento regolare. I rettangoli si calcolano In base allo stato civile della popolazione e ci mostra come in un secolo la popolazione si aumentata o diminuita. Avendo basi diverse avremo una lettura diversa Infatti con classi di diversa ampiezza la lettura del fenomeno diventerà meno è agevole. Il diagramma integrale ci dà le differenze relative quello cartesiano le differenze assolute. Nella rappresentazione con diagramma a colonne staccate o ortogramma utilizzando il metodo areale estraiamo la radice quadrata dei singoli valori e riportiamo i valori determinati. Successivamente fissiamo una determinata unità di misura prescelta per eseguire la rappresentazione grafica del fenomeno. Se nella rappresentazione grafica utilizziamo dal punto di vista geometrico il quadrato, riportiamo i valori determinati con l'unità di misura prescelta graficamente nell'estrazione dei quadrati. Se invece nella rappresentazione grafica operiamo la scelta di rappresentare il fenomeno con il rettangolo avremo rettangoli con base uguale per ciascuna modalità del carattere mentre l'altezza degli stessi rettangoli fissata dall'unità di misura sarà proporzionale ai valori dati. L'istogramma percentuale riporta all'interno del grafico i valori interni percentuali rispetto a quelli assoluti ovvero il peso di ciascun valore all'interno della distribuzione.

Nell’istogramma percentuale, per mettere meglio in risalto la composizione percentuale delle varie modalità del fenomeno rappresentato in altezza, in corrispondenza ad ogni modalità del carattere rappresentato in orizzontale si usa, talvolta fare tutte le colonne di uguale altezza, rappresentanti il valore 100, in modo che le varie suddivisioni di queste colonne, variamente tratteggiate, rappresentino le singole percentuali delle diverse parti componenti. Diagrammi a settori circolari. Volendo utilizzare i settori circolari per la rappresentazione di una mutabile sconnessa, occorre che ogni modalità sia rappresentata nel cerchio o nel semi-cerchio, nello stesso rapporto in cui figura nel totale. Quindi l’ampiezza alfa del settore corrispondente alla modalità ai si può ottenere dalla seguente proporzione: N : ni = 360° : alfa° se usiamo il cerchio. N : ni = 180° : alfa° se utilizziamo il semicerchio, dove ni è la frequenza delle modalità ai ed N è la frequenza totale. Uno dei difetti del metodo areale, con quadrati o con settori circolari, e che non consente di cogliere a vista le piccole differenze di area, essendo l’occhio umano più abituato a confrontare le lunghezze che le aree. Il sistema dei rettangoli e dei triangoli aventi uguale base (oppure uguale altezza) è scevro, invece, dal precedente difetto e le aree di queste figure sono direttamente proporzionali alle altezze (0 rispettivamente alle basi). Diagramma polare per la rappresentazione delle mutabili cicliche. Questo metodo si adatta bene per la rappresentazione delle mutabili cicliche, nelle quali le modalità si ripetono periodicamente. Esso utilizza il sistema di riferimento polare. Si fissa nel piano un punto O che chiamiamo polo ed una semiretta orientata uscente da O detta asse polare. Si assume, inoltre, un determinato segmento come unità di misura e si fissa il senso antiorario come verso positivo delle rotazioni dell’asse polare intorno al polo O. In base a questo sistema di riferimento, ogni punto P del piano può essere individuato da due coordinate: il raggio vettore p, che rappresenta la distanza di P da 0, e l’argomento Ø, ossia l’angolo formato dall’asse polare con il segmento OP. Nelle rappresentazioni delle mutabili cicliche il valore di p rappresenta, con una prefissata scala, la frequenza o l’intensità, mentre l’ampiezza di Ø è in relazione al numero di modalità. Se Queste sono i giorni della settimana, l’angolo corrispondente a Ciascuna modalità si ottiene dividendo l’angolo giro in sette parti; nel caso che Siano i mesi dell’anno, dividendo l’angolo giro in dodici parti ecc. Gli stessi dati sono stati rappresentati anche in coordinate cartesiane, le quali non consentono di apprezzare il carattere ciclico e, in particolare, l’accostamento tra il dato di dicembre e quello di gennaio. È appena il caso di aggiungere che, sullo stesso sistema polare, si possono rappresentare più mutabili cicliche, usando tratteggi diversi per ciascuna di esse. Uno degli inconvenienti del metodo è che non consente di rappresentare successioni molto lunghe di dati, che si riferiscono a periodi successivi, specialmente se le spezzate si sovrappongono, perché allora l’occhio riesce difficilmente a seguirlo. Altro inconveniente è che a variazioni numeriche identiche del fenomeno corrispondono impressioni diverse secondo che la poligonale si svolga vicino o lontano dal polo. Cartogrammi per la rappresentazione delle serie territoriali. Il cartogramma è utilizzato per rappresentare le serie territoriali di dati medi o di dati relativi (reddito medio, ampiezza media delle aziende, tasso di natalità ecc.). Nei cartogrammi si assume per base lo schema della carta geografica del territorio con i contorni delle circoscrizioni che interessano, aggiungendo una colorazione delle stesse secondo l’intensità del fenomeno. In margine al cartogramma bisogna riportare la scala delle colorazioni (chiave di lettura), cioè indicare le classi di intensità del fenomeno corrispondenti a ciascuna delle colorazioni adoperate. Invece, delle colorazioni si possono utilizzare dei tratteggi, via via più intensi al crescere della intensità del fenomeno. Nel caso di dati assoluti, invece, occorre utilizzare in ogni area territoriale, una figura geometrica che rappresenti il fenomeno di grandezza proporzionale a detta intensità. Si ha così la rappresentazione di un diagramma su base geografica, detta cartodiagramma. I cartogrammi consentono di localizzare geograficamente le zone di maggiore o minore intensità del fenomeno e quindi trovare le eventuali relazioni tra questo e le condizioni orografiche, idrografiche e climatiche del territorio. La rappresentazione di serie territoriali con diagrammi a colonne staccate, come si usa per le mutabili statistiche semplici, è indicata quando siano poche le modalità della serie territoriale; ad esempio, Italia settentrionale, Italia centrale, Italia meridionale ed insulare. La suddivisione in classi delle intensità del fenomeno da rappresentare con cartogramma è libera, ma è opportuno attenersi alle seguenti regole: a ) le classi devono avere, possibilmente, la stessa ampiezza, salvo la prima e l’ultima che possono essere classi

La variabile statistica doppia costituita dalle N coppie di valori corrispondenti (xi,yi), quando viene rappresentata su un sistema di assi cartesiani del piano, dà luogo a N punti che assumono la forma di una nuvola di punti (scatter secondo la terminologia inglese) generalmente più addensata al centro e più rada alla periferia. Meno frequente è il caso in cui questi punti si distribuiscono entro una striscia in modo da far pensare che trai due caratteri ci sia una relazione. Se la Variabile statistica doppia è, invece, costituita da una tabella a doppia entrata, la sua rappresentazione grafica può essere fatta con un sistema di assi cartesiani ortogonali nello spazio a tre dimensioni. Il disegno va, evidentemente, eseguito con visione prospettica. Il grafico costruito secondo lo schema prende il nome di stereogramma. Lo stereogramma è sostanzialmente la rappresentazione delle variabili a doppia entrata con modalità singole. Per ciascun valore di x avremo uno è solo un valore di Y. Nel caso in cui ho una variabile in cui le x e le y sono interpretate da classi di valori avrò la stessa distribuzione ma non avrò valori discreti ma continui. L’istostereogramma serve a rappresentare le variabili statistiche doppie i cui valori sono raggruppati in classi di valori. Per ogni classe di valori x ci sarà una classe di valori y corrispondente. Il suo inconvenitente è che non riusciamo a leggere i valori più bassi davanti o i più alti dietro. I rapporti statistici sono quei rapporti che mettono in relazione i singoli termini di una distribuzione oppure considerano il legame tra un valore della distribuzione e la media dei valori della distribuzione data. Quindi misuriamo la variazione relativa. Indichiamo il rapporto con rTo ovvero il rapporto al tempo di i con base tempo o. Vado a operare confrontando tra un valore della distribuzione considerato al tempo finale del mio esame rispetto al valore di quel bene a un tempo diverso ovvero O. O è il tempo iniziale e T è il valore del tempo finale. Sono i due istanti di tempo che metto a confronto per esaminare una variazione relativa di un carattere. oRt è il rapporto indice anche detto numero indice. Ad esempio in un anno avremmo come valore iniziale O il primo gennaio e come valore finale T il 31/12. Creiamo un rapporto tra valore finale e valore iniziale, se la spesa finale sarà ad esempio di 110 e la spesa iniziale di 100 Avrò avuto un incremento della spesa in un anno del 10%. Quindi il valore dell'incremento è stato del 10%. Il valore di x è uguale al rapporto XT / XO. Mentre quello della Y è uguale a YT / YO. Dove YT è l'elemento che voglio confrontare con un valore della distribuzione che è considerato in un tempo diverso. Il valore può essere o di incremento o di decremento. La base del rapporto YO dove metto a confronto il valore medio o il valore finale può essere a base fissa o a base variabile. Quando tutti si confrontano con la stessa base, i confronti saranno con base fissa. Questo confronto Determina un indice a catena a base fissa con riferimento immediato. In questo caso non rapporto i valori con la stessa base ma opero una base diversa. Ad esempio se confronto 110 su 100 e quindi salto un anno, avremo un indice a catena con base tempo a riferimento mediato. Se dovessi fare il confronto 105 su 130 andrei ad utilizzare un indice a catena con la base tempo a riferimento immediato. I confronti che facciamo sono importanti per l'economia. Ad esempio le quotazioni azionarie presenti in borsa vengono calcolate con rapporti statistici. Quando operiamo un confronto tra valori della stessa grandezza abbiamo numeri indicativi semplici. Se invece rapportiamo due o più valori di grandezze diverse, avremmo numeri indicativamente complessi perché esaminiamo contemporaneamente i valori di più grandezze. Quelli semplici godono di alcune proprietà. La prima proprietà è quella dell'identità che ci dice che la grandezza del fenomeno assunta a termine di confronto è uguale a 1 o a 100 o a una potenza di 10. La seconda proprietà è quella della commensurabilità che ci dice che se cambia l'unità di misura del fenomeno osservato, il relativo indice non subisce variazioni alcuna. La terza proprietà è quella della reversibilità delle basi in cui il prodotto di due indici semplici ovvero il rapporto degli Indici a base scambiate è uguale a 1. oRt x tRo=1. Per questa proprietà il rapporto che ne deriva è sempre uguale a 1. La quarta proprietà è quella della reversibilità dei fattori. Moltiplicando un rapporto indice di prezzo per il corrispondente rapporto indice di quantità avremo come risultato un rapporto indice di valore. IP x IQ = Vi ovvero prezzo per quantità uguale valore del bene. La quinta proprietà e quella transitiva. In una serie di indici a catena, il prodotto del rapporto indice finale per i rapporti indici precedenti è uguale al rapporto indice al tempo finale con base tempo il tempo iniziale. La sesta proprietà e quella circolare. Questa proprietà ci dice che il prodotto di 3 indici a base scambiate è sempre uguale all'unità. Attraverso lo slittamento della base per la proprietà transitiva è possibile passare da un indice a base fissa a un indice a

base variabile dividendo il rapporto considerato per quello da assumere come nuova base. Per passare invece da variabile a fissa, moltiplichiamo tra loro i rapporti Indici a catena. In questo modo otterremo una serie di rapporti indici al tempo considerando come base fissa il tempo iniziale. I numeri indici semplici misurano le variazioni tra due valori di una stessa grandezza. Quelli complessi invece misurano le variazioni tra due o più valori di grandezze diverse. I metodi di totalizzazione dei numeri indici sono: la media dei rapporti, il rapporto tra medie e il metodo aggregativo. Nella media dei rapporti si determinano quelli che sono gli indici semplici relativi ai prezzi di ciascun bene e si calcolano dopo la media più opportuna degli indici. Nel rapporto fra medie invece si calcolano le medie dei prezzi dei beni nei successivi tempi e poi i rapporti tra le medie così determinate. Con il metodo aggregativo andremo a sommare i prezzi assoluti nei successivi tempi e in seguito andremo ad utilizzare il rapporto delle somme che si vogliono andare a confrontare. Abbiamo vari tipi di medie tra cui: Media aritmetica, Media geometrica, Media armonica, mediana. La media aritmetica è più intuitiva e fornisce lo stesso coefficiente di importanza a tutti i termini della distribuzione. Le medie geometriche risentono invece dei valori maggiori della distribuzione e non vengono usate. La media armonica invece risente dei valori più bassi e non ci consente di evidenziare immediatamente il risultato dell'operazione. La media geometrica e la media armonica hanno gli stessi limiti. La mediana è influenzata dalle variazioni esterne. I suoi limiti sono che non si adatta bene alle lavorazioni successive della distribuzione. Nei numeri complessi si verificano proprietà di identità e proprietà commensurali. La proprietà della reversibilità viene soddisfatta solo mediante l'uso di una media geometrica o della media dei rapporti. Vengono soddisfatte con tutte le medie se invece utilizziamo il rapporto tra medie. Secondo la proprietà della proporzione i prezzi variano nella stessa proporzione. Anche il relativo indice varia con lo stesso coefficiente di proporzionalità. Secondo la proprietà della determinatezza un indice complesso non si annulla né diventa infinito o indeterminato se un termine della distribuzione risulta essere uguale a zero. La proprietà circolare si verifica sia con il rapporto tra medie che con le medie dei rapporti solamente con l'uso della media geometrica. I valori risultano essere la sommatoria dei prezzi al tempo ti è al tempo o sulla frequenza. Se moltiplichiamo per l'inverso avremo n sulla somma di Pio su Pit. Abbiamo quattro modi per ponderare i valori della distribuzione. Ponderare significa dare un peso. Mettere una ponderazione significa operare la posizione dei pesi all'interno dei valori della distribuzione. Un contributo importante nella costruzione degli indici dei prezzi ‘e dato dalla ponderazione dei prezzi stessi, ponderazione che può essere espressa o dalle quantità al tempo base qio o al tempo corrente qit o dai valori ottenuti dai prodotti dei prezzi al tempo 0 o al tempo t per le quantità al tempo 0 o al tempo t: pi0,qi0,pi0qit,pitqit,pitqi0,pit qit. Le quantità, sia al tempo base 0 che al tempo corrente t, costituiscono il cosiddetto paniere. Ciascuno dei panieri, poi, può essere valutato ai prezzi del tempo corrente t o a quelli del tempo base 0. Con la ponderazione si migliora l'andamento della distribuzione. Possiamo avere i pesi ponderabili costanti o pesi ponderabili variabili. Con quelli costanti effettuiamo confronti con valori iniziali, valori finali e intermedi con i valori della distribuzione. Quelli variabili effettuano confronti con valori iniziali e finali e non sempre con quelli intermedi. Adottando il procedimento della media aritmetica dei vari rapporti ponderati con i valori pi0 qit si perviene alla formula proposta da Paasche nel 1874 (indice IP). Alla stessa formula si giunge con il procedimento del rapporto dei prezzi medi al tempo corrente t e al tempo base zero, utilizzando la ponderazione con le quanta al tempo corrente qit. La formula di Laspeyres presenta una certa tendenziosità positiva rispetto a quella di Paasche. Infatti, per la legge economica della domanda, i beni per i quali si registrano i maggiori incrementi relativi dei prezzi dovrebbero far registrare

AGRUMI QUANTITÀ ESPRESSA IN MIGLIONI DI

TONNELLATE

PREZZI €/TONNELLATE

QIO QIT PIO PIT

ARANCE 86.6 103 519 560

CLEMENTINE 57.8 65 483 556

MANDARINI 3.9 4.1 615 635

POMPELMI 6.1 2.9 669 757

LIMONI 42.4 40 622 790

Dobbiamo fare il confronto geometrico fra i prezzi e le quantità, mediante la ponderazione.

IL=

ΣPIT∗QIO ΣPIO∗QIO

uso ponderazione con le quantità iniziali

IP=

ΣPIT∗QIT ΣPIO∗QIT

uso ponderazione con le quantità finali

IF= √

ΣPIT∗QIO ΣPIO∗QIO

ΣPIT∗QIT ΣPIO∗QIT

PITQIO PITQIT PIOQIO PIOQIT

IL =

𝟏𝟏𝟗𝟏𝟎𝟓 𝟏𝟎𝟓𝟕𝟏𝟓

= 1.26 ≈ 12.6% Rispetto all’anno base, gli incrementi dei prezzi medi dei

prodotti hanno registrato un aumento del 12.6%. Soffre di una tendenziosità positiva perché opera

con le quantità iniziali.

IP =

𝟏𝟐𝟖𝟐𝟏𝟖.𝟖 𝟏𝟏𝟒𝟏𝟗𝟑.𝟔

= 1.123 ≈ 12.3% Se operano con le quantità finali, abbiamo una tendenziosità

negativa del 12.3%.

IF = √𝟏. 𝟏𝟐𝟔 ∗ 𝟏. 𝟏𝟐𝟑 = 1.124 ≈ 12.4% Il valore è un valore interpolato tra Laspeyres e

Paasche. Operiamo un incrocio geometrico.

I rapporti di densità sono quozienti tra l’ammontare di un aggregato e una quantità che

rappresenta la dimensione spaziale o temporale del campo di osservazione cui esso fa riferimento.

Le quantità al numeratore e al denominatore sono grandezze eterogenee. Esempi: Il Prodotto

interno lordo pro capite, il numero medio di componenti per famiglia, l’indice di diffusione TV

(abbonamenti TV / popolazione residente), la densità per kmq (popolazione residente / superficie

kmq), tasso di ospedalizzazione (casi di ricovero di residenti / popolazione residente), ecc. Il

rapporto di densità può essere moltiplicato per comodità di lettura rispettivamente per 100, 1000

ecc.). Si dice rapporto di coesistenza il quoziente fra le frequenze o le intensità di un fenomeno in

due luoghi diversi, oppure il quoziente fra le frequenze o le intensità di due fenomeni in uno stesso

luogo. A differenza dei rapporti di composizione, i rapporti di coesistenza possono assumere valori

maggiori di 1 (o di 100 se sono rapporti percentuali). Ad esempio il rapporto tra esportazioni e

importazioni. Il rapporto tra due grandezze a/b in cui a è una parte di b, ovvero tra la quantità

corrispondente ad una modalità e la quantità complessiva costituisce un rapporto di

composizione o di parte del tutto.

Esercizio sul rapporto di durata.

D = 𝐂𝐎+𝐂𝟏 𝐄+𝐔 = 𝟓𝟔𝟎𝟖𝟎+𝟓𝟓𝟓𝟓𝟓𝟏 𝟏𝟑𝟔𝟎𝟓𝟐𝟕+𝟏𝟑𝟔𝟓𝟖𝟑𝟔 GIACENZA QO=560860 QT= MOVIMENTI Q. ENTRATE=1360527 Q. FINALI= 1365836

Saldo naturale della popolazione. Si determina l’ammontare della popolazione in un determinato

tempo. Consideriamo i valori che sono entrati e usciti nel collettivo.

Snat = 𝐐𝐧𝐚𝐭𝐢−𝐐𝐦𝐨𝐫𝐭𝐢 𝐏𝐌

Gli indici sono generali perché considerano tutto il collettivo. Gli indici sono specifici perché

considerano solo una parte.

Nati mortalità. Considera un aspetto particolare e quindi sul totale delle nascite quanti sono nati

morti. Quindi al valore 0. Rapporta i mai nati sui nati e ciò comporta che ci sono nati vivi e nati

morti. Indice di mortalità infantile , considera il valore delle morti dei bambini nel primo anno di

vita. Al denominatore avremo i nati vivi. I rapporti di durata considerano quella che è la durata

media di permanenza nel collettivo delle unità elementari che costituiscono il fenomeno osservato

e cioè mettono in evidenza il rapporto tra la consistenza dell'Unità in un Dato intervallo di tempo e

il loro flusso di entrata e uscita. I fenomeni nel loro manifestarsi non sono costanti nel tempo e

quindi si procede con procedimenti che risultano essere approssimativi. 𝐷 = 𝐶𝑀 1 2 (𝐸+𝑈)^

. CM è la

consistenza media del fenomeno ed è determinata dalla consistenza iniziale del

fenomeno. 𝐶𝑀 = 𝐶𝑂+𝐶 1 2 𝐶 1 = CO+(E-U)

I rapporti di derivazione sono quei rapporti tra l'intensità e la frequenza di un fenomeno con

l'intensità o la frequenza di un fenomeno che ne è il presupposto. Troviamo nei rapporti di

derivazione tutti quelli che sono i quozienti di natalità, mortalità ecc, ai quali si affiancano i

quozienti specifici, cioè che si riferiscono a gruppi di caratteri più omogenei e quindi più limitati.

Rappresentano la parte di un fenomeno più ampio. Ad esempio per i quozienti di mortalità i

rapporti sono composti al numeratore da un fenomeno di flusso cioè riferito ad un intervallo di

tempo e al denominatore uno di stato cioè riferito ad un particolare istante di tempo. Al

quoziente e all'indice di Nuzialità andremo a mettere al numeratore il numero di matrimoni e al

denominatore avremo la popolazione a metà anno che indichiamo con pm. È uguale alla

popolazione all'inizio del nostro intervallo di tempo più la popolazione alla fine fratto 2.

. 𝐼𝑛𝑢𝑛𝑧 = 𝑁 𝑚𝑎𝑡𝑟𝑖𝑚𝑜𝑛𝑖 𝑝𝑚

La media aritmetica è il valore medio più utilizzato e si ottiene calcolando l’ammontare complessivo del carattere pari alla somma di tutti i valori e dividendo per il loro numero N. Se consideriamo le N osservazioni singolarmente abbiamo la media aritmetica semplice. Nel caso in cui la serie delle osservazioni sia sintetizzata in una distribuzione in cui alle 5 modalità distinte xi, sono associate le frequenze ni (i = 1,2,...,s) abbiamo la media aritmetica ponderata. Proprietà della media aritmetica : 1) La somma algebrica degli scarti x1-μ è uguale a zero. 2) La somma dei quadrati degli scarti xi - μ è un minimo, nel senso che essa è minore della somma dei quadrati degli scarti dei valori xi, da un qualsiasi altro valore diverso da μ. 3) La media aritmetica è associativa, nel senso che possiamo sostituire ad un numero qualunque di valori diversi della X un egual numero di valori tutti uguali alla loro media. Quindi la media generale della distribuzione risulta essere uguale alla media ponderata delle medie parziali. Il valore di Xi è ponderato dalle corrispondenti frequenze ni. 4) Per la media aritmetica vale la proprietà traslativa nel senso che, aggiungendo a tutti i valori xi, una costante a, la media risulta aumentata di a, come si vede immediatamente dalle espressioni della media aritmetica. 5) Moltiplicando le xi per una costante b (diversa da zero), la media dei nuovi valori è uguale a b volte la media originaria; la media aritmetica è dunque omogenea. 6) La media aritmetica è interna, cioè riduce tutti i valori della distribuzione ai valori xi, la media risulta quindi uguale a Xi e se riportano tutti i valori a xn, la media risulterà uguale a xn. Questo vuol dire che è interna ai valori della distribuzione. 7) Se le xi sono in progressione aritmetica e se N è un numero dispari la media aritmetica coincide con il termine che occupa la posizione centrale nella graduatoria dei valori ordinati. MEDIA ARITMETICA SEMPLICE μ=1,2,3,5,7,11,13,17,19,23 valori discreti con frequenza= μ= 1 + 2 + 3 + 5 + 7 + 11 + 13 + 17 + 19 + 23 10 = 101 10 =10. MEDIA ARITMETICA PONDERATA μ= ( 3 ∗ 1 )+( 4 ∗ 2 )+( 5 ∗ 5 )+( 6 ∗ 7 )+( 7 ∗ 4 )+( 8 ∗ 1 ) 20 = 114 20 VOTI =5, Xi

ALUNNI

Ni Xi*Ni 3 1 3 4 2 8 5 5 25 6 7 42 7 4 28 8 1 8 20 114

2 caso MEDIA ARITMETICA μ= 50 + 300 + 350 + 3750 + 15000 190 = 19450 190 =102, 3 caso MEDIA ARITMETICA μ= 26721 +... 31759 12 = 241891 12 = La media geometrica la utilizziamo nei fattori di capitalizzazione e si indica con Mg. Mg semplice= √𝑋𝑖 𝑛 Mg ponderata= √𝑋𝑖𝑁𝑖 𝑛 Proprietà della media geometrica : 1) La media geometrica di più rapporti è uguale al rapporto fra la media geometrica dei termini al numeratore e la media geometrica dei termini al numeratore. 2) Anche la media geometrica è una media omogenea. Moltiplicando tutti i valori per una costante b, le nuove medie saranno b volte quella originaria. 3) Se le Xi sono in progressione geometrica se N ovvero l'ammontare delle frequenze è un valore dispari, la media geometrica coinciderà con il valore centrale della graduatoria dei valori ordinati dalla distribuzione. I1=0.05 1 anno I2=0.06 2 anno I3=0.055 3 anno I4=0.07 4 anno I5=0.065 5 anno

CLASSI

Xi-Xi+ Ni VC Xi*Ni 0 - 10 10 5 50 10 - 20 20 15 300 20 - 50 10 35 350 50 - 100 50 75 3750 100 - 200 100 150 15000 190 19450 MESI

BIGLIETTI

VENDUTI

Gennaio 26721 Febbraio 22621 Marzo 24855 Aprile 22748 Maggio 19098 Giugno 13258 Luglio 11450 Agosto 14687 Settembre 12589 Ottobre 19916 Novembre 22189 Dicembre 31759 241891

La media armonica la indichiamo con Mar ed è data dal rapporto tra il valore N delle frequenze e la somma

di 1 che varia da 1 a N Mar=

1 𝑥𝑖 𝑛 𝑣̇= 1

Mar=

𝑛𝑖 𝑥𝑖 𝑠 𝑣̇= 1

ponderata

La usiamo in tutte le distribuzioni che richiedono la determinazione di un concetto di proporzionalità inversa come se volessimo determinare un aspetto che è il consumo di un determinato bene andando a determinare la durata di quel bene. La più famosa tra le medie di potenze è la media quadratica. Quella quadratica semplice si determina dalla radice quadrata della somma che varia da 1 a n del valore di x^ fratto N. In quella semplice considero le singole modalità. In quella ponderata ho il quadrato della frequenza. Se la potenza è 1 Allora la media aritmetica sarà t uguale a 1. Se T è uguale a - 1 la media di potenze sarà uguale a quella armonica. Se T = 2 Allora la media di Potenza sarà uguale a quella quadratica.

Mq=√∑

La media quadratica la utilizzo quando considero l'usura di alcuni beni e la percorrenza. In una distribuzione X1,Xn i valori delle medie considerati portano come primo valore della media quello dell'armonica che risulta minore uguale a quello della geometrica che è minore uguale della media aritmetica che è minore uguale di quello quadratica. Il caso di eguaglianza si verifica nell'ipotesi in cui tutti i valori della distribuzione risultano essere tutti uguali tra loro. Le medie atipiche o lasche. Il valore centrale si esprime con Xi+Xi+ 1 2 ed è la semisomma dei valori dell'intervallo. La mediana esprime il valore che sta al centro della distribuzione dei valori dati. Le mediane lasche sono tutte quelle medie che si basano solo su alcuni valori della distribuzione, mettendo in prevalenza l'ordine che gli elementi rilevanti presentano rispetto ad altri aspetti della distribuzione data. Il valore centrale esprime il centro del campo di variazione della variabile statistica osservata. È il valore centrale che divide in due parti eguali l'intervallo dei valori dati. La mediana è influenzata dall'inclusione o meno dell'intervallo considerato di quelli che possono essere valori eccezionalmente alti eccezionalmente bassi ovvero i valori non omogenei. La mediana è quel valore che bipartisce la graduatoria dei valori osservati in due parti perfettamente uguali. Nella prima ipotesi il numero dei termini della distribuzione e dispari mentre nella seconda ipotesi il numero dei termini della distribuzione è pari. Nel primo caso la mediana coincide con il valore che occupa la posizione centrale. La indichiamo con ME=X ( Ni+ 1 2 ) se è dispari. Nel secondo caso il valore della mediana è uguale alla media aritmetica dei due termini della distribuzione che occupano la posizione centrale. ME=𝑥( 𝑁 2 )^ +^ 𝑥( 𝑁 2 +^1 )^.^ La somma corrisponderà al valore della mediana. Variabile divisa in intervalli

ME= 𝑥𝑖 +

𝑋𝑖+ 1 −𝑋𝑖 𝑛𝑖

𝑁 2

La moda è quel valore che si presenta con la massima frequenza. Viene utilizzata per studiare l'antropologia o studi di natura naturale sia per la facilità di calcolo che per la sua semplicità. In una distribuzione se abbiamo una curva in quel punto, la curva avrà il punto più alto. Se sono valori discreti parleremo di valore modale. Se la distribuzione riporta classi di valori, parleremo di classe modale che riporta la frequenza massima. Nella variabile statistica con andamento simmetrico avremo l'andamento sul lato destro che sarà uguale e sovrapposto a quelli sul lato sinistro della curva. Quindi sarà simmetrica o coincidente. Per variabili statistiche simmetriche unimodali μ=Me=Mo. Per variabili statistiche moderatamente asimmetriche, si verifica empiricamente che i valori di μ, Me ed Mo sono approssimativamente legati dalla seguente relazione M0 ≈ μ - 3 (μ - Me) cioè la mediana si trova tra la media aritmetica e la moda, ad un terzo di

distanza dalla prima e a due terzi di distanza dalla seconda. Nelle mediane intermedie vado a calcolarmi il primo quartile ovvero la mediana della prima parte della distribuzione. Il secondo quartile coincide con quello della mediana. Il terzo invece coincide con la parte finale della distribuzione.