Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Orale statistica Leogrande A-K, Appunti di Statistica

Preparazione per l’orale di statistica

Tipologia: Appunti

2022/2023

Caricato il 21/05/2023

anna_faticoso
anna_faticoso 🇮🇹

5

(1)

2 documenti

1 / 4

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Statistica
La Statistica è un insieme di metodi e di tecniche per la conoscenza quantitativa, l’analisi e la comprensione di uno o più fenomeni, singolarmente o congiuntamente considerati, che si presentano nella realtà con un insieme di diverse manifestazioni, osservabili totalmente o parzialmente.
La conoscenza quantitativa avviene attraverso la realizzazione del processo logico di
Osservazione -> analisi -> comprensione
Cioè il processo che tutti e tutte compiamo nella nostra quotidianità per prendere decisioni e che realizziamo attraverso un’indagine: l’indagine statistica.
Fasi dell’indagine statistica:
1- Definizione degli obiettivi: gli obiettivi prefissati devono essere esattamente individuati delimitando la ricerca in termini spaziali e temporali.
2- Rilevazione: è la fase dell’analisi statistica che riguarda l’osservazione dei caratteri relativi alle unità statistiche mediante opportune tecniche e strumenti.
3- Elaborazione dei dati
4- Presentazione ed interpretazione dei risultati: rappresentazione dei dati attraverso tabelle, grafici ed indici e nella spiegazione dei risultati ottenuti dall’intera indagine statistica
Fare un’indagine significa avere un’esigenza di studiare un fenomeno. Noi dobbiamo studiare questo fenomeno prima di prendere una qualsiasi decisione, quindi è necessaria un’organizzazione.
Progetto: indagine su almeno 50 unità statistiche che riguarda un determinato fenomeno.
Rispondenti: coloro che devono fornire i dati.
Dati grezzi -> dati rilevati = informazioni statistiche.
Indagine su campioni: risultati provati -> indagine parziale
Indagine su popolazione: risultati grezzi -> indagine totale
Popolazione: insieme di oggetti -> oggetto da conoscere
Campione: n unità campionarie (casi) selezionate tra le N unità che compongono la popolazione, allo scopo di rappresentarla ai fini dello studio -> strumento della conoscenza
Campionamento: procedura che seguiamo per scegliere le n unità campionarie del complesso delle N unità della popolazione
Due approcci:
- Indagine censuaria, totale o completa: il fenomeno di interesse è rilevato su tutte le unità del collettivo
oVantaggi: non è presente l’errore campionario
oSvantaggi: costosa, lunghi tempi di realizzazione, alta probabilità di errori non campionari
- Indagine parziale o campionaria: il fenomeno di interesse è rilevato su una parte (campione) delle unità del collettivo
oVantaggi: relativamente meno costosa, tempi di realizzazione più brevi, minore probabilità di errori non campionari
oSvantaggi: presenza dell’errore campionario
Statistica Univariata: analisi statistica di una variabile
Statistica Bivariata: analisi statistica di due variabili studiate congiuntamente
Campione non probabilistico: gli oggetti o gli individui sono inclusi senza tenere conto della loro probabilità di appartenere al campione
Campione probabilistico: i soggetti sono scelti sulla base delle probabilità note.
Tecniche di rilevazione:
- Intervista diretta
Interazione diretta tra intervistato e intervistatore
Strumenti di supporto
Tecnologia CAPI (Computer Assisted Personal Interview)
- Auto compilazione del questionario
Prevede che il rispondente compili da solo il questionario con l’aiuto di un libretto di istruzioni
- Intervista telefonica
In genere effettuata con tecnologia CATI (Computer Assisted Telephone Interviewing)
Utilizza l’elenco degli abbonati alla rete telefonica fissa come lista di campionamento
- Indagine web
È necessario che il campione sia probabilistico (casuale)
- Questionario
Tipi di domande
La formulazione delle domande è diversa a seconda del tipo di risposta attesa
- Domanda aperta: non precede modalità di risposta ma lascia il rispondente libero di esprimere il proprio pensiero, nella forma a lui più congeniale.
- Domanda chiusa: l’intervistato deve scegliere una (risposta unica) o più risposte (risposta multipla) tra un numero limitato di possibilità
- Domanda filtro: tipo particolare di domanda chiusa che ha la funzione di convogliare soltanto una parte dei rispondenti verso le domande successive. Viene utilizzata quando le unità di analisi dell’indagine non sono omogenee, per cui determinate informazioni devono (o possono) essere rilevate solo su un sottoinsieme
Unità statistica: elemento di base della popolazione su cui si vuole effettuare la rilevazione. Elemento fondamentale per l’indagine statistica.
Carattere (fenomeni) caratteristica oggetto di studio, cioè l’aspetto che della unità statistica si vuole studiare
Esempio: unità statistica = studenti
Caratteri = età, stautra, n esami superati, sesso, religione ecc
Ciascun carattere si esprime attraverso modalità
Modalità: numero (per i caratteri quantitativi) o l’attributo (per i caratteri qualitativi) che l’unità statistica manifesta
Frequenza: numero di volte che ciascuna modalità si presenta nel collettivo
Caratteri
Quantitativi: si manifestano nella popolazione osservata attraverso numeri, quantità.
DISCRETE: cui corrisponde un numero finito di modalità
CONTINUI: cui corrisponde un numero infinito di modalità
Anche chiamati “variabili”.
Qualitativi: si manifestano nella popolazione osservata attraverso attributi, qualità
ORDINATE: se è individuabile un ordine nelle modalità
SCONNESSE: se non è individuabile un ordine neanche con artifizi
Anche chiamati “mutabili”.
N.B.: alcuni caratteri teoricamente continui possono essere considerati discreti a causa della limitatezza degli strumenti di misura che li rendono di fatto discreti. Esempio: statura
Quei caratteri invece concettualmente discreti, che tuttavia si presentano con modalità molto numerose e vicine fra loro, conviene considerarli continui. Esempio: reddito dei lavoratori
Distribuzioni statistiche disaggregate o serie statistiche
Si consideri un collettivo statistico di N unità, dove si sia osservato il carattere -> X.
Si chiama distribuzione statistica disaggregata secondo il carattere X l’insieme delle osservazioni relative alle N unità del collettivo. Sta ad indicare un numero limitato di osservazioni.
In simboli:
x1, x2, … xN
dove x1 è l’osservazione relativa all’unità identificata dal numero 1, x2 l’osservazione relativa all’unità identificata dal numero 2 e così via.
X = carattere
x = modalità
Distribuzioni di frequenze
Le unità o le osservazioni della distribuzione disaggregata vengono generalmente classificate e aggregate in gruppi omogenei sulla base di uno o più caratteri.
Ad ognuna delle modalità vado ad associare la frequenza.
La scelta della modalità è condizionata dal livello di disaggregazione con cui i dati sono stati rilevati. L’aggregazione, però, comporta sempre una perdita di informazioni.
L’operazione di raggruppamento delle unità statistiche viene realizzata mediante la classificazione o lo spoglio dei dati.
Frequenza (assoluta): numero di volte che una data modalità si presenta nel collettivo statistico.
- Frequenze relative o proporzioni: si ottengono rapportando le frequenze assolute al totale delle unità N.
- Frequenze percentuali: si ottengono moltiplicando per 100 le frequenze relative.
Frequenze cumulate
Ni= n1 + n2 + … + ni , i= 1,2, … , k
Per ogni dato i, Ni rappresenta il numero delle unità del collettivo nelle quali il carattere X assume un valore non superiore a xi. Si sommano le frequenze assolute.
Frequenze relative cumulate
Rapporto tra frequenza cumulata fino a xi e numero totale di osservazioni.
Nella tabella alla voce “frequenza cumulata” troviamo la somma dei numeri alla voce “frequenza” fino a quel momento, mentre alla voce “frequenza relativa cumulata” troviamo i numeri dati dal rapporto tra i numeri e il totale (315)
La frequenza cumulata ha senso solo se il carattere presenta delle modalità che hanno un ordine
Distribuzione di frequenze con modalità raggruppate in classi
Si chiama distribuzione di frequenze di un carattere X suddiviso in classi lo schema con cui si associa a ciascuna classe la rispettiva frequenza.
Ampiezza della classe: differenza tra l’estremo sup e l’estremo inf di quella classe.
Valore centrale della classe: semisomma (somma diviso 2)
Densità di frequenza
Sia (ci-1, ci) la generica classe di una distribuzione di frequenze con modalità raggruppate in classi. Si ha facendo il rapporto tra la frequenza della classe e l’ampiezza di quella classe.
Distribuzioni doppie
Considerando congiuntamente due colonne della matrice dei dati, l’insieme delle coppie di modalità dei due caratteri che così si osservano costituisce una distribuzione doppia disaggregata.
Le distribuzioni doppie di frequenze sono il risultato dello spoglio dei dati basato su una preliminare definizione delle modalità e delle eventuali classi per entrambi i caratteri.
Distribuzioni multiple
In generale si parla di distribuzione tripla se si considerano congiuntamente 3 caratteri; distribuzione quadrupla se si considerano congiuntamente 4 caratteri e così via
Anche in questo caso, le distribuzioni si distinguono in disaggregate e di frequenza, a seconda che i dati si considerino allo stato grezzo o che sia proceduto allo spoglio
Distribuzione di quantità
Si chiama distribuzione di quantità lo schema con cui si associa a ogni modalità del carattere X il totale dello stesso o di un altro carattere posseduto dalle unità che presentano quella data modalità di X.
Tabella a doppia entrata: il collettivo che stiamo esaminando è stato preso in considerazione congiuntamente con un altro carattere.
Serie storiche
Si ha una serie storica quando i dati statistici di interesse vengono associati a modalità temporali (anni, trimestri, mesi ecc)
I dati statistici possono riguardare sia i fenomeni di movimento sia i fenomeni di stato.
A seconda della natura del fenomeno considerato, la serie storica si configura come distribuzione di frequenze oppure come distribuzione di quantità.
Serie territoriali
Si ha una serie territoriale quando i dati vengono associati a modalità rappresentate da entità territoriali.
Possono essere interpretate come distribuzioni di frequenze (risultato della classificazione di unità statistiche in base a modalità territoriali) o come distribuzioni di quantità se alle modalità territoriali vengono associati i valori di un carattere trasferibile come il PIL ecc
Tabella a doppia entrata
Due variabili che consideriamo congiuntamente
Le modalità della variabile X sono generalmente chiamate xi, l’ultima modalità della variabile X viene chiamata xs
S= numero delle modalità della variabile x
Le modalità della variabile X vengono generalmente chiamate yh, l’ultima modalità della variabile Y viene chiamata yt.
n12= coordinata della x e della y che somma la frequenza della variabile x e quella della variabile y
N10= somma delle righe, somma di frequenze
Distribuzioni marginali
In una tabella a doppia entrata ci sono 2 distribuzioni marginali, che prende i margini della tabella, dx sx sopra e sotto
Distribuzioni condizionate
Sono distribuzioni semplici di una variabile condizionata alle modalità dell’altra variabile.
Ogni qualvolta abbiamo una tabella doppia con delle variabili quantitative, la tabella prende il nome di “tabella di correlazione”.
Quante distribuzioni condizionate del reddito posso ottenere da questa tabella? Tante quante sono le distribuzioni della Y.
In una distribuzione doppia noi abbiamo tante distribuzioni semplici: ci sono sempre 2 distribuzioni marginali e tante distribuzioni condizionate per quante sono le modalità della X (s) e le modalità della Y (t) s+t
Variabile statistica discreta
Funzione “min” per trovare il valore minimo di una colonna
Funzione “più.se”: se il numero appartiene ad una classe mettilo in quella classe.
Si evidenzia il dato sul quale vogliamo applicare la funzione
Rappresentazioni grafiche
Le rappresentazioni grafiche hanno lo scopo di illustrare le distribuzioni di frequenze o di quantità.
Presentano diversi vantaggi:
- Consentono di visualizzare immediatamente le caratteristiche delle distribuzioni
- Rendono possibile il confronto tra più distribuzioni in spazi ristretti
- Agevolano l’investigazione dei fenomeni, mettendo in rilievo dati anomali, andamenti e relazioni.
- Sono un efficace strumento per la divulgazione dei dati.
Caratteri quantitativi discreti
La rappresentazione grafica più idonea per una distribuzione di frequenze secondo un carattere discreto è quella cartesiana.
Sull’asse delle ascisse vengono poste le modalità x1, x2, …, xk, sull’asse delle ordinate le frequenze corrispondenti n1, n2, … , nk
La rappresentazione grafica va sotto il nome di diagramma ad aste.
Funzione di ripartizione caratteri quantitativi discreti
Consideriamo il sottoinsieme così definito
Cx = u : X (u) x
Costituito dalle unità del collettivo in cui il carattere assume un valore minore o uguale a un livello assegnato x.
Si chiama funzione di ripartizione, F(x), il rapporto tra la numerosità di Cx e il totale delle unità N.
Proprietà della funzione di ripartizione
È definita per qualsiasi valore di x.
Assume valore 0 quando x è minore di x1 (perché nel collettivo non vi sono unità con modalità più piccole di x1)
Assume valore 1 quando x è maggiore o uguale a xk (perché nel collettivo non vi sono unità con modalità maggiori di x maggiori di xk)
È pari a F i-1 quando x i-1 = x < xi
Non è decrescente
pf3
pf4

Anteprima parziale del testo

Scarica Orale statistica Leogrande A-K e più Appunti in PDF di Statistica solo su Docsity!

Statistica La Statistica è un insieme di metodi e di tecniche per la conoscenza quantitativa, l’analisi e la comprensione di uno o più fenomeni, singolarmente o congiuntamente considerati, che si presentano nella realtà con un insieme di diverse manifestazioni, osservabili totalmente o parzialmente. La conoscenza quantitativa avviene attraverso la realizzazione del processo logico di Osservazione -> analisi -> comprensione Cioè il processo che tutti e tutte compiamo nella nostra quotidianità per prendere decisioni e che realizziamo attraverso un’indagine: l’indagine statistica. Fasi dell’indagine statistica: 1- 2- 3- Definizione degli obiettivi: gli obiettivi prefissati devono essere esattamente individuati delimitando la ricerca in termini spaziali e temporali.Rilevazione: è la fase dell’analisi statistica che riguarda l’osservazione dei caratteri relativi alle unità statistiche mediante opportune tecniche e strumenti.Elaborazione dei dati Fare un’indagine significa avere un’esigenza di studiare un fenomeno. Noi dobbiamo studiare questo fenomeno prima di prendere una qualsiasi decisione, quindi è necessaria un’organizzazione.^ 4-^ Presentazione ed interpretazione dei risultati: rappresentazione dei dati attraverso tabelle, grafici ed indici e nella spiegazione dei risultati ottenuti dall’intera indagine statistica Progetto: indagine su almeno 50 unità statistiche che riguarda un determinato fenomeno. Rispondenti: coloro che devono fornire i dati. Dati grezzi -> dati rilevati = informazioni statistiche. Indagine su campioni: risultati provati -> indagine parziale Indagine su popolazione: risultati grezzi -> indagine totale Popolazione: insieme di oggetti -> oggetto da conoscere Campione: n unità campionarie (casi) selezionate tra le N unità che compongono la popolazione, allo scopo di rappresentarla ai fini dello studio -> strumento della conoscenza Campionamento: procedura che seguiamo per scegliere le n unità campionarie del complesso delle N unità della popolazione Due approcci: - Indagine censuaria, totale o completa: il fenomeno di interesse è rilevato su tutte le unità del collettivo

  • Indagine parziale o campionaria: il fenomeno di interesse è rilevato su una parte (campione) delle unità del collettivo^ o^ o^ Vantaggi: non è presente l’errore campionarioSvantaggi: costosa, lunghi tempi di realizzazione, alta probabilità di errori non campionari o o Vantaggi: relativamente meno costosa, tempi di realizzazione più brevi, minore probabilità di errori non campionariSvantaggi: presenza dell’errore campionario Statistica Univariata: analisi statistica di una variabile Statistica Bivariata: analisi statistica di due variabili studiate congiuntamente Campione non probabilistico: gli oggetti o gli individui sono inclusi senza tenere conto della loro probabilità di appartenere al campione Campione probabilistico: i soggetti sono scelti sulla base delle probabilità note. Tecniche di rilevazione: - Intervista diretta Interazione diretta tra intervistato e intervistatore
  • Strumenti di supporto^ Tecnologia CAPI (Computer Assisted Personal Interview)Auto compilazione del questionario
  • Prevede che il rispondente compili da solo il questionario con l’aiuto di un libretto di istruzioniIntervista telefonica In genere effettuata con tecnologia CATI (Computer Assisted Telephone Interviewing)
  • Utilizza l’elenco degli abbonati alla rete telefonica fissa come lista di campionamentoIndagine web È necessario che il campione sia probabilistico (casuale) Tipi di domande^ -^ Questionario La formulazione delle domande è diversa a seconda del tipo di risposta attesa - Domanda aperta: non precede modalità di risposta ma lascia il rispondente libero di esprimere il proprio pensiero, nella forma a lui più congeniale.
  • (^) - Domanda chiusa: l’intervistato deve scegliere una (risposta unica) o più risposte (risposta multipla) tra un numero limitato di possibilitàDomanda filtro: tipo particolare di domanda chiusa che ha la funzione di convogliare soltanto una parte dei rispondenti verso le domande successive. Viene utilizzata quando le unità di analisi dell’indagine non sono omogenee, per cui determinate informazioni devono (o possono) essere rilevate solo su un sottoinsieme Unità statistica Carattere (fenomeni) Esempio: unità statistica = studenti: elemento di base della popolazione su cui si vuole effettuare la rilevazione. Elemento fondamentale per l’indagine statistica. caratteristica oggetto di studio, cioè l’aspetto che della unità statistica si vuole studiare Caratteri = età, stautra, n esami superati, sesso, religione ecc Ciascun carattere si esprime attraverso modalità Modalità Frequenza: numero (per i caratteri quantitativi) o l’attributo (per i caratteri qualitativi) che l’unità statistica manifesta: numero di volte che ciascuna modalità si presenta nel collettivo Caratteri Quantitativi: si manifestano nella popolazione osservata attraverso numeri, quantità.   DISCRETE: cui corrisponde un numero finito di modalitàCONTINUI: cui corrisponde un numero infinito di modalità Anche chiamati “variabili”. Qualitativi: si manifestano nella popolazione osservata attraverso attributi, qualità   ORDINATE: se è individuabile un ordine nelle modalitàSCONNESSE: se non è individuabile un ordine neanche con artifizi Anche chiamati “mutabili”. N.B.: alcuni caratteri teoricamente continui possono essere considerati discreti a causa della limitatezza degli strumenti di misura che li rendono di fatto discreti. Esempio: statura Quei caratteri invece concettualmente discreti, che tuttavia si presentano con modalità molto numerose e vicine fra loro, conviene considerarli continui. Esempio: reddito dei lavoratori Distribuzioni statistiche disaggregate o serie statistiche Si consideri un collettivo statistico di N unità, dove si sia osservato il carattere -> X. Si chiama distribuzione statistica disaggregata secondo il carattere X l’insieme delle osservazioni relative alle N unità del collettivo. Sta ad indicare un numero limitato di osservazioni. In simboli: x1, x2, … xN dove x1 è l’osservazione relativa all’unità identificata dal numero 1, x2 l’osservazione relativa all’unità identificata dal numero 2 e così via. X = carattere x = modalità Distribuzioni di frequenze Le unità o le osservazioni della distribuzione disaggregata vengono generalmente classificate e aggregate in gruppi omogenei sulla base di uno o più caratteri. Ad ognuna delle modalità vado ad associare la frequenza. La scelta della modalità è condizionata dal livello di disaggregazione con cui i dati sono stati rilevati. L’aggregazione, però, comporta sempre una perdita di informazioni. L’operazione di raggruppamento delle unità statistiche viene realizzata mediante la classificazione o lo spoglio dei dati. Frequenza (assoluta): numero di volte che una data modalità si presenta nel collettivo statistico.
  • (^) - Frequenze relative o proporzioni: si ottengono rapportando le frequenze assolute al totale delle unità N.Frequenze percentuali: si ottengono moltiplicando per 100 le frequenze relative. Frequenze cumulate Ni= n1 + n2 + … + ni , i= 1,2, … , k Per ogni dato i, Ni rappresenta il numero delle unità del collettivo nelle quali il carattere X assume un valore non superiore a xi. Si sommano le frequenze assolute. Frequenze relative cumulate Rapporto tra frequenza cumulata fino a xi e numero totale di osservazioni. Nella tabella alla voce “frequenza cumulata” troviamo la somma dei numeri alla voce “frequenza” fino a quel momento, mentre alla voce “frequenza relativa cumulata” troviamo i numeri dati dal rapporto tra i numeri e il totale (315) La frequenza cumulata ha senso solo se il carattere presenta delle modalità che hanno un ordine Distribuzione di frequenze con modalità raggruppate in classi Si chiama distribuzione di frequenze di un carattere X suddiviso in classi lo schema con cui si associa a ciascuna classe la rispettiva frequenza. Ampiezza della classe: differenza tra l’estremo sup e l’estremo inf di quella classe. Valore centrale della classe: semisomma (somma diviso 2) Densità di frequenza Sia (ci-1, ci) la generica classe di una distribuzione di frequenze con modalità raggruppate in classi. Si ha facendo il rapporto tra la frequenza della classe e l’ampiezza di quella classe. Distribuzioni doppie Considerando congiuntamente due colonne della matrice dei dati, l’insieme delle coppie di modalità dei due caratteri che così si osservano costituisce una distribuzione doppia disaggregata. Le distribuzioni doppie di frequenze sono il risultato dello spoglio dei dati basato su una preliminare definizione delle modalità e delle eventuali classi per entrambi i caratteri. Distribuzioni multiple In generale si parla di distribuzione tripla se si considerano congiuntamente 3 caratteri; distribuzione quadrupla se si considerano congiuntamente 4 caratteri e così via Anche in questo caso, le distribuzioni si distinguono in disaggregate e di frequenza, a seconda che i dati si considerino allo stato grezzo o che sia proceduto allo spoglio Distribuzione di quantità Si chiama distribuzione di quantità lo schema con cui si associa a ogni modalità del carattere X il totale dello stesso o di un altro carattere posseduto dalle unità che presentano quella data modalità di X. Tabella a doppia entrata: il collettivo che stiamo esaminando è stato preso in considerazione congiuntamente con un altro carattere. Serie storiche Si ha una serie storica quando i dati statistici di interesse vengono associati a modalità temporali (anni, trimestri, mesi ecc) I dati statistici possono riguardare sia i fenomeni di movimento sia i fenomeni di stato. A seconda della natura del fenomeno considerato, la serie storica si configura come distribuzione di frequenze oppure come distribuzione di quantità. Serie territoriali Si ha una serie territoriale quando i dati vengono associati a modalità rappresentate da entità territoriali. Possono essere interpretate come distribuzioni di frequenze (risultato della classificazione di unità statistiche in base a modalità territoriali) o come distribuzioni di quantità se alle modalità territoriali vengono associati i valori di un carattere trasferibile come il PIL ecc Tabella a doppia entrata Due variabili che consideriamo congiuntamente Le modalità della variabile X sono generalmente chiamate xi, l’ultima modalità della variabile X viene chiamata xs S= numero delle modalità della variabile x Le modalità della variabile X vengono generalmente chiamate yh, l’ultima modalità della variabile Y viene chiamata yt. n12= coordinata della x e della y che somma la frequenza della variabile x e quella della variabile y N10= somma delle righe, somma di frequenze Distribuzioni marginali In una tabella a doppia entrata ci sono 2 distribuzioni marginali, che prende i margini della tabella, dx sx sopra e sotto Distribuzioni condizionate Sono distribuzioni semplici di una variabile condizionata alle modalità dell’altra variabile. Ogni qualvolta abbiamo una tabella doppia con delle variabili quantitative, la tabella prende il nome di “tabella di correlazione”. Quante distribuzioni condizionate del reddito posso ottenere da questa tabella? Tante quante sono le distribuzioni della Y. In una distribuzione doppia noi abbiamo tante distribuzioni semplici: ci sono sempre 2 distribuzioni marginali e tante distribuzioni condizionate per quante sono le modalità della X (s) e le modalità della Y (t) s+t Variabile statistica discreta Funzione “min” per trovare il valore minimo di una colonna Funzione “più.se”: se il numero appartiene ad una classe mettilo in quella classe. Si evidenzia il dato sul quale vogliamo applicare la funzione Rappresentazioni grafiche Le rappresentazioni grafiche hanno lo scopo di illustrare le distribuzioni di frequenze o di quantità. Presentano diversi vantaggi: - Consentono di visualizzare immediatamente le caratteristiche delle distribuzioni
  • (^) - (^) - Rendono possibile il confronto tra più distribuzioni in spazi ristrettiAgevolano l’investigazione dei fenomeni, mettendo in rilievo dati anomali, andamenti e relazioni.Sono un efficace strumento per la divulgazione dei dati. Caratteri quantitativi discreti La rappresentazione grafica più idonea per una distribuzione di frequenze secondo un carattere discreto è quella cartesiana. Sull’asse delle ascisse vengono poste le modalità x1, x2, …, xk, sull’asse delle ordinate le frequenze corrispondenti n1, n2, … , nk La rappresentazione grafica va sotto il nome di diagramma ad aste. Funzione di ripartizione caratteri quantitativi discreti Consideriamo il sottoinsieme così definito Cx = Costituito dalle unità del collettivo in cui il carattere assume un valore minore o uguale a un livello assegnato x. u : X (u)  x  Si chiama funzione di ripartizione, F(x), il rapporto tra la numerosità di Cx e il totale delle unità N. Proprietà della funzione di ripartizione  È definita per qualsiasi valore di x.    Assume valore 0 quando x è minore di x1 (perché nel collettivo non vi sono unità con modalità più piccole di x1)Assume valore 1 quando x è maggiore o uguale a xk (perché nel collettivo non vi sono unità con modalità maggiori di x maggiori di xk)È pari a F i-1 quando x i-1 = x < xi  Non è decrescente

Rappresentazione di una variabile discreta -> grafico ad aste Caratteri quantitativi continui divisi in intervalli La rappresentazione grafica più appropriata è l’istogramma che si ottiene ponendo sull’asse delle ascisse gli estremi di classe c0, c1, …, ck e disegnando per ogni classe (ci – 1, ci). i = 1,2, … , k, un rettangolo avente per base il segmento dell0asse delle ascisse di estremi ci – 1 e ci e per altezza la densità di frequenza Densità di frequenza Uniforme distribuzione delle frequenze all’interno della classe -> in corrispondenza di ciascun valore all’interno della classe ci sia la stessa frequenza Funzione di ripartizione caratteri quantitativi continui Consideriamo il sottoinsieme così definito

Cx = u : X ( u ) ≤ x

Nel caso di un carattere continuo diviso in intervalli, la funzione di ripartizione è la frequenza relativa delle unità del collettivo in cui il carattere X non supera un fissato livello x. Ipotizzando che le unità siano uniformemente distribuite all’interno delle classi la funzione di ripartizione è espressa da:

Fi ( x )= Fi − 1 +

N

× ¿

di

( x − ci − 1 )

Serie sconnesse Le serie sconnesse vengono generalmente rappresentate con grafici di tipo areale, in cui alle modalità del carattere si fanno corrispondere figure geometriche con aree proporzionali alle grandezze da rappresentare (possono essere frequenze o quantità). Le figure geometriche spesso più utilizzate sono i rettangoli. Le medie Medie lasche: indicatori che si calcolano prendendo in considerazione soltanto alcuni valori Medie analitiche: gruppo di medie; si calcolano prendendo in considerazione tutti i dati del carattere che stiamo considerando Medie analitiche - Media aritmetica: rappresenta un indicatore che fornisce un’informazione. Sigma: si usa per indicare la sommatoria Proprietà della media aritmetica o Il prodotto N* dà il totale del carattere nella distribuzione o o o Se a e b sono il min e il max dell’insieme x1, x2, … , xn, la media aritmetica è compresa tra queste due quantità, ossia a <La somma algebrica degli scarti (differenza tra la media aritmetica e ciascun valore) dalla media aritmetica è uguale a 0.La somma degli scarti al quadrato dei valori da una costante c è minima quando c è uguale alla media aritmetica. -> PROPRIETA’ DI MINIMO  < b (internalità) o o Se il singolo termine della distribuzione, xi, viene sottoposto alla trasformazione a + bxi (OMOGENITA’) con a costante qualsiasi e bSe un collettivo statistico di N unità viene suddiviso in L sottoinsiemi disgiunti aventi numerosità e medie, allora la media aritmetica del collettivo può essere così calcolata -> PROPRIETÁ ASSOCIATIVA  0, la nuova media è legata a quella originaria dalla medesima trasformazione (linearità) -> PROPRIETÁ TRASLATIVA

  • (^) - (^) - Media armonica: “somma degli inversi”; distribuzione statistica disaggregata in cui i termini sono tutti diversi da 0, è data dal rapporto tra N e la somma dei reciproci terminiMedia geometrica: distribuzione statistica disaggregata in cui tutti i termini sono maggiori di 0, è data dalla radice N-sima del prodotto dei terminiMedia quadratica: distribuzione statistica disaggregata, è la radice quadrata della media aritmetica dei quadrati dei termini della distribuzione Bisogna verificare che: media armonica < media geometrica media geometrica < media aritmetica media aritmetica < media quadratica Mediana: media che divide la distribuzione in due parti uguali È quel valore che divide in parti uguali la distribuzione, dopo che è stata messa in ordine non decrescente Posto centrale: posto ideale tra il valore centrale e il valore centrale+1 - (^) - Se il numero delle osservazioni è pari c’è solo un posto centraleSe N è dispari non c’è solo un posto centrale, ma due x: valori originari y: valori x ordinati Proprietà della mediana - Se a e b sono il minimo e il massimo dell’insieme dei numeri x1,x2,x3, …, xn, la mediana è compresa tra queste due quantità a  m  b Quartili^ -^ La somma degli scarti in valore assoluto dei valori // // da una costante c, è minima quando c è uguale alla mediana Sia la distribuzione una distribuzione disaggregata. Sia la distribuzione disaggregata disposta in ordine non decrescente.
  • (^) - (^) - Il 1° quartile, q1 è la quantità che non è superata da un quarto dei termini ordinati della distribuzioneIl 2° quartile, q2 è la quantità che non è superata dalla metà dei termini ordinati-> coincide con la medianaIl 3° quartile, q3 è la quantità che non è superata dai tre quarti dei termini ordinati della distribuzione Calcolo quartile quando N è multiplo di quattro Il primo quartile sarà la media aritmetica tra l’ultimo numero della prima sezione e il primo della seconda ecc Definizione operativa Primo quartile

H= N ^1

Secondo quartile

H= N ^2

Terzo quartile

H= N ^3

Decili Medie lasche che dividono la distribuzione in parti uguali Modalità di calcolo: stesso modalità dei quartili con divisione per 10

Dsl: devianza spiegata Drl: devianza residua Correlazione Data una distribuzione doppia in forma disaggregata, si dice che tra le due variabili X e Y vi è correlazione positiva o concordanza (le due variabili variano nello stesso senso) quando esse tendono a crescere/decrescere insieme. Si ha correlazione negativa o discordanza quando al crescere di una variabile l’altra tende a decrescere. Coefficiente di correlazione lineare di Bravais r= codevianza ( Indice che può variare da -1 e +1) / radice quadrata del prodotto delle due devianze

  • (^) - (^) - Pari a 1 quando tutti i punti osservati si trovano su una retta con coefficiente angolare positivoPari a -1 quando tutti i punti osservati si trovano su una retta con coefficiente angolare negativoNon cambia se le modalità della singola variabile vengono moltiplicate per una costante o aumentate/diminuite di una costante positiva Discordanza perfetta: -1 Concordanza perfetta: 1 Concordanza -> i punti si trovano tutti su una retta Parte orale I rapporti statistici Consentono di confrontare intensità o frequenze di due fenomeni Sono quozienti istituibili: - Tra le intensità globali o medie o tra le frequenze di uno stesso collettivo, in tempi, luoghi o circostanze diverse. Particolarmente utili nell’analisi statistica, in quanto eliminano l’effetto dell’unità di misura, dando luogo a numeri puri^ -^ “” di due differenti fenomeni, di cui almeno uno sia un collettivo. Variazioni assolute e relative La differenza tra un fenomeno analizzato alla fine di un periodo e lo stesso fenomeno osservato auhvll’inizio del periodo è denominata variazione assoluta d= xt – xo rapportando la variazione assoluta al fenomeno osservato all’inizio del periodo si ottiene la variazione relativa d= xt – xo / x0 indica un saggio di incremento o decremento Rapporti di composizione I rapporti di composizione si ottengono dividendo l’intensità o la frequenza di un carattere per l’intensità o la frequenza globale (es: frequenze relative) Specificatamente, il rapporto tra frequenza dà origine a frequenze relative. Rapporti di derivazione Si calcolano ragguagliando l’intensità o la frequenza di un fenomeno all’intensità o alla frequenza di un altro fenomeno che ne costituisce il necessario e logico presupposto. Generalmente, al numeratore del rapporto figurano fenomeni di flusso e al denominatore fenomeni di stato. Sono rapporti di derivazione: Nascite/Popolazione *1000 -> quoziente di natalità Morti/Popolazione *1000 -> quoziente di mortalità Matrimoni/Popolazione * 1000 -> quoziente di nuzialità Rapporti di durata Si ottengono dividendo la consistenza media per la media aritmetica dei flussi di entrata e di uscita. Esprimono la durata media di permanenza nel collettivo degli elementi che formano il collettivo stesso

D =^ C

( E + U )/ 2

dove C= ½ (Co + C1) Rapporti di ripetizione Si ottengono dividendo il flusso di rinnovo supponendo uguali i flussi di entrata e di uscita di un dato fenomeno per la sua consistenza media. Esprimono il numero di volte in cui il fenomeno si rinnova nella dimensione temporale stabilita.

R=^ E + U

C

( E + U )/ 2

[ 2 Co +( E − U ) ] / 2

Rapporti di densità Si ottengono dividendo l’intensità o la frequenza complessiva di un dato carattere per una dimensione spaziale o temporale. Rapporti di coesistenza Sono quelli che si istituiscono fra due parti di un tutto. Essi sono in grado di porre in luce di quanto una parte è maggiore o minore dell’altra, a prescindere dalle dimensioni del fenomeno. Ad esempio, il rapporto occupati nell’industria/occupati nel settore terziario * 100 Numeri indici Sono rapporti che permettono di confrontare le intensità o frequenze di un fenomeno in situazioni temporali e/o spaziali differenti. Si costruiscono ponendo al denominatore un’intensità (detta base) della stessa natura del fenomeno che è al numeratore. La differenza rispetto a 100 è l’incremento e il decremento di quel prezzo rispetto al bene preso in considerazione.

  • (^) - N.I. a base fissa: se il periodo di riferimento è costante al variare del tempoN.I. a base variabile: se per ciascuno di essi si fa riferimento al periodo precedente N.I. semplici -> costituiti dal rapporto tra singole grandezze economiche riferite a beni omogenei (permettono di misurare le variazioni del prezzo di una data merce, nel tempo e nello spazio). N.I. complessi -> costituiti dal rapporto tra medie di più grandezze eterogenee. 3 metodi che servono per costruire un numero indice complesso (metodi di totalizzazione):  Rapporto di medie: consiste nel fare la media dei prezzi delle varie merci nei successivi tempi del periodo in esame e nel calcolare poi i numeri indici effettuando il rapporto tra i prezzi medi relativi ai due tempi che si vogliono prendere in considerazione.   Media di rapporti: consiste nel calcolare previa determinazione del tempo base, i rapporti indici per ciascuna delle merci. In questo modo si otterranno per ogni tempo tanti rapporti quante sono le merci. Successivamente si procederà alla costruzione dell’indice mediante calcolo della media di tutti i rapporti.Media di aggregati: consiste nel sommare i prezzi assoluti delle merci per ognuno dei tempi successivi costituenti il periodo in esame. Si calcolerà poi l’indice effettuando il rapporto tra le due somme dei prezzi relativi ai due tempi che si vogliono porre a confronto. N.I. complessi ponderati Molto spesso nella costruzione di numeri indici si utilizzano prezzi e grandezze che fanno riferimento ad unità di misura diverse. La ponderazione die prezzi viene espressa dalle quantità relativa al tempo base qi0 o al tempo finale qit Q= quantità I= indice generico N.I. di Laspeyres: N.I. complesso ponderato che considera i prezzi al tempo finale e al tempo iniziale e le quantità sempre al tempo iniziale Numeratore: moltiplicare i prezzi al t finale per le quantità iniziali Denominatore: prezzi iniziali e moltiplicare per le quantità iniziali Risultato -> i prezzi di questi beni hanno subito un incremento di quel numero in maniera percentuale N.I. di Paasche: N.I. complesso ponderato che considera le quantità al tempo finale sia al num che al denom Numeratore: prezzi finale per quantità finali Denom: prezzi iniziali per quantità finali N.I. di Fischer: radice quadrata del prodotto dei due indici di Laspeyres e di Paasche. È la media di questi due indici.