






Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
I concetti di caratteri quantitativi, modalità, frequenze e distribuzioni. Esplora la differenza tra caratteri trasferibili e non trasferibili, le modalità quantitative e qualitative, e il processo di misurare e rappresentare questi dati. Inoltre, descrive graficamente le distribuzioni di frequenze e quantità, e introduce concetti come media aritmetica, scostamento semplice e quadratico, e coefficiente di variabilità.
Tipologia: Appunti
1 / 12
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!







Сon il termine statistica si intendono le informazioni espresse numericamente- percentuali, medie, frequenze di accadimento di eventi- riferite a un insieme di entità omogenee da qualche punto di vista, che per ora viene indicato come ‘insieme di riferimento’. Sono statistiche i dati sulla variazione media dei pezzi gli occupati e i disoccupati. La produzione di statistiche e un'attività spesso complessa che segue le regole della disciplina che si chiama Statistica. Ma la produzione delle statistiche è solo la manifestazione più evidente e più immediata dell'applicazione della statistica. Essa non si limita a indicare gli strumenti per misurare l’efficacia del farmaco, ma presiede l'impostazione stessa della ricerca. La Statistica è la disciplina che elabora i principi e le metodologie che presiedono al processo di rilevazione e raccolta dei dati, alla rappresentazione sintetica e alla interpretazione dei dati stessi e, laddove ve ne siano le condizioni, alla generalizzazione delle evidenze osservate.
I numeri assumono la qualità di statistiche, quando sottendono un “insieme di riferimento” i “dati statistici sono numeri di un contesto”. I dati assumono la veste di statistiche, se sono risultato dell'osservazione intenzionale di una molteplicità di casi individuali, finalizzata alla conoscenza e/o alla comprensione del fenomeno oggetto di studio. La molteplicità dei casi individuali va sotto il nome di collettivo statistico. Nelle prove di collaudo di un bilancio di processione, il collettivo statistico è l'insieme delle misure effettuate. Si chiama unità statistica il caso individuale componente del collettivo statistico. Si chiama carattere ogni aspetto elementare, oggetto di rilevazione nelle unità statistiche del collettivo. La rilevazione riguarda sempre una pluralità di caratteri, che possono essere studiati singolarmente o in modo congiunto. Si chiamano modalità del carattere i diversi modi con cui questo si presenta nelle unità statistiche del collettivo. I caratteri sono di 2 tipi, qualitativi e quantitativi. I primi hanno modalità costituite da espressioni verbali, i secondi hanno modalità rappresentate da numeri. le modalità del carattere qualitativo possono essere o non essere ordinabili, sulla base di questa definizione si parla di caratteri rettilinei, sono ordinabili e di carattere sconnesso negli altri casi. Il carattere rettilineo è un “grado”. È sconnesso il carattere “professionale”. I caratteri quantitativi vengono denominati anche variabili, i caratteri quantitativi si dicono discreti se le loro modalità sono quantità distinte preventivamente individuabili ed elencabili. Si dicono continui, quando possono assumere tutti i valori di un certo intervallo di numeri reali, ad esempio la statura dell’individui. i caratteri quantitativi si distinguono in trasferibili e non trasferibili a secondo che abbia o non abbia senso ipotizzare il trasferimento di parte del carattere da unità a un'altra. Concetti importanti: 1.formulazione del problema, eventualmente sotto forma di ipotesi, 2.individuazione dei dati pertinenti, 3.programmazione della rilevazione dei dati, 4.analisi dei dati, 5.interpretazione dei risultati, ossia trasformazione delle evidenze tratte dai dati in risposte alle domande da cui la ricerca ha preso avvio. La statistica nelle scienze empiriche: 1.formulazione del problema, eventualmente sotto forma di ipotesi 2.individuazione dei dati pertinenti
QUALITATIVI modalità costituite da espressioni verbali-RETTILINEI modalità ordinabili=SCONNESSI modalità non ordinabili QUANTITATIVI modalità costituite da numeri-DISCRETI modalità: quantità distinte=CONTINUI possono assumere tutti i valori di un intervallo di numeri reali. *Misurare un carattere qualitativo consiste nell’osservare e registrare le modalità che si presentano nelle singole unità statistiche. *Le modalità possono essere predefinite a priori e inserite come tali nel questionario o nella scheda di rilevazione. *In altri casi le modalità vengono desunte a posteriori dalla descrizione dettagliata che il rilevatore fa dello stato della singola unità relativamente al carattere in questione. (DISCRETI) Conteggio con scala proporzionale. Le modalità del carattere sono espresse da numeri, e consentono di classificare le unità statistiche in gruppi omogenei; di graduare i gruppi secondo il valore; di misurare la differenza tra i gruppi. (CONTINUI) Misurazione con approssimazione. L’ approssimazione è dovuta al troncamento dei numeri: limiti di precisione dello strumento e limiti della capacità di lettura dell’utente. I dati statistici traggono origine da un’attività intenzionale rivolta all’acquisizione di informazioni sul fenomeno o sui fenomeni di interesse. Processi che danno origine ai dati statistici: 1.l’indagine statistica i dati che si vogliono acquisire si riferiscono a un collettivo statistico reale, detto popolazione finita, le cui unità sono entità (persone, imprese, abitazioni ecc.) esistenti, individuabili e osservabili. 2.l’esperimento quando persone, animali o oggetti vengono sottoposti a un “trattamento” per osservare su di essi la risposta, ossia la reazione al trattamento. 3.lo studio di osservazione o sul campo in cui non esiste una popolazione finita da indagare, né vi sono unità statistiche che il ricercatore decide di assegnare ai diversi trattamenti. indagini statistiche su popolazioni finite: CENSURARIE la rilevazione viene effettuata su tutte le unità del collettivo di riferimento CAMPIONARIE la rilevazione viene effettuata su di un sottoinsieme del collettivo di riferimento, detto CAMPIONE. Campionamento casuale o probabilistico Metodologia che fornisce le regole per la formazione del campione assegnando alle unità della popolazione probabilità non nulle di far parte del campione. Vantaggi: -oggettività nella selezione delle unità statistiche -possibilità di utilizzare le apposite tecniche statistiche per il cosiddetto riporto all’universo, ossia per l’estensione all’intera popolazione delle elaborazioni effettuate (secondo certi procedimenti) sui dati osservati nel campione. ALCUNI PIANI DI CAMPIONAMENTO *campionamento casuale semplice, alle unità della popolazione si assegnano uguali probabilità di essere inserite nel campione *campionamento stratificato, in cui si effettua il campionamento casuale semplice su singole sottopopolazioni derivanti dalla suddivisione della popolazione in sottoinsiemi più omogenei *campionamento a due stadi, in cui nel primo stadio viene estratta un’unità composita, costituita da un insieme di unità finali, e nel secondo stadio viene estratto un campione casuale di unità finali. Differenze relative *Se a e b sono i “livelli” di uno stesso fenomeno, espressi nella stessa unità di misura, ma riferiti a situazioni diverse, il confronto tra le quantità a e b può essere effettuato tramite la differenza assoluta = b-a
Lo schema seguente rappresenta le operazioni che è possibile fare con i diversi tipi di carattere introdotti sopra.
Caratteri qualitativi Misurare un carattere qualitativo consiste nell’osservare e registrare le modalità che si presentano nelle singole unità statistiche. Le modalità possono essere predefinite e inserite come tali nel questionario o nella scheda di rivelazione. Si opera in questo modo quando le situazioni individuate dalle varie modalità sono nettamente distinte. Quando questa condizione non sussiste, le modalità vengono desunte a posteriori dalla descrizione dettagliata. Qualche volta è basata sulla risposta è più quesiti. Determinare le modalità di un carattere qualitativo, equivale a costruire una scala di riferimento, la scala nominale che consente soltanto di classificare le unità del collettivo statistico in tanti gruppi distinti. La scala ordinale consente di classificare le unità statistiche in gruppi omogenei. Caratteri discreti La misurazione si risolve in un conteggio. La scala con cui si misura un carattere discreto e la scala Caratteri continui La misurazione di un carattere continuo comporta necessariamente un’approssimazione dovuta al troncamento dei numeri. La prima scelta da compiere e relativa al livello di precisione che si vuole raggiungere. Una volta scelto il livello di precisione, il rilevatore a noterai risultato della misurazione. Statistica descrittiva inferenza statistica i principi e i metodi della statistica descrittiva riguardano: la programmazione delle indagini censuarie, la rilevazione dei dati, la costruzione delle distribuzioni di frequenza o di quantità, la presentazione di queste in forma grafico o tabellare, la elaborazione statistica mirata alla sintesi dei dati. Alcuni calcoli statistici elementari: differenze relative e rapporti statistici È opportuno, introdurre alcune operazioni elementari utili nel proseguo della trattazione. Se a e b sono i livelli di uno stesso fenomeno, il confronto tra le quantità a e b può essere effettuato tramite la differenza assoluta
Dalla differenza assoluta si passa a quella relativa, dividendo per a o per b
Moltiplicando la differenza relativa per 100, si ottiene la differenza percentuale
DISTRIBUZIONE STATISTICHE
Si tratta di una successione di espressioni verbali, a seconda della natura del carattere. Allo stesso modo, è una distribuzione statistica disaggregata la successione dei 315 voti di laurea. Si consideri un collettivo statistico di N unità, dove si sia osservato il carattere X. Si chiama distribuzione statistica disaggregata secondo il carattere X l’insieme delle osservazioni (rappresentate da numeri o da espressioni verbali) relative alle N unità del collettivo. In simboli, la distribuzione disaggregata sarà indicata come x1, x2, …, xN, dove x1 è l’osservazione relativa all’unità identificata dal numero 1, x2 l’osservazione relativa all’unità identificata dal numero 2 e così via. Distribuzioni statistiche disaggregate: *Le unità o le osservazioni della distribuzione disaggregata vengono generalmente classificate e aggregate in gruppi omogenei sulla base di uno o più caratteri.
Le unità o le osservazioni della distribuzione disagiata vengono generalmente classificate e aggregate in gruppi omogenei, sulla base di uno o più caratteri. Si individuino preliminarmente le modalità rispetto a cui effettuare il raggruppamento, qualitativi o quantitativi. La scelta delle modalità è condizionata dal livello di disaggregazione. L'aggregazione comporta sempre una perdita di informazioni. L’operazione di raggruppamento delle unità statistiche viene realizzata mediante la classificazione. Distribuzioni di frequenze:
*frequenze percentuali: si ottengono moltiplicando per 100 le frequenze relative. Consideriamo una distribuzione di frequenze secondo un carattere a modalità ordinabili. *Si chiamano frequenze cumulate le quantità Ni = n1 + n2 + … + ni , i = 1, 2, …, k. Per ogni dato i, Ni rappresenta il numero delle unità del collettivo nelle quali il carattere X assume un valore non superiore a xi
Raggruppamento in classi Quando il carattere è quantitativo e il numero di osservazioni è elevato, la presentazione dei dati richiede necessariamente che le modalità contigue siano aggregate tramite la formazione di classi, cioè di intervalli numerici comprendenti più modalità. Si chiama distribuzione di frequenze un carattere X suddiviso in classi lo schema con cui si associa a ciascuna classe la rispettiva frequenza. Sia (ci – 1, ci) la generica classe di una distribuzione di frequenze con modalità raggruppate in classi. Si
La distribuzione finora considerate scaturiscono dall’esame di una singola colonna della matrice dei dati. La successione delle coppie di modalità dei 2 caratteri, che così si osservano costituisce una distribuzione doppia. In generale, si ha una distribuzione doppia quando si esaminano congiuntamente 2 caratteri nelle unità statistiche del collettivo. Si parlerà di distribuzioni doppie disaggregate e di distribuzione doppia di frequenze: le prime sono la semplice elencazione delle coppie di modalità, le seconde sono il risultato dello spoglio dei dati basato su una preliminare definizione delle modalità. Considerando congiuntamente due colonne della matrice dei dati, l’insieme delle coppie di modalità dei due caratteri che così si osservano costituisce una doppia disaggregata *le distribuzioni doppie di frequenze sono il risultato dello spoglio dei dati basato su una preliminare definizione delle modalità e delle eventuali classi per entrambi i caratteri. In generale si parla di: *distribuzione tripla, se si considerano congiuntamente tre caratteri (tre colonne della matrice dei dati); distribuzione quadrupla, se si considerano congiuntamente quattro caratteri, e così via
L’uso delle frequenze relative (o percentuali) non altera l’immagine della distribuzione fornita dal grafico. Consideriamo il sottoinsieme così definito costituito dalle unità del collettivo in cui il carattere assume un valore minore o uguale a un livello assegnato x. Si chiama funzione di ripartizione, F(x), il rapporto tra la numerosità di Cx e il totale delle unità N. Si tratta della frequenza relativa delle unità del collettivo nelle quali il carattere assume un valore non superiore alla quantità x. Caratteri quantitativi continui divisi in intervalli La rappresentazione grafica più appropriata è l’istogramma che si ottiene ponendo sull’asse delle ascisse gli estremi di classe c0, c1, …, ck e disegnando per ogni classe (ci – 1, ci ), i = 1, 2, …, k, un rettangolo avente per base il segmento dell’asse delle ascisse di estremi ci – 1 e ci e per altezza la densità di frequenza ni /di. SERIE SCONNESSE Le serie sconnesse vengono generalmente rappresentate con grafici di tipo areale, in cui alle modalità del carattere si fanno corrispondere figure geometriche (rettangoli, quadrati, settori circolari ecc.) con aree proporzionali alle grandezze da rappresentare (possono essere frequenze o quantità). Le figure geometriche più spesso utilizzate sono i rettangoli (nastri). Una rappresentazione grafica alternativa, utilizzabile quando il numero delle modalità non è elevato, è il grafico a settori circolari, in cui le frequenze o le quantità associate alle varie modalità del carattere vengono rappresentate con le aree dei settori circolari in cui è suddiviso un cerchio.
1° trim. 2° trim. 3° trim. 4° trim. Per la rappresentazione grafica delle serie storiche riferite a fenomeni di stato, si ricorre, generalmente, ai diagrammi cartesiani. Si pongono sull’asse delle ascisse i tempi e su quello delle ordinate le intensità
associate: i conseguenti punti del piano cartesiano vengono poi uniti con segmenti di retta per facilitare la percezione visiva dell’andamento del fenomeno. Quando la serie storica riguarda un fenomeno di movimento, la rappresentazione grafica più appropriata è quella a nastri. I periodi vengono indicati lungo una linea orizzontale, mentre su un asse verticale viene riportata l’appropriata scala; sulla base di questa, si tracciano dei rettangoli, con la stessa base e altezze pari alle intensità da rappresentare. SERIE TERRITORIALI RIASSUNTO In questo capitolo vengono illustrate le principali tecniche di rappresentazione grafica dei dati statistici, con particolare riferimento alle distribuzioni, di frequenze o di quantità, secondo un solo carattere. Viene, esaminato il caso delle distribuzioni di frequenze secondo un carattere quantitativo. Vengono poi esaminate le rappresentazioni per le distribuzioni il secondo un carattere qualitativo. per le prime i grafici un astio a settori circolari sono quelli più frequentemente usati. Per le seconde, l'alternativa è tra diagrammi cartesiani, e grafici a nastri. Delle serie territoriali, la rappresentazione più indicata è il cosiddetto cartogramma, o il grafico a nastri. MEDIE Questo capitolo è dedicato alle medie, che sono lo strumento con cui si sintetizzano, i dati statistici. La media aritmetica è sicuramente la più conosciuta. L’uso delle medie consente all’individuo di rappresentarsi mentalmente l’ordine di grandezza di un fenomeno. Il termine “comunicare” allude alla funzione di trasmissione dell’informazione da parte dello studioso ai propri lettori o da parte dell’ente di ricerca. La media aritmetica è uno strumento pervasivo nell’ambito della metodologia statistica: è la costante caratteristica principale della statistica descrittiva. *le medie sono lo strumento con cui si sintetizzano i dati statistici. *l’uso della media consente all’individuo di rappresentarsi mentalmente l’“ordine di grandezza” di un fenomeno, di effettuare comparazioni tra le manifestazioni di uno stesso fenomeno in tempi, luoghi o situazioni diverse, di comunicare ad altri tale informazione. *Insieme alle percentuali e ai grafici, la media aritmetica è lo strumento statistico più largamente utilizzato *Quello di media aritmetica è forse un concetto primitivo: un’idea di sintesi probabilmente antica quanto l’uomo *La media aritmetica di una distribuzione statistica disaggregata è la somma dei termini x1, x2, …, xN divisa per N
∑ i = 1 N
La media è uno strumento fondamentale della Statistica: il riassunto dei dati di una distribuzione. Lo scarto della media aritmetica è intesa come differenza tra il singolo termine della distribuzione e la media aritmetica. Scarto della media aritmetica x1-μ, i=1, 2,…, N. La media aritmetica presenta le seguenti proprietà:
Il calcolo della mediana avviene in due fasi:
La moda di una distribuzione di frequenze è la modalità che presenta la frequenza più alta. Quando il carattere è quantitativo e le modalità sono raggruppate in classi, si parla di classe modale con riferimento alla classe avente la densità di frequenza più elevata. VARIABILITA’ Per variabilità si intende l’attitudine dei fenomeni, naturali e sociali, a manifestarsi in modi differenti. Costituisce la ragione stessa dell’esistenza della Statistica. Tutta la metodologia statistica ha a che fare con la variabilità, per “neutralizzarla”, con le medie, che mirano a far emergere “il costante nel variabile”, per “misurarla”, con gli indici di variabilità, oggetto di questo capitolo, per “spiegarla”, con le tecniche della regressione e, in generale, con i metodi dell’inferenza statistica. Fonti di variabilità il fenomeno si manifesta su entità distinte osservazione ripetuta di una stessa grandezza i livelli rilevati sono in genere diversi in relazione a una molteplicità di elementi (l’ora della giornata, l’accuratezza della lettura dello strumento, l’eventuale assunzione di farmaci e così via) i caratteri osservati in unità distinte si manifestano con modalità diverse per una serie di circostanze e di cause Misura della variabilità: scostamento semplice medio Data la distribuzione disaggregata x1, x2, …, xN, si chiama scostamento semplice medio la media aritmetica degli scarti dalla media presi in valore assoluto:
| x 1 − μ |+| x 2 − μ |+^ … +| xN − μ |
∑ i = 1 N | xi − μ | Data la distribuzione disaggregata x1, x2, …, xN, si chiama scostamento quadratico medio o deviazione standard la media quadratica degli scarti |x1 – μ|, |x2 – μ|, …, |xN – μ|:
2
2
2
∑ i = 1 N
2
√
∑ i = 1 N
2
2 ❑ Proprietà degli indici Sμ e σ *Assumono il valore 0 nel caso di assenza di variabilità
2
2
2
2
∑ i = 1 N
La somma dei quadrati degli scarti dalla media (numeratore della varianza) si chiama devianza
2
2
2 =∑ i = 1 N
2 Si può dimostrare che la deviazione standard per una distribuzione di frequenze può essere posta nella forma
√
∑ i = 1 k
2
2 Campo di variazione e differenza interquartile Sia x1, x2, …, xN una distribuzione disaggregata. Sia y1, y2, …, yN la stessa distribuzione con i termini disposti in ordine non decrescente.
Si chiama indice di variabilità percentuale il rapporto, moltiplicato per 100, tra un indice di variabilità assoluto e la media aritmetica. *Particolare rilievo per le applicazioni ha coefficiente di variazione
Indici di forma *Gli indici di forma completano il quadro degli indicatori sintetici delle caratteristiche delle distribuzioni statistiche di caratteri quantitativi: fin qui abbiamo visto le medie e gli indici di variabilità