Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

Riassunto del libro "Statistica per le scienze sociali" Domenica F. Iezzi, Sintesi del corso di Statistica Sociale

Riassunto di alcune parti del libro del corso Metodi per il trattamento dei dati sociali UniBg prof. Paolo Cazzaniga. Cap. 1, 2, 3, 4.3 e 4.6, 7, 8 (non completo).

Cosa imparerai

  • Che cos'è una statistica sociale?
  • Come si utilizza la statistica inferenziale per trarre inferenze sulla popolazione intera?
  • Come si estrae un campione statistico?
  • Come si occupa la statistica di fenomeni sociali?
  • Quali metodi vengono utilizzati per la raccolta di dati in statistica sociale?

Tipologia: Sintesi del corso

2020/2021
In offerta
30 Punti
Discount

Offerta a tempo limitato


Caricato il 28/03/2022

Lepsssss
Lepsssss 🇮🇹

4.4

(56)

31 documenti

1 / 45

Discount

In offerta

Documenti correlati


Anteprima parziale del testo

Scarica Riassunto del libro "Statistica per le scienze sociali" Domenica F. Iezzi e più Sintesi del corso in PDF di Statistica Sociale solo su Docsity! Statistica per le scienze sociali. Dalla progettazione dell’indagine all’analisi dei dati Domenica Fioredistella Iezzi 1. Statistica sociale. L’arte di apprendere 1.1. Terminologia statistica e concetti introduttivi Statistica sociale è impiegata quale sinonimo di metodologie per la raccolta e l’analisi dei dati riguardanti fenomeni sociali. La statistica è un insieme di metodologie per la raccolta e l’analisi dei dati, il cui utilizzo consente di descrivere, valutare e prevedere fenomeni sociali. - Progetta  pianifica la raccolta dei dati necessari per le ricerche - Analizza  illustra, attraverso sintesi, un insieme di fenomeni collettivi - Prevede  dall’osservazione e analisi un campione statistico riesce a formulare previsioni Si occupa di fenomeni sociali, ovvero utilizza metodi statistici per descrivere e interpretare avvenimenti che traggono origine dall’organismo sociale, cioè avvenimenti e azioni che influiscono sulla collettività (mortalità, immigrazione, turismo) - Coinvolge una molteplicità di soggetti - Ha ripercussioni sull’intera collettività - È di tipo statistico, in quanto analizza i fatti in termini quantitativi Un fenomeno statistico è tutto ciò che può essere direttamente o indirettamente osservato e riguarda una molteplicità di unità statistiche. Es. se voglio conoscere le caratteristiche degli studenti di questo corso dovrò indicare i singoli individui che la compongono e rilevare in maniere puntuale ciò che ci interessa studiare. - Collettivo = tutti gli studenti del corso. L’insieme di tutte le unità statistiche sulle quali si può rilevare il carattere o i caratteri oggetti di studio.  Fenomeni collettivi semplici = quelli completamente descritti da un unico carattere (es. fenomeno statura degli individui è completamente descritto dal carattere che misura la distanza verticale tra il piano d’appoggio dei piedi e il sommo del cranio, quando l’individuo si trova in massima estensione)  Fenomeni collettivi complessi o multivariati = quelli descritti da molti caratteri. (es. consumo non alimentare delle famiglie. Dato che è caratterizzato da molte variabili: vestiario, calzature, servizi sanitari, elettricità, mobili ecc.) - Unità statistica = ogni individuo, oggetto, animale su cui si osservano i caratteri oggetto di studio - Variabili statistiche o caratteri = ciò che voglio conoscere, le caratteristiche che mi permettono di analizzare e descrivere un fenomeno. Es. classe composta da 10 studenti. Il nostro obiettivo è di descrivere le caratteristiche anagrafiche, antropometriche e il livello di istruzione, quindi rileviamo: sesso, età, peso, altezza scuola media superiore di provenienza e regione di residenza. Ogni riga della tabella corrisponde ad un individuo (numero matricola) ogni colonna individua un carattere oggetto di studio. Il collettivo è composto da 10 studenti, ciascuno studente rappresenta un’unità statistica. Una modalità è una manifestazione empirica di un’unità statistica su un carattere (caratteristiche) 1.2. La classificazione dei caratteri statistici Un carattere può assumere differenti modalità in corrispondenza delle diverse unità del collettivo. Modalità devono avere due requisiti: 1. Essere esaustive  in grado di interpretare qualunque manifestazione del carattere (importanza della modalità “altro”). 2. Essere mutuamente esclusive  ogni elemento della popolazione deve possedere solo una modalità del carattere Le modalità del carattere divise in due grandi gruppi: a) Caratteri qualitativi (o mutabili)  modalità di tipo verbale (es. aggettivi)  Sconnessi o nominali: se non è possibile stabilire un ordinamento (es. carattere sesso)  Ordinali: se e possibile stabilire un ordinamento naturale (es. giudizi di un servizio. Insufficiente < sufficiente < buono < distinto < ottimo)  Rettilinei = - macrodati  tutti i dati che sono il risultato di calcoli (somma, differenza, rapporto ecc.) effettuati sui microdati, secondo criteri definiti - metadati  costituiti da tutte le informazioni di carattere qualitativo e quantitativo riguardanti le modalità di produzione dei microdati e dei macrodati 2. le fonti statistiche ufficiali, nazionali e internazionali 2.1. introduzione Il ricercatore che voglia esprimere un giudizio quantitativo su un fenomeno sociale si troverà di fronte alla necessità di acquisire informazioni trattabili dal punto di vista statistico. Le situazioni possono essere di due tipi: 1) i dati statistici sono già disponibili 2) i dati occorrenti non sono disponibili Nel primo caso attingerà da fonti statistiche, che mettono a disposizione dati elaborati e da elaborare. Nel secondo caso dovrà avviare un’indagine ad hoc per la rilevazione delle informazioni da utilizzare. In ambe due le ipotesi il ricercatore dovrà raccogliere, organizzare e utilizzare tutte le possibili informazioni esistenti relative al fenomeno oggetto di studio. Ricerca anche chiamata ricerca a tavolino (desk research) e si contrappone alla ricerca sul campo (field research).  Dati primari: dati non disponibili presso una fonte statistica; devono quindi essere raccolti tramite una rilevazione chiamata ricerca sul campo  Dati secondari: dati già disponibili presso una fonte statistica; la ricerca di questo tipo di dati viene definita ricerca a tavolino È fonte statistica: - ente o istituto che fornisce informazioni “statistiche”, ovvero dati che possono essere contabilizzati, rispondendo all’esigenza di quantificare un fenomeno oggetto di studio. - rileva, elabora e diffonde informazioni quantitative su fenomeni collettivi. La funzione della fonte statistica è quella di rilevare, elaborare e diffondere informazioni quantitative su fenomeni sociali. è possibile classificarle in base a: 1. natura dell’ente  istituzionali (ISTAT che è una fonte ufficiale)  pubbliche o concessionarie di servizi pubblici (ACI, INPS, CONI)  private (IPSOS che è una fonte parallela) 2. scopo di rilevazione  rilevazioni amministrative (registro della popolazione, PRA)  censimenti (riguardanti l’intera popolazione)  indagini campionarie (riguardanti parte della popolazione) 3. territorialità  internazionali (Eurostat)  nazionali  locali 2.2. il sistema statistico nazionale (SISTAN) il sistema statistico nazionale è stato istituito dal D. lgs del 1989 n. 322, emanato in attuazione della delega contenuta nell’articolo 24 della legge 23 agosto 1988. «Il Sistema statistico nazionale (Sistan) è la rete di soggetti pubblici e privati che fornisce al Paese e agli organismi internazionali l’informazione statistica ufficiale.» Il Sistan comprende: - l’Istituto nazionale di statistica (Istat) - gli enti e organismi pubblici d’informazione statistica (Inea, Isfol) - gli uffici di statistica delle amministrazioni dello Stato e di altri enti pubblici, degli Uffici territoriali del Governo, delle Regioni e Province autonome, delle Province, delle Camere di commercio e dei Comuni - gli uffici di statistica di altre istituzioni pubbliche e private che svolgono funzioni di interesse pubblico. Il Sistan è il garante dell’omogeneità e della correttezza dei metodi statistici utilizzati. Fornisce al paese e agli organismi internazionali un’informazione statistica ufficiale che soddisfi i principi di qualità del dato statistico. Il governo del SISTAN è affidato all’ISTAT che si avvale del comitato di indirizzo e coordinamento dell’informazione statistica (COMSTAT)  si tratta di un organo collegiale, presieduto dal presidente dell’ISTAT e costituito dagli esponenti delle amministrazioni e degli enti che compongono il sistema, dal direttore generale dell’ISTAT e da due in materie statistiche, economiche e affini. Il COMSTAT emana direttive e atti di indirizzo nei confronti degli uffici di statistica del SISTANT e delibera su proposta del presidente dell’ISTAT il programma statistico nazionale (PSN). La Commissione (indipendente e autonoma) per la garanzia dell’informazione statistica vigila sul Sistan: - imparzialità e completezza dell’informazione statistica - qualità delle metodologie - conformità delle rilevazioni alle direttive internazionali e comunitarie 2.3. l’istituto nazionale di statistica l’ente fulcro dell’SISTAN è l’ISTAT  ente di ricerca pubblico presente in Italia dal 1926 è il principale produttore di statistica ufficiale a supporto dei cittadini e dei decisori pubblici. Sede centrale a Roma. Gli organi dell’istituto sono: il presidente, il consiglio, il comitato di indirizzo e coordinamento dell’informazione statistica (COMSTAT) e il Collegio dei revisori dei conti. - predispone il Programma Statistico Nazionale (PSN) - esegue i censimenti previsti dal PSN - coordina le attività degli enti del Sistan - definisce i metodi di classificazione e rilevazione dei fenomeni statistici - gestisce i rapporti con enti e uffici statistici internazionali Il sito è organizzato in 12 macro-argomenti https://www.istat.it/ : 1. popolazione 2. famiglia e società 3. istruzione e lavoro 4. salute e welfare 5. giustizia e sicurezza 6. prezzi 7. industria e servizi 8. commercio estero 9. conti economici 10. pubblica amministrazione e istituzioni private 11. agricoltura e zootecnia 12. ambiente e territorio La produzione editoriale dell’ISTAT può essere classificata in: - annuari diversi per tema - informazioni (anticipazioni del materiale poi pubblicato negli annuari - argomenti (approfondimenti su temi specifici) - metodi e norme (raccoglie le indicazioni metodologiche e le classificazioni adottate dall’ISTAT nello svolgimento delle indagini) - indicatori statistici - rapporti annuali sulla situazione del paese - comunicati stampa Le statistiche prodotte dall’ISTAT possono essere classificare in: - censimenti  totali, che si riferiscono all’intera popolazione  generali, che esaminano aspetti strutturali che riguardano le unità di «La qualità indica quanto un bene, prodotto o un servizio soddisfi le esigenze dei clienti [...] incluse le specifiche, la consegna, il metodo, il prezzo.» Eurostat ha evidenziato che l’informazione statistica è composta dalle sette dimensioni di seguito elencate: 1. Rilevanza: capacità dell’informazione di soddisfare le esigenze conoscitive 2. Accuratezza: grado di corrispondenza tra la stima e il valore reale 3. Tempestività: intervallo di tempo tra la rilevazione e la pubblicazione dei dati 4. Accessibilità: semplicità di reperibilità e comprensione dei dati 5. Confrontabilità: possibilità di paragonare le statistiche 6. Coerenza: possibilità di combinare inferenze per ottenere induzioni complesse 7. Completezza: capacità di fornire un quadro informativo soddisfacente L’ottava dimensione è la tutela della riservatezza degli intervistati. Seguendo le indicazioni di ISTAT possiamo affermare che: - una fonte statistica è affidabile se rispetta le regole di qualità nel tempo - un dato statistico è attendibile se prodotto da fonti affidabili SIQual: il sistema informativo sulla qualità dei dati di ISTAT che contiene le meta informazioni relative ai processi produttive statistici (rilevazione ed elaborazione). Un’ insieme di strumenti, risorse procedure che consentono la gestione di informazioni. 3. la programmazione di un’indagine statistica 3.1. le tappe di un’indagine campionaria l’indagine statistica (survey) è la rilevazione fatta un su campione, ovvero lo studio non viene esteso a tutta la popolazione di riferimento, ma a una parte della stessa. I principali motivi sono: - costo (vincolo al quale l’indagine soggiace) - tempo (bisogna disporre di dati tempestivi) I censimenti invece richiedono tempi molto lunghi (es. censimento della popolazione italiana ISTAT nel 2001 ha condotto l’ultima rilevazione, risultati parziali sono stati presentati nel 2004). Il suo obiettivo è quello di fotografare la popolazione in un dato momento. Inutile condurre un censimento si viaggi e vacanze degli italiani, con lo scopo di fornire strumenti di policy agli operatori del settore, se i risultati sono fruibili dopo anni. La rilevazione campionaria consente di analizzare le caratteristiche di una popolazione attraverso lo studio di una porzione della popolazione stessa (campione) - la porzione di popolazione presa in esame è detta campione - fornisce risultati attendibili con una minima perdita di precisione - utilizza dei protocolli:  insieme di regole, linee guida e procedure regolate e riconosciute pubblicamente Un’indagine campionaria si compone di quattro fasi fondamentali: 1. Definizione degli obiettivi della ricerca  individuare la popolazione di riferimento e delimitare il campo di azione della stessa 2. Rilevazione dei dati 3. Elaborazione (statistica) dei dati 4. Interpretazione dei risultati La definizione degli obiettivi della ricerca prevede l’identificazione della popolazione di riferimento, dove troviamo: - popolazione teorica: insieme di tutti i casi che costituiscono la popolazione oggetto di indagine - popolazione accessibile: insieme di tutti i casi appartenenti alla popolazione teorica che sono effettivamente raggiungibili La popolazione teorica non è sempre accessibile nell’indagine campionaria per i seguenti problemi: - limitate risorse economiche - la popolazione non è fisicamente raggiungibile - l’intera popolazione non è del tutto nota - Per questi motivi si passa al campionamento Il campionamento è costituito da un insieme di procedure standardizzate di selezione delle unità statistiche. Dopo aver definito la popolazione, bisogna determinare il piano di campionamento, ossia una lista o insieme di direttive, per identificare gli elementi della popolazione obiettivo. Ci imbattiamo spesso in risultati di sondaggi di diversa natura. C’è differenza tra sondaggi VS indagini statistiche? Il sondaggio è lo strumento per acquisire conoscenza statistica su un fenomeno. L’indagine statistica ha l’obiettivo di produrre statistiche  descrizioni riassuntive di carattere quantitativo, riguardanti la popolazione di interesse. I risultati di indagini campionarie sono strumenti largamente usati dai mezzi di comunicazione di massa. quali sono le caratteristiche che contraddistinguono un buon sondaggio da uno meno buono? Per determinare la qualità del campionamento devono essere fornite le seguenti informazioni: - soggetto che ha realizzato il sondaggio - criteri per l’individuazione del campione - metodo di raccolta e elaborazione dei dati - numero delle persone interpellate e universo (popolazione) di riferimento - domande rivolte - percentuale di persone che hanno risposo a ciascuna domanda - date in cui è stato realizzato il sondaggio 3.2. tipologie di indagini nella fase della progettazione il ricercatore deve valutare qual è il tipo di indagine più idonea allo scopo della ricerca. Le indagini si possono distinguere in: - trasversali  raccolta di informazioni in un particolare momento per stimare le caratteristiche della popolazione (es. il censimento della popolazione) - longitudinali  misura l’evoluzione nel tempo delle caratteristiche di interesse sullo stesso insieme di unità statistiche (ripetute più volte). I dati longitudinali sono essenziali per:  descrivere e analizzare in modo adeguato i processi di mobilità /inerzia  controllare l’eterogeneità non osservata  conducono analisi su comportamento individuale  i dati longitudinali sono osservazioni ripetute nel tempo sugli stessi soggetti Per le indagini sociali si utilizza il termine panel, ovvero un campione permanente o continuo (fisso o ruotato) costituiti dalla medesima unità, in successivi periodi di tempo. 3.4.2. Il campionamento stratificato La popolazione viene suddivisa in sotto-popolazioni dette strati, sulla base di alcune variabili ritenute rilevanti per il fenomeno oggetto di studio. La scelta degli strati viene fatta per ottenere una variabilità costante all’interno degli stessi e per massimizzare la variabilità tra strati. Il campione si forma estraendo a caso un certo numero di unità da ogni strato. Vengono estratte casualmente le unità all’interno di ogni strato: - con frazione di campionamento costante (utile quando c’è bassa variabilità negli strati) - con frazione di campionamento variabile (è necessario estrarre più unità dagli strati meno omogenei) 3.4.3. il campione sistematico Qui si estrae a sorte solo la prima unità (probabilità 1/N) da intervistare e poi, dopo aver fissato la numerosità campionaria n, si intervista un individuo ogni intervallo K (K= N/n). si utilizza quando le unità che compongono l’universo sono numerabili progressivamente e si possono estrarre delle unità di campionamento distanziate da un intervallo costante (es. indagine sugli hotel di Roma, sappiamo che la popolazione di riferimento è composta da 140 hotel e il campione deve essere pari a 20. Il passo di campionamento sarà pari a K = N/n = 140/20 = 7. Quindi selezionato il primo hotel da aver entrare nel campione, gli altri 19 saranno selezionati dalla lista, con un passo pari a 7. 3.4.4. Il campionamento a grappoli e a stadi - sfrutta l’esistenza di raggruppamenti “naturali” nella popolazione - si estrae un campione casuale di grappoli - viene effettuato quando non è disponibile una lista degli elementi della popolazione (che viene quindi suddivisa in unità areali) - viene effettuato per convenienza amministrativa e organizzativa - nella selezione a stadi viene estratto casualmente un campione a partire dai grappoli 3.5. il campionamento non probabilistico il criterio di selezione avviene secondo particolari esigenze conoscitive, criteri soggettivi o caratteristiche peculiari. 3.5.1. Campionamento accidentale - utilizza un “campione di convenienza” - è il metodo meno attendibile - vantaggi sono il risparmio di tempo e denaro 3.5.2. campionamento per quote - molto simile al campionamento casuale stratificato proporzionale - l’intervistatore sceglie le persone da intervistare - devono essere rispettate le quote prestabilite nella scelta delle unità - permette di ridurre tempi e costi - c’è il rischio di ottenere un campione distorto 3.5.3. campionamento a valanga - utilizzato per reperire informazioni su fenomeni rari - vengono scelte alcune unità con determinate caratteristiche - grazie alle unità scelte vengono identificate nuove unità con le stesse - caratteristiche (effetto valanga) 3.5.4. il campionamento tramite testimoni privilegiati - le unità scelte sono a conoscenza di informazioni e notizie su specifici argomenti - metodo Delphi:  le unità esprimono il loro parere (accordo/disaccordo) rispetto a delle affermazioni  in questo modo gli esperti possono confrontare le loro opinioni con quelle del gruppo - attiva meccanismi di autocorrezione se l’indagine viene ripetuta più volte - il problema principale riguarda la scelta delle unità da inserire nel - campione (spesso soggettiva) 3.6. alcuni problemi di campionamento nella ricerca sociale l’errore campionario è connesso al processo di stima statistica dei parametri della popolazione dai risultati ottenuti da un campione probabilistico della popolazione - riguarda solo i metodi di campionamento probabilistici - deriva dalla scelta del campione della popolazione - può essere stimato l’errore non campionario è connesso all’oggetto, alla definizione del modello concettuale, al contesto e alle modalità organizzative. Tende a essere maggiore quanto più grande e complessa è l’indagine - legato alle fasi di progettazione, esecuzione ed elaborazione di un’indagine - ha un impatto maggiore rispetto all’errore campionario - necessità metodi ad hoc per essere stimato Rombo = identifica una relazione tra le due entità o la relazione tra due collettivi. Es. la relazione o livello di associazione, in un collettivo di studenti, può essere rappresentato dall’appartenenza ad un determinato corso di laurea Un piccolo cerchio all’estremità di un segmento individua i caratteri o gli attributi che si intendono rilevare su di un collettivo. Esagono = oppure una barra verticale dalla quale partono delle frecce direzionali, rappresenta la gerarchia di generalizzazione o partizione del collettivo in sottocollettivi, che esprime la partizione tra entità padre o collettivo e alcune entità figlie. Es. partizione del collettivo in sottocollettivi è la classificazione del regno animale. Scopo è quello di porre in maniera ordinata i viventi in modo che tutti gli esseri che compongono il regno animale si possano comprendere l’uno con l’altro. 4.3.1. Le strategie top-down e bottom-up Nella definizione di uno schema concettuale, si possono adottare due tipi di strategie: - Top-down, si producono descrizione del fenomeno da analizzare man mano più ricche di particolari. - Bottom-up, si elaborano uno o più schemi particolareggiati relativi ad alcuni aspetti del fenomeno in esame, si definiscono schemi più generali nei quali sono riassunti i principali collettivi e le relazioni connesse con il fenomeno in esame La decisione di utilizzare una strategia piuttosto che un’altra dipende dal numero di informazioni che il team di ricerca dispone sul fenomeno oggetto di studio. Top-down, quando le informazioni a disposizione sono carenti, per questo si indentificano dapprima gli aspetti fondamentali della ricerca e poi si approfondiscono. Bottom-up quando il team di ricerca è in grado di rappresentare in maniera specifica la realtà oggetto di studio. 4.6. la verifica del questionario La verifica del questionario prevede una serie di controlli “sul campo”, che serve a stabilire se il questionario è stato strutturato correttamente. si hanno tre tipi di controllo: 1. Pre-test, si sottopone a verifica sul campo la stesura provvisoria del questionario, sotto ministrandolo a un piccolo campione di individui. Questo lo si fa per vedere se vi sono dei problemi nella compilazione del questionario. Da verificare se: il questionario è completo di informazioni necessarie per l’indagine e qual è il livello di chiarezza 2. Test di alternative, non sempre eseguita per ragioni di tempo e spese. Si tratta di preparare coppie di versione del questionario, che differiscono per un singolo aspetto, ad es. una domanda, e sotto ministrarle a coppie di campioni simili. 3. Indagine pilota, riproduce fedelmente tutte le fasi dell’indagine vera e propria. Si intende verificare definitivamente il questionario, non solo per la struttura ma anche in merito alle modifiche effettuate. 4.6.1. il diagramma di flusso O flow-chart è una rappresentazione grafica che descrive le operazioni eseguite da un programma di computer. Possono essere utilizzati: - Per organizzare aree omogenee del questionario indicando le selezioni che si succedono logicamente tra di loro - per collocare le domande nella giusta successione - per individuare e distinguere le domande filtro La frequenza assoluta non permette di fare comparazioni fra collettivi distinti; per fare ciò è opportuno calcolare la frequenza relativa Fj. Esempio tre classi di una scuola esaminiamo la distribuzione del carattere “sesso”. La tabella riporta la distribuzione di frequenza assoluta di tre classi, ovvero il numero di maschi e di femmine di ciascuna classe. In tutte e tre le classi sono presenti 15 maschi, ma la numerosità delle classi è differente (na=30, nb=50, nc=35). Per comparare la composizione delle tre classi, è utile calcolare il peso relativo di ciascuna modalità all’interno di ogni classe, ossia rapportare ciascuna frequenza assoluta alla numerosità di ogni collettivo esaminato: 7.2.1 la scelta arbitraria delle classi il criterio della scelta arbitraria prevede che il carattere quantitativo da raggruppare in classi sia partizionato in base a informazioni esterne di cui il ricercatore dispone. Ad esempio, ISTAT ha definito le seguenti classi per le fasce d’età: - 11-15: al di sotto dell’età legale - 16-17: minorenni - 18-24: giovani - 25-44: giovani adulti - -45-64: adulti - 65-74: giovani anziani - >74: anziani Importante specificare in una nota o legenda il criterio scelto per costruire le classi. 7.2.2. la costruzione di classi di pari ampiezza Per la costruzione delle classi di pari ampiezza di un carattere si procede come segue: - ordinare le modalità (ordinamento crescente, ad esempio in base al carattere “reddito”) - individuare gli estremi inferiore xmin e superiore xmax. - calcolare la differenza d tra estremo superiore e inferiore - scegliere il numero di classi k, in cui dividere il collettivo oggetto di studio - calcolare l’ampiezza della classe a: 7.3. la frequenza cumulata di una distribuzione - Si applica ai caratteri qualitativi ordinabili o ai caratteri quantitativi - Permette di calcolare la percentuale di unità statistiche al di sotto di una certa soglia 1. Il fenomeno oggetto di studio 2. Il livello di misura associato alla variabile esaminata (nominale, ordinale, cardinale) 3. La tipologia della distribuzione di frequenza (unitaria, non unitaria, in classi) Le regole per costruire un buon grafico sono: a) Chiarezza: il grafico prodotto deve permettere di leggere immediatamente tutte le informazioni necessarie alla comprensione dei dati in essa rappresentati b) Accuratezza: il grafico deve riportare l’unità di misura del carattere rappresentato c) Proporzionalità: il grafico deve dare indicazioni riguardo alle dimensioni reali del fenomeno studiato. Bisogna inoltre corredare sempre il grafico di: - Intestazione (titolo) che deve indicare con chiarezza la popolazione, le variabili l’oggetto, il luogo, l’epoca cui i dati si riferiscono - Carattere/i con le rispettive modalità di funzione delle quali sono classificate le unità statistiche. Legenda con i simboli utilizzati - Unità di misura impiegata per graduare l’asse (o gli assi) della rappresentazione dei dati - Fonte di provenienza dei dati 7.5.2. Rappresentazione grafiche per dati qualitativi Le serie sconnesse sono associate a variabili qualitative nominali e rappresentate, generalmente, da grafici di tipo areale. Le modalità del carattere si fanno corrispondere a figure geometriche, rettangolari o settori circolari, con aree proporzionali alla grandezza da rappresentare. I grafici più utilizzati sono: - Grafici a barre (orizzontali o verticali) - Diagrammi circolari (o grafici a torta) - Diagrammi in coordinate polari - Cartogrammi - Mappe sociali Grafici a barre (verticali o orizzontali)  ogni modalità viene rappresentata da una barra orizzontale o verticale, la cui larghezza misura la frequenza (assoluta o percentuale) con cui si presenta. Le barre possono essere: - Orizzontali o nastri - Verticali Diagrammi circolari (o grafici a torta)  forma a cerchio e possono essere: - settori variabili, comunemente chiamati grafici a torta, spicchi del cerchio proporzionati alle modalità da rappresentare - settori uguali, gli spicchi del cerchio sono uguali alle modalità da rappresentare Diagrammi in coordinate polari  distribuzione statistiche di fenomeni ciclici. Grafico meno utilizzato rispetto agli altri grafici, ma molto utile quando il carattere che si deve rappresentare è una variabile sconnessa di tipo ciclico. Si costruisce dividendo l’angolo di 360° con tanti raggi quante sono le modalità e attribuendo una stessa ampiezza a tutti gli angoli, per cui su ogni raggio si calcola un segmento di lunghezza proporzionale alla corrispondente frequenza, si unisce in fine con una spezzata l’estremità dei segmenti. f (X1, X2, …, Xn) = f (M, M, …, M) La M rappresenta il valore che, sostituito ai singoli valori della distribuzione, mantiene inalterato il totale. La funzione f è un operatore che consente di trasformare i dati in un’opportuna misura di sintesi. - Una media è un qualunque valore reale M compreso fra la più piccola e la più grande delle quantità considerate nella distribuzione (proprietà dell’internalità) 8.2. Medie analitiche Per il calcolo delle medie analitiche si effettuano una serie di operazioni algebriche. Le medie analitiche più comunemente utilizzate: - Media aritmetica - Media geometrica - Media armonica 8.2.1. La media aritmetica La media aritmetica x¯ di un insieme di n valori X 1, X 2, …, X n di un carattere quantitativo X è pari alla somma:
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved