Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Statistica Generale: Metodi di Analisi e Applicazioni Pratiche, Appunti di Statistica

Media Moda Mediana Devianza Variazione standard

Tipologia: Appunti

2020/2021

Caricato il 23/05/2021

giada-bondioli
giada-bondioli 🇮🇹

4.8

(4)

14 documenti

1 / 81

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
STATISTICA SOCIALE
Con il virus abbiamo scoperto perché la statistica è così importante. I numeri stanno alla base di qualsiasi
decisione.
Questione contagiati malati
Ogni giorno ci sono 30.000 nuovi contagiati, questo numero indica quante persone possono trasmettere il
virus. 30.000 sono i “nuovi” positivi, perché c’è una parte di “ritamponati”. I problemi sono due:
1. Chi fornisce i dati?
2. Come li fornisce?
Perché dopo mesi e mesi, i giornalisti continuano a dire infettati = malati, senza dare dati chiari? È un
problema legato alla sindrome dei numeri della statistica. Ci sono anche giornalisti che si lancino
nell’interpretazione dei numeri, dicendo cose comiche e scaturendo effetti devastanti. Il problema è che non si
sa leggere ciò che dice la statistica.
Indice non è una %, tendenzialmente sono dei rapporti, messi insieme tanti indici costituiscono un indicatore.
Che cos’è la statistica?
La statistica è un insieme di metodi e di tecniche per la conoscenza quantitativa, l’analisi e la comprensione
di uno o più fenomeni, singolarmente o congiuntamente considerati, che si presentano nella realtà con un
insieme di diverse manifestazioni, osservabili totalmente o parzialmente.
Le origini della statistica
L’etimologia della parola “statistica” deriva da un vocabolo “Stato” e fa riferimento al fatto che le prime
informazioni su fenomeni reali sono state raccolte ed organizzate ad opera degli organismi statali che ne erano
anche i principali utilizzatori.
Le tracce più antiche di rivelazioni statistiche ufficiali risalgono ai Sumeri (IV – II millennio AC).
Nell’antico Egitto ci sono testimonianze di una attiva misurazione quantitativa dei fenomeni sociali e
della venerazione di una dea dei libri e dei conti.
Fa parte della Bibbia il “Libro dei Numeri”, dove si parla anche del censimento di Mosé su ordine
divino.
Ci sono prove di rivelazioni statistiche ufficiali nell’antica Cina (2238 AC) e nell’antica Roma.
La statistica inizia a diventare importante con la modernità; la fase metodologica si fa iniziare con A. Quetelet
(1796 – 1874) a cui dobbiamo l’unificazione sotto un’unica visione di diversi ambiti di ricerca riconducibili
alla Statistica (la demografia, la teoria degli errori accidentali e il calcolo delle probabilità). È da questo
momento che la statistica si caratterizza come metodo scientifico.
I metodi e i concetti su cui si fonda il moderno ragionamento statistico appaiono nel XX secolo (con i
contributi classici di Pearson, Fischer, Gosset, Neyman, Gini, Chisini, De Finetti).
Gli italiani sono stati tra i grandi maestri della statistica.
Notazioni di base
I fenomeni di interesse sono detti fenomeni statistici (ad esempio il redito) e vengono indicati con
lettere maiuscole: A, K, X (…).
I supporti fisici o teorici delle diverse manifestazioni di un fenomeno statistico sono detti unità
statistiche (esempio i singoli individui).
Le singole determinazioni del fenomeno sono dette manifestazioni statistiche (esempio il reddito di
Tizio) a,k,x (minuscole).
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d
pf4e
pf4f
pf50
pf51

Anteprima parziale del testo

Scarica Statistica Generale: Metodi di Analisi e Applicazioni Pratiche e più Appunti in PDF di Statistica solo su Docsity!

STATISTICA SOCIALE

Con il virus abbiamo scoperto perché la statistica è così importante. I numeri stanno alla base di qualsiasi decisione. Questione contagiati malati Ogni giorno ci sono 30.000 nuovi contagiati, questo numero indica quante persone possono trasmettere il virus. 30.000 sono i “nuovi” positivi, perché c’è una parte di “ritamponati”. I problemi sono due:

  1. Chi fornisce i dati?
  2. Come li fornisce? Perché dopo mesi e mesi, i giornalisti continuano a dire infettati = malati, senza dare dati chiari? È un problema legato alla sindrome dei numeri della statistica. Ci sono anche giornalisti che si lancino nell’interpretazione dei numeri, dicendo cose comiche e scaturendo effetti devastanti. Il problema è che non si sa leggere ciò che dice la statistica. Indice non è una %, tendenzialmente sono dei rapporti, messi insieme tanti indici costituiscono un indicatore. Che cos’è la statistica? La statistica è un insieme di metodi e di tecniche per la conoscenza quantitativa, l’analisi e la comprensione di uno o più fenomeni, singolarmente o congiuntamente considerati, che si presentano nella realtà con un insieme di diverse manifestazioni, osservabili totalmente o parzialmente. Le origini della statistica L’etimologia della parola “statistica” deriva da un vocabolo “Stato” e fa riferimento al fatto che le prime informazioni su fenomeni reali sono state raccolte ed organizzate ad opera degli organismi statali che ne erano anche i principali utilizzatori.  Le tracce più antiche di rivelazioni statistiche ufficiali risalgono ai Sumeri (IV – II millennio AC).  Nell’antico Egitto ci sono testimonianze di una attiva misurazione quantitativa dei fenomeni sociali e della venerazione di una dea dei libri e dei conti.  Fa parte della Bibbia il “Libro dei Numeri”, dove si parla anche del censimento di Mosé su ordine divino.  Ci sono prove di rivelazioni statistiche ufficiali nell’antica Cina (2238 AC) e nell’antica Roma. La statistica inizia a diventare importante con la modernità; la fase metodologica si fa iniziare con A. Quetelet (1796 – 1874) a cui dobbiamo l’unificazione sotto un’unica visione di diversi ambiti di ricerca riconducibili alla Statistica (la demografia, la teoria degli errori accidentali e il calcolo delle probabilità). È da questo momento che la statistica si caratterizza come metodo scientifico. I metodi e i concetti su cui si fonda il moderno ragionamento statistico appaiono nel XX secolo (con i contributi classici di Pearson, Fischer, Gosset, Neyman, Gini, Chisini, De Finetti). Gli italiani sono stati tra i grandi maestri della statistica. Notazioni di base  I fenomeni di interesse sono detti fenomeni statistici (ad esempio il redito) e vengono indicati con lettere maiuscole: A, K, X (…).  I supporti fisici o teorici delle diverse manifestazioni di un fenomeno statistico sono detti unità statistiche (esempio i singoli individui).  Le singole determinazioni del fenomeno sono dette manifestazioni statistiche (esempio il reddito di Tizio)  a,k,x (minuscole).

(U) L’insieme delle unità statistiche sulla quali interessa studiare il fenomeno è chiamato popolazione statistica o universo di riferimento  U (N) Il numero di unità statistiche che compongono la popolazione statistica di riferimento è chiamato numerosità o dimensione U  N. Esempio: Al 90% della popolazione piace il cioccolato, ma al sondaggio hanno risposto in 80 persone su tot milioni. La numerosità è insufficiente a dire e sostenere qualcosa. Quando do una percentuale, devo sempre dare la numerosità. Posso dire che alle prossime elezioni ci sarà questo risultato, ma devo sempre dire quante persone ho intervistato. Ricerca censuaria (teorica) =/ Ricerca campionaria (la maggior parte). X fenomeno x modalità (categoria o numero ) U insieme N numero Due tipi di statistiche: Descrittiva e Inferenziale La statistica descrittiva Se la rivelazione è esaustiva (censuaria) di U, e si dispone di tutti gli N dati osservati presso tutte le unità statistiche, la statistica ha la funzione di descrivere il comportamento di X su U.

  1. Univariata , ha per oggetto un solo fenomeno singolarmente rilevato e come obiettivo la descrizione del suo comportamento su U.
  2. Bivariata , ha per oggetto una coppia di fenomeni rilevati sulla stessa U e come obiettivo l’individuazione delle (eventuali) relazioni (statistiche) tra i due.
  3. Multivariata , i fenomeni rilevati sulla stessa U sono più di due e l’obiettivo è descriverne il comportamento congiunto e studiarne le relazioni. Statistica inferenziale Se la rivelazione è parziale (campionaria, con n < N), la statistica continua ad avere come obiettivo la descrizione e la comprensione del comportamento di X su U, ma la sua funzione ora è più ardita. Estendere i risultati dell’elaborazione dei dati campionari all’intera U, e quindi anche alla parte non osservata: si tratta di un’induzione dal particolare al generale (inferenza statistica), alla cui base stanno elementi di teoria della probabilità. Possibili domande all’esame : Cosa è un campione? È una porzione di popolazione, un sottoinsieme (n). (n)  rappresenta le 80 persone intervistate per sapere se gli piacesse il cioccolato o no. Come faccio a selezionare queste persone? In base a delle variabili e a delle analisi. Dati e informazioni Conoscenza quantitativa dei fenomeni:  raccolta dei dati  elaborazione  trasformazione dei dati in informazioni Un dato ha un contenuto informativo in quanto viene messo in relazione con altri dati. Un dato isolato non serve a nulla (non ha contenuto informativo); anche se può far da base per la valutazione (trasformazione in informazione) di altri dati, diventa anch’esso oggetto di valutazione nel confronto. La costruzione del dato

L’esito di questo processo è la nascita di un metodo, un percorso in senso etimologico, ch eporta alla conoscenza: il metodo scientifico o sperimentale. Seguendo il metodo scientifico, le scienze possono raggiungere una conoscenza della realtà oggettiva e verificabile. La conoscenza umana dunque può descrivere la realtà in quanto tale e seguire procedure pubbliche, controllabili da chiunque. Sul concetto di scienza Per secoli, questa impostazione ha reso possibile sviluppare un apparato di conoscenze che hanno sostenuto altri grandi cambiamenti, come la Rivoluzione industriale (1750). Gli uomini erano persuasi che la realtà fosse alla loro portato, del tutto conoscibile con la sola ragione. Anche la rivoluzione francese (1789) può essere considerata uno degli esiti di quella scientifica, in quanto evento che metteva al centro della storia umana la Ragione (intesa come una divinità). Per questo, il concetto di scienza coincideva con alcune scienze, quelle che seguono il metodo sperimentale. In questo contesto di grandi scoperte che hanno modificato («progresso») le condizioni di vita e gli strumenti della produzione dei beni, si è consolidata una visione della scienza di tipo «oggettivo». Cioè, il fatto che esiste una realtà esterna all’essere umano (il soggetto) che ha una autonomia sostanziale (l’oggetto). Lo strumento per conoscere la realtà è la ragione (e il suo metodo rigoroso). La questione metodologica Il problema è se sia possibile conoscere l’oggetto con la ragione s soprattutto come sia possibile (il metodo): il dibattito si concentrerà soprattutto sullo statuto del sapere che si costruisce attraverso la ricerca sociale. Il paradigma galileiano (conoscenza oggettiva tipica delle scienze della natura) divenne anche il riferimento delle scienze sociali. In tempi relativamente più recenti, invece, si sono affacciati paradigmi diversi, che sottolineano lo statuto differente dell’oggetto di studio, cioè le relazioni sociali. Che cosa significa fare ricerca sociale? Significa indagare un aspetto della realtà sociale; “un insieme di procedimenti attraverso cui cerchiamo di acquisire conoscenze scientifiche sulla realtà”. *Che cosa differenzia il lavoro di un ricercatore, da altri tipi di indagine, per esempio quella giornalistica? Il metodo che si utilizza costituisce l’elemento che distingue una ricerca di tipo scientifico da altre forme di indagine. Che cos’è un metodo scientifico? Il metodo scientifico è una strada. Quindi, esistono molti sentieri per raggiungere la meta, e questo significa anche due cose:

  1. che non tutti sono scientifici
  2. che molti percorsi possono portare alla stessa meta Che cos’è scientifico nella ricerca sociale? Una ricerca per essere scientifica deve avere almeno queste tre caratteristiche:
  3. Essere frutto dell’applicazione rigorosa di un metodo di indagine
  4. Avere un fondamento empirico
  5. Le sue procedure devono essere pubbliche La base empirica della conoscenza

La seconda caratteristica di una conoscenza costruita scientificamente è il fatto di essere empiricamente fondata. Significa che alla sua base ci sono affermazioni, asserti, che trovano il proprio fondamento in fatti osservabili, cioè non sono solo costrutti mentali del ricercatore. Differenza tra base empirica e il senso comune: per esempio l’errata generalizzazione : la percezione della rilevanza quantitativa del crimine o di eventi che mettono in discussione la nostra idea di società (il fenomeno migratorio). Se si sta svolgendo un’indagine sulla criminalità, una signora che è stata scippata in passato dirà sicuramente che è molto diffusa, una persona che non ha vissuto sulla propria pelle quest’esperienza non affermerà lo stesso, probabilmente. La pubblicità delle procedure adottate La conoscenza che pretende di essere scientifica deve anche essere disponibile alla critica, cioè ad essere osservata e analizzata da altri scienziati. E come può essere oggetto di critica? Rendendo pubbliche le procedure utilizzate, dichiarare in maniera esplicita, per esempio, quale tecnica si è scelta, chi è stato intervistato, chi ha effettuato la rilevazione sul campo. Questa dimensione è particolarmente rilevante per le scienze sociali, che non dispongono di uno strumento come l’esperimento (replicabile) tipico delle scienze della natura. Esercizio di base

  1. Un maglione che costava 65 euro è venduto in saldo al 25%. Quanto costa adesso? 48.75 euro. La benzina costerà il 5% in più a partire
  2. La benzina costerà il 5% in più a partire da domani. Oggi costa 1,604 euro al litro. Quanto costerà domani? 5 % di 1, 604 – 5/100 di 1, (1,604:100) x 5 = 0, Da domani la benzina costerà 1,6842.
  3. Il signor Mario riceve un interesse medio annuo dell’1,3 % sul suo deposito (che ammonta a 5340 euro). A quanto ammonta il suo capitale dopo due anni? 1,3 % di 5340 – 1,3 / 100 di 5340 (5340:100) x 1,4 = 69, 5340 + 69,42 = 5478, 84 euro.
  4. In una scatola ci sono 197 cioccolatini. Quante probabilità abbiamo di trovarne uno alla nocciola (35)? 35/197 (35:197 x 100) = 17,
  5. Prendiamo un dado ( a 6 facce): quante sono le possibilità che esca un numero pari? 3/6 = ½ = 0,5 x 100 = 50%. Incidenza Ad esempio 30 ogni 100. L’incidenza è così importante, perché è considerata come una sorta di proporzione. Mediana Misura di distribuzione delle frequenza. È il valore/l'unità che occupa la posizione centrale nella distribuzione ordinata dei valori. Calcolo delle probabilità Il calcolo dell eprobabilità in matematica è lo studio degli eventi incerti. Esempio: in un sacchetto ci sono 20 palline colorate:12 rosse, 8 gialle. Quante probabilitàci sono che venga estratta una pallina gialla? 8/20 (8:20 x
  1. = 40%.

Trovare l’interpretazione giusta è complesso, da un lato è necessario che una persona conosca la statistica, ma dall’altro lato è necessario avere il supporto anche di chi sa interpretare. Le fonti di informazione La metodologia esamina le ricerche per esplicitare le procedure che furono usate, gli assunti sottostanti, e i modi di spiegazione offerti (Lazarsfeld, 1972). Questa codificazione di procedimenti mette in evidenza i pericoli, indica le possibilità trascinate e suggerisce eventuali miglioramenti. Inoltre, rende possibile la generalizzazione della conoscenza metodologica, trasmettendo i contributi specifici di n dato ricercatore al patrimonio della comunità scientifica. Popolazione e campione Se prendo due pallini, sono il mio campione che rappresentano tutto l’insieme U. Il campionamento è il processo attraverso il quale scelgo i campioni che rappresentano l’insieme; devo utilizzare dei criteri e delle variabili. Ad esempio, se nella provincia di Bergamo ci sono 100 comuni e suddividono per numero di abitanti, scopro che ci sono 4 fasce. 1.000 – 2. 2.000 – 5. 5.000 – 10.

Devo prendere un comune per ogni fascia Devo riprodurre nel mio campione ciò che c’è effettivamente nella popolazione, questo è fondamentale ed è ciò che permette alla statistica di avere un senso. Che cos’è il metodo? Etimologia  in cerca di, in direzione di, via, cammino Esso rappresenta, in un contesto scientifico, l’insieme delle procedure (non il singolo strumento o tecnica) utilizzate per raggiungere una conoscenza dotata di un significato (altri direbbero vera o certa). Che cosa le tecniche?  Gli strumenti della ricerca scientifica: quindi le procedure specifiche, le regole, i principi che consentono di conoscere la realtà.  Etimologia: indica la capacità pratica di operare per raggiungere un dato fine, n quanto basata su conoscenza ed esperienza.  In latino venne tradotta con ars (il moderno arte) che su esperienza conoscitiva e non su immediata ispirazione e genialità.

L’oggetto di studio Una possibile distinzione fra le scienze sociali e le altre scienze è il suo oggetto: esse studiano quella particolare configurazione che definiamo società, come entità sui generis (distinta da altre e dotata di una propria esistenza autonoma). Un altro modo di indicare l’oggetto delle scienze sociali sono le relazioni sociali. Cioè, al di là della definizione di società, le scienze sociali si occupano di fenomeni e processi i quali derivano da relazioni tra individui, oppure da istituzioni che hanno però anch’esse la loro origine nel comportamento individuale. Società e relazioni sociali: Durkheim e Weber

  1. Il primo approccio tende a studiare le società come un organismo (o un insieme, da cui l’espressione «olismo»), una realtà a se stante che ha un significato diverso (e superiore) dei singoli elementi che la compongono.
  2. Il secondo invece si interessa del senso che gli individui danno alle relazioni con gli altri individui. Quindi, il metodo nelle scienze sociali dipende da come si definisce l’oggetto di studio, perché il primo e il secondo approccio sono maggiormente interessati a studiare «oggetti» differenti e quindi useranno un percorso (metodo) diverso per raggiungere il proprio fine (la conoscenza). Una sintesi del dibattito sul metodo Spiegazione e comprensione Le scienze della natura, a partire dalla Rivoluzione scientifica, hanno cercato di spiegare i fenomeni naturali, cioè riconducendoli a una legge di tipo universale. Per esempio, la caduta dei gravi e la legge di gravitazione. Quando si tratta di comportamenti umani, si può trovare una legge di tipo universale? La risposta dipende dai paradigmi interpretativi che si adottano. Nel paradigma umanista e interpretativo non esistono cose come le leggi universali. Il paradigma soggettivista propende per la comprensione circa il significato che gli attori sociali danno alle loro azioni, cioè al significato culturale, di eventi che sono per loro natura individuali e irripetibili. Esempio (cfr. Amaturo)

significativi» imputabili al «caso». Nel modello quantitativo quando seleziono un campione statisticamente rappresentativo della popolazione, devo seguire certe procedure rigorose (previste nel disegno della ricerca). La successiva analisi statistica dei dati può garantire che essi riproducano in piccolo le caratteristiche della popolazione nel suo insieme. Quindi permette di generalizzare i risultati del campione alla popolazione nel suo insieme.

  1. Strumento di rilevazione: è il modo in cui il ricercatore «pone le domande» al soggetto-oggetto di indagine (un questionario standardizzato oppure una traccia di intervista o una griglia di osservazione). Nel modello quantitativo, il questionario: è uno strumento uguale per tutti i soggetti intervistati (standard). Si fanno a tutti i soggetti le stesse domande, nello stesso modo, senza mai variare altrimenti si inficia la possibilità di sommare tra loro le risposte in maniera matematica. Il suo naturale prodotto finale è una matrice di dati.
  2. Natura dei dati : non tutti i dati ottenuti da una ricerca sono uguali. Alcuni sono numeri, altri sono etichette verbali di comportamenti complessi, tipologie di atteggiamento. Nel modello quantitativo i dati sono indiscutibili, non opinabili (non sono interpretazioni). Per questo sono hard, come quelli delle scienze della natura. È il livello massimo di oggettività che si può ottenere in una ricerca sociale (nel sondaggio elettorale, il 30% è una quantità precisa del corpo elettorale). Analisi dei risultati Voglio capire quanti uomini ci sono nella provincia di Bergamo, mi sto riferendo a delle variabili, non al singolo individuo. Sintesi delle differenze principali (analisi dei dati)
  3. Oggetto dell’analisi: dipende da come e da che cosa viene preso a oggetto d’indagine. Nel modello quantitativo oggetto di analisi sono le variabili. Il livello culturale (proprietà di un individuo) può essere reso operativo attraverso il titolo di studio o un test di cultura generale. Il risultato varierà fra diverse modalità (livello culturale alto o basso, per es.): esse sono l’oggetto di analisi.
  4. Obiettivo dell’analisi : presi in esame i nostri individui o le variabili, che cosa vogliamo ottenere? Nel modello quantitativo è prevista una analisi statistica finalizzata a individuare relazioni (correlazioni statistiche) tra le variabili. Cioè come e quanto variano le diverse variabili all’interno del campione (per es. che relazione c’è tra titolo di studio e occupazione, come la variabile «titolo di studio» spiega

la condizione lavorativa delle persone; al variare del titolo di studio, varia anche l’occupazione? In che misura?). Sintesi delle differenze principali (risultati)

  1. Presentazione dei dati: come vengono presentati i dati raccolti nell’analisi? Nel modello quantitativo all’interno di tabelle. Per es. i dati dei sondaggi elettorali o le statistiche demografiche dell’ISTAT: è un modello di presentazione molto chiara che mette in relazione gli individui intervistati e alcune caratteristiche loro attribuite (livello di istruzione, opzioni di voto, giudizi morali).
  2. Generalizzazioni: obiettivo di una ricerca non è la mera descrizione di un fenomeno sociale (anche se è parte integrante del processo). È anche quello di instaurare relazioni fra variabili. Cioè forme di sintesi (generalizzazioni) che permettono di connettere i dati rilevati alla teoria. Nel modello quantitativo la tipica generalizzazione è costituita dalla correlazione statistica, l’individuazione di cause dei fenomeni, fino alla costruzione di leggi di validità universale.
  3. Portata dei dati: nella ricerca qualitativa si pone il problema di quale sia la portata di un dato raccolto su un numero ridotto di casi: se in una ricerca quantitativa si possono intervistare migliaia di persone, per uno studio di caso (qualitativo) magari si effettuano una decina di interviste. Nel modello quantitativo la generalizzabilità dei risultati è l’obiettivo principale (e la ragione più valida per effettuare una indagine che richiede più risorse di ogni altra forma di ricerca): poter estendere i risultati relativi al campione studiato all’intera popolazione di riferimento. Il disegno delle ricerca Prima del lavoro sul campo (distinzione tra desk e field).  La domanda di ricerca (ipotesi)  I concetti chiave  Le unità di analisi  La rilevazione Durkheim, la ricerca sul suicidio Secondo Durkheim, non c’è nulla di più individuale sul suicidio.

Solitamente l’indagine statistica si occupa di tre operazioni distinte:  Raccogliere i dati  Presentare i dati  Analizzare i dati I dati statistici Nelle indagini statistiche, si ha a che fare con diversi tipi di dati. Questi dati possono essere rappresentati sia in forma di tabelle sia in forma di grafici e disegni. L’oggetto delle indagini I fenomeni (X,Y,Z) sociali di cui si occupano le indagini statistiche sono diversi. In Italia la base di dati statistici di tipo sociale più rilevante è la «Indagine Multiscopo sulle famiglie: aspetti della vita quotidiana» dell’ISTAT (Istituto nazionale di statistica). Un’indagine recente è stata fatta sul reddito annuale di un uomo e il reddito annuale di duna donna: uomo circa 25 mila, mentre donna 17 mila  8 mila di differenza, disuguaglianza sistematica. Variabilità Ogni qualvolta si vuole studiare un fenomeno in cui è presente una certa variabilità della risposta, in presenza delle stesse condizioni, entra in gioco la statistica. Le scelte di consumo degli italiani dipendono per es. dall’età, dal sesso, dal luogo di residenza, dal reddito, dal capitale culturale. Il primo scopo della statistica è la comprensione delle cause della variabilità. Esempio: le abitudini degli studenti (Tab. 1) Campione della popolazione: n = 10 Fenomeni sociali studiati (argomenti del questionario): X, Y, Z, W - variabili della tabella. Gli studenti che rispondono: u (unità statistica o caso). Le risposte fornite (i valori che assumono le variabili): osservazioni. Dataset: l’insieme dei dati (costruiti attraverso una tabella). Marginali di riga e colonna

FREQUENZE

OSSERVATE

MASCHI FEMMINE TOTALE

BERGAMO 45 75 57,1 %

BRESCIA 35 55 42, 9 %

TOTALE 38,1 % 61,9% 100%

Dopo aver inserito i dati di frequenze osservate in valori assoluti, posso calcolare i valori % delle frequenze osservate, posso calcolare i marginali di riga e colonna. In valore % quante sono le femmine del campione (frequenza osservata)? Il 61,9%. Tot. = 45 + 75 + 55 + 35 = 210

1. 45 + 35 = 80 2. 80 : 210 = 0, 3. 0,381 x 100 = 38,1 % 1. 75 + 55 = 130 2. 130 : 210 = 0, 619 3. 0,619 x 100 = 61,9% 1. 45 + 75 120 2. 120 : 210 = 0, 3. 0,571 x 100 = 57,1% 1. 35 + 55 = 90 2. 90 : 210 = 0, 3. 0,429 x 100 = 42,9 % Esercizio 1 Un professore vuole indagare l’interesse per la sua materia da parte dei suoi 25 alunni. Decide di misurare il loro interesse contando il numero di libri letti negli ultimi 6 mesi da ogni suo studente. Determinare:  la popolazione statistica di riferimento  la classe  le relative unità statistiche  ogni alunno  la sua numerosità  25  il fenomeno di interesse  il numero dei libri letti  le modalità (come si manifesta questo fenomeno) osservabili su ogni unità statistica: x = 1,2,3, … n (ho letto 1 libro, 2 libri, 3 libri ecc.) Esercizio 2 Il direttore di un salone d’auto vuole conoscere le caratteristiche delle 371 auto che ha venduto lo scorso anno. È interessato a: marca stato (decoroso, buono, ottimo) cilindrata (S,M,L) capienza del bagagliaio (litri). L’obiettivo è formalizzare queste informazioni.  U = auto vendute  Unità statistica (u): singole auto vendute  N = 371 Fenomeno di interesse: o X (marca), modalità di X (x = FCA, Peugeot, Ford) o Y (stato), modalità di Y: decoroso, buono, ottimo

Seconda distinzione: è possibile individuare un ordine? Cioè: la posizione dell’uno rispetto all’altro. Tra i fenomeni quantitativi c’è sempre un ordine (numerico), tra i fenomeni qualitativi dipende  Tra i fenomeni qualitativi ci sono fenomeni ordinali oppure categoriali.  Ordinali: fenomeni qualitativi che però hanno attributi che si possono ordinare secondo un criterio o convenzione. Per esempio, X: titolo di studio, c’è un ordine tra diploma elementare e laurea (cioè diploma < laurea < dottorato). C’è un ordine crescente tra queste qualità, se non ho il diploma, non posso laurearmi, se non ho una laurea, non posso ottenere un dottorato.  Categoriali: fenomeni qualitativi che non si possono ordinare secondo un criterio o convenzione. Y: regione di residenza. Le regioni sono tutte uguali, non c’è nessun ordine. Tra i fenomeni quantitativi ci sono fenomeni discreti oppure continui.  Discreti: fenomeni quantitativi che si possono contare, enumerare. Per esempio, Z: numero di esami sostenuti; A: numero di furti di auto denunciati; B: accessi al sito internet del Dipartimento di Lingue di Bergamo.  Continui: fenomeni quantitativi che si possono misurare, per i quali esiste una scala di misura. C: peso corporeo alle 8 di mattina (kg.); T: temperatura massima giornaliera in novembre a Bergamo (°C, °F). In sintesi: dati e proprietà

  1. Numerici o quantitativi sono il risultato di una misura: continui (distanza, reddito, durata, peso) oppure il risultato di un conteggio: discreti (numero di figli, numero di esami, numero di giorni di malattia).
  2. Categorici o qualitativi : ordinali (titolo di studio, scala Mercalli per l'intensità di un terremoto) o categoriali o nominali (genere, religione). Esempio 1 Su un campione di n (campione) = 20 donne sono state rilevate le seguenti variabili:  tipo di dieta (X)  giudizio sull'ultimo film visto (Y)  numero di convivenze (Z)  spesa per massaggi nell'ultimo mese (W). Di che variabili si tratta? Nel questionario, c’erano alcune modalità di risposta per X:  N = Non importa / mangia di tutto  C = Carne sempre  V = Vegana o vegetariana  S = Solo salumi Non è un numero, è qualitativa, non c’è un ordine, è nominale /categoriale. Y (modalità di risposta):  x1 = A = abominevole  x2 = O = osservabile  x3 = S = super  x4 = L = da 30 e lode Non è un numero, è qualitativa, c’è un ordine.

La variabile numero di convivenze (Z) è una variabile numerica discreta. La variabile spesa per massaggi (W) è una variabile numerica continua (misurata con una specifica unità di misura). La rilevazione Il processo di costruzione dei dati (meglio di «creazione») è la rilevazione. Gli strumenti della rilevazione sono il questionario e le scale di modalità/di rilevazione. Le modalità La scala delle modalità o scala di rilevazione con cui si rileva X è l'insieme di tutte le possibili manifestazioni x di X (su U). La scelta e la formulazione della scala delle modalità, opportuna per la rilevazione di ogni fenomeno di interesse, è parte integrante del processo di costruzione dei dati. Devono essere rispettati due principi:esaustività : la scala delle modalità deve prevedere tutte le possibili manifestazioni di X su U, al fine di poter classificare ogni osservazione circa una unità statistica (esempio: la risposta “Altro” in un questionario).  mutua esclusività : la scala deve prevedere solo modalità che si escludono a vicenda, senza possibilità di confusione o sovrapposizioni, in modo da poter classificare ogni osservazione circa una unità statistica senza ambiguità. Classificazione delle scale di modalità Sconnessa – M/F oppure Sì/No Ordinale – titolo di studio Rapporto – numeri di accesi al web (0,1,2,3) Non rapporto – 0° C / 0 ° F Classificazione delle scale di modalità Scale qualitative, in cui le modalità sono attributi o categorie, qualità (esempio: genere, titolo di studio, ecc.):  Sconnesse , se gli attributi o le categorie non ammettono un ordinamento oggettivo ma solo un ordinamento casuale o personale (esempio: il genere, che è dicotomica),  Ordinal i, se gli attributi o le categorie possono essere ordinati secondo un qualche criterio oggettivo o convenzionalmente accettato (esempio: il titolo di studio). Scale quantitative, in cui le modalità sono numeri (esempio: età, altezza). Le scale quantitative sono sempre ordinali, ma si distinguono per avere:  Origine assoluta (scale rapporto), se l'origine della scala è il numero 0 e indica l'assenza del fenomeno (n. accessi).  Origine convenzionale (scale non rapporto), se l'origine della scala (generalmente ancora lo 0) ha significato solamente convenzionale (esempio: la temperatura). Livello di analisi Dalla tipologia di scala dipende il livello di analisi statistica:

Usiamo l'indice i per distinguere le diverse modalità x del fenomeno X: la rilevazione di X su U avviene con la scala di modalità x1, x2,…, xk (massimo modalità possibile) o xi , i = 1 - … - k (x con i per i che va da 1 a k). Per esempio: generek = 2; x1 =“maschio”, x2 =“femmina”. Notazione, Esempio 1 X ”ni” Frequenza % N 6 30 C 7 35 V 4 20 S 3 15 TOT 20 100 Quante unità statistiche presentano modalità x del fenomeno X (tipo di dieta)? In valori assoluti basta contare la frequenza (ni). Per convenzione, la i indica la modalità generica (iesima). Le modalità (k) della risposta sono: N, C, V, S. Quindi ni dove i = 1- … - 4. k= Le risposte possono essere assegnate alle diverse modalità in questo modo: risposta V (vegana), 4 frequenze, cioè per n3 = 4. Le altre risposte possono essere indicate ugualmente così: n1 + n2 + … + nk = n (cioè 20) K indica il totale delle modalità, i indica quali sono le modalità di un certo fenomeno. Appendice 1

  • Come si costruiscono le variabili
  • Come si costruiscono gli indici (introduzione) Unità di analisi L’oggetto di studio può essere l’individuo (studio la disoccupazione come caratteristica propria di alcuni individui, i giovani per esempio). Può anche essere: le auto vendute, i Comuni italiani, le scuole primarie del Comune di Bergamo. Sono tutte Unità di Analisi, cioè il tipo di oggetto di cui si occupa la ricerca sociale. L’UdA è singolare e astratta. I casi Per passare dall’astrazione (il generico oggetto di ricerca, le UdA) al concreto, devo invece prendere in considerazione i singoli casi. I casi sono gli esemplari su cui svolgo la ricerca (Mario, Giovanna, il Comune di Verdello, la Scuola primaria di Via Garibaldi). Oggetto, unità e caso Oggetto  unità  caso. Dal livello massimo di astrazione al concreto La disoccupazione giovanile  i giovani tra i 16 e i 34 anni, senza occupazione stabile  Mario. Il campionamento

Campionamento: la selezione di una porzione di popolazione (cioè una parte di U) per individuare i casi (le future righe della matrice dei dati, u). Solo con una delimitazione spazio-temporale (i giovani di Bergamo, nel 2019) e con il campionamento i risultati della ricerca (sui casi singoli) sono generalizzabili, cioè riferibili all’universo. Tipi di unità di analisi

  1. L’individuo, è l’unità elementare, non ulteriormente scomponibile di molte ricerche sociali (e la base per UdA di tipo aggregato).
  2. L’aggregato: a) Più individui  famiglia b) Unità territoriali  una città, un quartiere, una regione c) Enti  istituzioni, organizzazioni
  3. Eventi sociali (le elezioni, uno sciopero, un evento musicale, il Giubileo).
  4. Un prodotto culturale (spesso oggetto di analisi qualitativa, non statistica) a) I programmi televisivi, la pubblicità (il contenuto), i messaggi sui social network («sentiment») b) In genere: «analisi del contenuto». Concetti e indicatori Un concetto è rappresentato come una proprietà di una UdA. Devo tradurla in una variabile, i cui valori sono empiricamente rilevabili (da astratto a concreto). Sulla matrice potrò così inserire lo stato che ogni caso assume su quella proprietà (per esempio 1 o 2 come presenza o assenza). Questa traduzione è la operativizzazione, da concetto astratto a operativo. Nella ricerca sociale i concetti sono però spesso:
  • Generali / generici
  • Estesi (semanticamente)
  • Astratti Quindi: è impossibile la rilevazione diretta di questi concetti (anomia, libertà, partecipazione). Se il concetto non ha stati empiricamente rilevabili, si deve trovare un altro concetto che ha stati rilevabili empiricamente, cioè un indicatore. Il concetto (C) è rappresentato tramite l’indicatore (I). il concetto astratto è rappresentato dall’indicatore. I è un concetto più specifico di C, e può essere inteso come rappresentazione semantica di C.  C: status socioeconomico.  I: reddito, titolo di studio, posizione occupazionale. Poiché C è complesso, si usano spesso diversi I (non solo un I). Per esempio: Isee. Isee = Ise/N = Isr + (20% ∙ Isp)/N L’ISEE (Indicatore della Situazione Economica Equivalente) si trova con una formula complessa:
  1. L’indicatore di situazione economica (ise) / N (N=scala di equivalenza che possiamo tradurre con nucleo famigliare).
  2. L’Ise a sua volta è definibile come: Reddito (isr) + una parte (20% dei patrimoni) / N. Esempio: Come misurare il grado di secolarizzazione in un Comune (Marradi, 1984)?  Tasso di matrimoni civili, rispetto a quelli religiosi