









































































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Media Moda Mediana Devianza Variazione standard
Tipologia: Appunti
1 / 81
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!










































































Con il virus abbiamo scoperto perché la statistica è così importante. I numeri stanno alla base di qualsiasi decisione. Questione contagiati malati Ogni giorno ci sono 30.000 nuovi contagiati, questo numero indica quante persone possono trasmettere il virus. 30.000 sono i “nuovi” positivi, perché c’è una parte di “ritamponati”. I problemi sono due:
(U) L’insieme delle unità statistiche sulla quali interessa studiare il fenomeno è chiamato popolazione statistica o universo di riferimento U (N) Il numero di unità statistiche che compongono la popolazione statistica di riferimento è chiamato numerosità o dimensione U N. Esempio: Al 90% della popolazione piace il cioccolato, ma al sondaggio hanno risposto in 80 persone su tot milioni. La numerosità è insufficiente a dire e sostenere qualcosa. Quando do una percentuale, devo sempre dare la numerosità. Posso dire che alle prossime elezioni ci sarà questo risultato, ma devo sempre dire quante persone ho intervistato. Ricerca censuaria (teorica) =/ Ricerca campionaria (la maggior parte). X fenomeno x modalità (categoria o numero ) U insieme N numero Due tipi di statistiche: Descrittiva e Inferenziale La statistica descrittiva Se la rivelazione è esaustiva (censuaria) di U, e si dispone di tutti gli N dati osservati presso tutte le unità statistiche, la statistica ha la funzione di descrivere il comportamento di X su U.
L’esito di questo processo è la nascita di un metodo, un percorso in senso etimologico, ch eporta alla conoscenza: il metodo scientifico o sperimentale. Seguendo il metodo scientifico, le scienze possono raggiungere una conoscenza della realtà oggettiva e verificabile. La conoscenza umana dunque può descrivere la realtà in quanto tale e seguire procedure pubbliche, controllabili da chiunque. Sul concetto di scienza Per secoli, questa impostazione ha reso possibile sviluppare un apparato di conoscenze che hanno sostenuto altri grandi cambiamenti, come la Rivoluzione industriale (1750). Gli uomini erano persuasi che la realtà fosse alla loro portato, del tutto conoscibile con la sola ragione. Anche la rivoluzione francese (1789) può essere considerata uno degli esiti di quella scientifica, in quanto evento che metteva al centro della storia umana la Ragione (intesa come una divinità). Per questo, il concetto di scienza coincideva con alcune scienze, quelle che seguono il metodo sperimentale. In questo contesto di grandi scoperte che hanno modificato («progresso») le condizioni di vita e gli strumenti della produzione dei beni, si è consolidata una visione della scienza di tipo «oggettivo». Cioè, il fatto che esiste una realtà esterna all’essere umano (il soggetto) che ha una autonomia sostanziale (l’oggetto). Lo strumento per conoscere la realtà è la ragione (e il suo metodo rigoroso). La questione metodologica Il problema è se sia possibile conoscere l’oggetto con la ragione s soprattutto come sia possibile (il metodo): il dibattito si concentrerà soprattutto sullo statuto del sapere che si costruisce attraverso la ricerca sociale. Il paradigma galileiano (conoscenza oggettiva tipica delle scienze della natura) divenne anche il riferimento delle scienze sociali. In tempi relativamente più recenti, invece, si sono affacciati paradigmi diversi, che sottolineano lo statuto differente dell’oggetto di studio, cioè le relazioni sociali. Che cosa significa fare ricerca sociale? Significa indagare un aspetto della realtà sociale; “un insieme di procedimenti attraverso cui cerchiamo di acquisire conoscenze scientifiche sulla realtà”. *Che cosa differenzia il lavoro di un ricercatore, da altri tipi di indagine, per esempio quella giornalistica? Il metodo che si utilizza costituisce l’elemento che distingue una ricerca di tipo scientifico da altre forme di indagine. Che cos’è un metodo scientifico? Il metodo scientifico è una strada. Quindi, esistono molti sentieri per raggiungere la meta, e questo significa anche due cose:
La seconda caratteristica di una conoscenza costruita scientificamente è il fatto di essere empiricamente fondata. Significa che alla sua base ci sono affermazioni, asserti, che trovano il proprio fondamento in fatti osservabili, cioè non sono solo costrutti mentali del ricercatore. Differenza tra base empirica e il senso comune: per esempio l’errata generalizzazione : la percezione della rilevanza quantitativa del crimine o di eventi che mettono in discussione la nostra idea di società (il fenomeno migratorio). Se si sta svolgendo un’indagine sulla criminalità, una signora che è stata scippata in passato dirà sicuramente che è molto diffusa, una persona che non ha vissuto sulla propria pelle quest’esperienza non affermerà lo stesso, probabilmente. La pubblicità delle procedure adottate La conoscenza che pretende di essere scientifica deve anche essere disponibile alla critica, cioè ad essere osservata e analizzata da altri scienziati. E come può essere oggetto di critica? Rendendo pubbliche le procedure utilizzate, dichiarare in maniera esplicita, per esempio, quale tecnica si è scelta, chi è stato intervistato, chi ha effettuato la rilevazione sul campo. Questa dimensione è particolarmente rilevante per le scienze sociali, che non dispongono di uno strumento come l’esperimento (replicabile) tipico delle scienze della natura. Esercizio di base
Trovare l’interpretazione giusta è complesso, da un lato è necessario che una persona conosca la statistica, ma dall’altro lato è necessario avere il supporto anche di chi sa interpretare. Le fonti di informazione La metodologia esamina le ricerche per esplicitare le procedure che furono usate, gli assunti sottostanti, e i modi di spiegazione offerti (Lazarsfeld, 1972). Questa codificazione di procedimenti mette in evidenza i pericoli, indica le possibilità trascinate e suggerisce eventuali miglioramenti. Inoltre, rende possibile la generalizzazione della conoscenza metodologica, trasmettendo i contributi specifici di n dato ricercatore al patrimonio della comunità scientifica. Popolazione e campione Se prendo due pallini, sono il mio campione che rappresentano tutto l’insieme U. Il campionamento è il processo attraverso il quale scelgo i campioni che rappresentano l’insieme; devo utilizzare dei criteri e delle variabili. Ad esempio, se nella provincia di Bergamo ci sono 100 comuni e suddividono per numero di abitanti, scopro che ci sono 4 fasce. 1.000 – 2. 2.000 – 5. 5.000 – 10.
Devo prendere un comune per ogni fascia Devo riprodurre nel mio campione ciò che c’è effettivamente nella popolazione, questo è fondamentale ed è ciò che permette alla statistica di avere un senso. Che cos’è il metodo? Etimologia in cerca di, in direzione di, via, cammino Esso rappresenta, in un contesto scientifico, l’insieme delle procedure (non il singolo strumento o tecnica) utilizzate per raggiungere una conoscenza dotata di un significato (altri direbbero vera o certa). Che cosa le tecniche? Gli strumenti della ricerca scientifica: quindi le procedure specifiche, le regole, i principi che consentono di conoscere la realtà. Etimologia: indica la capacità pratica di operare per raggiungere un dato fine, n quanto basata su conoscenza ed esperienza. In latino venne tradotta con ars (il moderno arte) che su esperienza conoscitiva e non su immediata ispirazione e genialità.
L’oggetto di studio Una possibile distinzione fra le scienze sociali e le altre scienze è il suo oggetto: esse studiano quella particolare configurazione che definiamo società, come entità sui generis (distinta da altre e dotata di una propria esistenza autonoma). Un altro modo di indicare l’oggetto delle scienze sociali sono le relazioni sociali. Cioè, al di là della definizione di società, le scienze sociali si occupano di fenomeni e processi i quali derivano da relazioni tra individui, oppure da istituzioni che hanno però anch’esse la loro origine nel comportamento individuale. Società e relazioni sociali: Durkheim e Weber
significativi» imputabili al «caso». Nel modello quantitativo quando seleziono un campione statisticamente rappresentativo della popolazione, devo seguire certe procedure rigorose (previste nel disegno della ricerca). La successiva analisi statistica dei dati può garantire che essi riproducano in piccolo le caratteristiche della popolazione nel suo insieme. Quindi permette di generalizzare i risultati del campione alla popolazione nel suo insieme.
la condizione lavorativa delle persone; al variare del titolo di studio, varia anche l’occupazione? In che misura?). Sintesi delle differenze principali (risultati)
Solitamente l’indagine statistica si occupa di tre operazioni distinte: Raccogliere i dati Presentare i dati Analizzare i dati I dati statistici Nelle indagini statistiche, si ha a che fare con diversi tipi di dati. Questi dati possono essere rappresentati sia in forma di tabelle sia in forma di grafici e disegni. L’oggetto delle indagini I fenomeni (X,Y,Z) sociali di cui si occupano le indagini statistiche sono diversi. In Italia la base di dati statistici di tipo sociale più rilevante è la «Indagine Multiscopo sulle famiglie: aspetti della vita quotidiana» dell’ISTAT (Istituto nazionale di statistica). Un’indagine recente è stata fatta sul reddito annuale di un uomo e il reddito annuale di duna donna: uomo circa 25 mila, mentre donna 17 mila 8 mila di differenza, disuguaglianza sistematica. Variabilità Ogni qualvolta si vuole studiare un fenomeno in cui è presente una certa variabilità della risposta, in presenza delle stesse condizioni, entra in gioco la statistica. Le scelte di consumo degli italiani dipendono per es. dall’età, dal sesso, dal luogo di residenza, dal reddito, dal capitale culturale. Il primo scopo della statistica è la comprensione delle cause della variabilità. Esempio: le abitudini degli studenti (Tab. 1) Campione della popolazione: n = 10 Fenomeni sociali studiati (argomenti del questionario): X, Y, Z, W - variabili della tabella. Gli studenti che rispondono: u (unità statistica o caso). Le risposte fornite (i valori che assumono le variabili): osservazioni. Dataset: l’insieme dei dati (costruiti attraverso una tabella). Marginali di riga e colonna
Dopo aver inserito i dati di frequenze osservate in valori assoluti, posso calcolare i valori % delle frequenze osservate, posso calcolare i marginali di riga e colonna. In valore % quante sono le femmine del campione (frequenza osservata)? Il 61,9%. Tot. = 45 + 75 + 55 + 35 = 210
1. 45 + 35 = 80 2. 80 : 210 = 0, 3. 0,381 x 100 = 38,1 % 1. 75 + 55 = 130 2. 130 : 210 = 0, 619 3. 0,619 x 100 = 61,9% 1. 45 + 75 120 2. 120 : 210 = 0, 3. 0,571 x 100 = 57,1% 1. 35 + 55 = 90 2. 90 : 210 = 0, 3. 0,429 x 100 = 42,9 % Esercizio 1 Un professore vuole indagare l’interesse per la sua materia da parte dei suoi 25 alunni. Decide di misurare il loro interesse contando il numero di libri letti negli ultimi 6 mesi da ogni suo studente. Determinare: la popolazione statistica di riferimento la classe le relative unità statistiche ogni alunno la sua numerosità 25 il fenomeno di interesse il numero dei libri letti le modalità (come si manifesta questo fenomeno) osservabili su ogni unità statistica: x = 1,2,3, … n (ho letto 1 libro, 2 libri, 3 libri ecc.) Esercizio 2 Il direttore di un salone d’auto vuole conoscere le caratteristiche delle 371 auto che ha venduto lo scorso anno. È interessato a: marca stato (decoroso, buono, ottimo) cilindrata (S,M,L) capienza del bagagliaio (litri). L’obiettivo è formalizzare queste informazioni. U = auto vendute Unità statistica (u): singole auto vendute N = 371 Fenomeno di interesse: o X (marca), modalità di X (x = FCA, Peugeot, Ford) o Y (stato), modalità di Y: decoroso, buono, ottimo
Seconda distinzione: è possibile individuare un ordine? Cioè: la posizione dell’uno rispetto all’altro. Tra i fenomeni quantitativi c’è sempre un ordine (numerico), tra i fenomeni qualitativi dipende Tra i fenomeni qualitativi ci sono fenomeni ordinali oppure categoriali. Ordinali: fenomeni qualitativi che però hanno attributi che si possono ordinare secondo un criterio o convenzione. Per esempio, X: titolo di studio, c’è un ordine tra diploma elementare e laurea (cioè diploma < laurea < dottorato). C’è un ordine crescente tra queste qualità, se non ho il diploma, non posso laurearmi, se non ho una laurea, non posso ottenere un dottorato. Categoriali: fenomeni qualitativi che non si possono ordinare secondo un criterio o convenzione. Y: regione di residenza. Le regioni sono tutte uguali, non c’è nessun ordine. Tra i fenomeni quantitativi ci sono fenomeni discreti oppure continui. Discreti: fenomeni quantitativi che si possono contare, enumerare. Per esempio, Z: numero di esami sostenuti; A: numero di furti di auto denunciati; B: accessi al sito internet del Dipartimento di Lingue di Bergamo. Continui: fenomeni quantitativi che si possono misurare, per i quali esiste una scala di misura. C: peso corporeo alle 8 di mattina (kg.); T: temperatura massima giornaliera in novembre a Bergamo (°C, °F). In sintesi: dati e proprietà
La variabile numero di convivenze (Z) è una variabile numerica discreta. La variabile spesa per massaggi (W) è una variabile numerica continua (misurata con una specifica unità di misura). La rilevazione Il processo di costruzione dei dati (meglio di «creazione») è la rilevazione. Gli strumenti della rilevazione sono il questionario e le scale di modalità/di rilevazione. Le modalità La scala delle modalità o scala di rilevazione con cui si rileva X è l'insieme di tutte le possibili manifestazioni x di X (su U). La scelta e la formulazione della scala delle modalità, opportuna per la rilevazione di ogni fenomeno di interesse, è parte integrante del processo di costruzione dei dati. Devono essere rispettati due principi: esaustività : la scala delle modalità deve prevedere tutte le possibili manifestazioni di X su U, al fine di poter classificare ogni osservazione circa una unità statistica (esempio: la risposta “Altro” in un questionario). mutua esclusività : la scala deve prevedere solo modalità che si escludono a vicenda, senza possibilità di confusione o sovrapposizioni, in modo da poter classificare ogni osservazione circa una unità statistica senza ambiguità. Classificazione delle scale di modalità Sconnessa – M/F oppure Sì/No Ordinale – titolo di studio Rapporto – numeri di accesi al web (0,1,2,3) Non rapporto – 0° C / 0 ° F Classificazione delle scale di modalità Scale qualitative, in cui le modalità sono attributi o categorie, qualità (esempio: genere, titolo di studio, ecc.): Sconnesse , se gli attributi o le categorie non ammettono un ordinamento oggettivo ma solo un ordinamento casuale o personale (esempio: il genere, che è dicotomica), Ordinal i, se gli attributi o le categorie possono essere ordinati secondo un qualche criterio oggettivo o convenzionalmente accettato (esempio: il titolo di studio). Scale quantitative, in cui le modalità sono numeri (esempio: età, altezza). Le scale quantitative sono sempre ordinali, ma si distinguono per avere: Origine assoluta (scale rapporto), se l'origine della scala è il numero 0 e indica l'assenza del fenomeno (n. accessi). Origine convenzionale (scale non rapporto), se l'origine della scala (generalmente ancora lo 0) ha significato solamente convenzionale (esempio: la temperatura). Livello di analisi Dalla tipologia di scala dipende il livello di analisi statistica:
Usiamo l'indice i per distinguere le diverse modalità x del fenomeno X: la rilevazione di X su U avviene con la scala di modalità x1, x2,…, xk (massimo modalità possibile) o xi , i = 1 - … - k (x con i per i che va da 1 a k). Per esempio: genere k = 2; x1 =“maschio”, x2 =“femmina”. Notazione, Esempio 1 X ”ni” Frequenza % N 6 30 C 7 35 V 4 20 S 3 15 TOT 20 100 Quante unità statistiche presentano modalità x del fenomeno X (tipo di dieta)? In valori assoluti basta contare la frequenza (ni). Per convenzione, la i indica la modalità generica (iesima). Le modalità (k) della risposta sono: N, C, V, S. Quindi ni dove i = 1- … - 4. k= Le risposte possono essere assegnate alle diverse modalità in questo modo: risposta V (vegana), 4 frequenze, cioè per n3 = 4. Le altre risposte possono essere indicate ugualmente così: n1 + n2 + … + nk = n (cioè 20) K indica il totale delle modalità, i indica quali sono le modalità di un certo fenomeno. Appendice 1
Campionamento: la selezione di una porzione di popolazione (cioè una parte di U) per individuare i casi (le future righe della matrice dei dati, u). Solo con una delimitazione spazio-temporale (i giovani di Bergamo, nel 2019) e con il campionamento i risultati della ricerca (sui casi singoli) sono generalizzabili, cioè riferibili all’universo. Tipi di unità di analisi