

























Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
riassunto di Statistica delle scienze sociali
Tipologia: Appunti
1 / 33
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!


























STATISTICA Scienza basata sull’osservazione della realtà. Fornisce risposte a specifiche domande di ricerca. Associa una misura di probabilità ad ogni risposta o conclusione raggiunta Insieme di metodologie finalizzate a Ricavare dati Organizzare, sintetizzare, analizzare, interpretare, presentare e rappresentare graficamente le conclusioni derivate dai dati. Possiamo vedere la statistica come un processo che si occupa delle seguenti fasi: Raccolta delle informazioni; Sintesi dei dati; Analisi dei dati (con la finalità di trarre conclusioni); Verifica della correttezza delle conclusioni; Generalizzazione dei risultati a cui si è pervenuti.
(per fornire una risposta al punto
Le domande devono essere formulate in modo dettagliato al fine di identificare la popolazione da esaminare Spesso l’osservazione/misura dell’intera popolazione è difficoltosa o costosa. Si osserva/misura solo un campione della popolazione. Se i dati non sono raccolti in modo corretto, le conclusioni che si traggono sono prive di significato La statistica descrittiva permette di ottenere una panoramica generale dei dati a disposizione, e suggerisce quali metodi statistici inferenziali potrebbero essere utilizzati Estendere alla popolazione i dati ottenuti sul campione, usando appropriate tecniche, e riportare il livello di affidabilità delle conclusioni che si sono tratte STATISTICA SOCIALE metodologie per la raccolta e l’analisi di dati riguardanti fenomeni sociali STATISTICA PER LE SCIENZE SOCIALI insieme di metodi per la raccolta e l’analisi di dati, il cui utilizzo consente di descrivere, valutare e prevedere fenomeni sociali sono legati all’organismo sociale Sono avvenimenti e azioni che influiscono sulla collettività La statistica: ➢ Progetta e pianifica la raccolta dei dati necessari per le ricerche; ➢ Analizza dei dati di un insieme di fenomeni collettivi, illustrandoli attraverso opportune sintesi; ➢ Formula delle previsioni dall’osservazione e dall’analisi di un campione statistico.
ESEMPI di fenomeni sociali: o Mortalità , ossia il numero di decessi in un dato periodo di tempo → ha delle conseguenze sulla struttura per età di una popolazione, sulle forze di lavoro, sull’organizzazione del sistema di assistenza e previdenza; o Turismo → riguarda il movimento di un insieme di individui e comporta la predisposizione di strutture ricettive, di vie di comunicazione e di trasporto; o Emigrazione , ossia lo spostamento dai luoghi di origine e l’insediamento in altri territori per motivi di lavoro o di clima di una molteplicità di individui → determina effetti rilevanti sulla collettività di partenza o di arrivo. Elementi che caratterizzano il fenomeno sociale:
2.212 Maschio 21 67 170 Liceo classico Lazio 5.214 Femmina 19 54 160 Liceo scientifico Lazio 3.691 Femmina 18 60 170 Liceo scientifico Abruzzo 4.545 Maschio 24 90 185 Istituto tecnico Campania 2.211 Maschio 27 87 194 Liceo artistico Campania 4.023 Maschio 23 70 185 Liceo classico Lazio 1.230 Femmina 21 68 174 Istituto tecnico Lazio 8.532 Femmina 22 55 158 Liceo classico Lazio 9.574 Maschio 23 64 177 Liceo scientifico Abruzzo 3.256 Femmina 21 59 170 Liceo classico Lazio
Tabelle e distribuzioni di frequenza; Grafici; Statistiche riassuntive Le conclusioni che si traggono riguardano solamente l’insieme dei dati analizzati. La conoscenza statistica di un fenomeno può avvenire attraverso:
Il dato iniziale può essere elaborato, ottenendo il dato sintetico →con il dato iniziale, ricostruito ed elaborato, si ottiene un output. Il dato diventa informazione quando viene: − Memorizzato; − Organizzato; − Classificato; − Messo in relazione; − Interpretato I dati statistici si distinguono in: Microdati, dati elementari che si riferiscono alla singola unità di rilevazione (es. dati relativi a ciascun intervistato); Macrodati, dati risultanti da un calcolo (somma, differenza, rapporto) effettuato sui microdati (es. dati aggregati per sesso degli intervistati) Metadati, sono informazioni sul processo di produzione dei dati, ossia sul dove, quando, come e da chi i dati sono stati ottenuti LABORATORIO 1. INTRODUZIONE ALL’ELABORAZIONE DATI CON EXCEL Archivio o database → si presenta come una tabella. Consente di organizzare i dati grezzi in informazioni utili. È composto da: Righe, rappresentano le unità statistiche Colonne, caratteri oggetto di studio EXCEL → foglio elettronico, permette di costruire un archivio immettendo i dati in forma matriciale. MATRICE tabella di numeri disposta su n righe e p colonne Si dicono elementi della matrice Per distinguere gli elementi della matrice si utilizza aij → i (riga) j (colonna) a cui l’elemento appartiene. i e j sono contatori → i conta le righe che compongono la matrice, conta quindi i valori da 1 a n → i=1 , i =2 … j conta le colonne che compongono la matrice, conta quindi i valori da 1 a p → j =1 , j =2 … La matrice viene indicata A oppure A ij La matrice può essere: Quadrata se il numero delle righe è uguale a quello delle colonne → n = p Rettangolare se il numero delle righe è diverso a quello delle colonne → n ≠ p L’espressione in excel =somma (B2:B5) attiva la funzione di addizione delle celle che vanno da B2 a B5. Supponendo di osservare un carattere x₁ , x₂ , … su un campione di n unità statistiche e di volerne fare la somma, potremmo scrivere x₁ + x₂ + … ma, questo modo di scrivere la somma può risultare scomodo. Allora per sommare i valori di un dato carattere si utilizza il simbolo della lettera greca sigma ∑
∑xᵢ → sommatoria delle xᵢ per i che va da 1 a n
SISTAN rete di soggetti pubblici e privati che fornisce al Paese e agli organismi internazionali l’informazione statistica ufficiale. Composto da una rete di circa 10.000 operatori statistici. È il garante dell’omogeneità e della correttezza dei metodi statistici utilizzati Comprende: L’istituto nazionale di statistica → ISTAT, a cui è affidato il coordinamento; Gli enti e gli organismi pubblici di informazione statistica → INEA, ISFOL; Gli uffici di statistica delle amministrazioni dello Stato e di altri enti pubblici, degli Uffici territoriali del Governo, delle Regioni e Province autonome, delle Province, delle Camere di commercio e dei Comuni; Gli uffici di statistica di altre istituzioni pubbliche e private che svolgono funzioni di interesse pubblico. Il governo del SISTAN è affidato all’ISTAT, che si avvale del Comitato di indirizzo e coordinamento dell’informazione statistica (COMSTAT); La vigilanza sulle attività del SISTAN è affidata alla Commissione per la garanzia dell’informazione statistica che è un organo esterno, autonomo e indipendente. Vigila su: − Imparzialità e completezza dell’informazione statistica; − Qualità delle metodologie; − Conformità delle rilevazioni alle direttive degli organismi internazionali e comunitari. 2.3 L’ISTITUTO NAZIONALE DI STATISTICA → ISTAT ISTAT ente di ricerca pubblico, presente in Italia dal 1926. Principale produttore di statistica ufficiale a supporto dei cittadini e dei decisori pubblici. La sede centrale è a Roma. I principali compiti affidati all’ISTAT sono: − Predisposizione del programma statistico nazionale (PSN); − Esecuzione dei censimenti e delle principali rilevazioni statistiche previste dal PSN; − Indirizza e coordina le attività statistiche degli enti del SISTAN; − Definisce i metodi di classificazione e rilevazione dei fenomeni statistici; − Gestisce i rapporti con enti e uffici internazionali nel settore della informazione statistica. Dal sito web dell’ISTAT l’utente ha la possibilità di analizzare le statistiche per argomento. Il sito è organizzato in 12 macro argomenti:
b. Indagini multiscopo , nasce per rispondere ai nuovi bisogni informativi derivanti dalle trasformazioni economiche, sociali e demografiche che coinvolgono vasti strati della popolazione e che modificano i comportamenti individuali e familiari. Sono sette:
INDAGINE STATISTICA → SURVEY rilevazione fatta su un campione → lo studio non è esteso a tutta la popolazione di riferimento, ma a una parte della stessa. È principalmente influenzata da: Tempi Costi CENSIMENTO Richiede tempi troppo lunghi sia per la rilevazione sia per l’elaborazione→ l’ISTAT nel 2001 ha condotto una rilevazione, i cui primi risultati parziali sono stati presentati nel 2004. L’obiettivo del censimento è quello di fotografare la popolazione in un dato momento. Il tempo modifica le situazioni. INDAGINE CAMPIONARIA consente di analizzare le caratteristiche di una popolazione attraverso lo studio di una porzione della popolazione stessa (campione). Deve avere come caratteristiche:
➢ La qualità di un sondaggio non dipende soltanto dal campione, ma anche da come vengono formulate le domande. ➢ I risultati di un’indagine dipendono da tanti fattori. La pubblicazione dei dati di sondaggi deve essere sempre accompagnata dalle seguenti informazioni: Soggetto che ha realizzato il sondaggio; Criteri seguiti per l’individuazione del campione; Metodo di raccolta delle informazioni e di elaborazione dei dati; Numero delle persone interpellate e universo (popolazione) di riferimento; Domande rivolte; Percentuale delle persone che hanno risposto a ciascuna domanda; Date in cui è stato realizzato il sondaggio DEMOSCOPIA O INDAGINE DEMOSCOPICA indagine statistica volta a misurare fenomeni che hanno l’obiettivo di analizzare tematiche di interesse pubblico, in molti casi si tratta di sondaggi di opinioni. Demoscopico → demos (popolo) skopèo (osservare) → osservazione del popolo 3.2 TIPOLOGIE DI INDAGINI Nella fase di progettazione le indagini si possono distinguere in: Trasversali, raccolgono informazioni di interesse riferite ad un particolare momento/periodo di tempo, con l’intento di stimare le caratteristiche riferite allo stato della popolazione oggetto nel momento/periodo di interesse. Es. censimento Longitudinali, svolta rilevando più volte nel tempo il fenomeno oggetto della ricerca. I dati longitudinali sono essenziali perché:
➢ Casuale semplice; ➢ Stratificato (proporzionale, uniforme, ottimale); ➢ Sistematico; ➢ A grappoli; ➢ A più stadi. IL CAMPIONAMENTO CASUALE SEMPLICE più semplice tecnica di selezione di un campione ma poco utilizzata. È necessaria la presenza di una lista della popolazione. Il procedimento è simile allo schema di estrazione da un’urna. Se si indica con n la dimensione del campione (numero di elementi del campione) e con N la dimensione della popolazione, (numero di elementi della popolazione), nel campionamento casuale semplice la probabilità che ogni individuo della popolazione ha di essere scelto alla prima estrazione (rapporto di probabilità) è 𝟏 𝑵 → ogni individuo della popolazione ha la stessa probabilità di essere scelto. La selezione del campione può essere fatta in due modi:
Si utilizza quando le unità che compongono l’universo sono numerabili progressivamente e si possono estrarre delle unità di campionamento distanziate da un intervallo costante. Es. indagine sugli hotel di Roma. Ci sono 140 hotel e il campione deve essere pari a 20 K = 𝑵 𝒏 = 𝟏𝟒𝟎 𝟐𝟎 = 7 → selezionato il primo hotel da fare entrare nel campione, gli altri 19 saranno selezionati dalla lista 1 ogni 7. IL CAMPIONAMENTO A GRAPPOLO E A STADI L’unità di campionamento è un gruppo o grappolo di unità della popolazione. Si estrae un campione casuale di grappoli e tutte le unità ad esso appartenenti sono oggetto di rilevazione. Nella selezione a stadi viene estratto casualmente un campione a partire dai grappoli. Sfutta l’esistenza di raggruppamenti naturali della popolazione. Viene scelto questo campione quando: − Non è disponibile una lista degli elementi della popolazione che, viene suddivisa in unità areali (quartieri, sezioni di censimento); − Convenienza amministrativa e organizzativa. 3.5 IL CAMPIONAMENTO NON PROBABILISTICO CAMPIONAMENTO NON PROBABILISTICO Si dice non probabilistico quando per ciascun caso la probabilità di essere incluso nel campione non è nota. La differenza con campionamento probabilistico è rappresentata dalla selezione non casuale dei campioni. Non fornisce a ciascuna unità della popolazione la stessa occasione di essere parte del campione: alcuni gruppi o individui hanno maggiore probabilità di essere scelti, altri meno. Prevede la selezione del campione in base a criteri di comodo o di praticità per esempio perché sono più facilmente accessibili, o per ragioni di costo.
In un’indagine campionaria, è opportuno tener conto di diverse fonti di errore. Si distingue l’errore in: Errore campionario , deriva dalla scelta di osservare un sotto – insieme della popolazione. È un errore programmabile. Riguarda soltanto i campioni probabilistici. Può essere stimato; Errore non campionario , nasce in ogni fase di progettazione, esecuzione ed elaborazione. Ha un impatto maggiore rispetto all’errore campionario. Non si programma e richiede metodi ed indagini ad hoc per essere stimato. È l’involontaria conseguenza dei limiti e delle imperfezioni dell’indagine. PRINCIPALI CATEGORIE DI ERRORE NON CAMPIONARIO Errore di copertura → un’unità della popolazione non è presente o non è reperibile; Mancata risposta parziale o totale → l’unità intervistata non risponde. I motivi possono essere: − Soggetti non contattabili; − Soggetti non disponibili a rispondere; − Soggetti disponibili, ma non in grado di rispondere È opportuno utilizzare delle misure correttive, a meno che la proporzione di non rispondenti sia piccola. Due tipologie di misure correttive:
QUESTIONARIO strumento utilizzato per raccogliere informazioni in un’indagine. Composto da un insieme strutturato di domande, eventualmente corredato dalle possibili risposte, registrato su un supporto adeguato per la somministrazione. Criteri guida per la costruzione: Chiarezza; Semplicità; Brevità. Le fasi che caratterizzano la costruzione di un questionario sono tre:
Entità Collettivo / popolazione Attributo di una entità Carattere Relazione tra entità Relazione tra collettivi Gerarchia di generalizzazione Partizione di un collettivo di un sottocollettivo Sottoinsieme di un insieme Sottocollettivo di un collettivo SIMBOLI DEL DIAGRAMMA DI FLUSSO La freccia indica il flusso delle domande
In una tabella dati: NOME SESSO ALTEZZA PESO CAIO M 178 80 TIZIA F 167 58 Distribuzione unitaria multipla Distribuzione unitaria semplice Ogni riga (record) della tabella descrive il profilo di uno studente; Ogni studente rappresenta un’unità del collettivo; Ogni colonna illustra la distribuzione unitaria semplice dei caratteri oggetto di studio DISTRIBUZIONE UNITARIA SEMPLICE elenco delle modalità osservate (valori), unità per unità, nel collettivo preso in esame → si rileva un solo carattere DISTRIBUZIONE UNITARIA MULTIPLA → si rilevano più caratteri sullo stesso collettivo L’informazione contenuta nella distribuzione unitaria di un carattere diventa difficilmente fruibile all’aumentare del numero di unità statistiche considerate. Una prima descrizione sintetica del carattere osservato è data dalla frequenza con cui si presenta la sua modalità: DISTRIBUZIONE UNITARIA → sintesi → DISTRIBUZIONE DI FREQUENZA FREQUENZA ASSOLUTA di una modalità di un carattere, indica il numero di volte in cui questa di presenta in un collettivo. Es. supponiamo di aver il seguente insieme di dati: {1,2,5,4,6,4,3,7,1,5,6,5,3,4,5,1} e, vogliamo trovare la frequenza relativa del valore 5. Prima di determinare la frequenza relativa, dobbiamo trovare la frequenza assoluta che, in questo caso è 4, dato che il valore 5 appare 4 volte nell’insieme di dati. in un collettivo composto da n elementi, una variabile statistica X può assumere K modalità distinte, x 1 , x2, x 3 , …, xk → distribuzione unitaria per ogni unità della variabile X si fa corrispondere la quantità totale misurata/rilevata sui n elementi n1, n 2 , n 3 , …, nk → distribuzione di quantità DISTRIBUZIONE QUANTITA’ X 1 n 1 X 2 n 2 … … XI ni … … XK nk La frequenza j - esima è indicata con nj ed è sempre un numero intero → frequenza assoluta n 1 + n 2 + … + nj + … + nk = ∑ 𝑘 𝑗= 1 𝑛𝑗= n DISTRIBUZIONE DI FREQUENZA ASSOLUTA SEMPLICE schema che associa alle modalità che può assumere un carattere
X le corrispondenti frequenze assolute Un carattere può essere: Quantitativo − Discreto , le modalità sono numeri naturali − Continuo , le modalità sono intervalli continui di valore Qualitativo , le modalità saranno nomi o stringhe di caratteri Es. Carattere qualitativo → aggettivi Carattere quantitativo discreto → numeri naturali Quando il carattere è quantitativo o qualitativo ordinabile è opportuno, prima di avviare l’operazione di conteggio, ordinare le modalità in senso crescente, ossia porre i valori o le etichette verbali del carattere dal carattere più piccolo al più grande. La frequenza assoluta non permette di confrontare valori tra collettivi distinti. Per questo è necessario calcolare la frequenza relativa fj fj = nj n = nj ∑j= 1 n j k per j = 1,2, …, k Es. VOTO IN STATISTICA FREQUENZA ASSOLUTA ni
RELATIVA fi 18 (x 1 ) 3 (n 1 ) 𝑛^1 𝑛
3 8
24 (x 2 ) 1 (n 2 ) 0,125 (f 2 ) 26 (x 3 ) 2 (n 3 ) 0,25 (f 3 ) 30 (x 4 ) 2 (n 4 ) 0,25 (f 4 ) TOTALE 8 (n) 1 (f) La somma di tutte le frequenze relative è pari a 1 f 1 + f 2 +… = ∑ 𝑘 𝑗= 1 𝑓𝑗= Generalmente si preferisce utilizzare al posto delle frequenze relative le frequenze percentuali (pi) e si ottengono dalle frequenze relative moltiplicate per 100 fi x 100 = pi DISTRIBUZIONI DI FREQUENZA possono essere: Sconnesse, se, date due modalità, è possibile solo affermare se queste sono uguali o diverse − Carattere qualitativo sconnesso Es. sesso M/F Tipo di attività studente/operaio/impiegato − Carattere qualitativo nominale Es. nomi Chiara/Marco/Maria/Giovanni
18 Ordine 3 24 crescente 1 26 2 30 2 TOTALE 8
PERCENTUALE PI 0,375 X 100 = 37,50 % 0,125 X 100 = 12,50 % 0,25 X 100 = 25 % 0,25 X 100 = 25 % 100 %