Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Introduzione alla Statistica Sociale: Metodi di Raccolta e Analisi dei Dati, Appunti di Statistica applicata alla psicologia

riassunto di Statistica delle scienze sociali

Tipologia: Appunti

2018/2019

In vendita dal 29/04/2019

PsicoKore
PsicoKore 🇮🇹

4.5

(310)

321 documenti

1 / 33

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
1
Statistica per le scienze sociali. Dalla
progettazione dell'indagine all'analisi dei dati
Domenica Fioredistella Iezzi
CAPITOLO 1 STATISTICA SOCIALE: L’ARTE DI APPRENDERE DAI DATI
1.1 TERMINOLOGIA STATISTICA E CONCETTI INTRODUTTIVI
STATISTICA Scienza basata sull’osservazione della realtà. Fornisce risposte a specifiche domande di ricerca.
Associa una misura di probabilità ad ogni risposta o conclusione raggiunta
Insieme di metodologie finalizzate a Ricavare dati
Organizzare, sintetizzare, analizzare, interpretare, presentare e rappresentare
graficamente le conclusioni derivate dai dati.
Possiamo vedere la statistica come un processo che si occupa delle seguenti fasi:
Raccolta delle informazioni;
Sintesi dei dati;
Analisi dei dati (con la finalità di trarre conclusioni);
Verifica della correttezza delle conclusioni;
Generalizzazione dei risultati a cui si è pervenuti.
1. IDENTIFICARE
L’OBIETTIVO
DELLA RICERCA
2. RACCOGLIERE I
DATI NECESSARI
(per fornire una
risposta al punto
1)
3. DESCRIVERE I
DATI
4. FARE INFERENZA
Le domande devono
essere formulate in modo
dettagliato al fine di
identificare la popolazione
da esaminare
Spesso
l’osservazione/misura
dell’intera popolazione è
difficoltosa o costosa.
Si osserva/misura solo un
campione della
popolazione.
Se i dati non sono raccolti
in modo corretto, le
conclusioni che si
traggono sono prive di
significato
La statistica descrittiva
permette di ottenere una
panoramica generale dei
dati a disposizione, e
suggerisce quali metodi
statistici inferenziali
potrebbero essere
utilizzati
Estendere alla
popolazione i dati ottenuti
sul campione, usando
appropriate tecniche, e
riportare il livello di
affidabilità delle
conclusioni che si sono
tratte
STATISTICA SOCIALE metodologie per la raccolta e l’analisi di dati riguardanti fenomeni sociali
STATISTICA PER LE SCIENZE SOCIALI insieme di metodi per la raccolta e l’analisi di dati, il cui utilizzo consente di
descrivere, valutare e prevedere fenomeni sociali
sono legati all’organismo sociale
Sono avvenimenti e azioni che influiscono
sulla collettività
La statistica:
Progetta e pianifica la raccolta dei dati necessari per le ricerche;
Analizza dei dati di un insieme di fenomeni collettivi, illustrandoli attraverso opportune sintesi;
Formula delle previsioni dall’osservazione e dall’analisi di un campione statistico.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21

Anteprima parziale del testo

Scarica Introduzione alla Statistica Sociale: Metodi di Raccolta e Analisi dei Dati e più Appunti in PDF di Statistica applicata alla psicologia solo su Docsity!

Statistica per le scienze sociali. Dalla

progettazione dell'indagine all'analisi dei dati

Domenica Fioredistella Iezzi

CAPITOLO 1 – STATISTICA SOCIALE: L’ARTE DI APPRENDERE DAI DATI

1.1 TERMINOLOGIA STATISTICA E CONCETTI INTRODUTTIVI

STATISTICA Scienza basata sull’osservazione della realtà. Fornisce risposte a specifiche domande di ricerca. Associa una misura di probabilità ad ogni risposta o conclusione raggiunta Insieme di metodologie finalizzate a Ricavare dati Organizzare, sintetizzare, analizzare, interpretare, presentare e rappresentare graficamente le conclusioni derivate dai dati. Possiamo vedere la statistica come un processo che si occupa delle seguenti fasi:  Raccolta delle informazioni;  Sintesi dei dati;  Analisi dei dati (con la finalità di trarre conclusioni);  Verifica della correttezza delle conclusioni;  Generalizzazione dei risultati a cui si è pervenuti.

  1. IDENTIFICARE L’OBIETTIVO DELLA RICERCA

2. RACCOGLIERE I

DATI NECESSARI

(per fornire una risposta al punto

3. DESCRIVERE I

DATI

4. FARE INFERENZA

Le domande devono essere formulate in modo dettagliato al fine di identificare la popolazione da esaminare Spesso l’osservazione/misura dell’intera popolazione è difficoltosa o costosa. Si osserva/misura solo un campione della popolazione. Se i dati non sono raccolti in modo corretto, le conclusioni che si traggono sono prive di significato La statistica descrittiva permette di ottenere una panoramica generale dei dati a disposizione, e suggerisce quali metodi statistici inferenziali potrebbero essere utilizzati Estendere alla popolazione i dati ottenuti sul campione, usando appropriate tecniche, e riportare il livello di affidabilità delle conclusioni che si sono tratte STATISTICA SOCIALE metodologie per la raccolta e l’analisi di dati riguardanti fenomeni sociali STATISTICA PER LE SCIENZE SOCIALI insieme di metodi per la raccolta e l’analisi di dati, il cui utilizzo consente di descrivere, valutare e prevedere fenomeni sociali sono legati all’organismo sociale Sono avvenimenti e azioni che influiscono sulla collettività La statistica: ➢ Progetta e pianifica la raccolta dei dati necessari per le ricerche; ➢ Analizza dei dati di un insieme di fenomeni collettivi, illustrandoli attraverso opportune sintesi; ➢ Formula delle previsioni dall’osservazione e dall’analisi di un campione statistico.

ESEMPI di fenomeni sociali: o Mortalità , ossia il numero di decessi in un dato periodo di tempo → ha delle conseguenze sulla struttura per età di una popolazione, sulle forze di lavoro, sull’organizzazione del sistema di assistenza e previdenza; o Turismo → riguarda il movimento di un insieme di individui e comporta la predisposizione di strutture ricettive, di vie di comunicazione e di trasporto; o Emigrazione , ossia lo spostamento dai luoghi di origine e l’insediamento in altri territori per motivi di lavoro o di clima di una molteplicità di individui → determina effetti rilevanti sulla collettività di partenza o di arrivo. Elementi che caratterizzano il fenomeno sociale:

  1. Può essere misurato direttamente o indirettamente;
  2. Coinvolge una molteplicità di soggetti;
  3. Ha ripercussioni sull’intera collettività;
  4. Analizza i fatti in termini quantitativi→ è di tipo statico FENOMENO STATISTICO tutto ciò che può essere direttamente (es. evento demografico) o indirettamente (es. qualità di vita di una popolazione) osservato e riguarda una molteplicità di unità statistiche. VARIABILI STATISTICHE O CARATTERI caratteristiche che permettono di analizzare e descrivere un fenomeno statistico ESEMPIO DI UNA TABELLA DI DATI A ogni riga corrisponde un individuo del quale sono stati rilevati alcuni caratteri. In corrispondenza di ogni individuo, ciascun carattere assume una determinata modalità. Tutti gli studenti nel loro insieme compongono un collettivo. Ogni individuo costituisce un’unità elementare ossia un’unità statistica. Ciò che voglio conoscere sono le caratteristiche oggetto di studio o caratteri. Cosa troviamo in tabella:

NUMERO

MATRICOLA

SESSO ETA’

(IN ANNI

COMPIUTI)

PESO

(IN

KG)

STATURA

(IN CM)

SCUOLA

SECONDARIA

REGIONE

RESIDENZA

2.212 Maschio 21 67 170 Liceo classico Lazio 5.214 Femmina 19 54 160 Liceo scientifico Lazio 3.691 Femmina 18 60 170 Liceo scientifico Abruzzo 4.545 Maschio 24 90 185 Istituto tecnico Campania 2.211 Maschio 27 87 194 Liceo artistico Campania 4.023 Maschio 23 70 185 Liceo classico Lazio 1.230 Femmina 21 68 174 Istituto tecnico Lazio 8.532 Femmina 22 55 158 Liceo classico Lazio 9.574 Maschio 23 64 177 Liceo scientifico Abruzzo 3.256 Femmina 21 59 170 Liceo classico Lazio

 Tabelle e distribuzioni di frequenza;  Grafici;  Statistiche riassuntive Le conclusioni che si traggono riguardano solamente l’insieme dei dati analizzati. La conoscenza statistica di un fenomeno può avvenire attraverso:

  1. Rilevazione completa → censuaria → i censimenti sono utili per disegnare gli scenari, ma non riescono a cogliere le evoluzioni dei fenomeni
  2. Rilevazione parziale → campionaria → per essere rappresentativa deve consentire di ricostruire le caratteristiche della popolazione oggetto di studio. insieme di N unità statistiche che costituiscono l’oggetto di studio (N è l’ampiezza della popolazione) Vantaggi: notevole riduzione dei tempi e dei costi, possibilità di misurare e controllare l’attendibilità delle Informazioni raccolte → quantità e qualità delle informazioni raccolte da un’indagine campionaria possono essere superiori a quelle di un censimento CENSIMENTO rilevazione condotta su tutte le unità di una popolazione. È:  Diretta e individuale , ogni unità rispondente è enumerata separatamente con tutte le sue caratteristiche;  Trasversale , riferita a un preciso istante. CAMPIONE insieme delle n (ampiezza del campione) unità campionarie selezionate tra le N unità della popolazione; rappresentano la popolazione ai fini dello studio statistico n « N → n è molto più piccolo di N INFERENZA STATISTICA procedimento per cui si inducono le caratteristiche di una popolazione dall’osservazione del campione probabilistico ci permette di trarre inferenze o conclusioni sulla popolazione a partire dal campione Misure di sintesi:Parametri, descrivono una caratteristica della popolazione;  Statistiche , descrivono un campione;  Stimatore, funzione che associa ad ogni possibile campione un valore del parametro da stimare → il suo valore assunto, in corrispondenza ad un particolare campione è detto stima STATISTICA INFERENZIALE insieme dei metodi che consentono di stimare una caratteristica di una popolazione, oppure di prendere una decisione che concerne l’intera popolazione, sulla base di un campione estratto casualmente → utilizza i dati statistici, anche opportunamente sintetizzati dalla statistica descrittiva, per fare previsioni di tipo probabilistico su situazioni future o comunque incerte. Ad esempio esaminando un piccolo campione estratto da una grande popolazione cerca di valutare la frazione della popolazione che possiede una certa caratteristica, ha un certo reddito o voterà per un certo candidato. 1.4 IL DATO STATISTICO E L’INFORMAZIONE DATO STATISTICO evento osservato su un individuo del collettivo statistico registrato eliminando le caratteristiche non ritenute essenziali risultato dell’operazione di rilevazione di una data caratteristica su un individuo del collettivo statistico

Il dato iniziale può essere elaborato, ottenendo il dato sintetico →con il dato iniziale, ricostruito ed elaborato, si ottiene un output. Il dato diventa informazione quando viene: − Memorizzato; − Organizzato; − Classificato; − Messo in relazione; − Interpretato I dati statistici si distinguono in:  Microdati, dati elementari che si riferiscono alla singola unità di rilevazione (es. dati relativi a ciascun intervistato);  Macrodati, dati risultanti da un calcolo (somma, differenza, rapporto) effettuato sui microdati (es. dati aggregati per sesso degli intervistati)  Metadati, sono informazioni sul processo di produzione dei dati, ossia sul dove, quando, come e da chi i dati sono stati ottenuti LABORATORIO 1. INTRODUZIONE ALL’ELABORAZIONE DATI CON EXCEL Archivio o database → si presenta come una tabella. Consente di organizzare i dati grezzi in informazioni utili. È composto da:  Righe, rappresentano le unità statistiche  Colonne, caratteri oggetto di studio EXCEL → foglio elettronico, permette di costruire un archivio immettendo i dati in forma matriciale. MATRICE tabella di numeri disposta su n righe e p colonne Si dicono elementi della matrice Per distinguere gli elementi della matrice si utilizza aiji (riga) j (colonna) a cui l’elemento appartiene. i e j sono contatori → i conta le righe che compongono la matrice, conta quindi i valori da 1 a ni=1 , i =2 … j conta le colonne che compongono la matrice, conta quindi i valori da 1 a pj =1 , j =2 … La matrice viene indicata A oppure A ij La matrice può essere:  Quadrata se il numero delle righe è uguale a quello delle colonne → n = p  Rettangolare se il numero delle righe è diverso a quello delle colonne → n ≠ p L’espressione in excel =somma (B2:B5) attiva la funzione di addizione delle celle che vanno da B2 a B5. Supponendo di osservare un carattere x₁ , x₂ , … su un campione di n unità statistiche e di volerne fare la somma, potremmo scrivere x₁ + x₂ + … ma, questo modo di scrivere la somma può risultare scomodo. Allora per sommare i valori di un dato carattere si utilizza il simbolo della lettera greca sigma ∑

Punto di arrivo n elementi

∑xᵢ → sommatoria delle xᵢ per i che va da 1 a n

Punto di partenza I=1 indice

SISTAN rete di soggetti pubblici e privati che fornisce al Paese e agli organismi internazionali l’informazione statistica ufficiale. Composto da una rete di circa 10.000 operatori statistici. È il garante dell’omogeneità e della correttezza dei metodi statistici utilizzati Comprende:  L’istituto nazionale di statistica → ISTAT, a cui è affidato il coordinamento;  Gli enti e gli organismi pubblici di informazione statistica → INEA, ISFOL;  Gli uffici di statistica delle amministrazioni dello Stato e di altri enti pubblici, degli Uffici territoriali del Governo, delle Regioni e Province autonome, delle Province, delle Camere di commercio e dei Comuni;  Gli uffici di statistica di altre istituzioni pubbliche e private che svolgono funzioni di interesse pubblico. Il governo del SISTAN è affidato all’ISTAT, che si avvale del Comitato di indirizzo e coordinamento dell’informazione statistica (COMSTAT); La vigilanza sulle attività del SISTAN è affidata alla Commissione per la garanzia dell’informazione statistica che è un organo esterno, autonomo e indipendente. Vigila su: − Imparzialità e completezza dell’informazione statistica; − Qualità delle metodologie; − Conformità delle rilevazioni alle direttive degli organismi internazionali e comunitari. 2.3 L’ISTITUTO NAZIONALE DI STATISTICA → ISTAT ISTAT ente di ricerca pubblico, presente in Italia dal 1926. Principale produttore di statistica ufficiale a supporto dei cittadini e dei decisori pubblici. La sede centrale è a Roma. I principali compiti affidati all’ISTAT sono: − Predisposizione del programma statistico nazionale (PSN); − Esecuzione dei censimenti e delle principali rilevazioni statistiche previste dal PSN; − Indirizza e coordina le attività statistiche degli enti del SISTAN; − Definisce i metodi di classificazione e rilevazione dei fenomeni statistici; − Gestisce i rapporti con enti e uffici internazionali nel settore della informazione statistica. Dal sito web dell’ISTAT l’utente ha la possibilità di analizzare le statistiche per argomento. Il sito è organizzato in 12 macro argomenti:

  1. Popolazione → molto noto. Si effettua ogni 10 anni. Il 15° è stato realizzato ne 2011, il prossimo sarà nel
    1. Il primo fu nel 1861, non furono realizzati quello del 1891 e quello del 1941, ne fu aggiunto uno nel
    2. Dal 14° sono stati censiti anche gli edifici.
  2. Famiglia e società;
  3. Istruzione e lavoro;
  4. Salute e welfare;
  5. Giustizia e sicurezza;
  6. Prezzi;
  7. Industria e servizi → l’8° censimento si è svolto nel 2001
  8. Commercio estero;
  9. Conti economici;
  10. Pubblica amministrazione e istituzioni private;
  11. Agricoltura e zootecnia;
  12. Ambiente e territorio. Le statistiche prodotte dall’ISTAT possono essere classificate in: a. Censimenti , sono rilevazioni:  Totali , si riferiscono all’intera popolazione oggetto di studio;  Generali , esaminano aspetti strutturali che riguardano le unità di rilevazione;  Trasversali , si riferiscono a un istante temporale;  Dirette , le informazioni vengono rilevate sulle unità statistiche di riferimento;  Periodiche.

b. Indagini multiscopo , nasce per rispondere ai nuovi bisogni informativi derivanti dalle trasformazioni economiche, sociali e demografiche che coinvolgono vasti strati della popolazione e che modificano i comportamenti individuali e familiari. Sono sette:

  1. Aspetti della vita quotidiana → annuale
  2. Viaggi e vacanze → trimestrale
  3. Condizioni di salute e ricorso ai servizi sanitari → quinquennale
  4. I cittadini e il tempo libero → quinquennale
  5. Sicurezza dei cittadini → quinquennale
  6. Famiglie, soggetti sociali → quinquennale
  7. Uso del tempo → quinquennale c. Altre indagini. 2 .4 L’ISTITUTO STATISTICO DELLE COMUNITA’ EUROPEE E IL SISTEMA STATISTICO EUROPEO → EUROSTAT EUROSTAT ufficio statistico delle comunità europee. L’EUROSTAT:  Rende accessibili agli utenti le statistiche comunitarie divise per temi;  Uniforma i concetti e le definizioni usate dagli stati membri;  Definisce classificazioni e metodologie di indagini comuni;  Non raccoglie direttamente i dati ma armonizza le informazioni. Nel sito web di EUROSTAT i dati sono raccolti in nove macro – temi:
  8. Statistiche generali;
  9. Economia e finanza;
  10. Popolazione e condizioni sociali;
  11. Industria, commercio e servizi;
  12. Agricoltura, silvicoltura e pesca;
  13. Commercio estero;
  14. Trasporti;
  15. Ambiente ed energia;
  16. Scienze e tecnologia. La banca dati ha una struttura ad albero, con accesso per sotto - temi. I dati si possono consultare come tabelle, dati, metodologia e pubblicazioni. I dati consultabili possono essere di tipo oggettivo e soggettivo o di percezione. EUROBAROMETRI sondaggi di opinione sopranazionali, mirati a conoscere e comprendere gli atteggiamenti dei cittadini europei. Vengono condotte dal 1973. La Commissione europea le utilizza per l’elaborazione di proposte e testi normativi e come metro di valutazione del proprio operato Vengono effettuati simultaneamente in tutti i paesi dell’Unione Si basano su un campione di circa 28.000 cittadini rappresentativo dell’intera popolazione UE sopra i 15 anni Conduce tre tipologie di indagini statistiche:
  1. Eurobarometro standard, realizzato due volte l’anno. Mira a conoscere le tendenze a lungo termine dell’opinione pubblica europea.
  2. Eurobarometro “speciali”, dette anche flash. Sono indagini ciclicamente ripetute su temi di attualità.
  3. Eurobarometro su temi contingenti. Sono indagini approfondite su temi legati ad eventi contingenti, su cui la Commissione ritiene utile valutare il livello di conoscenza, lo stato d’animo o la sensibilità dei cittadini. 2.5 LA QUALITA’ DEI DATI: CONCETTI E DEFINIZIONI Nella realizzazione di un’indagine statistica è fondamentale che il dato statistico prodotto sia di qualità. QUALITA’ DI UNA STATISTICA capacità di soddisfare le esigenze di informazioni statistiche degli utenti. ISO 8402 – 1984 « la qualità indica quanto un bene, un prodotto o un servizio soddisfi le esigenze dei clienti. Ciò include tutte le dimensioni dei bisogni dei clienti: le specifiche, la consegna, il metodo, il prezzo. Insomma tutte le componenti che vanno a definire la qualità » « la qualità di un bene o servizio è il possesso della totalità delle caratteristiche che portano al

CAPITOLO 3 – LA PROGETTAZIONE DI UN’INDAGINE STATISTICA

3. 1 LE TAPPE DI UN’INDAGINE CAMPIONARIA

INDAGINE STATISTICA → SURVEY rilevazione fatta su un campione → lo studio non è esteso a tutta la popolazione di riferimento, ma a una parte della stessa. È principalmente influenzata da:  Tempi  Costi CENSIMENTO  Richiede tempi troppo lunghi sia per la rilevazione sia per l’elaborazione→ l’ISTAT nel 2001 ha condotto una rilevazione, i cui primi risultati parziali sono stati presentati nel 2004. L’obiettivo del censimento è quello di fotografare la popolazione in un dato momento. Il tempo modifica le situazioni. INDAGINE CAMPIONARIA consente di analizzare le caratteristiche di una popolazione attraverso lo studio di una porzione della popolazione stessa (campione). Deve avere come caratteristiche:

  • Assenza di distorsione
  • Affidabilità Richiede un protocollo di riferimento ossia, un insieme di regole da seguire, un insieme di linee guida o procedure concordate, regolate e pubblicamente riconosciute Si compone di 4 fasi fondamentali:
  1. Definizione degli oggetti e degli obiettivi della ricerca. Individuare la popolazione di riferimento. La definizione della popolazione dipende dagli obiettivi di ricerca. ▪ Popolazione teorica, insieme di tutti i casi che costituiscono la popolazione oggetto di indagine. Es. indagine sulle prossime elezioni politiche → popolazione teorica: tutti gli italiani con diritto di voto e con età uguale o superiore a 18 anni. Non è sempre possibile accedere alla popolazione teorica per i seguenti problemi:
  • Limitate risorse economiche, di personale, di tempo disponibili
  • L’intera popolazione da studiare non è fisicamente raggiungibile
  • L’intera popolazione da studiare non è del tutto nota Per questi motivi si passa al CAMPIONAMENTO → insieme di procedure standardizzate di selezione delle unità statistiche da rilevare ▪ Popolazione accessibile, insieme di tutti i casi appartenenti alla popolazione teorica che sono effettivamente raggiungibili. Es. indagine sulle prossime elezioni politiche → popolazione accessibile: parte degli italiani con diritto di voto e con età uguale o superiore a 18 anni effettivamente intervistabili
  1. Definizione dell’approccio metodologico da adottare
  2. Rilevazione dei dati
  3. Analisi, interpretazione e divulgazione dei dati SONDAGGIO (^) ≠ INDAGINE STATISTICA Strumento per acquisire conoscenza statistica su un fenomeno Obiettivo di produrre statistiche, ovvero descrizioni riassuntive di carattere quantitativo, riguardanti la popolazione di interesse

➢ La qualità di un sondaggio non dipende soltanto dal campione, ma anche da come vengono formulate le domande. ➢ I risultati di un’indagine dipendono da tanti fattori. La pubblicazione dei dati di sondaggi deve essere sempre accompagnata dalle seguenti informazioni:  Soggetto che ha realizzato il sondaggio;  Criteri seguiti per l’individuazione del campione;  Metodo di raccolta delle informazioni e di elaborazione dei dati;  Numero delle persone interpellate e universo (popolazione) di riferimento;  Domande rivolte;  Percentuale delle persone che hanno risposto a ciascuna domanda;  Date in cui è stato realizzato il sondaggio DEMOSCOPIA O INDAGINE DEMOSCOPICA indagine statistica volta a misurare fenomeni che hanno l’obiettivo di analizzare tematiche di interesse pubblico, in molti casi si tratta di sondaggi di opinioni. Demoscopicodemos (popolo) skopèo (osservare)osservazione del popolo 3.2 TIPOLOGIE DI INDAGINI Nella fase di progettazione le indagini si possono distinguere in:  Trasversali, raccolgono informazioni di interesse riferite ad un particolare momento/periodo di tempo, con l’intento di stimare le caratteristiche riferite allo stato della popolazione oggetto nel momento/periodo di interesse. Es. censimento  Longitudinali, svolta rilevando più volte nel tempo il fenomeno oggetto della ricerca. I dati longitudinali sono essenziali perché:

  • Descrivono e analizzano adeguatamente i processi di mobilità/inerzia;
  • Controllano l’eterogeneità non osservata;
  • Conducono analisi sul comportamento individuale PANEL si utilizza nelle indagini sociali per indicare campioni permanenti o continui. Possono essere con:
  • Campione fisso, se la rilevazione è ripetuta con cadenza regolare nel tempo con lo stesso strumento di misura su un campione che è sempre lo stesso;
  • Campione ruotato, se una parte delle unità viene sostituita con altre unità, nelle diverse rilevazioni. Si stanno sviluppando una nuova tipologia di panel, grazie all’utilizzo sempre più massiccio di internet. Le società di rilevazione di mercato progettano indagini che siano in grado di dare indicazioni riguardo ai siti più visitati. A tal fine, vengono utilizzate apparecchiature che inserite nel PC registrano automaticamente le navigazioni degli utenti→ plug-in CLASSIFICAZIONE DELLE INDAGINI  Indagini occasionali, indagini pianificate allo scopo di ottenere stime riferite a caratteristiche possedute dalla popolazione in un singolo istante di tempo o riferite a un periodo;  Indagini ripetute senza sovrapposizione fra le unità indagate nelle diverse occasioni, sono spesso chiamate indagini periodiche o ricorrenti. L’indagine viene ripetuta in momenti programmati nel tempo su popolazioni (campioni) diverse;  Indagini ripetute con una parziale sovrapposizione del campione, sono indagini programmate ad intervalli di tempo regolari con l’uso di panel ruotati. Lo scopo è ridurre la varianza campionaria delle stime;  Indagini longitudinali senza rotazione , l’obiettivo è studiare modificazioni intervenute nel collettivo durante il tempo, utilizzando i cambiamenti avvenuti su record individuali_._ Lo scopo è studiare le trasformazioni nel tempo di una popolazione;  Indagini longitudinali con rotazione, è possibile mantenere il campione stesso rappresentativo della popolazione anche nelle occasioni successive alla prima. Per ottenere stime sia longitudinali che trasversali.

TIPOLOGIE DI CAMPIONAMENTO PROBABILISTICO

➢ Casuale semplice; ➢ Stratificato (proporzionale, uniforme, ottimale); ➢ Sistematico; ➢ A grappoli; ➢ A più stadi. IL CAMPIONAMENTO CASUALE SEMPLICE più semplice tecnica di selezione di un campione ma poco utilizzata. È necessaria la presenza di una lista della popolazione. Il procedimento è simile allo schema di estrazione da un’urna. Se si indica con n la dimensione del campione (numero di elementi del campione) e con N la dimensione della popolazione, (numero di elementi della popolazione), nel campionamento casuale semplice la probabilità che ogni individuo della popolazione ha di essere scelto alla prima estrazione (rapporto di probabilità) è 𝟏 𝑵 → ogni individuo della popolazione ha la stessa probabilità di essere scelto. La selezione del campione può essere fatta in due modi:

  1. Con reimmissione, ciascun elemento della popolazione è disponibile ad ogni estrazione, quindi ad ogni estrazione ogni sempre probabilità 1 elemento ha 𝑁 di essere estratto. In questo modo un elemento può essere nuovamente estratto in una successiva estrazione. Es. alla lotteria, alla prima estrazione si estrae un numero che poi viene reimmesso nell’urna e, ha la probabilità di essere estratto nuovamente.
  2. Senza reimmissione, ciascun elemento, una volta selezionato, non viene rimesso nella popolazione e non può più essere scelto di nuovo. In questo modo però gli i casi non hanno tutti la stessa probabilità di essere estratti, perché si altera la composizione del campione dopo ogni estrazione. Es. alla lotteria, alla prima estrazione si estrae un numero che poi non viene reimmesso nell’urna. In questo caso la probabilità che un’altra unità venga scelta alla seconda estrazione è 1 N− 1 ; alla terza estrazione^ 1 N− 2 e cosi via.. IL CAMPIONAMENTO STRATIFICATO la popolazione viene suddivisa in sottopopolazioni dette “strati”. Si utilizza quando, essendo in possesso di una lista completa della popolazione, si intende studiare un carattere specifico e determinante della popolazione. I campioni estratti da un sottogruppo sono più omogenei tra di loro e presentano una variabilità minore rispetto all’intera popolazione. Esistono due tipi di campionamento stratificato:
  3. Con frazione di campionamento costante, si divide la popolazione in strati il più possibile omogenei al loro interno e il più possibile eterogenei tra di loro. Occorre estrarre un campione casuale di n₁ elementi all'interno di ogni strato i. Il totale di elementi campionati deve essere n. Questo tipo di campionamento dà buoni risultati quando è bassa l'eterogeneità all'interno dei singoli strati.
  1. Con frazione di campionamento variabile , si divide la popolazione in strati il più possibile omogenei al loro interno e il più possibile eterogenei tra di loro e si estrae un campione casuale all'interno di ogni strato, ma dagli strati meno omogenei (ovvero dove è maggiore la variabilità) devono essere estratti più elementi. Il totale di elementi campionati deve essere n. Questo secondo tipo di campionamento dà buoni risultati quando è alta l'eterogeneità all'interno dei singoli strati. La frazione campionaria in ogni strato deve essere proporzionale allo scarto tipo dello strato. Esiste un caso particolare del campionamento stratificato chiamato campione ottimo di Neyman. È un sinonimo di campione per strati con numerosità variabili di campionamento all'interno di ogni strato in maniera da rendere minima la varianza della stima del carattere in questione. IL CAMPIONAMENTO SISTEMATICO in questo tipo di campionamento viene estratta casualmente soltanto la prima unità da intervistare con probabilità 1 𝑁. Dopo aver fissato la numerosità campionaria n , vengono selezionate le unità successive ogni K unità. Si intervista un individuo ogni intervallo K → K = 𝑁 𝑛

Si utilizza quando le unità che compongono l’universo sono numerabili progressivamente e si possono estrarre delle unità di campionamento distanziate da un intervallo costante. Es. indagine sugli hotel di Roma. Ci sono 140 hotel e il campione deve essere pari a 20 K = 𝑵 𝒏 = 𝟏𝟒𝟎 𝟐𝟎 = 7 → selezionato il primo hotel da fare entrare nel campione, gli altri 19 saranno selezionati dalla lista 1 ogni 7. IL CAMPIONAMENTO A GRAPPOLO E A STADI L’unità di campionamento è un gruppo o grappolo di unità della popolazione. Si estrae un campione casuale di grappoli e tutte le unità ad esso appartenenti sono oggetto di rilevazione. Nella selezione a stadi viene estratto casualmente un campione a partire dai grappoli. Sfutta l’esistenza di raggruppamenti naturali della popolazione. Viene scelto questo campione quando: − Non è disponibile una lista degli elementi della popolazione che, viene suddivisa in unità areali (quartieri, sezioni di censimento); − Convenienza amministrativa e organizzativa. 3.5 IL CAMPIONAMENTO NON PROBABILISTICO CAMPIONAMENTO NON PROBABILISTICO Si dice non probabilistico quando per ciascun caso la probabilità di essere incluso nel campione non è nota. La differenza con campionamento probabilistico è rappresentata dalla selezione non casuale dei campioni. Non fornisce a ciascuna unità della popolazione la stessa occasione di essere parte del campione: alcuni gruppi o individui hanno maggiore probabilità di essere scelti, altri meno. Prevede la selezione del campione in base a criteri di comodo o di praticità per esempio perché sono più facilmente accessibili, o per ragioni di costo.

CAMPIONAMENTO

PROBABILISTICO

CASUALE

SEMPLICE

STRATIFICATO SISTEMATICO A GRAPPOLI A PIU' STADI

3.6 ALCUNI PROBLEMI DI CAMPIONAMENTO NELLA RICERCA SOCIALE

In un’indagine campionaria, è opportuno tener conto di diverse fonti di errore. Si distingue l’errore in:  Errore campionario , deriva dalla scelta di osservare un sotto – insieme della popolazione. È un errore programmabile. Riguarda soltanto i campioni probabilistici. Può essere stimato;  Errore non campionario , nasce in ogni fase di progettazione, esecuzione ed elaborazione. Ha un impatto maggiore rispetto all’errore campionario. Non si programma e richiede metodi ed indagini ad hoc per essere stimato. È l’involontaria conseguenza dei limiti e delle imperfezioni dell’indagine. PRINCIPALI CATEGORIE DI ERRORE NON CAMPIONARIO  Errore di copertura → un’unità della popolazione non è presente o non è reperibile;  Mancata risposta parziale o totale → l’unità intervistata non risponde. I motivi possono essere: − Soggetti non contattabili; − Soggetti non disponibili a rispondere; − Soggetti disponibili, ma non in grado di rispondere È opportuno utilizzare delle misure correttive, a meno che la proporzione di non rispondenti sia piccola. Due tipologie di misure correttive:

  1. Metodi che cercano di ridurre il numero delle mancate risposte. Si dividono in 3 sotto – tipologie: a) Interventi di pianificazione a livello di indagine → usare un questionario semplice e chiaro, contattando per più volte le persone disponibili a rispondere; b) Interventi a livello di tecniche di raccolta di dati → richiamo o call- back → richiamare l’intervistato in un altro momento, magari usando un intervistatore più esperto; c) Metodi per la tutela della riservatezza → prevedere l’auto - compilazione del questionario che possa assicurare l’anonimato del rispondente. Tecnica Computer Assisted Interviewing (CAI), rende possibile la somministrazione di questionari anche complessi senza l’ausilio dell’intervistatore.
  2. Metodi che cercano di correggere gli effetti dovuti alle mancate risposte. Si dividono in due grandi categorie: a) Metodi di imputazione → si basano sull’idea che è possibile stimare le probabilità di risposta delle unità. Vi sono vari metodi: − Il metodo della media (aritmetica); − Il metodo delle classi di imputazione, il campione viene suddiviso in sottoinsiemi di unità (classi) e, viene usato il metodo della media all’interno di ogni classe; − I metodi hot e cold deck, si utilizza un valore relativo a un rispondente della stessa indagine o di un’indagine diversa. Dà risultati migliori. b) Metodi di riponderazione → utilizzano variabili strutturali (sesso, età, stato civile) per ricostruire le mancate risposte  Errore di rilevazione → dall’unità osservata viene rilevato un valore diverso da quello vero;  Errore di registrazione e codifica → viene registrato un valore diverso da quello rilevato.

CAMPIONAMENTO

NON

PROBABILISTICO

ACCIDENTALE PER QUOTE A VALANGA PER TESTIMONI

PRIVILEGIATI

CAPITOLO 4 – IL QUESTIONARIO

4. 1 INTRODUZIONE

QUESTIONARIO strumento utilizzato per raccogliere informazioni in un’indagine. Composto da un insieme strutturato di domande, eventualmente corredato dalle possibili risposte, registrato su un supporto adeguato per la somministrazione. Criteri guida per la costruzione:Chiarezza;Semplicità;Brevità. Le fasi che caratterizzano la costruzione di un questionario sono tre:

  1. Progettazione concettuale utilizzando lo schema Entità – Relazione (E-R);
  2. Redazione del questionario , scelta della formulazione e del flusso di domande → flow – chart;
  3. Verifica del questionario , mediante pre- test, test delle alternative e indagine pilota. SIMBOLI DELLO SCHEMA E-R SIMBOLOGIA LINGUAGGIO INFORMATICO

LINGUAGGIO

STATISTICO

Entità Collettivo / popolazione Attributo di una entità Carattere Relazione tra entità Relazione tra collettivi Gerarchia di generalizzazione Partizione di un collettivo di un sottocollettivo Sottoinsieme di un insieme Sottocollettivo di un collettivo SIMBOLI DEL DIAGRAMMA DI FLUSSO La freccia indica il flusso delle domande

CAPITOLO 7 – LA DISTRIBUZIONE DI UN CARATTERE E LA SUA RAPPRESENTAZIONE GRAFICA

7. 1 LE DISTRIBUZIONI UNITARIE E DI FREQUENZA

In una tabella dati: NOME SESSO ALTEZZA PESO CAIO M 178 80 TIZIA F 167 58 Distribuzione unitaria multipla Distribuzione unitaria semplice  Ogni riga (record) della tabella descrive il profilo di uno studente;  Ogni studente rappresenta un’unità del collettivo;  Ogni colonna illustra la distribuzione unitaria semplice dei caratteri oggetto di studio DISTRIBUZIONE UNITARIA SEMPLICE elenco delle modalità osservate (valori), unità per unità, nel collettivo preso in esame → si rileva un solo carattere DISTRIBUZIONE UNITARIA MULTIPLA → si rilevano più caratteri sullo stesso collettivo L’informazione contenuta nella distribuzione unitaria di un carattere diventa difficilmente fruibile all’aumentare del numero di unità statistiche considerate. Una prima descrizione sintetica del carattere osservato è data dalla frequenza con cui si presenta la sua modalità: DISTRIBUZIONE UNITARIA → sintesi → DISTRIBUZIONE DI FREQUENZA FREQUENZA ASSOLUTA di una modalità di un carattere, indica il numero di volte in cui questa di presenta in un collettivo. Es. supponiamo di aver il seguente insieme di dati: {1,2,5,4,6,4,3,7,1,5,6,5,3,4,5,1} e, vogliamo trovare la frequenza relativa del valore 5. Prima di determinare la frequenza relativa, dobbiamo trovare la frequenza assoluta che, in questo caso è 4, dato che il valore 5 appare 4 volte nell’insieme di dati. in un collettivo composto da n elementi, una variabile statistica X può assumere K modalità distinte, x 1 , x2, x 3 , …, xk → distribuzione unitaria per ogni unità della variabile X si fa corrispondere la quantità totale misurata/rilevata sui n elementi n1, n 2 , n 3 , …, nk → distribuzione di quantità DISTRIBUZIONE QUANTITA’ X 1 n 1 X 2 n 2 … … XI ni … … XK nk La frequenza j - esima è indicata con nj ed è sempre un numero intero → frequenza assoluta n 1 + n 2 + … + nj + … + nk = ∑ 𝑘 𝑗= 1 𝑛𝑗= n DISTRIBUZIONE DI FREQUENZA ASSOLUTA SEMPLICE schema che associa alle modalità che può assumere un carattere

X le corrispondenti frequenze assolute Un carattere può essere:  QuantitativoDiscreto , le modalità sono numeri naturali − Continuo , le modalità sono intervalli continui di valore  Qualitativo , le modalità saranno nomi o stringhe di caratteri Es. Carattere qualitativo → aggettivi Carattere quantitativo discreto → numeri naturali Quando il carattere è quantitativo o qualitativo ordinabile è opportuno, prima di avviare l’operazione di conteggio, ordinare le modalità in senso crescente, ossia porre i valori o le etichette verbali del carattere dal carattere più piccolo al più grande. La frequenza assoluta non permette di confrontare valori tra collettivi distinti. Per questo è necessario calcolare la frequenza relativa fj fj = nj n = nj ∑j= 1 n j k per j = 1,2, …, k Es. VOTO IN STATISTICA FREQUENZA ASSOLUTA ni

FREQUENZA

RELATIVA fi 18 (x 1 ) 3 (n 1 ) 𝑛^1 𝑛

3 8

= 0,375 (f 1 )

24 (x 2 ) 1 (n 2 ) 0,125 (f 2 ) 26 (x 3 ) 2 (n 3 ) 0,25 (f 3 ) 30 (x 4 ) 2 (n 4 ) 0,25 (f 4 ) TOTALE 8 (n) 1 (f) La somma di tutte le frequenze relative è pari a 1 f 1 + f 2 +… = ∑ 𝑘 𝑗= 1 𝑓𝑗= Generalmente si preferisce utilizzare al posto delle frequenze relative le frequenze percentuali (pi) e si ottengono dalle frequenze relative moltiplicate per 100 fi x 100 = pi DISTRIBUZIONI DI FREQUENZA possono essere:  Sconnesse, se, date due modalità, è possibile solo affermare se queste sono uguali o diverse − Carattere qualitativo sconnesso Es. sesso M/F Tipo di attività studente/operaio/impiegato − Carattere qualitativo nominale Es. nomi Chiara/Marco/Maria/Giovanni

VOTO IN STATISTICA FREQUENZA

ASSOLUTA

18 Ordine 3 24 crescente 1 26 2 30 2 TOTALE 8

SESSO NUMERO STUDENTI

MASCHIO 5

FEMMINA 3

TOTALE 8

FREQUENZA

PERCENTUALE PI 0,375 X 100 = 37,50 % 0,125 X 100 = 12,50 % 0,25 X 100 = 25 % 0,25 X 100 = 25 % 100 %