




























Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
le fasi di un indagine statistica
Tipologia: Sintesi del corso
1 / 36
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!





























L'indagine statistica è lo strumento statistico mediante il quale si acquisiscono informazioni su uno o più fenomeni attinenti ad una popolazione. Scopo dell’indagine è quello di produrre statistiche, ovvero descrizioni riassuntive di carattere quantitativo, riguardanti il collettivo di interesse. La progettazione e l’esecuzione di un’indagine è frutto di un impegno multidisciplinare che coinvolge necessariamente un elevato numero di professionalità. L’attività di progettazione deve procedere prendendo in considerazione tutti gli aspetti coinvolti, da quelli riguardanti i fenomeni di interesse e quelli di carattere più operativo. L’indagine statistica si articola nelle fasi elencate di seguito.
Entrando nel dettaglio delle singole fasi si può sviluppare lo schema riportato nella pagina seguente.
Nella fase di progettazione dell’indagine statistica si costituisce un gruppo che riunisce tutte le professionalità necessarie ed ha come obiettivo la realizzazione di un documento di progettazione nel quale devono essere illustrate nel dettaglio tutte le soluzioni proposte e discusse le alternative considerate. Affinché la progettazione di un'indagine possa dirsi compiuta è inoltre necessario prevedere una o più sperimentazioni finalizzate a saggiare nella pratica le soluzioni ideate. La progettazione si articola nelle fasi presentate di seguito.
Consiste nell’individuazione dei principali aspetti del fenomeno oggetto di studio. In pratica si costruisce un modello di riferimento che rappresenta una versione semplificata del fenomeno su cui si deve effettuare l’indagine. Nel delimitare precisamente cosa interessa da cosa non interessa si deve tener presente che più ampio è l’arco degli argomenti trattati, maggiori divengono le complessità da affrontare sul piano concettuale statistico ed operativo. È necessario definire se interessa descrivere un fenomeno nella sua componente statica o in quella dinamica e specificare se interessa confrontare i risultati con informazioni relative ad altre realtà territoriali. Il documento di progettazione dovrà riportare indicazioni su: a) la popolazione di riferimento : data dall’insieme di unità statistiche alle quali si intende estendere i risultati dell’indagine. È necessario specificare esattamente le condizioni di eleggibilità, ovvero le caratteristiche che determinano l’inclusione (o l’esclusione) delle unità statistiche della popolazione. b) le caratteristiche di interesse : si deve stabilire quali sono le variabili rispetto alle quali si effettuerà la rilevazione delle informazioni. La definizione di tali variabili dovrebbe procedere attraverso una progressiva identificazione e raffinamento del fenomeno di interesse nelle sue componenti, fino ad identificare gli aspetti salienti. L’obiettivo di tale procedimento dall’alto verso il basso (TOP-DOWN) è quello di definire delle caratteristiche immediatamente utili alla ricerca. D’altro canto è necessario predisporre un analogo meccanismo dal basso verso l’alto (BOTTOM-UP) che tenga conto dell’effettiva misurabilità, sulle unità statistiche da indagare, delle caratteristiche che si vogliono conoscere. E’ utile procedere nella definizione delle variabili utilizzando tecniche quali il “ modello entità-relazioni ” che sarà presentato nell’ambito della costruzione del questionario.
c) le classificazioni delle variabili : dato dall’insieme delle categorie assunte da una variabile qualitativa sconnessa o ordinale. Definire una classificazione è un momento particolarmente critico. Ad esempio misurare il gradimento di uno spettacolo ricorrendo a quattro anziché a cinque categorie (ma anche denominando in modo appena diverso le stesse cinque categorie) può fornire risultati addirittura opposti. E’ quindi opportuno, soprattutto se si desidera confrontare i risultati dell’indagine con altre fonti di informazione disponibili, ricorrere a classificazioni comunemente utilizzate. Per alcune variabili particolarmente complesse da definire (attività economiche, professioni, malattie) sono disponibili classificazioni standard riconosciute a livello internazionale. In tutti i casi, soprattutto in quelli più complessi, nel definire una classificazione è opportuno, se possibile, procedere ad aggregazioni o raffinamenti di categorie utilizzate da classificazioni già esistenti in modo da preservare almeno in parte la confrontabilità dei risultati dell’indagine.
Si deve decidere qual è il tipo di indagine più consono a produrre le statistiche che interessano e se effettuare un’indagine totale o campionaria. Le indagini possono essere: a) occasionali : si tratta di indagini pianificate allo scopo di ottenere stime riferite a caratteristiche possedute dalla popolazione in un singolo istante di tempo (es.: distribuzione per età della popolazione in un dato istante) o riferite a un periodo (es.: distribuzione del fatturato realizzato nell’arco di un anno). b) ripetute : sono spesso chiamate indagini periodiche o ricorrenti. Secondo questa modalità un’organizzazione di indagine viene ripetuta in momenti programmati nel tempo. L’organizzazione adottata non prevede una sovrapposizione, neanche parziale, del campione di unità in differenti occasioni. c) longitudinali senza rotazione : sono indagini predisposte con lo scopo di seguire un particolare gruppo di unità nel tempo,in modo da creare un record longitudinale per ogni unità osservata. L’obiettivo è quello di studiare le modificazioni intervenute nel collettivo durante il tempo, utilizzando i cambiamenti avvenuti sui record individuali. E’ importante sottolineare che mediante un’indagine longitudinale senza rotazione è possibile produrre stime riferite alla sola popolazione di partenza dal momento che, senza disporre di ingressi di nuove unità, non si riesce a rappresentare gli eventuali mutamenti nella struttura del collettivo di riferimento.
interesse nella popolazione. La definizione delle modalità di estrazione del campione, della sua dimensione e delle funzioni dei dati utilizzate per ottenere, dal campione, stime riferite alla popolazione di interesse prende il nome di strategia di campionamento ed è basata sulla teoria statistica del campionamento. E' importante precisare che, qualora le unità da inserire nel campione siano selezionate con scelta ragionata e non con criteri di rigorosa casualità, non sarà più possibile garantire in alcun modo la rispondenza dei risultati delle analisi effettuate sui dati a requisiti statistici di affidabilità quali la correttezza e l'efficienza delle stime. Un’analisi più dettagliata delle strategie di campionamento è contenuta nella terza parte relativa alle tecniche di campionamento.
Con il termine tecnica di indagine si intende l’insieme delle modalità di contatto delle unità statistiche interessate dalla rilevazione e di reperimento delle informazioni oggetto di interesse. La scelta della tecnica di indagine più idonea a raccogliere le informazioni oggetto della ricerca è uno degli aspetti di maggiore importanza nella pianificazione e nell’esecuzione di una indagine ed è strettamente connessa ad altre caratteristiche quali il fenomeno indagato, gli archivi di base, la strategia di campionamento, l’organizzazione del personale sul campo, i costi e i tempi attesi. a) Intervista diretta ( o faccia a faccia ): l’intervista viene condotta da un rilevatore che legge le domande e le opzioni di risposta nell’esatto ordine e con lo stesso linguaggio adottati nel questionario, riportandovi quindi le risposte così come sono fornite dal rispondente. Se tale indagine è svolta tramite l’ausilio del computer si parlerà di CAPI (Computer Assisted Personal Interviewing). Vantaggi : - Si presta meglio ad alcuni disegni di indagine (es.: censimenti e campionamento areale) - Maggiore possibilità di contattare e convincere il rispondente a collaborare- Si identifica esattamente il rispondente - Possibilità di istruire il rispondente sul significato delle domande e sul modo corretto di fornire le risposte - Flessibilità negli strumenti utilizzabili - Interviste di maggiore durata. Svantaggi : - Costosa da implementare - Necessita di una organizzazione capillare sul territorio - Richiede tempi più lunghi di altri metodi per la raccolta dei dati - Maggiori rischi di condizionamento b) Intervista telefonica : l’intervista viene condotta al telefono da un intervistatore che legge le domande e le opzioni di risposta nell’esatto ordine e con lo stesso linguaggio adottati nel questionario, riportandovi quindi le risposte così come sono fornite dal rispondente. Se tale indagine è svolta tramite l’ausilio del computer si parlerà di CATI (Computer Assisted Telephone Interviewing). Vantaggi : - Costi minori rispetto all’intervista faccia a faccia -
Tempestività della raccolta dati - Non è richiesta un’organizzazione sul territorio - Maggiore possibilità di controllo dell’operato dei rilevatori - Possibilità di contatto anche per le persone che non si trovano in casa in orari "canonici" - Bassi rischi di condizionamento e maggiore possibilità di porre quesiti delicati Svantaggi :- Impossibilità di contattare le famiglie senza telefono - Il rispondente non è identificato con certezza - Limitazioni nella lunghezza del questionario e nell’aiuto fornito ai rispondenti c) Questionario postale autocompilato : il rispondente riceve il questionario a mezzo posta o corriere e provvede a compilarlo nelle parti ad esso spettanti e a rispedirlo indietro o eventualmente a riconsegnarlo ad un addetto che lo ritira a domicilio. Vantaggi: - Bassi costi di realizzazione - E’ richiesta un’organizzazione minore - Bassi rischi di condizionamento - Adatta per porre quesiti delicati - Disponibilità di tempo per reperire eventuale documentazione necessaria alla compilazione - Possibile sottoporre più categorie di risposta. Svantaggi: - Tempi lunghi di raccolta - Impossibilità di identificare con certezza il rispondente - Autoselezione dei rispondenti - Minore capacità di ottenere la partecipazione all’indagine (il tema deve essere coinvolgente) - E’ più difficile aiutare i rispondenti nella comprensione delle domande e nella compilazione del questionario (importanza della grafica) d) Diario : è un particolare tipo di questionario strutturato appositamente per registrare eventi frequenti e di scarsa importanza quali spese di bassa entità o attività quotidiane. L’organizzazione di tale strumento è tale da permettere la registrazione degli eventi nel momento della giornata in cui essi avvengono in modo tale da non dover ricorrere ad uno sforzo di memoria, con una conseguente sottonotifica degli eventi, nello svolgimento di una intervista di tipo classico. Vantaggi: - Non affetto da problemi di memoria per la rilevazione di eventi poco rilevanti e ad elevata frequenza (ad esempio: spese giornaliere, uso del tempo, visione di programmi TV). Svantaggi: - Struttura del questionario complessa - Sottonotifica degli eventi col passare del tempo di osservazione - Rischi di condizionamento dei comportamenti da registrare - Necessita di un rilevatore per la consegna, il ritiro e il supporto alla compilazione
Si possono avere anche tecniche miste combinando quelle descritte.
chiarimento sono due operazioni che dovrebbero servire a facilitare le operazioni di risposte e quindi dovrebbero diminuire le mancate risposte all’indagine. b. Azioni di controllo in corso d’opera , predisposte al fine di individuare e correggere gli errori nel momento in cui questi insorgono durante il processo di produzione. L’uso dei programmi per la registrazione controllata dei dati costituisce un esempio di tali azioni. Un altro esempio è dato dall’applicazione delle tecniche di identificazione automatica degli errori, le quali servono ad individuarne la presenza di incoerenze nei dati (es.: un professionista con la sola licenza elementare) e la conseguente correzione, ad esempio, per mezzo di un ritorno sul rispondente, o almeno il ripristino dell’informazione con valori accettabili. c. Azioni di valutazione , predisposte per quantificare il livello di errore non campionario contenuto nei dati prodotti. Tali azioni implicano l’elaborazione di dati raccolti durante l’esecuzione del processo di produzione, ovvero la conduzione di prove ausiliarie o vere e proprie indagini di controllo. A seconda della natura dell’azione di valutazione si ottiene una misura dell’errore che può andare dalla semplice valutazione di quantità ad esso associate (indicatore di qualità) quali i tassi di risposta, a misure dirette di componenti dell’errore totale quali, ad esempio, la varianza semplice di risposta, ottenibile con una reintervista delle unità statistiche.
L’attività di pianificazione degli aspetti concettuali e operativi da parte del gruppo di progettazione deve essere approfonditamente documentata per mezzo di un documento di progettazione. Questo deve essere distinto nella parte nella quale sono illustrati gli aspetti concettuali e in quella in cui vengono trattati gli argomenti relativi all’implementazione dell’indagine, considerando tuttavia le relazioni esistenti fra i due diversi piani di descrizione. Il documento di progettazione deve contenere le informazioni relative alle fasi viste precedentemente ed in particolare la descrizione di: a. obiettivi : contestualizzazione del fenomeno oggetto di indagine e analisi delle informazioni già disponibili da altre fonti; b. definizioni e concetti : descrizione delle definizioni e dei concetti adottati con particolare riferimento alle loro relazioni con gli obiettivi ed alle problematiche riguardanti il passaggio dalle definizioni teoriche all’applicabilità pratica;
c. analisi dei confronti praticabili (e non) fra i dati dell’indagine e quelli disponibili da altre fonti; d. classificazioni : standard adottati e problemi di riconducibilità ad altri standard in termini di possibilità di integrazione fra dati; e. periodicità e tempestività : pianificazione del disegno di indagine in relazione all’obiettivo di raccogliere dati trasversali e/o longitudinali; valutazione del tempo intercorrente fra il periodo di riferimento dei dati e l’istante di rilascio dei dati pubblicati; f. liste e archivi : scelta e descrizione delle liste da utilizzare per identificare la popolazione obiettivo; analisi della completezza e della ridondanza delle liste utilizzate; valutazioni concernenti la presenza di errori nelle informazioni disponibili, tali da precludere il contatto delle unità di rilevazione, il calcolo di pesi di riporto all’universo o l’assegnazione delle unità a strati; g. campionamento : definizione del disegno di campionamento in relazione alle liste di base disponibili ed agli obiettivi dell’indagine; analisi dei problemi di applicabilità del disegno teorico alle situazioni pratiche; h. strumenti di raccolta : descrizione degli strumenti utilizzati per la raccolta delle informazioni presso le unità statistiche (questionari e/o documenti amministrativi) e degli eventuali modelli ausiliari di aiuto alle operazioni di contatto o di ritorno sul campo;
La fase progettuale non può dirsi conclusa senza predisporre un momento di verifica delle soluzioni considerate. Le sperimentazioni dovrebbero essere finalizzate a valutare: l’adeguatezza e la comprensibilità dei concetti e delle definizioni adottate nei casi pratici; il questionario di indagine; la migliore fra più possibili soluzioni di specifici problemi; le eventuali difficoltà indotte da una operazione sulle successive;, l’adeguatezza delle previsione riguardanti tempi e costi necessari allo svolgimento delle attività predisposte. Due importanti modalità di verifica della progettazione di un’indagine sono: a. il test di soluzioni alternative : un campione contenuto di unità statistiche viene suddiviso in un numero di sottogruppi pari al numero di diverse alternative da saggiare. La caratteristica fondamentale del test di alternative è quella di prendere in considerazione un singolo aspetto da valutare, enucleandolo dal contesto. b. l’indagine pilota è in tutto e per tutto una esecuzione dell’indagine su scala molto ridotta. L’indagine pilota è finalizzata a verificare che l’insieme delle soluzioni prescelte sia
Una volta immessi i dati su supporto informatico è possibile procedere alla loro elaborazione che si articola nelle seguenti fasi: a. Revisione dei dati immessi per la correzione degli eventuali errori e quindi di quei dati che conducono a violazioni di regole logico formali, denominate regole di compatibilità, relative ai limiti imposti sul campo di variazione delle singole variabili, alle relazioni intercorrenti fra le variabili e alle relazioni formali stabilite dalle norme di compilazione dei modelli cartacei. La revisione può avvenire tramite procedura manuale o automatica e/o interattiva. Si definisce revisione automatica la fase di individuazione e intervento di imputazione, sui valori mancanti o incongruenti nelle variabili rilevate, per mezzo di procedure informatizzate. Si comprendono nella fase di revisione automatica anche le procedure di revisione interattiva, nelle quali viene automatizzata la sola fase di individuazione dell’errore, lasciando ad un operatore il compito di eseguire le correzioni al terminale. L’obiettivo di questa fase è quello di effettuare correzioni nei dati, in modo da minimizzare l’effetto degli errori riscontrati sulle successive fasi di elaborazione e sull’informazione prodotta. b. Elaborazioni statistiche sui dati registrati. Si devono principalmente effettuare analisi esplorative di tipo semplice ricorrendo alle rappresentazioni delle distribuzioni tramite tabelle di frequenze e grafici e calcolando le opportune statistiche descrittive univariate e bivariate. Si possono effettuare anche analisi esplorative multivariate. Se l’indagine è di tipo campionario si dovrà procedere alla stima dei parametri per la popolazione di riferimento tenendo conto del disegno di campionamento utilizzato. Se l’indagine è volta a verificare dei modelli definiti a priori si possono effettuare anche analisi multivariate di tipo confermativo o verifica di ipotesi statistiche. c. Validazione : processo attraverso il quale si valuta se l'informazione può essere considerata consona alle finalità per le quali è stata prodotta. Gli obiettivi dell'operazione di validazione sono duplici: valutare se la qualità dei dati è sufficiente ai fini della diffusione dell'informazione agli utenti; identificare le fonti di errore più rilevanti e predisporre modifiche al processo di produzione in modo da ridurre gli effetti degli errori in successive occasioni di indagine.
La strategia di diffusione dei risultati deve tenere conto sia dei canali utilizzati che delle caratteristiche dei fruitori. Si possono infatti privilegiare modalità di diffusione dirette, in cui i mezzi e i modi di trasferimento delle informazioni sono gestiti dal produttore delle statistiche per mezzo di propri strumenti editoriali, o modalità indirette quali ad esempio il coinvolgimento dei mezzi di comunicazione di massa. Anche il supporto utilizzato per la diffusione è rilevante. A fianco al tradizionale mezzo cartaceo possono infatti essere citati strumenti complementari. Uno di questi è il supporto informatico, quale il CD-Rom, che rispetto a quello cartaceo favorisce l'accessibilità delle informazioni in esso contenute attraverso più potenti chiavi di ricerca. L'espansione nell'uso di Internet consente inoltre di diffondere le informazioni in rete.
Di seguito sono definite le dimensioni che caratterizzano la qualità dell'informazione statistica su un collettivo di interesse, tenendo conto della documentazione Eurostat in materia di valutazione della qualità delle statistiche prodotte dai paesi membri della Comunità Europea:
Il questionario di indagine è lo strumento di misura designato a raccogliere le informazioni sulle variabili qualitative e quantitative oggetto di indagine. Il questionario deve essere visto come uno strumento di comunicazione finalizzato a facilitare l’interazione fra il ricercatore, il rilevatore e il rispondente. Affinché possa svolgere il suo ruolo occorre che il questionario sia uno strumento standardizzato; ovvero domande e comunicazione devono essere identiche per tutti i rispondenti al fine che le informazioni raccolte siano confrontabili fra loro. In tal senso il questionario è uno schema di un’intervista altamente strutturata. Il questionario deve essere progettato dopo che siano stati specificati: ß le caratteristiche di interesse del fenomeno oggetto di studio ß la popolazione di riferimento ß il tipo di indagine ß la tecnica di rilevazione
Le fasi della progettazione del questionario sono le seguenti: 1) Progettazione concettuale ß costruzione del modello Entità / Relazione 2) Redazione del questionario ß scelta del tipo di domande e formulazione dei quesiti ß diagramma di flu sso ß redazione del questionario 3) Verifica del questionario ß Indagine esplorativa : fase preliminare alla costruzione del questionario necessaria a stabilire la forma più adatta di strutturazione delle domande. ß Pretest : l’intera bozza del questionario viene provata su un campione ragionato di unità. ß Test formale di due o più alternative : confronto sperimentale di due o più versioni del questionario, o di diverse tecniche di indagine, diverse sequenze di domande, ecc. ß Indagine pilota : prova generale dell’indagine, rivolta a valutare la bontà del questionario ma anche di tutti gli altri aspetti della ricerca.
La progettazione del questionario può avvalersi del modello Entità/Relazione che ha come obiettivo quello di schematizzare un fenomeno collettivo complesso attraverso strutture di rappresentazione basate su regole formali e su simboli grafici. In particolare si utilizzano le strutture di rappresentazione presentate di seguito.
ENTITÀ : Classe di oggetti omogenei in una particolare realtà di interesse. Nella terminologia statistica l’entità è detta collettivo statistico. I singoli elementi costituenti l’entità sono detti Istanze e corrispondono alle unità statistiche.
Simbolo grafico: rettangolo
Esempio : entità di interesse per l’analisi della tipologia degli studenti di una facoltà
ATTRIBUTO: proprietà elementare dell’entità, caratteristica dell’entità. Nella terminologia statistica si parla di variabile statistica. Il dominio è l’insieme delle modalità della variabile statistica.
Simbolo grafico: piccolo cerchio all’estremità di un segmento
Esempio
sesso età scuola di provenienza
anno di corso residenza esami sostenuti
tipo di corso numero di iscritti
n° componenti reddito professione genitori
Esempio
SOTTOINSIEME : parte delle istanze di un’entità padre. Terminologia statistica: sottocollettivo di un collettivo. Simbolo grafico: freccia
Esempio
STATUS LAVORATIVO
Per progettare uno schema E/R si può seguire una strategia di progettazione Top-Down o Bottom- Up. TOP-DOWN : si producono descrizioni del fenomeno da analizzare mano a mano più ricche di particolari. Si inizia da uno schema concettuale contente poche entità e relazioni relative agli aspetti più generali del fenomeno in esame. BOTTOM-UP : inizialmente si producono uno o più schemi particolareggiati relativi ad alcuni aspetti del fenomeno in esame e, successivamente, si definiscono schemi più generali.
SCHEMA ENTITÀ-RELAZIONE
FAMIGLIA
CORSO DI LAUREA
APPARTIENE
E’ ISCRITTO sesso
età
residenza anno di corso scuola di provenienza esami sostenuti
n° componenti professionegenitori reddito
Numero di iscritti
tipo di corso
STUDENTE
STATUS LAVORATIVO
NON LAVORATORE lavorato LAVORATORE motivotipo durata
LAVORO INERENTE C.D.L. utilità