Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


progettazione indagine, Sintesi del corso di Statistica

progettazione di una indagine corso analisi dei dati

Tipologia: Sintesi del corso

2018/2019

Caricato il 28/11/2019

Martina.Zorzetti
Martina.Zorzetti 🇮🇹

4.5

(2)

7 documenti

1 / 6

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
4.Progettazione di una indagine
Un'indagine statistica si compone di quattro fasi: progettazione, realizzazione, elaborazione e
presentazione.
La fase di realizzazione dell'indagine statistica consiste nell'acquisizione dei dati (rilevazione dati) sulla
base del metodo e delle regole decise in fase di progettazione.
La fase successiva è la fase di elaborazione dei dati che consiste nella revisione e nell'analisi dei dati, allo
scopo di produrre dei risultati sintetici.
I risultati dell'elaborazione sono soggetti a verifica e validazione da parte del ricercatore sulla base di un
criterio di controllo della qualità. I criteri di controllo della qualità.
I criteri di controllo della qualità sono decisi dal ricercatore in fase di progettazione dell'indagine.
La presentazione dei risultati è la fase finale dell'indagine statistica in cui il ricercatore produce un
documento di sintesi in cui fornisce i risultati dell'indagine ed eventualmente li accompagna con un'eventuale
descrizione e interpretazione del fenomeno osservato.
Misurazione
quali dati devono essere collezionati sulle singole unità statistiche nel campione
Di cosa si interessa l'indagine?
Rilevazione (rappresentazione)
a quale popolazione si riferisce l'indagine
Su chi è condotta l'indagine?
Entrambe le dimensioni richiedono attenzione in fase di pianificazione e realizzazione dell'indagine
Approcci alla progettazione/realizzazione di un'indagine
Approccio da disegno: dai concetti astratti alle azioni concrete (operative)
Approccio alla qualità: possibili fonti di errore che possono inuenzare
(distorcere) i risultati
Approccio da disegno:
1. MISURAZIONE
-Costrutti (Constructs): sono gli “elementi/caratteristiche" che si cerca di
“misurare" attraverso l'indagine:
ad esempio nell'indagine multiscopo “sicurezza dei cittadini" un
elemento che si vuole misurare è la percezione della sicurezza nella
zona in cui si vive
altro esempio, l'altezza o il peso
a questo livello la formulazione è astratta e suscettibile di più
interpretazioni
-Misurazioni (Measurements): sono “elementi" dell'indagine più concreti
dei costrutti. Le misurazioni sono le realizzazioni dei costrutti:
pf3
pf4
pf5

Anteprima parziale del testo

Scarica progettazione indagine e più Sintesi del corso in PDF di Statistica solo su Docsity!

4.Progettazione di una indagine

Un'indagine statistica si compone di quattro fasi: progettazione, realizzazione, elaborazione e presentazione.

La fase di realizzazione dell'indagine statistica consiste nell'acquisizione dei dati ( rilevazione dati) sulla base del metodo e delle regole decise in fase di progettazione. La fase successiva è la fase di elaborazione dei dati che consiste nella revisione e nell'analisi dei dati , allo scopo di produrre dei risultati sintetici. I risultati dell'elaborazione sono soggetti a verifica e validazione da parte del ricercatore sulla base di un criterio di controllo della qualità. I criteri di controllo della qualità. I criteri di controllo della qualità sono decisi dal ricercatore in fase di progettazione dell'indagine. La presentazione dei risultati è la fase finale dell'indagine statistica in cui il ricercatore produce un documento di sintesi in cui fornisce i risultati dell'indagine ed eventualmente li accompagna con un'eventuale descrizione e interpretazione del fenomeno osservato.

Misurazione

  • quali dati devono essere collezionati sulle singole unità statistiche nel campione
  • Di cosa si interessa l'indagine?

Rilevazione (rappresentazione)

  • a quale popolazione si riferisce l'indagine
  • Su chi è condotta l'indagine?

Entrambe le dimensioni richiedono attenzione in fase di pianificazione e realizzazione dell'indagine

Approcci alla progettazione/realizzazione di un'indagine

Approccio da disegno : dai concetti astratti alle azioni concrete (operative) Approccio alla qualità : possibili fonti di errore che possono influenzare (distorcere) i risultati

Approccio da disegno:

  1. MISURAZIONE

-Costrutti (Constructs) : sono gli “elementi/caratteristiche" che si cerca di “misurare" attraverso l'indagine:

  • ad esempio nell'indagine multiscopo “ sicurezza dei cittadini " un elemento che si vuole misurare è la percezione della sicurezza nella zona in cui si vive
  • altro esempio, l'altezza o il peso
  • a questo livello la formulazione è astratta e suscettibile di più interpretazioni

-Misurazioni (Measurements): sono “elementi" dell'indagine più concreti dei costrutti. Le misurazioni sono le realizzazioni dei costrutti:

  • ad esempio nell'indagine multiscopo “ sicurezza dei cittadini " la sicurezza nella zona in cui si vive è misurata attraverso una serie di domande nel questionario, tra cui: Q: “ quanto si sente sicuro camminando per strada quando è buio ed è solo nella zona in cui vive?" - Molto sicuro - Abbastanza sicuro - Poco sicuro - Per niente sicuro
  • per il peso e l'altezza ad es. Kg o Grammi; cm e metri

Risposta (Response) : il dato prodotto dall'unità statistica a seguito della misurazione:

  • La natura delle risposte è determinata dal modo in cui si definisce la misurazione (es: natura qualitativa, quantitativa)
  • Quando la misurazione è effettuata mediante domande in un questionario l'unità statistica ha vari modi di produrre la risposta: -Può ricorrere al ricordo -Può ricorrere ad un documento (es: domanda su personale impiegato presso un'azienda) -Può ricorrere ad informazioni fornite da un'altra persona (es: chiedere al partner)
  • Nel caso delle domande ad un questionario l’unità statistica può scegliere tra una serie di opzioni di risposta oppure produrre una risposta libera senza vincoli

Risposta processata (Edited Response): il dato processato dal sistema di rilevazione o dal ricercatore posteriore alla raccolta dati:

  • Risposta processata dal sistema : alcuni strumenti di rilevazione dati di tipo computer-assisted effettuano contestualmente una verifica di coerenza delle risposte fornite alla misurazione - Ad es: nel caso si chieda l'anno di nascita specifici range di valori possono essere controllati dal sistema (anno < 1890) e si può

richiedere una verifica ( range check, un controllo di intervallo. E’ una tecnica di validazione, controlla il valore dei dati per vedere se rientra in un determinato intervallo, ad es. il mese dell'anno deve essere compreso tra 1 e 12)

  • Ad es: se una unità statistica dichiara di avere 14 anni e in un'altra domanda dichiara di avere 5 figli lo strumento di rilevazione può richiedere una verifica della risposta ( consistency check , test eseguito per determinare se i dati presentano conflitti interni)
  • Risposta processata dal ricercatore : dopo la fase di rilevazione dati il ricercatore può controllare l'intera distribuzione delle risposte e individuare eventuali valori anomali ( outliers, termine utilizzato in statistica per definire, in un insieme di osservazioni, un valore anomalo e aberrante. Un valore quindi chiaramente distante dalle altre osservazioni disponibili) da trattare in modo opportuno

-Campione (sample): campione estratto dalla frame population:

  • Esso è spesso una piccolissima frazione della frame population (e quindi anche della target population)

-Rispondenti (respondents): le unità statistiche campionate che è effettivamente hanno fornito risposte alle misurazioni (il loro complementare sono i non rispondenti):

  • Il tentativo di “misurazione" può non andare a buon fine e quindi ci sarà una frazione di non rispondenti tra le unità campionate
  • Se un'unità statistica non risponde completamente alle misurazioni si parla di unit nonresponse
  • A volte le definizioni di rispondente/non rispondente non sono univoche. Ad es: potrebbe essere definito non rispondente anche l'unità statistica che ha riposto solo ad alcune misurazioni
  • Occorre operare delle scelte post-rilevazione per decidere se escludere dalla matrice dati le unità che non hanno fornito risposte a tutte le misurazioni oppure lasciare l'unità statistica ma classificare come item nonresponse o missing data le risposte mancanti

-Aggiustamenti post-rilevazione (postsurvey adjustments): aggiustamento dei dati sulla base delle caratteristiche dei rispondenti:

  • dopo la fase di rilevazione e aver costruito la matrice dati per i rispondenti è possibile avere dei problemi di sovra- o sotto- rappresentazione di particolari sottogruppi della target population dovuti a: - Non corrispondenza della frame population con la target population (problemi di copertura) - Non rispondenti
  • ad es: in un'indagine via internet potremmo sotto rappresentare il sottogruppo degli over 50 (se presenti nella target population)
  • a tal fine è possibile utilizzare dei pesi (il metodo più diffuso di correzione consiste nella “riponderazione” delle unità. Assumendo note alcune caratteristiche della popolazione che si ritengono influenzare la non risposta totale, si partiziona il campione osservato e, con un meccanismo di post-stratificazione, si ricostruiscono le proporzioni presenti nella popolazione, attraverso un opportuno sistema di pesi. L’assunzione forte che si fa è quella di un comportamento omogeneo, ai fini del fabbisogno conoscitivo, all’interno degli strati individuati) per ristabilire l'equilibrio tra i sottogruppi
  • oppure individuare dei metodi di imputazione per i missing data (procedure di stima per dati mancanti). Per imputazione s’intende la sostituzione dei valori mancanti o errati di un dato record con alternative coerenti e plausibili ottenute dai dati stessi (campionari e non), da fonti esterne all’indagine effettuata o dalla combinazione di entrambi, in conformità a regole e metodi prestabiliti. Le procedure d’imputazione hanno l’obiettivo di ridurre le distorsioni introdotte dalla presenza di dati mancanti e di offrire, inoltre, maggiori garanzie sulla coerenza dei risultati derivati dalle analisi applicate, ma al contempo non confermano

la generalità di tale riduzione, addirittura amplificando in taluni casi le distorsioni esistenti. Infatti stati sviluppati metodi statistici che non assegnano esplicitamente valori, ma includono il dato mancante all’interno della stessa analisi.

Approccio alla qualità

  1. MISURAZIONE

Ogni fase della misurazione contiene elementi che possono inficiare la qualità del dato finale. Lo scopo di chi pianifica l'indagine è quello di massimizzare la qualità e minimizzare gli errori che si possono commettere in ciascuna fase dell'indagine.

È importante notare che ciascun termine di errore riguarda la singola risposta (relativa al singolo item/domanda del questionario) non tutta l'indagine.

  1. RAPPRESENTAZIONE

Relativamente agli errori nella prospettiva della rappresentazione passiamo dalla singola risposta alle statistiche vere e proprie (es. media, mediana, ecc.). Nello schema semplificato tratteremo della media (ma in realtà il discorso vale per qualunque altro indice).

  • Quando la frame population non coincide con la target population si ha il cosiddetto errore di copertura (es. sample frame - frame di campionamento, è il materiale o dispositivo sorgente da cui viene estratto un campione. È un elenco di tutti quelli all'interno di una popolazione che possono essere campionati - costituito da numeri telefonici).
  • Quando alcune unità statistiche della target population non sono incluse nella frame population si parla di sottocopertura o non copertura (es. non possessori di apparecchi telefonici).
  • Quando invece nella frame population ci sono unità statistiche non incluse nella target population si parla di ineleggibilità di tali unità ad entrare nel campione.
  • La copertura è la sovrapposizione delle unità statistiche nella target population e nella frame population. Si parla di eleggibilità di tali unità ad entrare nel campione.

Indicando con: