Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

tecniche di indagine statistica, Appunti di Analisi Statistica

tecniche di indagine statistica 6cfu

Tipologia: Appunti

2016/2017

Caricato il 23/02/2017

jessicamary.fortunelli1
jessicamary.fortunelli1 🇮🇹

5

(2)

5 documenti

Anteprima parziale del testo

Scarica tecniche di indagine statistica e più Appunti in PDF di Analisi Statistica solo su Docsity! 1 TECNICHE DI INDAGINE STATISTICA. I dati statistici possono provenire da: - una rilevazione appositamente eseguita - dall’elaborazione di dati raccolti all’interno di procedimenti di tipo amministrativo. I dati possono essere resi disponibili: -nella forma rilevata (banche dati, on-line) -in forma elaborata (indicatori, tabelle, grafici, …) Perché i dati si trasformino in informazione è necessaria una transazione e occorre che il soggetto al quale sono stati destinati ne colga il significato. L’autorevolezza della fonte gioca un ruolo fondamentale. L’informazione (di qualità) acquista maggiore valore quanto più si diffonde e viene utilizzata. Relativamente ad un fenomeno di interesse: – informazioni già disponibili -raccolte a fini specifici (es. opinione studenti) -raccolte per altri fini (es. censimento) – informazioni ad hoc da ottenere -logica sperimentale -logica osservazionale (sul campo) => progettazione indagine (scelta disegno): 1. conoscenza quantitativa di un fenomeno collettivo 2. criteri statistici Indagine statistica - Metodo sistematico per raccogliere informazioni da (un campione di) entità al fine di costruire descrittori quantitativi (statistiche) delle caratteristiche della popolazione (statistica) a cui tali entità appartengono 2 - Tecniche d’indagine (Survey Methods/ology): studio degli aspetti della realizzazione di una indagine collegati ai costi e alla qualità delle statistiche (stime) prodotte (studio/controllo possibili errori) o anche: focus: metodi per ottenere la migliore qualità dei dati, fissati i costi (minori costi, fissato il livello di qualità dei dati) (combina elementi di calcolo delle prob., inferenza statistica, teoria del campionamento, psicologia cognitiva – indagini su individui-) Indagine statistica: caratteristiche di base scopi -descrizione -spiegazione *contenuti – caratteristiche descrittive – condizioni socio - economiche – attività – opinioni e atteggiamenti copertura: – popolazione statistica cadenza temporale – dell’indagine ->una tantum”: una volta e basta –> correnti: svolte a intervalli regolari – delle informazioni raccolte con l’indagine – dell’indagine/informazioni Qualità di beni e servizi (ISO 8402-1986): Possesso della totalità delle caratteristiche che portano al soddisfacimento delle esigenze, esplicite ed implicite, dell’utente. – qualità del processo di produzione – qualità del prodotto (statistiche) 5 Indagine: approccio da disegno (da idee astratte ad azioni concrete) Fig.15 Disegno d’indagine come processo: 6 DEFINIZIONE DEGLI OBIETTIVI FENOMENO DI INTERESSE: cosa interessa e cosa non interessa? ci interessa la componente statica o dinamica? interessano dei confronti? (più gli argomenti trattati sono ampi, maggiore è la complessità statistica e operativa) POPOLAZIONE DI RIFERIMENTO: Fenomeno di interesse: riferito a chi ? insieme delle unità statistiche alle quali si intende estendere i risultati dell'indagine condizioni di eleggibilità: caratteristiche che determinano inclusione / esclusione delle unità statistiche nella popolazione di riferimento CARATTERI/VARIABILI STUDIATI: caratteristiche (che permettono di indagare il fenomeno di interesse) rilevate o misurate presso ogni singola unità statistica (nella pop.ne di rif.to) Nella specificazione degli obiettivi è necessario rintracciare tutta la documentazione che si può reperire. Gli obiettivi devono essere valutati e verificati in base alle risorse disponibili. L'insieme delle unità statistiche oggetto di attenzione costituisce il collettivo statistico. Esempio 1: Indagine sulla condizione occupazionale dei laureati: studente: unità di rilevazione, unità di analisi Rilevazione delle forze di lavoro: individui > 15 anni: unità di analisi, famiglie: unità di rilevazione DEFINIZIONE DELL'UNIVERSO E SCELTA DELLA LISTA - universo e popolazione di riferimento (target population) (es. pop.ne in età > = 18 in Italia; studenti iscritti UniTs) - popolazione statistica oggetto di studio (survey population) Pop.ne effettiva che viene indagata, anche in relazione alla disponibilità/caratteristiche dei (sampling) frame usati per identificare gli elementi della target population (es. pop.ne in età > = 18 residente in Italia; studenti iscritti UniTs non Erasmus, attivi – non oltre il 2^ anno FC – con mail UniTs) Se frame (survey population) non perfettamente sovrapposto a target population: 7 1. Ridefinire la target population 2. Ammettere la possibilità di errori di copertura nelle statistiche che descrivono la pop.ne Indagine campionaria -Teoria del campionamento: 1. definizione della popolazione (universo) 2. popolazione obiettivo (target population) 3. popolazione d’indagine (survey/study population) 4. disegno di campionamento: insieme delle regole seguite nella formazione del campione - probabilistico (casuale) 1. ogni elemento della popolazione ha una probabilità nota di essere estratto 2. sono usate tecniche (in modo appropriato) per la selezione casuale delle unità - non probabilistico *osservazioni più accessibili, “facili” * scelta soggettiva/ragionata *per quote (combinazione dei due) Obiettivo teoria del campionamento (probabilistico): individuare schemi (disegni) di campionamento : – economici e facili da eseguire – stimatori non distorti – a minima varianza Disegno di campionamento insieme delle regole seguite nella formazione del campione: struttura del campione: Caratteristiche della lista delle unità che compongono l’universo (sampling frame) selezione casuale delle unità probabilità di selezione (inclusione) numerosità del campione: attendibilità delle stime DEFINIZIONE DELL'UNIVERSO E SCELTA DELLA LISTA LISTA – ARCHIVI DI BASE: lista, mappe o altre specificazioni che forniscono le informazioni disponibili sulle unità che costituiscono la popolazione oggetto d’indagine 10  CASQ (Computer Self Administrated Questionnaire): assenza dell’intervistatore; utilizzo di un proprio computer o account  DBM (Disk by mail) - software spedito su un supporto  IVR (Interactive Voice Response, come ACASI ma con telefono): -TDE (Touchtone Data Entry) - VRE (Voice Recognition Entry) Altre definizioni: o FTF (Face to face interviewing) o PAPI (Paper and Pencil interviewing) o TEL (Telephone interviewing) Fig. 35 Classificazione dei metodi d’indagine Fig.36 SELF meglio di FTF o TEL per domande sensibili Effetto TECNOLOGIA entro la stessa modalità – Quali effetti ha effetto/tecnologia sulle risposte? – Quali effetti in generale sulla qualità dell’indagine? Tecnologia CAI Vantaggi: 11 tempi minori => costi minori controlli maggiori e migliori (editing immediato, collegamento con altre informazioni, verifica e imputazione on line)=> maggiore qualità dei dati particolarmente adatto per quesiti “delicati” (SELF: CASI, CSAQ…) Svantaggi: copertura (è necessario disporre dell’attrezzatura) CONFRONTO METODI DI RILEVAZIONE DEI DATI • Costi • Tempi • Complessità argomenti trattati • Implicazioni su disegno d’indagine: – Copertura – Non risposta (ammontare e informazioni disponibili su NR) – Qualità risposte: * completezza informazioni (items non-response) minore in modalità self, anche se pattern meno chiaro in web-survey (sembra dipendere più da disegno –come vengono sollecitate le risposte) * desiderabilità sociale (maggiore con presenza di intervistatore) * “response effects” (influenzati da metodi di raccolta): – ordine di presentazione quesiti – ordine presentazione risposte – acquiescenza minori in modalità self rispetto a tel, la direzione degli effetti è comunque legata al metodo – “a voce” o “a vista” * utilizzo strumenti visivi - Disegni multimodali (mixed-mode design) Costruzione questionario • obiettivi indagine sono tradotti in variabili che devono essere misurate con l’indagine: – variabili obiettivo/d’interesse (Y) 12 – variabili ausiliarie/supplementari (X) • dai valori osservati (popolazione/campione) di entrambi i tipi di variabili: – calcolo/stima di parametri relativi alla popolazione (media/mediana… di Y, % di casi con una certa caratteristica, misure di associazione, …) • i valori delle variabili (Y, X) sono ottenuti come risposte a quesiti (domande) specifici • insieme di quesiti (più qualcos’altro): questionario Questionario: strumento di misurazione (non perfetto) strumento di comunicazione fase 1: schema concettuale (“albero delle aree”) fase 2: formulazione quesiti (redazione): – codici identificativi – quesiti su caratteristiche strutturali – quesiti specifici (scelta della forma) Processo di formazione delle risposte: – comprensione quesito (valutare informazione richiesta) – capacità di rispondere (ricordare/formarsi un’opinione) – motivazione a fornire una risposta corretta – quesiti per controllo qualità fase 3: verifica: pre-test indagine pilota Quesiti fattuali (factual): informazioni su fatti e comportamenti (esiste sempre un valore “vero” che può essere determinato anche senza chiedere al rispondente) (salario orario, titolo di godimento dell’ abitazione, disponibilità, connessione internet) n.b.: è richiesta una precisa definizione del fatto da misurare (es. n.ro di stanze dell’abitazione) Quesiti non fattuali (nonfactual): informazioni su attitudini e opinioni (opinione riflette il parere su un argomento; attitudine: concetto più ampio, in generale su argomento complesso non esiste un valore “vero”: misurazione di uno stato soggettivo del rispondente che esiste solo nella sua mente in un dato momento) Opinione/attitudine: comportamento di voto; ruolo Unione Europea e singoli stati 15 2. Femminili 3. Arte, scienze umane e sociali 4. Altro genere « Quale genere di periodici legge? » (si possono fornire più risposte) Informazione generale 1 Femminili 2 Arte, scienze umane e sociali 3 Altro genere 4 (Oppure risposta □SI □NO ) Risposte/ domande gerarchizzate: Viene chiesto al rispondente di classificare in ordine di importanza un certo numero di modalità es. “Può indicarmi, in ordine di preferenza, a quali tipi di negozi lei ricorre per fare acquisti di generi alimentari?” Supermercati □ Negozi al dettaglio □ Mercati coperti o all’aperto □ Altro negozio □ Non so □ Procedure per facilitare la memoria (e ridurre il fenomeno di telescoping) liste: “Quali attività svolge nel tempo libero?” lista di attività “Che cosa legge abitualmente?” lista di libri, riviste, quotidiani con titoli Avvertenze: – lista esauriente ed esaustiva – ordine seguito – lunghezza – uso di filtri In generale: domande specifiche  es: “Quali bibite consuma abitualmente?” Regola delle 5 W: Who, What, Where, When, Why 16 EXERCISE: Make these three questions more concrete and describe how you improved specificity. 1. How satisfactory was your stay at the hotel? 2. What is the best way to improve health care? 3. Which restaurants do you eat in most frequently? POSSIBLE ANSWERS 1. How satisfactory was room service during your stay at the hotel? The question has been made more specific by focusing on room service. 2. What is the best way to improve the quality of preventive health care? “Improve” has been clarified to concentrate on the quality of preventive care. 3. In the past 3 months, which New York restaurants did you eat in most frequently? A time period and a place have been set: in the past 3 months and New York, respectively. Misure dell’estremità e dell’intensità di un atteggiamento (giudizio)  dimensione sottostante (continuum)  scala di valutazione (proposta al rispondente) 1) scala verbale: usualmente: unico giudizio e più alternative di risposta (molto, abbastanza, poco, per niente) 2) rappresentazioni grafiche: 3) punteggi numerici: 1-3, 1-5, 1-7, 1-10 Questionari e controllo delle qualità sostituzioni (se il piano di campionamento lo prevede)  – errori di lista – errori elenchi – intervistatore – indisponibilità rispondente • motivo sostituzione • caratteristiche unità non intervistata chi risponde alle domande: situazioni tipiche di intervista intervistatore: – codici identificativi – caratteristiche strutturali 17 andamento intervista: – data – ora inizio e fine – altre informazioni (se previsto intervistatore) Redazione del questionario: – Organizzare complessivamente il questionario in aree omogenee per tematica trattata, raggruppando le domande relative allo stesso tema possibilmente nella stessa area. – Adottare accorgimenti particolari a seconda del tipo di somministrazione scelta. – Saper individuare quanto spazio è opportuno dare all’intervistato nella risposta (domande aperte, strutturate). – Adottare un linguaggio comprensibile a tutti gli intervistati, non ambiguo e preciso e chiedere cose a cui l’intervistato può rispondere. – Essere precisi nel riferimento temporale delle domande e fare particolare attenzione all’uso di quesiti retrospettivi. – Fare un uso oculato delle domande delicate. – Collocare le domande in modo che non influenzino le risposte alle successive e controllare la sequenza delle risposte a una stessa domanda. – Saper individuare la lunghezza ottimale del questionario per impegno di tempo, approfondimento di temi, ridondanza di informazioni. – Impostare graficamente il questionario in modo da renderlo una guida efficace per la compilazione e uno strumento adeguato di comunicazione. – Individuare i codici più adatti per ciascuna modalità di risposta ai quesiti del questionario. – Adottare criteri standard per le variabili strutturali. – Prevedere una parte del questionario per i codici identificativi e una per i quesiti sui controlli di qualità. Per capire che una risposta è sbagliata non occorre una intelligenza eccezionale, ma per capire che una domanda è sbagliata ci vuole una mente creativa. cit. A. Jay (1968) Macchiavelli e i dirigenti di industria, Milano, p. 95 domanda di indagine e il loro contesto -Survey 1 Lancaster, una comunità di circa 150.000 persone, è programmi di pianificazione per prevenire gli abusi sui minori e la violenza in famiglia. La comunità si propone di condurre 20 • Metodi per disciplinare i bambini per lieve, moderata e grave infrazioni Sistema di indagini sociali multiscopo – ISTAT dal 1993 fig. 68 Indagine Statistica Multiscopo sulle famiglie Aspetti della vita quotidiana (indagine face-to face) - 2 questionari: 1. per intervista (ROSA) 2. autocompliazione (VERDE) annuale dal 1993 (dicembre), 1994 (novembre)… , 2012 (gen-febbraio) campione di circa 24.000 “famiglie” per un totale di ~ 54.000 individui, distribuite in circa 850 Comuni italiani di diversa ampiezza demografica. Famiglia: Insieme di persone legate da vincoli di matrimonio, parentela, affinità, adozione, tutela o vincoli affetti dimorante nella stessa abitazione famiglia di fatto Il questionario (ROSA) si compone di: – scheda generale – scheda individuale – scheda familiare – controlli (per l’intervistatore) Indagine: compresa nel Programma statistico nazionale (insieme delle rilevazioni statistiche necessarie al Paese). 21 Fig. 70,71 22 Tutela della privacy • La riservatezza dei dati personali in campo statistico era tutelata dal d.lgs n. 322/ 89 che conteneva disposizioni sul segreto d’ufficio (art.8) e sul segreto statistico (art. 9). • La legge 675/1996 disciplina condizioni, modalità e garanzie relativamente a tutti i trattamenti di dati personali, compresi quelli effettuati in ambito statistico. • Con la legge 676/1996 il Parlamento delega il Governo ad emanare decreti legislativi in materia di tutela della riservatezza per i trattamenti di dati personali effettuati per finalità storiche, statistiche e di ricerca scientifica. • In attuazione della delega, il Governo emana il decreto legislativo n. 281/1999, che integra e modifica sia il d.lgs n. 322/89 sia la legge n. 675/1996 • Il 30 giugno 2003 viene emanato il testo unico che rivede e organizza tutte le disposizioni in merito: Codice in materia di protezione dei dati personali che è entrato in vigore il 1.1.2004 Codice in materia di protezione dei dati personali • Art. 1 (Diritto alla protezione dei dati personali) Chiunque ha diritto alla protezione dei dati personali che lo riguardano. • Art. 3 (Principio di necessità nel trattamento dei dati) I sistemi informativi e i programmi informatici sono configurati riducendo al minimo l’utilizzazione di dati personali e di dati identificativi se ne deve escludere il trattamento quando le finalità perseguite possono essere realizzate mediante – dati anonimi – modalità di trattamento che permettano di identificare l’interessato solo in caso di necessità Il Codice: Definizioni “dato personale“: informazione relativa a persona fisica, persona giuridica, ente od associazione, identificati o identificabili, anche indirettamente, mediante riferimento a qualsiasi altra informazione, ivi compreso un numero di identificazione personale. “dati identificativi“: i dati personali che permettono l’identificazione diretta dell’interessato. “dato anonimo”: il dato che in origine, o a seguito di trattamento, non può essere associato ad un interessato identificato o identificabile. “dati sensibili”: i dati personali idonei a rivelare l'origine razziale ed etnica, le convinzioni religiose, filosofiche o di altro genere, le opinioni politiche, l'adesione a partiti, sindacati, Modello per la non risposta (fixed response model) _M N _ È N, non rispondenti> 7 > W,, =1- » rispondenti > 7. > MW. popolazione (anche con rilevazione completa) Y=W,+W,}, mom Tr. Fi si conosce solo questa da (WI, K, dl Wta) W.+W, =] r m Tm m E -Y= nt 5) proporzione missing differenza tra le medie Non risposta (fixed response model) È EFhO-) proporzione missing differenza tra le medie non può essere ignorata | — in generale, più frequente in gruppi particolari random response model: per ogni elemento i nella popolazione è definita una probabilità (ignota) di risposta p, * non risposta — DIL i] ‘aggiustamenti con pesi che assegnano totale: — Non trovati © peso maggiore a categorie (uso var. — altro ausiliarie) sotto rappresentate response variabili per vari motivi (collegata imputazione: valori al tipo di variabile) mancanti replicati da * item non informazioni mancanti su legata metodi di valori “di sintesi” 25 26 Errori di misura / di risposta il valore osservato è diverso da quello che si intendeva misurare: …………. rispondente – memoria – interpretazione – inaccuratezza interazioni – “proxy” rilevatore – istruzione sul questionario / indagine – errori di trascrizione 27 questionario – formulazione – sequenza – codifica modalità di raccolta – autocompilazione – intervista diretta tecnologia – telefonica effetto  distorsione e variabilità Errore totale e risorse disponibili modello statistico per valutare l’impatto delle varie fonti di errore (Kish, 1965) (approccio da disegno) ERRORE TOTALE = ERR. VARIABILI + DISTORSIONI FISSE …… estensioni: correlazioni tra i vari tipi di errore …..
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved