Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Appunti sui Questionari e Sondaggi, Schemi e mappe concettuali di Analisi Dei Dati

Appunti della lezione sui questionari e sondaggi

Tipologia: Schemi e mappe concettuali

2021/2022

Caricato il 14/04/2023

marta-saldarini
marta-saldarini 🇮🇹

4.8

(5)

12 documenti

1 / 4

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
28.09.2022
Francesco Della Beffa
SONDAGGI E QUESTIONARI
Possibile domanda d’esame: immaginare un sito in cui bisogna dichiarare l’età per iscriversi (es.
Facebook), e questo vuole confrontare l’età dei suoi utenti con l’età media della popolazione italiana che
si desuma dai dati ISTAT (per vedere, per esempio, se ci sono più giovani in relazione all’età media della
popolazione). Dunque si hanno fondamentalmente due età: l’età media della popolazione dell’ISTAT e
l’età media degli utenti di Facebook. Questi sono entrambi dati primari, entrambi dati secondari o uno
primario e uno secondario?
Tutte e due sono dati secondari: ISTAT raccoglie i suoi dati per motivi istituzionali, Facebook, invece, li
raccoglie inizialmente per motivi organizzativi (ovvero per poter effettuare la registrazione). Dunque il
fatto che questi dati vengano utilizzati anche per fare una media dell’età degli utenti del socia
rappresenta un obiettivo secondario e non l’obiettivo originale per cui sono stati raccolte tali informazioni.
SONDAGGIO
Un sondaggio è una rilevazione di dati primari con interviste strutturare a un campione di soggetti, molto
generale (si può fare su qualsiasi cosa), potenzialmente costoso, richiede competenza (bisogna sapere
cosa chiedere) e rigore nel definire gli obiettivi (bisogna stare dentro gli obiettivi che ci si pone).
Le alternative al sondaggio possono essere:
Censimento: rilevazione su tutta la popolazione;
Analisi di dati secondari da fonti esterne (es. ISTAT, Aida);
Analisi di dati secondari interni
-Banche, telefonia, assicurazioni = segmentazione e scoring
-GDO = market basket analysis
-e-commerce, entertainment = sistemi di raccomandazione
DATI DICHIARATI E DATI OGGETTIVI
I dati rilevati con questionari non sono mai perfettamente oggettivi, anche se riguardano comportamenti
(es. Auditel - misurazione degli ascolti televisivi = meter).
I dati Auditel tengono i piedi in due scarpe: si ottengono sia tramite questionario con dichiarazioni, sia la
parte di rilevazione (misura con precisione tutti i programmi che vengono ascoltati, quando, come, ecc).
Quindi c’è l’aspetto di dichiarazione e di misurazione.
POPOLAZIONE E CAMPIONE
Popolazione: l’insieme di tutte le unità oggetto di studio (es. persone, prodotti, aziende) e deve essere
identificata inequivocabilmente attraverso (almeno) una caratteristica osservabile (es. “italiani” o
“consumatori abituali” non basta, perché i confini di queste popolazioni sono estremamente sfumati,
non si sa se determinate persone possono trovarsi all’interno di questi confini o meno - es. “residenti in
Italia il 1 settembre 2022 è, invece, sufficiente a indicare una popolazione con precisione).
Unità statistica: ogni singolo elemento della popolazione.
Campione: il sottoinsieme della popolazione sul quale si rilevano i dati.
CAMPIONAMENTO
Il campionamento è il processo attraverso il quale si estrae il campione dalla popolazione e può essere:
1
pf3
pf4

Anteprima parziale del testo

Scarica Appunti sui Questionari e Sondaggi e più Schemi e mappe concettuali in PDF di Analisi Dei Dati solo su Docsity!

SONDAGGI E QUESTIONARI

Possibile domanda d’esame: immaginare un sito in cui bisogna dichiarare l’età per iscriversi (es. Facebook), e questo vuole confrontare l’età dei suoi utenti con l’età media della popolazione italiana che si desuma dai dati ISTAT (per vedere, per esempio, se ci sono più giovani in relazione all’età media della popolazione). Dunque si hanno fondamentalmente due età: l’età media della popolazione dell’ISTAT e l’età media degli utenti di Facebook. Questi sono entrambi dati primari, entrambi dati secondari o uno primario e uno secondario? Tutte e due sono dati secondari : ISTAT raccoglie i suoi dati per motivi istituzionali, Facebook, invece, li raccoglie inizialmente per motivi organizzativi (ovvero per poter effettuare la registrazione). Dunque il fatto che questi dati vengano utilizzati anche per fare una media dell’età degli utenti del socia rappresenta un obiettivo secondario e non l’obiettivo originale per cui sono stati raccolte tali informazioni. SONDAGGIO Un sondaggio è una rilevazione di dati primari con interviste strutturare a un campione di soggetti, molto generale (si può fare su qualsiasi cosa), potenzialmente costoso , richiede competenza (bisogna sapere cosa chiedere) e rigore nel definire gli obiettivi (bisogna stare dentro gli obiettivi che ci si pone). Le alternative al sondaggio possono essere:

  • Censimento : rilevazione su tutta la popolazione;
  • Analisi di dati^ secondari da fonti esterne^ (es. ISTAT, Aida);
  • Analisi di dati^ secondari interni

- Banche, telefonia, assicurazioni = segmentazione e scoring

- GDO = market basket analysis

- e-commerce, entertainment = sistemi di raccomandazione

DATI DICHIARATI E DATI OGGETTIVI

I dati rilevati con questionari non sono mai perfettamente oggettivi , anche se riguardano comportamenti (es. Auditel - misurazione degli ascolti televisivi = meter). I dati Auditel tengono i piedi in due scarpe: si ottengono sia tramite questionario con dichiarazioni, sia la parte di rilevazione (misura con precisione tutti i programmi che vengono ascoltati, quando, come, ecc). Quindi c’è l’aspetto di dichiarazione e di misurazione. POPOLAZIONE E CAMPIONE

  • Popolazione : l’insieme di tutte le unità^ oggetto di studio (es. persone, prodotti, aziende) e deve essere identificata inequivocabilmente attraverso (almeno) una caratteristica osservabile (es. “italiani” o “consumatori abituali” non basta, perché i confini di queste popolazioni sono estremamente sfumati, non si sa se determinate persone possono trovarsi all’interno di questi confini o meno - es. “residenti in Italia il 1 settembre 2022 è, invece, sufficiente a indicare una popolazione con precisione).
  • Unità^ statistica : ogni singolo elemento della popolazione.
  • Campione : il sottoinsieme della popolazione sul quale si rilevano i dati. CAMPIONAMENTO Il campionamento è il processo attraverso il quale si estrae il campione dalla popolazione e può essere:
  • Probabilistico
  • Non probabilistico (es. campione di esperti, campionamento “a valanga” - chiedere all’ultimo intervistato di chiedere a sua volta a qualcun altro e via dicendo, tipicamente usato quando il campione è difficile da trova, come per circostanze illegali per esempio -, campionamento “per convenienza”). CAMPIONAMENTO PROBABILISTICO Il campionamento probabilistico può essere:
  • Campionamento^ casuale semplice^ - modello ideale (es. estrazione da un’urna). Questo modello il più delle volte è impraticabile, per il semplice motivo che per fare quest’operazione bisognerebbe avere l’elenco di tutta la popolazione.
  • Campionamento^ stratificato : si utilizzano delle caratteristiche note della popolazione per suddividerla in strati (es. età, area). Questo campionamento si basa sull’ipotesi che all’interno della popolazione ci siano delle differenze note, oppure ipotizzabili con un buon livello di sicurezza (es. le donne, su un certo argomento, la pensano in modo diverso rispetto agli uomini). Si suppone, dunque, di conoscere delle differenze all’interno della popolazione e, dunque, si divide la popolazione in strati (per riprendere l’esempio precedente, si divide la popolazione in uomini e donne) = strati : omogenei all’interno, eterogenei tra loro
  • Campionamento^ a grappoli^ (cluster): quando la popolazione^ è^ naturalmente divisa in gruppi (es. classi scolastiche, comuni). = cluster : eternerei all’interno, omogenei tra loro DIMENSIONE DEL CAMPIONE I campioni più grandi migliorano la precisione delle stime, ma:
  • Sono più^ costosi
  • Il guadagno in precisione per ogni unità^ aggiuntiva diminuisce al crescere del campione (dunque vi^ è una soglia oltre la quale non ne vale la pena ampliare il proprio campione)
  • La dimensione del campione non dipende da quella della popolazione (se pop > 10 mila) La dimensione del campione si può stimare a priori. CARATTERISTICHE DI UN BUON CAMPIONE Le caratteristiche di un buon campione sono: a. Casualità

prodotto, tale risposta sarà condizionata dalle risposte alle precedenti domande inerenti gli attributi; chiedere il grado di gradimento del prodotto all’inizio, invece, la risposta dell’intervistato sarà pura.]

  1. Decidere la forma delle risposte e formulare le domande = come chiedere es. aperte o chiuse, in che scala, “non so” FORMULAZIONE DELLE DOMANDE esercizio
  2. Ha mai comprato online biglietti aerei e ferroviari? Sbagliata, perché sono due domande
  3. Nella sua famiglia ci sono bambini? Sbagliata, perché non è specificata l’età
  4. L’intervento dello Stato non è stato adeguato…? Sbagliata, perché è formulata negativamente (non)
  5. In che paese è nato: Italia | Francia | Spagna | Europa? Sbagliata, perché le risposte non sono esaustive (la risposta “Europa” comprende anche Italia, Francia e Spagna)
  6. Dove è andato in vacanza l’estate scorsa? Sbagliata, perché non è detto che sia andato in vacanza
  7. In che anno ha aperto l’account? Sbagliata, perché è una domanda rivolta al passato
  8. Ha malattie croniche? Sbagliata, perché è una domanda intrusiva
  9. Lei ritiene che i clandestini…? Sbagliata, perché il termine “clandestini” è un termine tendenzioso, il termine “immigrati irregolari” sarebbe stato più corretto Raccomandazioni per la formulazione delle domande:
  • Evitare domande^ doppie
  • Evitare^ ambiguità
  • Attenzione alle^ negazioni
  • Risposte^ esaustive^ e mutuamente^ esclusive
  • Non dare^ nulla per scontato
  • Attenzione alle domande sul^ passato^ e ai^ temi sensibili
  • Evitare formulazioni^ tendenziose
  • Inserire^ domande replicate^ (se un’aspetto^ è^ particolarmente importante può^ essere opportuno chiedere la stessa cosa in due punti del questionario diversi con due modalità diverse) o con scala invertita (c’è una sorta di inerzia per cui se vi è una batteria di domande analoghe sugli attributi e dalle quali è possibile che l’intervistato darà risposte positive, questo ad un certo punto metterà in automatico tutte risposte alte, dunque è opportuno inserire una domanda diversa tra queste)