



Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Articolo per analisi dell'opinione pubblica scelte di consumo e customer satisfaction (Martire)
Tipologia: Sintesi del corso
1 / 6
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!




L’inedita disponibilità di dati digitali su comportamenti e relazioni sociali, registrati automaticamente e in tempo reale in quanto sottoprodotto («by-product») delle attività degli utenti di piattaforme e aziende private, avrebbe reso in un colpo obsoleto l’apparato metodologico della sociologia accademica, qualitativa così come quantitativa. Secondo gli autori, la ricerca campionaria tramite survey – l’approccio storicamente dominante nella ricerca politica e sociale– non poteva che impallidire di fronte alle potenzialità dell’analisi computazionale dei «social data», utilizzata per scopi commerciali dai nuovi player del capitalismo informazionale, come per esempio Amazon. La crisi, insomma, era nell’aria. Sette anni dopo: i metodi campionari «variable centred» della ricerca sociale non sono stati spazzati dalla big data analysis, in quanto le due prospettive metodologiche consentono di osservare fenomeni sociali e culturali da angolature distinte, e con limitazioni differenti; per questo motivo, esse sono da ritenersi per molti aspetti complementari. La crisi, sette anni dopo, era diventata «far reaching». Nell’arco di tempo che separa i due articoli, Facebook raggiungeva e superava quota un miliardo di utenti attivi nel mondo (oggi due). Intanto, le scienze sociali facevano i conti con l’esplosione dei dati digitali, in particolar modo degli user generated data prodotti sui social media. Lo studio non intrusivo, in tempo reale e a basso costo delle opinioni e dei comportamenti digitalmente mediati degli individui non ha minato le fondamenta metodologiche della ricerca sociale, ma ha spianato la strada a nuove direzioni empiriche, molte delle quali ancora poco battute. Dando uno sguardo alla letteratura più recente si può avere l’impressione di assistere a un «testa a testa» controproducente tra gli approcci big data e la ricerca survey più tradizionale. Tale testa a testa chiama in causa elementi quali l’incontrollabilità del data generation process per i big data, le diverse modalità di controllo e gestione del total error e il diverso tipo di informazioni (e la loro qualità) che si possono ottenere tramite i due approcci. Questo articolo si discosta da questa contrapposizione affrontando invece un esempio di mixed method research in espansione nell’ambito della ricerca di mercato ma ancora sottoutilizzato nella ricerca politica e sociale: l’integrazione tra analisi di dati digitali e survey research. In quali casi l’analisi dei big data può essere integrata in disegni della ricerca imperniati sulla survey research? E, considerando la pratica della ricerca, in che modo? Dopo una riflessione intorno ad alcune peculiarità epistemologiche degli approcci survey e big data, verranno illustrate tre possibili combinazioni dei due: a) integrazione esplorativa – big data research mirata al survey design o alla scelta del dataset; b) integrazione complementare – i due approcci si integrano in fase di produzione e analisi dei dati; c) integrazione interpretativa – uso dei big data per approfondire e validare risultati survey. Survey: evoluzione tecnologica e incontro coi big data L’utilizzo delle surveys nelle scienze sociali ha già di fatto attraversato molteplici fasi di crescita, crisi e adattamento. Nel 1934 Neyman mostrava con chiarezza i vantaggi dei campioni probabilistici nell’offrire stime bias free ed errori di campionamento misurabili (Groves, 2011). Gli anni a seguire videro uno sviluppo notevole della survey: i campioni principalmente erano area- based, le interviste quasi unicamente face-to-face, i tassi di risposta altissimi e anche il lato della misurazione vide una grandissima evoluzione (Converse, 2009) grazie ai primi lavori di Likert, Gallup e Lazarsfeld. A partire dagli anni ’50 e soprattutto dai ’60, gli avanzamenti tecnologici incominciarono a offrire inedite opportunità ai tecnici delle surveys. La diffusione del telefono fornì sempre più occasioni di campionamento, mentre lo sviluppo dei computer iniziava a colonizzare sia l’analisi delle informazioni che la fase di raccolta. Dal punto di vista della misurazione, le teorie proprie della psicologia cognitiva vennero applicate al wording e alla costruzione dei questionari (Groves, 2011). Al contempo, l’utilizzo sempre più diffuso del telefono introdusse le problematiche legate alle interviste incomplete e ai tassi di risposta, suggerendo l’adattamento dei questionari stessi alle nuove modalità. La diminuzione dei tassi di risposta continuò negli anni (Berinsky, 2017) e le interviste face-to-face diminuirono sempre più di volume. Negli anni ’90 lo sviluppo della telefonia mobile invase la scena accompagnato da nuove opportunità e nuove problematiche. I tassi di risposta continuarono a scendere e il formato dei questionari venne sempre più adattato ai nuovi mezzi di rilevazione. Lo sviluppo di Internet rinvigorì lo studio dei questionari autosomministrati e
introdusse la possibilità di utilizzare materiale visivo ponendo l’accento sul basso costo per rispondente rispetto alle altre metodologie. L’esponenziale sviluppo di Internet e dei media digitali ha avuto e sta avendo un impatto senza precedenti sulla ricerca sociale. Secondo Groves (2011), viviamo in un periodo in cui la società stessa ha creato un sistema che misura, rileva, registra ogni tipo di attività in modo «organico». Il prodotto di questa sorta di «auto-misurazione» è noto come «big data». Epistemologia critica dei big data Messaggi testuali, visuali o vocali scambiati attraverso i social media, transazioni effettuate con carte di credito, accessi a pagine Web, spostamenti geolocalizzati tramite Gps, informazioni sul traffico registrate da sensori posizionati nelle città: questi sono solo alcuni esempi di big data. Le principali caratteristiche che li distinguono dalle basi dati comunemente analizzate nelle scienze sociali sono note in letteratura come le «tre V»: volume (enormi quantità di dati), velocità (dati prodotti in tempo reale) e varietà (dati di vario tipo, strutturati, semistrutturati e non-strutturati). Tuttavia, non è tanto il dato in sé a fare la differenza, quanto la sua origine. La principale peculiarità dei big data è infatti il loro essere dati «trovati» (found) dal ricercatore. Questo carattere «naturalistico» li rende paradossalmente più vicini a materiali etnografici che a dati provoked come, per esempio, risposte a surveys e interviste. Al contempo, diversamente dalle note di campo di un’osservazione partecipante, i dati digitali sono registrati istantaneamente e in modo non intrusivo dagli algoritmi di piattaforme online o sistemi informatici di altro tipo, nonché organizzati in modo persistente sotto forma di database ricercabili e analizzabili in tempo reale. Le caratteristiche di cui sopra, unite alla possibilità di studiare velocemente e con costi contenuti popolazioni su larghissima scala – per esempio, milioni di utenti Facebook – , hanno spesso indotto i ricercatori a considerare social media e piattaforme digitali come veri e propri laboratori a cielo aperto, capaci di abbracciare esaustivamente interi universi sociali. Questa concezione dei big data manca però di problematizzare alcune questioni metodologiche cruciali nello studio delle «digital footprint»:
mentre in quella interpretativa i big data sono a supporto dell’interpretazione e validazione di risultati survey. Data l’assoluta novità del tema, quelle illustrate di seguito non sono da intendersi come prassi assodate di ricerca ma, piuttosto, come direzioni metodologiche. Integrazione esplorativa L’integrazione esplorativa si riferisce all’utilizzo dei big data allo scopo di mappare un fenomeno che sarà poi analizzato tramite metodologie survey. Questo tipo di disegno misto può avere diversi fini, a seconda della popolazione studiata e delle risorse disponibili. Come nel caso ben più comune dell’uso preliminare di focus group e ricerche etnografiche, anche l’integrazione esplorativa di big data e survey research può servire in primis a informare la costruzione del questionario, allo scopo di ridurre i bias legati all’imposizione involontaria delle categorie del ricercatore sulle risposte. L’esplorazione su larga scala dei discorsi degli utenti sui social media – per esempio, attraverso tecniche non supervisionate come il topic modeling – può essere utile per tarare il wording delle domande e adottare il linguaggio specifico della popolazione studiata. Il mapping in tempo reale di trend dell’opinione pubblica può inoltre consentire di selezionare in modo induttivo casi specifici da menzionare nel questionario allo scopo di raccogliere le reazioni dei rispondenti. Per esempio, allo scopo di studiare forme di distinzione salienti nell’ambito del consumo musicale, Airoldi (2017b) ha incluso in un questionario disegnato ad hoc batterie di item riguardanti artisti posizionati agli estremi opposti di un campo culturale esplorato digitalmente attraverso tecniche di big data analysis applicate a YouTube, formulando le opzioni di risposta sulla base dello stile di commento caratteristico dei diversi profili di ascoltatori. Le potenzialità dell’integrazione esplorativa non finiscono qui. I big data – in particolar modo, i social media data – possono essere utilizzati per identificare e raggiungere popolazioni difficili da trovare offline. Più in generale, nel caso di surveys non rappresentative da condurre online, l’approccio big data può essere usato in fase preliminare per identificare i contesti digitali in cui distribuire la survey stessa. Infine, i big data possono idealmente fornire dati di contesto che agevolano la scelta della fonte dati più adatta in caso di analisi secondaria andando a ricostruire informazioni circa la popolazione oggetto di studio. Per esempio, il caso ipotetico di una forte correlazione tra supporto a Donald Trump e fruizione della tv via cavo emersa grazie a un’indagine esplorativa dei like degli utenti Facebook, potrebbe indurre il ricercatore elettorale a selezionare una fonte secondaria che includa anche quesiti specifici sul consumo televisivo. In tutti i casi citati sopra, la rapidità e il costo (relativamente) basso di analisi esplorative condotte online su larga scala rappresentano un fattore non indifferente nel favorire nuove forme digitali di eclettismo metodologico. Integrazione complementare Per «integrazione complementare» intendiamo un disegno di ricerca nel quale survey e big data si pongono sostanzialmente allo stesso livello sia analitico sia epistemologico, contribuendo da angolazioni differenti alla spiegazione di un fenomeno sociale nella sua «multidimensionalità». È proprio attraverso l’integrazione complementare che i due approcci hanno più possibilità di rafforzarsi e completarsi a vicenda. Possiamo rintracciare due grossi filoni di integrazione complementare tra survey e big data: triangolazione da un lato, data integration dall’altro. Il primo ricalca di fatto molte delle considerazioni fatte negli anni in merito al rapporto tra approcci qualitativi e quantitativi. Si tratta infatti di adottare le stesse procedure del cosiddetto «disegno triangolare», per cui si guarda al medesimo oggetto di studio secondo due prospettive differenti e complementari, le quali coesistono simultaneamente e con ugual «peso». Ciò consente di valorizzarne i rispettivi punti di forza metodologici: in questo caso, generalizzabilità statistica dei risultati e carattere strutturato dei materiali empirici per la parte survey, approccio non intrusivo, «data-driven» e in tempo reale per la parte big data. Detta in altro modo; ci si può concentrare sulle relazioni causali tra variabili utilizzando un approccio survey classico mentre si mappano su larga scala specifiche sfaccettature del fenomeno con un approccio computazionale. Questo è il caso del già citato studio di Airoldi (2017b) su distinzione e consumi musicali: mentre l’analisi dei dati YouTube ha consentito di indagare le relazioni tra artisti emergenti e pubblici digitali, un questionario distribuito via e-mail e completato da un campione non probabilistico di circa mille ascoltatori ha permesso di raccogliere informazioni (altrimenti irreperibili) sul rapporto tra gusto musicale e condizioni socioeconomiche. Il secondo filone di integrazione complementare tra dati
survey e big data ha invece a che fare con l’accorpamento dei due tipi di dati all’interno della stessa struttura analitica, pratica questa resa molto complessa dalla difficoltà nel mantenere la stessa unità di. A seconda del focus adottato si può distinguere tra tre configurazioni possibili: