













































Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Riassunto del libro Data Journalism, guida essenziale alle notizie fatte con i numeri di Marzia Antenore e Sergio Splendore. Nel riassunto sono state integrate le slide del corso di Data Journalism della professoressa Antenore.
Tipologia: Appunti
1 / 53
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!














































Con l’avvento del web 2.0 si è imposta la necessità di cambiare la realizzazione dei contenuti e della gestione dei processi produttivi delle news. Sono diventati fondamentali quindi due aspetti della comunicazione moderna: la connettività e lo storytelling. La crisi attuale del giornalismo è connessa a una mancanza di voglia di approfondire i contenuti da parte del lettore e del giornalismo stesso, ma anche da una reinvenzione monitorata. Con l’avvento di nuove tecnologie il giornalismo ha assunto due pratiche importanti: il bottom up, nello specifico il citizen journalism. Il data journalism necessità di nuove figure specializzate e la cooperazione di queste con il resto della redazione. Il compito del data journalist quindi è di acquisire competenze di analisi e saper riavvicinare al lettore che è sempre più disorientato dal grande numero di notizie che gli arrivano. Diventa necessario rendere queste informazioni gratuite e di facile comprendonio. Questa grande crisi è data anche dal fatto che il giornale cartaceo non si è saputo adattare al mondo attuale, soprattutto in Italia dove rimane una differenza operativa e quindi persiste una non cooperazione tra redazione cartacea e redazione digitale, cosa che avviene invece nel mondo anglosassone nel quale si ha un’integrazione di contenuti attraverso le varie piattaforme con strategie di approfondimento specifiche (continous desk) come per il The New York Times e il the Guardian. Attraverso lo studio svolto dall’osservatorio sul giornalismo è possibile notare come la maggior parte di coloro che lavorano in questo campo siano freelance. Dopo tutte queste critiche al giornale cartaceo bisogna ammettere che bisogna difendere l’istituzione che esso rappresenta. Il data journalism può essere interpretato come disintermediazione, ma al tempo stesso come un recupero da parte delle istituzioni della propria legittimità dopo la crisi della profilazione dell’informazione digitale. Il data journalism quindi ha una doppia funzione: rafforzare il rapporto di legittimità tra lettore e professionista dell’informazione e una semplificazione delle informazioni dati al lettore, ma anche una sfida personale da parte del giornalista nello sperimentare nuovi metodi di veicolare l’informazione.
Attualmente le testate giornalistiche che riscuotono più successo, sono coloro che adottano nuovi metodi per fare giornalismo di dati, come ad esempio Propublica, Buzzfeed e per quanto riguarda il contesto italiano il corriere della sera, il fatto quotidiano, la repubblica e skytg24.
Il data journalism è basato su dati, algoritmi, automatizzazione. La sua origine gè di area anglosassone e il fondatore è Samuel Rogers. Il data journalism dimostra che la storia può essere raccontata attraverso numeri, dataset e infografiche utilizzando l’interfaccia digitale e design negli strumenti. Spesso la sua origine è accumunata al giornalismo d’inchiesta. Tra i migliori prodotti di data journalism ci sono quelli che sono stati creati attraverso grandi quantità di dati, come lo studio del the guardian sulle spese parlamentari o ai files rilasciati da wikileaks sulle operazioni condotte in Afghanistan. Fondamentale per la redazione di articoli di dati sono gli open data, il processo mediante il quale le pubbliche amministrazioni rendono disponibili dati in formato digitale. Spesso open data e data journalism vengono accumunati perché gli open data diventano i data base per questi articoli, un caso particolare è quello italiano nel quale è più difficile rispetto alla media reperire dati. Una seconda motivazione è data dal fatto che le istituzioni mettono online i propri resoconti e diventa compito del giornalista controllare l’operato delle pubbliche amministrazioni. Infine, per ottenere questi dati sono state rilevanti le lotte da parte dei giornalisti che spesso hanno denunciato il fatto che molte istituzioni non mettessero o pubblicassero in modo parziale dati online, tra queste organizzazioni possiamo trovare il Foia4Italy, Ondata, LSDI (libertà di stampa e di informazione). Più i governi sono trasparenti e più il data journalism può trovare fonti su cui compiere le proprie indagini. Se il data journalism nasce dallo studio di dati, al momento ambisce a diventare un racconto efficace più chiaro possibile su questioni complesse, come ad esempio Raising barries del Washington post o Gun deaths in America del fivethirtyeight del 2017. Secondo Nikky Usher il data journalism è quel tipo di giornalismo interattivo, cioè che si basa su racconti giornalistici portati avanti attraverso rappresentazioni visive interattive che chiamano in causa il lettore, lo coinvolgono e gli chiedono di partecipare. Negli anni è stato istituito un Dta journalism awards, le quali categorie sono visualization, cioè la capacità di visualizzare in maniera efficace, comprensibile e interattiva una mole di dati; poi c’è una categoria che ha a che fare con il valore investigativo di quel lavoro giornalistico e infine si valuta la capacità di fornire dati in formato open che poi altri possano utilizzare. Esistono almeno quattro vantaggi che il giornalismo dei dati porta con sé al lettore:
L’emergere del data journalism, all’inizio del XXI secolo, indica una nuova fase del giornalismo in cui il volume di dati disponibile, rilasciato in formato digitale consente di lavorare con più informazioni rispetto al passato. Fino a qualche anno fa, il termine veniva spesso usato come sinonimo di “giornalismo di precisione”. Negli Stati Uniti è invalso a lungo l’uso del termine CAR [Computer Assisted Reporting], che indica un tipo particolare di reportage computer-assistito basato sull’analisi dei dati. Il data journalism come lo conosciamo oggi affonda le sue radici nell’analisi computazionale dei dati a fini previsionali svolta in occasione della campagna presidenziale del
Data visualization Uno spartiacque importante viene riconosciuto nel lavoro di raccolta, elaborazione e rappresentazione grafica di Florence Nighingale. Durante la guerra in Crimea, Nightingale sviluppa il suo celebre diagramma a cunei, un grafico ottenuto suddividendo una superficie circolare in dodici sezioni uguali, ciascuna corrispondente ad un mese dell’anno, sul quale è possibile visualizzare distintamente l’evoluzione nel tempo delle diverse cause di mortalità dei soldati. La maggioranza dei decessi dei soldati è causata da malattie prevenibili (cunei esterni) e non dalle ferite inferte sul campo di battaglia (cunei interni) come si era erroneamente pensato sin ad allora. Si rendono conto che tutte le malattie possano essere prevenute con delle attenzioni, doveva convincere i politici attraverso il diagramma. La Descriptive Maps of London Poverty realizzate in varie edizioni dal filantropo britannico Charles Booth rappresentano le antenate delle mappe interattive contemporanee. Frutto del lavoro di tre anni, la Booth’s map of London Poverty del 1889 è una radiografia della povertà che ridisegna la City in base a diverse categorie di disagio sociale. L’intento di Booth è quello di evidenziare e rendere pubbliche le sacche di disagio di una Londra più povera e socialmente composita di quanto mostrassero le statistiche ufficiale rendendo impossibile per l’opinione pubblicare ignorare la situazione. Per cogliere l’impatto dell’industrializzazione sulle condizioni di vita della Londra ottocentesca e, al tempo stesso rappresenta una formidabile testimonianza premoderna della potenzialità del datamining unito alla proiezione cartografica. Si tratta di una ricerca di natura ecologica poiché utilizza dati ecologici cioè che hanno a che fare con un certo territorio, non hanno a che fare con il singolo ma con le persone [Es dati del censimento, anagrafe, Istat]. Gli esordi computazionali e il giornalismo di precisione La svolta nel data journalism viene dall’introduzione del calcolatore elettronico nei primi anni Cinquanta che rende molto più semplice archiviare e elaborare dati per scopi scientifici, militari e quindi giornalistici. L’utilizzo del computer diviene una pratica comune nelle redazioni statunitensi già negli anni Sessanta. Ma le origini del CAR risalgono al 1952 quando il network CBS usa uno dei primi calcolatori commerciali. L’UNIVAC, per prevedere la vittoria di Dwight Eisenhower alle elezioni presidenziali basandosi sullo spoglio di poco più di 3 milioni di voti popolari.
un titolo emblematico – Less wind, lots of damage – evidenziano chiaramente come la devastazione degli edifici non fosse correlata all’intensità del vento, quanto agli esiti della corruzione dell’edilizia urbana, che a partire degli anni Settanta aveva messo a serio repentaglio la sicurezza degli edifici esponendoli a qualunque attacco atmosferico. Oggi Il giornalismo contemporaneo si serve delle banche dati online e la diffusione e ampliamento di banche dati online ma in realtà ancora oggi non sono ancora così ricche, redazioni con nuove figure professioni. Con dati intendiamo un modo di organizzare un’informazione, sono quindi una risorsa obliqua. Il computer assisted reporting non perde la sua vocazione alla denuncia sociale ma le storie data-driven presenti sui giornali coprono anche altri aspetti della vita quotidiana: il sistema dell’istruzione, le condizioni di lavoro e reddito dei cittadini, i trasporti e la criminalità. Nel 1989 viene creato il NICAR con l’intento di formare generazioni di giornalisti sull’importanza dei dati e delle statistiche. In UK viene fondato il centre for investigative journalism con la medesima mission formativa del suo corrispettivo americano con cui si muove in stretta sinergia. Da questi due centri emergono le prime linee guida collettive sugli standard che dovrebbero essere seguiti al fine di valorizzare i dataset nello storytelling: dà indicazioni pratiche sull’accuratezza dei dati alle competenze necessarie per elaborarli e inserirli correttamente nella storia. Nel gennaio 2005 viene finalmente applicato il FOIA [Freedom of information act] – approvato cinque anni prima- e nel 2009 Simon Rogers fonda il Guardian Data Blog considerato un punto di riferimento e fonte di ispirazione per tutti i data journalist europei e lancia l’etichetta data journalism. È un dispositivo legislativo che permette a chiunque di accedere a dati o fondi che non sono pubblicati e implica il dovere di consegnarli a chi ne fa uso. Nasce in Svezia, viene successivamente applicato negli USA e infine arriva in Italia. Megan Knight sostiene che l’impatto marginale, sia dal punto di vista della sue estensione che da quello dei reali contenuti informativi cosicché il data journalism è praticato sia per il suo visual appeal che per sue qualità investigative e il suo impatto generale sui quotidiani è decorativo quanto informativo.
In Italia il Data journalism esordisce nel 2012 procedendo fin da subito a due velocità. Quella delle newsroom delle testate tradizionali che, salvo sporadici ma illustri casi esempi di reportage data- driven ma con uno sviluppo lento e quella dei freelance che spesso iniziano appoggiandosi a una raccolta attraverso crowdfunding e poi vendono il pezzo. Il primo lavoro di data journalism che si definisce in questi termini viene realizzato dal freelance Jacopo Ottaviani per il fatto quotidiano e riguarda l’analisi dei decessi in carcere dal 2002 al 2012. L’inchiesta denominata Padri galere è corredata da una mappa interattiva che mostra luoghi, numerosità e cause dei decessi. Nell’autunno dello stesso anno esce in varie puntate su Wired Italia l’inchiesta di Scuole sicure basata sui dati relativi al rischio sismico e alla messa in sicurezza degli edifici scolastici. In questo caso il lavoro è di squadra e vede la partecipazione di giornalisti, sviluppatori e designer e promuove anche una campagna per l’apertura dei dati e per la loro raccolta dal basso (una forma di campagna di crowdsourcing rivolta a insegnanti e genitori). Nel 2012 è anche l’anno di fondazione di datajournalism, un network di attivisti e giornalisti, curando datastories una rubrica di data journalism per l’Espresso. Nello stesso anno apre Data Ninja, un network nato come laboratorio di sperimentazione nel giornalismo, che nel 2014, ha vinto il principale riconoscimento nel campo del data journalism award con l’inchiesta Migrant files , pubblicata dall’Espresso, l’inchiesta di Andrea Nelson Mauro e Alessio Cimarelli, racconta, sotto forma di mappa dinamica, la storia di 23 mila migranti deceduti nel tentativo di raggiungere l’Europa. Spaghetti Open data uno dei network più attivi nella promo zione del movimento open data che ha portato alla costruzione del primo portale di dati aperti in Italia (https://www.dati.gov.it/) e fondazione ahrefs istituita nel 2010, la prima in Italia a studiare e valorizzare il patrimonio informativo digitale. Molti dei protagonisti di questa fase hanno partecipato, a vario titolo, alla revisione del FOIA italiano approvato a maggio 2016 che costituisce un importante passaggio legislativo, per quanto ancora incompiuto, per adeguare la normativa italiana sull’accesso al dato a quella dei principali paesi europei. Il FOIA [freedom of information act] è un dispositivo legislativo che permette a chiunque di accedere ai dati o ai fondi che non sono pubblicati e implica il dovere di consegnarli a chi ne uso. Nato in Svezia, è stato introdotto successivamente negli Stati Uniti e infine emanato in Italia nel
Es Unfounded (Will the police believe you?), The Globe lavoro di data journalism svolto nel 2017 che consiste nell’analizzare casi di denuncia che non vengono creduti, per l’appunto il 20% viene dichiarato una non violenza. Il giornalista ha eseguito questo lavoro grazie anche alla possibilità data dagli agenti della polizia all’archivio dati.
Ogni giorno individui e organizzazioni contribuiscono, in modo più o meno consapevole, a produrre una straordinaria quantità di dati. Tutte le altre forme di azione e interazione mediate dal digitale, è possibile ricostruire profili di comportamento individuali e modelli di gruppo. Google, Apple, Facebook, Microsoft e Amazon sostengono ingenti investimenti per offrire servizi essendo poi ricompensati attraverso la raccolta, organizzazione e valorizzazione della maggior quantità di dati possibile. Un modello di previsione potrebbe, ad esempio, tenere traccia dello scarto tra la previsione fatta ed il valore osservato e usare questi dati per modificare il modello stesso in direzione di una progressiva minimizzazione dell’errore (secondo la logica del cosiddetto machine learning ). Per comprendere il passaggio di dati alla storia è essenziale inizialmente sgomberare il campo dall’assunto secondo il quale i dati, da soli, raccontano o contengono una storia. Una storia che non è confermata o che è addirittura smentita dai dati non regge allo sguardo di un osservatore attento. Una storia, viceversa, che richiama esplicitamente i dati è di solito considerata più solida. Questa proprietà dei dati rappresenta dunque un potente espediente per supportare una storia. Le storie potrebbero essere basate su dai errati o incompleti, ottenuti attraverso metodologie improprie o completamente errate, essere obsoleti e persino essere dati prodotti ad arte per supportare una certa visione del mondo. In questi casi vigono le normali regolo che consentono di stimare l’affidabilità delle fonti. Si tratta dunque in definitiva di un problema di fiducia. Ottenere dati corretti da una fonte attendibile è dunque indispensabile. Esistono sicuramente fattori che hanno contribuito negli ultimi anni a rendere più difficile fare sondaggi affidabili (il passaggio alla telefonia mobile, la volatilità degli scenari politici e delle scelte elettorali) e le peculiarità della competizione elettorale del 2016 hanno contribuito a rendere ancora più difficile questo compito. La percezione diffusa della sconfitta dei sondaggi non è dunque supportata da dati. A ben guardare, si tratta invece di un fallimento nella capacità dei news media di evincere la storia dei dati a cui è eseguita una efficace narrazione che ha attribuito agli istituti demoscopici l’errore. Alcuni errori comuni Analogamente, nel contesto della data analysis, la pratica del cherry picking consiste nel selezionare dei dati a disposizione quelli che supportano una certa ipotesi o narrazione ignorando o trascurando quelli che, al contrario, la indeboliscono o la disconfermano. Una delle tecniche di analisi dei dati più comune consiste nel cercare correlazioni statistiche tra serie di eventi diversi che potrebbero essere legati da una relazione di causa effetto contribuendo a spiegare un determinato fenomeno. È sempre opportuno prendere in considerazione la possibilità che la correlazione tra variabili che stiamo osservando potrebbe essere frutto del caso o dell’effetto di variabili terze che non abbiamo preso in considerazione (correlazioni spurie). La grande quantità di dati disponibili e l’elevata potenza di elaborazione di cui dispone comunemente nei dispositivi di uso quotidiano ha profondamente modificato le pratiche che sottendono l’analisi dei dati. La ricerca di correlazioni è infatti oggi spesso utilizzata come tecnica esplorativa finalizzata a cercare e formulare possibili domande di ricerca più che a testare la validità di domande formulate in precedenza.
Anche in presenza di una correlazione statistica ragionevole non spuria, non è possibile concludere senza ulteriori analisi che esista una relazione di causa ed effetto tra le variabili correlate. La correlazione non è infatti una direzionalità. Nelle narrazioni basate su dati la dimensione della correlazione e quella della causalità risultano spesso sovrapposte. In particolare, nella formulazione dei titoli, la necessità di sintesi, quella della semplificazione e talvolta la ricerca del sensazionalismo portano spesso a presentare le correlazioni come veri e propri rapporti di causa ed effetto. A differenza di altre branche della matematica statistica (e dunque dell’analisi dati) contiene un’intrinseca componente di scelta soggettiva del ricercatore. Questa componente soggettiva è parte integrante del processo ed in quanto tale non può essere espunta. La correttezza tra equità ed uguaglianza Anche se la componente soggettiva in un processo di analisi dei dati è ineliminabile, si può affidare, come sempre più di frequente viene fatto, l’analisi a modelli matematici che una volta progettati e implementati funzionano autonomamente rendendo l’intervento umano ancora meno visibile. Pur consistendo di una sequenza di istruzioni sempre uguali, infatti, l’algoritmo è stato ideato, progettato e realizzato da qualcuno. In quanto tale, esso può contenere errori e riflettere i bias di chi lo ha disegnato o implementato. L’algoritmo apprende e si modifica in base allo storico dei dati che ha analizzato. L’evoluzione di questi sistemi, specie quando elaborano in tempi rapidi enormi quantità di dati, non sempre è completamente prevedibile a priori neanche da chi ha progettato l’algoritmo. Lo dimostra la polemica scaturita negli Stati Uniti intorno all’algoritmo COMPAS. COMPAS è alla base di un sistema per supportare il giudice nella decisione di concedere o meno la libertà dell’imputato in attesa di processo. Le statistiche sul sistema giudiziario americano dimostrano che questa decisione influenza profondamente l’andamento delle fasi successive del processo poiché gli imputati a cui non viene concesso questo beneficio sono più soggetti ad essere condannati. Per quanto possa sembrare strano sia ProPublica che Northpointe hanno ragione. Il problema è che l’algoritmo è alimentato da dai storici sulla criminalità negli Stati Uniti che fotografano una situazione sbilanciata in cui i cittadini di colore sono tradizionalmente più soggetti ad essere arrestati per le stesse attività e condannati rispetto ai bianchi. Il paradosso è che per promuovere l’uguaglianza, l’algoritmo dovrebbe contenere un meccanismo di compensazione basato sul colore della pelle che lo renderebbe non neutrale e discriminatorio.
visualizzazione dei dati per il pubblico, questo avviene ad esempio alla BBC, Financial Times, in Germania o in Svizzera. Negli Stati Uniti invece le strutture organizzative sono diverse come hanno evidenziato gli studi di Parasie e Dagiral a Chicago, Royal per il New York Times e Usher per il Wall Street Journal. In questo caso all’interno delle redazioni non esiste un vero e proprio team di giornalisti dei dati, ma piuttosto un data team composta da programmer-journalist che lavorano i dati grezzi producendo visualizzazioni descrittive che altri giornalisti possono poi utilizzare o analizzare in maggiore profondità in un secondo momento. Non tutte le redazioni possono permettersi uno specialista di programmazione o di design. Soprattutto le testate locali faticano a implementare una organizzazione redazionale in cui ci sia una separazione netta tra le figure tecniche e figure giornalistiche. In questi casi ai giornalisti è richiesto di mettere in campo o sviluppare anche competenze tecniche diventando, appunto, dei tecnogiornalisti. In Scozia, Galles o Irlanda del Nord, dove si assiste a un, seppure lenta, istituzionalizzazione del data journalism perché tecniche che sono legate al giornalismo dei dati come lo scraping , le analisi statistiche o elaborazione algoritmica dei dati vengono utilizzate sempre più spesso. Il data journalist si avvale anche della collaborazione (soprattutto informale) con altri attori sia all’interno che all’esterno della redazione. Spesso, queste cooperazioni sono volte a sperimentare nuove forme di rappresentazione e visualizzazione o a introdurre nuove applicazioni o tecnologie che richiedono competenze cha mancano all’interno delle redazioni stesse. Ecco perché si tende ad attingere a risorse provenienti dall’esterno e da diversi comparti, un’attività detta anche MacGyvering. La tendenza a trascendere i confini della redazione è anche dimostrata all’interazione tra il singolo data journalist e la sua comunità di riferimento attraverso reti pan-mediatiche come ad esempio Hacks/Hackers e Spaghetti open data (in Italia). Infine, la particolare propensione alla produzione collaborativa è comprovata anche dalle cooperazioni con il settore della ricerca nell’ambito delle scienze sociali o informatiche o dallo scambio attivato con il pubblico o con i giornalisti non professionisti, un buon esempio di networked journalism. I principi dell’apertura, della trasparenza e della partecipazione L’orientamento all’apertura ( openess ) e alla trasparenza. Questo principio distingue tra l’altro il giornalismo dei dati da pratiche solo apparentemente simili com il CAR e il precision journalism. Nel caso del CAR, infatti, i dati grezzi non erano mai pubblicati, mentre con il precision journalism ci si limitava, nel rispetto del principio scientifico della replicabilità, alla stesura di una documentazione cartacea rivolta ad altri giornalisti investigativi, ma non al pubblico. Invece nel giornalismo dei dati la pubblicazione sia dei dati grezzi sia di una descrizione delle analisi svolte (su piattaforme come Github ), al fine di permettere a chiunque di riutilizzare i dati, è d’obbligo. Questo influenza in maniera rilevante il processo produttivo editoriale perché costringe i giornalisti a condividere i loro metodi e processi di analisi e a rendere conto delle loro attività. Il processo editoriale con chi non faceva parte della redazione, rifuggendo in questo modo da ogni forma di produzione partecipativa. Solo di recente alcune testate giornalistiche hanno permesso al pubblico di partecipare attivamente nella produzione delle notizie, ad esempio attraverso il crowdsourcing oppure aprendo veri e propri processi di partecipazione. Se cerchiamo però l’origine della cultura dell’apertura e della trasparenza, dobbiamo rivolgere lo sguardo alla cultura degli
hacker e alle comunità open source. Non a caso gli hacker e i corrispettivi hacker-journalist , che di solito sono programmatori, sono stati abituati a collaborare con altri programmatori, il che li rende l’implementazione di forme participative di produzione non solo meno impegnativa, ma facilita anche la sperimentazione di nuove innovazioni. Dall’altra nel bagaglio culturale di questi hacker- journalist ci sono anche delle norme professionali diverse. L’idea che sta dietro il concetto di open source è che la libera condivisione, la produzione collaborativa e la distribuzione gratuita produca i migliori risultati in termini di trasparenza, fruizione e usabilità, specie perché gli utenti vengono coinvolti nel processo di programmazione e produzione. Questo orientamento all’apertura completa di rispecchia nell’attitudine di fare bella mostra del proprio lavoro o in gergo di show your work. In accordo con questa prospettiva Lewis e Usher hanno sviluppato un quadro di quattro valori normatici che, se rispettati, permetterebbe l’applicazione dei principi dell’open source in ambito giornalistico: la trasparenza, la partecipazione, il tinkering (ossia la sperimentazione) e l’intenzione, che favorisce il processo di produzione creativa al posto dell’orientamento verso il prodotto finale. Il data journalism come espressione di una (contro)cultura giornalistica specifica Rispetto al giornalismo tradizionale, il data journalism è anche immerso in una cultura di riferimento che potrebbe essere definita cultura tecnologica integrata in quanto amalgama le innovazioni tecnologiche, la partecipazione del pubblico e la trasparenza con l’operato giornalistico. Le ricerche di Splendore e Polezza segnalano ad esempio che la maggior parte dei data journalist che lavora come freelance in Italia è stata formata e socializzata al di fuori delle redazioni tradizionali. Questo iter formativo peculiare ha portato molti dei futuri giornalisti di dati a confrontarsi con la cultura giornalistica anglosassone, mettendoli in contatto con pratiche, routine e soprattutto un’idea di epistemologia professionale diversa da chi si è formato e ha lavorato esclusivamente nelle redazioni tradizionali. Queste esperienze si riflettono da una parte nell’applicazione di un principio fondamentale nella cultura giornalistica anglosassone ovvero quello dell’oggettività, dall’altra in una maggiore propensione a mettere in pratica concetti come accountability e responsiveness , prendendosi la responsabilità della produzione e rendendo conto del proprio operato al pubblico. Grazia ai contributi di team dei giornalisti dei dati, di team interattivi o gruppi votati all’improvvisazione giornalistica, infatti, alcune redazioni sono riuscite a sviluppare la già citata cultura tecnologica integrata. Inoltre, questi team specializzai, hanno spesso contribuito alla diffusione graduale delle loro competenze tecnologiche specifiche in tutta la redazione, trasferendole quindi anche a giornalisti di stampo più tradizionale e generando così un cambiamento culturale che ha portato a una produzione di notizie più adatta alle esigenze di un ecosistema digitale. Tuttavia, è indubbio che oggi sia riconosciuta una crescente importanza ai dati e agli aspetti collaborativi in ambito giornalistico. Il crescente sviluppo del giornalismo dei dati è visibile anche nella creazione di network specializzati di data journalism come l’ European data journalism network -EDJNet. Si tratta di una rete di testate già affermate come Spiegel online (Germania), NRC Handelsblad (Paesi Bassi) Internazionale (Italia), El Confidencial (Spagna) Ouest-France (Francia) e altri ancora che, da ottobre 2017, condivide e pubblica contenuti su affari Europei prodotti mediante il data journalism. Inoltre, a Giugno 2017, le tre agenzie di stampa AFP, DPA e ANSA hanno lanciato la European Dta News Hub, una piattaforma che mette a disposizione contenuti data-driven sulla politica europea. Entrambi i progetti sono sostenuti dall’Unione Europea
L’industria dell’editoria e la professione giornalistica vivono oggi una condizione di mutamento costituito dalla disponibilità di un’abbondanza di dati esplorabili a livello computazionale e da un’enfasi sulla dimensione degli algoritmi. Si tratta di una prospettiva data-centrica che riguarda il più ampio rapporto tra tecnologia e società e che vede il digitale al centro del processo. Tale ambito sta trasformando il mondo delle news sia dal punto di vista produttivo che distributivo e di consumo attraverso la capacità di costruire ampli dataset che raccolgano miriadi di informazioni. Informazioni che hanno a che fare sia con i contenuti stessi, sia con il comportamento di esplorazione e lettura delle notizie, sia con la capacità di analizzare ed interpretare questi dati al fine di produrre senso e fornire valore finale attraverso processi automatizzati di machine learning. Mediatizzazione del giornalismo e deriva data-centrica Nel nostro caso si tratta quindi di confrontarsi con l’emersione di forme giornalistiche che corrispondono all’effetto di disruption prodotto da quella particolare configurazione data-centrica capace di alterare in modo significativo sia la realtà quotidiana, sia la realtà quotidiana, sia la dimensione del mercato, sia la cultura giornalistica in direzione del data journalism. Giornalismo automatizzato: big data journalism e bot journalism Il giornalismo automatizzato riguarda la possibilità di generare automaticamente news attraverso algoritmi capaci di trattare dati strutturati e si va da sistemi più semplici che estraggono dati da database – ad esempio risultati finanziari – da collocare in strutture narrative precompilate, a sistemi più complessi che combinano analisi di big data e la generazione di linguaggi naturali. In generale si parla di robot journalim in relazione all’insieme di tecnologie di automatizzazione delle news da distribuire online, o attraverso applicazioni mobile che consentono non solo la scrittura di articoli, ma anche di rispondere a specifiche attività produttive come la segnalazione e la curation di notizie, analisi dati e visualizzazione. La piattaforma Quill di Narrative Science combina analisi dei dati e storytelling, elaborando la raccolta di informazioni su specifici ambiti, come le partite, e scrivendo un paragrafo che simula dal punto di vista linguistico la sintesi del giornalismo sportivo. Forbes ha adottato questo software per generare articoli che ricostruiscono previsioni sulla realtà della finanza aziendale. La stessa Associated Press, una delle principali agenzie di stampa al mondo, ha iniziato ad automatizzare la produzione dei suoi rapporti trimestrali sui redditi aziendali. Il giornalismo automatizzato consente di gestire la produzione di notizie in termini di velocità, ampiezza e maggiore precisione. È quindi possibile produrre contenuti informativi in tempo reale attingendo a dati mentre vengono prodotti e coprire più eventi di uno stesso tipo senza dover selezionare dove puntare l’attenzione del giornalista.
Quakebot del Los Angeles Times consente di dare informazioni in tempo reale su tutti i terremoti raccogliendo i dati da sensori sismografici posti nella California del sud, mentre i giornalisti si limitano a raccontare quelli più rilevanti. La pervasività in tempo reale, anche di un’informazione che si rivolge ad un pubblico scientifico (anche linguisticamente) e territorialmente collocato, diventa rilevante per il sistema editoriale per la capacità di attrarre click sulla notizia online aumentando il traffico e quindi la possibile raccolta pubblicitaria. Una possibile deriva di questo tipo di automatizzazione delle news ha a che fare con l’iper- personalizzazione, cioè con la costruzione di contenuti per un singolo fruitore: il modello utilizzato non fonda infatti il valore economico sulla diffusione e scalabilità di massa delle informazioni generate quanto sulla loro pertinenza rispetto ad un bisogno informativo. È così possibile immaginare forme di personalizzazione anche della stessa notizia che può essere raccontata da un’angolatura differente mettendola in relazione ad altri eventi più aderenti agli interessi del lettore o addirittura a notizie on demand capaci di rispondere a quesiti che il fruitore può porre. Un limite di questa forma di giornalismo sta nella prevedibilità e standardizzazione del contenuto prodotto: gli algoritmi sono progettati per rispondere a specifiche domande ed esigenze di racconto, difficilmente possono generare nuovi punti di vista su un evento o assolvere alla funzione di sorveglianza del potere, nella più consolidata tradizione del giornalismo. La prospettiva utopica – ma tecnologicamente realizzabile man mano che si svilupperà la capacità di generazione del linguaggio naturale e della capacità data-driven - sta nello sviluppo di ricerche che usano l’intelligenza artificiale per trovare storie che gli esseri umani non potrebbero trovare. Una seconda via in sperimentazione in questo campo di automatizzazione dell’informazione e sua distribuzione sta nei sistemi di news bots che riguardano applicazioni di messaggistica istantanea, come messanger di facebook, che portano il contesto del giornalismo all’interno della comunicazione bidirezionale su piattaforme di chat. Testate come CNN, The Wall street journal e the Washington post hanno avviato progetti in tal senso. Ad esempio il Post ha inaugurato a luglio 2016 il bot Heliograf , sviluppato in-house, che genera sia aggiornamenti brevi che compaiono come live blog, su Twitter e in chat sia contenuti più strutturati. Altri percorsi all’orizzonte stanno integrando la dimensione audio alle bot news come nei casi di Alexa di Amazon e Google Assistant. Con la possibilità di monitorare i comportamenti di richiesta di informazione di lettura e la geo- localizzazione degli utenti in modo da personalizzare al massimo, anche qui, le news e i tempi di emissione in modo da creare un’esperienza di fruizione sempre più adeguata e su misura per il singolo. Le prime esperienze -ad esempio quella di CNN su messanger – infatti sono state caratterizzate da lamentele dei lettori circa i frequenti invii di contenuti, per le imprecisioni da parte di bot e per i tempi lenti di risposta. La crescita di personalizzazione associata a queste forme di giornalismo automatizzato porta a chiederci se questo tipo di giornalismo sarà in grado di rispondere ad un interesse pubblico o finirà, per garantirsi modelli di business efficaci, per costruire bolle informative in cui i singoli lettori saranno sempre di più immersi attraverso esperienze, sempre più a loro misura, ma che escludono un rapporto tra dimensione informativa e dibattito pubblico. Un’ulteriore criticità sperimentata dall’opinione pubblica con i sistemi di intelligenza artificiale – e che può alzare il livello di diffidenza – è offerta dal caso del chatbot Tay di Microsoft, progettato per interagire online con i millenials e apprendere attraverso le interazioni con loro su Twitter: in sole 24 ore ha cominciato a produrre contenuti razzisti xenofobi ed offensivi che hanno portato a chiuderlo.
Se pensiamo però alla frontiera più avanzata e sperimentale del giornalismo immersivo dobbiamo riflettere su di un utilizzo dei dati più strettamente legato all’esperienza di una presenza sensoriale ed emotiva di chi fruisce del contenuto informativo e quindi a forme narrative che utilizzano piattaforme di gioco e ambienti virtuali per veicolare news, documentari e racconti non-fiction. In tal senso vediamo emergere due tendenze: la prima all’iper-realismo, che sfrutta la raccolta di dati ambientali e sugli eventi per ricostruzioni di ambientazioni e situazioni che consentano di fare un’esperienza più ravvicinata con gli accadimenti; la seconda più interessata a miscelare dati reali con ricostruzioni tridimensionali in computer grafica, ad esempio attraverso l’uso di machinima che sfruttano sofware per ricostruire ambientazioni simulate e consentire un’esperienza immersiva gamificata. Se nella prima tendenza si privilegia l’esperienza del punto di vista dell’utente che può scegliere come osservare una particolare situazione in cui è immerso, la seconda privilegia il punto di vita, cioè l’interazione tra narrazione e scelte esplorative dell’utente. La logica narrativa in cui immergere l’utente è più simile a quella del videogioco e richiama gli stessi principi esplorativi. Un esempio del primo tipo sono i reportage come Tour Aleppo’s old city, an ancient treasure decimateb by war della CNN che offre in un video a 360° di due minuti, condiviso su Facebook, la possibilità di esplorare, attraverso il movimento del mouse, le immagini che si susseguono mentre una voce fuori campo descrive il centro antico della città. Si tratta di una prospettiva editoriale di arricchimento dell’offerta di approfondimento delle notizie su cui le redazioni cominciano ad investire – basti pensare che la CNN ha lanciato nel marzo 2017 il CNNVR, un’unità interna al CNN digital che si occupa di giornalismo immersivo anche per la piattaforma di VR. Un esempio del secondo tipo è rappresentato dai lavori della giornalista – docente Nonny de La Pena, come Project Syria in cui lo spettatore vive due situazioni in cui, prima è portato ad immergersi con visione VR lungo una ricostruzione tridimensionale delle strade di Aleppo e sperimenta la caduta di un razzo esplosivo che colpisce la strada, poi si ritrova in un campo di rifugiati, con audio originali degli eventi restituiti attraverso il visore stereoscopico a partire da una ricostruzione 3D tratta da video e fotografie che testimoniano gli accadimenti. Oppure con Hunger in LA in cui, sempre con head mounted display e virtual reality googles si esperisce la condizione di testimone davanti ad una zona di distribuzione di cibo ad indigenti a Los Angeles in cui una persona collassa a terra, fatto reale restituito dalla dimensione sonora registrata durante l’accadimento. O anche con l’esperienza immersiva Use Force in cui viene ricostruita da riprese video di testimoni il pestaggio da parte degli agenti pattuglia del confine con il Messico e la morte del messicano Anastasio Hernàndez-Rojas che, sprovvisto di documenti, tentava di rientrare negli Stati Uniti, in cui aveva vissuto per ventisette anni prima di essere deportato, per ricongiungersi con la famiglia. Una critica che è possibile fare circa lo sviluppo di queste forme di giornalismo immersivo è il rischio che porti il pubblico sempre più all’interno di quella dimensione iper-realtà cui i media, secondo la visione di Jean Baudrillard già ci sottopongono finendo per erodere il senso del reale e, quindi, renderci più distaccati dai fatti. Eppure, come sottolinea De La Pena è proprio questa opportunità di sperimentazione dei fatti piuttosto che nella sola presentazione che si possono sviluppare forme di partecipazione diretta ad eventi remoti capaci di produrre coinvolgimento di stampo emotivo ed empatico, che potrebbe sviluppare, grazie alla dimensione immersiva, livelli di comprensione e flessibilità diversa rispetto alla semplice fruizione di notizie. Conclusioni
Il data journalism rappresenta una risposta sociale alla crescita di asimmetria informativa che si produce sempre più di una società in cui, lungo il processo di mediatizzazione, i dati diventano risorsa centrale sia dal punto di vista economico che politico finendo per costituire una dimensione concentrazione di potere per quelle organizzazioni che li trattano. Il fatto che la professione giornalistica si apra alla possibilità di tradurre questi dati in narrazioni utili all’opinione pubblica rappresenta una forma di riequilibrio in termini di trasparenza e accountability. Immersive journalism/giornalismo immersivo Con il termine immersive journalism/giornalismo immersivo si intende la produzione di notizie secondo formati che consento un’esperienza in prima persona degli eventi raccontati. Lo spettro di possibilità che si apre in tal senso va dalla ricostruzione dei luoghi attraverso video girati con telecamere 360° per offrire ai lettori il senso spaziale e geografico di un accadimento fino all’uso di rending di computer-generated imagery (CGI) che producono machinima (machine animation) che consentono di esplorare narrazioni informative tridimensionali anche attraverso supporti immersivi come visori e cuffie per la VR. Pioniere di questo ambito è la giornalista Nonny de la Pena. Nel 2015 The New York Times Lancia l’iniziativa NYT VR in partnership con Google distribuendo ai suoi lettori i visori a basso costo Google Cardboard da applicare agli smartphone e l’anno successivo inizia la produzione quotidiana di video a 360° in collaborazione con samsung. Nel 2016 The Guardian sviluppa nel suo comparto News & Media un virtual reality team che ha prodotto un primo film immersivo in cui esplorare i sotterranei della Londra vittoriana in collaborazione con Google.