Corso

Data-driven journalism: raccontare il mondo a partire dai numeri

Anno Accademico: 

  • 2016-2017

Anno: 

Primo Anno

Contenuti: 

La messa a punto di un corso di data driven journalism muove da una considerazione semplice e ormai ampiamente condivisa nel mondo del giornalismo digitale: i dati (e i fatti) sono sacri. E un giornalista non può fare a meno di conoscerli, analizzarli e renderli visibili anche al pubblico. Il giornalismo digitale ha a disposizione una enorme quantità di dati. La continua raccolta di informazioni da parte delle istituzioni, delle amministrazioni, delle aziende e dei centri di ricerca così come la distribuzione di dati da parte dei singoli attraverso tutti i siti, i dispositivi mobile, le reti e le app che utilizziamo, unitamente alla potente capacità di calcolo ormai raggiunta, consentono di poter accedere a così tante informazioni da rendere obsoleta e poco adeguata una informazione basata solo su poche fonti.

La verifica dei dati, il loro utilizzo per la produzione di contenuti giornalistici e la pubblicazione di articoli e visualizzazioni che permettano anche una interazione diretta con il lettore/fruitore, diventano quindi strumenti necessari nella cassetta degli attrezzi di un giornalista del presente e dei tempi futuri. Il corso di data-driven journalism (data journalism) è stato il primo, all'interno di un master italiano, ad avere uno spazio strutturato e un corpus di ore che consente agli studenti di entrare in possesso dei concetti e degli strumenti pratici per poter ideare un prodotto giornalistico a partire dai dati.La collaborazione tra la Sissa e la Fondazione Ahref, prima esperienza italiana che si pone l'obiettivo di potenziare la qualità del lavoro giornalistico, attuando un metodo condiviso e valorizzando il contributo dei cittadini e delle reti civiche, permette al corso di avere una dimensione e una visibilità che vanno al di là del Master e dell'aula di studio.

Il data journalism rappresenta una esperienza in grande crescita nei paesi anglosassoni mentre è ancora in una fase iniziale nel contesto italiano. I media nazionali però iniziano ad apprezzare l’uso dei dati, in modo sistematico e scientifico, nella produzione di contenuti giornalistici. Gli studenti di MCS si trovano quindi nella posizione di arrivare sul mercato dell'informazione in un momento di grande interesse nei confronti di questa specifica pratica giornalistica dotati di competenze ancora scarsamente presenti nel panorama editoriale nazionale e quindi avvantaggiati rispetto ai colleghi che hanno seguito altri percorsi formativi più tradizionali.

Programma del corso: 

Ore di lezione: 24

Lezione 1: Get into the groove: entriamo nel mondo dei dati

Analisi comparativa delle migliori esperienze di data j nel contesto internazionale e delle esperienze italiane. Identificazione concreta dei vari step del processo che parte dal dato e arriva all'articolo. Biopsia dell’articolo data-driven: destrutturazione, analisi e identificazione del metodo scelto dall’autore.

Esercitazione pratica: gli studenti individuano un articolo di data journalism e lo analizzano per gli altri colleghi.

Lezione 2: Addomesticare i dati, leggerli e trasformarli in storie

Il toolkit del data journalist/1 – costruire un dataset coerente

Uso di excel per inserire i dati, pulirli, e fare le prime verifiche. Principali funzioni dei software di data entry e data analysis. Lavoreremo sui formati di dati, sulle tabelle xls e csv, imparando a distinguere tra valori assoluti e tassi, a operare confronti, a individuare gli errori.

Esercitazione: agli studenti verranno dati dei mini-set di dati dai quali dovranno dedurre una scaletta di domande e di spunti per la costruzione di un articolo giornalistico.

Lezione 3: Le fonti dei dati

Rassegna e discussione delle principali fonti di dati. Confronto tra open data e dati non aperti, con discussione sulle licenze e le possibilità di riuso dei dati per la produzione giornalistica. Analisi dei principali problemi di confronto tra dati provenienti da fonti diverse. Discussione sui formati.

Esercitazione: agli studenti verrà richiesto di lavorare sulle fonti per individuare un dataset, o una serie di dati, da utilizzare per la costruzione del proprio prodotto data j da consegnare e discutere a fine corso.

Lezione 4: Accesso ai dati e diritto di sapere

Il diritto di accesso all’informazione è regolamentato in Italia in modo molto diverso da altri paesi. Manca un Freedom of Information Act e le norme sulla trasparenza recentemente approvate non sono così stringenti da garantire l’accesso ai dati e alle informazioni prodotte dalla Pubblica Amministrazione.

Come si richiedono i dati che non sono pubblicati in formato open? Quali leggi e quali pratiche permettono ai giornalisti di accedere a informazioni e dati utili?

Esercitazione: confezionamento di una richiesta dati a una amministrazione pubblica secondo quanto previsto dal Codice Europeo sul diritto di sapere.

Lezione 5: Dal data al data viz: i tools più diffusi e accessibili di visualizzazione dati

Costruire una narrazione del dato può passare anche per il disegno e la produzione di infografiche semplici e al contempo ricche di contenuto. L'infografica può essere statica o interattiva, e la scelta del tipo di infografica da usare è cruciale per rendere l'informazione utile e immediatamente comprensibile. Al tempo stesso, la grafica può anche diventare interattiva e consentire quindi al lettore di scegliere il tipo di informazione da evidenziare a seconda del suo interesse. Infine, l'infografica può addirittura essere costruita per crowdsourcing, componendosi dunque dell'insieme di informazioni raccolte da una comunità di utenti web che contribuisce alla costruzione di un certo contenuto. La lezione sarà incentrata sulla rassegna e l'uso di diversi tools di infografica: quelli già disponibili in rete come Google fusion, ManyEyes, Infogram, DataWrapper e altri.

Esercitazione: gli studenti useranno le tecniche e gli strumenti di data viz per realizzare una infografica a partire dal proprio dataset.

Lezione 6: Hacking for journalists: estrarre i dati, entrare nel codice

A volte i dati sono nascosti in un sito web e non è facile ottenerli in dataset ordinati e già utilizzabili. Più spesso sono racchiusi in tabelle pubblicate su documenti in .pdf. Imparare a utilizzare uno scraper, costruirne uno quando ci serve, capire cosa sono le API e come possono esserci utili per raccogliere i dati e metterli in ordine: tutti strumenti che permettono di estrarre la materia prima dal sottosuolo in cui è intrappolata e utilizzarla per costruire il nostro pezzo. Ogni tanto il giornalista diventa hacker, più spesso diventa amico di un hacker e insieme lavorano per far uscire le informazioni dal buio e per renderle pubbliche. La giornata sarà dedicata a capire quali strumenti sono utili, a mettere le mani in pasta per usarli, a estrarre i dati da diversi siti e a lavorare per organizzarli nel modo più utile. Assieme a uno sviluppatore che ci aiuterà a leggere, e semmai a scrivere, quei pezzetti di codice che sono necessari per completare il processo che ci porta dal dato all'articolo finale.

Esercitazione: produzione di uno scraper per estrarre i dati da un sito di interesse (gli studenti lavorano a gruppi di due). Uso di diverse API per lavorare sui propri dataset.

Lezione 7: Metti un punto sulla mappa: georeferenziare i dati

Uno degli output più utili nel data j è la produzione di mappe in cui le informazioni siano distribuite, georeferenziate correttamente, sul territorio di riferimento. Per costruire una mappa è necessario avere: i dati, i riferimenti geografici giusti, la possibilità di verificare la distribuzione dei dati e delle informazioni, la capacità di disegnare la mappa evidenziando i parametri di interesse. Le mappe si possono costruire utilizzando sistemi proprietari, come Google, o sistemi open source, a volte meno intuitivi ma più potenti e soprattutto più personalizzabili. La lezione sarà incentrata sull'uso di sistemi di georeferenziazione, come gli strumenti di Google, Batchgeo e Qgis.

Esercitazione: gli studenti useranno parte del proprio dataset per costruire mappe da includere nel proprio articolo finale.

Lezione 8: Dai numeri all’articolo: finalizzare un articolo di data j

Che l’output finale sia un articolo giornalistico o un post per un sito istituzionale di informazione e di comunicazione, il passaggio dai numeri alla narrativa non è affatto automatico. E la narrativa cambia a seconda degli obiettivi: un sito di informazione civica ha registri e obiettivi diversi rispetto a un sito che fa informazione giornalistica. Analisi di esempi di media civici che partono dai dati per costruire attività civiche, come OpenRicostruzione e OpenCoesione.

Esercitazione: Nell’ultima lezione, gli studenti saranno impegnati a finalizzare il proprio prodotto data j, confezionandone testo e parti visual per renderlo utilizzabile all’interno di un sito. Il prodotto sarà presentato agli altri colleghi e discusso in dettaglio, sia sotto il profilo tecnico che sotto quello giornalistico/informativo, per valutare l’opportunità delle varie scelte narrative e di uso dei dati.

Obiettivi: 

Il corso sarà finalizzato all'acquisizione dei seguenti skills:

-uso di tools per la ricerca, la pulizia, l'acquisizione, lo scraping e l'analisi dei dati;

-uso di tools per la visualizzazione grafica dei dati;

-uso dei dati per la costruzione di inchieste e di reportage giornalistici o di narrazioni data-driven per siti istituzionali.

Il lavoro di tutto il corso sarà fortemente orientato a lavorare in modo pratico sui dataset identificato dagli studenti nel corso della prima lezione per arrivare, alla fine delle lezioni, a pubblicare un lavoro articolato di data j completo di testo, grafiche e mappe.

Docente: 

Marco Boscolo

Ha dato la disponibilità a tenere il corso "Data-driven journalism: raccontare il mondo a partire dai numeri"

Giornalista e videomaker, socio del collettivo di science writer e comunicatori formicablu, collabora con diverse testate italiane e internazionali, occupandosi soprattutto di scienza, tecnologia e il mondo dell’agricoltura e ambiente. Nel 2013 la sua inchiesta #Doveticuri sulla qualità dei servizi offerti dagli ospedali italiani pubblicata da Wired è stata finalista ai Datajournalism Awards. Con Elisabetta Tola, ha realizzato SEEDversity, un documentario crossmediale sulla biodiversità agricola e la selezione partecipativa dei semi (Wired, SciDev, Radio France International, Radio3Scienza). Il seguito, SEEDcontrol, focalizzato sul tema della concentrazione del mercato globale delle sementi è stato su LaStampa.it e in diversi media internazionali.

Elisabetta Tola

Ha tenuto i corsi: "Laboratorio multimediale" e "Data-driven journalism: raccontare il mondo a partire dai numeri".

Giornalista e comunicatrice scientifica, fondatrice dell’agenzia di comunicazione scientifica Formicablu. Da ottobre 2015 collabora con il Google News Lab come media training specialist per l’Italia.

Due volte grantee dell’Innovation and Development Reporting Grant dello European Journalism Center per progetti crossmediali sui temi dello sviluppo: Seedversity.org, (2014) webdoc sull’agrobiodiversità pubblicato in collaborazione con Radio3Scienza e Wired Italia e SEEDcontrol (2016), inchiesta sulla concentrazione crescente nel mercato delle sementi, pubblicato in inglese e italiano su La Stampa, Huffington Post SudAfrica, Oxpeckers. org, Euroscientist. Nel corso del 2015 ha fatto parte del team del progetto di inchiesta Hearing Voices, finanziato da JournalismFund. È una delle voci di Radio 3 Scienza. Come freelance ha collaborato per Wired Italy, RaiExpo, L’Espresso e altri media e per i siti dell’editore Zanichelli. Attualmente scrive per Agi Italia. Nel 2013 ha fondato il sito Datajournalism.it.

 

Contattaci

Seguici anche su

Siamo sui social network. Seguici e partecipa.