Introduzione alle esperienze internazionali e nazionali di data j per gli studenti del Master in giornalismo dello IULM, summer school IULM-Ahref agosto 2012, Transacqua
1. data driven journalism
i primi passi
Elisabetta Tola
iData - fondazione ahref
formicablu srl
Guido Romeo
iData - fondazione ahref
Wired IT
II ed. Summer School ahref-IULM, 27.08.12
2. 1. cosa succede in giro per il
mondo
2. cosa succede in Italia
3. perché fare ddj
4. un processo a step
5. primi tools del data
journalist
6. le fonti
7. get your hands on those data
– think in xls
28.
È uno strumento per raccontare
storie complesse da tanti punti di
vista
É uno strumento collaborativo
Rende trasparente il processo di
costruzione della storia
Trasforma un racconto astratto in
un quadro comprensibile e spesso
direttamente correlato al lettore
29.
É un giornalismo di precisione,
che applica un metodo scientifico
Genera storie nuove e correlate a
livello globale e locale
Sviluppa nuove competenze e dà
nuove opportunità
Valorizza la rete
È un equalizer: non dipende dalla
lingua
30. un processo a step
ma si parte comunque dalle
domande
35. I dati raramente arrivano
puliti e pronti all'uso
Spesso sono in formato non
prontamente utilizzabile (.pdf,
flash!)e vanno estratti
36. I dati raccolti per fini
burocratici sono organizzati
diversamente da quelli utili per
fini giornalistici
(meno precisione, molti codici
incomprensibili)
leggere sempre le note
metodologiche!!!
attenti ai confronti(es. dati sui
crimini in diversi paesi)
37. Nel data j contano più la
reputazione e l'affidabilità che
non la velocità di
pubblicazione!
Un buon lavoro di data j genera
molto traffico su un sito e non
muore a breve termine (più
storie nel tempo)
39. raccogliere i numeri
organizzare i dati
excel
google spreadsheet
libre calc
access, SQL
R
SPSS o Stata
40. pulire i dati - Google Refine
prime analisi e viz – Google
Fusion Tables – Google charts
mappe – BatchGeo, QGis
altri strumenti semplici di data
viz: ManyEyes, Tableau
41. le fonti di dati
incrociare più fonti
e verificare i dati
SEMPRE
(la preziosa lista degli
esperti-amici!)
43. Grandi aziende:ENEL,INPS
http://data.enel.com/
Camere di commercio: a
pagamento
OKFN,SOD e Linked Open
Data,GlobalLeaks,Scraper wiki
ONG: legambiente, associazioni
consumatori, cittadinanzattiva,
etc
44. Altri siti di news e alcuni
blog (dati grezzi resi
disponibili per riuso – eg. EU
structural funds – eg.
http://fortresseurope.blogspot.it/)
Sindacati e associazioni di
categoria: vari report
45. Università e istituti di
ricerca
Organizzazioni internazionali:
OECD, UNICEF, FAO, World Bank,
etc (eg. OECD e FAO sulla
produzione di grano)
46. Saper cercare
1. cercare con più parole chiave
(beware: termini burocratici e
tecnici)
2. specificare il formato:
filetype:xls, filetype:csv
3. limitare la ricerca a un sito:
site:dati.emilia-romagna.it
4. usare search site o plugin
simile
47. Le info al contorno
1. whois.domaintools.com – chi ha
registrato un sito, varie info
2. the wayback machine – le
vecchie pagine
3. TinEye – ritrovare l'origine
di una immagine
48. E con i dati che faccio?
1. salvare sempre il file
originale, lavorare su una copia
2. fare screenshot delle pagine
3. tenere diario di bordo
4. non usare i dati per
confermare visioni preconcette
5. accettare dati non completi
49. Quando i dati non sono online?
1. richiedere i dati (no tel)
2. parlare con la persona
responsabile dei dati
3. informare sulla
pubblicazione: può facilitare
rilascio altri dati
4. lanciare raccolta dati in
crowdsourcing
5. conoscere bene il FOIA e le
sue applicazioni
50. The investigation is a story:
la storia della costruzione del
puzzle è un buon pezzo di
giornalismo (soprattutto se
qualcuno mette i bastoni tra le
ruote)
Le domande valide sono sempre
le stesse: i dati sono una
sorte di fonte 'viva'
54. data driven journalism
i primi passi
Elisabetta Tola
iData - fondazione ahref
formicablu srl
Guido Romeo
iData - fondazione ahref
Wired IT
II ed. Summer School ahref-IULM, 27.08.12
55. 1. cosa succede in giro per il
mondo
2. cosa succede in Italia
3. perché fare ddj
4. un processo a step
5. primi tools del data
journalist
6. le fonti
7. get your hands on those data
– think in xls
88. I dati raramente arrivano
puliti e pronti all'uso
Spesso sono in formato non
prontamente utilizzabile (.pdf,
flash!)e vanno estratti
89. I dati raccolti per fini
burocratici sono organizzati
diversamente da quelli utili per
fini giornalistici
(meno precisione, molti codici
incomprensibili)
leggere sempre le note
metodologiche!!!
attenti ai confronti(es. dati sui
crimini in diversi paesi)
90. Nel data j contano più la
reputazione e l'affidabilità che
non la velocità di
pubblicazione!
Un buon lavoro di data j genera
molto traffico su un sito e non
muore a breve termine (più
storie nel tempo)
91.
92. raccogliere i numeri
organizzare i dati
excel
google spreadsheet
libre calc
access, SQL
R
SPSS o Stata
93. pulire i dati - Google Refine
prime analisi e viz – Google
Fusion Tables – Google charts
mappe – BatchGeo, QGis
altri strumenti semplici di data
viz: ManyEyes, Tableau