1. OPEN DATA:
STATO DELL’ARTE
ALESSIO DAL BIANCO / infoFACTORY
Parco Scientifico /
24 Febbraio 2012
dalbianco@infofactory.it
db.alessio@gmail.com
2. COSA SONO GLI OPEN DATA ?
§ Sono forme di dati accessibili a tutti.
§ Chiunque le può ridistribuire con facilità.
§ Il formato non deve essere limitante nell’utilizzo.
§ No copyright.
§ No royalties.
Ecc...
2
5. ESISTONO DEI DATI APERTI IN
ITALIA ?
§ Molti siti offrono liste di altri siti che offrono dei
dataset ( dati che si prestano ad essere analizzati
statisticamente ).
§ Molti di questi dataset NON indicano la Licenza
d’uso dei dati, quindi il principio Open NON può
essere applicato.
§ I dati sono presenti in siti di dubbia qualità.....
5
6. ESISTONO DEI DATI APERTI IN
ITALIA ?
Alcuni esempi italiani ( fatti da volontari ):
SPAGHETTI OPEN DATA
http://www.spaghettiopendata.org/
CKAN ITALIA
http://it.ckan.net/
6
8. E LA PUBBLICA AMMINISTRAZIONE ?
Il sito di riferimento è:
http://dati.gov.it
Ed esiste anche una community attiva:
http://www.innovatoripa.it/
8
9. E LA PUBBLICA AMMINISTRAZIONE ?
Purtroppo ci sono alcuni problemi:
§ I dati non sono centralizzati.
§ La creazione dei dataset sembra affidata totalmente alle
amministrazioni regionali e/o locali.
§ Databases eterogenei tra varie amministrazioni.
§ Difficoltà nell’identificare uno schema appropriato per i
dati.
§ Formati non standard.
Ecc.
9
12. COS’È GOOGLE REFINE ?
§ È un tool che permette di pulire i dati grezzi presenti
sulle tabelle Excel o testo semplice.
§ Può lavorare con tabelle enormi.
§ Molto utile per eliminare dati ridondanti e non strutturati.
12
13. COS’È FREEBASE ?
§ È una community, ma soprattutto una piattaforma per
creare dataset e schema anche complessi.
§ Tutti gli utenti registrati possono creare e/o modificare i
dati.
§ Tutti i dati sono accessibili via API.
§ È possibile creare ed integrare delle vere e proprie
applicazioni che utilizzano i dati presenti su Freebase.
13