Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
The Open Data movement. Challenges and issues.
1. The Open Data
movement, challenges
and issues
@mgarrigap
Marc Garriga: http://mgarrigap.info/
Journée Open Data
Institut de Recherche en Informatique de Toulouse, IRIT
Toulouse, November, 5th, 2013
6. Open Data
Provide (public) data in digital
standard and open formats for
reuse them automatically.
Anyone can use them for free
for whatever and whenever
you want (including
commercial purposes)
14. Salaries of the Chicago
City Council civil servants
https://data.cityofchicago.org/Administration-Finance/Current-Employee-Names-Salaries-and-Position-Title/xzkq-xp2w
16. La actividad infomediaria española se
calcula que es de 330-550 M € (anual).
Hay un universo de 150 empresas que
generan aplicaciones, productos y
servicios con valor destinados a
terceros, a partir de la información del
sector público. El 30% tiene clientes en
la UE y 25% fuera de UE.
Ocupa 3600-4400 trabajadores
* Según el estudio 'Caracterización del
sector Infomediario en España'.
Proyecto Datos.gob.es. Junio 2012.
Data = Economic Value
21. “Science is built on data: its collection, analysis,
publication, reanalysis, critique, and reuse.”
(Jennifer Molloy, 2011)
http://www.plosbiology.org/article/fetchArticle.action?
articleURI=info%3Adoi%2F10.1371%2Fjournal.pbio.1001195
http://datadryad.org/
31. We need to empower the data reusers
Open ≠ Reuse
http://www.slideshare.net/alorza/zaragoza-transparenciaopendata
32. Reason #1: ‘‘We need
more data opened’’
Reason #2: ‘‘Open the
Data is expensive’’
http://www.caldocasero.es/2013/09/por-que-no-se-reutilizan-los-datos.html
36. Reason #4: ‘‘The open
data quality is so low’’
http://www.caldocasero.es/2013/09/por-que-no-se-reutilizan-los-datos.html
37. •
•
•
•
•
El dato es único, lo mejor es ir siempre a la fuente de los datos, no tener
copias intermedias.
El dato hay que compartirlo (internamente y externamente: dato abierto),
compartiendo es cuando multiplicamos su valor.
Para poder compartir el dato tiene que estar accesible (de forma fácil y
estable a lo largo del tiempo).
La inmensa mayoría (por no decir todos) de los datos tienen la capacidad de
estar georreferenciados. Actualmente ya no se entiende un dato sin esta
característica.
El dato tiene que ir acompañado de sus metadatos que le describen
semánticamente.
Solution: Control the data
quality from its generation
http://www.zaragoza.es/ciudad/risp/
”Dato único / dato compartido / dato accesible / dato abierto /
dato georreferenciado / dato descrito semánticamente.”
38. Reason #5: ‘‘They
open data that we
don’t want’’
http://www.caldocasero.es/2013/09/por-que-no-se-reutilizan-los-datos.html
40. Reason #6: ‘‘We need
all data, we don’t want
only the ‘cooked’ data’’
http://www.caldocasero.es/2013/09/por-que-no-se-reutilizan-los-datos.html
41. Solution: Raw Data Now! ..
http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html
42. Reason #7: ‘‘We need
to homogenize all open
data offer’’
http://www.caldocasero.es/2013/09/por-que-no-se-reutilizan-los-datos.html
43. Este decálogo es fruto de las conclusiones del Día Open Data en Euskadi
celebrado en Donostia-San Sebastián, el 09/05/12, en el marco del #CICD.
http://red.gnoss.com/comunidad/OpenData
0.
1.
2.
3.
4.
5.
Armonización entre Administraciones.
Publicar datos en formatos abiertos y estándares.
Usar esquemas y vocabularios consensuados.
Inventario en un catálogo de datos estructurado.
Datos accesibles desde direcciones web persistentes y amigables.
Exponer un mínimo conjunto de datos relativos al nivel de competencias
del organismo y su estrategia de exposición de datos
6. Compromiso de servicio, actualización y calidad del dato, manteniendo
un canal eficiente de comunicación reutilizador <-> AAPP.
7. Monitorizar y evaluar el uso y servicio mediante métricas.
8. Datos bajo condiciones de uso no restrictivas y comunes.
9. Evangelizar y educar en el uso de datos.
10. Recopilar aplicaciones, herramientas y manuales para motivar y facilitar
la reutilización.
The Open Data España Decalogue
44. Reason #8: ‘‘From close
data to open data… but
in silos’’
http://www.caldocasero.es/2013/09/por-que-no-se-reutilizan-los-datos.html
48. Reason #10: ‘‘I have a
strong distrust towards
the government’’
http://www.caldocasero.es/2013/09/por-que-no-se-reutilizan-los-datos.html
49. Solution: Govs need to take
on long-lasting commitments
http://www.slideshare.net/alorza/zaragoza-transparenciaopendata
50. We need to change the
mindset of data responsibles
http://ccaa.elpais.com/ccaa/2013/10/21/catalunya/1382380347_283011.html
51. In short ...
• Open Data is for automatically reuse.
• Nowadays we (in Europe) have a lot of open data but its reuse is so low.
•
•
•
•
•
•
•
Open Data ... is not just open!
Opening data by default, as routine.
Opening harmonized.
Data quality is critical.
Open in metadata and formats appropriate.
Trust is essential if we want data reuse.
Open ≠ Reuse.
53. "The ability of third parties to
participate is what makes
Open Data truly transformative"
Beth Noveck, (former US CTO for oGov initiative)
“Open Data – The Democratic Imperative" (2012)
54. The Open Data
movement, challenges
and issues
@mgarrigap
Marc Garriga: http://mgarrigap.info/
Journée Open Data
Institut de Recherche en Informatique de Toulouse, IRIT
Toulouse, November, 5th, 2013