Datos abiertos y reutilización de la información en el sector público
Open Government Data y la
reutilización de la información
del Sector Público
Prof.ª Dra. Yolanda Martín González
Dpto. Biblioteconomía y Documentación
Universidad de Salamanca
ymargon@usal.es
27 noviembre 2013
Sumario
1. Conceptos
1.1 Open Government Data.
1.2 Reutilización de la información pública
2. Portales Open Data
2.1 Catálogo de datos abiertos.
2.2 Registro de aplicaciones.
2.3 Espacio de participación ciudadana.
1.
Open Data y Reutilización de la
información del Sector Público
Reflexión
¿Por qué se desarrollan las políticas públicas o estrategias
de datos abiertos en este momento de crisis (económica,
política, institucional, etc.)?
¿Coincidencia?
¿Consecuencia?
¿Solución?
-Transparencia: El Gobierno amplía y
mejora el acceso a la información sobre sus
actividades, facilitando la rendición de
cuentas, enriqueciendo el debate público y
la participación democrática.
- Participación: El Gobierno genera
espacios de encuentro y canales de
comunicación a fin de que los ciudadanos
puedan asumir un rol activo en el diseño de
las políticas públicas.
- Colaboración: El Gobierno promueve la
innovación mejorando y ampliando sus
prácticas de cooperación dentro del mismo
Gobierno, con otras agencias
gubernamentales y con la Sociedad Civil.
Memorandum on Transparency and
Open Government (21/06/2009)
¿Qué es la “información pública”?
Todo dato o documento (textual, numérico, gráfico, sonoro,
etc.) que haya sido elaborado, custodiado o sufragado por
cualquiera de las instituciones y órganos de la Administración
Pública y con independencia de su soporte material.
La ISP presenta un valor añadido para el sector privado al tratarse de
una información completa, fiable y de calidad.
Información de las cámaras de comercio
Registros oficiales de negocios
Información de negocios
Patentes y marcas
Bases de datos de licitación pública
Información de direcciones
Fotos aéreas
Información de edificios
Información geográfica
Información del catastro
Redes geodésicas
Información geológica
Datos hidrográficos
Datos topográficos
Información meteorológica
Datos sobre el clima
Categorización de la ISP tiempo
Previsiones del
Fuente: COTEC, 2011
Decisiones de cortes nacionales
Decisiones de cortes internacionales
Información legal
Legislación nacional
Tratados
Estadísticas económicas
Estadísticas de empleo
Estadísticas de salud
Información social
Estadísticas de población
Estadísticas de administración pública
Estadísticas sociales
Información sobre el grado de congestión del tráfico
Información relativa al
transporte
Información de las obras en carretera
Información del transporte público
Información sobre el registro y matriculación de vehículos
Categorización de la ISP
Fuente: COTEC, 2011
“Datos públicos abiertos”
-
Son los conjuntos de datos de interés público que el gobierno libera y
hace accesibles.
“Liberar datos públicos” significa devolvérselos a sus legítimos y
verdaderos dueños, los ciudadanos.
-
Finalidad última:
La Reutilización de la información del Sector público.
3 leyes de los Datos abiertos gubernamentales
1.
Si el dato no puede ser
encontrado e indexado en la web,
no existe.
2.
Si no está disponible en un
formato abierto que pueda ser
leído y procesado por una
máquina, no puede ser
reaprovechado.
3.
Si un dispositivo legal no permite
a alguien adaptarlo, no es útil.
Elaborado por David Eaves
David Eaves
Activista y asesor de políticas públicas
en materia de Gobierno Abierto
Principios del Open Government Data
El Open Government Data debe realizarse bajo las siguientes premisas:
1. La información tiene que ser completa.
2. Los datos deben provenir directamente de la fuente, sin
modificación o agregación alguna.
3. La publicación debe realizarse a tiempo para preservar el valor de
la información.
4. La información tiene que estar disponible para el mayor número
de usuarios y propósitos posibles.
Principios del Open Government Data
5. Los datos deben presentar una estructura mínima que permita su
tratamiento automatizado.
6. La publicación tiene que estar libre de discriminación y disponible
para
cualquiera sin necesidad de registro previo.
7. Los formatos de publicación deben ser no propietarios. Ninguna
entidad
tiene control exclusivo sobre ellos.
8. La información deben ser de uso libre, es decir, no estar sujetos
a
derechos de autor, patentes, marcas ni a regulaciones de
secreto industrial o comercial. Tampoco han de estar sujetos a
restricciones de
privacidad, seguridad o privilegio reguladas
por las normas.
Reutilización
Se entiende por reutilización el uso de documentos que obran
en poder de las Administraciones y organismos del sector
público, por personas físicas o jurídicas, con fines comerciales
o no comerciales, siempre que dicho uso no constituya una
actividad administrativa pública.
Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público
Crear nuevos servicios y aplicaciones de valor añadido
Ecosistema del Open G. Data
LAS ADMINISTRACIONES
PÚBLICAS
Generadoras y gestoras
de información
ENTIDADES INFOMEDIARIAS
Crean aplicaciones, productos y
servicios y los suministran
al usuario
Ministerios
Organismos
adscritos
Entidades
regionales
Entidades
locales
Información
geográfica
Información
económ.
USUARIOS FINALES
Consumidores de información
Reutilizadores
Ciudadanos
Información
meteorológ.
Información
estadística,
etc.
Empresas
18
Para las AAPP:
Reducción de costes asociados a la puesta en marcha de servicios.
Mayor colaboración con el ciudadano.
Interoperabilidad e intercomunicación con otras administraciones.
Para las empresas:
Nacimiento del sector infomediario.
Generan riqueza a partir de la creación de servicios y aplicaciones con valor añadido.
Promoción de un mercado de los contenidos digitales.
Fomento de la competitividad.
Para los ciudadanos:
Transparencia informativa
Nuevas aplicaciones y productos que mejoran su vida.
Creación de nuevos puestos de trabajo.
Beneficios del Open Government Data
ESTADOS UNIDOS (USA)
IMPULSORES:
Barack Obama (2009)
OBJETIVO:
Fortalecer la democracia y promover la eficiencia y
efectividad en el Gobierno.
INSTRUMENTO:
Directiva de Gobierno (2009): creación de un sistema
de transparencia, participación pública y colaboración.
REINO UNIDO (UK)
IMPULSORES:
Gordon Brown y David Cameron (2011)
OBJETIVO:
Transparencia.
Participación ciudadana en los procesos de toma de
decisiones y en la realización de sugerencias sobre las
políticas de gobierno basadas en la información recibida.
Ayudar a los ciudadanos a entender cómo funciona el
gobierno y cómo se llevan a cabo las distintas políticas.
INSTRUMENTO:
LÍNEAS DE TRABAJO:
Publicación online de la ISP.
Mejora en la calidad de dicha información.
Promoción e institucionalización de una cultura de
Gobierno Abierto
Creación de un framework común que le de soporte.
DATOS:
Publicación de la mayor cantidad de información en el
menor tiempo posible, volcando la información en crudo tal
y como está disponible.
Power of Information Report (2007)
LÍNEAS DE TRABAJO:
Publicar los conjunto de datos (datasets)
DATOS:
Se realiza un tratamiento previo de los datos para reducir los
esfuerzo necesarios en su posterior reutilización.
Apuesta por las tecnologías de la web semántica para modelar la
información y establecer relaciones explícitas entre los distintos
conjuntos de datos siguiendo los principios de los Datos
Enlazados (o Linked Data).
UNIÓN
EUROPEA
Una de las siete iniciativas emblemáticas de
Europa 2020, se dedicó a definir el papel clave
que permite que el uso de las TIC tendrán que
desempeñar si Europa quiere tener éxito en sus
ambiciones
para
el
2020.
El objetivo general [...] es ofrecer beneficios
económicos sostenibles y sociales de un mercado
único
digital
[...].
Acción 3: Abrir fuentes de datos públicas
para su reutilización
Fuente: J. Pelegrín
1.Datos abiertos por definición.
2.Calidad y cantidad.
3.Utilizable por todos.
4.Apertura de los datos para mejorar
la gobernanza.
5.Liberación de los datos para la
innovación.
La Carta de Datos Abiertos del G8 (2013)
Portales Open G. Data (OGD)
-
Los portales suponen la carta de presentación de las
políticas públicas de transparencia y de datos abiertos.
-
Finalidad:
1.
Herramienta que utiliza la Administración para publicar la
información que genera en el cumplimiento de sus funciones y
que es sufragada con presupuesto público.
2.
Canal digital donde el ciudadano puede encontrar la
información producida por los organismos e instituciones
públicas.
Portales Open G. Data (OGD)
-
La creación de los portales OGD es muy reciente (2 o 3 años máx.)
-
Inexistencia de un modelo único de concepción del portal: este varía en
función del país o del órgano responsable del mismo.
-
Mientras que el tipo de recursos ofrecidos y las opciones de búsqueda son
similares la forma en que se muestran los resultados diverge en función
del tipo de información recuperada.
-
Diferente consistencia y cobertura de los datos además de encontrarse
éstos poco estructurados.
-
Las condiciones de acceso y uso de los datos establecidas en las licencias,
en general, están orientadas al modelo de licencias abiertas, basadas en
Creative Commons.
Esquema de elementos que han de contener los portales de datos abiertos.
Fuente: Junta de Castilla y León
Catálogo de datos
Registro de aplicaciones
Información
sobre ésta u otras
iniciativas open
data
Peticiones de
apertura de datos
Buscador
por palabras
clave
Búsqueda
por
navegación
Noticias de
Actualidad,
enlaces, etc.
¿Qué datos liberamos?
¿Qué información es la más solicitada por los ciudadanos a través de los
servicios de acceso a la información pública?
¿ Qué información es entregada a otras administraciones, instituciones u
organismos que pueda ser de interés general?
¿Qué información posee la Administración que cumple con los requisitos de
datos abiertos y pueda ser publicada?
¿Qué información posee la Administración que no cumple con los requisitos de
datos abiertos pero a la que se le puede aplicar fácilmente?
¿Qué información es susceptible de ser reutilizada y a la que se le puede añadir
un valor?
Fuente: Guía rápida de publicación de datos abiertos.
Gobierno de Chile
Algunos consejos previos
Recomendaciones:
A.
Abrir datasets pequeños, sencillos y lo más rápidamente posible.
B.
Tener una actitud comprometida con los usuarios y reutilizadores de la
información que se proporcione detectando sus necesidades de
información.
C.
Identificar posibles temores y/o prejuicios iniciales relativos a la apertura
de datos.
Fuente: Open Knowledge Foundation, 2012
Algunos consejos previos
Pasos a seguir para la apertura de datos:
1. Seleccionar el conjunto de datos a abrir.
2. Convertir el formato del archivo a un formato abierto.
3. Aplicar una licencia abierta que indique las condiciones bajo las cuales
se puede utilizar esa información.
4. Incluir los metadatos.
5. Empaquetar:
Archivo con dataset + Archivo con licencia + Archivo con metadatos.
6. Asignar una URI de acceso que identifique al dataset.
Fuente: Open Knowledge Foundation, 2012
Metadatos del catálogo
Nombre
Descripción
Órgano publicador
Tamaño del catálogo
Identificador
Fecha de creación
Fecha de actualización
Idioma(s)
Cobertura geográfica
Temática
Página web
Términos de uso
Documento(s) y recursos de inf.
Metadatos del catálogo
Norma Técnica de Interoperabilidad para la
reutilización de los recursos de información
pública (BOE núm. 54 de 4 de marzo de 2013)
Metadatos
Nombre
Descripción
Temática(s)
Etiqueta(s)
Identificador
Fecha de creación
Fecha de última actualización
Frecuencia de actualización
Idioma(s)
Condiciones de uso
Cobertura geográfica
Cobertura temporal
Vigencia del recurso
Recurso(s) relacionados
Normativa
Distribución
Metadatos del dataset
Norma Técnica de Interoperabilidad para la
reutilización de los recursos de información
pública (BOE núm. 54 de 4 de marzo de 2013)
Registro de un nuevo conjunto de datos en datos.gob.es
Información general
CAMPOS DE TEXTO
LIBRE
CAMPOS CON FACILIDAD
DE AUTORRELLENO
CAMPOS DE SELECCIÓN
MÚLTIPLE
Fuente: datos.gob.es
CAMPOS DE TEXTO LIBRE
CON FACILIDAD DE SELECCIÓN
DE VALORES REGISTRADOS
ANTERIORMENTE
Registro de un nuevo conjunto de datos en datos.gob.es
Información general
CAMPOS QUE PERMITEN
VALORES MÚLTIPLES (pulsando
El botón “Añadir otro elemento”)
CAMPOS DE TIPO URL
Campos tipo fecha
Fuente: datos.gob.es
Registro de un nuevo conjunto de datos en datos.gob.es
Formato de distribución
CAMPO TIPO URL
CAMPO DE TIPO
DESPLEGABLE
Fuente: datos.gob.es
Registro de un nuevo conjunto de datos en datos.gob.es
Información adicional
CAMPOS DE TIPO DE LISTA DESPLEGABLE
CAMPO SELECCIÓN
CAMPOS TIPO FECHA
CAMPO DE TEXTO LIBRE
Fuente: datos.gob.es
Validación
Pulsando el botón VISTA PREVIA, se
realiza la validación y grabación
temporal en la base de datos de la
información introducida por el
usuario del catálogo.
Fuente: datos.gob.es
Metadatos (Chile)
Metadatos
Nombre
Descripción
Institución responsable de la publicación del dataset
Licencia (derechos de uso del dataset)
Categoría o taxonomía
Fecha de publicación
Enlace de distribución (url del recurso)
Tamaño
Formato
Descripción de características adicionales (tipo de
compresión, versión de algún estándar, etc.)
Fecha de los metadatos (asignada automáticamente)
Datos vinculados
A medida que pase el tiempo y aumente el número de usuarios de los datos abiertos tendrá menos sentido el
catalogar los datos como un colectivo específico y se exigirá una representación relacionada con otros datos
fácilmente ampliada y mezclable con otros datasets en formato RDF.
Según el Estudio de Caracterización del Sector
Informediario, publicado por el Observatorio Nacional
de las Telecomunicaciones y la Sociedad de la
Información en 2012, la RISP en España generó un
volumen de negocio anual de entre 330 y 550 millones
de euros anuales y empleó a una cifra de entre 3.600
y 4.400 personas para labores de reutilización de los
datos abiertos.
Selección de la información reutilizable
1. Al objeto de seleccionar los documentos y recursos de información aptos para la
reutilización, se considerarán prioritarios los de mayor relevancia y potencial
social y económico.
2. Los documentos y recursos de información reutilizables serán primarios, evitando
las modificaciones o alteraciones de la información existente en la fuente, al objeto
de evitar errores que se puedan producir durante la manipulación de la información.
3. El nivel granular será el más fino posible, evitando agregaciones adicionales,
para posibilitar una reutilización adecuada a cualquier necesidad.
4. Los documentos y recursos de información reutilizables tendrán asociada
información estructurada que permita su procesamiento automatizado.
5. Los documentos y recursos de información de elaboración o recogida periódica
puestos a disposición para su reutilización estarán actualizados a sus últimas
versiones y se indicará la fecha de última actualización, así como el periodo de la
misma.
Norma técnica de interoperabilidad de reutilización de recursos informativos
Algunas consideraciones finales
1.
De la Sociedad de la información a la Sociedad del Dato.
2.
Existe falta de consenso o de directrices comunes sobre conjuntos de datos que
las administraciones han de publicar para su reutilización.
3.
Ausencia de una catalogación única de datasets para todas las administraciones.
1.
Utilizar formatos estándar con estructuras similares para la descripción de los datos.
2.
Crear taxonomías comunes, p.e. nombres de lugar o de organismos públicos.
4.
Resulta insuficiente la información suministrada sobre las formas de publicación y
difusión de los datos así sobre los esquemas de descripción utilizados.
5.
Ausencia de pautas para la apertura de datos de las empresas privadas que
trabajan para la Administración.
6.
Necesidad de potenciar las propuestas de reutilización de un dataset.
7.
Potenciar la existencia de herramientas de participación ciudadana en los portales
de datos abiertos.
Video: Opening up Europe’s public data (video): http://www.youtube.com/watch?v=gBUpUD4l1Wo
Apertura de datos: seleccionar, abrir, mantener y controlar la divulgación de información gubernamental.
Ramos Simón, Luis Fernando; Arquero Avilés, Rosario; Botezán, Iuliana; Cobo Serrano, Silvia; Sala Jiménez, Andrea; Sánchez Jiménez, Rodrigo; Valle Gastaminza, Félix del (2012). «De la reutilización de información del sector público a los portales de datos abiertos en Europa». BiD: textos universitaris de biblioteconomia i documentació, desembre, núm. 29. <http://bid.ub.edu/29/ramos2.htm> [Consulta: 19-11-2013].
Ramos Simón, Luis Fernando; Arquero Avilés, Rosario; Botezán, Iuliana; Cobo Serrano, Silvia; Sala Jiménez, Andrea; Sánchez Jiménez, Rodrigo; Valle Gastaminza, Félix del (2012). «De la reutilización de información del sector público a los portales de datos abiertos en Europa». BiD: textos universitaris de biblioteconomia i documentació, desembre, núm. 29. <http://bid.ub.edu/29/ramos2.htm> [Consulta: 19-11-2013].
Obama, como senador por Illinois (2005-2008), impulsó la ley conocida como Fortalecimiento de la Transparencia y la rendición de cuentas (2007) y la Ley por un gobierno abierto y un liderazgo honesto (2008).
La primera de las leyes citadas permite al público visualizar los gastos federales en cualquier momento.
Fuente: Open Data Handbook Documentation, Open Knowledge Foundation (2012). http://opendatahandbook.org/
Fuente: Guía básica de datos abiertos de Uruguay
Norma Técnica de interoperabilidad para la reutilización de los recursos de información pública (BOE núm. 54 de 4 de marzo de 2013)
Norma Técnica de interoperabilidad para la reutilización de los recursos de información pública (BOE núm. 54 de 4 de marzo de 2013)
La primera universidad pública española que ha elegido el modelo de gobierno abierto como instrumento para la transparencia e impulso a la innovación es la Universidad Pablo Olavide de Sevilla.
Esta institución puso en marcha en 2012 su iniciativa de datos abiertos (http://www.upo.es/datos-abiertos/) con la que proporciona acceso abierto a datos académicos, económicos y de su personal.
Para ver cómo se asignan los metadatos en el catálogo de datos abiertos de Canadá visitar la página: http://donnees.gc.ca/data/fr/dataset/e418841e-d9dc-4caf-9a19-09b3269a3e1e