1. Abriendo los silos de la
información cultural al mundo
24 de Septiembre de 2015
Marta González,
Idoia Murua
Cristina Gareta,
Elena Turienzo,
Xabier Molero
#ALIADAWS15
2. Agenda
2Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
09:30 - 10:15 ALIADA. Introducción ¿Qué es? ¿Para qué sirve?
10:15 - 11:30 ALIADA. Probemos a utilizar la herramienta.
11:30 - 11:50 Pausa -café
11:50 - 12:30 Recogida de impresiones.
12:30 - 13:30 Presentación ALIADA en inglés
#ALIADAWS15
3. 3Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
09:30 - 10:15
ALIADA. Introducción ¿Qué es? ¿Para qué sirve?
Marta González
#ALIADAWS15
4. Estado actual del acceso a datos
culturales
En España existen más de 1.000 museos y más de 6.800
bibliotecas.
Gran parte de dichos museos y bibliotecas tienen su catálogo
disponible al público a través de la web.
• Esto nos permite conocer los fondos de los que disponen pero
nos obliga a recorrer una gran cantidad de sitios web
buscando la información deseada.
• E incluso hemos de acudir de forma personal al museo o
biblioteca cuando los fondos no han sido previamente
digitalizados, para consultar los mismos.
4Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
5. ¿Por qué hay que abrir los
datos culturales?
¿Lo tenemos claro?
Beneficio para el público en general al tener
acceso a nuestras colecciones.
Permitimos una investigación más rica y
fomentamos la innovación.
Nos beneficiamos de una mayor exposición y
promoción de nuestros contenidos.
5Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
7. 7
¿Qué son datos enlazados ó
Linked Data- LD?
• Término acuñado por Tim Berners-Lee– inventor de
la web y Director del W3C.
• Su visión de la web semántica es poner los datos en la web de forma que las
máquinas los pudieran entender de forma natural alcanzando la deseada web
de los datos: el paradigma Linked Data proporciona los medios para alcanzar
dicho objetivo.
• Método de publicación de datos estructurados para
mostrar, intercambiar y conectar datos a través de
URIs dereferenciables en la Web.
• Estándares Web: HTTP, RDF, URI.
• Datos legibles automáticamente por ordenadores.
• Permite conectar y consultar datos de diferentes
fuentes.
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
8. 8
¿Tu biblioteca o museo publica Linked
Open Data?
★
Datos publicados en la web con licencia
abierta.
★★
Datos estructurados y legibles por una
máquina.
★★★ Formato no propietario.
★★★★
Codificados según estándares abiertos de la
W3C (RDF).
★★★★★
Los datos están enlazados con otros datos
externos para proporcionar contexto.
http://www.w3.org/DesignIssues/LinkedData.html
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
“Nos estamos moviendo de una web de
documentos a una web de los datos”
9. 9
"Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/"
Linked Data Cloud
Publicaciones
Medios de Comunicación
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
10. 10
Linked Data Cloud
Medios de Comunicación
¿Quiénes publican?
• New York Times
• BBC Music: the portal site to music content across the BBC
website. It is also the location of the BBC's album reviews,
covering all major releases in every genre on a monthly basis and
written by a wide range of music experts
• Europeana: Europeana datasets.
• Last.FM RDFization of Events, Artists, and
Users
• DBTune.org Musicbrainz: open music
encyclopedia.
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
11. 11
Linked Data
Cloud
Publicaciones
¿Quiénes están?
• Library of Congress Subject Headings
• British National Bibliography
• Biblioteca Nacional de España
• OpenLibrary: One web page for every book
ever published
• The Bibliothèque nationale de France
• The European Library
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
12. 12
¿Por qué LOD en bibliotecas y
museos?
• Los LD son más perdurables y robustos que los formatos de
metadatos que dependen de una estructura de datos
particular
• Los desarrolladores ya no tendrán que trabajar con
formatos específicos (MARC, LIDO).
• Permite consultas más sofisticadas.
• Se crean conexiones con otras instituciones culturales y otros
recursos no-culturales.
• Esto permite la aparición de nuevos servicios y
aplicaciones.
• Mejora de la eficiencia en la catalogación e innovación:
porque podemos reutilizar los datos.
• Mejoramos nuestra presencia en la red, porque los
buscadores de información nos encontrarán más fácilmente.
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
13. 13
¿Cómo publicar LOD en la web?
1. Preparando los datos para publicar,
usando esquemas de metadatos
normalizados, como MARC, LIDO o
Dublin Core.
2. Creando una ontología, basándonos en
FRBR, BIBFRAME, CIDOC-CRM….
3. Convirtiendo los metadatos a un
conjunto de datos RDF.
4. Creando las URIs dereferenciables.
5. Enlazándonos con otros conjuntos de
datos: DBpedia, Geonames, VIAF, etc.
6. Publicando el conjunto de datos.
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
14. 14
INNOVATIVE SMEs
LINKED OPEN DATA CLOUD
http://lod-cloud.net/
Library
Management
System (ILS)
Museum
Collection
Management
System (MMS)
Content
Management
System (CMS)
OBJECTS RICH METADATA CREATORS
(librarians, curators)
ALIADA BROWSERS
OTHER CULTURAL
AND HERITAGE
INSTITUTIONS
O, utilizando
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
15. 15
• Plugin open source para sistemas de gestión bibliotecaria y de
museos.
• Compatible con los estándares de bibliotecas y museos: MARC21,
LIDO, DublinCore.
• Transforma de forma automática ficheros de metadatos a tripletas
RDF en base a la ontología ALIADA: Ontología basada en los
modelos conceptuales FRBR y CIDOC-CRM y en otras ontologías y
vocabularios como SKOS y FoaF.
http://aliada-project.eu/2014/aliada-ontology
• Enlaza de forma automática los datos transformados con otros
conjuntos de datos en LOD: Europeana, British National Bibliography, Spanish
National Library, Freebase Visual Art, DBpedia, Hungarian National Library, Library of Congress
Subject Headings, Lobid, MARC codes list, VIAF Virtual International Authority File or Open Library
• Genera las URIs dereferenciables.
• Publica de forma automática en la Linked Open Data Cloud.
http://aliada-project.eu/
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
16. 16
ALIADA se integra con gestores de
contenidos bibliotecarios y de colecciones
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
Integración con ILS (plugin para LibriSuite) Integración con CMS (exportación de registros de TMS)
Integración con Gestores de contenidos open source
que exporten DublinCore
#ALIADAWS15
17. 17
Código fuente: https:/ / github.com/ ALIADA/ aliada-tool/
¿Qué aspecto tiene ALIADA?
Accedemos con un navegador web:
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
18. 18
Y al final, ¿Qué tenemos?
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
19. 19
¿Quiénes somos?
SCANBIT
ILS & Library Services
SPAIN
TECNALIA
Research & Innovation
SPAIN
@CULT
Information & Knowledge Management
ITALY
ARTIUM
Contemporary Art Museum
SPAIN
SZEPMUVESZETI MUZEUM
Museum of Fine Arts, Budapest
HUNGARY
http://www.aliada-project.eu/
https://github.com/ALIADA/aliada-tool/
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
20. 20Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
Cristina Gareta
10:15 - 11:30
ALIADA. Probemos a utilizar la herramienta.
#ALIADAWS15
21. 21Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
• Nos repartimos en 5 grupos de 5 a 8 personas cada uno.
• A cada grupo os daremos un conjunto de datos, a elegir entre:
• MARCXML Bib
• LIDO
• Y un documento con los diferentes datos/enlaces que necesitáis:
1. Para acceder a ALIADA:
http://aliada.scanbit.net:8080/aliada-user-interface-2.0/
Probando la herramienta
#ALIADAWS15
22. 22Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
2. Cada grupo utilizará un nombre de usuario y contraseña:
GRUPO 1: Usuario: group1 Contraseña: aliada1
GRUPO 2: Usuario: group2 Contraseña: aliada2
GRUPO 3: Usuario: group3 Contraseña: aliada3
GRUPO 4: Usuario: group4 Contraseña: aliada4
GRUPO 5: Usuario: group5 Contraseña: aliada5
3. Os iremos guiando en el proceso, a la hora de transformar y publicar os
iremos indicando a cada grupo cuándo podéis hacerlo.
IMPORTANTE, ESPERAD NUESTRAS INDICACIONES
4. Mientras vamos probando la herramienta nos gustaría que dejarais
vuestras opiniones aquí:
https://docs.google.com/forms/d/1X2q12mE-
8sFqufXPO4uqoSUzF9KcIqdKakygkqHJerg/viewform
Probando la herramienta II
#ALIADAWS15
23. 23
Automatic Publication under Linked Data
Paradigm of Library Data
Comunidad ALIADA: http://www.aliada-project.eu/getInvolvedAliada
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
Marta González: marta.gonzalez@tecnalia.com
Cristina Gareta: cgareta@scanbit.net
#ALIADAWS15
24. 24Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
25. 25Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
Marta González
Cristina Gareta
11:50 - 12:30
Recogida de impresiones.
#ALIADAWS15
27. 27
Automatic Publication under Linked Data
Paradigm of Library Data
Comunidad ALIADA: http://www.aliada-project.eu/getInvolvedAliada
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
Marta González: marta.gonzalez@tecnalia.com
Cristina Gareta: cgareta@scanbit.net
#ALIADAWS15
28. Opening the cultural data silos to
the World
2015 September, 24th
Marta González,
Idoia Murua
Cristina Gareta,
Elena Turienzo,
Xabier Molero
#ALIADAWS15
29. 29Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
ALIADA. Introduction
Marta González
#ALIADAWS15
30. How to access cultural data?
Only in Spain you can find more than 1,000 museums and more
than 6,800 libraries.
The majority of them provide access to their catalogue through a
web page.
• So you can have access to the collections, but you have to
navigate web by web.
• Or you need to personally go to the museum or library when
the collections have not been digitalized.
30Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
31. Why cultural data should be
open?
Benefit for the general public because
they will have access to our collections.
We allow a richer research and promote
innovation.
Our institutions have a major exposition
and promotion of our contents.
31Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
#ALIADAWS15
32. 32
What is Linked Data?
• Tim Berners-Lee, director of the World Wide Web Consortium (W3C),
coined the term in a design note about the Semantic Web project.
• Method of publishing structured data so that it can be interlinked
and become more useful. A path to the Web of Data
• Standard Web technologies: HTTP, RDF, URI, SPARQL, OWL…
• To share information in a way that can be read automatically by
computers.
• Enables data from different sources to be connected and queried.
2015 September, 24th
#ALIADAWS15
33. 33
Are your library or museum Linked
Open Data (LOD)?
★ Data published under open license
★★ Machine-readable data
★★★ Non-proprietary format
★★★★ RDF standards
★★★★
★
Linked RDF
http://www.w3.org/DesignIssues/LinkedData.html
“We’re moving from a web of
documents to a web of data”
2015 September, 24th
#ALIADAWS15
34. 34
Why LOD in libraries and
museums?
• A global pool of shared data that can be re-used to describe resources will
avoid the redundant effort of the current cataloging processes.
• The use of the Web and Web-based identifiers will make up-to-date resource
descriptions directly citable by catalogers.
• Linked Data is more durable and robust than metadata formats that depend
on a particular data structure.
• Developers will also no longer have to work with library-specific data formats
(MARC, LIDO).
• With Linked Open Data, libraries can increase their presence on the Web,
where most information seekers may be found.
http://www.w3.org/2005/Incubator/lld/wiki/Benefits
2015 September, 24th
#ALIADAWS15
36. 36
How to publish Linked Open Data?
• Exporting our metadata to standard formats:
MARC, LIDO or Dublin Core.
• Defining an ontology according international
conceptual models (FRBR, BIBFRAME, CIDOC-
CRM, …)
• Transforming the metadata to RDF.
• Generating the dereferenciable URIs.
• Linking to other datasets.
• Publishing the dataset.
“Librarians and curators are experts in cataloguing and
make accessible their resources, but they don’t know
about Linked Data, so they need an ally”
2015 September, 24th
#ALIADAWS15
37. 37
ALIADA, the ‘ally’
• Open source Java application to automatically publish as Linked Data the metadata
created by a library or museum management System
• Supported metadata types (types of datasets): bibliographic records, authority
records, and descriptions of museum objects
• Compliant with MARC, LIDO and DublinCore formats
• Conversion to RDF triples (mapping) according to the ALIADA ontology, mainly
based on FRBRoo, SKOS and FoaF ontologies
• Linking to other datasets, such as Europeana, British National Bibliography, Spanish
National Library, Freebase Visual Art, DBpedia, Hungarian National Library, Library
of Congress Subject Headings, Lobid, MARC codes list, VIAF Virtual International
Authority File or Open Library
• Automatic publication of dumps (URIs) and SPARQL Endpoint on DataHub
2015 September, 24th
#ALIADAWS15
38. 38
Who is who in ALIADA?
SCANBIT
ILS & Library Services
SPAIN
TECNALIA
Research & Innovation
SPAIN
@CULT
Information & Knowledge Management
ITALY
ARTIUM
Contemporary Art Museum
SPAIN
SZEPMUVESZETI MUZEUM
Museum of Fine Arts, Budapest
HUNGARY
http://www.aliada-project.eu/
https://github.com/ALIADA/aliada-tool/
2015 September, 24th
#ALIADAWS15
39. 39Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
ALIADA. Demo
Cristina Gareta
#ALIADAWS15
40. 40
ALIADA, Demo
We have assigned a time slot for an online demo to each of the registered
assistants.
If you do not have such demo slot, please put in contact with:
info@aliada-project.eu
With the demo slot you will be provided with a dataset to be published and
access to the form where to leave your impressions:
https://docs.google.com/forms/d/1X2q12mE-
8sFqufXPO4uqoSUzF9KcIqdKakygkqHJerg/viewform
Also access to a video, that will facilitate the demo:
https://vimeo.com/110897369
2015 September, 24th
#ALIADAWS15
41. 41
Automatic Publication under Linked Data
Paradigm of Library Data
ALIADA Community: http://www.aliada-project.eu/getInvolvedAliada
Abriendo los silos de la información al mundo – 24 de Septiembre de 2015
Marta González: marta.gonzalez@tecnalia.com
Cristina Gareta: cgareta@scanbit.net
#ALIADAWS15