Diese Präsentation wurde erfolgreich gemeldet.
Die SlideShare-Präsentation wird heruntergeladen. ×

VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - Sara Sánchez Hernández

Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Una nueva forma de mostrar el patrimonio.
Proyectos recientes de web semántica y
datos enlazados en el ámbito de los museo...
ANTECEDENTES Y SITUACIÓN DE PARTIDA
Antes de adentrarnos en la web semántica, partíamos de la siguiente situación:
• Domus...
¿QUÉ ES DOMUS?
• En 1996 se publicó el informe “Normalización
documental de museos: elementos para una
aplicación informát...

YouTube-Videos werden auf SlideShare nicht mehr unterstützt.

Original auf YouTube ansehen

Hier ansehen

1 von 61 Anzeige

VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - Sara Sánchez Hernández

Herunterladen, um offline zu lesen

"Una nueva forma de mostrar el patrimonio. Proyectos recientes de web semántica y datos enlazados en el ámbito de los museos" por Sara Sánchez Hernández, jefa de Servicio de Aplicaciones de Bellas Artes. Subdirección General de Tecnologías de la Información y de las Comunicaciones. Ministerio de Educación, Cultura y Deporte.

"Una nueva forma de mostrar el patrimonio. Proyectos recientes de web semántica y datos enlazados en el ámbito de los museos" por Sara Sánchez Hernández, jefa de Servicio de Aplicaciones de Bellas Artes. Subdirección General de Tecnologías de la Información y de las Comunicaciones. Ministerio de Educación, Cultura y Deporte.

Anzeige
Anzeige

Weitere Verwandte Inhalte

Diashows für Sie (20)

Ähnlich wie VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - Sara Sánchez Hernández (20)

Anzeige

Weitere von Artium Vitoria (20)

Aktuellste (20)

Anzeige

VIII Encuentros de Centros de Documentación de Arte Contemporáneo en Artium - Sara Sánchez Hernández

  1. 1. Una nueva forma de mostrar el patrimonio. Proyectos recientes de web semántica y datos enlazados en el ámbito de los museos.
  2. 2. ANTECEDENTES Y SITUACIÓN DE PARTIDA Antes de adentrarnos en la web semántica, partíamos de la siguiente situación: • Domus instalado en más de 150 museos de diferente tipología, ámbito, titularidad … • Aplicaciones locales de uso centralizado para la gestión de tesauros • Publicación online de los bienes culturales de Domus de 97 museos mediante la aplicación http://ceres.mcu.es • Publicación online de los tesauros de bienes culturales mediante la aplicación web http://tesauros.mecd.es/tesauros
  3. 3. ¿QUÉ ES DOMUS? • En 1996 se publicó el informe “Normalización documental de museos: elementos para una aplicación informática de gestión museográfica” • Se sentaban las bases para el desarrollo posterior del proyecto de normalización documental y de elaboración de tesauros • Incluía las funcionalidades y requisitos que debía cumplir la aplicación informática que se desarrollaría a partir de la publicación del informe y que con el tiempo se denominaría DOMUS
  4. 4. • Tras su publicación se pusieron en marcha los grupos de trabajo que debían desarrollar estos tesauros. • Fruto de este trabajo se publicaron • Diccionario de Materiales Cerámicos en el año 2002 • Diccionario de Mobiliario en el año 2006 • Diccionario de Numismática en el año 2009. • No se pudieron abarcar un gran número de campos “científicos” empleados a la hora de catalogar un fondo: clasificación genérica, denominación del objeto, título, técnica, materia, iconografía… • En paralelo a la realización de estos estudios y publicaciones, se desarrolló la aplicación DOMUS y se comenzó a instalar en los museos. Dicha herramienta se creó con herramientas de control terminológico a las que había que dar respuesta desde los museos
  5. 5. • DOMUS nació con herramientas de fuerte control terminológico, siguiendo el modelo de la Normalización Documental. • Muchos campos del modelo, como clasificación genérica, denominación del objeto, título, técnica, materia, iconografía … etc en ese momento no tenían definidos los tesauros • Ello conllevó que los museos elaboraran sus propios tesauros dentro de la aplicación para dar respuesta a la catalogación. Cada museo usaba sus propios descriptores • Para paliar esta situación, a partir del año 2001 el Ministerio de Educación, Cultura y Deporte inició una segunda vía de actuación en la normalización terminológica, dirigida a elaborar tesauros generales que sirvieran para cualquier tipo de colección. Este proyecto sigue vivo hoy en día.
  6. 6. • Se escogieron áreas de trabajo que tuvieran su correspondencia en determinados campos de información de DOMUS: clasificación genérica. materias, técnicas, autores, iconografía, lugares geográficos y toponimia histórica, denominaciones de bienes culturales (para el campo “objeto”), iconografía y contextos culturales. • Fruto de este trabajo, han visto la luz hasta ahora: • Diccionario de materias en el año 2008 • Diccionario de objetos asociados a ritos, cultos y creencias en el año 2011 • Diccionario de objetos asociados a la expresión artística, en el año 2012 • Diccionario de técnicas en el año 2016. • Está ya ultimando su aparición el Diccionario de objetos asociados a la arquitectura y estructuras, que se publicará también en el año 2016, y que, junto con los otros dos diccionarios de objetos ya publicados, forman parte del ambicioso Diccionario de denominaciones de objetos culturales, cuya inabarcable dimensión ha obligado a publicarlo por ramas. • Se prevé que en el año 2017 se publiquen el Diccionario de toponimia histórica y el Diccionario de contextos culturales.
  7. 7. Para trabajar con los tesauros y poder distribuirlos en los museos, el Ministerio de Educación, Cultura y Deporte puso en marcha en el año 2004 el diseño de dos herramientas informáticas, denominadas Jerartes y Convertes JERARTES Su objetivo principal es permitir la construcción jerarquizada de cada uno de los tesauros, así como completar la información de cada término (definición, bibliografía, nota de alcance..), etc. CONVERTES Su objetivo principal es permitir la comparación entre el tesauro de un museo y el tesauro central, elaborando un fichero de diferencias a procesar en el museo
  8. 8. JERARTES
  9. 9. CONVERTES
  10. 10. • En el año 2009 se publicó en internet http://ceres.mcu.es • En el año 2011 se publicó en internet http://tesauros.mcu.es Este ha sido el primer proyecto de web semántica en el ámbito de museos. PUBLICACIONES ONLINE
  11. 11. • El origen de los datos publicados en el portal, es la aplicación Jerartes • El portal de tesauros permite consultar la descripción de los diferentes términos que forman parte de los tesauros • Permite la visión jerárquica y alfabética de dicho tesauro • También muestra las imágenes relacionadas con los términos • Actualmente se encuentran disponibles online los tesauros: • Generales: Materias, Geográfico, Bienes Culturales (dos ramas), Técnicas • Específicos: Numismática, Cerámica, Mobiliario PORTAL DE TESAUROS
  12. 12. • Hay enlaces bidireccionales entre el portal de tesauros y ceres • Del portal a ceres:
  13. 13. • De ceres al portal
  14. 14. Para la publicación de los tesauros en Linked Open Data fue necesario: • Convertir la información a un formato reconocible y aceptado, cumpliendo los requisitos establecidos en el Word Wide Web Consortium. • Se eligió el SKOS por ser el más adecuado para la publicación en LOD de vocabularios y ontologías, siendo el sistema que había elegido previamente la Lista de Encabezamiento de Materias desarrollada por la Subdirección General de Coordinación Bibliotecaria del Ministerio de Educación, Cultura y Deporte así como otras instituciones que habían empezado a trabajar en datos abiertos, como los tesauros de Getty Research Institute o el British Museum
  15. 15. • Los datos se han modelado a SKOS siguiendo las directrices definidas por el W3C para las “Cool URIs” , mediante la asignación a cada uno de los términos de un identificador o URI persistente. • Cada uno de los tesauros se ha generado con el siguiente esquema: Esquema del tesauro (skos:Scheme); Concepto (skos:Concept); Facetas (skos:Collection). Por cada descriptor se ha creado un concepto SKOS, mapeando sus campos a tripletas RDF: skos:prefLabel (término); skos:inScheme (tesauro al que pertenece); skos:definition (definición); dct:bibliographicCitation (referencias bibliográficas); skos:scopeNote (nota de alcance) y dct:created (fecha de creación del término). • A cada término relacionado se le ha asignado la etiqueta skos:related; a los términos genéricos skos:broader y skos:topConceptOf y a los términos jerárquicamente dependientes skos:narrower y skos:hasTopConcept. Por cada no descriptor se han formado tripletas en el concepto SKOS creado para su descriptor asociado, con la etiqueta skos:altLabel.
  16. 16. La nueva página de Tesauros del Patrimonio Cultural atiende a dos tipos de “clientes”: • Por una parte, la nueva aplicación ofrece al usuario humano una experiencia de uso similar al de la aplicación antigua: cuando el usuario humano realiza una de consultar un término de alguno de los vocabularios, el sistema responderá a la petición redirigiendo al usuario a la uri del término elegido, en un formato html. • Por otra parte, permite a rastreadores automatizados acceder a los datos, que se devolverán siempre en formato RDF (rdf/xml, Notation3, rdf/Json y Json-ld) • Esta nueva presentación de los Tesauros como LOD permite, por tanto, que recursos de información ajenos puedan vincular sus propios registros de forma automatizada con los datos que ofrece el Portal de Tesauros, pero éste quiere a su vez convertirse en un recurso de información vinculado con otras fuentes.
  17. 17. Para ello, los tesauros incluidos en el Portal han sido enlazados con vocabularios externos que ya se han publicado en Linked Open Data. Hasta el momento, se han realizado vinculaciones con • Lista de Encabezamientos de Materia para Bibliotecas Públicas del Ministerio de Educación, Cultura y Deporte, • Llista de Encapçalaments de Matèria de la Biblioteca de Catalunya, • Bibliothèque nationale de France, • Getty Art and Architecture Thesaurus, • Library of Congress, • Deutsche Nationalbibliothek, • Dbpedia, • Geonames • Getty Thesaurus of Geographic Names (estos últimos en el caso del Diccionario Geográfico) • Ver ejemplos • Alabastro, Abrasivo, Aceite de Girasol • Abadía • África
  18. 18. Además de la funcionalidad de la consulta de los diccionarios y sus términos a los usuarios finales, el sistema ofrece otro tipo de información: enlaces de descargas de datos
  19. 19. Consulta sobre total de datos (estadísticas)
  20. 20. Punto de consulta SPARQL
  21. 21. • En una primera fase, se encargó a la empresa Digibís el modelado en SKOS del Diccionario de Materias y una primera aplicación para su gestión. • Posteriormente, la empresa Serdoc ha realizado el modelado en SKOS del resto de diccionarios y ha definido la aplicación definitiva de gestión de los tesauros en LOD. Para ello, la empresa ha utilizado una aplicación denominada BRÚJULA©, una plataforma de desarrollo de la propia empresa en la que se combina software open source con herramientas y programas de desarrollo propio • En total, se han establecido 54.710 enlaces SKOS closeMatch. El proceso de conversión a SKOS y de vinculación a recursos externos no ha sido automático en su totalidad, ha requerido de la intervención humana para analizar previamente la definición, estructura y relaciones internas de cada tesauro que se skosifica. DESARROLLO
  22. 22. La aplicación está diseñada siguiendo un esquema Model-View-Controller (MVC). • Capa SGBD: No existe. • Capa de persistencia: Se crea automáticamente un modelo RDF Apache Jena a partir de los datos RDF especificados (cuya ubicación es configurable). Este modelo se utiliza globalmente en la aplicación para realizar las diferentes tareas que requieren acceso a datos. • Capa de negocio: Compuesta principalmente por controladores soportados por Spring Framework y clases auxiliares. • Capa Web: Compuesta por vistas HTML usando el sistema de plantillas Thymeleaf. http://www.thymeleaf.org/ CARACTERÍSTICAS TÉCNICAS
  23. 23. • Primera publicación de fondos entre 2004 y 2009, individualizadas por museo. • En el año 2009 sale a la calle http://ceres.mcu.es • Objetivos: - Ofrecer la posibilidad de búsqueda conjunta o individualizada en todos los museos pertenecientes a la red - Generar catálogos temáticos en base a una temática o categoría común - Posibilidad de integración con otros sistemas (europeana) CERES
  24. 24. PRIMER CONTACTO CON LA WEB SEMÁNTICA O DATOS ABIERTOS • Entre 2009 y 2010 los datos de ceres se vuelcan por primera vez a los portales HISPANA y EUROPEANA. • A día de hoy las cifras son: • Ceres: 257030 • Fashion: 17278 • Judaica: 2179 • Locloud:38890 • Los datos actualmente se vuelcan en formato ESE v4.3. Europeana lo transforma automáticamente a formato EDM • Existe un enlace entre ceres y europeana
  25. 25. ESPAÑA. Cuarto lugar en proveedor de contenidos a Europeana Total: 4.498.494 items digitales (9’02%). Hispana más otros proveedores Fuente MED: Consejo de Cooperación Bibliotecaria
  26. 26. Fuente MED: Consejo de Cooperación Bibliotecaria CER.ES a través de Hispana: 186,032 CER.ES a través de otros proveedores: 54.760 items
  27. 27. EN 2015 NOS PLANTEAMOS EL CAMBIO… • El modelo actual únicamente permite búsquedas combinadas por una o varias palabras • No permite hacer sugerencias al usuario • No es interoperable, únicamente lo entienden las personas • Muchísimas posibilidades: • Gran riqueza de objetos • Gran variedad de datos • Alto control terminológico Ceres hacia la Web Semántica
  28. 28. Estamos en fase de desarrollo de: WEB SEMÁNTICA  Nuestro propia publicación en estándar RDF.  Punto de consultas SPARQL  Seguimos las recomendaciones de ICOM sobre linked open data para los museos.  Nuestros metadatos son datos abiertos enlazados.  Nuestra ID es el número de inventario de la institución  Facilitamos recursos digitales (metadatos) para que terceros puedan desarrollar recursos y productos culturales  Facetamos las búsquedas/orientamos al usuario  Enlazamos nuestros recursos con otros recursos. ¿Cómo lo hacemos?. Los recursos los identificamos mediante URIs Ejemplo: http://ceres.mcu.es/pages/Main/IdFicha=idFicha http://tesauros.mecd.es/tesauros/materias/1188806.html
  29. 29. La publicación en RDF permitirá a los museos usuarios de CER.ES A) Interoperar con otros modelos semánticos que estén en la Web acorde a nuestros intereses. Mapas conceptuales.: por ejemplo Numismática. B) Que terceros interoperen con nosotros garantizando el respeto a la difusión que damos de nuestros contenidos creando nuevos productos/servicios.
  30. 30. Primera fase ¿Qué buscamos con esta iniciativas? • Incluir a CER.ES como un recurso más del mapa conceptual de la Web Semántica • Elaborar grafos de relaciones entre los museos que participan en la Red Digital • Facilitar a todos los museos la publicación de sus recursos en un esquema RDF. • Independencia de su mapa conceptual, de sus intereses. • Independencia de cada institucion: elegir ser acceso abierto o dato abierto Segunda fase: la interoperabilidad con iniciativas similares Idea principal: conectar las colecciones de la Red digital con otras colecciones y recursos externos nacionales e internacionales publicados en RDF.
  31. 31. NUESTROS REQUISITOS PRINCIPALES A partir de realizar la primera búsqueda se mostrará la pantalla dividida en dos secciones, a la izquierda se mostrarán los filtros y las facetas y a la derecha los resultados en mosaico, en un listado o directamente la ficha, dependiendo del número de resultados, tal y como se muestra actualmente.
  32. 32. Una vez realizada la primera búsqueda se listarán los resultados obtenidos por los que continuar filtrando, además de cada filtro se contabilizará el número de resultados obtenidos y una casilla de verificación para poder seleccionarlos. El facetado realizará búsquedas por: • Museo • Clasificación genérica • Objeto / Documento • Autor • Materia / Soporte • Técnica • Datación • Contexto cultural / Estilo • Lugar de Producción / Ceca • Lugar de Procedencia
  33. 33. El orden en el que se muestran los filtros, varía en función de los resultados obtenidos. Museo Museo Arqueológico (2.000) Museo del Traje (200) Objeto Cuadro (3.000) Dibujo (1.000) … Sí el número de filtros es superior a 5, se mostrarán 5 filtros y Ver Más. Se incluye Botón Aplicar Filtros para incluir los filtros (seleccionadas con el check) a la búsqueda, la cual se refresca al pulsar botón.
  34. 34. Además de estas facetas, se añadirán facetas “También te puede interesar” con los siguientes criterios: • Cuando los resultados mayoritarios se encuentren en MUSEO: Se busca por museos con los que coincida en el tipo de museo • Cuando los resultados mayoritarios se encuentren en AUTOR: Se busca por autores que coincidan con la misma datación • Cuando los resultados mayoritarios se encuentren en OBJETO: Se busca por objetos que coincidan con la misma clasificación genérica. • Cuando los resultados mayoritarios se encuentren en DATACIÓN: Se busca por contextos culturales con el mismo lugar • Cuando los resultados mayoritarios se encuentren en LUGAR: Se busca por contextos culturales con la misma datación. En cualquier otro caso, se buscará por defecto por museos con los que coincida en el tipo de museo.
  35. 35. Se mostrarán en la parte inferior de la web, 6 resultados con scroll. Se mostrarán el nombre del museo y del objeto, ajustados en dos líneas, sí el nombre del museo o del objeto no cabe en una línea se muestra la información que cabe seguido de tres puntos.
  36. 36. En el mosaico y en el listado de resultados, al pulsar sobre el botón se generará el archivo RDF de la página actual en la que se encuentre el usuario.
  37. 37. En la ficha detalle del fondo o conjunto, al pinchar sobre el botón se generará el RDF del fondo o conjunto. Este archivo RDF incluye la información de los tesauros de materias y lugares geográficos si los hubiera. Al pulsar el botón, se da la posibilidad de abrir el archivo generado o de guardarlo.
  38. 38. CARÁCTERÍSTICAS TÉCNICAS • Se conserva la base de datos relacional con los datos de los 97 museos provenientes de domus. A partir de dicha base de datos, se generan los rdf siguiendo los siguientes pasos: 1. GENERACIÓN BASE DE DATOS GRÁFICA – RDF Se ha creado una herramienta llamada RDCME_RDF_generator, desarrollada en Java 1.7, que genera los archivos RDF de las tablas FMUS, FDOC, y CONJ, junto con las imágenes de fondos, adaptados a la estructura y necesidades de Ceres. 2. DESPLIEGUE APACHE SOLR El indexado de los triples RDF y el facetado para las búsquedas se realiza utilizando el framework Apache SOLR en su versión 4.6.1. 3.DESPLIEGUE APACHE FUSEKI Fuseki es una interfaz HTTP para datos RDF. Es compatible con SPARQL para consultar y actualizar. El proyecto es un sub-proyecto de Jena y se desarrolló como servlet. La versión utilizada en el despliegue y desarrollo es Apache Fuseki v.2.0.0.
  39. 39. 4. GENERACIÓN BASE DE DATOS GRÁFICA – RDF Desplegados correctamente Fuseki y Solr, y con el archivo rdcme.rdf ya generado (paso 1), podemos proceder a la creación del TDB con todos los datos RDF. La creación del TDB parte de un assembler o archivo de configuración config.ttl. Los assemblers son un mecanismo general en Apache Jena para describir los objetos que se construirán, a menudo, estos objetos son modelos y conjuntos de datos. Terminado el proceso se crea en FUSEKI_BASE/databases los archivos que forman el TDB. Si el proceso lo hemos generado desde local habrá que copiarlos, mediante FTP, al FUSEKI_BASE del servidor remoto.
  40. 40. 5. INDEXACIÓN DEL TDB Y CREACIÓN DEL FACETADO Una vez generado el TDB podemos proceder a la indexación del mismo. Es necesario tener desplegado y arrancado SOLR en el servidor (con el listado de directorios y archivos que se ha descrito en el punto 4.1). Se ejecuta un proceso por consola de comandos, y al terminar el proceso se crean en la carpeta data/index y en la carpeta data/tlog los ficheros que configuran el índice. 6. MODIFICACIONES CÓDIGO FUENTE Se ha cambiado la arquitectura de desarrollo de Ceres a Java7 y su despliegue se ha cambiado de un servidor JBOSS a Apache Tomcat.
  41. 41. PROCESO TIEMPO Creación RDF 11 días ? Indexación TDB ? ESTADO ACTUAL DEL PROYECTO • El proyecto fue entregado en junio del 2016. • Actualmente se encuentra en vías de implantación en el entorno de desarrollo del MECD. • Estamos encontrando dificultades en los tiempos de procesamiento • Somos nuevos en algunas tecnologías, y estamos aprendiendo
  42. 42. La publicación de los recursos de CERES en formato RDF está basada en las siguientes ontologías o diccionarios de términos semánticos: Dublin Core (http://dublincore.org/): Esta ontología, abreviada como dc, define un conjunto de elementos de metadata para catalogar elementos en bibliotecas y otros recursos electrónicos. Bajo esta ontología también se utilizan los términos publicados en dcterms (una ampliación del vocabulario Dublin Core). CIDOC Conceptual Reference Model (http://www.cidoc-crm.org/): define conceptos e información de patrimonio cultural y documentación de museos. Europeana Data Model (http://pro.europeana.eu/page/edm-documentation): modelo de metadatos del portal Europeana y ofrece más posibilidades de búsqueda y contextualización e información para el usuario, y de interoperabilidad en proyectos con Linked Open Data. Debido a lo específico de algunos campos, no se ha podido utilizar una ontología en concreto, por ello se ha optado por utilizar un diccionario propio llamado rdcme. PREFIJO O ABREVIATURA ESPACIO DE NOMBRE dc http://purl.org/dc/elements/1.1/ dcterms http://purl.org/dc/terms/ crm http://www.cidoc-crm.org/cidoc-crm/ edm http://www.europeana.eu/schemas/edm/ rdf http://www.w3.org/1999/02/22-rdf-syntax-ns# rdfs http://www.w3.org/2000/01/rdf-schema# rdcme http://ceres.mcu.es/pages/Main/ ESPACIOS DE NOMBRES USADOS EN NUESTROS RDFS
  43. 43. Los datos en RDF son la base para interoperar con terceros agentes pero también son clave para el posicionamiento Web. Se prioriza su lectura  Diseñar proyectos específicos y escalables.  Proyectos sostenibles a medio plazo. Tendencia internacional.  Proyectos replicables.  La museometría como condicionante de los desarrollos. Datos 2011-2015 Visitas: 1.275.329. Usuarios nacionales: 1.030.991 (80 %) Usuarios internacionales: 244.338 (20%) Tiempo medio de visita: 5’ 41” PAÍS VISITAS PORCENTAJE SOBRE EL TOTAL México 30.294 2,38 % Francia 27.658 2,17 % Estados Unidos 26.692 2,09 % Argentina 20.677 1,62 % Italia 13.697 1,07 % PÁGINA DE REFERENCIA VISITAS PORCENTAJE SOBRE EL TOTAL Web del Museo Arqueológico Nacional 91538 29,1% Europeana 44673 14,2 % Web del MECD 23823 7,6 % Wikipedia 8634 2,75 %
  44. 44. CONCLUSIONES • Sabemos que somos “primerizos” y que estamos aprendiendo • Consideramos que es muy importante compartir experiencias y conocimientos entre las distintas instituciones • Tenemos claro que es un sitio donde queremos estar bien posicionados • Confiamos en tener ceres en web semántica en producción en 2017 …. SEGUIMOS TRABAJANDO!!!
  45. 45. ¡¡GRACIAS!! sara.sanchez@mecd.es

×