Este documento describe cómo pensar en los datos puede mejorar las soluciones tecnológicas. Explica cómo al principio el objetivo era mostrar obras sobre un mismo tema, pero al enfocarse en los datos (enlazando obras y temas) en lugar de la aplicación, se logró una solución más rápida y reutilizable que benefició todo el servicio. Ahora, siguiendo esta filosofía de "pensar en los datos", se pueden explotar nuevas funcionalidades como sugerencias basadas en temas similares entre obras.
Datos.bne.es. Pensando en los datos. Daniel Vila Suero
1. Daniel Vila Suero
Ontology Engineering Group
Pensando en los datos
Cita en la BNE: RDA y Linked Data
15 Abril 2016
2. Grupo de investigación
dirigido por Asunción Gómez Pérez
Linked Data-based
Data Integration
Semantic
e-Science
(Social)
Semantic
Web
NLP and
Multilingualism
Ontological Engineering
1995
19972000
2004 2008
Ontology Engineering Group 9
3. JSON-LD
SPARQLMotor de búsqueda NoSQL DB
Aplicación + API (Javascript)
Cliente HTTP API
Indexación y ranking
SPARQL
endpoint
Ontología BNE
Acceso
Aplicación
JSON-LD
Datos
4. • La Web: Javascript + CSS3 + HTML5 + LD
• Crecer: Escalabilidad con el número de usuarios
• Los usuarios: Apps and us
• ”Pensar en los datos”: Datos primero, aplicación después
Arquitectura pensada para..
5. ¿Pensar en los datos?
JSON-LD
SPARQLMotor de búsqueda NoSQL DB
Aplicación + API (Javascript)
Indexación y ranking
Ontología BNE
Aplicación
JSON-LD
Datos
Problema a resolver
Solución
Solución
“Pensar en los datos”: Abordar las soluciones desde el modelo de datos
(aplicación)
(datos)
6. “Pensar en los datos” con un ejemplo
¿De dónde vienen estas sugerencias?
(2015)
9. Situación inicial (60’s): Los temas están en los bibliográficos
Registros bibliográficos (Ediciones)
Registros autoridad (Obras)
Tema
Tema
Aplicación
Datos
Aplicación
?
10. Soluciones (2014): “Clásica” vs. “Pensar en los datos”
?
Ediciones
Obras
Aplicación
Temas
Quiero mostrar obras
sobre un mismo tema
“Clásica” (1)
Pregunto por ediciones sobre el mismo tema
Ediciones
Obras
Aplicación
Temas
Tema =
Novelas picarescas
Ediciones
(muchas)
Problemas:
No es lo que queríamos.
¿cómo presentamos los resultados? (relevancia)
11. Soluciones (2014): “Clásica” vs. “Pensar en los datos”
?
Ediciones
Obras
Aplicación
Temas
Quiero mostrar obras
sobre un mismo tema
“Clásica” (2)
Pregunto por ediciones sobre el mismo tema
y por cada edición pregunto por su obra
Ediciones
Obras
Aplicación
Temas
Tema =
Novelas picarescas
Enlaces
a obras
Problemas:
Dos consultas, + costoso, +complejo
NO facilmente reutilizable
1
Recuperar
obras
2 Obras
1
2
12. Pensar en los datos (2014)
?Ediciones
Obras
Aplicación
Temas
Quiero mostrar obras
sobre un mismo tema
Pensemos
en los datos
Obra
Edición Temas
Nueva relación
(FRBR, RDA)
Ediciones
Obras
Temas
Nuevos
enlaces
13. Pensar en los datos (2014)
Pregunto por obras sobre el mismo tema
Ediciones
Obras
Aplicación
Temas
Tema =
Novelas picarescas
Obras
Ventajas:
Aplicación + rápida, menos compleja
Beneficia a todo el servicio
REUTILIZABLE
Mejor presentación de resultados
(relevancia,
agregación,
presentación)
14. Pensar en los datos (2015): Sugerencias
Misma funcionalidad (usando el buscador)
Obras que compartan temas
Obras
Temas
15. Pensar en los datos (2016?): Valor añadido
Explotar la misma idea
en distintos contextos:
> Obras con temas similares
> Autores que hablan de los mismos temas
> Temas que coinciden en diferentes obras
Obras
Temas
16. • Mayor impacto en todo el servicio: APIs, Motor de
búsqueda, algoritmos de relevancia.
• Reutilización de funcionalidades
• El poder de los enlaces (the network effect):
“Cada nuevo enlace representa nuevas posibilidades”
Beneficios de pensar en los datos