Este documento introduce el concepto de Linked Data y explica cómo permite publicar y vincular datos en la Web de una manera estandarizada. Explica los cuatro principios básicos de Linked Data, que son usar URIs para nombrar recursos, exponer datos usando HTTP, proporcionar información sobre un recurso usando RDF, y enlazar recursos con otros. También muestra un ejemplo de cómo describir recursos sobre una persona y una ciudad usando tripletas RDF y vocabularios como FOAF y Geo.
1. Linked Data:
¿quéesyquénosofrece?
Daniel Vila-Suero
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedosn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
dvila@fi.upm.es
Agradecimientos: A. Gómez-Pérez.
Seminario web Linked Open Data@AIMS FAO
Martes 11 de Diciembre de 2012
2. Contenido
• Produciendoyconsumiendoinformación en la Web
• Linked Data
• Conceptosbásicos a través de un ejemplo
• Lecturas
2
4. La Web desde dos perspectivas
PRODUCTOR CONSUMIDOR
WWW
INFORMACIÓN INFORMACIÓN
• Dos roles con fronterascadadíamásdiluídas
• Usuarios:
• Consumimos a diarioinformación de wikipedia, prensa,
twitter, facebook, etc.
• Producimosinformación en twitter, wikipedia, facebook,
comentamosnoticias, etc.
• Unaorganización(empresa, instituciónpública):
• Produceinformaciónyofreceservicios (compra-venta,
agregacióninformación, etc.)
• Consumeinformaciónparamejorarsusservicios/oferta
4
5. Consumidores
CONSUMIDORES WWW
• Cuando usamos la Web:
• Consultamos varias fuentes de información:
• Para organizar un viaje: compra de billetes, hotel, sitios
de interés, etc.
• Para comprar un libro: desde un autor que nos gusta a
un tema determinado
• Los servicios más exitosos son aquellos que son capaces
de agregar/derivar información que nos interesa: google,
twitter, etc.
• Muchas veces resulta tedioso/difícil encontrar lo que
buscamos
5
6. Productores
PRODUCTORES WWW
• Necesitan que su información/servicio sea visible, útil
y relevante
• Reutilizar información de otros aumenta las
capacidades del servicio
• Compartir información de una manera sencilla y
estándar amplía el potencial de la misma y la
visibilidad de la organización
6
8. Produciendoinformación en la Web
HTML
Web 1.0 WWW
AUTOR HTML, XML, servicios web
WWW
Web 2.0 LIBR IDIOMA
O
EDITOR
8
9. Produciendoinformación en la Web
HTML
Web 1.0 WWW
HTML, XML, servicios web
WWW
Web 2.0
WWW WWW
Linked Data AUTOR
LIBR IDIOMA
O
EDITOR
9
10. Produciendoinformación en la Web
HTML
Web 1.0 WWW
WWW
Web 2.0
WWW WWW
Linked Data
“Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/” 10
11. Limitaciones
• El sistema actual (HTML + Servicios Web) no facilita
la reutilización ni la generación de nuevo
conocimiento
• HTML: Es un formato para estructurar documentos,
no datos
• Servicios Web: Aunque estructuran los datos, no
especifican el modelo de una manera estándar (e.g.
es Eduardo Mendoza una persona? )
11
14. Idea básica
Mantén el modelo de tusdatoscuandopubliques
información en la Web
AUTOR WWW
LIBRO IDIOMA AUTOR
LIBRO
EDITOR
Estar en la Web……..
14
15. Idea básica
Mantén el modelo de tusdatoscuandopubliques
información en la Web
WWW
AUTOR WWW
LIBRO IDIOMA AUTOR
LIBRO
EDITOR
… ser parte de la Web.
15
16. Linked Data
• Publicación de datos en la Web:
• Usando las tecnologías de la Web: HTTP, URL/URI, DNS
• Con un modelo de datos explícito: RDF + vocabularios (o
esquemas, ontologías..) en RDF Schema o OWL
• Permite compartir (aumentar)tus datos
• Permite reutilizar datos de otros para enriquecer tu
información, reducir costes, y ofrecer mejores
servicios
16
18. Los 4 Principios*
1. Utilizar URIspara nombrar cosas (recursos)
2. Usar el protocolo HTTP para publicar/recuperar recursos
http://dbpedia.org/resource/Love
http://geo.linkeddata.es/resource/Provincia/Barcelona
3. Describir datos en un formato estándar (RDF)
dbpedia:Tim_Berners-Lee rdf:typefoaf:Person
foaf:surname "Berners-Lee"@en ;
foaf:givenName "Tim"@en ;
4. Enlazarcon otros recursos a través de URIs
*http://www.w3.org/DesignIssues/LinkedData
18
19. ¿Qué necesitamos? (1)
• Bloque básico: tripletas RDF
Sujeto Predicado Objeto
Eduardo Mendoza es autor de La ciudad de los prodigios
Barcelona forma parte de Catalunya
• Sujeto y predicado son URIs
• El objeto puede ser una URI o un literal
19
20. ¿Qué necesitamos? (2)
• Vocabularios para:
• Indicar de qué tipo son nuestros recursos (CLASES):
Eduardo Mendoza es Persona
Barcelona es Municipio
• Describir nuestros recursos (PROPIEDADES):
• Tiene nombre, nº de páginas, etc.
• Existen multitud de vocabularios (http://lov.okfn.org/)
para describir todo tipo de cosas en la Web
20
21. El modelo (vocabulario) y los datos
Lengua
Traducción
Es autor
Año Obra Persona
Fecha de Publicación Vocab
Ubicado en
Tiene como materia
Biblioteca
Catalán
Datos
Traducción
Es autor
1960 El Quijote Cervantes
Fecha de Publicación
Tiene como materia
Ubicado en
Vida de Cervantes
BNE
21
22. Ejemplo*:
2 recursos
3 conjuntos de datos
*Basado en la presentación de Tom Baker@FAO-AIMS:
http://www.slideshare.net/faoaims/linking-your-resources-to-the-data-web
22
24. Bloque básico para describir el recurso: Tripletas
Sujeto Predicado Objeto
Sujeto Predicado Objeto
Eduardo Mendoza Nacido en Barcelona
Eduardo Mendoza Fecha de nacimiento 01-11-1943
Eduardo Mendoza Profesión Escritor
Eduardo Mendoza Autor de La ciudad de los prodigios
24
25. Triplificando la descripción
Identificamos el sujeto con una URI
Sujeto Predicado Objeto
dbpedia:Eduardo_Mendoza_Garriga Nacido en Barcelona
dbpedia:Eduardo_Mendoza_Garriga Fecha de nacimiento 01-11-1943
dbpedia:Eduardo_Mendoza_Garriga Profesión Escritor
dbpedia:Eduardo_Mendoza_Garriga Autor de La ciudad de los prodigios
La URI completa es http://dbpedia.org/resource/Eduardo_Mendoza_Garrigapero
utilizamos la abreviación dbpedia:
25
26. Triplificando la descripción: Usando otros conjuntos de datos
Los objetos pueden ser URIs o
literales
Sujeto Predicado Objeto
dbpedia:Eduardo_Mendoza_Garriga Nacido en geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga Fecha de nacimiento "01-11-1943"
dbpedia:Eduardo_Mendoza_Garriga Es una foaf:Person
dbpedia:Eduardo_Mendoza_Garriga Autor de bne:XX1892304
La URI completa es http://datos.bne.es/resource/XX1892304pero utilizamos
la abreviación bne:
26
27. Triplificando la descripción: Usando vocabularios
Los predicados SON URIs
(de uno o varios vocabularios)
Sujeto Predicado Objeto
dbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"
dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
Foaf es un vocabulario para describir personas (fecha y lugar de
nacimiento por ejemplo).
rdf:type asigna un tipo al recurso
27
28. Al usar recursos de otros conjuntos: ampliamos la información
Sujeto Predicado Objeto
dbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"
dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
bne:XX1892304 dc:title La ciudad de los prodigios
bne:XX1892304 es la URI que identifica la obra con titulo "La
ciudad de los prodigios" en el portal de datos de la BNE
(datos.bne.es)
28
29. Las tripletas conforman un grafo
geoes:Barcelona
01-11-1943
foaf:birthPlace
foaf:birthDate
rdf:type foaf:Person
dbpedia:Eduardo_Mendoza
… La ciudad de los
dc:title prodigios
bne:XX1892304
frbr:isCreatorOf
Sujeto Predicado Objeto
dbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"
dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
29
32. Aumentando el grafo
Uniendo las tripletas del recurso A
Sujeto Predicado Objeto
dbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"
dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
bne:XX1892304 dc:title La ciudad de los prodigios
32
33. Aumentando el grafo
Con las tripletas del recurso B
Sujeto Predicado Objeto
dbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"
dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
bne:XX1892304 dc:title La ciudad de los prodigios
geoes:Barcelona http://geo.linkeddata.es/ontology/fo http://geo.linkeddata.es/page/reso
rmaParteDe urce/ComunidadAutónoma/Catalu
ña
geoes:Barcelona geo:lat 41.3833333333333
geoes:Barcelona geo:long 2.16666666666667
geoes:Barcelona rdf:type http://geo.linkeddata.es/ontology/P
rovincia
33
34. URIs: integrando datos en la WWW
Con las tripletas del recurso B
Sujeto Predicado Objeto
dbpedia:Eduardo_Mendoza_Garriga foaf:birthPlace geoes:Barcelona
dbpedia:Eduardo_Mendoza_Garriga foaf:birthDate "01-11-1943"
dbpedia:Eduardo_Mendoza_Garriga rdf:type foaf:Person
dbpedia:Eduardo_Mendoza_Garriga frbr:isCreatorOf bne:XX1892304
bne:XX1892304 dc:title La ciudad de los prodigios
geoes:Barcelona http://geo.linkeddata.es/ontology/fo http://geo.linkeddata.es/page/reso
rmaParteDe urce/ComunidadAutónoma/Catalu
ña
geoes:Barcelona geo:lat 41.3833333333333
geoes:Barcelona geo:long 2.16666666666667
geoes:Barcelona rdf:type http://geo.linkeddata.es/ontology/P
rovincia
34
35. Las URIs
01-11-1943
foaf:birthDate
rdf:type foaf:Person
dbpedia:Eduardo_Mendoza
… La ciudad de los
dc:title prodigios
bne:XX1892304
frbr:isCreatorOf
foaf:birthPlace
geoes:Barcelona
geoes:Cataluña
41.3833333333333
geoes:formaParteDe
geo:lat
geo:long 2.16666666666667
geoes:Barcelona
rdf:type
geoes:Provincia
35
36. Creando un grafo de datos
01-11-1943
foaf:birthDate
rdf:type foaf:Person
dbpedia:Eduardo_Mendoza
… La ciudad de los
dc:title prodigios
bne:XX1892304
frbr:isCreatorOf
foaf:birthPlace
geoes:formaParteDe
geoes:Barcelona
geoes:Cataluña
41.3833333333333
geo:lat
rdf:type geo:long
2.16666666666667
geoes:Provincia
36
37. Generando valor a través del enlazado
01-11-1943
foaf:birthDate
rdf:type foaf:Person
dbpedia:Eduardo_Mendoza
… La ciudad de los
dc:title prodigios
bne:XX1892304
frbr:isCreatorOf
foaf:birthPlace
geoes:formaParteDe
geoes:Barcelona
geoes:Cataluña
41.3833333333333
geo:lat
rdf:type geo:long
2.16666666666667
geoes:Provincia
37
38. Ampliando la red de datos
01-11-1943
foaf:birthDate
rdf:type foaf:Person
dbpedia:Eduardo_Mendoza
… La ciudad de los
dc:title prodigios
bne:XX1892304
frbr:isCreatorOf
foaf:birthPlace
geoes:formaParteDe
geoes:Barcelona
geoes:Cataluña
41.3833333333333
geo:lat
rdf:type geo:long
2.16666666666667
geoes:Provincia
38
39. Lecciones aprendidas
• Nombrar nuestros recursos usando HTTP URIs, describirlos
usando vocabularios (RDFS y OWL), enlazar nuestros
datos usando URIs de otros proveedores de datos.
• Receta básica:
1. Entender nuestro modelo de datos de origen
2. Crear un espacio de URIs gestionadas por la organización y que
identifiquen univocamente nuestros recursos
3. Seleccionar los vocabularios adecuados
(http://lov.okfn.org/dataset/lov). Mantener el modelo claro y sencillo
4. Describir nuestros recursos usando tripletas RDF y los
vocabularios
5. Usar URIs de otros para describir nuestros datos
complementando y aumentando nuestros recursos
39
40. Lecturas
• Informes del W3C Library Linked Data Incubator Group:
• Inglés:http://www.w3.org/2005/Incubator/lld/XGR-lld-20111025/
• Español y otros idiomas:
http://www.w3.org/2003/03/Translations/byTechnology?technology=ll
d-reports
• Linked Data book, Heath and Bizer:
• http://linkeddatabook.com/editions/1.0/
• Artículo sobre la publicación de datos de la BNE:
• http://semantic-web-journal.net/content/datosbnees-library-linked-
data-dataset
40