SlideShare una empresa de Scribd logo
1 de 14
Lecciones aprendidas en la
publicación de datos
enlazados
Asunción Gómez-Pérez
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
asun@fi.upm.es
Agradecimientos:
O. Corcho, D. Vila
Jornada de Web semántica en archivos, bibliotecas y museos.
Madrid, 10 de abril de 2014
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Los datos enlazados son para las máquinas, también para los humanos
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Casuística
Dominios FuentesProveedores Idiomas
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
¿Qué busca el usuario de datos enlazados?
• ¿Quién generó el conjunto de datos?
• ¿Cuándo se creó el conjunto de datos?
• ¿Cómo se creó el conjunto de datos?
• ¿Es ésta la última versión?
• ¿Está la información sobre licencias de uso claramente identificada?
• ¿En qué formatos se me ofrecen los datos abiertos?
• ¿Son los datos monoligües o multilingües?
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 1. La institución debe estar convencida
Convencimiento institucional
• Aportar recursos humanos
• Antes de empezar:
• Datos recopilados
• Datos de calidad en origen
• No es una solución a coste cero
• Presupuesto asignado interno
• Presupuesto externo,si solita la ayuda de terceros
• Plan de formación interno en tecnologías semánticas
• Otra tecnología a mantener
• Persistencia y sostenibilidad
• Los datos evolucionan
5
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 2: Usar datos curados
6
No se debe generar datos
enlazados a partir de
cualquier dato
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 3: Los aspectos metodológicos son importantes
Especificación
Modelado del
vocabulario
(ontología)
Generación
en RDF
Publicación
Explotacion
Enlazado con
otros datos
7
Limpieza
de los
datos
Muchas
tecnologías
involucradas
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 4: Utilizar ontologías
http://www.server1.org/resource/Cervantes
http://www.server2.es/resource/Cervantes
http://datos.bne.es/resource/XX1718747
http://d-nb.info/gnd/11851993X
http://geo.linkeddata.es/page/resource/Municipio/Cervantes
Same as
Same as
Same as
Same as
URI
URI
URI
URI
URI
914 296 093
276,4 km²
Phone
Size
1547
#People
1547
Date of Birth
Author
D. Quijote
Cervantes
(persona)
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Cervantes y un poco de semántica
http://www.server1.org/resource/Cervantes
http://www.server2.es/resource/Cervantes
http://datos.bne.es/resource/XX1718747
http://d-nb.info/gnd/11851993X
http://geo.linkeddata.es/page/resource/Municipio/Cervantes
Same as
Person
rdf:type
rdf:type
Retaurant
rdf:type
Street
rdf:type
Municipality
rdf:type
URI
URI
URI
URI
URI
1547
Date of Birth
Author
D. Quijote
Cervantes
(Person)
Asunción Gómez-Pérez W3C @ Spain – 2013 Madrid, 18th December
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 5: Introducir metadatos adicionales siguiendo estándares
• Propiedad Intelectual
• Licencias de uso
• Procedencia (Provenance) del dato
• Proceso seguido para:
• obtener el dato en su formato original
• generar el dato en RDF
• Idioma
10
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Lección 6: Ser selectivos con los enlaces
• No hay que enlazar con todo
• Enlaces con recursos
• De calidad
• Relevantes
• que abren la puerta a otros recursos
• Enlaces persistentes
11
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Efectos colaterales importantes
12
El proceso de generar RDF incrementa la
calidad de los datos en el formato origen
• Detección automática de anomalías
• Reducción de costes
Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014
Conclusiones
1. Convencimiento institucional
2. Generar con datos de calidad
3. Los aspectos metodológicos son importantes
4. Las ontologías proporcionan contexto al dato
5. Introducir metadatos de procedencia, licencias e
idiomas
6. Ser selectivos con los enlaces
7. Efectos colaterales importantes
• Mejora de los datos de la institución
• Reducción de costes
8. Plan de formación en Tecnologías Semánticas y
Datos enlazados
• (cursos disponibles en http://www.oeg-upm.net/)
Lecciones aprendidas en la
publicación de datos
enlazados
Asunción Gómez-Pérez
Facultad de Informática, Universidad Politécnica de Madrid
Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid
http://www.oeg-upm.net
asun@fi.upm.es
Agradecimientos:
O. Corcho, D. Vila
Jornada de Web semántica en archivos, bibliotecas y museos.
Madrid, 10 de abril de 2014

Más contenido relacionado

Similar a Lecciones aprendidas al publicar datos enlazados

Herramientas de la web 3
Herramientas de la web 3Herramientas de la web 3
Herramientas de la web 3
Matsukasaki
 
Silabo tbd 2019_n_v1
Silabo tbd 2019_n_v1Silabo tbd 2019_n_v1
Silabo tbd 2019_n_v1
UNFV
 

Similar a Lecciones aprendidas al publicar datos enlazados (20)

Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...Gestionar y compartir Datos de Investigación: los retos y los principales com...
Gestionar y compartir Datos de Investigación: los retos y los principales com...
 
Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...
Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...
Reutilización de datos abiertos en el aprendizaje de diseño de bases de datos...
 
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...
A. Fuster. La era del Open Data: Caso de éxito y oportunidades. Semanainforma...
 
Taller 080324 DBD-01 - Diseño de bases de datos
Taller 080324 DBD-01 - Diseño de bases de datosTaller 080324 DBD-01 - Diseño de bases de datos
Taller 080324 DBD-01 - Diseño de bases de datos
 
Silabus de base de datos i 2014
Silabus de base de datos i 2014 Silabus de base de datos i 2014
Silabus de base de datos i 2014
 
Portafolio de trabajo
Portafolio de trabajoPortafolio de trabajo
Portafolio de trabajo
 
Portafolio de Trabajo REA
Portafolio de Trabajo REAPortafolio de Trabajo REA
Portafolio de Trabajo REA
 
Implementação de serviços nacionais e estratégias institucionais para a Gestã...
Implementação de serviços nacionais e estratégias institucionais para a Gestã...Implementação de serviços nacionais e estratégias institucionais para a Gestã...
Implementação de serviços nacionais e estratégias institucionais para a Gestã...
 
Herramientas de la web 3
Herramientas de la web 3Herramientas de la web 3
Herramientas de la web 3
 
Objetivo y temario de bda
Objetivo y temario de bdaObjetivo y temario de bda
Objetivo y temario de bda
 
Silabo tbd 2019_n_v1
Silabo tbd 2019_n_v1Silabo tbd 2019_n_v1
Silabo tbd 2019_n_v1
 
Presentacion del programa de formacion profesional de Informática en Salud, E...
Presentacion del programa de formacion profesional de Informática en Salud, E...Presentacion del programa de formacion profesional de Informática en Salud, E...
Presentacion del programa de formacion profesional de Informática en Salud, E...
 
Linked Data en el dominio geográfico español
Linked Data en el dominio geográfico españolLinked Data en el dominio geográfico español
Linked Data en el dominio geográfico español
 
Elaboración de sílabo 2
Elaboración de sílabo 2Elaboración de sílabo 2
Elaboración de sílabo 2
 
Escuela de Datos
Escuela de DatosEscuela de Datos
Escuela de Datos
 
Edutec16 - Investigación Abierta / Open research
Edutec16 - Investigación Abierta / Open researchEdutec16 - Investigación Abierta / Open research
Edutec16 - Investigación Abierta / Open research
 
Conole barcelona
Conole barcelonaConole barcelona
Conole barcelona
 
Trabajo de la tic s
Trabajo de la tic s Trabajo de la tic s
Trabajo de la tic s
 
Silabo base de datos 2013
Silabo base de datos 2013Silabo base de datos 2013
Silabo base de datos 2013
 
Ciencia Abierta y Gestión de Datos de Investigación (RDM)
Ciencia Abierta y Gestión de Datos de Investigación (RDM)Ciencia Abierta y Gestión de Datos de Investigación (RDM)
Ciencia Abierta y Gestión de Datos de Investigación (RDM)
 

Más de Asuncion Gomez-Perez

Más de Asuncion Gomez-Perez (8)

Maximising (Re)Usability of Library metadata using Linked Data
Maximising (Re)Usability of Library metadata using Linked Data Maximising (Re)Usability of Library metadata using Linked Data
Maximising (Re)Usability of Library metadata using Linked Data
 
Maximising (Re)Usability of Resources using Linked Data
Maximising (Re)Usability of Resources using Linked DataMaximising (Re)Usability of Resources using Linked Data
Maximising (Re)Usability of Resources using Linked Data
 
Uso de datos.bne.es: imaginando el futuro
Uso de datos.bne.es: imaginando el futuroUso de datos.bne.es: imaginando el futuro
Uso de datos.bne.es: imaginando el futuro
 
Linked data and language technologies
Linked data and language technologies Linked data and language technologies
Linked data and language technologies
 
Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...
Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...
Linked DAta Applications: There is no One-Size-Fits All Formula (Long present...
 
Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...
Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...
Linked DAta Applications: There is no One-Size-Fits All Formula (Short presen...
 
W3c app ld-asun(v5)-final
W3c app ld-asun(v5)-finalW3c app ld-asun(v5)-final
W3c app ld-asun(v5)-final
 
Datos enlazados en la Biblioteca Nacional de España
Datos enlazados en la Biblioteca Nacional  de EspañaDatos enlazados en la Biblioteca Nacional  de España
Datos enlazados en la Biblioteca Nacional de España
 

Último

Último (20)

Sistemas distribuidos de redes de computadores en un entorno virtual de apren...
Sistemas distribuidos de redes de computadores en un entorno virtual de apren...Sistemas distribuidos de redes de computadores en un entorno virtual de apren...
Sistemas distribuidos de redes de computadores en un entorno virtual de apren...
 
JORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUAL
JORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUALJORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUAL
JORNADA INTELIGENCIA ARTIFICIAL Y REALIDAD VIRTUAL
 
¡Mira mi nuevo diseño hecho en Canva!.pdf
¡Mira mi nuevo diseño hecho en Canva!.pdf¡Mira mi nuevo diseño hecho en Canva!.pdf
¡Mira mi nuevo diseño hecho en Canva!.pdf
 
proyectos_social_y_socioproductivos _mapas_conceptuales
proyectos_social_y_socioproductivos _mapas_conceptualesproyectos_social_y_socioproductivos _mapas_conceptuales
proyectos_social_y_socioproductivos _mapas_conceptuales
 
Presentacion y Extension de tema para Blogger.pptx
Presentacion y Extension de tema para Blogger.pptxPresentacion y Extension de tema para Blogger.pptx
Presentacion y Extension de tema para Blogger.pptx
 
Herramientas informáticas. Sara Torres R.
Herramientas informáticas. Sara Torres R.Herramientas informáticas. Sara Torres R.
Herramientas informáticas. Sara Torres R.
 
NIVEL DE MADUREZ TECNOLÓGICA (TRL).pptx
NIVEL DE  MADUREZ TECNOLÓGICA (TRL).pptxNIVEL DE  MADUREZ TECNOLÓGICA (TRL).pptx
NIVEL DE MADUREZ TECNOLÓGICA (TRL).pptx
 
Pons, A. - El desorden digital - guia para historiadores y humanistas [2013].pdf
Pons, A. - El desorden digital - guia para historiadores y humanistas [2013].pdfPons, A. - El desorden digital - guia para historiadores y humanistas [2013].pdf
Pons, A. - El desorden digital - guia para historiadores y humanistas [2013].pdf
 
BUSCADORES DE INTERNET (Universidad de Sonora).
BUSCADORES DE INTERNET (Universidad de Sonora).BUSCADORES DE INTERNET (Universidad de Sonora).
BUSCADORES DE INTERNET (Universidad de Sonora).
 
HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...
HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...
HerramientasInformaticas ¿Que es? - ¿Para que sirve? - Recomendaciones - Comp...
 
Uso de las TIC en la vida cotidiana .
Uso de las TIC en la vida cotidiana       .Uso de las TIC en la vida cotidiana       .
Uso de las TIC en la vida cotidiana .
 
Gestión de concurrencia y bloqueos en SQL Server
Gestión de concurrencia y bloqueos en SQL ServerGestión de concurrencia y bloqueos en SQL Server
Gestión de concurrencia y bloqueos en SQL Server
 
manual-de-oleohidraulica-industrial-vickers.pdf
manual-de-oleohidraulica-industrial-vickers.pdfmanual-de-oleohidraulica-industrial-vickers.pdf
manual-de-oleohidraulica-industrial-vickers.pdf
 
Bloque 1 _ Lectura base - Sistemas Distribuidos
Bloque 1 _ Lectura base - Sistemas DistribuidosBloque 1 _ Lectura base - Sistemas Distribuidos
Bloque 1 _ Lectura base - Sistemas Distribuidos
 
taller de tablas en word para estudiantes de secundaria
taller de tablas en word para estudiantes de secundariataller de tablas en word para estudiantes de secundaria
taller de tablas en word para estudiantes de secundaria
 
De Olmos Santiago_Dolores _ M1S3AI6.pptx
De Olmos Santiago_Dolores _ M1S3AI6.pptxDe Olmos Santiago_Dolores _ M1S3AI6.pptx
De Olmos Santiago_Dolores _ M1S3AI6.pptx
 
CIBERSEGURIDAD Y SEGURIDAD INFORMATICA .
CIBERSEGURIDAD Y SEGURIDAD INFORMATICA .CIBERSEGURIDAD Y SEGURIDAD INFORMATICA .
CIBERSEGURIDAD Y SEGURIDAD INFORMATICA .
 
VelderrainPerez_Paola_M1C1G63-097.pptx. LAS TiC
VelderrainPerez_Paola_M1C1G63-097.pptx. LAS TiCVelderrainPerez_Paola_M1C1G63-097.pptx. LAS TiC
VelderrainPerez_Paola_M1C1G63-097.pptx. LAS TiC
 
Unidad 1- Historia y Evolucion de las computadoras.pdf
Unidad 1- Historia y Evolucion de las computadoras.pdfUnidad 1- Historia y Evolucion de las computadoras.pdf
Unidad 1- Historia y Evolucion de las computadoras.pdf
 
herramientas informaticas mas utilizadas
herramientas informaticas mas utilizadasherramientas informaticas mas utilizadas
herramientas informaticas mas utilizadas
 

Lecciones aprendidas al publicar datos enlazados

  • 1. Lecciones aprendidas en la publicación de datos enlazados Asunción Gómez-Pérez Facultad de Informática, Universidad Politécnica de Madrid Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net asun@fi.upm.es Agradecimientos: O. Corcho, D. Vila Jornada de Web semántica en archivos, bibliotecas y museos. Madrid, 10 de abril de 2014
  • 2. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Los datos enlazados son para las máquinas, también para los humanos
  • 3. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Casuística Dominios FuentesProveedores Idiomas
  • 4. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 ¿Qué busca el usuario de datos enlazados? • ¿Quién generó el conjunto de datos? • ¿Cuándo se creó el conjunto de datos? • ¿Cómo se creó el conjunto de datos? • ¿Es ésta la última versión? • ¿Está la información sobre licencias de uso claramente identificada? • ¿En qué formatos se me ofrecen los datos abiertos? • ¿Son los datos monoligües o multilingües?
  • 5. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 1. La institución debe estar convencida Convencimiento institucional • Aportar recursos humanos • Antes de empezar: • Datos recopilados • Datos de calidad en origen • No es una solución a coste cero • Presupuesto asignado interno • Presupuesto externo,si solita la ayuda de terceros • Plan de formación interno en tecnologías semánticas • Otra tecnología a mantener • Persistencia y sostenibilidad • Los datos evolucionan 5
  • 6. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 2: Usar datos curados 6 No se debe generar datos enlazados a partir de cualquier dato
  • 7. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 3: Los aspectos metodológicos son importantes Especificación Modelado del vocabulario (ontología) Generación en RDF Publicación Explotacion Enlazado con otros datos 7 Limpieza de los datos Muchas tecnologías involucradas
  • 8. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 4: Utilizar ontologías http://www.server1.org/resource/Cervantes http://www.server2.es/resource/Cervantes http://datos.bne.es/resource/XX1718747 http://d-nb.info/gnd/11851993X http://geo.linkeddata.es/page/resource/Municipio/Cervantes Same as Same as Same as Same as URI URI URI URI URI 914 296 093 276,4 km² Phone Size 1547 #People 1547 Date of Birth Author D. Quijote Cervantes (persona)
  • 9. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Cervantes y un poco de semántica http://www.server1.org/resource/Cervantes http://www.server2.es/resource/Cervantes http://datos.bne.es/resource/XX1718747 http://d-nb.info/gnd/11851993X http://geo.linkeddata.es/page/resource/Municipio/Cervantes Same as Person rdf:type rdf:type Retaurant rdf:type Street rdf:type Municipality rdf:type URI URI URI URI URI 1547 Date of Birth Author D. Quijote Cervantes (Person) Asunción Gómez-Pérez W3C @ Spain – 2013 Madrid, 18th December
  • 10. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 5: Introducir metadatos adicionales siguiendo estándares • Propiedad Intelectual • Licencias de uso • Procedencia (Provenance) del dato • Proceso seguido para: • obtener el dato en su formato original • generar el dato en RDF • Idioma 10
  • 11. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Lección 6: Ser selectivos con los enlaces • No hay que enlazar con todo • Enlaces con recursos • De calidad • Relevantes • que abren la puerta a otros recursos • Enlaces persistentes 11
  • 12. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Efectos colaterales importantes 12 El proceso de generar RDF incrementa la calidad de los datos en el formato origen • Detección automática de anomalías • Reducción de costes
  • 13. Lecciones aprendidas en la publicación de datos enlazados A. Gómez-Pérez Madrid 10 de abril de 2014 Conclusiones 1. Convencimiento institucional 2. Generar con datos de calidad 3. Los aspectos metodológicos son importantes 4. Las ontologías proporcionan contexto al dato 5. Introducir metadatos de procedencia, licencias e idiomas 6. Ser selectivos con los enlaces 7. Efectos colaterales importantes • Mejora de los datos de la institución • Reducción de costes 8. Plan de formación en Tecnologías Semánticas y Datos enlazados • (cursos disponibles en http://www.oeg-upm.net/)
  • 14. Lecciones aprendidas en la publicación de datos enlazados Asunción Gómez-Pérez Facultad de Informática, Universidad Politécnica de Madrid Campus de Montegancedo sn, 28660 Boadilla del Monte, Madrid http://www.oeg-upm.net asun@fi.upm.es Agradecimientos: O. Corcho, D. Vila Jornada de Web semántica en archivos, bibliotecas y museos. Madrid, 10 de abril de 2014