« Musées de France », exemple d’agrégation de données ouvertes pour la réalisation d’une application web qui a été primée en avril 2014 par le ministère de la Culture via le concours Semanticpedia.
Au travers d’un exemple réel, en ligne sur le site http://labs.antidot.net/museesdefrance/, on présente comment réaliser une application mettant en œuvre plusieurs sources de données ouvertes : les différentes étapes de conception et de réalisation de l’application seront présentées : récupération ou connexion à différents jeux de données, utilisation de web services pour l’enrichissement d’informations (géopositionnement, ajout d’objets multimédias…) puis restitution des données sous forme d’une application web utilisant un moteur de recherche sémantique.
5. 5
Le coeur du mashup
● Usages : une idée générale de l’usage à
développer et de l’expérience utilisateur
● Données : choix du jeu de données principal
6. 6
Des jeux de données complémentaires
● Quels jeux de données ?
● Comment les choisir ?
● Comment les lier au jeu de données principal ?
7. 7
Que veut-on faire des données ?
Interrogations sur l’état des données
Le rêve La réalité
8. 8
Que veut-on faire des données ?
Interrogations sur l’état des données
● Autorité de la source ?
● Qualité intrinsèque ?
● Fraîcheur / fréquence de mise à jour ?
● « Connectabilité » à d’autres données ?
● « Automatisabilité » des traitements ?
9. 9
Que veut-on faire des données ?
One shot ou mise à jour régulière ?
12. 12
Le coeur du mashup
« Construire un site
agrégeant des
informations sur les
musées de France »
● Usages : une idée
générale de
l’usage à
développer
● Données : choix du
jeu de données
principal
26. 26
Sortir de la logique de silos de données…
http://www.flickr.com/photos/jimgris/281139738/
Siège social d’Oracle, l’éditeur du SGBDR le
plus utilisé dans le monde, dans la Silicon
Valley
27. 27
…pour partager la donnée structurée sur
un espace décentralisé
D’un Web de documents
● Documents reliés par des liens
● Pas de structuration sémantique
● Pas de requêtes structurées
28. 28
…pour partager la donnée structurée sur
un espace décentralisé
À un Web d’applications
● Données exposées à travers des API
● API valables uniquement pour un silo
● Pas d’interopérabilité entre les silos
29. 29
…pour partager la donnée structurée sur
un espace décentralisé
À un Web de données
● Web de données = espace unifié
● Liens entre les données elles-mêmes
● APIs remplacées par des standards ouverts
30. 30
Une condition : assurer l’interopérabilité
des données structurées
● Transport
31. 31
Une condition : assurer l’interopérabilité
des données structurées
● Syntaxe
32. 32
Une condition : assurer l’interopérabilité
des données structurées
● Structure
33. 33
Une condition : assurer l’interopérabilité
des données structurées
● Sémantique
34. 34
Un langage pour les machines
Une grammaire Le vocabulaire
Des règles
d’écriture
Des moyens
de communication
RDF
RDFS / OWL
Ontologie
RDF/XML
N3, Turtle
RDFa
HTTP
SPARQL
37. 37
« Raw data now ! » mars 2009
http://www.ted.com/talks/view/lang/en//id/484
38. 38
Les quatre principes du Linked data
Utiliser des URIs Utiliser des URIs
http://dbpedia.org/resource/
Smoking_pipe_%28tobacco%29
accessibles via HTTP
Donner l’accès aux données
utiles en utilisant les
standards SPARQL et RDF
Exprimer
l’URI des objets liés