2. L'Open Data
● disponibles en ligne librement ★
● structurées et accessibles ★★
● libres techniquement ★★★
● identifiables et interrogeables ★★★★
● liées à d'autres ressources ★★★★★
Tim Berners-Lee, 2010
3. Le Web de données à la
rescousse
données en masse => problèmes techniques
d'exploitation des données ouvertes
Mécanismes du Web de données:
● Accessibilité à travers des identifiants
● Standardisation (RDF, micro-données HTML5)
● Entrepôt de données (SPARQL)
=> Contrôlables et Exploitables
4. Qu’est-ce que le Web des
données ?
Le Web de données (Linked Data) est une
initiative du W3C. Tous les éléments doivent
être représentés par des identifiants:
● uniques
● valides
● lisibles
● liés
5. W3C, standards et formats
Requêtes
SPARQL
Ontologie
OWL
Structuration des données
RDF
Sérialisation
Notation3
Identification
IRI
Alphabet
UNICODE
7. Resource Description
Framework
● Un document structuré en RDF décrit les
ressources et leurs métadonnées
● permet le traitement automatique des
données
● Un document structuré en RDF est constitué
d'un ensemble de triplets.
8. Triplet RDF
Un triplet RDF est une association:
(sujet, prédicat, objet)
● sujet: ressource à décrire ;
● prédicat : type de propriété applicable;
● objet: donnée ou une autre ressource :
valeur de la propriété.
9. Triplet RDF
Un triplet RDF est une association:
(sujet, prédicat, objet)
● sujet: IRI ;
● prédicat : IRI;
● objet: valeur ou IRI.
12. Le protocole SPARQL
● SPARQL (SPARQL Protocol and RDF Query
Language) est un langage de requêtes pour
interroger des données de type RDF.
● C'est l'une des couches pour la mise en œuvre du
Web sémantique
● Trois recommandations W3C:
● Langage de requête SPARQL
● Formatage des donnes résultats
● Protocole d'accès
14. Type de requêtes SPARQL
● Lecture (SELECT)
● Ecriture (INSERT/DELETE DATA)
● Découverte prédicats et types (DESCRIBE)
● Exportation (CONSTRUCT) aux formats (N3,
JSON, XML, RDF)
15. Triplesores SPARQL
● Un triplestore est une base de données
conçue pour le stockage et la récupération de
données RDF
● contrairement à une base de données
relationnelle, un triplestore ne stocke qu'un
seul type de données : le triplet
● Exemple : 4store, Sesame, Jena ...
16. Avantages
● offrir une interopérabilité non seulement au niveau des
services mais aussi au niveau des données
● offre le même usage que SQL, mais en respectant les
standards du W3C
● une application pourra interroger à l'avenir n'importe quel
serveur SPARQL sans se soucier du constructeur
● SPARQL permet de découvrir la structure d'une base de
données pour répondre à des questions complexes