Le but de ce tutoriel est de présenter de manière concrète RDFa, recommandation du W3C qui permet d'exprimer des triplets RDF dans des pages Web HTML. A travers différents exemples, nous montrons pas à pas les principes de cette syntaxe de RDF revenant au passage sur les fondements du modèle de triplet. Puis, nous abordons différents exemples d'exploitation des données en RDFa tant du point de vue du site Web en lui-même, qu'au niveau du navigateur que des moteurs de recherche (Google rich snippet, Yahoo SearchMonkey, projet Isidore du CNRS). Dans la continuité, nous ouvrons la discussion sur les perspectives ouvertes par RDFa dans le domaine de l'optimisation du référencement, en particulier dans le E-commerce.
3. Le code HTML d’une page Web <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr"> <head> <title>Présentation de Gautier Poupeau</title> </head> <body> <p>Je m'appelle Gautier Poupeau.</p> <p>Mon anniversaire est le 19 mai.</p> <p> Je suis passionné par les technologies du Web sémantique. </p> <p> Je tiens d'ailleurs un blog sur ces questions : <a href="http://www.lespetitescases.net">Les petites cases</a> </p> <p>J'appartiens à la communauté des professionnels de l'information composée de :</p> <ul> <li> <a href="http://www.figoblog.org">Emmanuelle Bermès</a> ; </li> <li> <a href="http://stephanepouyllau.org/">Stéphane Pouyllau</a>. </li> </ul> </body> </html>
5. La même page Web vu par un moteur de recherche <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr"> <head> <title> Présentation de Gautier Poupeau </title> </head> <body> <p> Je m'appelle Gautier Poupeau. </p> <p> Mon anniversaire est le 19 mai. </p> <p> Je suis passionné par les technologies du Web sémantique. </p> <p> Je tiens d'ailleurs un blog sur ces questions : <a href="http://www.lespetitescases.net">Les petites cases</a> </p> <p> J'appartiens à la communauté des professionnels de l'information composée de : </p> <ul> <li> <a href="http://www.figoblog.org">Emmanuelle Bermès</a> ; </li> <li> <a href="http://stephanepouyllau.org/">Stéphane Pouyllau</a>. </li> </ul> </body> </html>
6. Et pourtant, il existe beaucoup d’informations <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="fr"> <head> <title>Présentation de Gautier Poupeau</title> </head> <body> <p>Je m'appelle Gautier Poupeau.</p> <p>Mon anniversaire est le 19 mai.</p> <p> Je suis passionné par les technologies du Web sémantique. </p> <p> Je tiens d'ailleurs un blog sur ces questions : <a href="http://www.lespetitescases.net">Les petites cases</a> </p> <p>J'appartiens à la communauté des professionnels de l'information composée de :</p> <ul> <li> <a href="http://www.figoblog.org">Emmanuelle Bermès</a> ; </li> <li> <a href="http://stephanepouyllau.org/">Stéphane Pouyllau</a>. </li> </ul> </body> </html> Cette page décrit une personne Mon nom Ma date anniversaire Ma passion L’URL de mon blog Le titre de mon blog mes connaissances
7. Comment exprimer une donnée pour la machine ? Chien Animal Une série de signes reliés forme une donnée Machine doit comprendre la donnée
8. Comment exprimer une donnée pour la machine ? Chien Animal Une série de signes reliés forme une donnée La donnée est encodée dans le cadre d’un document Machine doit comprendre la donnée Ne comprend pas la donnée mais qu’il s’agit d’un paragraphe De plus, la donnée est toujours vraie même en dehors de ce document. <html> <head> <title>Le chien</title> </head> <body> <p> le chien est un animal </p> </body> </html>
9. Comment exprimer une donnée pour la machine ? Chien Animal Une série de signes reliés forme une donnée La donnée est encodée dans le cadre d’un document Machine doit comprendre la donnée Ne comprend pas la donnée mais qu’il s’agit d’un paragraphe De plus, la donnée est toujours vraie même en dehors de ce document. La donnée elle-même est encodée sous la forme d’un triplet. La machine peut traiter et analyser la donnée car elle est encodée selon une logique formelle. <html> <head> <title>Le chien</title> </head> <body> <p> le chien est un animal </p> </body> </html> Sujet prédicat Objet chien animal est
10. Comment exprimer une donnée pour la machine ? Chien Animal Une série de signes reliés forme une donnée La donnée est encodée dans le cadre d’un document Machine doit comprendre la donnée Ne comprend pas la donnée mais qu’il s’agit d’un paragraphe De plus, la donnée est toujours vraie même en dehors de ce document. La donnée elle-même est encodée sous la forme d’un triplet. La machine peut traiter et analyser la donnée car elle est encodée selon une logique formelle. <html> <head> <title>Le chien</title> </head> <body> <p> le chien est un animal </p> </body> </html> Sujet prédicat Objet Sujet prédicat prédicat chien animal est RDF, un modèle pour encoder les données structurées
11.
12. RDFa : la rencontre entre RDF et XML Dès 2004, Mark Birbeck propose un mécanisme pour ajouter des triplets RDF dans HTML. Initialement prévu pour XHTML 2, une recommandation est publiée pour XHTML 1 en 2007. XHTML RDF RDFa
17. FOAF : Friend Of A Friend http://xmlns.com/foaf/spec/ Ontologie créée et maintenue par Dan Brickley et Libby Miller
18. RDFa <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <html xmlns ="http://www.w3.org/1999/xhtml" xmlns:dc="http://purl.org/dc/terms/" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xml:lang="fr"> <head typeof="foaf:PersonalProfileDocument"> <title>Profil RDFa à titre d'exemple</title> <meta property="dc:title" content="Mon profil FOAF"/> <link rel="foaf:maker" href="#GP"/> <link rel="foaf:primaryTopic" href="#GP"/> </head> <body> <div typeof="foaf:Person" about="#GP"> <p>Je m'appelle <span property="foaf:name" datatype="xsd:string">Gautier Poupeau</span>. </p> Déclaration de la DTD spécifique XHTML + RDFa
19. RDFa <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <html xmlns ="http://www.w3.org/1999/xhtml" xmlns:dc="http://purl.org/dc/terms/" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xml:lang="fr"> <head typeof="foaf:PersonalProfileDocument"> <title>Profil RDFa à titre d'exemple</title> <meta property="dc:title" content="Mon profil FOAF"/> <link rel="foaf:maker" href="#GP"/> <link rel="foaf:primaryTopic" href="#GP"/> </head> <body> <div typeof="foaf:Person" about="#GP"> <p>Je m'appelle <span property="foaf:name" datatype="xsd:string">Gautier Poupeau</span>. </p> Déclaration des espaces de noms et des préfixes
20. RDFa <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <html xmlns ="http://www.w3.org/1999/xhtml" xmlns:dc="http://purl.org/dc/terms/" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xml:lang="fr"> <head typeof="foaf:PersonalProfileDocument"> <title>Profil RDFa à titre d'exemple</title> <meta property="dc:title" content="Mon profil FOAF"/> <link rel="foaf:maker" href="#GP"/> <link rel="foaf:primaryTopic" href="#GP"/> </head> <body> <div typeof="foaf:Person" about="#GP"> <p>Je m'appelle <span property="foaf:name" datatype="xsd:string">Gautier Poupeau</span>. </p> Déclaration de la langue donc récupéré pour tous les littéraux
21. RDFa <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <html xmlns ="http://www.w3.org/1999/xhtml" xmlns:dc="http://purl.org/dc/terms/" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xml:lang="fr"> <head typeof="foaf:PersonalProfileDocument"> <title>Profil RDFa à titre d'exemple</title> <meta property="dc:title" content="Mon profil FOAF"/> <link rel="foaf:maker" href="#GP"/> <link rel="foaf:primaryTopic" href="#GP"/> </head> <body> <div typeof="foaf:Person" about="#GP"> <p>Je m'appelle <span property="foaf:name" datatype="xsd:string">Gautier Poupeau</span>. </p> Pas de déclaration URI du sujet donc l’URL de la page par défaut
22. RDFa <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <html xmlns ="http://www.w3.org/1999/xhtml" xmlns:dc="http://purl.org/dc/terms/" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xml:lang="fr"> <head typeof="foaf:PersonalProfileDocument"> <title>Profil RDFa à titre d'exemple</title> <meta property="dc:title" content="Mon profil FOAF"/> <link rel="foaf:maker" href="#GP"/> <link rel="foaf:primaryTopic" href="#GP"/> </head> <body> <div typeof="foaf:Person" about="#GP"> <p>Je m'appelle <span property="foaf:name" datatype="xsd:string">Gautier Poupeau</span>. </p> Attribut @typeof pour indiquer le type de la ressource = rdf:type
23. RDFa <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <html xmlns ="http://www.w3.org/1999/xhtml" xmlns:dc="http://purl.org/dc/terms/" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xml:lang="fr"> <head typeof="foaf:PersonalProfileDocument"> <title>Profil RDFa à titre d'exemple</title> <meta property="dc:title" content="Mon profil FOAF"/> <link rel="foaf:maker" href="#GP"/> <link rel="foaf:primaryTopic" href="#GP"/> </head> <body> <div typeof="foaf:Person" about="#GP"> <p>Je m'appelle <span property="foaf:name" datatype="xsd:string">Gautier Poupeau</span>. </p> Attribut @property si objet = Littéral (ici dans attribut @content car dans l’en-tête HTML)
25. RDFa <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <html xmlns ="http://www.w3.org/1999/xhtml" xmlns:dc="http://purl.org/dc/terms/" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xml:lang="fr"> <head typeof="foaf:PersonalProfileDocument"> <title>Profil RDFa à titre d'exemple</title> <meta property="dc:title" content="Mon profil FOAF"/> <link rel="foaf:maker" href="#GP"/> <link rel="foaf:primaryTopic" href="#GP"/> </head> <body> <div typeof="foaf:Person" about="#GP"> <p>Je m'appelle <span property="foaf:name" datatype="xsd:string">Gautier Poupeau</span>. </p> Attribut @about pour déclarer l’URI d’un sujet différent de l’URL de la page
26. RDFa <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <html xmlns ="http://www.w3.org/1999/xhtml" xmlns:dc="http://purl.org/dc/terms/" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xml:lang="fr"> <head typeof="foaf:PersonalProfileDocument"> <title>Profil RDFa à titre d'exemple</title> <meta property="dc:title" content="Mon profil FOAF"/> <link rel="foaf:maker" href="#GP"/> <link rel="foaf:primaryTopic" href="#GP"/> </head> <body> <div typeof="foaf:Person" about="#GP"> <p>Je m'appelle <span property="foaf:name" datatype="xsd:string">Gautier Poupeau</span>. </p> Utilisation de la hiérarchie de XHTML pour indiquer les différents triplets dont l’URI est sujet
27. RDFa <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <html xmlns ="http://www.w3.org/1999/xhtml" xmlns:dc="http://purl.org/dc/terms/" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xml:lang="fr"> <head typeof="foaf:PersonalProfileDocument"> <title>Profil RDFa à titre d'exemple</title> <meta property="dc:title" content="Mon profil FOAF"/> <link rel="foaf:maker" href="#GP"/> <link rel="foaf:primaryTopic" href="#GP"/> </head> <body> <div typeof="foaf:Person" about="#GP"> <p>Je m'appelle <span property="foaf:name" datatype="xsd:string">Gautier Poupeau</span>. </p> Attribut @datatype pour indiquer le type de données
28. RDFa Mon anniversaire est le <span property="foaf:birthday" content="05-19" xml:lang="en">19 mai</span> </p> <p> Je suis passionné par les technologies du <span rel="foaf:interest" href="http://dbpedia.org/resource/Semantic_Web">Web sémantique</span>. </p> <p>Je tiens d'ailleurs un blog sur ces questions : <span rel="foaf:weblog"><a href="http://www.lespetitescases.net" property="dc:title">Les petites cases</a></span> </p> <p>J'appartiens à la communauté des professionnels de l'information composée de :</p> <ul rel="foaf:knows"> <li typeof="foaf:person" about="http://www.figoblog.org/foaf.rdf#EB"> <a property="foaf:name" rel="foaf:homepage" href="http://www.figoblog.org">Emmanuelle Bermès</a> </li> <li typeof="foaf:person"> <a property="foaf:name" rel="foaf:homepage" href="http://stephanepouyllau.org/">Stéphane Pouyllau</a> </li> </ul> </div> </body> </html> Attribut @content pour indiquer contenu différent de l’élément
29. RDFa Mon anniversaire est le <span property="foaf:birthday" content="05-19" xml:lang="en">19 mai</span> </p> <p> Je suis passionné par les technologies du <span rel="foaf:interest" href="http://dbpedia.org/resource/Semantic_Web">Web sémantique</span>. </p> <p>Je tiens d'ailleurs un blog sur ces questions : <span rel="foaf:weblog"><a href="http://www.lespetitescases.net" property="dc:title">Les petites cases</a></span> </p> <p>J'appartiens à la communauté des professionnels de l'information composée de :</p> <ul rel="foaf:knows"> <li typeof="foaf:person" about="http://www.figoblog.org/foaf.rdf#EB"> <a property="foaf:name" rel="foaf:homepage" href="http://www.figoblog.org">Emmanuelle Bermès</a> </li> <li typeof="foaf:person"> <a property="foaf:name" rel="foaf:homepage" href="http://stephanepouyllau.org/">Stéphane Pouyllau</a> </li> </ul> </div> </body> </html> Attribut @rel et @href pour indiquer triplet avec ressource en objet
30. RDFa Mon anniversaire est le <span property="foaf:birthday" content="05-19" xml:lang="en">19 mai</span> </p> <p> Je suis passionné par les technologies du <span rel="foaf:interest" href="http://dbpedia.org/resource/Semantic_Web">Web sémantique</span>. </p> <p>Je tiens d'ailleurs un blog sur ces questions : <span rel="foaf:weblog"><a href="http://www.lespetitescases.net" property="dc:title">Les petites cases</a></span> </p> <p>J'appartiens à la communauté des professionnels de l'information composée de :</p> <ul rel="foaf:knows"> <li typeof="foaf:person" about="http://www.figoblog.org/foaf.rdf#EB"> <a property="foaf:name" rel="foaf:homepage" href="http://www.figoblog.org">Emmanuelle Bermès</a> </li> <li typeof="foaf:person"> <a property="foaf:name" rel="foaf:homepage" href="http://stephanepouyllau.org/">Stéphane Pouyllau</a> </li> </ul> </div> </body> </html> Utilisation de la hiérarchie pour indiquer triplet sur une ressource elle-même objet avec le prédicat foaf:weblog
31. RDFa Mon anniversaire est le <span property="foaf:birthday" content="05-19" xml:lang="en">19 mai</span> </p> <p> Je suis passionné par les technologies du <span rel="foaf:interest" href="http://dbpedia.org/resource/Semantic_Web">Web sémantique</span>. </p> <p>Je tiens d'ailleurs un blog sur ces questions : <span rel="foaf:weblog"><a href="http://www.lespetitescases.net" property="dc:title">Les petites cases</a></span> </p> <p>J'appartiens à la communauté des professionnels de l'information composée de :</p> <ul rel="foaf:knows"> <li typeof="foaf:person" about="http://www.figoblog.org/foaf.rdf#EB"> <a property="foaf:name" rel="foaf:homepage" href="http://www.figoblog.org">Emmanuelle Bermès</a> </li> <li typeof="foaf:person"> <a property="foaf:name" rel="foaf:homepage" href="http://stephanepouyllau.org/">Stéphane Pouyllau</a> </li> </ul> </div> </body> </html> Utilisation de la hiérarchie pour indiquer triplet sur une ressource elle-même objet avec le prédicat foaf:knows
32. RDFa Mon anniversaire est le <span property="foaf:birthday" content="05-19" xml:lang="en">19 mai</span> </p> <p> Je suis passionné par les technologies du <span rel="foaf:interest" href="http://dbpedia.org/resource/Semantic_Web">Web sémantique</span>. </p> <p>Je tiens d'ailleurs un blog sur ces questions : <span rel="foaf:weblog"><a href="http://www.lespetitescases.net" property="dc:title">Les petites cases</a></span> </p> <p>J'appartiens à la communauté des professionnels de l'information composée de :</p> <ul rel="foaf:knows"> <li typeof="foaf:person" about="http://www.figoblog.org/foaf.rdf#EB"> <a property="foaf:name" rel="foaf:homepage" href="http://www.figoblog.org">Emmanuelle Bermès</a> </li> <li typeof="foaf:person"> <a property="foaf:name" rel="foaf:homepage" href="http://stephanepouyllau.org/">Stéphane Pouyllau</a> </li> </ul> </div> </body> </html> Même chose mais ici on a un nœud blanc
35. RDFa distiller RDFa Distiller est un service en ligne du W3C mis au point par Ivan Herman qui extrait les annotations RDFa d’une page Web pour en faire un flux RDF/XML, Turtle, N-triples http://www.w3.org/2007/08/pyRdfa/
43. Interactions entre les sites : Open Graph Protocol Système basé sur RDFa mis au point par Facebook pour enrichir l’affichage des sélections des utilisateurs avec le bouton « I like/j’aime » <html xmlns="http://www.w3.org/1999/xhtml" xmlns:og="http://ogp.me/ns#" xmlns:fb="http://www.facebook.com/2008/fbml"> <head> <title>The Rock (1996)</title> <meta property="og:title" content="The Rock"/> <meta property="og:type" content="movie"/> <meta property="og:url" content="http://www.imdb.com/title/tt0117500/"/> <meta property="og:image" content="http://ia.media-imdb.com/rock.jpg"/> <meta property="og:site_name" content="IMDb"/> <meta property="fb:admins" content="USER_ID"/> <meta property="og:description" content="A group of U.S. Marines, under command of a renegade general, take over Alcatraz and threaten San Francisco Bay with biological weapons."/> ... </head> ... </html>
44. Interactions avec le navigateur : les modules Des modules de navigateurs exploitent les annotations RDFa, quelques exemples : RDFa Developper (Firefox) Operator (Firefox) Amazon Checker (Chrome)
45. Interaction dans le même site : Knowledge box <span id="css" about="#css" rel="owl:sameAs" href="http://dbpedia.org/resource/Cascading_Style_Sheets"> CSS </span> Le code source original Interrogation en sparql Affichage du résultat dans une bulle via Ajax Knowledge box est un module Drupal 6 qui s’appuie sur les annotations RDFa pour afficher des définitions de termes ou d’expressions. http://www.lespetitescases.net/knowledge-box-reloaded
46. Interaction dans le même site : RDFQuery RDFQuery est un module Jquery mis au point par Jeni Tennison qui permet d’exploiter l’encodage RDFa au sein d’une page Web (Requête, application de règles) http://code.google.com/p/rdfquery/
48. RDFa à la conquête des CMS Les annotations RDFa peuvent facilement être générées automatiquement à partir des données structurées stockées dans les bases de données. Il est donc logique que les CMS ajoutent un support natif de RDFa ou via des plugins dédiés. Drupal 7 Goodrelations-for-oscommerce Semantium_MSemanticBasic Goodrelations for WP e-Commerce
49. RDFa 1.1 Objectif du groupe de travail du W3C : mettre au point une API, simplifier la pratique et mieux définir la sémantique des attributs RDFa pour XML. Cf. la présentation d’Ivan Herman : http://www.w3.org/2011/Talks/0117-Paris-IH/
50.
Hinweis der Redaktion
RDF peut être « sérialisé », c’est-à-dire écrit en XML. Dans ce cas, c’est évidemment la syntaxe qui nous intéresse et non le modèle XML. Pour autant, un arbre étant un type particulier de graphes, il « suffit » de respecter quelques règles de base pour écrire du RDF en XML. Il est à noter qu’il n’existe aucune DTD ou schéma XML pour valider un fichier RDF en XML, ce qui est compréhensible, puisque l’écriture d’un graphe RDF peut prendre plusieurs formes dans l’arbre XML et que l’attribution d’une URI est complètement libre. L’élément racine est toujours RDF. Le système des espaces de noms qui désignent en XML un élément rattaché à un schéma XML, constitue pour RDF un mécanisme d’abréviations des prédicats. Une ressource décrite est toujours introduite par l’élément <rdf:Description>, l’URI de la resource (le sujet) dans l’attribut @rdf:about. Les éléments enfants sont les prédicats qui se rattachent à cette même ressource. Si l’objet est un litéral, il est représenté sous la forme de la valeur d’un élément. Si l’objet est une ressource, son URI est indiqué dans l’attribut @rdf:resource.
RDFa est une recommandation du W3C depuis octobre 2008 (cf. les traductions en français : http://www.yoyodesign.org/doc/w3c/rdfa-syntax/Overview.html et http://www.yoyodesign.org/doc/w3c/xhtml-rdfa-primer/) dont le but est d’exprimer des triplets en RDF dans des pages Web grâce à l’ajout d’attributs spécifiques à XHTML. Les attributs ajoutés sont les suivants : @typeof : permet d’indiquer le type de la ressource ; @about : permet d’indiquer l’URI de la ressource en sujet ; @rel : permet d’exprimer le prédicat lorsque l’objet est une ressource ; @href : permet d’indiquer l’URI de la ressource en objet ; @property : permet d’indiquer le prédicat lorsque l’objet est un litéral ; @content : permet d’indiquer l’objet lorsque l’objet est un litéral, en son absence, le contenu de l’élément qui porte l’attribut @property est considéré comme l’objet.