SlideShare ist ein Scribd-Unternehmen logo
1 von 22
Downloaden Sie, um offline zu lesen
Data Archiving and Networked Services



 Clarifier le sens de vos
données publiques avec
   le Web de données
          Christophe Guéret (@cgueret)

 Webinar LOD@AIMS, January 22, 2013



DANS is een instituut van KNAW en NWO
Le Web de données
● Publier des données sur le Web

● Publication selon des principes simples:
  ○ Décrire des ressources identifiées par des URI
    (addresses Web)
  ○ Connecter les ressources avec des liens typés


● Quel est l'avantage? Pourquoi publier les
  données de cette façon?
Prenons un exemple...
● Implantation d'un projet immobilier dans la
  commune de "Vouvray" (Indre et Loire, France)

● Des informations sont nécessaires sur
  ○   Les conditions météo de la zone
  ○   L'utilisation faite des sols dans les environs
  ○   La faune et la flore locale
  ○   Les données liées à la propriété
  ○   ...
La recherche de données
● De nombreuses données gouvernementales
  sont qualifiées d' "Open Data" et par
  conséquent libres d'accès

● Processus d'intégration de données
  ○ Chercher des sources de données
  ○ Acquérir et intégrer les données
  ○ Publier un document de synthèse
Les données (fictives) récupérées

                        Area                 City            Land use

                 Indre et Loire     Vouvray                Vineyard




                   Parcelle           Feuille               Superficie

                 1388             000G02                 1664 m2




                         Ville                      Ensoleillement

                 Vouvray                   3000h / an
L'intégration s'avère difficile...
    Area             City     Land use

Indre et Loire     Vouvray    Vineyard

Parcelle         Feuille     Superficie          Ville   Zone       ?

1388         000G02         1664 m2
                                          +   Vouvray    ?      ?

  Ville            Ensoleillement

Vouvray    3000h / an




● Problèmes
       ○ Langue : "Area" = "Département" ?
       ○ Terminologie : "Parcelle", "Feuille" ?
       ○ Ambiguïté : "Vouvray" = "Vouvray" ?
Quel est le problème exactement?

● Toutes les sources de données publient des
  données ouvertes et facilement utilisables

● Mais...
   ○ La signification (sémantique) des données n'est pas
     claire
   ○ Des noms ambigus sont utilisés


● Besoin de clarifier les concepts utilisés et les
  entités auxquelles il est fait référence
Une solution : uniformiser
● Créer un système d'information uniforme
  ○ Les sources d'information saisissent leurs données
  ○ Les concepts employés sont identiques
  ○ Les entités référencées sont contrôlées


● De nombreux exemples

                                               ...


● Solution dédiée et générique
Une autre solution : le Web
● Le Web de données (WoD) permet la
  publication décentralisée de données

● Chaque jeu de données publié utilise
  ○ Un modèle basé sur des relations entre ressources
  ○ Des identifiants uniques à la place des mots
  ○ Un vocabulaire commun pour exprimer les relations


● Les identifiants des ressources sont des URI
Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
  http://dbpedia.org/resource/Vouvray

                          http://dbpedia.org/ontology/department

                             http://dbpedia.org/resource/Indre-et-Loire


● Description associée à une ressource
  http://dbpedia.org/resource/Vouvray
                                           http://xmlns.com/foaf/0.1/name

                                               Vouvray
Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
                  dbpedia-owl:department
dbpedia:Vouvray                            dbpedia:Indre-et-Loire




● Description associée à une ressource
                            foaf:name
dbpedia:Vouvray                              Vouvray
Triplets RDF - la grammaire du WoD
● Connection entre deux ressources
                  dbpedia-owl:department
dbpedia:Vouvray                            dbpedia:Indre-et-Loire

                       predicat
          sujet                                   objet


● Description associée à une ressource
                            foaf:name
dbpedia:Vouvray                              Vouvray
Triplets connectés = WoD

Le Web de documents   Le Web de données


                        r1                       r4


                             p1             p1

                                  r2             p3

                                       p2


                                       r3
Chacun contribue au WoD

                                           dbpedia:Indre-et-Loire



                                           dbpedia-owl:department

                     dbpedia:Vouvray

    gn:nearby
                                           wgs84_pos:lat

 geonames:8292345
                          wgs84_pos:long      47.41088


                    0.79892
Données de DBpedia

                                           dbpedia:Indre-et-Loire



                                           dbpedia-owl:department

                     dbpedia:Vouvray

    gn:nearby
                                           wgs84_pos:lat

 geonames:8292345
                          wgs84_pos:long      47.41088


                    0.79892
Données de Geonames

                                           dbpedia:Indre-et-Loire



                                           dbpedia-owl:department

                     dbpedia:Vouvray

    gn:nearby
                                           wgs84_pos:lat

 geonames:8292345
                          wgs84_pos:long      47.41088


                    0.79892
Revenons à notre exemple...
● Le travail du consommateur est simplifié
  ○ Les différent jeux de données sont interconnectés
  ○ Parcourir le WoD en partant du noeud "Vouvray" permet
    de trouver les informations nécessaires
  ○ Nul besoin de télécharger des jeux de données entiers !
    ■ Approche remplacée par des requêtes ciblées


● Les données publiées sont enrichies
  ○ Chaque contributeur apporte ses informations
Quelques exemples d'utilisation
Dévelopement et e-Gouvernance
● Interconnection de différents jeux de données
  permettant d'obtenir une vue globale:
SemanticXO et WikiReg
● Au lieu d'envoyer les données vers un
  serveur central, chaque XO est son propre
  serveur
RadioMarché
● Partage d'information relative au prix des
  produits agricoles (avec Agrovoc)
Participez!
● Publiez vos données sur le Web et
  connectez-les aux autres ressources

● En quelque étapes
  ○ Identifiez les ressources décrites par vos données
    (Villes, Personnes, Lieux, ...)
  ○ Assignez des URI aux ressources décrites
  ○ Choisissez des vocabulaires (DC, FOAF, Agrovoc,
    ...)
  ○ Décrivez vos ressources en RDF

Weitere ähnliche Inhalte

Mehr von AIMS (Agricultural Information Management Standards)

Mehr von AIMS (Agricultural Information Management Standards) (20)

Webinar@ASIRA: How to foster openness from an academic library
Webinar@ASIRA: How to foster openness from an academic library Webinar@ASIRA: How to foster openness from an academic library
Webinar@ASIRA: How to foster openness from an academic library
 
Webinar@ASIRA: A Practitioners Approach to Open Data for Agricultural Research
Webinar@ASIRA: A Practitioners Approach to Open Data for Agricultural Research Webinar@ASIRA: A Practitioners Approach to Open Data for Agricultural Research
Webinar@ASIRA: A Practitioners Approach to Open Data for Agricultural Research
 
Webinar@ASIRA: AuthorAID: Supporting Developing Country Researchers in Publis...
Webinar@ASIRA: AuthorAID: Supporting Developing Country Researchers in Publis...Webinar@ASIRA: AuthorAID: Supporting Developing Country Researchers in Publis...
Webinar@ASIRA: AuthorAID: Supporting Developing Country Researchers in Publis...
 
Webinar@ASIRA: Introduction to Using TEEAL to Access Agricultural Journals
Webinar@ASIRA: Introduction to Using TEEAL to Access Agricultural Journals Webinar@ASIRA: Introduction to Using TEEAL to Access Agricultural Journals
Webinar@ASIRA: Introduction to Using TEEAL to Access Agricultural Journals
 
Webinar@ASIRA: Access to Global Online Research in Agriculture (AGORA)
Webinar@ASIRA: Access to Global Online Research in Agriculture (AGORA) Webinar@ASIRA: Access to Global Online Research in Agriculture (AGORA)
Webinar@ASIRA: Access to Global Online Research in Agriculture (AGORA)
 
Webinar@ASIRA: AGRIS: Providing Access to Agricultural Research and Technolog...
Webinar@ASIRA: AGRIS: Providing Access to Agricultural Research and Technolog...Webinar@ASIRA: AGRIS: Providing Access to Agricultural Research and Technolog...
Webinar@ASIRA: AGRIS: Providing Access to Agricultural Research and Technolog...
 
Webinar@ASIRA: New Roles for Changing Times UNAM Subject Librarians in Context
Webinar@ASIRA: New Roles for Changing Times UNAM Subject Librarians in Context Webinar@ASIRA: New Roles for Changing Times UNAM Subject Librarians in Context
Webinar@ASIRA: New Roles for Changing Times UNAM Subject Librarians in Context
 
Webinar@ASIRA: Emerging Themes in Agricultural Research Publishing
Webinar@ASIRA: Emerging Themes in Agricultural Research PublishingWebinar@ASIRA: Emerging Themes in Agricultural Research Publishing
Webinar@ASIRA: Emerging Themes in Agricultural Research Publishing
 
Webinar@AIMS: OKAD & F1000Research: a very different approach to publishing a...
Webinar@AIMS: OKAD & F1000Research: a very different approach to publishing a...Webinar@AIMS: OKAD & F1000Research: a very different approach to publishing a...
Webinar@AIMS: OKAD & F1000Research: a very different approach to publishing a...
 
Using AGRIS as a portal of choice to access agricultural research and technol...
Using AGRIS as a portal of choice to access agricultural research and technol...Using AGRIS as a portal of choice to access agricultural research and technol...
Using AGRIS as a portal of choice to access agricultural research and technol...
 
Research4Life: La bibliothèque qui ouvre ses portes
Research4Life: La bibliothèque qui ouvre ses portesResearch4Life: La bibliothèque qui ouvre ses portes
Research4Life: La bibliothèque qui ouvre ses portes
 
Publishing skos concept schemes with skosmos
Publishing skos concept schemes with skosmosPublishing skos concept schemes with skosmos
Publishing skos concept schemes with skosmos
 
Research4Life: La biblioteca que abre puertas
Research4Life: La biblioteca que abre puertasResearch4Life: La biblioteca que abre puertas
Research4Life: La biblioteca que abre puertas
 
Research4Life: The library that opens doors
Research4Life: The library that opens doorsResearch4Life: The library that opens doors
Research4Life: The library that opens doors
 
Webinar@AIMS: Perspective on Big Data in the CGIAR
Webinar@AIMS: Perspective on Big Data in the CGIARWebinar@AIMS: Perspective on Big Data in the CGIAR
Webinar@AIMS: Perspective on Big Data in the CGIAR
 
Under-representation of local needs in the global south in mainstream bibliog...
Under-representation of local needs in the global south in mainstream bibliog...Under-representation of local needs in the global south in mainstream bibliog...
Under-representation of local needs in the global south in mainstream bibliog...
 
Webinar@AIMS: Big Data challenges and solutions in agricultural and environme...
Webinar@AIMS: Big Data challenges and solutions in agricultural and environme...Webinar@AIMS: Big Data challenges and solutions in agricultural and environme...
Webinar@AIMS: Big Data challenges and solutions in agricultural and environme...
 
Access to Global Online Research in Agriculture (AGORA) - Ayudando a construi...
Access to Global Online Research in Agriculture (AGORA) - Ayudando a construi...Access to Global Online Research in Agriculture (AGORA) - Ayudando a construi...
Access to Global Online Research in Agriculture (AGORA) - Ayudando a construi...
 
AIMS: How to get news and updates about information management in agricultura...
AIMS: How to get news and updates about information management in agricultura...AIMS: How to get news and updates about information management in agricultura...
AIMS: How to get news and updates about information management in agricultura...
 
Webinar@AIMS: How to practically support Open Access: Guidelines for Data Pro...
Webinar@AIMS: How to practically support Open Access: Guidelines for Data Pro...Webinar@AIMS: How to practically support Open Access: Guidelines for Data Pro...
Webinar@AIMS: How to practically support Open Access: Guidelines for Data Pro...
 

Clarifier le sens de vos données publiques avec le Web de données

  • 1. Data Archiving and Networked Services Clarifier le sens de vos données publiques avec le Web de données Christophe Guéret (@cgueret) Webinar LOD@AIMS, January 22, 2013 DANS is een instituut van KNAW en NWO
  • 2. Le Web de données ● Publier des données sur le Web ● Publication selon des principes simples: ○ Décrire des ressources identifiées par des URI (addresses Web) ○ Connecter les ressources avec des liens typés ● Quel est l'avantage? Pourquoi publier les données de cette façon?
  • 3. Prenons un exemple... ● Implantation d'un projet immobilier dans la commune de "Vouvray" (Indre et Loire, France) ● Des informations sont nécessaires sur ○ Les conditions météo de la zone ○ L'utilisation faite des sols dans les environs ○ La faune et la flore locale ○ Les données liées à la propriété ○ ...
  • 4. La recherche de données ● De nombreuses données gouvernementales sont qualifiées d' "Open Data" et par conséquent libres d'accès ● Processus d'intégration de données ○ Chercher des sources de données ○ Acquérir et intégrer les données ○ Publier un document de synthèse
  • 5. Les données (fictives) récupérées Area City Land use Indre et Loire Vouvray Vineyard Parcelle Feuille Superficie 1388 000G02 1664 m2 Ville Ensoleillement Vouvray 3000h / an
  • 6. L'intégration s'avère difficile... Area City Land use Indre et Loire Vouvray Vineyard Parcelle Feuille Superficie Ville Zone ? 1388 000G02 1664 m2 + Vouvray ? ? Ville Ensoleillement Vouvray 3000h / an ● Problèmes ○ Langue : "Area" = "Département" ? ○ Terminologie : "Parcelle", "Feuille" ? ○ Ambiguïté : "Vouvray" = "Vouvray" ?
  • 7. Quel est le problème exactement? ● Toutes les sources de données publient des données ouvertes et facilement utilisables ● Mais... ○ La signification (sémantique) des données n'est pas claire ○ Des noms ambigus sont utilisés ● Besoin de clarifier les concepts utilisés et les entités auxquelles il est fait référence
  • 8. Une solution : uniformiser ● Créer un système d'information uniforme ○ Les sources d'information saisissent leurs données ○ Les concepts employés sont identiques ○ Les entités référencées sont contrôlées ● De nombreux exemples ... ● Solution dédiée et générique
  • 9. Une autre solution : le Web ● Le Web de données (WoD) permet la publication décentralisée de données ● Chaque jeu de données publié utilise ○ Un modèle basé sur des relations entre ressources ○ Des identifiants uniques à la place des mots ○ Un vocabulaire commun pour exprimer les relations ● Les identifiants des ressources sont des URI
  • 10. Triplets RDF - la grammaire du WoD ● Connection entre deux ressources http://dbpedia.org/resource/Vouvray http://dbpedia.org/ontology/department http://dbpedia.org/resource/Indre-et-Loire ● Description associée à une ressource http://dbpedia.org/resource/Vouvray http://xmlns.com/foaf/0.1/name Vouvray
  • 11. Triplets RDF - la grammaire du WoD ● Connection entre deux ressources dbpedia-owl:department dbpedia:Vouvray dbpedia:Indre-et-Loire ● Description associée à une ressource foaf:name dbpedia:Vouvray Vouvray
  • 12. Triplets RDF - la grammaire du WoD ● Connection entre deux ressources dbpedia-owl:department dbpedia:Vouvray dbpedia:Indre-et-Loire predicat sujet objet ● Description associée à une ressource foaf:name dbpedia:Vouvray Vouvray
  • 13. Triplets connectés = WoD Le Web de documents Le Web de données r1 r4 p1 p1 r2 p3 p2 r3
  • 14. Chacun contribue au WoD dbpedia:Indre-et-Loire dbpedia-owl:department dbpedia:Vouvray gn:nearby wgs84_pos:lat geonames:8292345 wgs84_pos:long 47.41088 0.79892
  • 15. Données de DBpedia dbpedia:Indre-et-Loire dbpedia-owl:department dbpedia:Vouvray gn:nearby wgs84_pos:lat geonames:8292345 wgs84_pos:long 47.41088 0.79892
  • 16. Données de Geonames dbpedia:Indre-et-Loire dbpedia-owl:department dbpedia:Vouvray gn:nearby wgs84_pos:lat geonames:8292345 wgs84_pos:long 47.41088 0.79892
  • 17. Revenons à notre exemple... ● Le travail du consommateur est simplifié ○ Les différent jeux de données sont interconnectés ○ Parcourir le WoD en partant du noeud "Vouvray" permet de trouver les informations nécessaires ○ Nul besoin de télécharger des jeux de données entiers ! ■ Approche remplacée par des requêtes ciblées ● Les données publiées sont enrichies ○ Chaque contributeur apporte ses informations
  • 19. Dévelopement et e-Gouvernance ● Interconnection de différents jeux de données permettant d'obtenir une vue globale:
  • 20. SemanticXO et WikiReg ● Au lieu d'envoyer les données vers un serveur central, chaque XO est son propre serveur
  • 21. RadioMarché ● Partage d'information relative au prix des produits agricoles (avec Agrovoc)
  • 22. Participez! ● Publiez vos données sur le Web et connectez-les aux autres ressources ● En quelque étapes ○ Identifiez les ressources décrites par vos données (Villes, Personnes, Lieux, ...) ○ Assignez des URI aux ressources décrites ○ Choisissez des vocabulaires (DC, FOAF, Agrovoc, ...) ○ Décrivez vos ressources en RDF