Diese Präsentation wurde erfolgreich gemeldet.
Wir verwenden Ihre LinkedIn Profilangaben und Informationen zu Ihren Aktivitäten, um Anzeigen zu personalisieren und Ihnen relevantere Inhalte anzuzeigen. Sie können Ihre Anzeigeneinstellungen jederzeit ändern.

Le Matterhorn RDF Data Model

575 Aufrufe

Veröffentlicht am

"Le Matterhorn RDF Data Model: Implémentation des modèles d’information OAIS et RiC dans le cadre des technologies sémantiques"
Présentation donnée au Forum des archivistes de l'arc lémanique, le 11 septembre 2017.
Publiée en ligne avec l'aimable autorisation de Tobias Wildi et Alain Dubois.

Veröffentlicht in: Technologie
  • Als Erste(r) kommentieren

  • Gehören Sie zu den Ersten, denen das gefällt!

Le Matterhorn RDF Data Model

  1. 1. Le Matterhorn RDF Data Model: Implémentation des modèles d’information OAIS et RiC dans le cadre des technologies sémantiques Alain Dubois, Tobias Wildi 1
  2. 2. Depuis 10 ans, deux axes de réflexion • Le cœur de la réflexion porte sur la question de la préservation numérique (garantie de la qualité de l’information durant tout son cycle de vie, notamment en termes de contextualisation) • Le réflexion est conduite en se fondant sur les normes et standards internationaux 2
  3. 3. La pérennisation des données • Modèle de référence OAIS 3
  4. 4. Une description archivistique contextualisée • Normes de description du CIA 4
  5. 5. 2012 – Matterhorn METS Profile 5
  6. 6. Matterhorn METS Profile • Première concrétisation des modèles conceptuels pérennisation / contextualisation • Une boîte à outils composée – d’une Metadata-Map – du Matterhorn METS Profile – d’outils open source (docuteam packer, docuteam feeder) 6
  7. 7. Matterhorn METS Profile: la Metadata-Map 7
  8. 8. Matterhorn METS Profile • Le Matterhorn METS Profile – enregistré en 2012 auprès de la LoC comme un profil générique pouvant être utilisé par des institution de conservation du patrimoine gérant des fonds d’archives (archives, bibliothèques et musées) • Des outils open source (docuteam packer, docuteam feeder), utilisé dans 20 services d’archives environ • Utilisation du XML pour la sérialisation 8
  9. 9. Points d’amélioration et de développement • Evolution du Matterhorn METS Profile qui tienne compte des possibilités offertes par le Linked Data et l’Open Linked Data et dont le cœur porte sur la préservation numérique • Améliorer la contextualisation des archives en les intégrant à des ensemble plus grand (bibliothèques, Wikipedia, etc.) • Réutiliser des ressources existantes pour rendre la description archivistique plus précise 9
  10. 10. Nouvelles technologies • Absence de modélisation des liens entre les différents standards du CIA • Le XML ne suffit plus pour relier des ressources • Les technologies sémantiques tendent à devenir la norme en matière de description archivistique et bibliothéconomique 10
  11. 11. Réflexions de l’EGAD depuis 2012 • Plus qu’une norme de description • Centré sur le concept du Records in Context 11
  12. 12. Un monde en mutation qui nécessite une révision • Le contexte archivistique, marqué par les travaux de l’EGAD et un développement technologique continu, nécessite une révision du Matterhorn METS Profile • Choix de standards utilisables pour pérenniser l’information, quelle que soit l’institution qui la gère (archives, bibliothèques, musées, centres de recherche, centres de documentation…) 12
  13. 13. Deux approches possibles • Approche spécifique de l’EGAD: développer un standard RDF spécifique aux Archives, mais avec des passerelles vers les standards des bibliothèques et musées • Approche généraliste du Matterhorn RDF Data Model: se fonder sur des standards RDF existants et répandus au niveau international, qui permettent de modéliser le Records in Context • Contrairement à l’approche de l’EGAD, le Matterhorn RDF Data Model se fonde sur des ontologies déjà existantes. Il suit ainsi les W3C Best Practices: «It is best practice to use or extend an existing vocabulary before creating a new vocabulary.» 13
  14. 14. 2017 – Matterhorn RDF Data Model 14
  15. 15. Matterhorn RDF Data Model 15 Event premis:Event Agent (technical) premis:Agent Rights premis:RightsStatement pcdm:hasRelatedObject pcdm:hasMember Activity, Function bpmn:Activity prov:has_provenance File pcdm:File prem is:hasLinkingO bject premis:hasEventRelatedAgent premis:hasEventType prem is:hasAgentRelatedRights prem is:hasRightsStatem ent pcdm:hasFile Agent (description) rdac:C10002 Object, Entity (description) pcdm:Object Technical Metadata Descriptive Metadata RiC-E1 Record RiC-E2 Record Component RiC-E3 Record Set RiC-E4 Agent RiC-E5 Occupation RiC-E6 Position RiC-E7 Function RiC-E8 Function (Abstract) RiC-E9 Activity RiC-E10 Mandate Object, Entity (technical) premis:Object RiC-E28 History
  16. 16. Matterhorn RDF Data Model 16
  17. 17. Matterhorn RDF Data Model 17 Une grande partie des attributs (properties) utilisés dans le Matterhorn RDF Data Model est tirée du standard RDA (Resource Description and Access)
  18. 18. 18
  19. 19. Exemple 1: Base de données d’inventaires vers métadonnées descriptives Des tests sont actuellement en cours pour produire automatiquement des triples à partir de descriptions d’archives docuteam curator en vue de verser dans aLOD (www.alod.ch) l’inventaire des Archives de la Ville de Baden. Processus: • nous partons de la base de données «brute» et utilisons le standard «RDB to RDF Mapping Language” (R2RML) pour passer d’un modèle de données à l’autre • sur conseil de l’entreprise Zazuko, qui a fait la réalisation technique du projet aLOD, nous avons testé une syntaxe en language Turtle pour décrire le mapping de la base de données vers des triples RDF. Celle-ci tire partie d’un triple-store commercial nommé Stardog. 19
  20. 20. Table Archival Description (docuteam curator MySQL) Notices de description d’archive structurées selon le standard ISAD(G). D’autres tables de la même base font le lien avec des notices d’autorités (ISAAR-CPF). 20
  21. 21. Triples qui expriment chacun un object 21 URI d’une série d’“Objects” après transformation en RDF
  22. 22. Triples qui expriment les champs ISAD(G) sous forme de propriétés d’une ressource 22 <http://data.alod.ch/stabaden/record/6251> ?p ?o
  23. 23. Même principe pour une notice d’autorité structurée selon ISAAR-CPF 23 <http://data.alod.ch/stabaden/person/900> ?p ?o RDA „has date of death“ RDA „has date of birth“
  24. 24. Exemple 2: Conversion Matterhorn METS à Matterhorn RDF (dossier administratif) 24
  25. 25. 25
  26. 26. Et après? Cross-over Matterhorn RDF vers RiC-O Réaliser un fichier de mapping qui permette de transformer des données sémantiques décrites en utilisant le Matterhorn RDF Model pour les exprimer en utilisant la future ontologie du Records in Context. Cela pour démontrer que le modèle de données RDF est bien moins rigide que les modèles de données standards, tels qu’une bases de données relationnelle ou une sérialisation des données en XML. 26
  27. 27. En guise de conclusion • La préservation numérique est un work in progress • Notre objectif est d’apporter une contribution aux réflexions en cours au sein du Conseil international des archives • Notre but n’est pas de développer un modèle alternatif • Nous restons en discussion avec différents membres de l’EGAD 27
  28. 28. Coordonnées Alain Dubois Archiviste cantonal Rue de Lausanne 45 1950 Sion +41 27 606 46 05 alain.dubois@admin.vs.ch Tobias Wildi Im Langacker 16 5405 Baden-Dättwil +41 56 470 03 37 t.wildi@docuteam.ch

×