SlideShare ist ein Scribd-Unternehmen logo
1 von 51
Les métadonnées de pérennisation et l’accès aux objets Formation PIN18-21 octobre 2011Pérennisation et communication de l'information numérique Pascal RomainIngénieur documentaireConseil général de la Gironde
Sommaire • Introduction sur les métadonnées définition, aspect théorique, processus de production • Le modèle d’information de l’OAIS: place des métadonnées dans le modèle  • Quelles métadonnées pour la pérennisation ? • Encoder et lier les métadonnées • L’accès à l’information grâce aux métadonnées
Introduction sur les métadonnées : définition Une métadonnée est une donnée servant à définir ou décrire une autre donnée. Porteuse d'information sur le contexte, le sens et la description de la ressource informationnelle portée par la donnée brute. μετά:préfixe grec indiquant l'auto-référence
Introduction sur les métadonnées : théorie Les métadonnées servent à définir et conserver l’intégrité, l’interprétation et l’interopérabilité des données.Elles transforment la donnée brute en donnée intelligible titre contexte temporel + = indexation lieu producteur indexation sujet contexte spatial
Introduction sur les métadonnées : théorie Dans le contexte numérique, des dispositifs de médiation sont nécessaires à l’appréhension de la donnée. Plusieurs communautés d’utilisateurs impliquent différents types de métadonnées Une métadonnée doit avoir une finalité et une utilité immédiate Des dispositifs d’encodage, de lecture  et de transmission conditionnent  notre accès aux données Attention : l’abus de métadonnées est dangereux pour la santé Des dispositifs de stockage, de sécurisationet de surveillance sont nécessaires à la conservation des données
Introduction sur les métadonnées: typologie On distingue généralement 4 grands types de métadonnées : métadonnées techniques:  décrivent les outils utilisés pour créer la donnée ainsi que le processus de création lui-même.  essentielles à l'intelligibilité de la donnée dans un contexte d'intermédiation numérique ainsi qu'à la qualité de la donnée dans une perspective de conservation sur le long terme. elles doivent suivre le cycle de vie de la donnée et permettre de garantir son intégrité métadonnées administratives utilisées pour définir les contrôles d'accès à la donnée décrivent les évènements et les agents qui interviennent sur la donnée ainsi que les conditions d'utilisation permettent de gérer la donnée et les liens qui peuvent exister entre ses éventuelles différentes représentations métadonnées descriptives utilisées pour préciser le contenu informatif de la donnée structurent les informations dont la donnée est porteuse en la reliant à des concepts ou à d'autres données permettent d'expliciter, de décrire, de contextualiser ou de hiérarchiser l'information métadonnées de structure enveloppes qui permettent de relier plusieurs types de métadonnée permettent de disposer d'un cadre de description commun favorisant l'interopérabilité de l'information
Introduction sur les métadonnées: production La production de métadonnées peut s'envisager à différentes étapes du cycle de vie du document porteur d'information : saisie à la création saisies au cours d'une étape de traitement de l'information extraction à posteriori : transformation, diffusion, récupération
Introduction sur les métadonnées: production lors de la création de la donnée des champs  permettent d'expliciter des informations de contexte, de provenance ou d'accès dans l'en-tête ou dans un fichier séparépar exemple champs IPTC dans les images ou métadonnées dans les en-têtes des documents bureautiques saisie à la création: saisie à posteriori: extraction automatisée: ->  la saisie à la création est l'opération la moins coûteuse et celle qui assure la meilleure qualité. à partir de la consultation des données, une description structurée de l'information est possiblepar exemple une notice documentaire, une fiche technique, des conditions d’accès ->compétences scientifiques coûteuses ; voire impossibilité de compléter l'information 			   il est possible de caractériser des éléments d'information automatiquementpar exemple par la mise en relation du contenu informationnel avec des référentiels de données ou des processus d’OCR -> l'extraction automatique est coûteuse pour parvenir à une qualité documentaire satisfaisante
Sommaire • Introduction sur les métadonnées   définition, aspect théorique, processus de production • Le modèle d’information de l’OAIS: place des métadonnées dans le modèle  • Quelles métadonnées pour la pérennisation ? • encoder et lier les métadonnées • L’accès à l’information grâce aux métadonnées
Modèle conceptuel organisé autour de 6 entités gérant les échanges d’informations au sein du système d’information Système d’information ouvert d’archivage OAIS
Le modèle d’information de l’OAIS: les paquets d’information ,[object Object]
le paquet d’information à soumettre : SIP (Submission Information Package)
le paquet d’information à archiver: AIP (Archival Information Package). Il peut exister sous 2 formes au sein de l’archive OAIS
Le paquet d’information à diffuser : DIP (Diffusion Information Package)
Les entités administration et planification sont chargés de gérer ces états en fonction des besoins,[object Object]
Le modèle d’information de l’OAIS: les paquets d’information: l’information l’Objet Information est composé d’un objet données (physique ou numérique) et de l’information de représentation qui permet d’interpréter les données sous la forme d’une information compréhensible.
Le modèle d’information de l’OAIS: les paquets d’information: la représentation ,[object Object]
types de données courants en informatique, comme des caractères, des nombres, des pixels, des tableaux
Information sémantique
informations complémentaires associées aux éléments de structure, telles que la langue dans laquelle l’objet est exprimé, les opérations réalisables sur chaque type de données et leurs corrélations, etc.
Autres
Identifiants d’autres standards comme la référence à la norme ASCIIbasé sur le principe de la récursivité
Le modèle d’information de l’OAIS: les paquets d’information: la pérennisation ,[object Object]
Information de contexteDécrit comment le contenu d’information s’articule avec d’autres informations à l’extérieur du paquet
Information d’identificationFournit un ou plusieurs identifiants ou systèmes d’identification
Information d’intégritéProtège le contenu d’information contre les altérations non documentées,[object Object]
Le modèle d’information de l’OAIS: le contexte du versement Le versement d’un document ou d’une archive dans une perspective de pérennisation implique la description de plusieurs éléments de contexte (l’environnement technique, la description du producteur, la description du contenu, les droits d’accès). Il mets en relation un agent versant et un agent recevant autour d’un versement comprenant des objets en relation
Le modèle d’information de l’OAIS: le contexte de la gestion (ou archivage) La gestion et le stockage impliquent la description d’évènements (l’analyse, l’enrichissement, le stockage, la migration) dont la responsabilité incombe à l’entité OAIS. Ces processus sont complexes et nécessitent la description des objets à conserver et à diffuser
Le modèle d’information de l’OAIS: le contexte d’administration L’administration dans le temps de l’archive nécessite le suivi et la modification des événements qui affectent l’information. Une veille technologique est nécessaire pour garantir l’accès des agents habilités au cours du cycle de vie des objets informationnels
Le modèle d’information de l’OAIS: le contexte de l’accès L’accès aux informations nécessite l’enrichissement et la mise en relation des objets avec d’autres sources d’explicitation  Les communautés d’agents expriment des besoins qui doivent être pris en compte sans compromettre l’intégrité de l’entité OAIS
Le modèle d’information de l’OAIS: la structuration des méta-données ,[object Object]
L’objectif est de conserver la richesse de l’information et sa traçabilité,[object Object]
Quelle métadonnées pour la pérennisation ?Les informations techniques La production et la conservation de métadonnées techniques répondent à une triple finalité qui correspond aux étapes inhérentes au cycle de vie documentaire  qualité	intelligibilitéintégrité production conservation	              diffusion
Quelle métadonnées pour la pérennisation ?Les informations administratives La gestion et le stockagede métadonnées techniques répondent à une logique de structuration des entités  qui interagissent entre dans les différents contextes inhérentes au cycle de vie documentaire  agents		événements		objets création	 	conservation	              diffusion
Quelle métadonnées pour la pérennisation ?Les informations descriptives La description et la structuration des métadonnées descriptives répondent à une logique de recherche et d’accès  en fonction de la communauté d’utilisateurs et des impératifs de citabilité et d’interopérabilité acteurs		contexte			objets identité	 	référentiel	           granularité
Quelle métadonnées pour la pérennisation ?Les informations de structure Les métadonnées de structure sont des enveloppes qui relient et permettent de disposer d'un cadre de description commun favorisant l'interopérabilité de l'information et la structuration de l'information objets		événements		agents identité	 	représentation	           pérennité
Quelle métadonnées pour la pérennisation ?METS: la structuration de la description des ressources Le schéma METS vise à fournir un méta-modèle pour l'encapsulation d'autres formats de métadonnées.  Ce schéma XML composé de 7 sections est extrêmement flexible.  Il permet notamment de représenter l'information sous forme de carte de structure et s'implémenter le modèle conceptuel OAIS.  Il constitue un format pivot entre la logique de diffusion et celle de conservation de l'information.
Quelle métadonnées pour la pérennisation ?METS: la structuration de la description des ressources L’utilisation de METS passe par la mise en forme d’un profil d’utilisationCelui-ci permet de définir les règles de description et de permettre une automatisation des processus de validation et de contrôle. Il permet de multiplier les formats de description et les modes de consultation des objets à conserver ou à diffuser. Il utilise un système de pointeur basé sur l’identification de toutes les unités de description
Quelle métadonnées pour la pérennisation ?3 normes pour la structuration des objets d’information PREMIS (PreservationMetadata: ImplementationStrategies) : le modèle de données de PREMIS est composé de 5 entités reliées entre elles par des identifiants: Entité intellectuelle, Objet, Evénement, Agent, et Droits. Ce schéma répond notamment au besoin de pérennisation de l'information numérique et de conservation du cycle de vie des données (import dans un entrepôt de donnée, migration, gestion d'intégrité, liens entre différentes représentations d'un même document). [http://www.loc.gov/standards/premis] LIDO (Lightweight Information DescribingObjects) : cette norme vise à décrire les objets patrimoniaux en référence au modèle conceptuel international CIDOC-CRM((ISO 21127). Il permet de décrire l'objet en terme de contenu mais également de cycle de vie et est fortement orienté vers l'interopérabilité et la mise en réseau. [http://www.lido-schema.org] FRBR (FunctionnalRequirements for Bibliographic Records) et FRAD (FunctionalRequirements for Authority Data) sont des normes qui organisent les différentes composantes de la description bibliographique. Ils organisent les différentes composantes de la description bibliographique. et fournissent un modèle conceptuel permettant l'amélioration des notices de catalogue (un produit), l'action de cataloguer (un processus) et la conception des catalogues (une technologie)
Quelle métadonnées pour la pérennisation ?PREMIS : les métadonnées du cycle de vie ,[object Object]
des listes d'autorités peuvent être utilisées en vue d'optimiser les opérations de gestion, de contrôle ou de transformation (eventType, agentType, format, objectCategory, storageMedium, copyrightStatus, and RightsBasis).
PREMIS est couramment utilisé en lien avec METS:
premis:eventdansdigiProvMD
premis:rightsdansrightsMD
premis:objectdanstechMDdansdigiProvMD
premis:agentdansdigiProvMDourightsMD
Des choixd’implémentationss’imposent en lien avec l’utilisation de METS (redondance de données, mécanismed’identification, répartition des informations),[object Object]
Quelle métadonnées pour la pérennisation ?LIDO: un cadre conceptuel et technique basé sur le modèle conceptuel CIDOC-CRM (ISO 21127:2006) : conseil international des musées-modèle conceptuel de référence constitue une « ontologie » de l'information relative au patrimoine culturel la présentation en est basée sur l'approche « orientée objet » la création, la collection ou l'utilisation d'un objet sont définies comme des événements qui ont des entités associées comme des dates, des lieux ou des acteurs.
Quelle métadonnées pour la pérennisation ?FRBR: le modèle conceptuel de référence ,[object Object]
une entité est un être, ou une « chose doté d'une existence distincte »
un attribut est une qualité, quelque chose qui décrit cette entité

Weitere ähnliche Inhalte

Andere mochten auch

Presentation opendata generaliste
Presentation opendata generalistePresentation opendata generaliste
Presentation opendata generalistePascal Romain
 
FRBR - Formation Medial Reims-Strasbourg 20130607
FRBR - Formation Medial Reims-Strasbourg 20130607FRBR - Formation Medial Reims-Strasbourg 20130607
FRBR - Formation Medial Reims-Strasbourg 20130607Lully
 

Andere mochten auch (11)

4 Solutions Linux Spar
4 Solutions Linux Spar4 Solutions Linux Spar
4 Solutions Linux Spar
 
Aos Community
Aos CommunityAos Community
Aos Community
 
Presentation opendata generaliste
Presentation opendata generalistePresentation opendata generaliste
Presentation opendata generaliste
 
Webinar@AIMS: OKAD & F1000Research: a very different approach to publishing a...
Webinar@AIMS: OKAD & F1000Research: a very different approach to publishing a...Webinar@AIMS: OKAD & F1000Research: a very different approach to publishing a...
Webinar@AIMS: OKAD & F1000Research: a very different approach to publishing a...
 
Publishing skos concept schemes with skosmos
Publishing skos concept schemes with skosmosPublishing skos concept schemes with skosmos
Publishing skos concept schemes with skosmos
 
Webinar@ASIRA: Emerging Themes in Agricultural Research Publishing
Webinar@ASIRA: Emerging Themes in Agricultural Research PublishingWebinar@ASIRA: Emerging Themes in Agricultural Research Publishing
Webinar@ASIRA: Emerging Themes in Agricultural Research Publishing
 
Webinar@ASIRA: New Roles for Changing Times UNAM Subject Librarians in Context
Webinar@ASIRA: New Roles for Changing Times UNAM Subject Librarians in Context Webinar@ASIRA: New Roles for Changing Times UNAM Subject Librarians in Context
Webinar@ASIRA: New Roles for Changing Times UNAM Subject Librarians in Context
 
Webinar@ASIRA: AGRIS: Providing Access to Agricultural Research and Technolog...
Webinar@ASIRA: AGRIS: Providing Access to Agricultural Research and Technolog...Webinar@ASIRA: AGRIS: Providing Access to Agricultural Research and Technolog...
Webinar@ASIRA: AGRIS: Providing Access to Agricultural Research and Technolog...
 
Webinar@ASIRA: Introduction to Using TEEAL to Access Agricultural Journals
Webinar@ASIRA: Introduction to Using TEEAL to Access Agricultural Journals Webinar@ASIRA: Introduction to Using TEEAL to Access Agricultural Journals
Webinar@ASIRA: Introduction to Using TEEAL to Access Agricultural Journals
 
Webinar@ASIRA: Access to Global Online Research in Agriculture (AGORA)
Webinar@ASIRA: Access to Global Online Research in Agriculture (AGORA) Webinar@ASIRA: Access to Global Online Research in Agriculture (AGORA)
Webinar@ASIRA: Access to Global Online Research in Agriculture (AGORA)
 
FRBR - Formation Medial Reims-Strasbourg 20130607
FRBR - Formation Medial Reims-Strasbourg 20130607FRBR - Formation Medial Reims-Strasbourg 20130607
FRBR - Formation Medial Reims-Strasbourg 20130607
 

Ähnlich wie Presentation PIN 2011

Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Gautier Poupeau
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Gautier Poupeau
 
Introduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesIntroduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesOpen Data Support
 
presentationcoursbd.pdf
presentationcoursbd.pdfpresentationcoursbd.pdf
presentationcoursbd.pdfAabidiHafid
 
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheFiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheAgropolis International
 
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...Denodo
 
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Desconnets Jean-Christophe
 
Bid CE Workshop 1 session 06 - Data quality during digitization
Bid CE Workshop 1   session 06 - Data quality during digitizationBid CE Workshop 1   session 06 - Data quality during digitization
Bid CE Workshop 1 session 06 - Data quality during digitizationAlberto González-Talaván
 
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...mondeca
 
Data visualisations sur les données des représentants d’intérêts (lobbies) en...
Data visualisations sur les données des représentants d’intérêts (lobbies) en...Data visualisations sur les données des représentants d’intérêts (lobbies) en...
Data visualisations sur les données des représentants d’intérêts (lobbies) en...Thibaud Aschbacher
 
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Gilbert Paquette
 
Chap1Concepts-FondamentauxBD.pdf
Chap1Concepts-FondamentauxBD.pdfChap1Concepts-FondamentauxBD.pdf
Chap1Concepts-FondamentauxBD.pdfBoubakerMedanas
 
Meta archivesetatdel art
Meta archivesetatdel artMeta archivesetatdel art
Meta archivesetatdel artPascal Romain
 
2015-09-30 ASIP Santé JNI "Modèle des objets de santé et nomenclatures associ...
2015-09-30 ASIP Santé JNI "Modèle des objets de santé et nomenclatures associ...2015-09-30 ASIP Santé JNI "Modèle des objets de santé et nomenclatures associ...
2015-09-30 ASIP Santé JNI "Modèle des objets de santé et nomenclatures associ...ASIP Santé
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueGautier Poupeau
 
Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BISaid Sadik
 

Ähnlich wie Presentation PIN 2011 (20)

Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
Le "Lac de données" de l'Ina, un projet pour placer la donnée au cœur de l'or...
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...
 
Cours BDD.pptx
Cours BDD.pptxCours BDD.pptx
Cours BDD.pptx
 
Introduction à la gestion des métadonnées
Introduction à la gestion des métadonnéesIntroduction à la gestion des métadonnées
Introduction à la gestion des métadonnées
 
ANTIDOT - Cas client ISIDORE
ANTIDOT - Cas client ISIDOREANTIDOT - Cas client ISIDORE
ANTIDOT - Cas client ISIDORE
 
presentationcoursbd.pdf
presentationcoursbd.pdfpresentationcoursbd.pdf
presentationcoursbd.pdf
 
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la rechercheFiche pratique IST Agropolis : L'Open Access et les données de la recherche
Fiche pratique IST Agropolis : L'Open Access et les données de la recherche
 
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
Webinar Denodo & CRIP : Souveraineté, information sensible et data gouvernanc...
 
Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...Les entrepôts de données ou comment rendre les données trouvables accessibles...
Les entrepôts de données ou comment rendre les données trouvables accessibles...
 
Cours_BD_M1-EAI-2023.pdf
Cours_BD_M1-EAI-2023.pdfCours_BD_M1-EAI-2023.pdf
Cours_BD_M1-EAI-2023.pdf
 
Bid CE Workshop 1 session 06 - Data quality during digitization
Bid CE Workshop 1   session 06 - Data quality during digitizationBid CE Workshop 1   session 06 - Data quality during digitization
Bid CE Workshop 1 session 06 - Data quality during digitization
 
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
Présentation SEO et semantic web à la conférence SMX, SEO and semantic Web to...
 
ANTIDOT - Antidot information factory
ANTIDOT - Antidot information factoryANTIDOT - Antidot information factory
ANTIDOT - Antidot information factory
 
Data visualisations sur les données des représentants d’intérêts (lobbies) en...
Data visualisations sur les données des représentants d’intérêts (lobbies) en...Data visualisations sur les données des représentants d’intérêts (lobbies) en...
Data visualisations sur les données des représentants d’intérêts (lobbies) en...
 
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...Le Web sémantique pour la formation et la gestion des connaissances dans les ...
Le Web sémantique pour la formation et la gestion des connaissances dans les ...
 
Chap1Concepts-FondamentauxBD.pdf
Chap1Concepts-FondamentauxBD.pdfChap1Concepts-FondamentauxBD.pdf
Chap1Concepts-FondamentauxBD.pdf
 
Meta archivesetatdel art
Meta archivesetatdel artMeta archivesetatdel art
Meta archivesetatdel art
 
2015-09-30 ASIP Santé JNI "Modèle des objets de santé et nomenclatures associ...
2015-09-30 ASIP Santé JNI "Modèle des objets de santé et nomenclatures associ...2015-09-30 ASIP Santé JNI "Modèle des objets de santé et nomenclatures associ...
2015-09-30 ASIP Santé JNI "Modèle des objets de santé et nomenclatures associ...
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 
Etat de l’art approche et outils BI
Etat de l’art approche et outils BIEtat de l’art approche et outils BI
Etat de l’art approche et outils BI
 

Presentation PIN 2011

  • 1. Les métadonnées de pérennisation et l’accès aux objets Formation PIN18-21 octobre 2011Pérennisation et communication de l'information numérique Pascal RomainIngénieur documentaireConseil général de la Gironde
  • 2. Sommaire • Introduction sur les métadonnées définition, aspect théorique, processus de production • Le modèle d’information de l’OAIS: place des métadonnées dans le modèle • Quelles métadonnées pour la pérennisation ? • Encoder et lier les métadonnées • L’accès à l’information grâce aux métadonnées
  • 3. Introduction sur les métadonnées : définition Une métadonnée est une donnée servant à définir ou décrire une autre donnée. Porteuse d'information sur le contexte, le sens et la description de la ressource informationnelle portée par la donnée brute. μετά:préfixe grec indiquant l'auto-référence
  • 4. Introduction sur les métadonnées : théorie Les métadonnées servent à définir et conserver l’intégrité, l’interprétation et l’interopérabilité des données.Elles transforment la donnée brute en donnée intelligible titre contexte temporel + = indexation lieu producteur indexation sujet contexte spatial
  • 5. Introduction sur les métadonnées : théorie Dans le contexte numérique, des dispositifs de médiation sont nécessaires à l’appréhension de la donnée. Plusieurs communautés d’utilisateurs impliquent différents types de métadonnées Une métadonnée doit avoir une finalité et une utilité immédiate Des dispositifs d’encodage, de lecture et de transmission conditionnent notre accès aux données Attention : l’abus de métadonnées est dangereux pour la santé Des dispositifs de stockage, de sécurisationet de surveillance sont nécessaires à la conservation des données
  • 6. Introduction sur les métadonnées: typologie On distingue généralement 4 grands types de métadonnées : métadonnées techniques: décrivent les outils utilisés pour créer la donnée ainsi que le processus de création lui-même. essentielles à l'intelligibilité de la donnée dans un contexte d'intermédiation numérique ainsi qu'à la qualité de la donnée dans une perspective de conservation sur le long terme. elles doivent suivre le cycle de vie de la donnée et permettre de garantir son intégrité métadonnées administratives utilisées pour définir les contrôles d'accès à la donnée décrivent les évènements et les agents qui interviennent sur la donnée ainsi que les conditions d'utilisation permettent de gérer la donnée et les liens qui peuvent exister entre ses éventuelles différentes représentations métadonnées descriptives utilisées pour préciser le contenu informatif de la donnée structurent les informations dont la donnée est porteuse en la reliant à des concepts ou à d'autres données permettent d'expliciter, de décrire, de contextualiser ou de hiérarchiser l'information métadonnées de structure enveloppes qui permettent de relier plusieurs types de métadonnée permettent de disposer d'un cadre de description commun favorisant l'interopérabilité de l'information
  • 7. Introduction sur les métadonnées: production La production de métadonnées peut s'envisager à différentes étapes du cycle de vie du document porteur d'information : saisie à la création saisies au cours d'une étape de traitement de l'information extraction à posteriori : transformation, diffusion, récupération
  • 8. Introduction sur les métadonnées: production lors de la création de la donnée des champs permettent d'expliciter des informations de contexte, de provenance ou d'accès dans l'en-tête ou dans un fichier séparépar exemple champs IPTC dans les images ou métadonnées dans les en-têtes des documents bureautiques saisie à la création: saisie à posteriori: extraction automatisée: -> la saisie à la création est l'opération la moins coûteuse et celle qui assure la meilleure qualité. à partir de la consultation des données, une description structurée de l'information est possiblepar exemple une notice documentaire, une fiche technique, des conditions d’accès ->compétences scientifiques coûteuses ; voire impossibilité de compléter l'information il est possible de caractériser des éléments d'information automatiquementpar exemple par la mise en relation du contenu informationnel avec des référentiels de données ou des processus d’OCR -> l'extraction automatique est coûteuse pour parvenir à une qualité documentaire satisfaisante
  • 9. Sommaire • Introduction sur les métadonnées définition, aspect théorique, processus de production • Le modèle d’information de l’OAIS: place des métadonnées dans le modèle • Quelles métadonnées pour la pérennisation ? • encoder et lier les métadonnées • L’accès à l’information grâce aux métadonnées
  • 10. Modèle conceptuel organisé autour de 6 entités gérant les échanges d’informations au sein du système d’information Système d’information ouvert d’archivage OAIS
  • 11.
  • 12. le paquet d’information à soumettre : SIP (Submission Information Package)
  • 13. le paquet d’information à archiver: AIP (Archival Information Package). Il peut exister sous 2 formes au sein de l’archive OAIS
  • 14. Le paquet d’information à diffuser : DIP (Diffusion Information Package)
  • 15.
  • 16. Le modèle d’information de l’OAIS: les paquets d’information: l’information l’Objet Information est composé d’un objet données (physique ou numérique) et de l’information de représentation qui permet d’interpréter les données sous la forme d’une information compréhensible.
  • 17.
  • 18. types de données courants en informatique, comme des caractères, des nombres, des pixels, des tableaux
  • 20. informations complémentaires associées aux éléments de structure, telles que la langue dans laquelle l’objet est exprimé, les opérations réalisables sur chaque type de données et leurs corrélations, etc.
  • 22. Identifiants d’autres standards comme la référence à la norme ASCIIbasé sur le principe de la récursivité
  • 23.
  • 24. Information de contexteDécrit comment le contenu d’information s’articule avec d’autres informations à l’extérieur du paquet
  • 25. Information d’identificationFournit un ou plusieurs identifiants ou systèmes d’identification
  • 26.
  • 27. Le modèle d’information de l’OAIS: le contexte du versement Le versement d’un document ou d’une archive dans une perspective de pérennisation implique la description de plusieurs éléments de contexte (l’environnement technique, la description du producteur, la description du contenu, les droits d’accès). Il mets en relation un agent versant et un agent recevant autour d’un versement comprenant des objets en relation
  • 28. Le modèle d’information de l’OAIS: le contexte de la gestion (ou archivage) La gestion et le stockage impliquent la description d’évènements (l’analyse, l’enrichissement, le stockage, la migration) dont la responsabilité incombe à l’entité OAIS. Ces processus sont complexes et nécessitent la description des objets à conserver et à diffuser
  • 29. Le modèle d’information de l’OAIS: le contexte d’administration L’administration dans le temps de l’archive nécessite le suivi et la modification des événements qui affectent l’information. Une veille technologique est nécessaire pour garantir l’accès des agents habilités au cours du cycle de vie des objets informationnels
  • 30. Le modèle d’information de l’OAIS: le contexte de l’accès L’accès aux informations nécessite l’enrichissement et la mise en relation des objets avec d’autres sources d’explicitation Les communautés d’agents expriment des besoins qui doivent être pris en compte sans compromettre l’intégrité de l’entité OAIS
  • 31.
  • 32.
  • 33. Quelle métadonnées pour la pérennisation ?Les informations techniques La production et la conservation de métadonnées techniques répondent à une triple finalité qui correspond aux étapes inhérentes au cycle de vie documentaire qualité intelligibilitéintégrité production conservation diffusion
  • 34. Quelle métadonnées pour la pérennisation ?Les informations administratives La gestion et le stockagede métadonnées techniques répondent à une logique de structuration des entités qui interagissent entre dans les différents contextes inhérentes au cycle de vie documentaire agents événements objets création conservation diffusion
  • 35. Quelle métadonnées pour la pérennisation ?Les informations descriptives La description et la structuration des métadonnées descriptives répondent à une logique de recherche et d’accès en fonction de la communauté d’utilisateurs et des impératifs de citabilité et d’interopérabilité acteurs contexte objets identité référentiel granularité
  • 36. Quelle métadonnées pour la pérennisation ?Les informations de structure Les métadonnées de structure sont des enveloppes qui relient et permettent de disposer d'un cadre de description commun favorisant l'interopérabilité de l'information et la structuration de l'information objets événements agents identité représentation pérennité
  • 37. Quelle métadonnées pour la pérennisation ?METS: la structuration de la description des ressources Le schéma METS vise à fournir un méta-modèle pour l'encapsulation d'autres formats de métadonnées. Ce schéma XML composé de 7 sections est extrêmement flexible. Il permet notamment de représenter l'information sous forme de carte de structure et s'implémenter le modèle conceptuel OAIS. Il constitue un format pivot entre la logique de diffusion et celle de conservation de l'information.
  • 38. Quelle métadonnées pour la pérennisation ?METS: la structuration de la description des ressources L’utilisation de METS passe par la mise en forme d’un profil d’utilisationCelui-ci permet de définir les règles de description et de permettre une automatisation des processus de validation et de contrôle. Il permet de multiplier les formats de description et les modes de consultation des objets à conserver ou à diffuser. Il utilise un système de pointeur basé sur l’identification de toutes les unités de description
  • 39. Quelle métadonnées pour la pérennisation ?3 normes pour la structuration des objets d’information PREMIS (PreservationMetadata: ImplementationStrategies) : le modèle de données de PREMIS est composé de 5 entités reliées entre elles par des identifiants: Entité intellectuelle, Objet, Evénement, Agent, et Droits. Ce schéma répond notamment au besoin de pérennisation de l'information numérique et de conservation du cycle de vie des données (import dans un entrepôt de donnée, migration, gestion d'intégrité, liens entre différentes représentations d'un même document). [http://www.loc.gov/standards/premis] LIDO (Lightweight Information DescribingObjects) : cette norme vise à décrire les objets patrimoniaux en référence au modèle conceptuel international CIDOC-CRM((ISO 21127). Il permet de décrire l'objet en terme de contenu mais également de cycle de vie et est fortement orienté vers l'interopérabilité et la mise en réseau. [http://www.lido-schema.org] FRBR (FunctionnalRequirements for Bibliographic Records) et FRAD (FunctionalRequirements for Authority Data) sont des normes qui organisent les différentes composantes de la description bibliographique. Ils organisent les différentes composantes de la description bibliographique. et fournissent un modèle conceptuel permettant l'amélioration des notices de catalogue (un produit), l'action de cataloguer (un processus) et la conception des catalogues (une technologie)
  • 40.
  • 41. des listes d'autorités peuvent être utilisées en vue d'optimiser les opérations de gestion, de contrôle ou de transformation (eventType, agentType, format, objectCategory, storageMedium, copyrightStatus, and RightsBasis).
  • 42. PREMIS est couramment utilisé en lien avec METS:
  • 47.
  • 48. Quelle métadonnées pour la pérennisation ?LIDO: un cadre conceptuel et technique basé sur le modèle conceptuel CIDOC-CRM (ISO 21127:2006) : conseil international des musées-modèle conceptuel de référence constitue une « ontologie » de l'information relative au patrimoine culturel la présentation en est basée sur l'approche « orientée objet » la création, la collection ou l'utilisation d'un objet sont définies comme des événements qui ont des entités associées comme des dates, des lieux ou des acteurs.
  • 49.
  • 50. une entité est un être, ou une « chose doté d'une existence distincte »
  • 51. un attribut est une qualité, quelque chose qui décrit cette entité
  • 52. une relation est le lien entre différentes entités
  • 54. groupe 1: les produits abstraits ou concrets (travail, expression, manifestation et exemplaire)
  • 55. groupe 2: les individus ou institutions
  • 56. groupe 3: les sujets (concepts, des objets, des évènements, des lieux)
  • 57. Les attributs sont des caractéristiques ou des propriétés.Ils permettent aux utilisateurs de trouver les entités dont ils ont besoin.
  • 59.
  • 60.
  • 61. un élément qui permet de désigner l’autorité nommante qui a attribué l’identifiant au sein de ce système
  • 62. le « nom » lui-même, c'est-à-dire une chaîne de caractères qui identifie la ressourcede manière unique, au sein de ce système et pour cette autorité.Les URI sont des identifiants Web. Les URL sont des URI qui identifient la ressource par le moyen d'y accéder. Les URL peuvent être pérennes.
  • 63.
  • 64. langage hiérarchique permettant de décrire des relations
  • 65. langage de transport d’information permettant de standardiser les échanges de données
  • 66. peut être décrit par un schéma ou une DTD
  • 67. peut servir au stockage des données mais également à leur interrogation<xml version="1.0" encoding="UTF-8"?> <ex:collectionxml:lang="fr" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns=http://www.w3.org/1999/xhtmlxmlns:ex="http://exemple.org"> <ex:vehicule> <dc:title>Mon super vélo</dc:title> <velo id="2"> <taille>76</taille> <marque>cool bike</marque> <modele>speeder</modele> </ex:velo> <ex:velo taille="76" marque="coolbike" modele="speeder" id="2" />
  • 68. Encoder et lier les métadonnées3 normes complémentaires pour l’information technique des images fixes EXIF (Exchangeable image file format): permet de décrire le contexte (quand), l'outil (comment), la localisation (où) et l'auteur (qui) de la production. Les données Exif sont incorporées au fichier d’image lui-même. Elles peuvent être modifiées mais reflètent normalement les conditions de production d'une image numérique. Le format en version 2.2 (2003) n'est pas maintenu [http://exif.org/Exif2-2.PDF] XMP (Extensible Metadata Platform): permet de décrire sous forme d'un document XML intégré au fichier des informations relatives à ses caractéristiques. Il permet d'intégrer des métadonnées EXIF ou Dublin Core et supporte l'unicode. Ce format est maintenu par Adobe. [http://www.adobe.com/products/xmp/] MIX (Metadata Image XML): permet de décrire sous forme d'un document XML externe l'ensemble des éléments définis dans la norme ISO 39.87. Le format en version 2 est maintenu par la bibliothèque du congrès américain. [http://www.loc.gov/standards/mix/]
  • 69. Encoder et lier les métadonnéesL’exemple du schéma de données MIX
  • 70. Encoder et lier les métadonnéesL’exemple du schéma de données MIX
  • 71. Encoder et lier les métadonnées3 normes complémentaires pour l’information technique des contenus multimédias MPEG-7 (Moving Picture Experts Group) : une norme de description dont le but est de faciliter l'indexation et la recherche de documents multimédia. Il permet d'utiliser des descripteurs pour caractériser des données audio ou visuelles mais également de décrire le contenu de ces données ainsi que les relations sémantiques qui les lient entre elles. Standard ISO/IEC 15938 il est assez peu utilisé en raison de sa complexité.[http://mpeg.chiariglione.org/standards/mpeg-7/mpeg-7.htm] PBCore (Public BroadcastingMetadataDictionary) : initialement utilisé par les diffuseurs radio, il s'appuie sur le standard Dublin Core pour décrire le contenu intellectuel des ressources, les mentions de droits ainsi que l'ensemble des informations techniques sur le document numérique audio. Il existe sous forme de format XML. [http://pbcore.org/2.0/] VIDEOMD (VideoTechnicalMetadata Extension Schema) : permet de décrire sous forme d'un document XML externe les métadonnées techniques qui décrivent un objet numérique vidéo. Il est utilisé en lien avec METS. [http://lcweb2.loc.gov/mets/Schemas/VMD.xsd]
  • 72.
  • 73. autorise la description hiérarchique ou simple
  • 74.
  • 75. le schéma EAC vise à décrire les producteurs pour retracer l'historique d'une entité administrative ou morale d'archives en se basant sur la norme ISAAR-CPF [http://eac.staatsbibliothek-berlin.de/].
  • 76.
  • 77.
  • 78. Il permet d'automatiser les procéduresd'échange d'information en décrivant les règles contractuelles qui régissent le versement et la prise en charge d'un paquet d'information.
  • 79. Les messages SEDA décrivent les contraintes (format, support, identification) et fournissent un historique des opérations effectuées (transfert, réception, destruction, etc..)
  • 80.
  • 81. L’accès à l’information par les métadonnéesEAD: modélisation des entités sémantiques
  • 82.
  • 83. Les référentiels permettent alors de les relier L’Ecume des jours est un roman de Boris Vian publié en 1947 avec pour thèmes centraux l’amour, la maladie, la mort L’Ecume des jours est un roman L’Ecume des jours a pour auteur Boris Vian L’Ecume des jours est paru en 1947 L’Ecume des jours a pour thèmes l’amour, la maladie, la mort J’irais cracher sur vos tombes a pour auteur Vernon Sullivan L’Arrache-coeur– type - roman L’Arrache-coeur– auteur - Boris Vian L’Arrache-coeur– année de parution – 1947 L’Arrache-coeur- thème – amour http://dbpedia.org/page/Froth_on_the_Daydream http://data.bnf.fr/13091689/boris_vian/ dbpedia:Froth_on_the_Daydreamrdf:type yago:Novel106367879 dbpedia:Froth_on_the_Daydreamdcterms:creatordbpedia:Boris_Vian dbpedia:Froth_on_the_Daydreamdcterms:date "1947" dbpedia:Froth_on_the_Daydreamskos:subjectdbpedia:Love dbpedia-owl:wikiPageRedirectsdcterms:creatordbpedia:Vernon_Sullivan RDF n'est pas lié à une syntaxe particulière mais c'est en XML que sont publiés la plupart des vocabulaires standard (RDFS, FOAF, SKOS, OWL) qui utilisent le modèle de données en graphe.
  • 84.
  • 85. SKOS est actuellement développé dans le cadre du W3C et cherche à être au maximum compatible avec les standards qui définissent les thésaurus.
  • 86. SKOS est un vocabulaire écrit en RDFS où la classe générique est skos:Concept
  • 87. les propriétés de mise en correspondance proposées dans SKOS permettent d'exprimer des correspondances entre concepts provenant de schémas différents
  • 90.
  • 91.
  • 92. 15 éléments optionnels répétables et qualifiables
  • 93. profils d’implémentation permettant d’échanger facilement des données entre différents domaine
  • 94. permet de s’intégrer dans des portails documentaires transversaux
  • 95.