Référentiels, de quoi parle-t-on ?
Sylvie Dalbin - sylvieatd@aol.com
Assistance & Techniques documentaires
Journée d’Etude
Du thésaurus aux référentiels terminologiques
Mardi 26 Novembre 2013
Support - v0.1
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 2
Plan
1. Un peu d’histoire et de contexte
2. Référentiel terminologique
3. Qualité et administration
Introduction aux interventions de la journée
Référentiels du Web sémantique, Education nationale, Electre,
HDA Lab, Kompass, RadioFrance.
1.Un peu d’histoire
et de contexte
Outils d’organisation et d’accès
Référentiels
Terminologies
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 4
Annotations en 1757
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 5
Annotations en 2013
Ligne du temps
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 6
Epoques Ressource Processus Outils Public Usage
1
Antiquité Manuscrit
ou corpus
d’un auteur
Annotation du
contenu d’un
texte
Notes marginales;
Table de
concordance
accès rapide à un
passage pour
compréhension =>
mémorisation
2 Moyen Age
Manuscrit
papyrus -
parchemin - codex
Note externe
lien au texte
regroupement
des notes
Table - Index
symbole de
repérage
Idem
+ extension aux
encyclopédies
3 Renaissance
Imprimé
Manuscrit
Collections
Indexation fine
- contenu du
document
(et collections)
Index de fin de
livre
Recherche sujet
avec accès direct
au passage du
texte ;
langues
vernaculaires
4
Fin
XIXe siècle
Périodiques,
Livres
industrialisation
Objets
Indexation
contrôlée et
thématique de
collections
Table/Index de
collections
Vedettes matières
Taxinomies
Repérage sujet
avec accès indirect
au texte
5
Post 2ème
Guerre
Mondiale
Variétés de
“documents” et
supports
texte, image, son
- numérique
Indexation
contrôlée, fine
du contenu de
collections
Hypertexte
Thésaurus
TALN -
Ressources
linguistiques
Recherche
concepts combinés
accès direct au
texte
6
Fin XXè
Début XXI
Ressources
Granularité
Graphes
Annotations
variées
Libres, contrôlées
Ontologie,
Termino. Voc
(contrôlé, libre)
Taxonomies de
navigation
Accès grain
d’information en
contexte
- Lecture sur écran
Avant le référentielMéthodes et outils s’accumulent
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 7
Référentiel Géologique de la France
Référentiels de l'ONIAM pour l'indemnisation des
accidents médicaux
TAXRef - Référentiel national sur la faune, la flore et la
fonge de France
Référentiel Marianne : socle d’engagement interministériel - qualité
d’accueil
Référentiel de pratiques de l’examen périodique de
santé des CES sur le dépistage….
Référentiel de formation en intelligence économique
Référentiel des métiers et des compétences …
Référentiels - usages du terme
HUMAIN
MACHINE
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 8
Référentiels - usages du terme
Référentiel Géologique de la France
Référentiels de l'ONIAM pour l'indemnisation des
accidents médicaux
TAXRef - Référentiel national sur la faune, la flore et la
fonge de France
Référentiel Marianne : socle d’engagement interministériel - qualité
d’accueil
Référentiel de pratiques de l’examen périodique de
santé des CES sur le dépistage….
Référentiel de formation en intelligence économique
Référentiel des métiers et des compétences …
HUMAIN
MACHINE
Bonnes pratiques
Règles - Directives
Voc. Contrôlé et partagé
Référentiels de données du SI (MDM)
Référentiel terminologique
Voc.Contrôlé
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 9
Vous avez dit « terminologique »
ou sémantique ?
Référentiels de …
Groupes de concepts - termes - relations
Mais :
• Encodés pour être compris par les machines
– Intervention de B.Vatant
• Articulés avec les autres composants des SI
• Contextes et environnements variés
Notices Documents numériques - métadonnées
Documents Ressources
Périmètre Fermé / Ouvert
Accès Formulaire - Moteur,..
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 11
Des listes contrôlées…
Nom
ID
Titre
Auteur
Editeur
Date
Support
…
Descripteurs
- Géographiques
- Personnes
- Thèmes
- Nature info,…
Répertoire
Documents
Auteurs
Pays
Lexiques contrôlésDocuments
Nom Continent/Pays
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 12
Aux référentiels terminologiques…
Répertoire
Personnes
Répertoire
Géographique
RessourceRessource
et sémantiques
ID
Titre
Auteur
Editeur
Date
Support
…
Personnes
Organismes
Lieux
Nature info,
…
ID
Nom
Date Naissance/Mort
Pseudonyme
PaysNaissance
TypePublication
Genre
AireLinguistique
…
Répertoire
Documents
Impacts sur les vocabulaires existants
Richesse et rigueur
des relations au sein et entre vocabulaires
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 17
Thésaurus en relation
Gemet
Agrovoc, Eurovoc
Wikipedia, UMTHES
Alignements
Poly-appartenance
EP/ TG / TS / TA
Différents niveaux
de correspondance
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 18
Mutualisation - Rigueur dans la sémantique
des concepts et des relations
Exemple d’articulation entre Motbis et Thésagri
5025 Culture - Loisirs - Tourisme 1530 nature et environnement
Tourisme rural
Terme générique noyau commun
Terme spécifique noyau commun
Terme générique pour les termes spécifiques
Termes spécifique du subthésaurus
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 20
Enjeux des référentiels
Condition : Etre reconnus et donc utilisés
• Usage exclusif d’un thésaurus pour une seule application ?
Améliorer l’expérience utilisateur
– optimisation de l’accès aux ressources
Une réponse à la complexité des SI
– volumétrie, multiplication des contraintes, lourdeur
d’administration
• Evolution des SI : plus aisée, plus rapide
• Adaptatibilité aux nouveaux besoins
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 21
Risques des référentiels
QuickTime™ et un
décompresseur
sont requis pour visionner cette image.
https://commons.wikimedia.org/wiki/File:Pieter_Bruegel_d._%C3%84._074.jpg?uselang=fr
La Tour de Babel Pertes d’information
Partager et/ou regrouper,
réconcilier, relier sans perte
Ne pas confondre trop ambitieux,
alambiqué ou embrouillé,
avec un système complexe
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 23
Contexte nouveau - Pratiques nouvelles
3 niveaux possibles d’administration
• Le Référentiel
• Les Vocabulaires au sein du Référentiel
• Les Vocabulaires au sein d’une application
Adapter méthodes, règles et outils à ces contextes
Evaluer par rapport :
• Aux procédures et règles prévues (conformité)
• Aux besoins et usages
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 24
Surveiller la qualité
[Référentiel]
Accueillant Evolutif
Accessible Documenté
Réutilisable
[Vocabulaires/Référentiel]
Fraicheur, Accueillants
Précision Ouverts
Organisés Extensibles
et structurés
Cohérents
(dans le temps)
[Vocabulaires / applicatifs]
Adéquation Aligné
Usages au référentiel
Cohérent À travers
le temps
Evolutif
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 25
Administration et gouvernance
Des fonctions et compétences
• Une équipe étendue, aux compétences variées
• Administration de vocabulaires, de données
fonction de veille de la qualité sémantique : « absence de synonymes
et d’homonymes ; entretien de la cohérence des codages ; accessibilité
et clarté de la documentation, etc. » [Volle, 2001
Une organisation robuste
Des outils spécialisés
• Gérer les vocabulaires
• Réaliser et gérer les alignements
TAE de Mondeca
• Evaluer, en usage
Merci de votre attention
Questions - Débat
Rappel des actions menées par le Secteur Taxonomies & Métadonnées
Site T&M - http://www.adbs.fr/secteur-taxonomies-et-metadonnees-de-l-adbs-132836.htm
5-à-7 Ginco, Katell Briatte, le 10 Décembre 2013 à l’ADBS
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 28
Concepts complexes : exemple
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 29
Exemples de référentiels terminologiques
Sylvie Dalbin - Référentiel terminologique : de quoi parle-t-on ? ADBS - 26 Nov. 2013 - p. 30
Bibliographie sélective
Numéro spécial DOCSI DocSI, n° 3, septembre 2013. Dossier : Les métiers de l’information et la « donnée » :
analyse d’un monde en mutation - http://www.adbs.fr/docsi-n-3-septembre-2013-dossier-les-metiers-de-l-information-
et-la-donnee-analyse-d-un-monde-en-mutation-134291.htm#sthash.ht7dW16f.dpuf
Comment concevoir un référentiel, M.Volle, 2001, http://www.volle.com/travaux/referentiel.htm
Mettre en place une administration de données, M.Volle, 2002, http://www.volle.com/travaux/add.htm
Travaux d’Isabelle Boydens - http://www.ulb.ac.be/cours/iboydens/ - Impact du temps sur la qualité - Réfléxions
sur la place des thésaurus et des ontologies.
Les référentiels du système d'information, J. Paumier, P. Rivière, J. Bizingre, Coll. InfoPro, Dunod,
2013
Référentiels de données : piliers du SI, R.Mandel, 2013, http://www.value-
architecture.com/2013/03/referentiels-de-donnees-piliers-du-si.html
Autour des mots « Référentiel », CROS F., RAISKY C., Recherche & Formation, 2010, n°64 (Les
référentiels en formation : enjeux, légitimité, contenu et usage ) - http://ife.ens-lyon.fr/publications/edition-
electronique/recherche-et-formation/RR064-08.pdf
Normes - http://dossierdoc.typepad.com/descripteurs/2013/03/thesaurus-documents-normatifs.html
Sur les systèmes d’organisation et les métadonnées, Sylvie Dalbin
Présentations http://fr.slideshare.net/Dalb/ et Blogue (http://dossierdoc.typepad.com/descripteurs/)
Sélection de répertoires de Vocabulaires - https://www.diigo.com/list/dalbin/list-2013112411105513
Exemple dans le secteur Médical - TeRSan: Terminologies et Référentiels d’interopérabilité
sémantique en Santé, Journée d’étude – 18 ans – CISMeF - 5 février 2013
L’Observatoire Virtuel astronomique : interopérabilité et standards au service de la recherche en
astronomieThomas Boch, FRéDOC 2011 - http://renatis.cnrs.fr/IMG/pdf/Presentation_de_Thomas_Boch.pd
Intervention en appui - http://www.adbs.fr/du-thesaurus-aux-referentiels-terminologiques-134144.htm?RH=1372927073786
Les référentiels du Web de données : l'âge de raison- Bernard Vatant, Mondeca
ScoLOMFR : de la mise en œuvre au déploiement du référentiel sémantique, pour les ressources pédagogiques - Marie-José Chacon (DGESCO), Laetitia Cordeau (CNDP), Marie Muller (CNDP), ministère de l'Education nationale
Les référentiels auteurs, sociétés, œuvres : du catalogue des livres à l'open data- Pierre Boudigues et Joëlle Aernoudt, Electre
Indexation documentaire et tagging sémantique : réflexion à partir de l'expérience HDA Lab - Bertrand Sajus, chef de projets au département des Programmes numériques du ministère de la Culture et de la Communication
Refonte de la classification multilingue de Kompass International - Anne-Sophie Berthon, Kompass International
L'expertise documentaire au service des référentiels de l'entreprise - Caroline Wiegandt, Isabelle Canno, Radio France
- See more at: http://www.adbs.fr/du-thesaurus-aux-referentiels-terminologiques-134144.htm?RH=1372927073786#sthash.zHj12oVg.dpuf
AM Claudine Masse
PM Présidente de séance : Lisette Calderan, INRIA
Explique la variété des situations
En 900 - https://commons.wikimedia.org/wiki/File:Annotations_de_Florus_de_Lyon,_fol._16v.jpg
NOTE, NOTES - http://www.item.ens.fr/index.php?id=577641
Notation manuscrite à finalité variée (mémorisation, guide de lecture, guide d’organisation (pour l’auteur) - note, annotation, commentaires, note de bas de page ou de fin de chapitre/documents
Annotations : notes de l'auteur destinées au scribe, notes d'un copiste à un autre copiste, mais aussi des témoignages de lecture du texte sous forme de notes manuscrites, de dessins ou de signes à l'encre.
Ligne du temps - activité d’annotation reposant sur le découpage des objets audiovisuels (segmentation)
Annotation par les communautés - http://www.mccord-museum.qc.ca/fr/dossiers/user_1578_1197103386
Pour une typologie des formes d’annotation audiovisuelle - http://celluloid.hypotheses.org/412
Le question - vedettes matière / thésaurus est devenu secondaire. Par contre, le principe d’une indexation au thème principal versus une annotation précise des contenus reste posé,
Pratiques de production et indexation : adaptations de pratiques “anciennes” au contexte du XX-XXI siècleActeurs - éditeurs et indexeurs professionnels, phénomène récent, concerné par une part limitée de la production de connaissances
Bonnes pratiques (best practices) / Directives (Guidelines) [controlled vocabularies] la fonction d'entrepôt (repository)
la fonction de référence (universal (universal set), master (MDM), registry / référentiel
les objets entreposés (data, document, information)
Data repository, data registry,
Une notion empruntée pénètre un autre monde que celui qui en est l’initiateur. Son sens peut s’en trouver quelque peu transformé par un processus très souvent implicite de suggestions venues : de la source elle-même, des attentes du milieu qui l’emprunte, des tendances sociales,…. (CROS F., RAISKY C)
Désigne un ensemble rationalisé des données dont se sert une application
Le MDM (Master Data Management) ou la gestion de données de référence consiste à centraliser la gestion des données dites essentielles intéressant les grandes applications de l’entreprise (Cigref)
Diane Sciandra est Product Data Analyst dans une grande entreprise industrielle. Ce poste a été recréé récemment suite aux recommandations d'un audit, car les données manquantes dans les bases de données de son entreprise rendaient le management moins concurrentiel. - See more at: http://www.adbs.fr/diane-sciandra-product-data-analyst-dans-une-grande-entreprise-industrielle-121935.htm?RH=1220884479450#sthash.N7aiX5Hp.dpuf
Des Référentiels de concepts - termes - relations :
Encadrés par leur fonction au sein de ces SI et leurs articulations aux composants des SI : applications et bases de données ; métadonnées, ontologies
Encadrés par des contextes d’usages variés au sein des différents SI
Fermé / ouvert
Collection (agrégats, corpus, regroupements, clusters)
Sélection à des fins particulières, périmètre ± délimité
Référentiels multi-usages ou multi-fonctions (limites)
Personne, Géographie, mais aussi Genre, AireLinguistique/Langue, …. sont des Réservoirs de vocabulaires désambiguïsés pouvant servir de Base de connaissance qualifiée, partageables.
Ces informations complétementaires à ces listes (structurées) de termes permettent : de lever l’ambiguité, d’autoriser des rebonds indirects, d’offrir des modes de visualisation (géolocalisation associée au nom des villes et pays), regroupement, filtres de recherche (facettes),…
Les applications informatiques peuvent conduire à d’autres architectures
Une approche par filières (créant des silos)
Des schémas de métadonnées spécifiques
Des vocabulaires contrôlés partiellement mutualisé. Un thésaurus dédié aux articles et ouvrages
> Schémas de métadonnées spécifique reproduisant la structure du catalogage des ressources par dispositifs
– une indexation liée aux besoins des « spécialistes » de chacune des filières uniquement
des pointeurs communs - les entités du domaines (ressources pédagogiques, Entreprises / Secteurs, Radio, …)
liens/rebonds difficiles à faire entre certaines catégories identiques d’information : date, titre, nom d’organismes, ...
> Vocabulaire contrôlé spécifiques (structure, ampleur, ….) aux métadonnées auxquelles elles sont associées
Mutualisation possibles
Partage et Mutualisation possibles moyennant un travail d’architecture/structure - mise en cohérence
Réconcialiation des vocabulaires - Attention à la préservation du sens.
Un Thésaurus, couvrant un large éventail thématique peut être exploitable plus largement
Des listes ou nomenclatures spécifiques aux Services/dispositifs : exploitables
> Des possibiltiés larges en aval - la structuration en back office facilite les innovations et adaptations en front-office
Optimisation du travail sémantique
Mais attention : qualité
Travail sur les interfaces Utilisateurs (conception ergonomique)
TAE de Mondeca - http://fr.slideshare.net/thomasfrancart/web-smantique-et-dveloppement-durable
http://www.eionet.europa.eu/gemet/concept?cp=591&langcode=fr&ns=1
Réconcialtion
Des éléments partagés, des éléments spécifiques
http://www.cndp.fr/thesaurus-motbis/site/mtesp.php?mt=5025&t=frCNDP-MOTBIS-001396&tlp=59550&m=&md=&ep=&te=&rech=
http://www.cndp.fr/thesaurus-thesagri/site/lpesp.php?mt=5025&t=frCNDP19378&tlp=61278&m=&md=&ep=&te=&rech=
Risques de pertes au moment de la réconciliation des vocabulaires, les données entre vos bases et DBPedia
Référentiel du SI d'une entreprise :
ensemble des règles, documents et bases de données concernant les identifiants et nomenclatures [3] utilisés par le SI
règles de conception et d'administration du partage de ces références par les diverses composantes du SI.
Administration des données
fonction […] veille[r] à la qualité sémantique d’un système d’information (SI) : absence de synonymes et d’homonymes ; entretien de la cohérence des codages ; accessibilité et clarté de la documentation, etc. [Volle, 2001]
Les définitions sont contenues dans des référentiels
>>>> Qualité orientée Référentiel
Accueillant et évolutif
Prend en compte la spécificité des domaines
Prend en compte le facteur « temps »
Décalage d’évolution entre : normes, pratiques et Référentiel
Accessible et documenté
À destination des SI et des Administrateurs d’autres dispositifs
Réutilisable
Granulaire, Documenté, Administré
Pertinence des normes utilisées
Pertinence des formats d’échanges et de distribution
>>>> Qualité orientée Vocabulaires/Référentiel
Fraîcheur, précision
Impacts de chaque vocabulaire sur les autres
Acceuillant
Prend en compte la spécificité des contextes, des applications
Organisé et structuré
Communs (partagés) / locaux
Spécialisés / globaux
Collections et objets ; objets et ses composants (complexe)
Relations autres : internes ou externes
Extensible et flexible
Concepts / termes, groupes de concepts, structure et relations
Cohérent - à travers le temps
>>>>Qualité orientée Vocabulaires applicatifs
En adéquation avec les usages
Structure (modèle) de la base
Acquisition/Saisie, Recherche
Evolutif
Aligné au référentiel
Sans perte d’information ou de redondance
Cohérent - à travers le temps