SlideShare ist ein Scribd-Unternehmen logo
1 von 27
Apport des thésaurus pour le catalogage et la
localisation des données environnementales :
Exemple avec l’outil MDweb
J.C. Desconnets
jean-christophe.Desconnets@ird.fr
Plan
 Pour quels besoins ?
 L’outil de catalogage MDweb
 Périmètre fonctionnel
 Eléments techniques
 Apport des thésaurus
 Problématique traitée
 Propositions
 Implémentation actuelle dans MDweb
 Pistes de travaux
 Quelques mots sur le projet MDweb
Pour quels besoins ?
 Offrir un point de découverte des données à une
communauté d’intérêts,
 Partager ses données dans le cadre de systèmes
d’information distribués
 Pallier à l’hétérogénéité des données et des procédures de
productions.
Ex : Directive INSPIRE
Spécificité du contexte
 Spécificité des données :
 Un point commun : la dimension spatiale,
 Nature, modèle, format hétérogènes (données matricielles, vectorielles, observations,...)
 Spécificité des usagers :
 Diversité de point de vue et d’expertise,
 Au delà des thématiques traitées, 3 grands rôles
Périmètre fonctionnel : localiser, accéder
L’outil libre MDweb : editer, publier
L’outil libre MDweb : administrer
MDweb : Principes de conception
• Une Architecture Orientée Service qui décomposent les fonctionnalités en
services web (un service = une unité fonctionnelle)
• Les composants de cette architecture sont construits sur les standards
industriels du domaine (OGC, ISO, W3C, OASIS, ...),
• La structuration des métadonnées est normalisée.
• Conforme à la Directive INSPIRE
Norme ISO
ISO 19115, ISO 19139…Standards W3C, OASIS
XML, SOAP…
INSPIRE
CSW INSPIRE…
MDweb : éléments techniques
MDweb repose sur :
 L’utilisation d’un SGBD pour le
stockage des métadonnées, bati
sur un métamodèle,
 Un serveur d’application Java
afin de déployer l’application.
 L’utilisation de l’environnement
JAVA et d’une machine virtuelle
JAVA.
Apports des thésaurus : problématique
traitée
• Améliorer le processus de localisation pour différents niveaux
d’expertise et de points de vue
• Problématique induite par la diversité des rôles et expertise
•ex : agro-forestier veut classifier son massif, un hydrologue suivre le changement
d’occupation de son bassin, versant, un conservateur suivre l’évolution du trait de
côte, ...
• et la nature des métadonnées qui représentent le point de vue
du producteur
Apports des thésaurus : problématique
traitée
Nature de la métadonnée :
• Basé sur des standards techniques: ISO, TDWG, OGC, ... (vision producteur)
• Peu de sémantique, ou non maîtrisée, pour décrire le contenu (vision consommateur)
Propositions apportées par MDweb
S’appuyer sur un référentiel thématique pour apporter et contrôler la
sémantique du domaine dans les phases de création des métadonnées et
de recherche.
Référentiel thématique décrit, pour une communaute donnée, la semantique du domaine
considére par l'intermediaire de modèles de connaissances explicites. Il constitue le
vecteur de l'intéroperabilité sémantique entre acteurs pour partager la compréhension
des concepts du domaine
Propositions apportées par MDweb
1. Contrôler l’annotation sémantique des métadonnées
« descriptives » lors de la phase d’édition
Propositions apportées par MDweb
2. Aider l’utilisateur à formuler ou reformuler le critère Quoi ?
Implémentation actuelle : représentation
du référentiel
• S’appuie sur la notion de thésaurus
• Représentation par un vocabulaire RDF pour la représentation de
schémas de concepts : SKOS (W3C)
• Utilisation des éléments « coeur »
Implémentation actuelle : Stockage
Implémentation actuelle : Accès
•Service web (REST) basé sur l’API
GEMET (EOINET)
•Différentes méthodes :
• Accès aux différentes propriétés,
• Méthode de calcul d’occurences de
termes
• Méthode de regroupement des
occurences
Implémentation actuelle : utilisation pour
l’édition des métadonnées
Composant d’auto-complétion allant chercher les skos:prefLabel
selon la langue avec getConceptsMatchingKeyword(): Concept[]
Implémentation actuelle : utilisation pour la
recherche
• Objet : accompagner l’utilisateur dans la phase de recherche,
notamment sur la définition du critère sémantique « Quoi ? »
• 3 composants :
• Composant d’auto complétion,
• Composant d’exploration du thésaurus,
• Composant de navigation.
Implémentation actuelle : utilisation pour la
recherche
Composant d’auto-complétion
proposant les termes ayant été
utilisés :
• Nécessite le calcul des occurences
des termes pour chacune des fiches
de métadonnées publiées
• Supporte le calcul sur plusieurs
catalogues (via le service CSW)
Implémentation actuelle : utilisation pour la
recherche
Composant d’exploration du thésaurus
• Objet : Lancer une recherche à partir de la découverte du vocabulaire, pour les non
experts du domaine
• Représentation de la hiérarchie (skos:Broader; skos:Narrower)
• regroupement ascendant des occurences de termes
Implémentation actuelle : utilisation pour la
recherche
Composant de navigation
Objet : poursuivre une recherche en parcourant le
réseau de relations entre terme. Pré-condition :
recherche lancée sur un terme du thésaurus
2 modes :
• Pouvoir « étendre » la recherche sur un autre terme
• Pourvoir « resteindre » avec le terme intial et le terme
choisi « terme initial AND nouveau terme »
Implémentation actuelle : gestion du thésaurus
• Gestionnaire de thésaurus
multi-lingue :
• Edition des propriétés
SKOS
• 2 vues : à plat, en réseau
Retour d’experiences
Une approche à adapter selon la nature des catalogues
Typologie de catalogue :
• Catalogue producteur de données (IGN, CNES, ...) : création des métadonnées au sein du
processus de production > métadonnées où la sémantique sera peu discriminante (homogénéité
du contenu sur un grand ensemble de jeu de données)
•Catalogue des prosumers (Projets environnementaux) : création des métadonnées à postériori,
intervention manuelle pour créer les métadonnées, jeu de données plus hétérogènes à tous les
points de vue (contenu, format, modèle, ...)
Notre Ascenceur
 Résoudre l’hétérogénéité des métadonnées > ontologie cadre de
métadonnées environnementales
 Représenter les métadonnées en RDF et les interroger en SPARQL
pour étendre les capacités de recherche
 Ajouter un point d’entrée SPARQL (end point) à la plateforme
existante
Quelques mots sur le projet MDweb
Licence : Un outil libre, sous license LGPL 3.0
version actuelle : 2.3, en cours 3.0 (celle présentée)
Resource en ligne www.mdweb-project.org
Communautés : variée : recherche, producteur, collectivités
 10 000 hits (Téléchargement), 100 users sur le forum
Contributeurs :
Derniers projets phares

Weitere ähnliche Inhalte

Ähnlich wie Apport des thésaurus pour le catalogage et la localisation des données environnementales : exemple avec l'outil MDweb

MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...Desconnets Jean-Christophe
 
Séminaire Inria IST - Référentiels et interoperabilité (2)
Séminaire Inria IST - Référentiels et interoperabilité (2)Séminaire Inria IST - Référentiels et interoperabilité (2)
Séminaire Inria IST - Référentiels et interoperabilité (2)Antoine Isaac
 
MDweb: outil libre de catalogage et de localisation de l'information
MDweb: outil libre de catalogage et de localisation de l'informationMDweb: outil libre de catalogage et de localisation de l'information
MDweb: outil libre de catalogage et de localisation de l'informationDesconnets Jean-Christophe
 
Service sémantique de découverte de données géospatiales
Service sémantique de découverte de données géospatialesService sémantique de découverte de données géospatiales
Service sémantique de découverte de données géospatialesACSG Section Montréal
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022François-Xavier Boffy
 
Créer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libresCréer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libresRobert Viseur
 
03 Web Semantique
03  Web Semantique03  Web Semantique
03 Web Semantiquebadirh
 
Présentation de Claire Sibille et Michel Jacobson
Présentation de Claire Sibille et Michel JacobsonPrésentation de Claire Sibille et Michel Jacobson
Présentation de Claire Sibille et Michel JacobsonAssociationAF
 
Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...Alexandre Monnin
 
Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationcatherine roussey
 
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...ABES
 
Ressources normalisation
Ressources normalisationRessources normalisation
Ressources normalisationrazougmed
 
Alain Dubois, Tobias Wildi. Le Matterhorn RDF Data Model: Description archivi...
Alain Dubois, Tobias Wildi. Le Matterhorn RDF Data Model: Description archivi...Alain Dubois, Tobias Wildi. Le Matterhorn RDF Data Model: Description archivi...
Alain Dubois, Tobias Wildi. Le Matterhorn RDF Data Model: Description archivi...Tobias Wildi
 
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationMasterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationAntidot
 

Ähnlich wie Apport des thésaurus pour le catalogage et la localisation des données environnementales : exemple avec l'outil MDweb (20)

MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...MDweb: un composant pour le catalogage et la localisation de l'information en...
MDweb: un composant pour le catalogage et la localisation de l'information en...
 
Présentation cice telos
Présentation cice   telosPrésentation cice   telos
Présentation cice telos
 
Séminaire Inria IST - Référentiels et interoperabilité (2)
Séminaire Inria IST - Référentiels et interoperabilité (2)Séminaire Inria IST - Référentiels et interoperabilité (2)
Séminaire Inria IST - Référentiels et interoperabilité (2)
 
MDweb: outil libre de catalogage et de localisation de l'information
MDweb: outil libre de catalogage et de localisation de l'informationMDweb: outil libre de catalogage et de localisation de l'information
MDweb: outil libre de catalogage et de localisation de l'information
 
Service sémantique de découverte de données géospatiales
Service sémantique de découverte de données géospatialesService sémantique de découverte de données géospatiales
Service sémantique de découverte de données géospatiales
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022
 
Le Matterhorn RDF Data Model
Le Matterhorn RDF Data ModelLe Matterhorn RDF Data Model
Le Matterhorn RDF Data Model
 
Créer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libresCréer un moteur de recherche avec des logiciels libres
Créer un moteur de recherche avec des logiciels libres
 
03 Web Semantique
03  Web Semantique03  Web Semantique
03 Web Semantique
 
Présentation de Claire Sibille et Michel Jacobson
Présentation de Claire Sibille et Michel JacobsonPrésentation de Claire Sibille et Michel Jacobson
Présentation de Claire Sibille et Michel Jacobson
 
Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...Le Web et son architecture : Pour une critique philosophique de la notion d’u...
Le Web et son architecture : Pour une critique philosophique de la notion d’u...
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
Le studio SAPHIR pour segmenter et décrire des documents audiovisuels, visuel...
Le studio SAPHIR pour segmenter et décrire des documents audiovisuels, visuel...Le studio SAPHIR pour segmenter et décrire des documents audiovisuels, visuel...
Le studio SAPHIR pour segmenter et décrire des documents audiovisuels, visuel...
 
Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformation
 
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
Prenez le train de la Transition bibliographique - Journée Systèmes & Données...
 
Skos transformation
Skos transformationSkos transformation
Skos transformation
 
Ressources normalisation
Ressources normalisationRessources normalisation
Ressources normalisation
 
Alain Dubois, Tobias Wildi. Le Matterhorn RDF Data Model: Description archivi...
Alain Dubois, Tobias Wildi. Le Matterhorn RDF Data Model: Description archivi...Alain Dubois, Tobias Wildi. Le Matterhorn RDF Data Model: Description archivi...
Alain Dubois, Tobias Wildi. Le Matterhorn RDF Data Model: Description archivi...
 
Liste des fonctionnalités du CMS Rubedo
Liste des fonctionnalités du CMS RubedoListe des fonctionnalités du CMS Rubedo
Liste des fonctionnalités du CMS Rubedo
 
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'informationMasterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
Masterclasse i-expo 2011 : Pour un véritable accès unifié à l'information
 

Mehr von Desconnets Jean-Christophe

Eopower Resource Facility and connection with others resource facilities
Eopower Resource Facility and connection with others resource facilitiesEopower Resource Facility and connection with others resource facilities
Eopower Resource Facility and connection with others resource facilitiesDesconnets Jean-Christophe
 
Eopower Resource Facility and connection with others resource facilities
Eopower Resource Facility and connection with others resource facilitiesEopower Resource Facility and connection with others resource facilities
Eopower Resource Facility and connection with others resource facilitiesDesconnets Jean-Christophe
 
WGCapD Collaboration with EOPOWER on Resource facility
WGCapD Collaboration with EOPOWER on Resource facilityWGCapD Collaboration with EOPOWER on Resource facility
WGCapD Collaboration with EOPOWER on Resource facilityDesconnets Jean-Christophe
 
Proposition de structuration des métadonnées en géosciences: spécificité de l...
Proposition de structuration des métadonnées en géosciences: spécificité de l...Proposition de structuration des métadonnées en géosciences: spécificité de l...
Proposition de structuration des métadonnées en géosciences: spécificité de l...Desconnets Jean-Christophe
 
Approche pour la constitution et la mise en oeuvre des systèmes d'information...
Approche pour la constitution et la mise en oeuvre des systèmes d'information...Approche pour la constitution et la mise en oeuvre des systèmes d'information...
Approche pour la constitution et la mise en oeuvre des systèmes d'information...Desconnets Jean-Christophe
 
Les métadonnées pour la mutualisation de l'information géographique: expérien...
Les métadonnées pour la mutualisation de l'information géographique: expérien...Les métadonnées pour la mutualisation de l'information géographique: expérien...
Les métadonnées pour la mutualisation de l'information géographique: expérien...Desconnets Jean-Christophe
 
using a semantic approach for a cataloguing service
using a semantic approach for a cataloguing serviceusing a semantic approach for a cataloguing service
using a semantic approach for a cataloguing serviceDesconnets Jean-Christophe
 
spatial data infrastructure : data modelling and web services for data access
spatial data infrastructure : data modelling and web services for data accessspatial data infrastructure : data modelling and web services for data access
spatial data infrastructure : data modelling and web services for data accessDesconnets Jean-Christophe
 
spatial data infrastructure : issues and concepts
spatial data infrastructure : issues and conceptsspatial data infrastructure : issues and concepts
spatial data infrastructure : issues and conceptsDesconnets Jean-Christophe
 
Mutualization of environmental data and knowledge
Mutualization of environmental data and knowledgeMutualization of environmental data and knowledge
Mutualization of environmental data and knowledgeDesconnets Jean-Christophe
 
infrastructure de données spatiales: notions et enjeux
infrastructure de données spatiales: notions et enjeuxinfrastructure de données spatiales: notions et enjeux
infrastructure de données spatiales: notions et enjeuxDesconnets Jean-Christophe
 
Harmonisation of data and metadata models. metadata point of view
Harmonisation of data and metadata models. metadata point of viewHarmonisation of data and metadata models. metadata point of view
Harmonisation of data and metadata models. metadata point of viewDesconnets Jean-Christophe
 
metadata profiles for protected sites. analysis and propositions for annex III
metadata profiles for protected sites. analysis and propositions for annex IIImetadata profiles for protected sites. analysis and propositions for annex III
metadata profiles for protected sites. analysis and propositions for annex IIIDesconnets Jean-Christophe
 
Metadata specification at work: some examples of INSPIRE use cases with a cat...
Metadata specification at work: some examples of INSPIRE use cases with a cat...Metadata specification at work: some examples of INSPIRE use cases with a cat...
Metadata specification at work: some examples of INSPIRE use cases with a cat...Desconnets Jean-Christophe
 
Méthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnéesMéthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnéesDesconnets Jean-Christophe
 

Mehr von Desconnets Jean-Christophe (20)

How to populate the GEONETCAB portal ?
How to populate the GEONETCAB portal ? How to populate the GEONETCAB portal ?
How to populate the GEONETCAB portal ?
 
Eopower Resource Facility and connection with others resource facilities
Eopower Resource Facility and connection with others resource facilitiesEopower Resource Facility and connection with others resource facilities
Eopower Resource Facility and connection with others resource facilities
 
Eopower Resource Facility and connection with others resource facilities
Eopower Resource Facility and connection with others resource facilitiesEopower Resource Facility and connection with others resource facilities
Eopower Resource Facility and connection with others resource facilities
 
WGCapD Collaboration with EOPOWER on Resource facility
WGCapD Collaboration with EOPOWER on Resource facilityWGCapD Collaboration with EOPOWER on Resource facility
WGCapD Collaboration with EOPOWER on Resource facility
 
GEOCAB portal : GEO Capacity Portal
GEOCAB portal : GEO Capacity PortalGEOCAB portal : GEO Capacity Portal
GEOCAB portal : GEO Capacity Portal
 
Proposition de structuration des métadonnées en géosciences: spécificité de l...
Proposition de structuration des métadonnées en géosciences: spécificité de l...Proposition de structuration des métadonnées en géosciences: spécificité de l...
Proposition de structuration des métadonnées en géosciences: spécificité de l...
 
Gestion des métadonnées. ANR PADOUE
Gestion des métadonnées. ANR PADOUEGestion des métadonnées. ANR PADOUE
Gestion des métadonnées. ANR PADOUE
 
Approche pour la constitution et la mise en oeuvre des systèmes d'information...
Approche pour la constitution et la mise en oeuvre des systèmes d'information...Approche pour la constitution et la mise en oeuvre des systèmes d'information...
Approche pour la constitution et la mise en oeuvre des systèmes d'information...
 
Les métadonnées pour la mutualisation de l'information géographique: expérien...
Les métadonnées pour la mutualisation de l'information géographique: expérien...Les métadonnées pour la mutualisation de l'information géographique: expérien...
Les métadonnées pour la mutualisation de l'information géographique: expérien...
 
using a semantic approach for a cataloguing service
using a semantic approach for a cataloguing serviceusing a semantic approach for a cataloguing service
using a semantic approach for a cataloguing service
 
spatial data infrastructure : data modelling and web services for data access
spatial data infrastructure : data modelling and web services for data accessspatial data infrastructure : data modelling and web services for data access
spatial data infrastructure : data modelling and web services for data access
 
spatial data infrastructure : issues and concepts
spatial data infrastructure : issues and conceptsspatial data infrastructure : issues and concepts
spatial data infrastructure : issues and concepts
 
Mutualization of environmental data and knowledge
Mutualization of environmental data and knowledgeMutualization of environmental data and knowledge
Mutualization of environmental data and knowledge
 
infrastructure de données spatiales: notions et enjeux
infrastructure de données spatiales: notions et enjeuxinfrastructure de données spatiales: notions et enjeux
infrastructure de données spatiales: notions et enjeux
 
the capacity building resource access portal
the capacity building resource access portal the capacity building resource access portal
the capacity building resource access portal
 
Harmonisation of data and metadata models. metadata point of view
Harmonisation of data and metadata models. metadata point of viewHarmonisation of data and metadata models. metadata point of view
Harmonisation of data and metadata models. metadata point of view
 
metadata profiles for protected sites. analysis and propositions for annex III
metadata profiles for protected sites. analysis and propositions for annex IIImetadata profiles for protected sites. analysis and propositions for annex III
metadata profiles for protected sites. analysis and propositions for annex III
 
Metadata specification at work: some examples of INSPIRE use cases with a cat...
Metadata specification at work: some examples of INSPIRE use cases with a cat...Metadata specification at work: some examples of INSPIRE use cases with a cat...
Metadata specification at work: some examples of INSPIRE use cases with a cat...
 
Méthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnéesMéthodologie de mise en place d'observatoires virtuels via les métadonnées
Méthodologie de mise en place d'observatoires virtuels via les métadonnées
 
Observation and measurement data model
Observation and measurement data modelObservation and measurement data model
Observation and measurement data model
 

Kürzlich hochgeladen

Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Ville de Châteauguay
 
comprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestioncomprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestionyakinekaidouchi1
 
Algo II: les files cours + exercices corrigés
Algo II: les files cours + exercices corrigésAlgo II: les files cours + exercices corrigés
Algo II: les files cours + exercices corrigésSana REFAI
 
conception d'un batiment r+4 comparative de defferente ariante de plancher
conception d'un  batiment  r+4 comparative de defferente ariante de plancherconception d'un  batiment  r+4 comparative de defferente ariante de plancher
conception d'un batiment r+4 comparative de defferente ariante de planchermansouriahlam
 
firefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdffirefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdffirstjob4
 
optimisation logistique MLT_231102_155827.pdf
optimisation logistique  MLT_231102_155827.pdfoptimisation logistique  MLT_231102_155827.pdf
optimisation logistique MLT_231102_155827.pdfSoukainaMounawir
 

Kürzlich hochgeladen (7)

Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
Présentation_Soirée-Information_ Surverse_Thibert _30 avril 2024
 
comprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestioncomprehension de DDMRP dans le domaine de gestion
comprehension de DDMRP dans le domaine de gestion
 
Algo II: les files cours + exercices corrigés
Algo II: les files cours + exercices corrigésAlgo II: les files cours + exercices corrigés
Algo II: les files cours + exercices corrigés
 
conception d'un batiment r+4 comparative de defferente ariante de plancher
conception d'un  batiment  r+4 comparative de defferente ariante de plancherconception d'un  batiment  r+4 comparative de defferente ariante de plancher
conception d'un batiment r+4 comparative de defferente ariante de plancher
 
JTC 2024 Bâtiment et Photovoltaïque.pdf
JTC 2024  Bâtiment et Photovoltaïque.pdfJTC 2024  Bâtiment et Photovoltaïque.pdf
JTC 2024 Bâtiment et Photovoltaïque.pdf
 
firefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdffirefly algoriyhm sac a dos step by step .pdf
firefly algoriyhm sac a dos step by step .pdf
 
optimisation logistique MLT_231102_155827.pdf
optimisation logistique  MLT_231102_155827.pdfoptimisation logistique  MLT_231102_155827.pdf
optimisation logistique MLT_231102_155827.pdf
 

Apport des thésaurus pour le catalogage et la localisation des données environnementales : exemple avec l'outil MDweb

  • 1. Apport des thésaurus pour le catalogage et la localisation des données environnementales : Exemple avec l’outil MDweb J.C. Desconnets jean-christophe.Desconnets@ird.fr
  • 2. Plan  Pour quels besoins ?  L’outil de catalogage MDweb  Périmètre fonctionnel  Eléments techniques  Apport des thésaurus  Problématique traitée  Propositions  Implémentation actuelle dans MDweb  Pistes de travaux  Quelques mots sur le projet MDweb
  • 3. Pour quels besoins ?  Offrir un point de découverte des données à une communauté d’intérêts,  Partager ses données dans le cadre de systèmes d’information distribués  Pallier à l’hétérogénéité des données et des procédures de productions. Ex : Directive INSPIRE
  • 4. Spécificité du contexte  Spécificité des données :  Un point commun : la dimension spatiale,  Nature, modèle, format hétérogènes (données matricielles, vectorielles, observations,...)  Spécificité des usagers :  Diversité de point de vue et d’expertise,  Au delà des thématiques traitées, 3 grands rôles
  • 5. Périmètre fonctionnel : localiser, accéder
  • 6. L’outil libre MDweb : editer, publier
  • 7. L’outil libre MDweb : administrer
  • 8. MDweb : Principes de conception • Une Architecture Orientée Service qui décomposent les fonctionnalités en services web (un service = une unité fonctionnelle) • Les composants de cette architecture sont construits sur les standards industriels du domaine (OGC, ISO, W3C, OASIS, ...), • La structuration des métadonnées est normalisée. • Conforme à la Directive INSPIRE Norme ISO ISO 19115, ISO 19139…Standards W3C, OASIS XML, SOAP… INSPIRE CSW INSPIRE…
  • 9. MDweb : éléments techniques MDweb repose sur :  L’utilisation d’un SGBD pour le stockage des métadonnées, bati sur un métamodèle,  Un serveur d’application Java afin de déployer l’application.  L’utilisation de l’environnement JAVA et d’une machine virtuelle JAVA.
  • 10. Apports des thésaurus : problématique traitée • Améliorer le processus de localisation pour différents niveaux d’expertise et de points de vue • Problématique induite par la diversité des rôles et expertise •ex : agro-forestier veut classifier son massif, un hydrologue suivre le changement d’occupation de son bassin, versant, un conservateur suivre l’évolution du trait de côte, ... • et la nature des métadonnées qui représentent le point de vue du producteur
  • 11. Apports des thésaurus : problématique traitée Nature de la métadonnée : • Basé sur des standards techniques: ISO, TDWG, OGC, ... (vision producteur) • Peu de sémantique, ou non maîtrisée, pour décrire le contenu (vision consommateur)
  • 12. Propositions apportées par MDweb S’appuyer sur un référentiel thématique pour apporter et contrôler la sémantique du domaine dans les phases de création des métadonnées et de recherche. Référentiel thématique décrit, pour une communaute donnée, la semantique du domaine considére par l'intermediaire de modèles de connaissances explicites. Il constitue le vecteur de l'intéroperabilité sémantique entre acteurs pour partager la compréhension des concepts du domaine
  • 13. Propositions apportées par MDweb 1. Contrôler l’annotation sémantique des métadonnées « descriptives » lors de la phase d’édition
  • 14. Propositions apportées par MDweb 2. Aider l’utilisateur à formuler ou reformuler le critère Quoi ?
  • 15. Implémentation actuelle : représentation du référentiel • S’appuie sur la notion de thésaurus • Représentation par un vocabulaire RDF pour la représentation de schémas de concepts : SKOS (W3C) • Utilisation des éléments « coeur »
  • 17. Implémentation actuelle : Accès •Service web (REST) basé sur l’API GEMET (EOINET) •Différentes méthodes : • Accès aux différentes propriétés, • Méthode de calcul d’occurences de termes • Méthode de regroupement des occurences
  • 18. Implémentation actuelle : utilisation pour l’édition des métadonnées Composant d’auto-complétion allant chercher les skos:prefLabel selon la langue avec getConceptsMatchingKeyword(): Concept[]
  • 19. Implémentation actuelle : utilisation pour la recherche • Objet : accompagner l’utilisateur dans la phase de recherche, notamment sur la définition du critère sémantique « Quoi ? » • 3 composants : • Composant d’auto complétion, • Composant d’exploration du thésaurus, • Composant de navigation.
  • 20. Implémentation actuelle : utilisation pour la recherche Composant d’auto-complétion proposant les termes ayant été utilisés : • Nécessite le calcul des occurences des termes pour chacune des fiches de métadonnées publiées • Supporte le calcul sur plusieurs catalogues (via le service CSW)
  • 21. Implémentation actuelle : utilisation pour la recherche Composant d’exploration du thésaurus • Objet : Lancer une recherche à partir de la découverte du vocabulaire, pour les non experts du domaine • Représentation de la hiérarchie (skos:Broader; skos:Narrower) • regroupement ascendant des occurences de termes
  • 22. Implémentation actuelle : utilisation pour la recherche Composant de navigation Objet : poursuivre une recherche en parcourant le réseau de relations entre terme. Pré-condition : recherche lancée sur un terme du thésaurus 2 modes : • Pouvoir « étendre » la recherche sur un autre terme • Pourvoir « resteindre » avec le terme intial et le terme choisi « terme initial AND nouveau terme »
  • 23. Implémentation actuelle : gestion du thésaurus • Gestionnaire de thésaurus multi-lingue : • Edition des propriétés SKOS • 2 vues : à plat, en réseau
  • 24. Retour d’experiences Une approche à adapter selon la nature des catalogues Typologie de catalogue : • Catalogue producteur de données (IGN, CNES, ...) : création des métadonnées au sein du processus de production > métadonnées où la sémantique sera peu discriminante (homogénéité du contenu sur un grand ensemble de jeu de données) •Catalogue des prosumers (Projets environnementaux) : création des métadonnées à postériori, intervention manuelle pour créer les métadonnées, jeu de données plus hétérogènes à tous les points de vue (contenu, format, modèle, ...)
  • 25. Notre Ascenceur  Résoudre l’hétérogénéité des métadonnées > ontologie cadre de métadonnées environnementales  Représenter les métadonnées en RDF et les interroger en SPARQL pour étendre les capacités de recherche  Ajouter un point d’entrée SPARQL (end point) à la plateforme existante
  • 26. Quelques mots sur le projet MDweb Licence : Un outil libre, sous license LGPL 3.0 version actuelle : 2.3, en cours 3.0 (celle présentée) Resource en ligne www.mdweb-project.org Communautés : variée : recherche, producteur, collectivités  10 000 hits (Téléchargement), 100 users sur le forum Contributeurs :