SlideShare ist ein Scribd-Unternehmen logo
1 von 45
Les avancées du projet ecoOnto : un
exemple spécifique aux observations
           naturalistes
      Réunion ecoOnto – 29 novembre 2010
          Faculté de Saint Jérôme, Marseille
                    Julie Chabalier
Plan

• Introduction
  – Le projet ecoOnto
  – Les outils collaboratifs


• Le projet ecoOnto
  – Les résultats globaux
  – Un exemple
Le projet ecoOnto
• Conception d’une ontologie de la biodiversité
• Projet open source collaboratif
   –   Soutenu par le MEEDDM, porté par Natural Solutions
   –   Supervisé par un comité scientifique
   –   Actuellement 24 membres
   –   18 mois (initialement janvier 2010 – juillet 2011)
   –   1er rapport d’étape : décembre.
Conception de l’ontologie

• Une conception « bottom-up » en 4 phases
  –   Inventaire des concepts environnementaux
  –   Etude des standards actuels
  –   Modélisation de ontologie de la biodiversité
  –   Enrichissement de l’ontologie et validation
Les outils collaboratifs
• Un site Web
http://www.natural-solutions.eu/nslabs/


• Une liste de diffusion/discussion
ecoonto-project@googlegroups.com


• Un nouveau logo !
http://r21854.ovh.net/xwiki/bin/download/Main/WebHome/logo-ecoOnto.jpg


• Un wiki
http://r21854.ovh.net/xwiki/
ecoOnto Wiki

• Droit d’accès :
   – En lecture à tous
   – En lecture/écriture aux membres (mdp sur demande)


• Modification
   – WYSIWYG
   – Source (syntaxes implémentées : MediaWiki, Confluence,
     JSPWiki, Creole, TWiki, etc.)
L’écriture sur le wiki
L’écriture sur le wiki
Les résultats / WP

WP 1 : Inventaire des concepts environnementaux
      WP1.1. Lister les questions environnementales
      WP1.2. Décomposer les questions
       WP1.3. Définir les concepts impliqués
WP 2 : Etude des standards en biodiversité
WP 3 : Etude des ontologies existantes
WP1 .1 - Lister les questions

    • 35 questions (fr/en)
    • Classées en 3 catégories (Fondation pour la
    Recherche en Biodiversité, avril 2010)
        • Questions scientifiques
        • Questions politiques
        • Questions locales
WP1 .1 - Lister les questions
• Scientifiques : 5 questions
   – Quelles sont les conséquences de l’introduction de la
     coccinelle orientale, Harmonia axyridis Pallas, sur
     l’écosystème européen ?
   – Quelle taille et quelle forme le corridor du Siju-Rewat
     devraient avoir pour améliorer les chances de survies de la
     population locale d'éléphant ?
• Politiques : 12 questions
   – Quelles sont les méthodes pour évaluer la biodiversité de
     ma région ?
   – Comment délimiter le cœur de parc du futur Parc National
     des calanques ?
WP1 .1 - Lister les questions
• Locales : 6 questions
   – Quel est l’impact de la mise en place d’une aire de
     stationnement de poids lourds au niveau de l’aire
     d’autoroute de Vidauban ?
   – Puis-je observer des Bouquetins dans le Parc National des
     Ecrins?
• Non classées : 12 questions
    concernent la collecte de données.
   – Quels sont les principaux protocoles d'échantillonnage
     pour estimer la taille/densité d'une population d'oiseaux ?
   – Combien de quadrats devraient être utilisés pour
     échantillonner efficacement l'aire X ?
WP1 .2 - Décomposer les questions
7 questions ont été décomposées en 52 sous-questions
 Question 22 : Combien de quadrats devraient être utilisés pour
 échantillonner efficacement l'aire X ?
 1. Quelles sont les espèces à observer ?
 2. Quelle est la distribution spatiale des variables à mesurer (en massif, au
 hasard ou uniformément réparties, communes ou rares) ?
 3. Quels sont les protocoles associés aux espèces à observer ?
 4. Quelle est la taille de l’aire à étudier?
 5. Quelles sont les ressources disponibles pour cet échantillonnage ( temps
 et argent) ?
 6. Quels sont les résultats des tests préliminaires sur le terrain ?
WP1 .2 - Définir les concepts
 • 51 concepts définis (fr/en)

Terme         Synonymes    Définition   Référence   Termes
préféré                                             associés


           Plusieurs définitions/concept
           Choix dans le cadre ecoOnto ?
WP1 .2 - Définir les concepts
WP1 .2 - Définir les concepts
• Apport de la décomposition

    7 questions : 15 concepts définis ou à définir
52 sous-questions : 40 concepts définis ou à définir

      + 25 termes (2,7 fois + de termes)
WP2 - Etude des standards actuels


                                Dublin Core       Standards de
                                   EML            métadonnées


              Darwin Core
                                                 GML
             ABCD schema
                                              ISO 19115
         Taxon Concept Schema


Standards de données                              Standards de données
de biodiversité                                   géographiques
WP3 - Etude des ontologies existantes
• 30 ontologies de domaine :
   • Seronto, Oboe, BFO, DOLCE, Gazetter ontology, geonames,
     ENVO, Fly taxonomy, etc.

         Biologie      17    OWL    16
         Géographie    11    OBO    12
         Haut niveau   4     RDFS   2

   • Visualisation : Ontology Browser (v1.4.1), Université de
   Manchester
Ontology Browser : OBOE
A faire …
• Court terme :
   – Valider (choix) les définitions par les experts
   – Ajouter des définitions / questions existantes
     (éventuellement ajouter des questions)
• Moyen terme :
   – Mappings concepts – standards – ontologies
   – Modélisation des concepts manquants
• Long terme :
   – Validation de l’ontologie
Les observations naturalistes


Une observation est une action dont le résultat est une
estimation de la valeur de certaines propriétés d’une
caractéristique d'intérêt. Cette valeur est obtenue en utilisant
une procédure spécifique.
Open Geospatial Consortium
Choix des questions
• Les critères
   – Collecte de données
   – Méthodes d’échantillonnage
   – Identification
   – Préparation de la collecte (recherche d’information
     cartographique, par exemple)
   – Données collectées
Les questions
     • 10 questions
Combien d'observations sont présentes dans le rectangle de sélection ?
Combien d'individus de l'espèce X ont été vus sur la zone Y ?
Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une
population d'oiseaux ?
Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonner
efficacement l'aire X ?
Quelle est la précision et l'exactitude de ce jeu de données ?
Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ?
Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?
Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du
domaine, i.e. taxon le plus élevé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ?
Quelles étaient les valeurs des variables d'environnement pour cet échantillon de données ?
Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
Classification & décomposition

• Non classées
• 10 questions : + 12 sous-questions

            questions simples
Les concepts associés aux questions
• 19 concepts à définir
Combien d'observations sont présentes dans le rectangle de sélection ?
Combien d'individus de l'espèce X ont été vus sur la zone Y ?
Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une
population d'oiseaux ?
Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonner
efficacement l'aire X ?
Quelle est la précision et l'exactitude de ce jeu de données ?
Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ?
Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?
Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du
domaine, i.e. taxon le plus élevé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ?
Quelles étaient les valeurs des variables d'environnement pour cet échantillon de données ?
Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
Les concepts associés aux sous-
                                       questions
  • 8 concepts supplémentaires à définir
Quel est le polygone correspondant à la zone étudiée ?
Combien d’observations se trouvent dans ce polygone ?
Combien d’individus de l’espèce X ont été observés dans ce polygone ?
Quelles sont les espèces à observer ?
Quelle est la distribution spatiale des variables à mesurer (en massif, au hasard ou uniformément,
communes ou rares) ?
Quels sont les protocoles associés à ces espèces ?
Quelles sont les ressources disponibles pour cet échantillonnage ( temps et argent)?
Quels sont les resultats des tests préliminaires sur le terrain ?
Quelle est la date de l’échantillonage ?
Combien d’unités d’échantillonage ont été visitées ?
Les définitions
• Les publications
•   Dajoz R. Précis d'écologie, 615 p, Dunod, 2000.
•   Hellmann J. J., Fowler G. W. (1999) Bias, precision, and accuracy of four measures of species
    richness. Ecological Applications, Vol. 9, No. 3., pp. 824-834.
•   Mackay R.J. and Oldford R.W. (2000) Scientific Method, Statistical Method, and the Speed of
    Light. Working Paper.
•   Madin J., Bowers S., Schildhauer M., Krivov S.,Pennington D., Villa F. (2007) An ontology for
    describing and synthesizing ecological observation data. Ecological Informatics, Vol.2,
    No.3,pp 279-296 .
•   Mayr E. (1940) Speciation phenomena in birds. The American Naturalist
    Vol. 74, No. 752, pp. 249-278
•   Mayr E. (1992) Species Concepts and their Application. The units of evolution: essays on the
    nature of species, Ereshefsky ed. The MIT Press.
•   de Quieroz K., Donoghe M.J. (1990) Phylogenetic systematics and species revisited. Cladistics
    Vol. 6, No. 1, pp 83–90.
•   Ridley M. (1993) Evolution. Journal of Evolutionary Biology, Vol. 6, No. 4, pp 615–617, July
    1993
•   Wiley E. O. (1981) Phylogenetics: the theory and practice of phylogenetic systematics. John
    Wiley and Sons, New York.
Les définitions
• Les glossaires, codes et dictionnaires
•   Glossary for exploring GIS by Nicholas Chrismas
•   Glossary of the Federal Geographic Data Committee
•   Glossary of the Great Lakes Environmental Indicators Project
•   Glossary of terms and acronyms, Fisheries and Aquaculture Department of
    FAO
•   Glossary of statistical terms, Organization for economic co-operation and
    development
•   OceanLink’s Glossary of Common Terms and Definitions in Marine Biology
•   International Code of Zoological Nomenclature 1999
•   Larousse
•   Wiktionary
Mappings avec les standards
• Méthode : mapping syntaxique simple + validation
 Standards            Nb mappings exacts             Nb mappings partiels
 ABCD Schema (2.06)                             2                           26
 Darwin Core                                    1                           12
 (450-2991-1-SP)
 GML                                            2                           8
 (3.2.1)
                      Accuracy (ABCD Schema)           ABCD Schema :
                      Identification (ABCD Schema)     dateLastEdited
                      Taxon (DwC)                      AcquisitionDate
                      Observation (GML)                AccessionDate
                      Polygon (GML)                    MeasurementDate
                                                       …
Mappings avec les ontologies

• Choix des ontologies : observations

    SERONTO : Socio-Ecological Research and Observation
    oNTology

    OBOE : Extensible Observational Ontology
SERONTO core

• Projet européen dont l’objectif est de faciliter
  l’intégration des données de biodiversité à partir des
  sources de données dispersées dans l’union
  européenne.

• ALTER-net : A Long-Term Biodiversity, Ecosystem and
  Awareness Research Network (UE)
SERONTO Core
Mapping SERONTO core

• Méthode : mapping syntaxique simple (classes et/ou
  propriétés)
 Nb mappings exacts       Nb mappings partiels
                      5                          7


 Accuracy                  Landcore_area
 Area                      Political_area
 Population_Size           IntendedSampleSize
 Precision                 hasSample
 Sampling_Protocol         isSampleOf
                           hasSamplingMethod
OBOE
• Ontologie issue du projet SEEK (Science Environment
  for Ecological Knowledge) dont l’objectif était de
  créer une « cyberinfrastructure » pour la recherche
  en biodiversité, environnement et écologie et pour
  éduquer la communauté à l’écoinformatique (projet
  US).
• LTER : Long Term Ecological Research (US)
• http://seek.ecoinformatics.org.
OBOE core
Mapping OBOE core

• Méthode : mapping syntaxique simple (classes et/ou
  propriétés)
 Nb mappings exacts         Nb mappings partiels
                        2                          3


 Observation                protocolFor
 Protocol                   UsesProtocol
                            hasPrecision
Extension OBOE core

• Créer un module observation ecoOnto
  – S’appuie sur les points d’extension décrits dans Madin et
    al. 2007
  – Classification des concepts définis suivant les points
    d’extension :
     • Entity
     • Characteristic
     • Measurement
  – Modélisation des propriétés et classes supplémentaires
Les concepts
• 15 concepts classés (sur 27)

Entity             Characteristic            Measurement
Sample             Date                      SamplingProtocol
Population         Area                      Identification
Polygon            PopulationSize
Quadrat            PopulationDensity
Transect           SpatialPattern
Individu           Criteria
                   EnvironnementalVariable
Les concepts (suite)
• 12 concepts restants
   • 2 concepts existants (oboe:observation, oboe:hasPrecision)
   • 4 non classés (Protocol ≠ oboe:protocol, Resource, Layer,
   TaxonomicKey)
   • 3 concepts  associations (Observer, Accuracy,
   ConfidenceLevel)
   • 3 concepts exclus (Species, Taxon, Result)

• Nouveaux concepts et propriétés
   • 7 classes supplémentaires (FieldSurvey,
   PopulationCharacteristic, SpatialLocation, etc.)
   • 5 propriétés supplémentaires (hasResource, isIdentifiedBy,
   includedEntity,etc.)
La classe Resource
La classe Entity




             Open Geospatial
             Consortium
Les classes Characteristic &
       Measurement
Intégration   seronto:Accuracy
                                                seronto:Area
                                                seronto:Population_Size
Accuracy (ABCD Schema)                         seronto:Precision
 Identification (ABCD Schema)                  seronto:Sampling_Protocol
Taxon (DwC)
 Observation (GML)
 Polygon (GML)
En cours et à suivre …


• Implémentation en OWL-DL
• Validation (cohérence + questions)
Le projet EcoOnto  - avancees.

Weitere ähnliche Inhalte

Andere mochten auch

Mancioni 1º 5 tarea final
Mancioni 1º 5 tarea finalMancioni 1º 5 tarea final
Mancioni 1º 5 tarea finalPabloPereira
 
Mon idole. maría céspedes
Mon idole. maría céspedesMon idole. maría céspedes
Mon idole. maría céspedesSchool
 
Käfer Akademie Jahresrückblick 2014
Käfer Akademie Jahresrückblick 2014Käfer Akademie Jahresrückblick 2014
Käfer Akademie Jahresrückblick 2014Käfer Akademie
 
Trabajo práctico blog nosotros en la web
Trabajo práctico blog nosotros en la webTrabajo práctico blog nosotros en la web
Trabajo práctico blog nosotros en la webPatricia Ferrer
 
4.7 session 46 einheit 6
4.7 session 46 einheit 64.7 session 46 einheit 6
4.7 session 46 einheit 6nblock
 
Lb Tome1 Partie1
Lb Tome1 Partie1Lb Tome1 Partie1
Lb Tome1 Partie1youri59490
 
Mon idole. paula
Mon idole. paulaMon idole. paula
Mon idole. paulaSchool
 
Présentation d’un modèle de réseau de chaleur aux granules dans un village no...
Présentation d’un modèle de réseau de chaleur aux granules dans un village no...Présentation d’un modèle de réseau de chaleur aux granules dans un village no...
Présentation d’un modèle de réseau de chaleur aux granules dans un village no...Comité filière biomasse d'Abitibi-Ouest
 
Trendreport Energiesparen - Wie haben die Deutschen 2013 Energie gespart?
Trendreport Energiesparen - Wie haben die Deutschen 2013 Energie gespart?Trendreport Energiesparen - Wie haben die Deutschen 2013 Energie gespart?
Trendreport Energiesparen - Wie haben die Deutschen 2013 Energie gespart?Grünspar
 
Guia de la buena prescripcion
Guia de la buena prescripcionGuia de la buena prescripcion
Guia de la buena prescripcionraul
 

Andere mochten auch (19)

Les 14 4
Les 14 4Les 14 4
Les 14 4
 
Mancioni 1º 5 tarea final
Mancioni 1º 5 tarea finalMancioni 1º 5 tarea final
Mancioni 1º 5 tarea final
 
Mon idole. maría céspedes
Mon idole. maría céspedesMon idole. maría céspedes
Mon idole. maría céspedes
 
Modèle Disc
Modèle DiscModèle Disc
Modèle Disc
 
Grizzly
GrizzlyGrizzly
Grizzly
 
Lamacaes
LamacaesLamacaes
Lamacaes
 
Best photos 2009
Best photos 2009Best photos 2009
Best photos 2009
 
Käfer Akademie Jahresrückblick 2014
Käfer Akademie Jahresrückblick 2014Käfer Akademie Jahresrückblick 2014
Käfer Akademie Jahresrückblick 2014
 
Trabajo práctico blog nosotros en la web
Trabajo práctico blog nosotros en la webTrabajo práctico blog nosotros en la web
Trabajo práctico blog nosotros en la web
 
4.7 session 46 einheit 6
4.7 session 46 einheit 64.7 session 46 einheit 6
4.7 session 46 einheit 6
 
Lb Tome1 Partie1
Lb Tome1 Partie1Lb Tome1 Partie1
Lb Tome1 Partie1
 
Mon idole. paula
Mon idole. paulaMon idole. paula
Mon idole. paula
 
Présentation d’un modèle de réseau de chaleur aux granules dans un village no...
Présentation d’un modèle de réseau de chaleur aux granules dans un village no...Présentation d’un modèle de réseau de chaleur aux granules dans un village no...
Présentation d’un modèle de réseau de chaleur aux granules dans un village no...
 
Carson & Schwitters
Carson & SchwittersCarson & Schwitters
Carson & Schwitters
 
School leaving exams
School leaving examsSchool leaving exams
School leaving exams
 
Trendreport Energiesparen - Wie haben die Deutschen 2013 Energie gespart?
Trendreport Energiesparen - Wie haben die Deutschen 2013 Energie gespart?Trendreport Energiesparen - Wie haben die Deutschen 2013 Energie gespart?
Trendreport Energiesparen - Wie haben die Deutschen 2013 Energie gespart?
 
Guia de la buena prescripcion
Guia de la buena prescripcionGuia de la buena prescripcion
Guia de la buena prescripcion
 
Seco10_es
Seco10_esSeco10_es
Seco10_es
 
frances
francesfrances
frances
 

Ähnlich wie Le projet EcoOnto - avancees.

Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationcatherine roussey
 
Présentation eco balade-100112
Présentation eco balade-100112Présentation eco balade-100112
Présentation eco balade-100112Natural Solutions
 
Assemblée Générale du projet EGOUT - 11 mai 2023
Assemblée Générale du projet EGOUT - 11 mai 2023Assemblée Générale du projet EGOUT - 11 mai 2023
Assemblée Générale du projet EGOUT - 11 mai 2023Jacob Jeremy
 
Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...Alberto González-Talaván
 
Recherche d'informations sur internet : méthodologie et outils disponibles
Recherche d'informations sur internet : méthodologie et outils disponiblesRecherche d'informations sur internet : méthodologie et outils disponibles
Recherche d'informations sur internet : méthodologie et outils disponiblesURFIST de Paris
 
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...Comment intégrer les termino-ontologies de santé dans le web des données / Ju...
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...pwod
 
Maitriser l'Information Scientifique et Technique en Recherche
Maitriser l'Information Scientifique et Technique en RechercheMaitriser l'Information Scientifique et Technique en Recherche
Maitriser l'Information Scientifique et Technique en RecherchePatricia Volland-Nail
 
En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?Manuel Durand Barthez
 
Recherche d'information et le métier de doctorant
Recherche d'information et le métier de doctorantRecherche d'information et le métier de doctorant
Recherche d'information et le métier de doctorantBessem Aamira
 
Rédaction scientifique_Partie 1
Rédaction scientifique_Partie 1Rédaction scientifique_Partie 1
Rédaction scientifique_Partie 1Ibrahima Sylla
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...kmichel69
 

Ähnlich wie Le projet EcoOnto - avancees. (20)

Ontologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformationOntologies, web de données et SKOS transformation
Ontologies, web de données et SKOS transformation
 
Présentation eco balade-100112
Présentation eco balade-100112Présentation eco balade-100112
Présentation eco balade-100112
 
Assemblée Générale du projet EGOUT - 11 mai 2023
Assemblée Générale du projet EGOUT - 11 mai 2023Assemblée Générale du projet EGOUT - 11 mai 2023
Assemblée Générale du projet EGOUT - 11 mai 2023
 
Skos transformation
Skos transformationSkos transformation
Skos transformation
 
Ns jo bim2011 fr
Ns jo bim2011 frNs jo bim2011 fr
Ns jo bim2011 fr
 
2016 dan8002 formation_documentaire
2016 dan8002 formation_documentaire2016 dan8002 formation_documentaire
2016 dan8002 formation_documentaire
 
Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...Séance 06, Introduction à la publication des données d'échantillonnage dans l...
Séance 06, Introduction à la publication des données d'échantillonnage dans l...
 
ontologie de capteurs
ontologie de capteursontologie de capteurs
ontologie de capteurs
 
Recherche d'informations sur internet : méthodologie et outils disponibles
Recherche d'informations sur internet : méthodologie et outils disponiblesRecherche d'informations sur internet : méthodologie et outils disponibles
Recherche d'informations sur internet : méthodologie et outils disponibles
 
Odonto s4
Odonto s4Odonto s4
Odonto s4
 
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...Comment intégrer les termino-ontologies de santé dans le web des données / Ju...
Comment intégrer les termino-ontologies de santé dans le web des données / Ju...
 
IUT - PPP "métiers de la chimie"- septembre 2014
IUT - PPP "métiers de la chimie"- septembre 2014IUT - PPP "métiers de la chimie"- septembre 2014
IUT - PPP "métiers de la chimie"- septembre 2014
 
Maitriser l'Information Scientifique et Technique en Recherche
Maitriser l'Information Scientifique et Technique en RechercheMaitriser l'Information Scientifique et Technique en Recherche
Maitriser l'Information Scientifique et Technique en Recherche
 
Odonto s4
Odonto s4Odonto s4
Odonto s4
 
En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?En marge du Rang A : quel espace pour la recherche ?
En marge du Rang A : quel espace pour la recherche ?
 
Du projet Esperense vers un réseau d'évaluation de ressources génétiques fore...
Du projet Esperense vers un réseau d'évaluation de ressources génétiques fore...Du projet Esperense vers un réseau d'évaluation de ressources génétiques fore...
Du projet Esperense vers un réseau d'évaluation de ressources génétiques fore...
 
Recherche d'information et le métier de doctorant
Recherche d'information et le métier de doctorantRecherche d'information et le métier de doctorant
Recherche d'information et le métier de doctorant
 
Rédaction scientifique_Partie 1
Rédaction scientifique_Partie 1Rédaction scientifique_Partie 1
Rédaction scientifique_Partie 1
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
 
Gestion des métadonnées. ANR PADOUE
Gestion des métadonnées. ANR PADOUEGestion des métadonnées. ANR PADOUE
Gestion des métadonnées. ANR PADOUE
 

Mehr von jchabalier

ecoOnto - une ontologie pour la biodiversité
ecoOnto - une ontologie pour la biodiversitéecoOnto - une ontologie pour la biodiversité
ecoOnto - une ontologie pour la biodiversitéjchabalier
 
Thesauform - ecoOnto meeting
Thesauform - ecoOnto meetingThesauform - ecoOnto meeting
Thesauform - ecoOnto meetingjchabalier
 
Presentation Natura 2000 - ecoOnto meeting
Presentation Natura 2000 - ecoOnto meetingPresentation Natura 2000 - ecoOnto meeting
Presentation Natura 2000 - ecoOnto meetingjchabalier
 
Les mesures de biodiversite - ecoOnto meeting
Les mesures de biodiversite - ecoOnto meetingLes mesures de biodiversite - ecoOnto meeting
Les mesures de biodiversite - ecoOnto meetingjchabalier
 
Transformation de modèles - ecoOnto meeting
Transformation de modèles - ecoOnto meetingTransformation de modèles - ecoOnto meeting
Transformation de modèles - ecoOnto meetingjchabalier
 
Ontologies introduction - ecoOnto meeting
Ontologies introduction - ecoOnto meetingOntologies introduction - ecoOnto meeting
Ontologies introduction - ecoOnto meetingjchabalier
 
Projet ecoOnto
Projet ecoOntoProjet ecoOnto
Projet ecoOntojchabalier
 
Les standards en biodiversité
Les standards en biodiversitéLes standards en biodiversité
Les standards en biodiversitéjchabalier
 

Mehr von jchabalier (8)

ecoOnto - une ontologie pour la biodiversité
ecoOnto - une ontologie pour la biodiversitéecoOnto - une ontologie pour la biodiversité
ecoOnto - une ontologie pour la biodiversité
 
Thesauform - ecoOnto meeting
Thesauform - ecoOnto meetingThesauform - ecoOnto meeting
Thesauform - ecoOnto meeting
 
Presentation Natura 2000 - ecoOnto meeting
Presentation Natura 2000 - ecoOnto meetingPresentation Natura 2000 - ecoOnto meeting
Presentation Natura 2000 - ecoOnto meeting
 
Les mesures de biodiversite - ecoOnto meeting
Les mesures de biodiversite - ecoOnto meetingLes mesures de biodiversite - ecoOnto meeting
Les mesures de biodiversite - ecoOnto meeting
 
Transformation de modèles - ecoOnto meeting
Transformation de modèles - ecoOnto meetingTransformation de modèles - ecoOnto meeting
Transformation de modèles - ecoOnto meeting
 
Ontologies introduction - ecoOnto meeting
Ontologies introduction - ecoOnto meetingOntologies introduction - ecoOnto meeting
Ontologies introduction - ecoOnto meeting
 
Projet ecoOnto
Projet ecoOntoProjet ecoOnto
Projet ecoOnto
 
Les standards en biodiversité
Les standards en biodiversitéLes standards en biodiversité
Les standards en biodiversité
 

Le projet EcoOnto - avancees.

  • 1. Les avancées du projet ecoOnto : un exemple spécifique aux observations naturalistes Réunion ecoOnto – 29 novembre 2010 Faculté de Saint Jérôme, Marseille Julie Chabalier
  • 2. Plan • Introduction – Le projet ecoOnto – Les outils collaboratifs • Le projet ecoOnto – Les résultats globaux – Un exemple
  • 3. Le projet ecoOnto • Conception d’une ontologie de la biodiversité • Projet open source collaboratif – Soutenu par le MEEDDM, porté par Natural Solutions – Supervisé par un comité scientifique – Actuellement 24 membres – 18 mois (initialement janvier 2010 – juillet 2011) – 1er rapport d’étape : décembre.
  • 4. Conception de l’ontologie • Une conception « bottom-up » en 4 phases – Inventaire des concepts environnementaux – Etude des standards actuels – Modélisation de ontologie de la biodiversité – Enrichissement de l’ontologie et validation
  • 5. Les outils collaboratifs • Un site Web http://www.natural-solutions.eu/nslabs/ • Une liste de diffusion/discussion ecoonto-project@googlegroups.com • Un nouveau logo ! http://r21854.ovh.net/xwiki/bin/download/Main/WebHome/logo-ecoOnto.jpg • Un wiki http://r21854.ovh.net/xwiki/
  • 6. ecoOnto Wiki • Droit d’accès : – En lecture à tous – En lecture/écriture aux membres (mdp sur demande) • Modification – WYSIWYG – Source (syntaxes implémentées : MediaWiki, Confluence, JSPWiki, Creole, TWiki, etc.)
  • 9. Les résultats / WP WP 1 : Inventaire des concepts environnementaux WP1.1. Lister les questions environnementales WP1.2. Décomposer les questions WP1.3. Définir les concepts impliqués WP 2 : Etude des standards en biodiversité WP 3 : Etude des ontologies existantes
  • 10. WP1 .1 - Lister les questions • 35 questions (fr/en) • Classées en 3 catégories (Fondation pour la Recherche en Biodiversité, avril 2010) • Questions scientifiques • Questions politiques • Questions locales
  • 11. WP1 .1 - Lister les questions • Scientifiques : 5 questions – Quelles sont les conséquences de l’introduction de la coccinelle orientale, Harmonia axyridis Pallas, sur l’écosystème européen ? – Quelle taille et quelle forme le corridor du Siju-Rewat devraient avoir pour améliorer les chances de survies de la population locale d'éléphant ? • Politiques : 12 questions – Quelles sont les méthodes pour évaluer la biodiversité de ma région ? – Comment délimiter le cœur de parc du futur Parc National des calanques ?
  • 12. WP1 .1 - Lister les questions • Locales : 6 questions – Quel est l’impact de la mise en place d’une aire de stationnement de poids lourds au niveau de l’aire d’autoroute de Vidauban ? – Puis-je observer des Bouquetins dans le Parc National des Ecrins? • Non classées : 12 questions  concernent la collecte de données. – Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une population d'oiseaux ? – Combien de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ?
  • 13. WP1 .2 - Décomposer les questions 7 questions ont été décomposées en 52 sous-questions Question 22 : Combien de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ? 1. Quelles sont les espèces à observer ? 2. Quelle est la distribution spatiale des variables à mesurer (en massif, au hasard ou uniformément réparties, communes ou rares) ? 3. Quels sont les protocoles associés aux espèces à observer ? 4. Quelle est la taille de l’aire à étudier? 5. Quelles sont les ressources disponibles pour cet échantillonnage ( temps et argent) ? 6. Quels sont les résultats des tests préliminaires sur le terrain ?
  • 14. WP1 .2 - Définir les concepts • 51 concepts définis (fr/en) Terme Synonymes Définition Référence Termes préféré associés  Plusieurs définitions/concept  Choix dans le cadre ecoOnto ?
  • 15. WP1 .2 - Définir les concepts
  • 16. WP1 .2 - Définir les concepts • Apport de la décomposition 7 questions : 15 concepts définis ou à définir 52 sous-questions : 40 concepts définis ou à définir  + 25 termes (2,7 fois + de termes)
  • 17. WP2 - Etude des standards actuels Dublin Core Standards de EML métadonnées Darwin Core GML ABCD schema ISO 19115 Taxon Concept Schema Standards de données Standards de données de biodiversité géographiques
  • 18. WP3 - Etude des ontologies existantes • 30 ontologies de domaine : • Seronto, Oboe, BFO, DOLCE, Gazetter ontology, geonames, ENVO, Fly taxonomy, etc. Biologie 17 OWL 16 Géographie 11 OBO 12 Haut niveau 4 RDFS 2 • Visualisation : Ontology Browser (v1.4.1), Université de Manchester
  • 20. A faire … • Court terme : – Valider (choix) les définitions par les experts – Ajouter des définitions / questions existantes (éventuellement ajouter des questions) • Moyen terme : – Mappings concepts – standards – ontologies – Modélisation des concepts manquants • Long terme : – Validation de l’ontologie
  • 21. Les observations naturalistes Une observation est une action dont le résultat est une estimation de la valeur de certaines propriétés d’une caractéristique d'intérêt. Cette valeur est obtenue en utilisant une procédure spécifique. Open Geospatial Consortium
  • 22. Choix des questions • Les critères – Collecte de données – Méthodes d’échantillonnage – Identification – Préparation de la collecte (recherche d’information cartographique, par exemple) – Données collectées
  • 23. Les questions • 10 questions Combien d'observations sont présentes dans le rectangle de sélection ? Combien d'individus de l'espèce X ont été vus sur la zone Y ? Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une population d'oiseaux ? Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ? Quelle est la précision et l'exactitude de ce jeu de données ? Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ? Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ? Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du domaine, i.e. taxon le plus élevé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ? Quelles étaient les valeurs des variables d'environnement pour cet échantillon de données ? Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
  • 24. Classification & décomposition • Non classées • 10 questions : + 12 sous-questions  questions simples
  • 25. Les concepts associés aux questions • 19 concepts à définir Combien d'observations sont présentes dans le rectangle de sélection ? Combien d'individus de l'espèce X ont été vus sur la zone Y ? Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une population d'oiseaux ? Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonner efficacement l'aire X ? Quelle est la précision et l'exactitude de ce jeu de données ? Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ? Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ? Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du domaine, i.e. taxon le plus élevé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ? Quelles étaient les valeurs des variables d'environnement pour cet échantillon de données ? Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
  • 26. Les concepts associés aux sous- questions • 8 concepts supplémentaires à définir Quel est le polygone correspondant à la zone étudiée ? Combien d’observations se trouvent dans ce polygone ? Combien d’individus de l’espèce X ont été observés dans ce polygone ? Quelles sont les espèces à observer ? Quelle est la distribution spatiale des variables à mesurer (en massif, au hasard ou uniformément, communes ou rares) ? Quels sont les protocoles associés à ces espèces ? Quelles sont les ressources disponibles pour cet échantillonnage ( temps et argent)? Quels sont les resultats des tests préliminaires sur le terrain ? Quelle est la date de l’échantillonage ? Combien d’unités d’échantillonage ont été visitées ?
  • 27. Les définitions • Les publications • Dajoz R. Précis d'écologie, 615 p, Dunod, 2000. • Hellmann J. J., Fowler G. W. (1999) Bias, precision, and accuracy of four measures of species richness. Ecological Applications, Vol. 9, No. 3., pp. 824-834. • Mackay R.J. and Oldford R.W. (2000) Scientific Method, Statistical Method, and the Speed of Light. Working Paper. • Madin J., Bowers S., Schildhauer M., Krivov S.,Pennington D., Villa F. (2007) An ontology for describing and synthesizing ecological observation data. Ecological Informatics, Vol.2, No.3,pp 279-296 . • Mayr E. (1940) Speciation phenomena in birds. The American Naturalist Vol. 74, No. 752, pp. 249-278 • Mayr E. (1992) Species Concepts and their Application. The units of evolution: essays on the nature of species, Ereshefsky ed. The MIT Press. • de Quieroz K., Donoghe M.J. (1990) Phylogenetic systematics and species revisited. Cladistics Vol. 6, No. 1, pp 83–90. • Ridley M. (1993) Evolution. Journal of Evolutionary Biology, Vol. 6, No. 4, pp 615–617, July 1993 • Wiley E. O. (1981) Phylogenetics: the theory and practice of phylogenetic systematics. John Wiley and Sons, New York.
  • 28. Les définitions • Les glossaires, codes et dictionnaires • Glossary for exploring GIS by Nicholas Chrismas • Glossary of the Federal Geographic Data Committee • Glossary of the Great Lakes Environmental Indicators Project • Glossary of terms and acronyms, Fisheries and Aquaculture Department of FAO • Glossary of statistical terms, Organization for economic co-operation and development • OceanLink’s Glossary of Common Terms and Definitions in Marine Biology • International Code of Zoological Nomenclature 1999 • Larousse • Wiktionary
  • 29. Mappings avec les standards • Méthode : mapping syntaxique simple + validation Standards Nb mappings exacts Nb mappings partiels ABCD Schema (2.06) 2 26 Darwin Core 1 12 (450-2991-1-SP) GML 2 8 (3.2.1) Accuracy (ABCD Schema) ABCD Schema : Identification (ABCD Schema) dateLastEdited Taxon (DwC) AcquisitionDate Observation (GML) AccessionDate Polygon (GML) MeasurementDate …
  • 30. Mappings avec les ontologies • Choix des ontologies : observations  SERONTO : Socio-Ecological Research and Observation oNTology  OBOE : Extensible Observational Ontology
  • 31. SERONTO core • Projet européen dont l’objectif est de faciliter l’intégration des données de biodiversité à partir des sources de données dispersées dans l’union européenne. • ALTER-net : A Long-Term Biodiversity, Ecosystem and Awareness Research Network (UE)
  • 33. Mapping SERONTO core • Méthode : mapping syntaxique simple (classes et/ou propriétés) Nb mappings exacts Nb mappings partiels 5 7 Accuracy Landcore_area Area Political_area Population_Size IntendedSampleSize Precision hasSample Sampling_Protocol isSampleOf hasSamplingMethod
  • 34. OBOE • Ontologie issue du projet SEEK (Science Environment for Ecological Knowledge) dont l’objectif était de créer une « cyberinfrastructure » pour la recherche en biodiversité, environnement et écologie et pour éduquer la communauté à l’écoinformatique (projet US). • LTER : Long Term Ecological Research (US) • http://seek.ecoinformatics.org.
  • 36. Mapping OBOE core • Méthode : mapping syntaxique simple (classes et/ou propriétés) Nb mappings exacts Nb mappings partiels 2 3 Observation protocolFor Protocol UsesProtocol hasPrecision
  • 37. Extension OBOE core • Créer un module observation ecoOnto – S’appuie sur les points d’extension décrits dans Madin et al. 2007 – Classification des concepts définis suivant les points d’extension : • Entity • Characteristic • Measurement – Modélisation des propriétés et classes supplémentaires
  • 38. Les concepts • 15 concepts classés (sur 27) Entity Characteristic Measurement Sample Date SamplingProtocol Population Area Identification Polygon PopulationSize Quadrat PopulationDensity Transect SpatialPattern Individu Criteria EnvironnementalVariable
  • 39. Les concepts (suite) • 12 concepts restants • 2 concepts existants (oboe:observation, oboe:hasPrecision) • 4 non classés (Protocol ≠ oboe:protocol, Resource, Layer, TaxonomicKey) • 3 concepts  associations (Observer, Accuracy, ConfidenceLevel) • 3 concepts exclus (Species, Taxon, Result) • Nouveaux concepts et propriétés • 7 classes supplémentaires (FieldSurvey, PopulationCharacteristic, SpatialLocation, etc.) • 5 propriétés supplémentaires (hasResource, isIdentifiedBy, includedEntity,etc.)
  • 41. La classe Entity Open Geospatial Consortium
  • 42. Les classes Characteristic & Measurement
  • 43. Intégration seronto:Accuracy  seronto:Area  seronto:Population_Size Accuracy (ABCD Schema) seronto:Precision  Identification (ABCD Schema)  seronto:Sampling_Protocol Taxon (DwC)  Observation (GML)  Polygon (GML)
  • 44. En cours et à suivre … • Implémentation en OWL-DL • Validation (cohérence + questions)