1. Les avancées du projet ecoOnto : un
exemple spécifique aux observations
naturalistes
Réunion ecoOnto – 29 novembre 2010
Faculté de Saint Jérôme, Marseille
Julie Chabalier
2. Plan
• Introduction
– Le projet ecoOnto
– Les outils collaboratifs
• Le projet ecoOnto
– Les résultats globaux
– Un exemple
3. Le projet ecoOnto
• Conception d’une ontologie de la biodiversité
• Projet open source collaboratif
– Soutenu par le MEEDDM, porté par Natural Solutions
– Supervisé par un comité scientifique
– Actuellement 24 membres
– 18 mois (initialement janvier 2010 – juillet 2011)
– 1er rapport d’étape : décembre.
4. Conception de l’ontologie
• Une conception « bottom-up » en 4 phases
– Inventaire des concepts environnementaux
– Etude des standards actuels
– Modélisation de ontologie de la biodiversité
– Enrichissement de l’ontologie et validation
5. Les outils collaboratifs
• Un site Web
http://www.natural-solutions.eu/nslabs/
• Une liste de diffusion/discussion
ecoonto-project@googlegroups.com
• Un nouveau logo !
http://r21854.ovh.net/xwiki/bin/download/Main/WebHome/logo-ecoOnto.jpg
• Un wiki
http://r21854.ovh.net/xwiki/
6. ecoOnto Wiki
• Droit d’accès :
– En lecture à tous
– En lecture/écriture aux membres (mdp sur demande)
• Modification
– WYSIWYG
– Source (syntaxes implémentées : MediaWiki, Confluence,
JSPWiki, Creole, TWiki, etc.)
9. Les résultats / WP
WP 1 : Inventaire des concepts environnementaux
WP1.1. Lister les questions environnementales
WP1.2. Décomposer les questions
WP1.3. Définir les concepts impliqués
WP 2 : Etude des standards en biodiversité
WP 3 : Etude des ontologies existantes
10. WP1 .1 - Lister les questions
• 35 questions (fr/en)
• Classées en 3 catégories (Fondation pour la
Recherche en Biodiversité, avril 2010)
• Questions scientifiques
• Questions politiques
• Questions locales
11. WP1 .1 - Lister les questions
• Scientifiques : 5 questions
– Quelles sont les conséquences de l’introduction de la
coccinelle orientale, Harmonia axyridis Pallas, sur
l’écosystème européen ?
– Quelle taille et quelle forme le corridor du Siju-Rewat
devraient avoir pour améliorer les chances de survies de la
population locale d'éléphant ?
• Politiques : 12 questions
– Quelles sont les méthodes pour évaluer la biodiversité de
ma région ?
– Comment délimiter le cœur de parc du futur Parc National
des calanques ?
12. WP1 .1 - Lister les questions
• Locales : 6 questions
– Quel est l’impact de la mise en place d’une aire de
stationnement de poids lourds au niveau de l’aire
d’autoroute de Vidauban ?
– Puis-je observer des Bouquetins dans le Parc National des
Ecrins?
• Non classées : 12 questions
concernent la collecte de données.
– Quels sont les principaux protocoles d'échantillonnage
pour estimer la taille/densité d'une population d'oiseaux ?
– Combien de quadrats devraient être utilisés pour
échantillonner efficacement l'aire X ?
13. WP1 .2 - Décomposer les questions
7 questions ont été décomposées en 52 sous-questions
Question 22 : Combien de quadrats devraient être utilisés pour
échantillonner efficacement l'aire X ?
1. Quelles sont les espèces à observer ?
2. Quelle est la distribution spatiale des variables à mesurer (en massif, au
hasard ou uniformément réparties, communes ou rares) ?
3. Quels sont les protocoles associés aux espèces à observer ?
4. Quelle est la taille de l’aire à étudier?
5. Quelles sont les ressources disponibles pour cet échantillonnage ( temps
et argent) ?
6. Quels sont les résultats des tests préliminaires sur le terrain ?
14. WP1 .2 - Définir les concepts
• 51 concepts définis (fr/en)
Terme Synonymes Définition Référence Termes
préféré associés
Plusieurs définitions/concept
Choix dans le cadre ecoOnto ?
16. WP1 .2 - Définir les concepts
• Apport de la décomposition
7 questions : 15 concepts définis ou à définir
52 sous-questions : 40 concepts définis ou à définir
+ 25 termes (2,7 fois + de termes)
17. WP2 - Etude des standards actuels
Dublin Core Standards de
EML métadonnées
Darwin Core
GML
ABCD schema
ISO 19115
Taxon Concept Schema
Standards de données Standards de données
de biodiversité géographiques
18. WP3 - Etude des ontologies existantes
• 30 ontologies de domaine :
• Seronto, Oboe, BFO, DOLCE, Gazetter ontology, geonames,
ENVO, Fly taxonomy, etc.
Biologie 17 OWL 16
Géographie 11 OBO 12
Haut niveau 4 RDFS 2
• Visualisation : Ontology Browser (v1.4.1), Université de
Manchester
20. A faire …
• Court terme :
– Valider (choix) les définitions par les experts
– Ajouter des définitions / questions existantes
(éventuellement ajouter des questions)
• Moyen terme :
– Mappings concepts – standards – ontologies
– Modélisation des concepts manquants
• Long terme :
– Validation de l’ontologie
21. Les observations naturalistes
Une observation est une action dont le résultat est une
estimation de la valeur de certaines propriétés d’une
caractéristique d'intérêt. Cette valeur est obtenue en utilisant
une procédure spécifique.
Open Geospatial Consortium
22. Choix des questions
• Les critères
– Collecte de données
– Méthodes d’échantillonnage
– Identification
– Préparation de la collecte (recherche d’information
cartographique, par exemple)
– Données collectées
23. Les questions
• 10 questions
Combien d'observations sont présentes dans le rectangle de sélection ?
Combien d'individus de l'espèce X ont été vus sur la zone Y ?
Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une
population d'oiseaux ?
Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonner
efficacement l'aire X ?
Quelle est la précision et l'exactitude de ce jeu de données ?
Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ?
Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?
Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du
domaine, i.e. taxon le plus élevé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ?
Quelles étaient les valeurs des variables d'environnement pour cet échantillon de données ?
Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
25. Les concepts associés aux questions
• 19 concepts à définir
Combien d'observations sont présentes dans le rectangle de sélection ?
Combien d'individus de l'espèce X ont été vus sur la zone Y ?
Quels sont les principaux protocoles d'échantillonnage pour estimer la taille/densité d'une
population d'oiseaux ?
Quelles est la taille, la forme et combien de quadrats devraient être utilisés pour échantillonner
efficacement l'aire X ?
Quelle est la précision et l'exactitude de ce jeu de données ?
Quel est le degré de confiance accordé à la détermination d'espèce réalisée par l'observateur X ?
Quels sont les critères nécessaires pour déterminer un taxon par rapport à un autre ?
Existe-t-il une clé taxonomique (clé dichotomique ou matrice) disponible pour cet organisme (du
domaine, i.e. taxon le plus élevé, à l'espèce/sous-espèce, i.e. taxon le plus bas) ?
Quelles étaient les valeurs des variables d'environnement pour cet échantillon de données ?
Existe-t-il des couches de végétation disponibles pour l'aire d'étude ?
26. Les concepts associés aux sous-
questions
• 8 concepts supplémentaires à définir
Quel est le polygone correspondant à la zone étudiée ?
Combien d’observations se trouvent dans ce polygone ?
Combien d’individus de l’espèce X ont été observés dans ce polygone ?
Quelles sont les espèces à observer ?
Quelle est la distribution spatiale des variables à mesurer (en massif, au hasard ou uniformément,
communes ou rares) ?
Quels sont les protocoles associés à ces espèces ?
Quelles sont les ressources disponibles pour cet échantillonnage ( temps et argent)?
Quels sont les resultats des tests préliminaires sur le terrain ?
Quelle est la date de l’échantillonage ?
Combien d’unités d’échantillonage ont été visitées ?
27. Les définitions
• Les publications
• Dajoz R. Précis d'écologie, 615 p, Dunod, 2000.
• Hellmann J. J., Fowler G. W. (1999) Bias, precision, and accuracy of four measures of species
richness. Ecological Applications, Vol. 9, No. 3., pp. 824-834.
• Mackay R.J. and Oldford R.W. (2000) Scientific Method, Statistical Method, and the Speed of
Light. Working Paper.
• Madin J., Bowers S., Schildhauer M., Krivov S.,Pennington D., Villa F. (2007) An ontology for
describing and synthesizing ecological observation data. Ecological Informatics, Vol.2,
No.3,pp 279-296 .
• Mayr E. (1940) Speciation phenomena in birds. The American Naturalist
Vol. 74, No. 752, pp. 249-278
• Mayr E. (1992) Species Concepts and their Application. The units of evolution: essays on the
nature of species, Ereshefsky ed. The MIT Press.
• de Quieroz K., Donoghe M.J. (1990) Phylogenetic systematics and species revisited. Cladistics
Vol. 6, No. 1, pp 83–90.
• Ridley M. (1993) Evolution. Journal of Evolutionary Biology, Vol. 6, No. 4, pp 615–617, July
1993
• Wiley E. O. (1981) Phylogenetics: the theory and practice of phylogenetic systematics. John
Wiley and Sons, New York.
28. Les définitions
• Les glossaires, codes et dictionnaires
• Glossary for exploring GIS by Nicholas Chrismas
• Glossary of the Federal Geographic Data Committee
• Glossary of the Great Lakes Environmental Indicators Project
• Glossary of terms and acronyms, Fisheries and Aquaculture Department of
FAO
• Glossary of statistical terms, Organization for economic co-operation and
development
• OceanLink’s Glossary of Common Terms and Definitions in Marine Biology
• International Code of Zoological Nomenclature 1999
• Larousse
• Wiktionary
30. Mappings avec les ontologies
• Choix des ontologies : observations
SERONTO : Socio-Ecological Research and Observation
oNTology
OBOE : Extensible Observational Ontology
31. SERONTO core
• Projet européen dont l’objectif est de faciliter
l’intégration des données de biodiversité à partir des
sources de données dispersées dans l’union
européenne.
• ALTER-net : A Long-Term Biodiversity, Ecosystem and
Awareness Research Network (UE)
34. OBOE
• Ontologie issue du projet SEEK (Science Environment
for Ecological Knowledge) dont l’objectif était de
créer une « cyberinfrastructure » pour la recherche
en biodiversité, environnement et écologie et pour
éduquer la communauté à l’écoinformatique (projet
US).
• LTER : Long Term Ecological Research (US)
• http://seek.ecoinformatics.org.
37. Extension OBOE core
• Créer un module observation ecoOnto
– S’appuie sur les points d’extension décrits dans Madin et
al. 2007
– Classification des concepts définis suivant les points
d’extension :
• Entity
• Characteristic
• Measurement
– Modélisation des propriétés et classes supplémentaires
38. Les concepts
• 15 concepts classés (sur 27)
Entity Characteristic Measurement
Sample Date SamplingProtocol
Population Area Identification
Polygon PopulationSize
Quadrat PopulationDensity
Transect SpatialPattern
Individu Criteria
EnvironnementalVariable