Cette présentation établis les principes fondamentales pour la publication des données provenant des échantillons. Elle était présenté pour la première fois dans la formation GB22 pour des points nodaux du GBIF.
Diapos produites et présentés par L. Smirnova (Royal Museum for Central Africa - Belgium).
Séance 07. Démonstration de la publication des données d'échantillonnage. For...
Séance 06, Introduction à la publication des données d'échantillonnage dans la formation GB22 pour points nodaux du GBIF
1. GB22 TRAINING EVENT FOR NODES – 5 OCTOBER 2015
Séance 06: Introduction à la publication
des données d’échantillonnage
Larissa Smirnova
2. INDEX
Introduction
Définition des données d' échantillonnage
GEO BON et EBVs
Applications des données d' échantillonnage
Rendre possible la publication des données d'
échantillonnage
L’importance des métadonnées
Utilisation de « event core » dans l’IPT
Cas d’utilisation de la publication des données d'
échantillonnage
3. “If a biodiversity datum is produced,
and no one can find it,
does it create change?”
Show me the Data: JRS Report on Access
to Biodiversity Data in our Projects
4. VOS CONTRIBUTIONS AU FORUM
Résumé:
• Il-y-a demande de la part des détenteurs des données
• Quelques jeux des données déjà publiés en GBIF se
placent mieux dans les données des échantillons
• De nouvelles fonctionnalités de l’IPT permettent la
publication de jeux des données plus diversifiés
• Un nouveau type des données élargit la diversité des
détenteurs des données
• Une bonne documentation technique et un bon
système de soutien sont des conditions importantes
pour une mise en œuvre réussite de ce nouveau
développement
5. INDEX
Introduction
Définition des données d' échantillonnage
GEO BON et EBVs
Applications des données d' échantillonnage
Rendre possible la publication des données d'
échantillonnage
L’importance des métadonnées
Utilisation de « event core » dans l’IPT
Cas d’utilisation de la publication des données d'
échantillonnage
6. DONNÉES D’ÉCHANTILLONNAGE: NOTRE DEFINITION
Les données d' échantillonnage sont….
« Un type des données disponible à partir des études
environnementales, écologiques, et des ressources
naturelles ; des études singuliers ou des programme
de suivi. Habituellement, ces données sont
qualitatives, calibrés, et ils suivent des protocoles
fixés pour pouvoir détecter des changements et des
tendances dans les populations »
7. LES DONNÉES D' ÉCHANTILLONNAGE
Résultats des programmes de monitoring (échantillons,
recensements, plot)
Quantitatifs, calibrés
Répétables, comparables
Recueillis en utilisant les protocoles standard
Lien entre l’environnement et la biodiversité
Détection des changements (modèles,
procès) et tendances dans les populations
8. Botanistes, zoologistes
Managers des ressources naturelles
Ecologistes et biologistes conservateurs
Citoyens scientifiques
Ngo’s, associations, professionels d’autres disciplines (pêche,
agriculture…)
DES DONNÉES D' ÉCHANTILLONNAGE SONT
RASSEMBLÉES PAR...
9. Botanistes, zoologistes
Managers des ressources naturelles
Ecologistes et biologistes conservateurs
Citoyens scientifiques
Preneurs de décisions!
DES DONNÉES D' ÉCHANTILLONNAGE SONT
UTILISÉES PAR...
10. EXEMPLES DES DONNÉES DES ÉCHANTILLONS
Un exercice en groupe!
Sont les exemples ci-dessous des jeux des données d’ échantillonnage?
1. Une piège pour des insectes installé dans canopée forestière et ramassé
un moins après
2. Un collier GPS attaché à un individu qui envoie des données à une base
des données central permanemment.
3. Des image de satellite téléchargés annuellement pour analyser la
composition végétal d’un area
4. Suivi des chauve-souris par voiture où des volontaires enregistrent des
ultrasons en utilisant des détecteurs d’expansion temporelle
5. Échantillonnage de la végétation (core boring) pour mesurer la pollution
sous-surface
11. INDEX
Introduction
Définition des données d' échantillonnage
GEO BON et EBVs
Applications des données d' échantillonnage
Rendre possible la publication des données d'
échantillonnage
L’importance des métadonnées
Utilisation de « event core » dans l’IPT
Cas d’utilisation de la publication des données d'
échantillonnage
12. Rendre possible la découverte et l’accès aux données
des échantillons
GBIF, en collaboration avec les partenaires EU BON, a
adapté l’IPT (Integrated Publishing Toolkit) et le standard
Darwin Core Archives permettant le flux des données
des échantillons (2015)
Un des objectifs est soutenir les Variables Essentielles
sur la Biodiversité de GEO BON (Essential Biodiversity
Variables - EBVs)
Aussi le soutient à la détection des changements et des
tendances dans les populations
EU BON, GBIF ET LES EBV
13. CE SONT QUOI, LES EBV?
Mesures requises
pour l’étude, le
rapportage et la
gestion des
changements dans la
biodiversité
Sert de niveau
intermédiaire entre les
données brutes et les
indicateurs (p.e., pour
CBD)
15. “Monitoring biodiversity change often requires
repeated measures at the same place. This
extension will enable data holders publishing
through the GBIF network to share population
abundance data (including time series
population data) and presence/absence data,
and also to document the sampling protocol”
Henrique Pereira, chair of GEO BON
16. INDEX
Introduction
Définition des données d' échantillonnage
GEO BON et EBVs
Applications des données d' échantillonnage
Rendre possible la publication des données d'
échantillonnage
L’importance des métadonnées
Utilisation de « event core » dans l’IPT
Cas d’utilisation de la publication des données d'
échantillonnage
17. Objectifs: Modèles qui appuient la conservation et la gestion de la faune et de
la flore
prédiction des distributions
Identification des régions importantes (p.ex., des régions plus appropriés
pour une espèce ou où on a une plus grande possibilité de trouver
hautes densités)
Méthodes:
Caméras-piège
Suivi avec appareils GPS
Échantillons point-count
Mesures:
Abondance
Présence / absence
APPLICATIONS DE DES DONNÉES
D'ÉCHANTILLONNAGE (1/3)
18. Objectifs: Modèles qui supportent la conservation de la biodiversité, la surveillance
environnementale, de la santé et l’état des écosystèmes et de l'impact du
changement climatique
La recherche dur la végétation (phyto sociologie, analyse des tendances)
La dégradation des forêts
L’utilisation des terrains
Contrôle des niveaux de carbone
Dynamiques écologiques
Méthodes:
Parcelles de végétation
Relevés
Mesures:
Abondance des espèces
Couverture (ex. échelle Braun-Blanquet)
APPLICATION DE DES DONNÉES
D'ÉCHANTILLONNAGE (2/3)
19. APPLICATIONS DE DES DONNÉES
D'ÉCHANTILLONNAGE (3/3)
Objectifs: Interactions entre la biodiversité et l’environnement
Suivi des espèces
Modèles temporels
Tendance de population trends et réponses aux drivers
Indicateurs biologiques dans l’utilisation de terre
Méthodes:
Données des suivis a longue-terme (recensements)
Donnés des atlas (échantillons)
Mesures:
Nombre des individus
Abondance relative
20. INDEX
Introduction
Définition des données d' échantillonnage
GEO BON et EBVs
Applications des données d' échantillonnage
Rendre possible la publication des données d'
échantillonnage
L’importance des métadonnées
Utilisation de « event core » dans l’IPT
Cas d’utilisation de la publication des données d'
échantillonnage
22. 7 termes essentiels pour coder les données
d'échantillonnage :
1. eventID
2. parentEventID (nouveau)
3. samplingProtocol
4. sampleSize (nouveau)
5. sampleSizeUnit (nouveau)
6. organismQuantity (nouveau)
7. organismQuantityType (nouveau)
RENDRE POSSIBLE L’ÉDITION DES DONNÉES
D'ÉCHANTILLONNAGE : DWC VOCABULAIRE
23. NOUVELLES FONCTIONNALITÉS
• Event core et ses extensions
• Possibilité d’assigner des identifiants
DOIs aux ressources
• Génération automatique d’une citation
pour chaque ressources, comprenant le
numéro de version et le DOI
• Licences lisibles automatiquement
RENDRE POSSIBLE L’ÉDITION DES DONNÉES
D'ÉCHANTILLONNAGE : IPT V.2.3
24. INDEX
Introduction
Définition des données d' échantillonnage
GEO BON et EBVs
Applications des données d' échantillonnage
Rendre possible la publication des données d'
échantillonnage
L’importance des métadonnées
Utilisation de « event core » dans l’IPT
Cas d’utilisation de la publication des données d'
échantillonnage
25. Métadonnées sont ESSENTIELS pour les données
des échantillons :
Pour documenter les données du projet :
description de l’activité de surveillance.
Pour documenter les méthodes de surveillance :
les protocoles, la qualité des données et les étapes
dans le surveillance.
La documentation du jeu des données permets à
l’utilisateur d’évaluer sa aptitude à l’emploi
L’ IMPORTANCE DES MÉTADONNÉES
27. • “Seasonal (4 seasons) records of zoobenthic communities across
confinement gradient in 5 coastal lagoons (Mazoma,
Tsopeli,Tsoukalio, Rodia and Logarou)”
• “The floristic inventories was conducted at the Sierra Nevada
(Andalusia, southeast Spain). Forest cover in Sierra Nevada is
dominated by pine plantations (Pinus halepensis Mill., Pinus pinaster
Ait., Pinus nigra Arnold. subsp. salzmannii (Dunal) Franco, and Pinus
sylvestris L.) that covering approximately 40,000 ha…”
• “Transect walks were conducted once in two weeks from the
beginning of October to the end of June on the territory of Israel”
EXEMPLE DE MÉTADONNÉES: EXTENSION DE
L’ÉTUDE
28. • “Seasonal (4 seasons) records of zoobenthic communities across
confinement gradient in 5 coastal lagoons (Mazoma,
Tsopeli,Tsoukalio, Rodia and Logarou)”
• “The floristic inventories was conducted at the Sierra Nevada
(Andalusia, southeast Spain). Forest cover in Sierra Nevada is
dominated by pine plantations (Pinus halepensis Mill., Pinus pinaster
Ait., Pinus nigra Arnold. subsp. salzmannii (Dunal) Franco, and Pinus
sylvestris L.) that covering approximately 40,000 ha…”
• “Transect walks were conducted once in two weeks from the
beginning of October to the end of June on the territory of Israel.”
EXEMPLE DE MÉTADONNÉES: EXTENSION DE
L’ÉTUDE
Région d’échantillonnage + Fréquence de l’échantillonnage
29. • “Box corer for 0.03 square meters area sampled”
• “Transect lengths range between 300 and 600 m in length, and divide into
50 m sections. Transect usually cover a single habitat type. In each visit,
transect-walkers count all butterfly species that can be seen within a range
of 5 m range. Special behaviours (egg laying or nectaring), as well as
butterfly larvae or eggs, can be registered as well.”
• “The dataset includes data from 1,879 sites, collected using standard RLS
survey methods, described in detail in an online methods manual. Surveys
involve underwater visual census by SCUBA divers along a 50 m transect
line, laid along a depth contour on hard substrate. All fish species observed
within 5 m of the transect line were recorded on a waterproof datasheet as
the diver swam slowly along the line (at approximately 2 m/min)…”
EXEMPLE DE MÉTADONNÉES: DESCRIPTION DE
L'ÉCHANTILLONNAGE
30. • “Box corer for 0.03 square meters area sampled”
• “Transect lengths range between 300 and 600 m in length, and divide into
50 m sections. Transect usually cover a single habitat type. In each visit,
transect-walkers count all butterfly species that can be seen within a range
of 5 m range. Special behaviours (egg laying or nectaring), as well as
butterfly larvae or eggs, can be registered as well.”
• “The dataset includes data from 1,879 sites, collected using standard RLS
survey methods, described in detail in an online methods manual. Surveys
involve underwater visual census by SCUBA divers along a 50 m transect
line, laid along a depth contour on hard substrate. All fish species observed
within 5 m of the transect line were recorded on a waterproof datasheet
as the diver swam slowly along the line (at approximately 2 m/min)…”
Description des procédures d’échantillonnage
EXEMPLE DE MÉTADONNÉES: DESCRIPTION DE
L'ÉCHANTILLONNAGE
31. • “Record validation and cleaning was incorporated at several steps of
the documentation process: the scientific names on labels were
checked with a taxonomic thesaurus…. We assigned scientific names
in accordance to current taxonomy trends. Geographic coordinates
were verified using the “Check Coordinates” function in DIVA-GIS”
• “Every reported record is flagged ‘for Approval’. Record status is
changed to "Approved" upon and by expert only“
• “Each sampling plot was checked to ensure whether the geographical
coordinates were correct. The databases of International Plant
Names Index (IPNI, 2013) and Catalogue of Life/Species 2000 to
verify the taxonomical classification”
EXEMPLE DE MÉTADONNÉES: CONTRÔLE DE LA
QUALITÉ
32. • “Record validation and cleaning was incorporated at several steps of the
documentation process: the scientific names on labels were checked with a
taxonomic thesaurus…. We assigned scientific names in accordance to
current taxonomy trends. Geographic coordinates were verified using the
“Check Coordinates” function in DIVA-GIS”
• “Every reported record is flagged ‘forApproval’. Record status is changed
to "Approved" upon and by expert only“
• “Each sampling plot was checked to ensure whether the geographical
coordinates were correct. The databases of International Plant Names
Index (IPNI, 2013) and Catalogue of Life/Species 2000 to verify the
taxonomical classification”
Actions de contrôle de la qualité
EXEMPLE DE MÉTADONNÉES: CONTRÔLE DE LA
QUALITÉ
33. • “Replicates were collected at two stations, one inside and one outside the lagoon,
using a box corer (0.03 m2 sampling surface). The samples were sieved through a
0.5 mm mesh sieve, stained with Rose Bengal and preserved in 4% formalin. All
benthic organisms were sorted in the lab and identified and counted using stereo-
and microscopes”
• “1. Selection and rout of transect is accompanied by an scientific/principal
investigator. 2. Identification of the capabilities of the observer are verified tested
along timeline 3. Time start and weather condition are recorded first. 4. During
transect walk, the number seen of every species is counted….”
• “This dataset was compiled from data collected in a combination of collaborative
surveys with scientific colleagues worldwide, targeted RLS field campaigns and ad-
hoc local surveys by trained RLS divers at their regular dive sites or when on
holidays. Field campaigns involved small groups of divers (usually 4 to 8)
undertaking survey dives over a period of four days to two weeks under the
direction and supervision of a scientist or experienced survey diver“
EXEMPLE DE MÉTADONNÉES: DESCRIPTION DE
L’ÉTAPE
34. • “Replicates were collected at two stations, one inside and one outside the lagoon,
using a box corer (0.03 m2 sampling surface). The samples were sieved through a
0.5 mm mesh sieve, stained with Rose Bengal and preserved in 4% formalin. All
benthic organisms were sorted in the lab and identified and counted using stereo-
and microscopes”
• “1. Selection and rout of transect is accompanied by an scientific/principal
investigator. 2. Identification of the capabilities of the observer are verified tested
along timeline 3. Time start and weather condition are recorded first. 4. During
transect walk, the number seen of every species is counted….”
• “This dataset was compiled from data collected in a combination of collaborative
surveys with scientific colleagues worldwide, targeted RLS field campaigns and ad-
hoc local surveys by trained RLS divers at their regular dive sites or when on
holidays. Field campaigns involved small groups of divers (usually 4 to 8)
undertaking survey dives over a period of four days to two weeks under the
direction and supervision of a scientist or experienced survey diver“
EXEMPLE DE MÉTADONNÉES: DESCRIPTION DE
L’ÉTAPE
Méthodes, procédures, étapes de traitement
36. INDEX
Introduction
Définition des données d' échantillonnage
GEO BON et EBVs
Applications des données d' échantillonnage
Rendre possible la publication des données d'
échantillonnage
L’importance des métadonnées
Utilisation de « event core » dans l’IPT
Cas d’utilisation de la publication des données d'
échantillonnage
37. LE NOUVEL EVENT CORE (CŒUR ÉVÉNEMENT )
En IPT 2.3, vous pouvez sélectionner le nouvel
event core:
• En créant de nouvelles ressources
• En connectant les termes
Trois classes sont disponibles:
• Event (événement)
• Location
• GeologicalContext
(contexte géologique)
39. NOUVEAUX TERMES DWC
eventID et parentEventID
• Les événements d’échantillonnage peuvent être liés entre eux (ex.,
échantillonnages emboîtés) a travers d’un identifiant parent commun
• L’information sur la nature de la relation (ex. part d’une séries de suivi)
peut être décrit dans la section lié au projet dans les métadonnées.
Une parcelle Whittaker avec des sub-parcelles de différent taille
40. NOUVEAUX TERMES DWC
sampleSize
sampleSizeUnit
Un valeur numérique pour la duration temporelle, le longueur, l’area
ou le volume lié a l’événement d’échantillonnage.
L’unité de mesure utilisé dans le événement d’échantillonnage, ex.,
minute, heure, jour, mètre, mètre carré, mètre cubique.
sampleSize sampleSizeUnit
2 hour
6 m2
1 litre
3 km
42. DONNEES: NOUVEAUX TERMES DWC
organismQuantity
organismQuantityType
Le valeur d’un numéro ou d’une énumération pour la quantité des
organismes. Utilisez-le avec organismQuantityType pour indiquer le
type d’entité qui est quantifié.
Le type d’entité à lequel le valeur du numéro ou de l’énumeration pour
la quantité des organismes dans organismQuantity réfère.
organismQuantity organismQuantityType
14 Individuals
r BraunBlanquetScale
31 %Biomass
0.4 %Species
43. INDEX
Introduction
Définition des données d' échantillonnage
GEO BON et EBVs
Applications des données d' échantillonnage
Rendre possible la publication des données d'
échantillonnage
L’importance des métadonnées
Utilisation de « event core » dans l’IPT
Cas d’utilisation de la publication des données d'
échantillonnage
45. UC1 – INVERTÉBRÉS AQUATIQUES
• Comparaison de l’abondance/ biomasse,
distribution des espèces dans des classes
d’abondance géométrique et taille géométrique
• Structure et dynamique des communautés
• Évaluation de l’impact humain
• Étude saisonnier des invertébrés des
eaux saumâtres
• 7 stations
• Grappin Van Veen, utilisé à la main
• Abondance, biomasse, variables
environnementales
48. Israel Systematic Butterflies Monitoring Scheme (BMS-IL )
• Protocole des transects “Pollard” : observations le long des transects fixés.
• Longueur des transects entre 300 et 600 m, divisé en sections de 50 m.
• Pour chaque espèce : enregistrement du nombre des individus vues dans chaque section
Transect map
UC2 - LÉPIDOPTÈRES
51. Diversité des macrophytes par le Rhine-Main-Observatory (RMO)
• Pourcentage de couverture des espèces de plantes vasculaires dans 21 sections des ruisseaux de
la rivière Kinzig.
• Relevés de végétation Braun-Blanquet; définis annuellement (printemps pour ceux que fleurit tôt, et
été pour le reste des plantes)
• Échantillons réalisés annuellement.
UC3 - MACROPHYTES
52. Composants abiotiques
Utilisation du terrain
Données de la météo
Données hydrologiques
Données physico-chimiques
Composants biotiques :
Couverture végétale,
Grandeur moyen per biotype
Information d’abondance d’espèces
Information utilisant l’échelle Braun-
Blanquet
UC3 - MACROPHYTES - DONNÉES
54. • 2006-2013
• 1,879 sites dans des récifs de corail et
rocailleux par toute le monde
• Changement dans les écosystèmes,
effets du changement climatique et
de l’acidification des océans
• Recensement visuel par des plongeurs au
long des transects immergés de 50 m
• Les espèces de poisson et des invertébrés
son enregistrés avec des estimation de
l’abondance pour les espèces plus rares
• Ils prennent des photos aussi des coraux
et de la couverture des algues
• Paramètres environnementales:
température de l’eau, pH et salinité.
UC4 – ÉTUDES DES RÉCIFS DE CORAIL
56. “What we’ve got today is a lot of data records but
probably not yet enough modeling on top of it to
understand the significance”
“We are now in a transitional period in which the
challenges are less about gathering data than
understanding what to do with it”
Ruby Russell: Big data brings new possibilities to biodiversity
science. 2014.
57. GB22 TRAINING EVENT FOR NODES – 5 OCTOBER 2015
Séance 06: Introduction à la publication
des données d’échantillonnage
Larissa Smirnova
Hinweis der Redaktion
Image from Jason Young, shared via http://www.freeimages.com/photo/logbook-1548276.
Traduction: « Au cas un “biodiversity datum” est produit que personne ne peut trouver, cela peut-il créer un changement? »
Sample-data publishing primer
« Le suivi des changements dans la biodiversité habituellement a besoin des mesures répétés dans le même endroit. Cette extension rendra possible pour les éditeurs des données de la réseau GBIF le partage des données de abondance des populations (notamment les données des populations des séries temporels) et des donnés de présence/absence, et aussi de décrire le protocole d’échantillonnage ».
Text and illustrations are from: KOUTSOUBAS D, DOUNAS C, ARVANITIDIS C, KORNILIOS S, PETIHAKIS G, TRIANTAFYLLOU G, ELEFTHERIOU A (2000) Macrobenthic community structure and disturbance assessment in a Mediterranean lagoon (Gialova lagoon, Ionian Sea). ICES Journal of Marine Science 57: 1472-1480
Photo invertebrate: https://www.flickr.com/photos/artour_a/2195807130
Illustrations from: Emily Gertz, Popular Science, 02-18-2014: Vast Underwater Survey Identifies Five Keys to Conserving Ocean Life http://www.popsci.com/article/science/vast-underwater-survey-identifies-five-keys-conserving-ocean-life
“Ce que nous avons obtenu aujourd’hui est un tas de données mais probablement pas assez permettant une modélisation pour en comprendre la signification.”
“Nous nous trouvons dans une étape de transition dans laquelle les défis concernent moins le rassemblement de données que d’en comprendre quoi faire.”
Image from Jason Young, shared via http://www.freeimages.com/photo/logbook-1548276.