L'analyse qualitative des métadonnées et les traitements, sans collaboration de l’éditeur.
Catherine Storne
SCD Université de Strasbourg
JABES 2016 – 10/05/2016 – Session 1
JABES 2016 - DALLOZ et le SCD de l’Université de Strasbourg
1. L'analyse qualitative des
métadonnées et les traitements,
sans collaboration de l’éditeur
Catherine Storne
SCD Université de Strasbourg
JABES 2016 – 10/05/2016 – Session 1
2. Immersion à l’ABES : 2-5 février
Objectifs pour le SCD
• Comprendre le hub et la manipulation de
données
• Impulser une convergence au SCD Unistra
entre documentation imprimée et
électronique
• Préparer le chantier CERCLES
http://www.numistral.fr/ark:/12148/btv1b10218808w
Objectifs pour l’ABES
• Explorer un modèle de collaboration des
bibliothèques en amont du hub, sur le
traitement des métadonnées
Objectifs pour le réseau
• Disposer de métadonnées
de qualité
2
3. Bibliothèque numérique Dalloz :
catalogage attendu par le réseau
A la recherche des métadonnées
• http://www.dalloz-bibliotheque.fr/ =
plateforme de recherche et de
consultation de e-books
• liste des titres sous forme de tableau :
http://www.dalloz-
bibliotheque.fr/listing.php
• entrepôt OAI :
http://logistic.book-vision.com/services/oai/act68.php?verb=ListRecords&metadataPrefix=onix_dc
3
5. MAIS …
OAI Dalloz
Tableau Dalloz
Données plus complètes, dont résumés
MAIS
383 notices absentes
Pas de notice OAI, donc, pas d’URL
de consultation
5
7. Et le Sudoc ?
• Comparaison ISBN imprimé liste / ISBN
imprimé Sudoc (via web service isbn2ppn)
• Constat :
• Presque toutes les notices existent pour la
version imprimée dans le Sudoc
• Vérifications sur les notices imprimées :
les liens vers un ppn autorités ou
collection existent pour les 7XX, 410, 6XX
• Une centaine de notices nécessitent une
vérification humaine
• 1831 titres pourraient être créés
automatiquement
• Décision :
• création – par un script de l'ABES - des
notices des e-books dans le Sudoc à
partir des notices correspondantes
imprimées
PUIS
• enrichissement par des données
venues des sources Dalloz par le hub
7
8. Traitements effectués sur les
métadonnées
• Liste :
• ajout du ppn imprimé, obtenu
par le web service isbn2ppn
• ajout du ppn électronique,
obtenu par le compte-rendu du
script de création
=> Transformation de ce tableau
en xml/rdf par l'équipe du hub
• Entrepôt OAI :
=> Transformation de ce tableau
en xml/rdf par l'équipe du hub
Travail sur les 2 tableaux
8
9. RDF : URI
URI
• Identifiant d’une ressource,
construit sous forme d’une
URL
• Choix de construction dans
le hub
• Préfixe
http://www.hub.abes.fr/bndalloz/ebook/
• Suffixes
ISBN électronique
Exemples
http://www.hub.abes.fr/bndalloz/ebook/9782247103713/w
http://www.hub.abes.fr/bndalloz/ebook/9782247103713/m/web
http://www.hub.abes.fr/bndalloz/ebook/9782247103713/m/print
9
10. RDF : triplets
Composition du triplet
• sujet : identifiant de la
ressource
• prédicat : propriété ou une
relation, elle-même
identifiée par une URI (le
plus souvent représentée par
un préfixe)
• objet : identifiant d’une
autre ressource en relation
avec la première, une valeur
ou un littéral
http://documentation.abes.fr/sudoc/manuels/pdf/
sudoc-rdf.pdf
Exemple
• <http://www.hub.abes.fr/bndalloz/ebook/
9782247103713/w>
• dcterms:title
équivalent de : http://purl.org/dc/terms/
• "50 droits contre l'exclusion " .
10
11. Travaux du chantier CERCLES
• Créations de notices
• Quand pas de notice papier ou besoin d'une vérification : 69 titres
• Vérifications et enrichissement des notices d'e-book qui existaient déjà
dans le Sudoc : 38 titres
• Vérifications des notices pour lesquelles la date d'édition entre le Sudoc et
le tableau-Dalloz sont différentes : 59 titres
• Titres présents dans OAI-Dalloz mais absents de tableau-Dalloz : 29 titres à
traiter dans un second temps
• Travail sur les notices d'e-books créées par l'ABES :
• collections numériques : récupération du ppn ou demande de création
• Envoi à l’ABES des ppn des collections numériques, en regard des URI fournis par
l’ABES
• Vérifier nécessité de créer et comment les champs 303,304,305,307,339
• Vérifier les 13 notices signalées par l'ABES pour lesquelles plusieurs urls de
consultations sont associées (liste fournie par l'ABES)
• Responsable du chantier : Stéphanie Himber (Unistra)
11
12. Enrichissements par le hub
Programme expérimental d'enrichissement des
données du Sudoc (MARCEDMOD)
• Requêtes SPARQL dans les
deux fichiers RDF/XML
• selon le critère choisi
• par script, remplacement des
notices du Sudoc par la valeur
présente dans les fichiers
RDF/XML
Liste des enrichissements faits
par le hub
• Résumé
• ISBN électronique
• Dates d'édition : dates ajoutées en
100$a et 210$d (par écrasement de
celles éventuellement présentes)
• Edition : pour les titres ayant un
numéro d'édition autre que 1, ce
numéro d'édition a remplacé celui
présent dans le Sudoc
• Dewey : pour les notices sans 676,
ajout d'un 676 avec le code dewey
340 tiré d'OAI-Dalloz
• URL : reconstitution de l'URL de
consultation et ajout dans les notices
• Editeur
12
13. Et maintenant ?
Mises à jour
• Gros travail initial du hub.
• Mises à jour du moissonnage OAI :
• par bibliothécaire ?
• transmission au hub ?
• Ensemble du workflow difficilement
automatisable
KBART
• Transformation des données en
KBART ?
• Données disponibles
• Par la bibliothèque ?
• Par l’ABES ? pas dans sa politique
actuelle
• Versé dans quoi ? Bacon ? Pour quel
usage ?
Des correspondants « hub » ?
• Extension du périmètre de participation des
établissements
• Correspondant ne doit pas être isolé dans
son établissement
=> Valable pour tous types de correspondants
ABES
13
14. Remerciements
• A Jérôme Kalfon (directeur de l’ABES) et Dominique Wolf
(directrice du SCD de l’université de Strasbourg) qui ont
autorisé cette immersion
• A tous les collègues de l’ABES qui ont pris le temps d’organiser
administrativement ou fonctionnellement cette immersion et
me faire part de leurs savoirs et leurs pratiques, plus
particulièrement :
• Yann Nicolas (tuteur de stage)
• Ilhem Addoun Poliakow
• Laurent Piquemal
• Marion Grand-Demery, Brigitte Michel, Philippe
Millepied, Stéphane Rey
14