Assemblée générale 2016 du programme de recherche BVH : Avancement & perspectives des Catalogues régionaux des Incunables de France : papier et informatisés
(CESR, Tours, 7 décembre 2016)
Pierre Aquilon, Rémi Jimenes, Anne-Laure Allain, Laura Monneau
Bilan 2019 & perspectives 2020 du programme de recherche BVH
Assemblée générale 2016 du programme de recherche BVH : Catalogues régionaux des Incunables de France papier et informatisés
1. Catalogues régionaux des
Incunables de France
papier et informatisés
http://www.bvh.univ-tours.fr
Assemblée générale 2016, Tours, 7 décembre
Programme de recherche « Bibliothèque Virtuelles Humanistes »
Pierre Aquilon, Rémi Jimenes,
Anne-Laure Allain et Laura Monneau
6. Données bibliographiques
Alimentation de la base de données
Données bibliographiques
et d’exemplaires des CRI
Marc-XML
Données d’exemplaires
Compagnie des Incunabulistes Associés
7. CRI IV, Basse-Normandie, 1984
CRI XVI, Auvergne, 2006
CRI X, Centre, 1991
Les premiers CRI, un signalement simple puis un niveau intermédiaire de description
vers une description de plus en plus détaillée de l’exemplaire
Une collection mais différents états
Notice Koha 26343
8. Un exemple de notice en MARC-XML
Niveau bibliographique (titre et notes)
Exemplaire 1, Lyon BM
Exemplaire 2, Loches BM
9. Volumétrie 2016 :
6 catalogues informatisés
► CRI IV (Basse-Normandie, 447 éditions)
► CRI XVI (Auvergne, 286 unités bibliographiques)
► CRI XIII (Bas-Rhin, 2 443 entrées)
► CRI VIII (Bibliothèques religieuses parisiennes, etc., 532
éditions)
► CRI VII (Institut de France, 180 entrées)
► CRI III (Midi-Pyrénées, 814 unités)
12 690 entrées de catalogue sur les 13 789 que compte
notre corpus ont été traitées soit 92 % de l’ensemble
Ce sont 7 013 notices canoniques qui ont
été créées et 19 281 exemplaires décrits
10. Représentation graphique de l’informatisation
(au 1er décembre)
0
500
1000
1500
2000
2500 En attente de traitement
CRI III
CRI VII
CRI VIII
CRI XIII
CRI XVI
Informatisation du CRI IV
Avancée au 1er janvier 2016
11. Feuille de route en vue de la
finalisation de l'informatisation
► Traitement des derniers catalogues du corpus
Janvier 2017 : CRI II, Languedoc-Roussillon (507 entrées)
Mars 2017 : CRI I, Champagne-Ardenne (1 455 entrées)
► Lancement du traitement des caractères spéciaux
par prestation :
Décembre 2016 : préparation de la prestation, rédaction de
l’appel et du cahier des charges. Premières demandes de devis
Janvier 2017 : demande de devis, choix du prestataire
Février-avril 2017 : encodage des caractères spéciaux
Mai 2017 : contrôle qualité des notices
► 31 Mai 2017 : transfert des notices finalisées au
Ministère de la Culture
12. Activités connexes
► Hausse du nombre de numérisations signalées
257 nouveaux liens ajoutés depuis fin 2015 (sur un total de
408 entrées)
• Répertoire centralisé des numérisations d'incunables
► Établissement d’un thésaurus centralisé de données de
provenances
Définition de règles pour le traitement d’entrées identiques
mais issues de différents catalogues
• 6 135 personnes
• 1 892 collectivités
• 94 familles
13. Mention au crayon : « 30 fcs en
1870. Combien vaudra-t-il dans 2
siècles ? », XIXe s.
Sur : OSVALDUS de LASKO, Sermones dominicales perutiles Biga
salutis intitulati. – Haguenau : Heinrich Gran pour Johannes
Rynmann, “ipsa die vincentii martyris” [22 I] 1498. – 4°.
CRI XX, Bibliothèques parisiennes, notice 223, bibliothèque de la
Société de l’Histoire du Protestantisme Français
Hinweis der Redaktion
Présentation CRI papiers par Pierre
Présentation CRI papiers par Pierre
Parallèlement aux publication des CRI papiers, le projet d’informatisation des catalogues continue.
AlAlla :
Avancement de l’informatisation des CRI
Voici l’état de l’informatisation fin 2015, année consacrée au corpus régional inclus dans CRIICO (Catalogues Régionaux des Incunables Informatisés du centre-ouest) avec le traitement des CRI consacrés aux régions Centre, Pays de la Loire, Poitou-Charentes & Limousin.
<CLIC 1>
Le catalogue consacré à la Basse-Normandie a été le premier traité en 2016
<CLIC 3>
Suivi par l’Auvergne
<CLIC 4>
Le Bas-Rhin, un département seul mais le plus important volume traité à ce jour
<CLIC 5>
Puis les CRI parisiens VII et VIII, consacrés respectivement à l’Institut de France et au bibliothèques religieuses
<CLIC 6>
Et depuis la fin novembre le CRI III Midi-Pyrénées
Restent à traiter les CRI II Languedoc-Roussillon et I (Champagne-Ardenne) déjà bien entamés (plus de 60 %) du fait de notre progression en tâche d’huile dans le corpus.
AlAlla
Le projet des Catalogues Régionaux des Incunables Informatisés vise à faciliter l’accès aux collections d’incunables via un catalogue informatisé, intéropérable, national et gratuit. Pour cela nous regroupons les informations présentes dans les différents volumes des CRI et proposons un catalogue homogène qui regroupe sous une seule et même notice canonique, le signalement de chaque exemplaires conservé sur le territoire, la présence des anciens possesseurs et provenances ainsi que les mentions manuscrites et des descriptions physiques aussi exhaustives que possible.
> Pour ce faire nous nous sommes appuyées sur le versement des données bibliographiques issues de l’ISTC.
Ces notices sommaires ont fournit un squelette nous greffons des données d’exemplaires issues nos partenaires (la bibliothèque Mazarine et de la BM de Lyon et quelques incunabulistes ).
Enfin, cette notice intermédiaire est complété par l’ensemble des informations bibliographiques et d’exemplaires issues des Catalogues régionaux.
> Cette notice canonique finale est ensuite exportée en MarcXML et l’enrichissement TEI se fait via une feuille de transformation
Code Koha : id : kohauser / mp : teroljds
Laura :
Dans le cadre de ce projet, nous partons d'une notice issue du catalogue en cours de traitement, puis cherchons dans les autres volumes toutes les occurrences de ce même titre (via le catalogue de l’ISTC où elles sont listés avec le numéro de chaque notice dans chaque catalogue….). Ainsi, nous pouvons confronter et traiter en une seule fois tous les exemplaires d'une seule et même édition décrits dans chacun des catalogues parus.
Cette diapositive nous montre l'évolution du catalogage papier des incunables au fil des années :
> Nous passons d'un simple signalement dans les premiers catalogues (localisation, cote et provenance sommaire pour les exemplaires)
> à une description plus minutieuse, notamment sur les provenances, mentions manuscrites et ex-libris
> Puis à une notice plus détaillée au niveau de la responsabilités des textes par exemple et une description physique plus précise des exemplaires (éventuelles enluminures ou rubrication, reliure, provenances détaillées…) dans les CRI les plus récents comme celui traitant des bibliothèques d’Auvergne.
KOHA : Données codées / ID de la notice / Zone 200 / Zone 300 : Montrer la différence des responsabilités, des titres retenus + liens vers les autres catalogues dont CIBN (en 300), passer aux exemplaires (Loches, Lyon puis Le Puy)
LAURA
Après avoir terminé les notices et exemplaires dans Koha, nous réalisons un export MARC-XML de la notice, dont vous avez un aperçu ici.
> Le niveau bibliographique :
> On retrouve les données codées de la notice, avec numéro ISTC notamment.
> Puis les différentes zones remplies dans KOHA avec leurs identifiant en MARC, identifiées ici dans les balises
- En zone 200 : le titre et les mentions de responsabilités
- En 210 : adresse bibliographique / en 215 : le format
- Les zones de notes, notamment sur les responsabilités intellectuelles, ici en zone 314
- Suivi par la liste des catalogues qui décrivent cette édition, avec l'ISTC en premier lieu puis les CRI et d'autres catalogues tels que le GW ou Pellechet.
> A la suite de la description bibliographique -> niveau exemplaire :
> Ici exemple de l'exemplaire conservé à Lyon BM. Les exemplaires sont codés en zone MARC 930.
> On retrouve pour chacun d'eux et dans chaque zone de notes qui les concernent, leur numéro d'identification unique composé du RCR (numéro de la bibliothèque dans laquelle l’exemplaire est conservé) suivi de « : » puis la cote de l'exemplaire.
> Les différentes zones de description concernent :
- les mentions de provenances, ici une signature et des dessins (zone 317 de l'exemplaire)
- les descriptions de reliure (zone 395)
- l'indexation des provenances en zone 702 pour les noms de personnes (ici Jehanne dont nous avions vu la mention de la signature plus haut)
> Autre exemple : l'exemplaire de Loches avec la même organisation et des mentions de provenances plus fournies.
L’ensemble de nos notices exportées à partir de Koha suivent ce modèle. Elles concentrent ainsi toutes les éditions traitées lors de l’informatisation des CRI.
AlAlla :
Laura vient de vous présenter un exemple de notices canonique. A ce jour nous en comptons plus de 7 000 !
Au cours de l’année 2016 nous avons informatisé 6 catalogues régionaux supplémentaires . Nous arrivons désormais à 12 690 entrées sur les 13 789 de notre corpus soit 92 % de l’ensemble (contre 70% l’an passé).
Nous sommes ainsi passés de 4 629 notices canoniques recensées et 14 917 exemplaires décrits en 2015 à 7 013 notices et 19 281 exemplaires
AlAlla :
Cet histogramme permettra peut-être de mieux vous représenter le travail et l'avancée de la rétroconversion des catalogues Régionaux.
Chaque aire du graphique représente un volume et le nombre de notices qu’il contient.
Comme nous l’avons évoqué précédemment, nous partons d’une notice dans un catalogue donné et remontons chaque occurrences de cette notice dans l’ensemble des Catalogues Régionaux
En gris foncé, sont matérialisées les notices traitées depuis le début du projet.
<CLIC>
* en rouge, la région Basse-Normandie
<CLIC>
* en vert, l’Auvergne
<CLIC>
* en violet, le Bas-Rhin
<CLIC>
* en turquoise, les bibliothèques scientifiques parisiennes
<CLIC>
* en orange, l’Institut de France
<CLIC>
* en bleu, le Midi-Pyrénées
En enfin en gris, celles que nous allons traiter d’ici Mars 2017
Laura
Pour la suite du projet, nous devrions finir le CRI II Languedoc-Roussillon et ses 507 entrées, actuellement en cours d’informatisation, en janvier 2017. Nous enchainerons ensuite sur le CRI I Champagne Ardenne, plus volumineux avec 1455 entrées avec une fin prévue en mars 2017.
Parallèlement à cette finalisation de l’informatisation des CRI publiés, il est prévu un traitement des caractères spéciaux présents dans certaines notices, notamment dans les zones de titres, de dates, collations, descriptions d’exemplaires et qui ne peuvent être traités en même temps que l’informatisation. Une prestation est ainsi prévue pour cet encodage spécifique avec la réalisation du cahier des charges et les premières demandes de devis durant ce mois de décembre. L’encodage devra avoir lieu de février à avril pour un contrôle des notices en mai avant la livraison de ces dernières au ministère de la culture le 31 mai 2017.
Laura
Conjointement à l’informatisation, nous tenons un répertoire des numérisations signalées de nos exemplaires. Nous avons ainsi ajouté 257 nouveaux liens depuis fin 2015 sur un total de 408 liens recensés depuis le début du projet. Ce fichier, mis à jour, régulièrement contient la date d’ajout de la numérisation dans Koha, les informations concernant l’édition : ISTC, auteur, titre, adresse bibliographique. Puis l’identification dans Koha, la bibliothèque où est conservé l’exemplaire, sa cote, des informations sur l’intégralité de la numérisation et enfin le lien vers la numérisation qui est intégré dans notre base.
Autre outil de travail que nous avons développé : un thésaurus sur les données de provenances afin d’homogénéiser le traitement de ces provenances, identiques mais issues de différents catalogues. Nous nous référerons ainsi à ce thésaurus quotidiennement pour aller chercher une entrée déjà structurée ou en créer une lorsque nous rencontrons une nouvelle provenance dans les CRI. Nous avons à ce jour 6135 personnes, 1892 collectivités et 94 familles.
Pour exemple, voici la page pour les collectivités, trier par ville, avec par exemple la structuration des communautés religieuses. Et les noms de personnes. Peu lisible projeté comme ça mais très utile pour notre travail quotidien d’uniformisation. Par exemple, pour le traitement du cri II actuellement, nous avons un abbé et prieur à Clairvaux dont les CRI mentionnaient plusieurs formes de noms : Vepria, La véprie, Voivre. Nous avons donc trancher en utilisant la forme la plus commune. Nous l’utilisons donc à chaque fois que nous rencontrons cette provenance dans les CRI, ce qui permet un meilleur signalement de ce type de données.
Nous terminons ce tour d’horizon de l’informatisation par un peu de spéculation sur un ouvrage décrit dans le dernier catalogue parus…