Jabes 2021 - Poster "CorHAL, une voie pour les chercheurs : simplifier le dép...
Calames oct. 2010 (Saint-Mihiel)
1. Signaler des sources,
et au-delà ?
L’exemple de Calames
Jean-Marie Feurtet
Université d’hiver Saint-Mihiel – 29/10/2010
L’historien face aux manuscrits / Le manuscrit face aux NTIC
2. Calames : définition
Catalogue en ligne
Interface publique ouverte à la consultation le 1er
décembre
2007
Pour les catalogueurs, l’interface de production est
également disponible via un navigateur web depuis avril
2008
des archives et manuscrits
Périmètre large, englobant des fonds ou des collections; des
manuscrits médiévaux aux archives contemporaines
Des ensembles iconographiques peuvent être décrits dans
Calames (dans d’autres cas : dans le Sudoc)
de l’enseignement supérieur
Outils s’adressant à des SCD (BU, BIU, BS), des
bibliothèques de grands établissements (MNHN), des
sociétés savantes (SHPF), des laboratoires….
Calames : définition
3. Aux sources de Calames (1)
Volonté d’améliorer la visibilité du travail existant et
de relancer une dynamique de signalement et de
traitement
Inventaires hétérogènes, parfois confidentiels
Notices dispersées dans des catalogues de collections imprimées
Nombreux fonds inaccessibles, non inventoriés
Etapes clés
1998 : publication du format XML EAD (SAA / LOC)
2002-2006 : conversion rétrospective du Catalogue général des
manuscrits des bibliothèques publiques de France (116 vol.
publiés entre 1849 et 1993, hors BN)
Second noyau : Palme (répertoires des mss.
littéraires français XXe s., 1995-2006)
4. Le CGM : exemple du vol. 1 (1849), par G. Libri
5. Aux sources de Calames (2)
Répartition des données encodées CGM et Palme :
BnF, Culture, et ESR
Projet ABES 2006-2008
Choix de développements internes à l’ABES, en s’appuyant
sur des standards éprouvés
Spécifications et tests avec l’appui d’une communauté
naissante (établissements ESR ayant d’importants fonds
manuscrits)
Optique et problématiques des « digital humanities »
Un « Sudoc » des manuscrits et des archives ?
6. Un « triptyque » numérique issu
de la rétroconversion du CGM :
1. CCFr Manuscrits
http://www.ccfr.bnf.fr
(CGM hors ESR + interrogation
d’autres ressources)…
2. BnF Archives et Manuscrits
http://archivesetmanuscrits.bnf.fr
8. Intérêt du format XML-EAD
Deux grands types d’IR informatiques structurés: les BDD
documentaires et les données EAD
Avec EAD : avantages du langage XML, hiérarchisation des données,
adaptation et raffinement de l’indexation…
Catalogues d’imprimés :
description sur deux niveaux
(ex. de mss. dans le Sudoc)
9. Intérêt du format XML-EAD
Exemple d’une correspondance encodée
en EAD dans Calames :
Encodage dans l’outil de catalogage Calames… :
...Données publiées :
10. 3e
cercle (2010)
4e
cercle (2011)
…
Fonds et collections
de bibliothèques
hors CGM et
hors Palme
(2009-…)
Autres fonds et collections (E.S.)
(2008-…)
CGM
Cat. Gén. Mss.
37500 notices E.S.
(2005-2006)
Palme
(mss. littéraires
XXe s.)
40000 notices
(2006-2007)
3e
cercle (2010)
4e
cercle (2011)
…
3e
cercle (2010)
4e
cercle (2011)
…
2e
cercle
+ 800 notices
(2009-…)
1er
cercle
+ 15000 notices
(2008-…)
Compléments CGM & Palme (2008-…)
Calames : « noyaux » de données et évolutions (oct. 2010)
Du 1er
au 4e
cercles : 50. à
100.000 notices attendues
par catalogage natif
3e
cercle (2010)
4e
cercle (2011)
…
Fonds et collections
de bibliothèques
hors CGM et
hors Palme
(2009-…)
Autres fonds et collections (E.S.)
(2008-…)
CGM
Cat. Gén. Mss.
37500 notices E.S.
(2005-2006)
Palme
(mss. littéraires
XXe s.)
40000 notices
(2006-2007)
3e
cercle (2010)
4e
cercle (2011)
…
3e
cercle (2010)
4e
cercle (2011)
…
1er
cercle
+ 15000 notices
(2008-…)
Compléments CGM & Palme (2008-…)
11. De nouvelles sources historiques
en déploiement
Quelques exemples de nouveautés historiques dans Calames :
Au sein du 1er cercle de bibliothèques : Institut de France,
Muséum, Bibliothèque littéraire Jacques Doucet… (nombreux
ensembles en cours d’encodage)
BDIC : la « bibliothèque contemporaine de l’événement » [ex.]
2e
cercle (2009) : des nouveautés publiées (BIU Pharmacie),
d’autres en cours d’encodage (SHPF, Académie de médecine…)
3e
cercle (2010) : fonds du Centre des archives du féminisme
(Angers), archives anciennes et d’entreprises du CNAM, archives
de mathématiciens (Paris 6), Musée Curie, INHA…
4e
cercle (2011) : Ecole des Mines, Institut catholique de Paris,
SCD Poitiers (archives d’Argenson)…
12. Autres (méta-)catalogues de manuscrits,
autres projets…
CERL Portal (Manuscrits et livres imprimés anciens)
Calames prochainement « moissonné »
Malvine/Kalliope, Manuscripta Mediaevalia…
(All.), BLMC (British Library), Manus (Ita.)…
A venir : projet Apenet (portail européen des
archives, développé en lien avec Europeana)
Dans le sein même des bibliothèques ESR,
Calames n’est pas une obligation (ex. :
Alidade, Observatoire de Paris)
Une informatisation à géométrie variable
(ex. NUCMC aux Etats-Unis)
13. Chercher dans Calames
Recherche « simple »
Résutats tenant compte de la hiérarchie des données
Gestion par l’usager de la quantité d’informations à afficher
(dépliage des composants)
« Boîte à outils » : impression, URL citable
Fonctionnalités avancées
Dans toute liste de résultats : possibilité de filtrer par facettes
Feuilletage de certains index (autocomplétion)
Limitation à un établissement (contenu dynamique des index,
recherche par cotes…) et interfaces spécifiques (Institut, BSG)
« Sommaire » : Navigation et localisation d’un résultat au sein
de l’arborescence d’un établissement
Nuages de mots clés par établissements (personnes, sujets)
14. Fonctionnalités de recherche :
exemples
Feuilletage des index
(renvois d’autorités : partiels)
A ne pas confondre avec la présence
ou le signalement d’une reproduction
numérique)
Ensemble des autorités intervenant
dans l’histoire du document
Points d’accès mis en évidence
lors du catalogage
15. Fonctionnalités de recherche :
exemples
Navigations au sein des arborescences :
déploiements de composants…
…recours au « sommaire » d’un
établissement (ensemble de ses
instruments de recherche)Fichiers
maîtres
composants
Sous-
composant
Divisions
Composant
(groupe de
notices)
Ajout des composants
suivants (de 10 en 10)
Défilement des notices
16. Fonctionnalités de recherche :
exemples
Nuages de mots clés (ex. : principaux sujets des inventaires de la BIU
de Médecine, Paris)
17. De la nécessité d’un bon encodage en XML-EAD :
exemple d’une recherche sur le nom « Dupont de Nemours »
1. Recherche simple «Dupont de
Nemours» : 5 réponses
2. Recherche avancée par
l’index « personnes physiques » :
seulement 3 + 1 réponses
Autorité Pierre-Samuel : 3 réponses
Autorité Victor-Marie : 1 réponse
=> Conclusion :
la réponse #3 correspondant au ms 1258
(Bib. Institut, correspondance de P.M. Hennin)
manque par le feuilletage, car la forme
normalisée du point d’accès n’a pas été saisie
(ni aucun lien aux autorités Sudoc).
18. L’ouverture sur le Web
Au-delà d’un répertoire de notices arborescentes :
partage des données d’autorités Sudoc (nouveau
module Idref : identifier des personnes, collectivités… dans
un environnement documentaire élargi)
Exposition aux moteurs de recherche
une URL par « notice » (par nœud Calames)
un risque de surindexation ?
vers le Web sémantique (données RDF enrichies)
Nouvelles fonctionnalités participatives (2011) :
authentification Calames, annotations des notices,
fils RSS
19. Comptes et commentaires
dans Calames (2011)
Ecrire à l’établissement
responsable
Exemple d’un fil
de commentaires
Exemple d’un compte
« établissement »
Profil
Gestion
d’images
Commentaires
20. Calames et la numérisation
Dès l’ouverture du catalogue : vignettes pointant
vers Liber Floridus (enluminures Mazarine et BSG)
Liens vers des ressources externes (reproductions
numériques, liens vers d’autres bases…)
Prochainement : dépôts d’images par le réseau
Service lié à la mise en place des comptes Calames
Sélection d’images (illustrations) ou reproductions
intégrales : rapprocher métadonnées et données
Visionneuse Calames permettant de zoomer et de naviguer
dans les ensembles déposés
22. En conclusion : vers l’édification d’un
« Web patrimonial » … ?
Merci de votre attention
Hinweis der Redaktion
Voir logos et icono dans
H:\Services\EAD\Graphisme\charte_graphique_Calames_Oxynel\css\images
Pour (-) : Retrait avant le texte de 1.78 cm, suspendu de 0.68 cm
Pour (+) : retrait avant le texte de 0.76, suspendu de 0.76
1ers catalogues de manuscrits en France : Bernard de Montfaucon, Bibliotheca bibliothecarum manuscriptorum nova (1739) ; puis publication d'un Catalogue des manuscrits de la Bibliothèque du roi (1739-1744). Idée de tels catalogues pour aider les érudits émise dès 1725 par l’abbé Lebeuf dans une lettre au Mercure de France.
BnF : concernée par le CGM avec la présence de la bibliothèque de l’Arsenal ; sinon, fichiers et inventaires propres.
La BnF a été au centre des projets de conversion du CGM et de Palme.
Palme : projet ITEM (CNRS, recherche sur génétique des textes littéraires) + IMEC + Bib. J. Doucet + BnF -> hébergement jusqu’en 2007 sur la base BN-Opaline. Données converties en EAD en 2006-2007.
Il n’y a aucune obligation pour une B.U. à rejoindre le réseau Calames : c’est une option, que certains établissements ont d’ailleurs choisi de ne pas prendre (ex. de la Bibliothèque de l’Observatoire de Paris-Meudon : inventaire Alidade regroupant archives et manuscrits, mais aussi instruments scientifiques, iconographie : http://alidade.obspm.fr/sdx/alidade/, s’appuyant sur l’outil Pleade). Chaque membre est libre d’exporter ses données et de les réutiliser à sa guise.
Objectif général : éviter un éclatement de bases par type de documents, avec des sous-ensembles hermétiques de documents spécialisés. Enjeu non négligeable alors que la recherche est souvent, et de plus en plus, une affaire de spécialiste…
PUBLICS de ces catalogues, et notamment de Calames : essentiellement tourné vers les sciences humaines, et tout particulièrement les sciences historiques (de la généalogie à la génétique des textes littéraires, l’histoire des sciences…).
BAM : mis en ligne à p. de sept. 2007, n’a que peu hérité des données CGM/Palme. Les deux réservoirs chargés d’héberger les données converties du CGM et de Palme étaient le CCFR et l’outil développé par l’ABES (Calames).
NB : les chiffres du nb total de notices CGM et Palme d’origine varient selon les sources : de 32000 à 37500 pour le CGM, de 39000 à 42000 pour Palme.
Source retenue ici : Max Naudi, tableaux en vue des rétroconversions Calames.
Nombre de notices (composants avec cotes) :
Sous total 2008-2010 : 15829 dont 785 hors cercle 1 (5%)
Notamment en 2009 : 12521 nouvelles notices, la palme allant à Doucet (8844), l’Institut (1458) et la BIUP (549)
Nombre de nouveaux composants c :
Sous total 2008-2010 : 64355 dont 5789 hors cercle 1 (9%)
Notamment en 2009 : 47439 nouveaux <c>, dont Institut (22164), Doucet (11159), et BIUP (5606)
En 2010 (chiffres à la mi-octobre 2010), se distinguent nettement l’Institut (+ 1500 notices, 7700 nouveaux <c>) et le Muséum (+ 520 notices, 4200 nouveaux <c>).
On pourrait y ajouter environ 550 notices créées en Base Formation par l’Académie de Médecine (cercle 2) ; des centaines de notices supplémentaires créées par Doucet en Formation et encore non publiées ; ainsi que plus de 2700 notices créées en Formation par la BDIC.
Sont attendues (ou déjà encodées depuis 2008) : en compléments au CGM, environ 10000 notices (cf. enquête SDBIS 2007) ; hors CGM (Palme, nouveaux fonds), de 50000 à 100000 nouvelles notices pour les 1er, 2e et 3e cercles… chiffres très approximatifs.
En octobre 2010, on compte un peu plus de 77300 « notices » publiées dans Calames (composants ayant un unitid = « cote » et non pas « division »)
Informatisation loin d’être complète y compris au pays de l’EAD : cf NUCMC National Union Catalog of Manuscript Collections = pas d’interface propre pour l’Union Catalog of Manuscripts américain, notices publiées de 1953 à 1986 = pas dans Worldcat, seulement accessibles sous forme imprimée… Par ailleurs, recherche dans Worldcat malaisée, avec une limitation « Archive material », et une astuce à connaître pour savoir où se trouvent les documents décrits… (en format marc…)
URL citable = explique que durant la conception de Calames, il n’a pas été jugé nécessaire d’implémenter un « panier » de notices à la manière des catalogues traditionnels…
Incise sur l’hypothèse, pour l’heure mise entre parenthèses, de lier Calames avec du contenu textuel > retranscriptions de manuscrits, par ex. encodés en TEI.
En attente d’évolutions prochaines dans le paysage des schémas XML ?...
Adresse pub. de la base dev Simoun : http://193.52.69.127/CgmPub/#culture=fr
Ex. BDIC : http://193.52.69.127/CgmPub/#details?id=Calames-200912151112307502