2. API de recherche
◦ SRU Gallica
API d’accès aux documents
◦ IIIF
IIIF : description de l’API pour les images fixes
Les métadonnées
L’utilisation à la BnF
API non implémentées : recherche, authentification
◦ API Document
27 janvier 2021 2
3. Utilisation du protocole standardisé SRU
(Search/Retreval via URL)
Permet de faire des recherches sur les
métadonnées des documents de Gallica
Utilisation de la recherche avancée
de Gallica pour former la requête
27 janvier 2021 3
6. 27 janvier 2021 6
• Interroger Gallica : requête SRU
https://gallica.bnf.fr/SRU?version=1.2&operation=searchRetrieve&query=
dc.title all "imagier" and (dc.type all "image") and
(gallicapublication_date>="1800")&suggest=10&keywords=imagier
flux
XML
7. 27 janvier 2021 7
• Gestion de la pagination : startRecord
https://gallica.bnf.fr/SRU?version=1.2&operation=searchRetrieve&query=
dc.title all "imagier" and (dc.type all "image") and
(gallicapublication_date>="1800")&startRecord=5
• Affiner la recherche (facettes)
https://gallica.bnf.fr/services/Categories?SRU=dc.title all "imagier" and (dc.type all "image")
and (gallicapublication_date>="1800")
Voir aussi :
https://api.bnf.fr/api-gallica-de-
recherche
flux
JSON
8. Gallica propose d’autres API d’accès aux documents :
◦ Service de récupération des années et fascicules parus pour un
périodique : exemple Issues
◦ Service de récupération des informations bibliographiques d'un
document : exemple OAIRecord
◦ Service de récupération de la pagination d'un document :
Pagination
◦ Service d'affichage d'images précalculées : exemple lowres
◦ Service d'occurrences de recherche : exemple ContentSearch
◦ Service de récupération de la table des matières : exemple Toc
◦ Service de récupération du texte : exemple texteBrut
◦ Service de récupération de l’OCR
27 janvier 2021 8
Voir aussi :
https://api.bnf.fr/api-gallica-de-
recherche
9. Informations bibliographiques
• Obtenir la notice OAI d’un document numérique à partir
d’un identifiant ARK : service OAIRecord
https://gallica.bnf.fr/services/OAIRecord?ark=btv1b10506358w
http://catalogue.bnf.fr/api/SRU?version=1.2&operation=searchRetrieve&qu
ery=bib.ark any "ark:/12148/cb43692485k"&recordSchema=dublincore
• Obtenir la notice catalogue du document à partir de son
identifiant ARK de notice : service SRU Catalogue général
http://catalogue.bnf.fr/api/SRU?version=1.2&operation=searchRetrieve&qu
ery=bib.ark%20any%20%22ark:/12148/cb43692485k%22&recordSchema=
intermarcXchange
Voir aussi :
https://api.bnf.fr/api-sru-catalogue-
general
10. • La pagination
https://gallica.bnf.fr/services/Pagination?ark=bpt6k6399988n
• Le texte
https://gallica.bnf.fr/ark:/12148/bpt6k6399988n.texteBrut
• L’OCR
https://gallica.bnf.fr/RequestDigitalElement?O=bpt6k6399988n&E=ALTO&Deb=10
• Les tables des matières et index
https://gallica.bnf.fr/services/Toc?ark=ark:/12148/bpt6k6399988n
• Les légendes : via l’API Pagination ou l’OAI (mode DIDL)
• Les vignettes image
https://gallica.bnf.fr/ark:/12148/btv1b8593523f.thumbnail
https://gallica.bnf.fr/ark:/12148/btv1b8593523f.medres
https://gallica.bnf.fr/ark:/12148/btv1b8593523f.highres
Accès aux contenus numériques
11. Projet né en 2011
Une API pour rendre interopérable des fonds
d’images
Inspirée du modèle OAI-PMH
Utilisée pour permettre d’accéder de façon
standardisée à des images quels que soient leurs
localisations
Permettant à des éditeurs de construire des
solutions
de visualisation de documents
27 janvier 2021 11
12. 27 janvier 2021 12
Stanford
University
BL
BnF
Application
Gallica
Application
spécifique
(manuscrits)
Application
spécifique
(banque
d’images)
13. 27 janvier 2021 13
Stanford
University
BL
BnF
API IIIF
Application
Gallica
Application
spécifique
(manuscrits)
Application
spécifique
(banque
d’images)
14. 27 janvier 2021 14
Stanford
University
BL
BnF
API IIIF
Application
Gallica
Application
spécifique
(manuscrits)
Application
spécifique
(banque
d’images)
15. Les spécifications de l’API sont disponibles sur le site
http://iiif.io.
Version actuelle : 3.0 (implémentée à la BnF 1.1)
API REST permettant d’accéder à :
◦ Une image ou une partie d’une image
◦ De faire effectuer par le serveur des transformations sur
cette image ou sur cette partie d’image.
27 janvier 2021 15
{scheme}://{server}{/prefix}/{identifier}/{region}/{size}/{rotation}/{quality}.{format}
HTTP ou
HTTPS
Nom hôte
Localisation
du service
Identifiant du
document
numérique
Rectangle de
l’image source
demandée
Taille de
l’image
générée
Deg de
rotation
éventuelle
Transformation
(niveau de gris,
noir et blanc)
Format en
sortie
16. Gallica contient plusieurs millions de
documents dont un million d’image…
Elles sont toutes manipulables par l’API
images ….
27 janvier 2021 16
18. 27 janvier 2021 18
https://gallica.bnf.fr/iiif/ark:/12148/bpt6k97989381/f19/full/1500,300/0/native.jpg
19. 27 janvier 2021 19
http://gallica.bnf.fr/iiif/ark:/12148/bpt6k8801260t/f1/full/full/135/native.jpg
20. 27 janvier 2021 20
https://gallica.bnf.fr/iiif/ark:/12148/bpt6k97989381/f1/0,500,2000,2000/full/45/bitonal.jpg
21. IIIF : description de l’API pour les images fixes
Les métadonnées
L’utilisation à la BnF
API non implémentées : recherche,
authentification
27 janvier 2021 21
22. Très rapidement la question de l’obtention
de métadonnées pour utiliser de façon
générique les documents se pose…
Version actuelle de l’API : 3.0
(implémentée à la BnF : 2.0)
API REST permettant de fournir des
métadonnées riches (notice
bibliographique, liens, droits, descriptions
de chacune des vues de l’objet,
potentiellement de régions particulières,
etc.).
27 janvier 2021 22
24. Les serveurs d’images :
◦ Loris est un logiciel open source, écrit en python qui supporte la norme en
V2.0. Il permet de diffuser des images en JPEG, JPEG2000 et TIFF.
◦ IIPImage Server : logiciel open source écrit en C++ (fast-cgi pour Apache)
◦ …
Les visualiseurs :
◦ OpenSeaDragon (visualiseur javascript)
◦ Mirador (visualiseur javascript avec comparaison de documents)
◦ IIPMooviewer (HTML 5 Ajax viewer)
◦ …
A la BnF :
◦ Développement en interne d’un serveur d’images, avec
un noyau écrit en C++ qui s’appuie sur des composants
Kakadu et ImageMagick
27 janvier 2021 24
25. Cache JPEG2000
27 janvier 2021 25
Fond numérisés BnF
API IIIF
Recherche Visualiseur
Index
de
recherc
he
Z
o
o
m
26. Search API en version 1.0.0
◦ Objectif : offrir une recherche sur les
métadonnées proposées dans l’API de
présentation (des plus simples : titre,
auteur, … au plus complexe : OCR,
annotations, traductions, etc.)
Authentification API : 0.9.3
◦ Permettre d’authentifier les utilisateurs
pour accéder à des fonds d’images.
Restreindre éventuellement l’accès à
certains formats des utilisateurs non
authentifiés.
27 janvier 2021 26