8. Constat :
➢ Modèles de documents DTD et schémas
multiples
➢ Respect aléatoire des standards de la part des
éditeurs
➢ Formes et éléments de contenu très variés,
contenu inexact ou absent
➢ Spécificité d’un corpus en XML (arborescence
avec respect aléatoire de la DTD, noms des
éléments différents, espaces de noms non
déclarés ...)
8
La standardisation des données a pour objectif d’assurer une
interopérabilité optimale des données en vue de leur réutilisation.
Standardisation :
➢ Formats standards :
● MODS, TEI …
➢ Données (valeurs)
10. Pour rendre mon document compatible avec
différents standards
11. Metadonnées :
● titles
● abstracts
● identifiers
● authors / affiliations
● keywords
● bibliographic references
● etc.
11
MODS (Metadata Object Description Schema) :
En tant que format d’échanges et de partage, il permet une articulation
entre des données bibliographiques construites selon des modèles
différents (books + journals)
Format pivot
12. Metadonnées dans <teiHeader> :
● titles
● abstracts
● identifiers
● authors / affiliations
● keywords
● bibliographic references
● etc.
+ balisage du texte dans <text><body>
12
TEI (Text Encoding Initiative) :
Effort international pour unifier les pratiques d’encodage de texte dans
le domaine académique.
- Plein texte dans XML
- généré à partir du PDF
13. Pour permettre à mon document d’être
“recherchable” & “analysable” par des outils TDM
25. Une API pour permettre à mon document d’être
consulté
26. 26
Un Web Service permettant d'accéder à mon document
grâce à des fonctionnalités de :
• Recherche avancée
• Tri
• Pagination
• Facettes
• Téléchargement
28. 28
Après intégration, recherche et accès au plein-texte :
• Widgets
• Portails universitaires / ENT
• Outils de découverte
• Google Scholar
• Démonstrateur
• Extension Firefox
& Google Chrome
• ...
29. Permettre à mon document d’être trouvé via
plusieurs moteurs compatibles OpenURL
30. ● L'API ISTEX dispose de son propre résolveur dédié
aux ressources ISTEX
● Respect de la Norme OpenURL z39_88_2004
(versions 0.1 et 1.0)
● Résolution à partir
○ d'identifiants forts (DOI, PMID…)
○ de métadonnées, si suffisamment exhaustives
● Exemples
○ https://api.istex.fr/document/openurl?rft_id=
info:doi/10.1007/978-3-642-13792-1_17
○ https://api.istex.fr/document/openurl?
&rft.issn=0302-9743
&rft.au=Alma M. Gómez-Rodríguez&rft.date=2010
30
31. ● Possibilité d'intégrer le résolveur dans les outils
compatibles avec la norme
○ Exemple : Zotero
31
1
2
3
32. Permettre à mon document d’être trouvé
via les outils de découverte
34. Permettre à mon document d’être trouvé
via le moteur spécialisé Google Scholar
35. ● Déclaration des "bouquets ISTEX" via KBart Bacon
● Utilisation de la fonction "Library Links"
35
2
1
3
4
36. 36
● Ajout d'un lien [PDF ISTEX] si ressource détectée
● Ce lien de type OpenURL
○ Utilise le résolveur ISTEX
○ Amène au plein-texte sur la plateforme ISTEX
38. • Détection automatique des documents ISTEX
à partir des identifiants documentaires (DOI, PMID, PII…)
• Vérification de la présence dans l'API ISTEX
via requête OpenURL
• Affichage d'un bouton reliant au plein-texte
38
39. • Installation simplifiée (https://addons.istex.fr)
• Activation automatique de la bibliothèque ISTEX GScholar
39
OU