1. Mutation des formats bibliographiques
à l’ère du numérique et du web de données
ou .. « du catalogage à l’encodage »
Formation ADBS (29-30 mai 2012)
Intervenante : Christine Fleury
2. Dispositif pédagogique
• Cette présentation (en ligne sur SlideShare)
• Dossier documentaire :
– Petit lexique de survie
– Focus
– sélection d‟articles
• Visites de ressources
• Démonstrations – utilisation d‟outils dédiés
• TP – manipulation et analyse de données
(en ligne sur ISSUU)
Ce dispositif est placé sous licence :
3. Au programme
• Introduction : comprendre les facteurs de
transformation de la sphère bibliographique
• Irruption dans la sphère bibliographique : XML et
les métadonnées
• Accompagner la transition numérique : nouveaux
enjeux interprofessionnels -- cas concrets
• Renouvellement des modèles et des règles de
catalogage : D‟FRBR en RDA
Focus : L‟importance des identifiants
• Vers le web de données : Introduction à RDF
16. De la Dématérialisation des supports
télévision / radio
téléphonie A partir de 1980 :
révolution numérique
photographie
qui impacte (presque)
cinéma l’ensemble des objets
musique culturels
lecture
22. De la Bibliothèque physique
• Des USAGES
Des ESPACES
Des ARCHITECTURES
source : Olivier Ertzscheid
23. À la Bibliothèque numérique
Des ARCHITECTURES
Des USAGES Des ESPACES techniques
source : Olivier Ertzscheid
24. Missions numériques : valorisation
médiation diffusion dissémination
• faciliter l‟accès aux
ressources numériques
• Valoriser les données
bibliographiques
• exposer ses données aux
moteurs de recherche
= renouvellement des
interfaces des catalogues
+ revisite des formats de
données
Vers le Metadata management
25. Missions numériques : préservation
archivage pérenne
• Préserver le patrimoine
par la numérisation
• Garantir l‟intégrité des
données numériques
• Garantir la pérennité
des données numériques
36. Part 1 –
Irruption dans la sphère
bibliographique :
XML et les métadonnées
sommaire
37. au générique : l'interopérabilité
Production :
Dans les rôles principaux :
• XML = lingua franca informatique
• XSLT : le traducteur universel
• Unicode = Babel des écritures
• Dans l’ordre d’apparition : TEI, EAD, Dublin Core, MarcXML,
MODS, MADS, METS, TEF, LOM...
= métadonnées en partage
• OAI – PMH = hors de la tour d’ivoire des savoirs
• OAIS = la garantie de l’avenir
38. Focus sur les protocoles
• un objectif : l‟intéropérabilité des systèmes
d‟échanges de données pour permettre leur circulation
• Z39-50 : le pionnier (= interrogation à distance)
• FTP : transport entre serveurs
• HTTP : la navigation sur le Web
• TCP/IP : le transport des données du web
• SRU/SRW : Z39-50 sur le Web
40. XML - Au royaume du mapping
....
• le cycle de transformations des données
– XML : un langage
– XSLT : un traducteur
– DTD (MarcXml, Dublin Core, TEF,
EAD...) : des vocabulaires
– Schémas : des structures
• « Rien ne se perd, rien ne se crée, tout se
transforme » (Lavoisier)
41. … et du Mash up
• application composite qui combine des
contenus ou des services provenant de
diverses applications et sites
webservices et API
RSS
42. XML – berceau des métadonnées
Extensible Markup Language
1998 : Standard W3C
http://www.w3.org/XML/
Famille des langages “à balises” < />
+ ouvert (non propriétaire)
+ hiérarchique (structuré)
= format d‟échange
= interopérabilité
= langage pivot
43. XML – une structure hiérarchique
<balise parent>
<balise fils>donnée</balise fils>
</balise parent>
<annuaire>
<personne class = " bibliothecaire">
<nom>Fleury</nom>
<prenom>Christine</prenom>
<telephone>555-123456</telephone>
<email>fleury@abes.fr</email>
</personne>
</annuaire>
44. XML – une syntaxe souple
• Head = prologue
– Référence à la version
– Encodage (UTF8 par défaut)
– Déclaration d‟espace de nom
• Éléments
– <baLiSe>Donnée</baLiSe>
– <_balise attribut9='valeur'/>
• Exemple :
<?xml version="1.0" standalone="yes"?>
<magasin>
<service>
<produit> Vaisselle </produit>
<couleur produit = „bleue‟>
</service>
</magasin>
46. XML – DTD …
DTD : Document Type Definition
= structure logique permettant de vérifier la
conformité du document XML
Exemple :
<!DOCTYPE annuaire [ <!ELEMENT personne
(nom,prenom,telephone,email? > <!ELEMENT
nom (#PCDATA) > <!ELEMENT prenom
(#PCDATA) > <!ELEMENT telephone
(#PCDATA) > <!ELEMENT email (#PCDATA)
> <personne> <nom> </nom><prenom>
Prénom</prenom> <telephone>Tel </telephone>
<email>Courriel</email></personne>
47. <?xml version="1.0" encoding="UTF-8"?> = encodage
<ex:collection xml:lang="fr"
xmlns:dc="http://purl.org/dc/elements/1.1/" = schéma de référence
xmlns="http://www.w3.org/1999/xhtml" = espaces de nom
<élément>Texte</élément>
<dc:title>Astérix le Gaulois</dc:title>
<ex:livre attribut="valeur" type="BD">
<dc:title>Astérix chez les Belges</dc:title>
<!-- élément répété --> = commentaire
<dc:creator>René Goscinny</dc:creator>
<dc:creator>Albert Uderzo</dc:creator>
<dc:description> Astérix chez les Belges est un
album de <ahref="http://fr.wikipedia.org/wiki/
Bande_dessinée">bande dessinée</a> de la série Astérix
le Gaulois créée par René Goscinny et Albert Uderzo.
</dc:description>
</ex:livre>
50. « au-delà des données »
• Du grec « meta » : au-delà-de
• Selon ISO (2003) : « donnée qui définit et
décrit une autre donnée »
• Selon NISO (2004) : « information
structurée qui décrit, explique, localise la
ressource et en facilite la recherche, l‟usage
et la gestion »
60. Schémas et DTD « métier »
• TEI - Text Encoding Initiative
• http://www.tei-c.org/
• http://www.tei-c.org/release/doc/tei-p5-doc/fr/html/
= système pour faciliter la création, l'échange,
l'intégration de données textuelles informatisées
« Il ne s'agit pas d'une spécification (DTD ou Schéma) en
soi mais plutôt d'un cadre (framework) pour en
développer des particulières. »
61. TEI vu de l’intérieur
• En-tête :
– <fileDesc> : Description bibliographique de la ressource dans le
même style que celle proposée par les RCAA (titre, auteur, édition,
taille, etc.)
– <encodingDesc> : Renseignements sur la manière dont le texte a été
encodé.
– <profileDesc> : Autres types d‟indications au sujet de la ressource
(langue, participants à la création, thèmes abordés, etc.)
– <revisionDesc> : Mises à jour effectuées sur la ressource et
intermédiaires responsables de sa modification.
• Texte :
– <front> : Rassemble des données qui se trouvent avant le début du
texte (page de titre, préface, dédicace, etc.)
– <group> : Permet d‟associer ensemble plusieurs textes unitaires ou des
groupes de textes.
– <body> : Comprend le texte en tant que tel, mis à part les annexes et
les données préliminaires.
– <back> : Combine toutes les annexes auxquelles fait allusion le texte
principal.
62. TEI vu de l’intérieur
<div type="Act" n="I"><head>Acte II</head> <div
type="Scene" n="1"><head>Scène 2</head>
<sp><speaker>Rodrigue</speaker> <l part="i">À moi,
comte, deux mots.</l></sp>
<sp><speaker>Comte</speaker> <l
part="m">Parle</l></sp>
<sp><speaker>Rodrique</speaker> <l part="f">Ôte-moi
d'un doute</l></sp> <sp><speaker>Comte</speaker> <l
part="i">Connais-tu bien Don Diègue ?</l></sp>
<sp><speaker>Comte</speaker> <l
part="m">Oui</l></sp>
<sp><speaker>Rodrigue</speaker> <l part="f">Parlons
bas, écoute.</l> <l>Sais-tu que ce vieillard fut la même
vertu,</l> <l>La vaillance et l'honneur de son temps ? Le
sais-tu ?</l></sp> ... </div> ... </div>
64. EAD de l’intérieur
• <ead>
<eadheader> l‟entête
<frontmatter> les préliminaires
<archdesc> la description
<did>
<admininfo>
<bioghist>
<scopecontent>
<add>
<dsc>
<c01> les composants
</c01>
<c02>
</c02>
</dsc>
</archdesc>
</ead>
65. Schémas et DTD « métier »
• TEF - Thèses Electroniques Françaises
– Recommandation AFNOR – CG46
– http://www.abes.fr/abes/documents/tef/
• Démo : STAR et STEP - outils pour la
production de données en TEF
• http://www.abes.fr/abes/documents/tef/recommandation/ex1_theseSimplePDF.xml
• Visite guidée : theses.fr moteur de
recherche des thèses françaises
67. OAI : une philosophie
• = Open Archives Initiative
– concepts clés : archive ouverte et libre accès aux
données de la science
– http://www.openarchives.org/
– http://www.openarchives.org/OAI/2.0/guidelines-oai-
identifier.htm
• Philosophe en convergence avec l‟Open source
68. OAI-PMH : une réponse informatique
• OAI- PMH : protocole for metadata harvesting
= protocole basé sur XML et le Dublin Core pour
l'échange de métadonnées entre fournisseurs de
données et fournisseurs de services
• Répertoires OAI - visites guidées
• http://tel.ccsd.cnrs.fr/oai/oai.php
http://www.openarchives.org/Register/BrowseSites
• Tester : http://re.cs.uct.ac.za/
80. Convergence des métadonnées - ONIX
• ONIX* for books » : norme qui définit un format
d’échange de métadonnées des fichiers numériques
• élaborée et maintenue par le groupe international
EDItEUR
Visite guidée :
• http://www.onixedit.com/fr/Accueil.aspx
• http://publishers.oclc.org/en/default.htm
81.
82. Convergence des formats de lecture - ePUB
• Format ePub - « electronic publication »
développé par l‟IDPF - avril 2005
• Open Ebook V2 - format de fichier ebook
non-propriétaire - dérivé d’XML
• composé de plusieurs fichiers (instance,
structure, métadonnées…
• largement utilisé par les éditeurs
• facilite la mise en page des livres sur tout
appareil de lecture (ordinateur, mobile,
smartphone, tablette)
• + les fichiers PDF créés avec des versions
récentes du logiciel Adobe Acrobat sont
compatibles avec le format ePub.
83.
84.
85.
86.
87. Archivage pérenne des données
numériques
• modèle OAIS - Open Archival Information
System = Système ouvert d'archivage
d'information
– norme ISO - référence 14721:2003
88. Modèle OAIS – ex : DIAS (KB - Koninklijke Bibliotheek
91. Gallica, côté cour
• Océrisation : du mode image au mode texte
– recherche plein texte possible
• Données conformes aux standards du Web
– Brique de Europeana - récupération par OAI PMH
– visibilité sur les moteurs de recherche
• URL pérenne par document numérisé / par page
– Document citable
– Identification univoque
• gestion des métadonnées : données numérisées décrites
en XML (Dublin Core / METS)
• services web
– récupération du code pour intégration dans un autre site web
– audio
94. MAUX ...
• « 89 % des étudiants de premier cycle débutent une
recherche documentaire en utilisant un moteur de
recherche, 2 % seulement passent d’abord par le site
portail d’une bibliothèque »
• College Students’ Perceptions of the Libraries and Information Resources : A
Report to the OCLC Membership, Dublin (Ohio) : OCLC, 2006
95. … et remèdes
• “The future will require the kind of catalog that
is one link in a chain of services enabling
users to find, select, and obtain the information
objects they want. One requirement of this
future catalog is thus to ingest and disperse
data from and to many systems inside and
outside the library. It would be helpful to
reconsider what needs to be part of catalog
data —and where catalog data needs to be
present to facilitate the user’s process of
discovering, requesting, and getting the
information they need.”
• (Calhoun, 2006, conclusion d’un rapport commandé par la
Library of Congress ).
97. Part 3 - Renouvellement des modèles
et des règles de catalogage
D’FRBR en RDA
sommaire
98.
99.
100. Pavé ISBD – les 8 zones
• zone 0 : contenu et type de médiation (indication
générale du type de ressource)
• zone 1 : titre et mention de responsabilité (auteurs,
traducteurs)
• zone 2 : édition (1re, 2e, nouvelle édition)
• zone 3 : zone particulière aux cartographies et aux
documents électroniques
• zone 4 : adresse bibliographique (lieu d'édition, éditeur,
date)
• zone 5 : collation (description physique : pagination,
format, illustration)
• zone 6 : collection
• zone 7 : notes (on y mentionne notamment la présence
d'une bibliographie si besoin)
• zone 8 : numéro international normalisé (ISBN, ISSN)
et éventuellement prix.
101. Les bibliothèques : digital native
Les années1970
• Formats MARC
• Z39.50 : pionnier des protocoles
d'échanges de données
Les années 1980
• Catalogues collectifs via Minitel
• OPACs « Online Public Access
Catalog » = une des premières
Louise Addis, bibliothécaire du
réalisations à grande échelle du principe
Stanford Linear Accelerator Center (SLAC) de séparation entre contenu et mise en
première bibliothécaire - webmaster (1990) page
102. Label Directory FT Field FT Field FT
Ex : 210 - - $aParis$cPresses univers
France$d1992
109. Le point sur les modèles - FRBR
• Functional Requirements for Bibliographic
Records
= Spécifications fonctionnelles des notices
bibliographiques
– Approuvé par le Comité permanent de la Section de
catalogage de l‟IFLA en 1997
115. Ils travaillent pour nous
• A l‟international :
• Pour le modèle FRAD : IFLA working group on “functional
requirements and numbering of authority records”
(FRANAR) devenu par la suite « functional requirements
for authority data” (FRAD)
• Pour le modèle FRSAD : IFLA working group on
“functional requirements for subject authority data”
(FRSAD)
• En France :
• BnF - pôle Modélisation fonctionnelle / direction des
Services et des réseaux / département Information
bibliographique et numérique.) : participation, traduction
116. Le point sur les modèles - FRAD
• de 1999 à 2009 : groupe de travail FRANAR
• 2009 : Publication de Functional Requirements for
Authority Data (FRAD)- A Conceptual Model.
• modèle pour les entités décrites dans les notices
d‟autorité = « ensemble d‟informations relatives à une
personne, une famille, une collectivité ou à une œuvre
dont le nom constitue la base d’un point d’accès
contrôlé dans des références ou des notices
bibliographiques au sein d’un catalogue de
bibliothèque ou d’une base de données
bibliographiques » = entités du groupe 2 du modèle
FRBR
• En français :
http://www.bnf.fr/documents/frad_rapport_final.pdf
117. Le point sur les modèles - FRSAD
• 2005- : groupe de travail FRSAD
• 2011 : publication de Functional requirements for
subject authority data : a conceptual model
(Fonctionnalités requises des notices d‟autorité
matière)
• modèle pour les entités décrites dans les notices
d‟autorité matière
• = Entités du groupe 3 du modèle FRBR = sujets
des œuvres : concept, objet, événement et lieu.
• En français :
http://www.bnf.fr/documents/frsad_rapport_final.
pdf
118.
119.
120. En savoir plus sur FRBR …
FRBR, c‟est quoi déjà ? Philippe Le Pape , « 5 à 7 » (vidéo),
ADBS, 2011
http://www.adbs.fr/rda-le-nouveau-paradigme-du-
catalogage-1-frbr-c-est-quoi-deja--102461.htm
http://www.slideshare.net/ADBS/rda-le-nouveau-paradigme-
du-catalogage-1-frbr-cest-quoi-dj
• Les spécifications (en Français)
• http://www.bnf.fr/fr/professionnels/modelisation_ont
ologies/a.modele_FRBR.html
• http://www.bnf.fr/documents/frbr_rapport_final.pdf
• http://www.bnf.fr/documents/frad_rapport_final.pdf
122. Des principes de Paris aux PIC
• Principes internationaux de catalogage (PIC)
+ travaux de modélisation FRBR et de FRAD =
corpus sur lequel s‟appuient les nouveaux
standards de métadonnées bibliographiques et
les nouveaux codes de catalogage.
• International cataloguing principles
• Statut : standard international
1ère édition : 2009
• Principes internationaux de catalogage ; trad.
par Françoise Bourdon, Françoise Leresche,
Catherine Marandas... - Version française
123. Transformation de l’ISBD
• International standard bibliographic descriptions :
Descriptions bibliographiques internationales
normalisées
2007 : ISBD consolidé
http://www.bnf.fr/fr/professionnels/anx_norm/a.isbd_2010
_enquete.html
124. Les conditions de la
« Frbrisation » des catalogues
• points cruciaux dans les notices Unimarc :
– Titres
– Codes de langues (101)
– Accès auteurs (7XX)
– Dates
– Édition (205)
– Identifiants normalisés
– Identifiants de notices
126. Ils travaillent pour nous
• JSC = JOINT STEERING COMMITEE FOR DEVELOPMENT
OF RDA = Partenaires dans le développement d’une nouvelle
norme de catalogage international : Resource Description and
Access
• Partenaires :
– The American Library Association
– The Australian Committee on Cataloguing
– The British Library
– The Canadian Committee on Cataloguing
– CILIP: Chartered Institute of Library and Information Professionals
– Deutsche Nationalbibliothek
– The Library of Congress
• http://www.rda-jsc.org/
127. RDA en Europe ? – EURIG
• EURIG = European RDA Interest Group : Initiative des 4 pays
"fondateurs" (Allemagne, Espagne, Royaume-Uni, Suède)
• 19 pays représentés
– Membres : agences bibliographiques
– Comité exécutif
• Président : Alan Danskin (BL, membre du JSC)
• Vice-président : Gildas Illien (BnF)
• Secrétaire : Laura Peters (KB, Pays-Bas)
• voir les compte-rendus en ligne
• Travaux internationaux sur RDA : État d’avancement (Réunion du
Groupe technique sur l’adoption de RDA en France, février 2012)
128. RDA en France ?
Groupe stratégique
Groupe technique
130. Boite à outil RDA
• RDA (Ressources : description et accès)
– http://www.rdatoolkit.org/
– http://www.rdatoolkit.org/background
• RDA dans le monde
– http://www.rda-jsc.org/working2.html#chair-10
• RDA en Europe - EURIG
– http://www.slainte.org.uk/eurig/index.htm
• RDA en France
– http://rda-en-france.enssib.fr/
– http://rda.abes.fr
• Plaquette RDA
– http://rda-en-france.enssib.fr/sites/rda-en-france.enssib.fr/files/Depliantv1.pdf
• Comprendre :
– http://www.adbs.fr/rda-le-nouveau-paradigme-du-catalogage-2-qu-est-ce-que-le-
rda--102462.htm
Veille : http://www.scoop.it/t/frbr-rda-etc
131. Part 4 –
Focus – l’importance des identifiants
sommaire
132. IS – etc …
• ISBN monographies
• ISSN publications en série
• ISRC enregistrements sonores et visuels
• ISAN œuvres audiovisuelles
• ISWC œuvres musicales
• ISMN musique imprimée
• ISTC œuvres textuelles
• ISRN rapports
• ISIL bibliothèques
• ISNI les créateurs
133. Les précurseurs
• ISBN : International
Standard Book Number • ISSN : International Standard
Serial Number
norme ISO 2108 norme ISO 3297
Agence internationale Agence internationale
134. Périmètre de l’ISBN
• les monographies
• les publications non périodiques faisant l‟objet du dépôt
légal
• les numéros séparés de publications paraissant une fois par
an (rapports annuels, annuaires..)
• les publications en plusieurs volumes (un ISBN
d‟ensemble + un ISBN par volume)
• les présentations ou reliures différentes d‟un même titre
• les documents cartographiques
• les publications en braille
• les microformes
• les documents multimédia (CD-ROM, DVD, livres-audio,
etc.)
• les documents électroniques (y compris en ligne )
• les logiciels
135. De ISBN-10 à ISBN-13 …
Convertisseur :
• http://www.isbn.org/converterpub.asp
– 2-7654-0912-9 ?
En savoir plus
136. ISBN-13 : 978-2-84365-104-5
• 978 : code EAN du produit « livre »
• 2 : zone linguistique francophone
• 84365 : éditions de l‟ADBS
• 104 : numéro d‟ordre dans la
production de cet éditeur
• 5 : caractère de contrôle.
138. Périmètre de l’ISSN
les « ressources continues » =
• les publications en série
– périodiques (journaux, revues, magazines, etc.)
– monographies en série (annuaires, annales, etc.) : un ISSN
pour le titre de la série + un ISBN pour chaque volume
– collections de monographies
• les ressources intégratrices
– sites Web à mises à jour intégrées,
– publications à feuillets mobiles
139. La loi des séries
• ISSN : International Standard Serial
Number
ISO 3297:2007
140. Titre clé
• = nom de la publication +
• Attribution du titre clé (éventuellement) un
= titre normalisé qualificatif (souvent le lieu
unique attribué à une de publication).
publication en série
• Ex : ISSN - 0999-2138 est
par le Réseau de
associé au titre-clé «Ouest-
l'ISSN et lié à son
France (Rennes)».
ISSN.
141. ISSN-L
• Objectif : identifier sans ambiguïté une ressource
donnée indépendamment de son support.
• attribué à la plus ancienne version inscrite dans le
registre de l'ISSN
– Cadre d‟utilisation : l'ISSN-L permet d‟établir un lien entre la
version imprimée d'un quotidien et sa version en ligne /
numérisée
– Accès au registre ISSN : http://portal.issn.org
142. Focus - ISRC
• International Standard Recording Code
(enregistrements sonores et visuels)
– ISO 3901
• opérateur : International Federation of the
Phonographic Industry (IFPI)
ISRC FR-AB5-07-12345 ?
143. Focus - ISIL
• International Standard Identifier for Libraries and
Related Organisations
– ISO 15511 (2003)
• Structure :
– en France : FR- N°RCR (12 caractères
alphanumériques)
– Ex :
• Cadre d‟utilisation : localisations, prêt (ILL),
campagne de numérisation
• Agence en France : ABES
144. Focus - ISNI
• International Standard Name Identify
(Code international des noms )
– ISO 27729:2012
• Opérateur
– Agence internationale ISNI (ISNI-IA).
– La BnF et la British Library en sont membres
• Cadre d‟utilisation : identifier au niveau
international les identités publiques des personnes
ou des collectivités impliquées dans la création,
production, gestion et distribution des contenus
intellectuels et artistiques ou faisant l‟objet de ces
contenus.
145.
146. ARK
• Archival Resource Key
• Opérateur : California Digital Library
• Voir sur Gallica :
http://gallica.bnf.fr/ark:/12148/bpt6k107371t
• Voir sur le catalogue de la BnF :
• http://catalogue.bnf.fr/ark:/12148/cb3100947
5p
147. URI
• URI : Unified Resource Identifier
– URC : Uniform Resource Characteristic
– URN : Uniform Resource Name
– URL : Uniform Resource Locator
– PURL : Persistent Uniform Resource Locator
• http://purl.net/
• Open Url : http://nbn-resolving.org/resolve_urn.htm
148. DOI
• DOI - Digital Object Identifier
– norme : ISO 26324 (1998 )
• Opérateur : DOI Foundation (IDF) : http://www.doi.org
– Crossref dans le domaine de la recherche
– INIST-CNRS en France
• Résolveur : http://dx.doi.org/
Ex : http://dx.doi.org/10.3929/ethz-a-000565688
149. Perma lien Europeana :
http://www.europeana.eu/p
ortal/record/08549/93F426
F1A8763CA1FE06BE75B
59DEA0F5BEEEF2C.html
#.T6qFCVPxl7A.2tag
Créateur de QR Code :
http://2tag.nl/index.php
151. Vers un Web « de données liées»
Pourquoi ? Comment ?
valoriser « nos » données S‟imprégner de la
philosophie du web de
tirer bénéfice des données
données et de la culture
créées par les autres
des standards du Web
exploiter la richesse des
Sortir les données de leurs
données (scientifiques,
entrepôts (bases de
gouvernementales,
données… ) pour les
statistiques, encyclopédiques,
rendre disponibles sur le
d‟autorité, bibliographiques)
WEB
= conditions pour entrer
Voir vidéo Tim Berners LEE dans l‟écosystème du
TED 2009 linked data web
161. Visites au cœur du web de données
• DBPedia
• Geoname
• http://mappings.dbpedia.or
g/server/ontology/classes/ • Musicbrainz
• Exemple : • Data.gov
http://fr.wikipedia.org/wik
i/Mod%C3%A8le:Infobox
_Personnage_%28fiction • http://data.gov.uk/
%29
162. En savoir plus sur le web de données
• Tim Berners-Lee : The Next Web of Open, Linked Data (TED 2009)
– http://dai.ly/cvIl6P (sous-titré en français)
• Linking OpenData
– http://esw.w3.org/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
• LIBRIS : un catalogue dans le linked data
– http://dc2008.de/wp-content/uploads/2008/09/malmsten.pdf
• Les catalogues de bibliothèques sur le Web – Emmanuelle Bermès (2009)
– http://www.slideshare.net/Figoblog/les-catalogues-sur-le-web
• Le web sémantique : un web de métadonnées – Yann Nicolas
– http://www.slideshare.net/yannn/le-web-smantique-un
• Portail de blogs : http://planete.websemantique.org/
163.
164. Introduction à RDF
● Une nouvelle grammaire (descriptive) pour
tout transformer : /
● triplet RDF = la clé de la métamorphose :
isbd.rdf ; DC.rdf ; Marc.rff ; rda.rdf …
● Pour se comprendre : les ontologies =
schémas relationnels (SKOS ; FOAF)
● Des ressources en commun : VIAF,
Geoname, data.bnf, IdRef …)
165. RDF – Resource Description Framework
• À la base du Web sémantique : utilisé (notamment)
pour décrire les ressources du web et leur métadonnées
et permettre leur traitement automatique
• RDF Model Theory
– recommandation W3C du 14 février 2002
– http://www.w3.org/TR/2002/WD-rdf-mt-20020214/V
– voir la recommandation du W3C (en français)
• Un langage de requête spécifique : SPARQL
Protocol and RDF Query Language
– Recommandation W3C du 15 janvier 2008
– http://www.w3.org/TR/rdf-sparql-protocol/
166. RDF - syntaxe
• RDF peut s‟écrire dans différentes syntaxes
• RDF/XML - Syntax Specification
– recommandation W3C du 25 Mars 2002
– http://www.w3.org/TR/2002/WD-rdf-syntax-grammar-
20020325/
• Turtle - Terse RDF Triple Language
– recommandation W3C du 14 January 2008
– http://www.w3.org/TeamSubmission/2008/SUBM-turtle-
20080114/
167.
168. RDF - le principe des triplets
Les données sont décomposées / recomposées en
« triplets RDF »
http://www.w3.org/Home/Lassila
Sujet ( = ce qu‟on décrit )
Prédicat ( = une Propriété applicable à ce
A pour Créateur
qu‟on décrit )
Objet (= une valeur ) "Ora Lassila"
…. et modélisées en « graphes RDF »
169. Sujet/prédicat/objet
• Quatre-vingt-treize est un
roman de Victor Hugo paru en
1874 et dont le thème est la • (Quatre-vingt-treize, type,
révolution française roman)
• (Quatre-vingt-treize, auteur,
• Quatre-vingt-treize est un Victor Hugo)
roman
• (Quatre-vingt-treize, année
• Quatre-vingt-treize a pour
auteur Victor Hugo de parution, 1874)
• Quatre-vingt-treize est paru en • (Quatre-vingt-treize, thème,
1874 La Révolution Française)
• Quatre-vingt-treize a pour
thème la Révolution française
Exemple emprunté à Bernard Vatant –
in Métadonnées, perspectives et Mutations
Séminaire INRIA – 2008)
170. Sujet / prédicat / objet
Ressource = 1 URI = http://dbpedia.org/resource/Ninety-Three
dbpedia : Ninety-Three rdf:type
yago:Novel106367879
dbpedia : Ninety-Three dcterms : creator dbpedia : Victor Hugo
dbpedia : Ninety-Three dcterms : created « 1874 »
dbpedia : Ninety-Three skos:subject dbpedia : Category :
French revolution
171. RDF - s’exprimer en URI…
• Principe : chaque ressource (= objet, lieu, livre,
auteur …..) est identifiée par une - ou plusieurs -
URI
-(= identifiant uniforme de ressource)
– ex : un oiseau =
http://stitch.cs.vu.nl/vocabularies/rameau/ark:/12148/cb
11932889r
– ex : Les Boulassiers http://sws.geonames.org/3031189/
– ex : Aristote = http://viaf.org/viaf/7524651/#Aristotle
« same as » http://www.idref.fr/026690276/id
172. RDF - s’exprimer en URI
• Ex : Dublin Core en RDF
http://dublincore.org/2010/10/11/dcelements.rdf#
http://www.dublincore.org/documents/dcmi-
terms/#H5
• Ex : ISBD en RDF
ISBD : http://iflastandards.info/ns/isbd/
173. RDF - Une langue, des ontologies –
OWL
• OWL -Web Ontology Langage
« super -structure » des ontologies
(= vocabulaires RDF)
–recommandation W3C du 12
novembre 2002
• // METS ?
174. RDF - Une langue, des ontologies –
SKOS
• Simple Knowledge Organisation System
– recommandation W3C du 18 août 2009
– représentation dans un contexte multilingue de tout
vocabulaire contrôlé (thésaurus, classifications,
taxonomies, etc )
Voir :
– http://www.w3.org/TR/skos-reference/#semantic-relations
– http://www.w3.org/2009/08/skos-reference/skos.html
175. RDF - Une langue, des ontologies –
FOAF
• Friend of a Friend
– recommandation W3C du 9 août 2010
– description des personnes et des relations entre elles
– http://xmlns.com/foaf/spec/20100809.html
• Tutoriel
• tester FOAF
181. En d‟autres termes : comment porter les
données des bibliothèques sur le web de
données ?
Source : Emmanuelle Bermès –
http://www.slideshare.net/Figoblog/les-catalogues-sur-le-web
182.
183. Des réponses convergentes
Vocabulaires RDF Réalisations
• MADS/RDF
Rameau en SKOS
(TEL Plus Project)
Dublin Core en RDF
VIAF : Virtual
International Authority
FRBR / FRSAD en File (OCLC)
RDF • IdREF : autorités Sudoc
en RDF (ABES)
RDA en RDF • Projet Open Library
http://openlibrary.org/a
ISBD en RDF bout/lib
199. Boite à Outils RDF
• traduction en RDF des normes, formats …
• http://metadataregistry.org/
200. Boite à Outils RDF
• INDICE = pour voir le monde en RDF
– http://inspector.sindice.com/
• Pour voir le monde en URI :
• Les concepts - SKOS -
http://www.w3.org/2004/02/skos/
• Les langues - Lexvo -
http://www.lexvo.org/index.html
• Les lieux – Geonames : http://sws.geonames.org
• les personnes et collectivités : tester FOAF
201. Boite à outils RDF
• Ontologies et espaces de nom :
– MADS : http://www.loc.gov/mads/rdf/v1#
– OWL : http://www.w3.org/2002/07/owl#
– RDF : http://www.w3.org/1999/02/22-rdf-syntax-ns#
– RDFS : http://www.w3.org/2000/01/rdf-schema#
– SKOS : http://www.w3.org/2004/02/skos/core#
– FOAF : http://xmlns.com/foaf/0.1/
202. #Bonus - D’ FRBR en RDA –
sur l’air de « en passant par RDF »
• Rendons à César …la palme des meilleures
présentations sur ces questions épineuses -
– http://www.abes.fr/Media/Fichiers/Article-WEB/Journees-ABES/2010pps/LePape_FranceRDA02
– http://www.slideshare.net/ADBS/rda-le-nouveau-paradigme-du-catalogage-1-frbr-cest-quoi-dj
203. la suite ???
c’est maintenant !!!
Conception : Christine Fleury
Cadre d’intervention : formation proposée par l’ADBS (Domaine /
zoom métiers / Bibliothèques )
Thème : « Mutation des formats bibliographiques » - 29-30 Mai 2012
Cette présentation est placée sous licence Creative Commons