1. Mutation desformats bibliographiquesà l’ère du numérique et du web de donnéesou .. «du catalogage à l’encodage»
Formation ADBS (29-30 mai 2012)
Intervenante : Christine Fleury
2. Dispositif pédagogique
•Cette présentation (en ligne sur SlideShare)
•Dossier documentaire :
–Petit lexique de survie
–Focus
–sélection d‟articles
•Visites de ressources
•Démonstrations –utilisation d‟outils dédiés
•TP –manipulation et analyse de données (en ligne sur ISSUU)
Ce dispositif est placé sous licence :
3. Au programme
•Introduction : comprendre les facteurs de transformation de la sphère bibliographique
•Irruption dans la sphère bibliographique : XML et les métadonnées
•Accompagner la transition numérique : nouveaux enjeux interprofessionnels --cas concrets
•Renouvellement des modèles et des règles de catalogage : D‟FRBR en RDA
Focus : L‟importance des identifiants
•Vers le web de données: Introduction à RDF
16. De la Dématérialisation des supports
télévision / radio
téléphonie
photographie
cinéma
musique
lecture
A partir de 1980 :
révolution numérique
qui impacte (presque) l’ensemble des objets culturels
23. À la Bibliothèquenumérique
Des USAGESDes ESPACES
Des ARCHITECTURES techniques
source :Olivier Ertzscheid
24. Missions numériques : valorisation médiation diffusion dissémination
•faciliter l‟accès aux ressources numériques
•Valoriser les données bibliographiques
•exposer ses données aux moteurs de recherche
= renouvellement des interfaces des catalogues
+ revisite des formats de données
Vers le Metadata management
25. Missions numériques : préservation archivage pérenne
•Préserver le patrimoine par la numérisation
•Garantir l‟intégrité des données numériques
•Garantir la pérennité des données numériques
36. Part 1 – Irruption dans la sphère bibliographique : XML et les métadonnéessommaire
37. au générique : l'interopérabilité
Production :
Dans les rôles principaux :
•XML = lingua franca informatique
•XSLT : le traducteur universel
•Unicode = Babel des écritures
•Dans l’ordre d’apparition : TEI, EAD, Dublin Core, MarcXML, MODS, MADS, METS, TEF, LOM...
= métadonnées en partage
•OAI –PMH = hors de la tour d’ivoire des savoirs
•OAIS = la garantie de l’avenir
38. Focus surles protocoles
•un objectif: l‟intéropérabilitédes systèmesd‟échangesde donnéespour permettreleurcirculation
•Z39-50 : le pionnier(= interrogation à distance)
•FTP : transport entre serveurs
•HTTP : la navigation surle Web
•TCP/IP : le transport des donnéesdu web
•SRU/SRW : Z39-50 surle Web
39. De l’encodage universel
48 C3 A9 74 C3 A9 72 6F 67 C3 A8 6E 65
غير متجانسة
异质
異種の
மாறிலி
= hétérogène
כעטעראַדזשיניאַס
ετερογενής
40. XML -Au royaume du mapping....
•le cycle de transformations des données
–XML : un langage
–XSLT : un traducteur
–DTD (MarcXml, Dublin Core, TEF, EAD...) : des vocabulaires
–Schémas : des structures
•«Rien ne se perd, rien ne se crée, tout se transforme» (Lavoisier)
41. … et du Mash up
•application composite qui combine des contenus ou des services provenant de diverses applications et sites
webservices et API
RSS
42. XML –berceau des métadonnées
Extensible Markup Language1998 : Standard W3C http://www.w3.org/XML/ Familledes langages“à balises” < /> + ouvert(non propriétaire) + hiérarchique(structuré) = format d‟échange= interopérabilité= langagepivot
44. XML –une syntaxe souple
•Head = prologue
–Référence à la version
–Encodage (UTF8 par défaut)
–Déclaration d‟espace de nom
•Éléments
–<baLiSe>Donnée</baLiSe>
–<_baliseattribut9='valeur'/>
•Exemple :
<?xmlversion="1.0" standalone="yes"?>
<magasin>
<service>
<produit> Vaisselle </produit>
<couleur produit = „bleue‟>
</service>
</magasin>
46. XML –DTD …
DTD : Document Type Definition
= structure logique permettant de vérifier la conformité du document XML
Exemple :
<!DOCTYPE annuaire [ <!ELEMENT personne (nom,prenom,telephone,email? > <!ELEMENT nom (#PCDATA) > <!ELEMENT prenom(#PCDATA) > <!ELEMENT telephone(#PCDATA) > <!ELEMENT email (#PCDATA) > <personne> <nom> </nom><prenom> Prénom</prenom> <telephone>Tel </telephone> <email>Courriel</email></personne>
47. <?xmlversion="1.0" encoding="UTF-8"?>
<ex:collectionxml:lang="fr" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns="http://www.w3.org/1999/xhtml"
<élément>Texte</élément>
<dc:title>Astérix le Gaulois</dc:title>
<ex:livreattribut="valeur" type="BD">
<dc:title>Astérix chez les Belges</dc:title>
<!--élément répété -->
<dc:creator>René Goscinny</dc:creator>
<dc:creator>Albert Uderzo</dc:creator>
<dc:description> Astérix chez les Belges est un album de <ahref="http://fr.wikipedia.org/wiki/ Bande_dessinée">bande dessinée</a> de la série Astérix le Gaulois créée par René Goscinny et Albert Uderzo.
</dc:description>
</ex:livre>
</ex:collection> = espaces de nom
= schéma de référence
= encodage= commentaire
50. «au-delà des données»
•Du grec «meta» : au-delà-de
•Selon ISO (2003) : «donnée qui définit et décrit une autre donnée»
•Selon NISO (2004) : «information structurée qui décrit, explique, localise la ressource et en facilite la recherche, l‟usage et la gestion»
58. •<link rel="schema.dc" href="http://purl.org/DC/elements/1.1/"/>
•<link rel="schema.cndp" href="http://www.cndp.fr/standards/meta/1.0/" />
•<metaname="dc.title" content="Dossier documentaire sur les métadonnées " />
•<metaname="dc.description" content="mise en perspective -nouveaux formats bibliographique -renouvellement du cadre normatif -modèle FRBR/règles RDA, un assouplissement et un enrichissement des données -XML / métadonnées -une (r)évolution technique -numérique et web de données -connaître les bouleversements en cours, comprendre les enjeux pour la description bibliographique dans ce contexte (numérisation, édition électronique..), mettre en perspective les différents éléments métier ( modèles et normes, schémas et structures, environnements techniques et juridique...)" />
•<meta name="dc.creator" content="Fleury, Christine" />
•<metaname="cndp.niveau" content="licence professionnelle;maîtrise;master;DUTdiplôme universitaire de technologie" />
•<metaname="cndp.discipline" content=" enseignement renforcé des langues; éducation à l'image; éducation aux médias; formation à la maîtrise de l'information; culture scientifique et technique" />
•<meta name="dc.subject" scheme="DCC" content="formation" />
•<meta name="dc.subject" content="e-learning" />
•<meta name="dc.date" content="2012-04-18" />
•<meta name="dc.type" scheme="dcMIType" content="Interactive ressource" />
•<meta name="dc.rights" content="creative common -CC-" />
•<meta name="dc.language" content="fr" />
•<metaname="cndp.public" content="Enseignant" />
•<metaname="cndp.statut" content="Document de travail" />
60. Schémas et DTD «métier»
•TEI -TextEncodingInitiative
•http://www.tei-c.org/
•http://www.tei-c.org/release/doc/tei-p5-doc/fr/html/
= système pour faciliter la création, l'échange, l'intégration de données textuelles informatisées
«Il ne s'agit pas d'une spécification (DTD ou Schéma) en soi mais plutôt d'un cadre (framework) pour en développer des particulières.»
61. TEI vu de l’intérieur
•En-tête :
–<fileDesc>: Description bibliographique de la ressource dans le même style que celle proposée par les RCAA (titre, auteur, édition, taille, etc.)
–<encodingDesc>: Renseignements sur la manière dont le texte a été encodé.
–<profileDesc>: Autres types d‟indications au sujet de la ressource (langue, participants à la création, thèmes abordés, etc.)
–<revisionDesc>: Mises à jour effectuées sur la ressource et intermédiaires responsables de sa modification.
•Texte :
–<front>: Rassemble des données qui se trouvent avant le début du texte (page de titre, préface, dédicace, etc.)
–<group>: Permet d‟associer ensemble plusieurs textes unitaires ou des groupes de textes.
–<body>: Comprend le texte en tant que tel, mis à part les annexes et les données préliminaires.
–<back>: Combine toutes les annexes auxquelles fait allusion le texte principal.
62. TEI vu de l’intérieur
<divtype="Act" n="I"><head>Acte II</head> <divtype="Scene" n="1"><head>Scène 2</head> <sp><speaker>Rodrigue</speaker> <l part="i">À moi, comte, deux mots.</l></sp> <sp><speaker>Comte</speaker> <l part="m">Parle</l></sp> <sp><speaker>Rodrique</speaker> <l part="f">Ôte-moi d'un doute</l></sp> <sp><speaker>Comte</speaker> <l part="i">Connais-tu bien Don Diègue?</l></sp> <sp><speaker>Comte</speaker> <l part="m">Oui</l></sp> <sp><speaker>Rodrigue</speaker> <l part="f">Parlons bas, écoute.</l> <l>Sais-tu que ce vieillard fut la même vertu,</l> <l>La vaillance et l'honneur de son temps ? Le sais-tu ?</l></sp> ... </div> ... </div>
64. EAD de l’intérieur
•<ead> <eadheader> l‟entête<frontmatter> les préliminaires
<archdesc> la description<did> <admininfo> <bioghist> <scopecontent> <add> <dsc> <c01> les composants</c01>
<c02> </c02> </dsc> </archdesc>
</ead>
65. Schémas et DTD «métier»
•TEF -Thèses Electroniques Françaises
–Recommandation AFNOR –CG46
–http://www.abes.fr/abes/documents/tef/
•Démo : STAR et STEP -outils pour la production de données en TEF
•http://www.abes.fr/abes/documents/tef/recommandation/ex1_theseSimplePDF.xml
•Visite guidée : theses.frmoteur de recherche des thèses françaises
67. OAI : une philosophie
•= Open Archives Initiative
–concepts clés : archive ouverte et libre accès aux données de la science
–http://www.openarchives.org/
–http://www.openarchives.org/OAI/2.0/guidelines-oai- identifier.htm
•Philosophe en convergence avec l‟Open source
68. OAI-PMH : une réponse informatique
•OAI-PMH : protocole for metadataharvesting
= protocole basé sur XML et le Dublin Corepour l'échange de métadonnées entre fournisseurs de données et fournisseurs de services
•Répertoires OAI -visites guidées
•http://tel.ccsd.cnrs.fr/oai/oai.phphttp://www.openarchives.org/Register/BrowseSites
•Tester : http://re.cs.uct.ac.za/
80. Convergence des métadonnées -ONIX
•ONIX* for books » : norme qui définit un format d’échange de métadonnéesdes fichiers numériques
•élaborée et maintenue par le groupe international EDItEUR
Visite guidée :
•http://www.onixedit.com/fr/Accueil.aspx
•http://publishers.oclc.org/en/default.htm
82. Convergence des formats de lecture -ePUB
•Format ePub-« electronicpublication » développé parl‟IDPF -avril 2005
•Open EbookV2 -format de fichier ebooknon-propriétaire -dérivé d’XML
•composé de plusieurs fichiers (instance, structure, métadonnées…
•largement utilisé par les éditeurs
•facilite la mise en page des livres sur tout appareil de lecture (ordinateur, mobile, smartphone, tablette)
•+ les fichiers PDF créés avec des versions récentes du logiciel Adobe Acrobat sont compatibles avec le format ePub.
87. Archivage pérenne des données numériques
•modèle OAIS -Open ArchivalInformation System = Système ouvert d'archivage d'information
–norme ISO-référence 14721:2003
91. Gallica, côté cour
•Océrisation: du mode image au mode texte
–recherche plein texte possible
•Données conformes aux standards du Web
–Brique de Europeana-récupération par OAI PMH
–visibilité sur les moteurs de recherche
•URL pérenne par document numérisé / par page
–Document citable
–Identification univoque
•gestion des métadonnées : données numérisées décrites en XML (Dublin Core/ METS)
•services web
–récupération du code pour intégration dans un autre site web
–audio
94. MAUX ...
•«89 % des étudiants de premier cycle débutent une recherche documentaire en utilisant un moteur de recherche, 2 % seulement passent d’abord par le site portail d’une bibliothèque »
•College Students’ Perceptions of the Libraries and Information Resources : A Report to the OCLC Membership, Dublin (Ohio) : OCLC, 2006
95. … et remèdes
•“The future will require the kind of catalog that is one link in a chain of servicesenabling users to find, select, and obtain the information objects they want. One requirement of this future catalog is thus to ingest and disperse datafrom and to many systems inside and outside the library. It would be helpful to reconsider what needs to be part of catalog data —and where catalog data needs to be presentto facilitate the user’s process of discovering, requesting, and getting the information they need.”
•(Calhoun, 2006, conclusion d’un rapport commandé par la Library of Congress ).
97. D’FRBR en RDA
Part 3 -Renouvellement des modèles
et des règles de catalogage sommaire
100. Pavé ISBD –les 8 zones
•zone 0: contenu et type de médiation (indication générale du type de ressource)
•zone 1: titre et mention de responsabilité (auteurs, traducteurs)
•zone 2: édition (1re, 2e, nouvelle édition)
•zone 3: zone particulière aux cartographies et aux documents électroniques
•zone 4: adresse bibliographique (lieu d'édition, éditeur, date)
•zone 5: collation (description physique: pagination, format, illustration)
•zone 6: collection
•zone 7: notes (on y mentionne notamment la présence d'une bibliographie si besoin)
•zone 8: numéro international normalisé (ISBN, ISSN) et éventuellement prix.
101. Les bibliothèques : digital native
Les années1970
•Formats MARC
•Z39.50 : pionnierdes protocolesd'échangesde données
Les années1980
•Catalogues collectifsvia Minitel
•OPACs «Online Public Access Catalog» = une des premières réalisations à grande échelle du principe de séparation entre contenu et mise en page Louise Addis, bibliothécairedu Stanford Linear Accelerator Center(SLAC) première bibliothécaire-webmaster (1990)
102. Ex : 210 --$aParis$cPressesuniversitaires France$d1992
Label Directory FT Field FT Field FT
109. Le point sur les modèles -FRBR
•FunctionalRequirementsfor BibliographicRecords
= Spécifications fonctionnelles des notices bibliographiques
–Approuvé par le Comité permanent de la Section de catalogage de l‟IFLA en 1997
115. Ils travaillent pour nous
•A l‟international:
•Pour le modèleFRAD : IFLA working group on “functional requirements and numbering of authority records” (FRANAR)devenu par la suite «functional requirements for authority data” (FRAD)
•Pour le modèleFRSAD : IFLA working group on “functional requirements for subject authority data” (FRSAD)
•En France :
•BnF-pôle Modélisation fonctionnelle / direction des Services et des réseaux / département Information bibliographique et numérique.) : participation, traduction
116. Le point sur les modèles -FRAD
•de 1999 à 2009 : groupe de travail FRANAR
•2009 : Publication deFunctionalRequirementsfor AuthorityData (FRAD)-A ConceptualModel.
•modèle pour les entités décrites dans les notices d‟autorité = « ensemble d‟informations relatives à une personne, une famille, une collectivité ou à une oeuvre dont le nom constitue la base d’un point d’accès contrôlé dans des références ou des notices bibliographiques au sein d’un catalogue de bibliothèque ou d’une base de données bibliographiques» = entités du groupe 2 du modèle FRBR
•En français : http://www.bnf.fr/documents/frad_rapport_final.pdf
117. Le point sur les modèles -FRSAD
•2005-: groupe de travail FRSAD
•2011 : publication de Functional requirements for subject authority data : a conceptual model (Fonctionnalités requises des notices d‟autorité matière)
•modèle pour les entités décrites dans les notices d‟autorité matière
•= Entités du groupe 3 du modèle FRBR = sujets des oeuvres : concept, objet, événement et lieu.
•En français: http://www.bnf.fr/documents/frsad_rapport_final. pdf
120. En savoir plus sur FRBR …
FRBR, c‟est quoi déjà ? Philippe Le Pape , «5 à 7» (vidéo), ADBS, 2011
http://www.adbs.fr/rda-le-nouveau-paradigme-du- catalogage-1-frbr-c-est-quoi-deja--102461.htm
http://www.slideshare.net/ADBS/rda-le-nouveau-paradigme- du-catalogage-1-frbr-cest-quoi-dj
•Les spécifications (en Français)
•http://www.bnf.fr/fr/professionnels/modelisation_ontologies/a.modele_FRBR.html
•http://www.bnf.fr/documents/frbr_rapport_final.pdf
•http://www.bnf.fr/documents/frad_rapport_final.pdf
122. Des principes de Paris aux PIC
•Principes internationaux de catalogage (PIC)
+ travaux de modélisation FRBR et de FRAD = corpus sur lequel s‟appuient les nouveaux standards de métadonnées bibliographiques et les nouveaux codes de catalogage.
•International cataloguingprinciples
•Statut: standard international1èreédition: 2009
•Principes internationaux de catalogage; trad. par Françoise Bourdon, Françoise Leresche, Catherine Marandas... -Version française
123. Transformation de l’ISBD
•International standard bibliographicdescriptions :
Descriptions bibliographiques internationales normalisées
2007 : ISBD consolidé
http://www.bnf.fr/fr/professionnels/anx_norm/a.isbd_2010_enquete.html
124. Les conditions de la «Frbrisation» des catalogues
•points cruciaux dans les notices Unimarc:
–Titres
–Codes de langues (101)
–Accès auteurs (7XX)
–Dates
–Édition (205)
–Identifiants normalisés
–Identifiants de notices
126. Ils travaillent pour nous
•JSC = JOINT STEERING COMMITEE FOR DEVELOPMENT OF RDA = Partenaires dans le développement d’une nouvelle norme de catalogage international : Resource Description and Access
•Partenaires :
–The American Library Association
–The Australian Committee on Cataloguing
–The British Library
–The Canadian Committee on Cataloguing
–CILIP: Chartered Institute of Library and Information Professionals
–Deutsche Nationalbibliothek
–The Library of Congress
•http://www.rda-jsc.org/
127. •EURIG = EuropeanRDA InterestGroup : Initiative des 4 pays "fondateurs" (Allemagne, Espagne, Royaume-Uni, Suède)
•19 pays représentés
–Membres : agences bibliographiques
–Comité exécutif
•Président : Alan Danskin(BL, membre du JSC)
•Vice-président : Gildas Illien(BnF)
•Secrétaire : Laura Peters (KB, Pays-Bas)
•voir les compte-rendusen ligne
•Travaux internationaux sur RDA : État d’avancement(Réunion du Groupe technique sur l’adoption de RDA en France, février 2012) RDA en Europe ? –EURIG
130. Boite à outil RDA
•RDA (Ressources : description et accès)
–http://www.rdatoolkit.org/
–http://www.rdatoolkit.org/background
•RDA dans le monde
–http://www.rda-jsc.org/working2.html#chair-10
•RDA en Europe -EURIG
–http://www.slainte.org.uk/eurig/index.htm
•RDA en France
–http://rda-en-france.enssib.fr/
–http://rda.abes.fr
•Plaquette RDA
–http://rda-en-france.enssib.fr/sites/rda-en-france.enssib.fr/files/Depliantv1.pdf
•Comprendre :
–http://www.adbs.fr/rda-le-nouveau-paradigme-du-catalogage-2-qu-est-ce-que-le- rda--102462.htm
Veille : http://www.scoop.it/t/frbr-rda-etc
131. Part 4 – Focus –l’importance des identifiantssommaire
132. IS –etc…
•ISBN
•ISSN
•ISRC
•ISAN
•ISWC
•ISMN
•ISTC
•ISRN
•ISIL
•ISNI
monographies
publications en série
enregistrements sonores et visuels
oeuvres audiovisuelles
oeuvres musicales
musique imprimée
oeuvres textuelles
rapports
bibliothèques
les créateurs
133. Les précurseurs
•ISBN : International Standard Book Numbernorme ISO2108Agence internationalenorme ISO 3297Agence internationale
•ISSN : International StandardSerial Number
134. Périmètre de l’ISBN
•les monographies
•les publications non périodiques faisant l‟objet du dépôt légal
•les numéros séparés de publications paraissant une fois par an (rapports annuels, annuaires..)
•les publications en plusieurs volumes (un ISBN d‟ensemble + un ISBN par volume)
•les présentations ou reliures différentes d‟un même titre
•les documents cartographiques
•les publications en braille
•les microformes
•les documents multimédia (CD-ROM, DVD, livres-audio, etc.)
•les documents électroniques (y compris en ligne)
•les logiciels
135. De ISBN-10 à ISBN-13…
Convertisseur :
•http://www.isbn.org/converterpub.asp
–2-7654-0912-9 ?
En savoir plus
136. ISBN-13: 978-2-84365-104-5
•978 : code EAN du produit «livre»
•2 : zone linguistique francophone
•84365 : éditions de l‟ADBS
•104 : numéro d‟ordre dans la production de cet éditeur
•5 : caractère de contrôle.
138. Périmètre de l’ISSN
les «ressources continues» =
•les publications en série
–périodiques (journaux, revues, magazines, etc.)
–monographies en série (annuaires, annales, etc.): un ISSN pour le titre de la série + un ISBN pour chaque volume
–collections de monographies
•les ressources intégratrices
–sites Web à mises à jour intégrées,
–publications à feuillets mobiles
139. La loi des séries
•ISSN : International Standard Serial Number
ISO 3297:2007
140. Titre clé
•Attribution du titre clé = titre normalisé unique attribué à une publication en série par le Réseau de l'ISSN et lié à son ISSN.
•= nom de la publication + (éventuellement) un qualificatif (souvent le lieu de publication).
•Ex : ISSN -0999-2138est associé au titre-clé «Ouest- France (Rennes)».
141. ISSN-L
•Objectif : identifier sans ambiguïté une ressource donnée indépendamment de son support.
•attribué à la plus ancienne version inscrite dans le registre de l'ISSN
–Cadre d‟utilisation : l'ISSN-L permet d‟établir un lien entre la version imprimée d'un quotidien et sa version en ligne / numérisée
–Accès au registre ISSN : http://portal.issn.org
142. Focus -ISRC
•International Standard RecordingCode(enregistrements sonores et visuels)
–ISO 3901
•opérateur : International Federation of the Phonographic Industry(IFPI)
ISRC FR-AB5-07-12345 ?
143. Focus -ISIL
•International Standard Identifier for Librariesand RelatedOrganisations
–ISO 15511 (2003)
•Structure :
–en France : FR-N°RCR (12 caractères alphanumériques)
–Ex :
•Cadre d‟utilisation : localisations, prêt (ILL), campagne de numérisation
•Agence en France : ABES
144. Focus -ISNI
•International Standard Name Identify
(Code international des noms )
–ISO 27729:2012
•Opérateur
–Agence internationale ISNI (ISNI-IA).
–La BnFet la British Library en sont membres
•Cadre d‟utilisation : identifier au niveau international les identités publiques des personnes ou des collectivités impliquées dans la création, production, gestion et distribution des contenus intellectuels et artistiques ou faisant l‟objet de ces contenus.
146. ARK
•ArchivalResource Key
•Opérateur : CaliforniaDigital Library
•Voir sur Gallica: http://gallica.bnf.fr/ark:/12148/bpt6k107371t
•Voir sur le catalogue de la BnF:
•http://catalogue.bnf.fr/ark:/12148/cb31009475p
148. DOI
•DOI -Digital Object Identifier
–norme : ISO 26324 (1998 )
•Opérateur : DOI Foundation(IDF) : http://www.doi.org
–Crossrefdans le domaine de la recherche
–INIST-CNRS en France
•Résolveur : http://dx.doi.org/
Ex : http://dx.doi.org/10.3929/ethz-a-000565688
149. Créateur de QR Code : http://2tag.nl/index.phpPerma lien Europeana: http://www.europeana.eu/portal/record/08549/93F426F1A8763CA1FE06BE75B59DEA0F5BEEEF2C.html#.T6qFCVPxl7A.2tag
151. Vers un Web «de donnéesliées»
Comment ?
S‟imprégner de la philosophie du web de données et de la culture des standards du Web
Sortir les données de leurs entrepôts (bases de données… ) pour les rendre disponibles sur le WEB
= conditions pour entrer dans l‟écosystème du linkeddataweb
Pourquoi ?
valoriser «nos» données
tirer bénéfice des données créées par les autres
exploiter la richesse des données (scientifiques, gouvernementales, statistiques, encyclopédiques, d‟autorité, bibliographiques)
Voir vidéo Tim BernersLEETED 2009
161. Visites au coeur du web de données
•Geoname
•Musicbrainz
•Data.gov
•http://data.gov.uk/
•DBPedia
•http://mappings.dbpedia.org/server/ontology/classes/
•Exemple : http://fr.wikipedia.org/wiki/Mod%C3%A8le:Infobox_Personnage_%28fiction%29
162. En savoir plus sur le web de données
•Tim Berners-Lee : The Next Web of Open, Linked Data (TED 2009)
–http://dai.ly/cvIl6P(sous-titré en français)
•LinkingOpenData
–http://esw.w3.org/SweoIG/TaskForces/CommunityProjects/LinkingOpenData
•LIBRIS : un catalogue dans le linkeddata
–http://dc2008.de/wp-content/uploads/2008/09/malmsten.pdf
•Les catalogues de bibliothèques sur le Web –Emmanuelle Bermès(2009)
–http://www.slideshare.net/Figoblog/les-catalogues-sur-le-web
•Le web sémantique : un web de métadonnées –Yann Nicolas
–http://www.slideshare.net/yannn/le-web-smantique-un
•Portail de blogs : http://planete.websemantique.org/
164. Introduction à RDF
●Une nouvelle grammaire (descriptive) pour tout transformer : /
●triplet RDF = la clé de la métamorphose : isbd.rdf ; DC.rdf ; Marc.rff ; rda.rdf …
●Pour se comprendre : les ontologies = schémas relationnels (SKOS ; FOAF)
●Des ressources en commun : VIAF, Geoname, data.bnf, IdRef…)
165. RDF –Resource Description Framework
•À la base du Web sémantique : utilisé (notamment) pour décrire les ressources du web et leur métadonnées et permettre leur traitement automatique
•RDF Model Theory
–recommandation W3C du 14 février2002
–http://www.w3.org/TR/2002/WD-rdf-mt-20020214/V
–voir la recommandation du W3C (en français)
•Un langage de requête spécifique : SPARQL
Protocol and RDF Query Language
–RecommandationW3C du 15 janvier2008
–http://www.w3.org/TR/rdf-sparql-protocol/
166. RDF -syntaxe
•RDF peut s‟écrire dans différentes syntaxes
•RDF/XML -Syntax Specification
–recommandation W3C du 25 Mars 2002
–http://www.w3.org/TR/2002/WD-rdf-syntax-grammar- 20020325/
•Turtle -Terse RDF Triple Language
–recommandation W3C du 14 January 2008
–http://www.w3.org/TeamSubmission/2008/SUBM-turtle- 20080114/
168. Sujet ( = ce qu‟on décrit )
http://www.w3.org/Home/Lassila
Prédicat ( = une Propriétéapplicable à ce qu‟on décrit )
A pour Créateur
Objet (=une valeur )
"OraLassila" RDF -le principe des tripletsLes données sont décomposées / recomposées en «tripletsRDF »
…. et modélisées en «graphes RDF»
169. Sujet/prédicat/objet
•Quatre-vingt-treizeest un roman de Victor Hugo paru en 1874 et dont le thème est la révolution française
•Quatre-vingt-treize estun roman
•Quatre-vingt-treize a pour auteur Victor Hugo
•Quatre-vingt-treize est paru en 1874
•Quatre-vingt-treize a pour thèmela Révolution française
•(Quatre-vingt-treize, type, roman)
•(Quatre-vingt-treize, auteur, Victor Hugo)
•(Quatre-vingt-treize, année de parution, 1874)
•(Quatre-vingt-treize, thème, La Révolution Française)
Exemple emprunté à Bernard Vatant – in Métadonnées, perspectives et MutationsSéminaire INRIA –2008)
170. Sujet / prédicat/ objet
Ressource = 1 URI = http://dbpedia.org/resource/Ninety-Three
dbpedia: Ninety-Threerdf:typeyago:Novel106367879
dbpedia: Ninety-Threedcterms: creatordbpedia: Victor Hugo
dbpedia: Ninety-Threedcterms: created«1874»
dbpedia: Ninety-Threeskos:subjectdbpedia: Category: French revolution
171. RDF -s’exprimer en URI…
•Principe : chaque ressource (= objet, lieu, livre, auteur …..) est identifiée par une -ou plusieurs - URI
-(= identifiant uniforme de ressource)
–ex : un oiseau = http://stitch.cs.vu.nl/vocabularies/rameau/ark:/12148/cb11932889r
–ex :Les Boulassiershttp://sws.geonames.org/3031189/
–ex : Aristote = http://viaf.org/viaf/7524651/#Aristotle
«sameas» http://www.idref.fr/026690276/id
172. RDF -s’exprimer en URI
•Ex : Dublin Core en RDF
http://dublincore.org/2010/10/11/dcelements.rdf#
http://www.dublincore.org/documents/dcmi- terms/#H5
•Ex : ISBD en RDF
ISBD : http://iflastandards.info/ns/isbd/
173. •OWL-Web OntologyLangage «super-structure» des ontologies (= vocabulaires RDF)
–recommandation W3C du 12 novembre 2002
•// METS ?
RDF -Une langue, des ontologies – OWL
174. RDF -Une langue, des ontologies – SKOS
•Simple KnowledgeOrganisation System
–recommandation W3C du 18 août 2009
–représentation dans un contexte multilingue de tout vocabulaire contrôlé (thésaurus, classifications, taxonomies, etc)
Voir :
–http://www.w3.org/TR/skos-reference/#semantic-relations
–http://www.w3.org/2009/08/skos-reference/skos.html
175. RDF -Une langue, des ontologies – FOAF
•Friend of aFriend
–recommandationW3C du 9 août2010
–description des personnes et des relations entre elles
–http://xmlns.com/foaf/spec/20100809.html
•Tutoriel
•tester FOAF
181. En d‟autres termes : comment porter les données des bibliothèques sur le web de données ?
Source: Emmanuelle Bermès–
http://www.slideshare.net/Figoblog/les-catalogues-sur-le-web
183. Des réponses convergentes
Réalisations
Rameau en SKOS(TEL Plus Project)
VIAF: Virtual International AuthorityFile (OCLC)
•IdREF: autorités Sudocen RDF (ABES)
•Projet Open Library http://openlibrary.org/about/lib
Vocabulaires RDF
•MADS/RDF
Dublin Coreen RDF
FRBR/ FRSAD en RDF
RDAen RDF
ISBD en RDF
184. Vers la convergence des autorités
•LCSH -
•http://id.loc.gov/authorities/subjects/sh85024567.rdf
•http://lccn.loc.gov/n98036669
•IdRef–autorités Sudoc
•http://www.idref.fr/autorites/autorites.html
•http://www.idref.fr/027100669
•Data.bnf –
•http://data.bnf.fr/semanticweb
•http://data.bnf.fr/11921997/arthur_rimbaud/#rdt72-11921997
•http://data.bnf.fr/11928016/jules_verne/rdf.xml,
•VIAF
•http://viaf.org/viaf/7396281/
•http://viaf.org/viaf/7396281/rdf.xml
185. Avant…
L'agriculture de la France. Isabelle Albouy-Delponte, Milan, 1997
•Sujets (Rameau/BNF) : Agriculture –France
•Concepts (Thésaurus Motbis) : production agricole / agriculteur exploitant / politique agricole européenne / France
•Classe (Dewey) : 630.944 022= Agronomie, agriculture et techniques connexes
La guillotine carcérale : silence, on meurt. JacquaL., Paris : Nautilus, 2003
•Sujet (Rameau/BNF) :Prisons --France --1990-.... --Récits personnels ; Crimes et criminels --France --1990-.... --Biographies
•Concepts (Thésaurus BDSP) : Prisonnier, Prison, Accès soins, Solitude, Discrimination, Violence, Témoignage, France, Sida
•Concepts (Thésaurus Enap) : Témoignage, Biographies, Détenu, Vie en détention, Condition de détention, Délinquant
•Classe (Dewey) : 365.440 92 = Établissements pénitentiaires et établissements connexes pour les hommes adultes -Étude relative à une personne
source
186. Après … Source : Information numériques : définitions et enjeux, Xavier Poupeau-voir
199. •traduction en RDF des normes, formats …
•http://metadataregistry.org/ Boite à Outils RDF
200. Boite à Outils RDF
•INDICE = pour voir le monde en RDF
–http://inspector.sindice.com/
•Pour voir le monde en URI :
•Les concepts -SKOS - http://www.w3.org/2004/02/skos/
•Les langues -Lexvo- http://www.lexvo.org/index.html
•Les lieux –Geonames: http://sws.geonames.org
•les personnes et collectivités : tester FOAF
202. #Bonus -D’ FRBR en RDA – sur l’air de «en passant par RDF»
•Rendons à César …la palme des meilleures présentations sur ces questions épineuses -
–http://www.abes.fr/Media/Fichiers/Article-WEB/Journees-ABES/2010pps/LePape_FranceRDA02
–http://www.slideshare.net/ADBS/rda-le-nouveau-paradigme-du-catalogage-1-frbr-cest-quoi-dj
203. la suite ??? c’est maintenant !!!
Conception : Christine FleuryCadre d’intervention : formation proposée par l’ADBS (Domaine / zoom métiers/ Bibliothèques ) Thème : «Mutation des formats bibliographiques» -29-30 Mai 2012 Cette présentation est placée sous licence CreativeCommons