11. Métadonnées = ? Information structurée et réutilisable sur (…) Exemples Une page de titre papier est structurée, mais n’est pas réutilisable Une notice MARC = un ensemble de métadonnées 5
26. Les métadonnées de thèse,c’est… toute information structurée … … qui concerne de près ou de loin la thèse peu importe la structure peu importe le format peut importe le type d’entité dont on parle : Document Personne Organisme Concept 16
27. Thèse = ? En apparence, c’est un objet précis En fait, différentes entités derrière le mot « Thèse » Et chacune a ses propres métadonnées 17
36. Il n’existe pas un format canonique pour les métadonnées de thèse Il n’existe pas un état de complétude (géométrie variable, selon contexte) Il n’existe pas qu’un circuit linéaire (workflow à la carte) Mais il existe des conditions favorables à la circulation et au recyclage des métadonnées 26
37. Conditions favorables Information la plus découpée possible nom et prénom séparés Information la plus homogène possible Peu importe la structure des dates, mais ne pas varier Information la plus précise possible Pas de majuscules non ACCENTUEES ! Utiliser des listes fermées (diplômes, disciplines..) Garder le maximum de précision et de richesse au fil des conversions Avoir des outils qui permettent de maîtriser les flux entrants et sortants Disposer de compétences XSLT 27
38. TEF Une forme parmi d’autres pour les métadonnées de thèse 28
39. TEF Format XML Pour les thèses numériques natives Recommandation AFNOR (2006) ? <chut>Obligation ABES</chut> TEF, fait sur mesure pour STAR Pour répondre aux missions de STAR Format d’import de STAR 29
40. Missions de STAR > Aspects de TEF Signalement Sudoc TEF : méta biblio, autorités… Archivage pérenne TEF : gestion d’éditions différentes, avec métadonnées de fichiers associées Respect du droit de la PI et des restrictions de diffusion TEF : gestion fine des droits Respect de la validation Jury TEF : différentes versions possibles 30
42. TEF et les FRBR FRBR : modélisation de l’information bibliographique par l’iFLA (1998) Clarification conceptuelle A chaque niveau ses métadonnées Œuvre Expression (= Version selon TEF) Manifestation (= Edition selon TEF) Exemplaire (Pas dans TEF) 32
50. http://www.theses.fr/2009TOUR3802/id Identifiant de la thèse comme œuvre Aujourd’hui pur identifiant pour le RDF Demain, identifiant et URL Même si l’œuvre n’est pas un document accessible surle Web. Seules ses éditions (manifestations) y sont. 40
51. Avec le portail des thèses (2011) : http://www.theses.fr/2009TOUR3802.rdf http://www.theses.fr/2009TOUR3802.xml http://www.theses.fr/2009TOUR3802/dc.xml http://www.theses.fr/2009TOUR3802/marc.xml … 41
54. IdRef Nouvelle application ABES (octobre 2010) Objectifs : Interroger, modifier, créer les autorités Sudoc À partir du site Web www.idref.fr A partir d’une autre application « branchée » sur IdRef STAR (oct. 2010), Calames (aujourd’hui !), ORI-OAI (2011) et d’autres applications de l’ens. sup. & rech. fr. 44
56. Politique des URL http://www.idref.fr/026690276 URL des métadonnées de la personne (HTML ou RDF) http://www.idref.fr/026690276/id URL de la personne Redirige (303) vers les métadonnées http://www.idref.fr/026690276.rdf URL des métadonnées RDF de la personne http://www.idref.fr/026690276.html URL des métadonnées HTML de la personne http://www.idref.fr/026690276.xml URL des métadonnées UNIMARC/XML de la personne 46
57. Prière Faîtes le maximum de liens vers des référentiels et leurs identifiants ! Membres du jury Entreprises Entreprises Projets ANR Le Web vous le rendra… 47
59. RDF Standard W3C Existe depuis 1998, mais décolle aujourd’hui Resource Description Framework Cadre général pour décrire n’importe quoi Toutpeut être « resource » à décrire RDF, modèle universel pour intégrer toute information au Web de données 49
63. Comment publier ses métadonnées en RDF ? Mettre du RDF dans ses pages HTML RDFa (RDF dans les attributs HTML) Calames Thèses de STAR : www.theses.fr/{Numéro_national_de_Thèse} Publier un document RDF à part RDF en XML (ou autre format) Autorités Sudoc dans IdRef 53
71. Nos métadonnées et les moteurs Google Richsnippets RDFa à la Google pour Google Pas possible de parler de thèses, de documents Mais on peut parler de personnes, d’entreprises, de produits… Sindice Moteur spécialisé dans les données sémantiques Les moteurs explorent, moissonnent De plus en plus vont agréger et faire raisonner nos métadonnées Seulement le début… 55
72. Diffuser les métadonnées sur le Web de données, c’est … Valoriser les thèses Valoriser les personnes et les organismes liées aux thèses Enrichir nos propres métadonnées Enrichir les métadonnées des autres Découvrir de nouveaux usages et utilisateurs de nos données Publier à la cantonade ≠ échanger entre partenaires 56
74. Les métadonnées dans la thèse La thèse contient des informations structurées Page de titre Table des matières Autres tables Plan de la thèse Bibliographie Ces métadonnées ne sont pas explicites pas caractérisées de manière sémantique 58
75. Les métadonnées dans la thèse La thèse contient des informations précises mais non structurées de manière sémantique : = la prose scientifique RDFa montre la possibilité de truffer la prose de métadonnées Au moins, structurer le résumé en RDF ? 59
77. Quels outils pour une écriture sémantique ? Styles Word ? Mais pour baliser le sens, pas la forme ! Plugin Bureautique ? Ex : Word Add-in For Ontology Recognition Ex: Extension sémantique pour Open Office Editeur HTML 5 ? Microdata Rival de RDFa 61