SlideShare ist ein Scribd-Unternehmen logo
1 von 33
Downloaden Sie, um offline zu lesen
De la caractérisation des
   données à leur transformation


                    Ecole Technique du pôle Technologies

                                    14-15-16 mars à Poitiers




Diane Le Hénaff, Ingénieur Systèmes d’information Documentaires (DV-IST)
De la caractérisation des
données à leur transformation

1ère partie

1- Objet, information, donnée, …
2- Caractériser
3- Exemple
4- Transformer
1- Objet, information, donnée
Qu’est ce qu’une donnée ?


“The term data refers to qualitative or quantitative attributes of a
variable or set of variables. Data are typically the results of
measurements and can be the basis of graphs, images, or observations
of a set of variables”


Source : http://en.wikipedia.org/wiki/Data


 • Une donnée est un attribut, une propriété d’un objet
 • Une donnée est une unité d’information
1- Un objet
1- Un ensemble d'information
2- Caractériser
Caractériser un objet, c’est décrire
l’objet avec des propriétés, des
attributs, des caractéristiques qui
forment alors un ensemble de
données.

Caractériser une donnée est impropre
sauf si l’on vise à décrire encore plus
finement une unité d’information.
2- Caractériser un objet
               Les polyamines sont des composés organiques
               possédant au moins deux fonctions amine
               Une amine est un composé organique dérivé de
               l'ammoniac dont certains hydrogènes ont été
               remplacés par un groupement carboné



 Un polyamine se caractérise par :
 • une suite de copolymères (-CH2-CHOH-CH2-N+(CH3)2-
 ) de dimethylamine et d’epichlorohydrin
 • présence d’ammoniac
 •…
2-Caractériser une information

           Une bibliothèque est un lieu (-thèque)
           qui regroupe des livres (biblio-)




                Ce livre se caractérise par :
                • un éditeur : Gallimard
                • un auteur : Lane Smith
                • un titre : « C’est un livre »
                • un nombre de pages
                • une langue d’écriture
                •…
2- Prendre en compte le
 contexte et l’objectif
         Cet objet se caractérise par :
         • un assemblage de légo
         • des couleurs noir, bleu, gris
         • une belle harmonie avec les couleurs de
         la chambre de mon fils…


         Ce livre se caractérise par :
         • une très bonne critique
         • son classement en livre jeunesse
         • son sujet original sur les mérites du
         livre imprimé
2-Caractériser : pour quoi,
   pour qui, comment ?

            •Retrouver l’information

Pour quoi   •Définir l’information
            •Récupérer l’information




Pour qui    •L’utilisateur humain
            •La machine




            •En stockant les propriétés-données (avec ou sans
Comment      l’objet)
            •En les publiant sous différents formats et média
3- Exemple


             Objectif :
             je voudrais
             que mon
             article soit
             lu par mes
             pairs
3- Exemple
Je le publie




Je le stocke
3- Exemple
Je le décris ------   manuellement
3- Exemple
Il est décrit ------   informatiquement

                        On parle du format de
                        données de
                        l’application (ici
                        ProdInra).
                        Il est issu d’une
                        modélisation
                        intellectuelle puis
                        informatique (en UML)
3- Exemple




                Application
                   BDD




De l’alimentation à la restitution des données
4- Transformer
Tout est transformation de données



BDD XML
4- Transformer
  Tout est transformation de données



SGBD relationnel
1ère partie       Conclusion 1/4

Caractériser un objet, un document
               doit se faire
dans un contexte (implicite)
pour un objectif (implicite)
1ère partie     Conclusion 2/4
Concevoir un système d'information
documentaire, c'est expliciter
                 • le contexte,
                 • l'objectif
et modéliser (décrire) les objets,
les informations, les documents.
1ère partie      Conclusion 3/4

La transformation des données est
partout,
mais elle est cachée à l'utilisateur
1ère partie      Conclusion 4/4
Chaque transformation a un coût
humain et financier.
L’avenir est dans les systèmes économes
(ie : optimisation/réduction du nbre de
transformations pour un objectif donné)
De la caractérisation des
données à leur transformation

2ème partie

1.   Du document à l'encodage
2.   Concevoir une application
     documentaire
3.   L'exposition des données en OAI
4.   La réutilisation des données
1- Du document à l’encodage
               Je caractérise :
               Type : Article -> Editorial
               Titre : des bibliothèques aux
               archives ouvertes
               Auteur : Jean-Michel Rauzier
               Revue : Documentaliste – SI
               Corps du texte :
               Voici, comme chaque année à pareille époque, un numéro
               dans lequel les bibliothèques occupent une place plus
               visible que d’ordinaire – parce qu’il paraît après le
               congrès de l’IFLA que précéda de peu celui de l’ABF. Les
               bibliothèques, moteurs de la diffusion des connaissances et
               de la construction de la société de l’information : c’est
               vers l’avenir que l’IFLA avait clairement tourné sa soixante-
               douzième conférence, moins que jamais repliée sur la
               bibliothéconomie d’antan et s’affirmant désormais
               résolument comme « le congrès mondial des bibliothèques
               et de l’information ». La bibliothèque demain… : loin de
               s’appesantir avec narcissisme sur un siècle d’existence,
               l’Association des bibliothécaires français consacrait le
               congrès de son centenaire à scruter le futur des
               bibliothèques et du métier dans la société de l’information.
1- Du document à l’encodage
Je caractérise :                                          J’encode :
Type : Article -> Editorial                               (le choix du schéma est important –
Titre : des bibliothèques aux                             voici ce qu’il ne faut pas faire)
archives ouvertes                                         </type production=« Article »

Auteur : Jean-Michel Rauzier                              genre=« Editorial »>
                                                          <description>
Revue : Documentaliste – SI
                                                          <titre langue=« FRA » role="original">
Corps du texte :
Voici, comme chaque année à pareille époque, un           Des bibliothèques aux archives ouvertes
numéro dans lequel les bibliothèques occupent une
place plus visible que d’ordinaire – parce qu’il paraît   </titre>
après le
congrès de l’IFLA que précéda de peu celui de l’ABF.
Les bibliothèques, moteurs de la diffusion des
                                                          <auteur>
connaissances et de la construction de la société de
l’information : c’est                                     <prenom>Jean-Michel</prenom>
vers l’avenir que l’IFLA avait clairement tourné sa
soixante-douzième conférence, moins que jamais
repliée sur la bibliothéconomie d’antan et
                                                          <nom>Rauzier</nom>
s’affirmant désormais résolument comme « le
congrès mondial des bibliothèques et de                   </auteur>
l’information ». La bibliothèque demain…
                                                          …
2- Concevoir une application
          documentaire

Quel type de     • Relationnelle
                 • Native XML
  BDD ?          • Objet, graphe, no-sql…



   Quelle        •MCD
modélisation ?   •UML



                 •Spécifique
Quel format ?    •Standard (MODS…)
2- Un exemple de diagramme de classe
3- L’exposition des données en OAI
                   Métadonnées au format
                   de l’archive ouverte      Transformation      Record
                                                                 (Métadata)
                                                                 Format demenadé
                                        I
                                        n
 Méta données


                                        t
                            Set n°1     e
                                                 Record
                                                 (Métadata)
                                        r        format OA
 Fichiers
 texte intégral
                                        p
                                        r
                      Set n°2           é
                                        t
                                Set     e   Requête OAI (http)
                                n°3     u
 Archive ouverte                        r   • Le verbe (ici GetRecord)
                         Entrepôt OAI
                                            • Le set de données (optionnel)
                                            • Le format de données (obligatoire)
4- La réutilisation des données
Exemple avec les projets IraLis, Exit, E-LIS portés
par CIEPI, the International Centre of Research for
Information Strategy and Development




               Je m’enregistre
                 dans IraLis
4- La réutilisation des données
         Ma signature telle qu’encodée en RDF dans IraLIS

<rdf:RDF>
<foaf:Person rdf:about="FRLIS2192">
<foaf:familyName>Le Hénaff</foaf:familyName>
<foaf:firstName>Diane</foaf:firstName>
<foaf:mbox rdf:resource="mailto:diane.lehenaff@gmail.com"/>
<iralis:anep_classification>LIS</iralis:anep_classification>
<iralis:jcr_classification>INFORMATION SCIENCE </iralis:jcr_classification>
<skos:Collection/>
<skos:prefLabel>Diane Le-Hénaff</skos:prefLabel>
<foaf:mbox rdf:resource="mailto:"/>
</foaf:Person>
</rdf:RDF>
4- La réutilisation des données


Je m’enregistre
dans EXIT en
signalant mon
IraLIS




Mes publications
déposées dans ELIS
sont mentionnées
2ème partie   Conclusion 1/2


On ne caractérise pas des données
mais un objet, un document, une
information…
2ème partie    Conclusion 2/2


On ne transforme pas des données
mais l’encodage de l’objet (format
de données)
Conclusion générale

Le titre de cette présentation est
 incorrect (CQFD)


Vous devriez maintenant savoir
 pourquoi !

Weitere ähnliche Inhalte

Was ist angesagt?

Les portails documentaires juridiques français
Les portails documentaires juridiques françaisLes portails documentaires juridiques français
Les portails documentaires juridiques français
Stéphane Dufournet
 
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013
Luc Bellier
 
Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011
Sylvain Machefert
 
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part1_2013
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part1_2013Le document numérique - cours IUT Métiers du livre de Saint Cloud - part1_2013
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part1_2013
Luc Bellier
 
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Bibliotheque Université de Provence
 

Was ist angesagt? (19)

Les portails documentaires juridiques français
Les portails documentaires juridiques françaisLes portails documentaires juridiques français
Les portails documentaires juridiques français
 
Les catalogues sur le Web
Les catalogues sur le WebLes catalogues sur le Web
Les catalogues sur le Web
 
Abes Adbs2411
Abes Adbs2411Abes Adbs2411
Abes Adbs2411
 
Nouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèquesNouveaux catalogues de bibliothèques
Nouveaux catalogues de bibliothèques
 
2011 06-23 bi-b92_formats-de-donnees_fl-pl-b
2011 06-23 bi-b92_formats-de-donnees_fl-pl-b2011 06-23 bi-b92_formats-de-donnees_fl-pl-b
2011 06-23 bi-b92_formats-de-donnees_fl-pl-b
 
Semantic web introduction
Semantic web introductionSemantic web introduction
Semantic web introduction
 
EBD 2013 le document, document numérique
EBD 2013 le document, document numériqueEBD 2013 le document, document numérique
EBD 2013 le document, document numérique
 
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part2_2013
 
Informatique documentaire - Cours Licence pro bib 2013
Informatique documentaire - Cours Licence pro bib 2013Informatique documentaire - Cours Licence pro bib 2013
Informatique documentaire - Cours Licence pro bib 2013
 
Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011Introduction à l'informatique documentaire - 2011
Introduction à l'informatique documentaire - 2011
 
Introduction à l'informatique documentaire
Introduction à l'informatique documentaireIntroduction à l'informatique documentaire
Introduction à l'informatique documentaire
 
2013 bibnum ebd
2013 bibnum ebd2013 bibnum ebd
2013 bibnum ebd
 
Sensibilisation à la veille documentaire (Doctorants SHS, juin 2021)
Sensibilisation à la veille documentaire  (Doctorants SHS, juin 2021)Sensibilisation à la veille documentaire  (Doctorants SHS, juin 2021)
Sensibilisation à la veille documentaire (Doctorants SHS, juin 2021)
 
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part1_2013
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part1_2013Le document numérique - cours IUT Métiers du livre de Saint Cloud - part1_2013
Le document numérique - cours IUT Métiers du livre de Saint Cloud - part1_2013
 
Modèles de données et langages de description ouverts 2021-2022 - 1
Modèles de données et langages de description ouverts   2021-2022 - 1Modèles de données et langages de description ouverts   2021-2022 - 1
Modèles de données et langages de description ouverts 2021-2022 - 1
 
Formation Zotero avancée pour doctorants - Isidoct mars 2020 ENS Lyon
Formation Zotero avancée pour doctorants - Isidoct mars 2020 ENS LyonFormation Zotero avancée pour doctorants - Isidoct mars 2020 ENS Lyon
Formation Zotero avancée pour doctorants - Isidoct mars 2020 ENS Lyon
 
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
Méthodologie de la recherche documentaire en psychanalyse master 2 2012 2013
 
Modèles de données et langages de description ouverts 5 - 2021-2022
Modèles de données et langages de description ouverts   5 - 2021-2022Modèles de données et langages de description ouverts   5 - 2021-2022
Modèles de données et langages de description ouverts 5 - 2021-2022
 
Méthodologie de la recherche documentaire M1 Langues romanes
Méthodologie de la recherche documentaire M1 Langues romanesMéthodologie de la recherche documentaire M1 Langues romanes
Méthodologie de la recherche documentaire M1 Langues romanes
 

Andere mochten auch

Sistema nervioso
Sistema nerviosoSistema nervioso
Sistema nervioso
pedrotvdu
 
Cuarta unidad de computacion y redes
Cuarta unidad de computacion y redesCuarta unidad de computacion y redes
Cuarta unidad de computacion y redes
lokotelokote
 
Ejerciccios 60 69
Ejerciccios 60   69Ejerciccios 60   69
Ejerciccios 60 69
NORMA
 
Ignite Maroc 2ème Edition - Martine Zussy
Ignite Maroc 2ème Edition - Martine ZussyIgnite Maroc 2ème Edition - Martine Zussy
Ignite Maroc 2ème Edition - Martine Zussy
Salah Benzakour
 
070116 ra80 inteligencias multiples rotaract
070116 ra80 inteligencias multiples rotaract070116 ra80 inteligencias multiples rotaract
070116 ra80 inteligencias multiples rotaract
nasdia
 
perfil profesional
perfil profesionalperfil profesional
perfil profesional
nataly
 

Andere mochten auch (20)

Resolución de Aprovación
Resolución de AprovaciónResolución de Aprovación
Resolución de Aprovación
 
Sistema nervioso
Sistema nerviosoSistema nervioso
Sistema nervioso
 
Michelo.ntic
Michelo.nticMichelo.ntic
Michelo.ntic
 
Cuarta unidad de computacion y redes
Cuarta unidad de computacion y redesCuarta unidad de computacion y redes
Cuarta unidad de computacion y redes
 
Trabajo cono.odg
Trabajo cono.odgTrabajo cono.odg
Trabajo cono.odg
 
Ejerciccios 60 69
Ejerciccios 60   69Ejerciccios 60   69
Ejerciccios 60 69
 
Ignite Maroc 2ème Edition - Martine Zussy
Ignite Maroc 2ème Edition - Martine ZussyIgnite Maroc 2ème Edition - Martine Zussy
Ignite Maroc 2ème Edition - Martine Zussy
 
Contrôle de gestion et services publics : optimiser la ressource financière p...
Contrôle de gestion et services publics : optimiser la ressource financière p...Contrôle de gestion et services publics : optimiser la ressource financière p...
Contrôle de gestion et services publics : optimiser la ressource financière p...
 
070116 ra80 inteligencias multiples rotaract
070116 ra80 inteligencias multiples rotaract070116 ra80 inteligencias multiples rotaract
070116 ra80 inteligencias multiples rotaract
 
Mariela ladera nieto
Mariela ladera nietoMariela ladera nieto
Mariela ladera nieto
 
perfil profesional
perfil profesionalperfil profesional
perfil profesional
 
Historia de la comunicación
Historia de la comunicaciónHistoria de la comunicación
Historia de la comunicación
 
Resumenes
ResumenesResumenes
Resumenes
 
Presentación1
Presentación1Presentación1
Presentación1
 
Webinar
WebinarWebinar
Webinar
 
ri 38 cartas
ri 38 cartasri 38 cartas
ri 38 cartas
 
Management
ManagementManagement
Management
 
TV bloc
TV blocTV bloc
TV bloc
 
ñ
ññ
ñ
 
Revista 2010
Revista 2010Revista 2010
Revista 2010
 

Ähnlich wie De la caractérisation des données à leur transformation

Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01
Parc De Camargue
 
Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02
ABES
 
Les concepts fondamentaux de DITA
Les concepts fondamentaux de DITALes concepts fondamentaux de DITA
Les concepts fondamentaux de DITA
Peccatte
 

Ähnlich wie De la caractérisation des données à leur transformation (20)

CRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDACRFCB AMU_evolutions-catalogage_091213_RDA
CRFCB AMU_evolutions-catalogage_091213_RDA
 
Ppt msh def.
Ppt msh def.Ppt msh def.
Ppt msh def.
 
Crfcb amu evolutions_catalogage_091213_enjeux_2
Crfcb amu evolutions_catalogage_091213_enjeux_2Crfcb amu evolutions_catalogage_091213_enjeux_2
Crfcb amu evolutions_catalogage_091213_enjeux_2
 
Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01Isaac referentiels-ist12-121002051942-phpapp01
Isaac referentiels-ist12-121002051942-phpapp01
 
Travailler avec des archives audiovisuels numériques. Deuxième partie : Digit...
Travailler avec des archives audiovisuels numériques. Deuxième partie : Digit...Travailler avec des archives audiovisuels numériques. Deuxième partie : Digit...
Travailler avec des archives audiovisuels numériques. Deuxième partie : Digit...
 
Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02Adbs2012presentation 120527125034-phpapp02
Adbs2012presentation 120527125034-phpapp02
 
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physiqueVisite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
Visite guidée au pays de la donnée - Du modèle conceptuel au modèle physique
 
Interopérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archivesInteropérabilité et échanges de données pour les archives
Interopérabilité et échanges de données pour les archives
 
Les éléments d'indexation dans la DTD-EAD
Les éléments d'indexation dans la DTD-EADLes éléments d'indexation dans la DTD-EAD
Les éléments d'indexation dans la DTD-EAD
 
CRFCB AMU evolutions-catalogage_091213 _ FRBR
CRFCB AMU evolutions-catalogage_091213 _ FRBRCRFCB AMU evolutions-catalogage_091213 _ FRBR
CRFCB AMU evolutions-catalogage_091213 _ FRBR
 
Les concepts fondamentaux de DITA
Les concepts fondamentaux de DITALes concepts fondamentaux de DITA
Les concepts fondamentaux de DITA
 
L'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de BiblissimaL'utilisation d’ontologies dans le cadre de Biblissima
L'utilisation d’ontologies dans le cadre de Biblissima
 
Administrer une base de données d'inventaire : le cas concret de l'Ecole nati...
Administrer une base de données d'inventaire : le cas concret de l'Ecole nati...Administrer une base de données d'inventaire : le cas concret de l'Ecole nati...
Administrer une base de données d'inventaire : le cas concret de l'Ecole nati...
 
#AAFSaintÉ19 : Transmettre la connaissance sur le (très) long terme: des manu...
#AAFSaintÉ19 : Transmettre la connaissance sur le (très) long terme: des manu...#AAFSaintÉ19 : Transmettre la connaissance sur le (très) long terme: des manu...
#AAFSaintÉ19 : Transmettre la connaissance sur le (très) long terme: des manu...
 
Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...
Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...
Représentation et accès: continuités et transformations. Chapitre 4. Métadonn...
 
Meta archivesetatdel art
Meta archivesetatdel artMeta archivesetatdel art
Meta archivesetatdel art
 
N. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHS
N. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHSN. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHS
N. Dufournaud : XML TEI un outil méthodologique pour la recherche en SHS
 
Introduction aux bases de données
Introduction aux bases de donnéesIntroduction aux bases de données
Introduction aux bases de données
 
Richard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSH
Richard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSHRichard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSH
Richard Walter (IRHT), "Chercheurs vos papiers", 26 novembre 2009, MMSH
 
Pres archimaine-20120925
Pres archimaine-20120925Pres archimaine-20120925
Pres archimaine-20120925
 

De la caractérisation des données à leur transformation

  • 1. De la caractérisation des données à leur transformation Ecole Technique du pôle Technologies 14-15-16 mars à Poitiers Diane Le Hénaff, Ingénieur Systèmes d’information Documentaires (DV-IST)
  • 2. De la caractérisation des données à leur transformation 1ère partie 1- Objet, information, donnée, … 2- Caractériser 3- Exemple 4- Transformer
  • 3. 1- Objet, information, donnée Qu’est ce qu’une donnée ? “The term data refers to qualitative or quantitative attributes of a variable or set of variables. Data are typically the results of measurements and can be the basis of graphs, images, or observations of a set of variables” Source : http://en.wikipedia.org/wiki/Data • Une donnée est un attribut, une propriété d’un objet • Une donnée est une unité d’information
  • 5. 1- Un ensemble d'information
  • 6. 2- Caractériser Caractériser un objet, c’est décrire l’objet avec des propriétés, des attributs, des caractéristiques qui forment alors un ensemble de données. Caractériser une donnée est impropre sauf si l’on vise à décrire encore plus finement une unité d’information.
  • 7. 2- Caractériser un objet Les polyamines sont des composés organiques possédant au moins deux fonctions amine Une amine est un composé organique dérivé de l'ammoniac dont certains hydrogènes ont été remplacés par un groupement carboné Un polyamine se caractérise par : • une suite de copolymères (-CH2-CHOH-CH2-N+(CH3)2- ) de dimethylamine et d’epichlorohydrin • présence d’ammoniac •…
  • 8. 2-Caractériser une information Une bibliothèque est un lieu (-thèque) qui regroupe des livres (biblio-) Ce livre se caractérise par : • un éditeur : Gallimard • un auteur : Lane Smith • un titre : « C’est un livre » • un nombre de pages • une langue d’écriture •…
  • 9. 2- Prendre en compte le contexte et l’objectif Cet objet se caractérise par : • un assemblage de légo • des couleurs noir, bleu, gris • une belle harmonie avec les couleurs de la chambre de mon fils… Ce livre se caractérise par : • une très bonne critique • son classement en livre jeunesse • son sujet original sur les mérites du livre imprimé
  • 10. 2-Caractériser : pour quoi, pour qui, comment ? •Retrouver l’information Pour quoi •Définir l’information •Récupérer l’information Pour qui •L’utilisateur humain •La machine •En stockant les propriétés-données (avec ou sans Comment l’objet) •En les publiant sous différents formats et média
  • 11. 3- Exemple Objectif : je voudrais que mon article soit lu par mes pairs
  • 12. 3- Exemple Je le publie Je le stocke
  • 13. 3- Exemple Je le décris ------ manuellement
  • 14. 3- Exemple Il est décrit ------ informatiquement On parle du format de données de l’application (ici ProdInra). Il est issu d’une modélisation intellectuelle puis informatique (en UML)
  • 15. 3- Exemple Application BDD De l’alimentation à la restitution des données
  • 16. 4- Transformer Tout est transformation de données BDD XML
  • 17. 4- Transformer Tout est transformation de données SGBD relationnel
  • 18. 1ère partie Conclusion 1/4 Caractériser un objet, un document doit se faire dans un contexte (implicite) pour un objectif (implicite)
  • 19. 1ère partie Conclusion 2/4 Concevoir un système d'information documentaire, c'est expliciter • le contexte, • l'objectif et modéliser (décrire) les objets, les informations, les documents.
  • 20. 1ère partie Conclusion 3/4 La transformation des données est partout, mais elle est cachée à l'utilisateur
  • 21. 1ère partie Conclusion 4/4 Chaque transformation a un coût humain et financier. L’avenir est dans les systèmes économes (ie : optimisation/réduction du nbre de transformations pour un objectif donné)
  • 22. De la caractérisation des données à leur transformation 2ème partie 1. Du document à l'encodage 2. Concevoir une application documentaire 3. L'exposition des données en OAI 4. La réutilisation des données
  • 23. 1- Du document à l’encodage Je caractérise : Type : Article -> Editorial Titre : des bibliothèques aux archives ouvertes Auteur : Jean-Michel Rauzier Revue : Documentaliste – SI Corps du texte : Voici, comme chaque année à pareille époque, un numéro dans lequel les bibliothèques occupent une place plus visible que d’ordinaire – parce qu’il paraît après le congrès de l’IFLA que précéda de peu celui de l’ABF. Les bibliothèques, moteurs de la diffusion des connaissances et de la construction de la société de l’information : c’est vers l’avenir que l’IFLA avait clairement tourné sa soixante- douzième conférence, moins que jamais repliée sur la bibliothéconomie d’antan et s’affirmant désormais résolument comme « le congrès mondial des bibliothèques et de l’information ». La bibliothèque demain… : loin de s’appesantir avec narcissisme sur un siècle d’existence, l’Association des bibliothécaires français consacrait le congrès de son centenaire à scruter le futur des bibliothèques et du métier dans la société de l’information.
  • 24. 1- Du document à l’encodage Je caractérise : J’encode : Type : Article -> Editorial (le choix du schéma est important – Titre : des bibliothèques aux voici ce qu’il ne faut pas faire) archives ouvertes </type production=« Article » Auteur : Jean-Michel Rauzier genre=« Editorial »> <description> Revue : Documentaliste – SI <titre langue=« FRA » role="original"> Corps du texte : Voici, comme chaque année à pareille époque, un Des bibliothèques aux archives ouvertes numéro dans lequel les bibliothèques occupent une place plus visible que d’ordinaire – parce qu’il paraît </titre> après le congrès de l’IFLA que précéda de peu celui de l’ABF. Les bibliothèques, moteurs de la diffusion des <auteur> connaissances et de la construction de la société de l’information : c’est <prenom>Jean-Michel</prenom> vers l’avenir que l’IFLA avait clairement tourné sa soixante-douzième conférence, moins que jamais repliée sur la bibliothéconomie d’antan et <nom>Rauzier</nom> s’affirmant désormais résolument comme « le congrès mondial des bibliothèques et de </auteur> l’information ». La bibliothèque demain… …
  • 25. 2- Concevoir une application documentaire Quel type de • Relationnelle • Native XML BDD ? • Objet, graphe, no-sql… Quelle •MCD modélisation ? •UML •Spécifique Quel format ? •Standard (MODS…)
  • 26. 2- Un exemple de diagramme de classe
  • 27. 3- L’exposition des données en OAI Métadonnées au format de l’archive ouverte Transformation Record (Métadata) Format demenadé I n Méta données t Set n°1 e Record (Métadata) r format OA Fichiers texte intégral p r Set n°2 é t Set e Requête OAI (http) n°3 u Archive ouverte r • Le verbe (ici GetRecord) Entrepôt OAI • Le set de données (optionnel) • Le format de données (obligatoire)
  • 28. 4- La réutilisation des données Exemple avec les projets IraLis, Exit, E-LIS portés par CIEPI, the International Centre of Research for Information Strategy and Development Je m’enregistre dans IraLis
  • 29. 4- La réutilisation des données Ma signature telle qu’encodée en RDF dans IraLIS <rdf:RDF> <foaf:Person rdf:about="FRLIS2192"> <foaf:familyName>Le Hénaff</foaf:familyName> <foaf:firstName>Diane</foaf:firstName> <foaf:mbox rdf:resource="mailto:diane.lehenaff@gmail.com"/> <iralis:anep_classification>LIS</iralis:anep_classification> <iralis:jcr_classification>INFORMATION SCIENCE </iralis:jcr_classification> <skos:Collection/> <skos:prefLabel>Diane Le-Hénaff</skos:prefLabel> <foaf:mbox rdf:resource="mailto:"/> </foaf:Person> </rdf:RDF>
  • 30. 4- La réutilisation des données Je m’enregistre dans EXIT en signalant mon IraLIS Mes publications déposées dans ELIS sont mentionnées
  • 31. 2ème partie Conclusion 1/2 On ne caractérise pas des données mais un objet, un document, une information…
  • 32. 2ème partie Conclusion 2/2 On ne transforme pas des données mais l’encodage de l’objet (format de données)
  • 33. Conclusion générale Le titre de cette présentation est incorrect (CQFD) Vous devriez maintenant savoir pourquoi !