SlideShare ist ein Scribd-Unternehmen logo
1 von 24
Downloaden Sie, um offline zu lesen
Du document à la donnée
       et retour
     La fourmilière ou les Lumières

   Jean-Michel Salaün
     Séminaire INRIA – IST
  « Le document numérique à
 l'heure du web de données »
      30 septembre 2012

                                      © Nicolas Taffin
Epistemic infrastructure
                                                                                              © Nicolas Taffin

 L’infrastructure épistémique de l’économie de la
  connaissance repose sur les bibliothèques, les archives,
  les musées, les galeries, les zoos, les aquariums et
  d’autres collections systématiques encore qui permettent
  aux individus de savoir ce qu’ils savent et de faire ce
  qu’ils font. Le rassemblement, la conservation,
  l’organisation, la représentation et la diffusion des
  documents d’archives, des plantes et des animaux, des
  objets rares ou communs, des œuvres d’art, etc. est au
  cœur de la production de connaissances, de
  l’enseignement, de la prise de décision et du commerce.
              Margaret Hedstrom et John Leslie King, « Epistemic infrastructure in the rise of the
              knowledge economy », in Brian Kahin et Dominique Foray, Advancing Knowledge and
              the Knowledge Economy, MIT Press, Cambridge (Mass.), USA, 2006, p. 113-134.




                             INRIA-IST-Carnac-2012                                                   2
JM Salaun
Cyberinfrastructure
                                                                      © Nicolas Taffin

                        L’arrivée de l’internet a transformé les
                        pratiques dans les sciences sociales et
                        humaines (SHS), plus lentement que certains
                        l’avaient espéré mais plus profondément que
                        d’autres auraient attendu. Les ressources du
                        patrimoine culturel numérique forment un
                        ensemble de données essentielles pour les
                        SHS : ces ressources, traitées grâce aux
                        réseaux et aux logiciels, organisent aujourd’hui
                        la façon dont les scientifiques découvrent et
                        donnent du sens aux traces humaines tout en
                        organisant la manière dont leurs résultats sont
                        transmis à leurs étudiants, leurs collègues et
                        au public en général

                              Our Cultural Commonwealth. The report of the
                        American Council of Learned Societies Commission
                        on Cyberinfrastructure for the Humanities and Social
                        Sciences, 2006, 51p.




                INRIA-IST-Carnac-2012                                       3
JM Salaun
Google
                                                                   © Nicolas Taffin

   Il s’agit de cartographier le monde réel d’une
   façon que les ordinateurs puissent comprendre.
   Il s’agit de prendre des objets du monde réel, de
   comprendre ce que sont ces choses et quelles
   sont les choses importantes à leur sujet ainsi
   que leurs relations à d’autres choses. C’est la
   partie que je trouve la plus fascinante : quelle
   est la relation entre toutes ces choses
   différentes ?

            Entretien avec la responsable du Knowledge Graph de Google,
            RWW, 26 juillet 2012.


                         INRIA-IST-Carnac-2012                           4
JM Salaun
La documentarisation
  (à la Bibliothèque du Congrès début 20ème
                     siècle)                  © Nicolas Taffin




       Wikipédia

                      INRIA-IST-Carnac-2012         5
JM Salaun
De la manufacture à l’industrie
                                          © Nicolas Taffin




                  INRIA-IST-Carnac-2012         6
JM Salaun
Les trois dimensions du
                   document
                 (Roger T. Pédauque)              © Nicolas Taffin


1. Anthropologique : Forme Vu
    Document = Support + Inscription

                        Contrat
2. Intellectuelle :Texte Lu
                          de
                        lecture
    Document = Code + représentation


3. Sociale : Médium Su
    Document = Mémoire + transaction
                          INRIA-IST-Carnac-2012         7
JM Salaun
Du document à la donnée
                                                                © Nicolas Taffin

• 19e-20e : Document scientifique = article de revue et livre

                       » Transmettre et prouver

• 21e : Document scientifique =
    – Documents numériques (hyper-) (Web 1 modifie le vu)
            • ArXive, ScienceDirect…
            • Gallica, Europeana, Google-Book…
    – Néodocuments (Web 2 modifie le su)
            •   Blogues
            •   Wikipédia
            •   Réseaux sociaux
            •   Sites dynamiques, etc.
    – Données (Web 3 modifie le lu)

                       » Partager et reconstruire ?

                                    INRIA-IST-Carnac-2012             8
JM Salaun
La documentarisation
                        (vue par P. Otlet)
                                                                                         © Nicolas Taffin




                                                                   Première modernité
                                                                   (première et deuxième
                                                                      révolution industrielle)
            P.Otlet, Traité de documentation,
            1934, p.41                     INRIA-IST-Carnac-2012                               9
JM Salaun
Le Web des données
                 (vue par le W3C)
                                                                © Nicolas Taffin




                                        Seconde modernité ou
                                            modernité tardive
                                        (troisième révolution
                                            industrielle)
       2007 : web des données
       W3C
                           INRIA-IST-Carnac-2012                    10
JM Salaun
L’inversion de la logique
    de documentarisation                                                      © Nicolas Taffin




       On construit le savoir à partir                  On reconstruit le savoir
       de l’observation de la nature              à partir des ressources disponibles
                                INRIA-IST-Carnac-2012                             11
JM Salaun
Le rapport au savoir
              change                                                          © Nicolas Taffin

                  Bienvenue sur Wikipédia
                  Le projet d’encyclopédie libre que vous pouvez améliorer




Les articles de Wikipédia devraient reposer principalement sur des
sources secondaires fiables. Toute utilisation de sources primaires devrait
s'appuyer sur des sources secondaires, et ne pas être une sélection,
analyse, synthèse ou interprétation inédite réalisée par un contributeur de
Wikipédia. Les sources primaires seules sont acceptées si elles
consistent en des assertions factuelles et non sujettes à interprétation ou
polémique. Wkp
                             INRIA-IST-Carnac-2012                                12
JM Salaun
Transparence et
              accélération                                                    © Nicolas Taffin



Le dialogue de sourds entre Ph. Roth et Wikipédia :

•   20 août première correction : j'ai retiré la référence à Anatole Broyard sur
    l'insistance de Philip Roth, je suis son biographe.
•   Une minute après, un éditeur de wkp remet le texte initial : Pouvez-vous le
    vérifier ?.
•   Vingt minutes plus tard, correction renouvelée : Une nouvelle fois, j'ai
    enlevé la référence à Anatole Broyard. C'est tout à fait inexact et donc sans
    objet. Je suis le biographe de Roth et j'ai fait cette correction à sa demande.
•   Six minutes après, un autre éditeur de wkp remet de nouveau le texte initial
    et ajoute de nouveaux détails pour confirmer l'inspiration du roman par le
    personnage d'A. Broyard. Cet éditeur prendra deux heures de son temps
    pour cette rédaction. Comme l'indique le wikipédien qui relate l'histoire : cet
    éditeur a du se prendre pour un vrai détective !
•   7 septembre Ph Roth publie une Lettre ouverte à Wikipédia sur The New
    Yorker, très largement commentée dans la presse et sur le web.
•   18h54 correction réalisée par un membre de la Wikimedia Foundation.
                                INRIA-IST-Carnac-2012                             13
JM Salaun
Wikipédia, au centre
       du web de données                 © Nicolas Taffin




                 INRIA-IST-Carnac-2012       14
JM Salaun
Wikipédia + Google
        = le sens commun                 © Nicolas Taffin




• Carnac

• François Hollande
• Barak Obama
• Marilyn Monroe

• Jean-Michel Salaün
                 INRIA-IST-Carnac-2012       15
JM Salaun
Web de données + traces
   = Knowledge Graph                                                       © Nicolas Taffin

   Avant, Metaweb était un référentiel d'entités et de faits et
   les employés de la société utilisaient beaucoup leur
   intuition pour trouver ce qui importait pour les usagers et
   quelle information chercher. Depuis qu'ils ont été
   rachetés par Google, Google dispose de tous ces
   usagers cherchant de l'information, et de là nous savons
   quelles choses du monde sont importantes (...) Google
   sait que les gens qui cherchent une chose en cherchent
   aussi d'autres. Ainsi on peut trouver des relations
   intéressantes en regardant les sessions agrégées des
   usagers. Une des prochaines étapes est en effet
   d'expliquer ces relations fortuites.
            Entretien avec la responsable du Knowledge Graph de Google, RWW, 26
              juillet 2012.

                             INRIA-IST-Carnac-2012                             16
JM Salaun
Pour une histoire
   des (bases de) données                                       © Nicolas Taffin


• Les cartes perforées au service du
  contrôle
• La classification au service du partage du
  savoir
• Les hobbyistes au service de l’autonomie
• Le « big data » et le retour du contrôle ?

            Driscoll, Kevin. « From Punched Cards to “Big Data”: A
            Social History of Database Populism ».
            communication 1 1, no. 1 (août 29, 2012).

                        INRIA-IST-Carnac-2012                        17
JM Salaun
Le « big data »
            Publication vs transparence
                                                                                                   © Nicolas Taffin

   Ce sont les petites miettes de données que vous laissez derrière
   vous quand vous vous déplacez sur terre.
   Ce que ces miettes racontent, c'est l'histoire de votre vie. Elles
   disent ce que vous avez choisi de faire. C'est très différent de ce
   que vous mettez sur Facebook. Ce que vous mettez sur
   Facebook, c'est ce que vous voudriez dire aux gens, rédigé selon
   les normes d'aujourd'hui. (...)
   Si je peux connaitre certains de vos comportements, je peux
   inférer le reste juste en vous comparant avec la foule de ceux qui
   vous ressemblent. (…)
   Ce qui compte vraiment, c'est comment les gens sont reliés les
   uns aux autres par les machines et comment ils créent un
   marché financier, un gouvernement, une entreprise et d'autres
   structures sociales.
              Alex Pentland in Reinventing Society In The Wake Of Big Data. Edge, août 30, 2012.

                                        INRIA-IST-Carnac-2012                                          18
JM Salaun
Le risque : la fourmilière
                                          © Nicolas Taffin




• Selon Thomas Bern, la transparence
  conduit à un gouvernement « inoffensif »
  où les décisions politiques ne sont plus
  discutées et sont diluées dans le social.

• Selon Harmut Rosa, accélération rime
  avec aliénation.
                 INRIA-IST-Carnac-2012        19
JM Salaun
Analyser
            l’histoire de la statistique
                                                                                       © Nicolas Taffin


   Dans son architecture actuelle, la statistique se présente comme la combinaison de
   deux types d’outillages distincts (…). Le premier est politico-administratif : peu à peu
   se sont mis en place, depuis le 18e siècle, des systèmes d’enregistrement, de
   codage, de tabulation et de publications de « statistiques » au sens de description
   chiffrée de divers aspects du monde social. Le second est cognitif, et implique la
   mise en forme de schèmes scientifiques (moyenne, dispersion, corrélation,
   échantillonnage probabiliste), destinés à résumer, notamment par des outils
   mathématiques une diversité supposée non maîtrisable. (A. Desrosières)

   Dans son architecture actuelle, le web de données se présente comme la
   combinaison de deux types d’outillages distincts. Le premier est politico-
   administratif : peu à peu se sont mis en place, à partir de la fin du 19e siècle
   des systèmes d’enregistrement, de codage, de classification et de publication
   de « bases de données » au sens de description factuelles de divers aspects
   du monde social. Le second est cognitif et implique la constitution de schémas
   logiques destinés à résumer grâce à des algorithmes une diversité supposée
   non maîtrisable.



                                  INRIA-IST-Carnac-2012                                    20
JM Salaun
Analyser
            La théorie du document
                                               © Nicolas Taffin


• Mieux comprendre le passage du
  « transmettre et prouver » au « partager et
  reconstruire ».
• Suivre les stratégies commerciales et non
  commerciales sur le vu, le lu et le su.
• Observer et comprendre le nouveau
  contrat de lecture dans les formes
  ordinaires de consultations documentaires
  numériques.
                       INRIA-IST-Carnac-2012       21
JM Salaun
Réinventer
       un contrat de lecture                                                  © Nicolas Taffin


 La constitution d’un espace rendant possible le débat
 contradictoire sur les options de la cité suppose
 l’existence d’un minimum d’éléments de référence
 communs aux divers acteurs : langage pour mettre en
 forme les choses, pour dire les fins et les moyens de
 l’action, pour en discuter les résultats. Ce langage ne
 préexiste pas au débat : il est négocié, stabilisé, inscrit,
 puis déformé et défait peu à peu, au fil des interactions
 propres à un espace et une période historique données.

 Alain Desrosières, La politique des grands nombres : histoire de la raison
 statistique. Paris : La Découverte, 2000,

                              INRIA-IST-Carnac-2012                               22
JM Salaun
Agir
        Vers de nouvelles Lumières
                                             © Nicolas Taffin




• Participer au mouvement : ouverture et
  agilité.

• Gérer l’hybride sans sectarisme.

• Vers une « architecture de l’information ».

                     INRIA-IST-Carnac-2012       23
JM Salaun
En résumé
                                               © Nicolas Taffin


• Le web des données est une étape
  supplémentaire dans une longue histoire des
  systèmes documentaires.
• L’évolution du web favorise une modification de
  la notion de document vers « partager et
  reconstruire ».
• Transparence et accélération marquent cette
  étape, non sans risque.
• Nous avons une responsabilité à tenir dans
  cette dynamique.

                   INRIA-IST-Carnac-2012            24
JM Salaun

Weitere ähnliche Inhalte

Was ist angesagt?

Présentation Opendata (octobre 2012)
Présentation Opendata (octobre 2012)Présentation Opendata (octobre 2012)
Présentation Opendata (octobre 2012)Adrien VAN HAMME
 
5@7 AtoS Aix - Open Data en PACA
5@7 AtoS Aix - Open Data en PACA5@7 AtoS Aix - Open Data en PACA
5@7 AtoS Aix - Open Data en PACAJean-Paul CARMONA
 
Retour d'expérience Open Data Paris - La novela
Retour d'expérience Open Data Paris - La novelaRetour d'expérience Open Data Paris - La novela
Retour d'expérience Open Data Paris - La novelaMairie de Paris
 
Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve...
Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve...Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve...
Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve...Charles Ruelle
 
Assurer la qualité des données électroniques tout au long de leur cycle de vi...
Assurer la qualité des données électroniques tout au long de leur cycle de vi...Assurer la qualité des données électroniques tout au long de leur cycle de vi...
Assurer la qualité des données électroniques tout au long de leur cycle de vi...AssociationAF
 
RDA - Vers le web sémantique. RDA en bref par Audray Sauvage
RDA - Vers le web sémantique. RDA en bref par Audray SauvageRDA - Vers le web sémantique. RDA en bref par Audray Sauvage
RDA - Vers le web sémantique. RDA en bref par Audray SauvageMichèle Furer-Benedetti
 
Open data dans la Métropole de Toulouse
Open data dans la Métropole de ToulouseOpen data dans la Métropole de Toulouse
Open data dans la Métropole de Toulouseantic Pays basque
 
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...AssociationAF
 
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...ABES
 
Open Data en pratique
Open Data en pratiqueOpen Data en pratique
Open Data en pratiqueGarlann Nizon
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...kmichel69
 
Présentation APRIL : L'open data
Présentation APRIL : L'open data Présentation APRIL : L'open data
Présentation APRIL : L'open data Ville de Toulouse
 
OpenData et médiation numérique
OpenData et médiation numériqueOpenData et médiation numérique
OpenData et médiation numériqueGarlann Nizon
 
Open data et participation 31mars17
Open data et participation 31mars17Open data et participation 31mars17
Open data et participation 31mars17Garlann Nizon
 
Créer une communauté apprenante entre archivistes via internet: le PIAF et se...
Créer une communauté apprenante entre archivistes via internet: le PIAF et se...Créer une communauté apprenante entre archivistes via internet: le PIAF et se...
Créer une communauté apprenante entre archivistes via internet: le PIAF et se...AssociationAF
 
Open data et gouvernance des organisations par www.opendatasoft.com
Open data et gouvernance des organisations par www.opendatasoft.comOpen data et gouvernance des organisations par www.opendatasoft.com
Open data et gouvernance des organisations par www.opendatasoft.comOpenDataSoft
 
La base de connaissances du CNFPT
La base de connaissances du CNFPTLa base de connaissances du CNFPT
La base de connaissances du CNFPTXWiki
 
Opendata introduction 31mars17
Opendata introduction 31mars17Opendata introduction 31mars17
Opendata introduction 31mars17Garlann Nizon
 

Was ist angesagt? (20)

Présentation Opendata (octobre 2012)
Présentation Opendata (octobre 2012)Présentation Opendata (octobre 2012)
Présentation Opendata (octobre 2012)
 
5@7 AtoS Aix - Open Data en PACA
5@7 AtoS Aix - Open Data en PACA5@7 AtoS Aix - Open Data en PACA
5@7 AtoS Aix - Open Data en PACA
 
Retour d'expérience Open Data Paris - La novela
Retour d'expérience Open Data Paris - La novelaRetour d'expérience Open Data Paris - La novela
Retour d'expérience Open Data Paris - La novela
 
Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve...
Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve...Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve...
Colloque National du Maroc “Open Gouvernement : Stratégies Fondées sur l’Ouve...
 
Assurer la qualité des données électroniques tout au long de leur cycle de vi...
Assurer la qualité des données électroniques tout au long de leur cycle de vi...Assurer la qualité des données électroniques tout au long de leur cycle de vi...
Assurer la qualité des données électroniques tout au long de leur cycle de vi...
 
RDA - Vers le web sémantique. RDA en bref par Audray Sauvage
RDA - Vers le web sémantique. RDA en bref par Audray SauvageRDA - Vers le web sémantique. RDA en bref par Audray Sauvage
RDA - Vers le web sémantique. RDA en bref par Audray Sauvage
 
Open data dans la Métropole de Toulouse
Open data dans la Métropole de ToulouseOpen data dans la Métropole de Toulouse
Open data dans la Métropole de Toulouse
 
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
Françoise Lemaire et Rosine Lheureux_Explorer les nouveaux territoires de la ...
 
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
Parcours Sudoc - Quelle trajectoire pour les catalogues français dans le web ...
 
Open Data en pratique
Open Data en pratiqueOpen Data en pratique
Open Data en pratique
 
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
Kristell MICHEL : Une IDG au service des Observatoires sur l’eau: retour d'ex...
 
Ribet
RibetRibet
Ribet
 
Présentation APRIL : L'open data
Présentation APRIL : L'open data Présentation APRIL : L'open data
Présentation APRIL : L'open data
 
OpenData et médiation numérique
OpenData et médiation numériqueOpenData et médiation numérique
OpenData et médiation numérique
 
Open data et participation 31mars17
Open data et participation 31mars17Open data et participation 31mars17
Open data et participation 31mars17
 
Créer une communauté apprenante entre archivistes via internet: le PIAF et se...
Créer une communauté apprenante entre archivistes via internet: le PIAF et se...Créer une communauté apprenante entre archivistes via internet: le PIAF et se...
Créer une communauté apprenante entre archivistes via internet: le PIAF et se...
 
Une semaine à Lubumbashi (RDC)
Une semaine à Lubumbashi (RDC)Une semaine à Lubumbashi (RDC)
Une semaine à Lubumbashi (RDC)
 
Open data et gouvernance des organisations par www.opendatasoft.com
Open data et gouvernance des organisations par www.opendatasoft.comOpen data et gouvernance des organisations par www.opendatasoft.com
Open data et gouvernance des organisations par www.opendatasoft.com
 
La base de connaissances du CNFPT
La base de connaissances du CNFPTLa base de connaissances du CNFPT
La base de connaissances du CNFPT
 
Opendata introduction 31mars17
Opendata introduction 31mars17Opendata introduction 31mars17
Opendata introduction 31mars17
 

Ähnlich wie Du document à la donnée et retour : la fourmilière ou les Lumières

Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...
Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...
Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...Amar LAKEL, PhD
 
Numérique et société : outils, usages et perspectives
Numérique et société : outils, usages et perspectivesNumérique et société : outils, usages et perspectives
Numérique et société : outils, usages et perspectivesClément Dussarps
 
La valorisation des réseaux socionumériques dans la recherche
La valorisation des réseaux socionumériques dans la rechercheLa valorisation des réseaux socionumériques dans la recherche
La valorisation des réseaux socionumériques dans la rechercheJulien PIERRE
 
Bibliothèques et crowdsourcing
Bibliothèques et crowdsourcingBibliothèques et crowdsourcing
Bibliothèques et crowdsourcingPauline Moirez
 
Former aux « littératies médiatiques »
, bâtir un socle de compétences pour f...
Former aux « littératies médiatiques »
, bâtir un socle de compétences pour f...Former aux « littératies médiatiques »
, bâtir un socle de compétences pour f...
Former aux « littératies médiatiques »
, bâtir un socle de compétences pour f...Florent Michelot
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsolivier
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...olivier
 
La curation d'information en bibliothèque
La curation d'information en bibliothèqueLa curation d'information en bibliothèque
La curation d'information en bibliothèqueOrianne Ledroit
 
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...Gehan Kamachi
 
Usages des archives : définitions, théories et typologies
Usages des archives : définitions, théories et typologiesUsages des archives : définitions, théories et typologies
Usages des archives : définitions, théories et typologiesSimon Côté-Lapointe
 
Homo interneticus internet modifie t il nos modes d'apprentissages?
Homo interneticus   internet modifie t il nos modes d'apprentissages?Homo interneticus   internet modifie t il nos modes d'apprentissages?
Homo interneticus internet modifie t il nos modes d'apprentissages?espenel
 
Web numérique et littérature jeunesse #introduction
Web numérique et littérature jeunesse #introduction Web numérique et littérature jeunesse #introduction
Web numérique et littérature jeunesse #introduction Anne Clerc
 
Rapport humanités numériques
Rapport humanités numériquesRapport humanités numériques
Rapport humanités numériquesOpenEdition
 
De la lecture à la navigation: quelles compétences médiatiques
De la lecture à la navigation: quelles compétences médiatiquesDe la lecture à la navigation: quelles compétences médiatiques
De la lecture à la navigation: quelles compétences médiatiquesPierre Fastrez
 
Démarche documentaire Par Dr. Hassan El Ouazzani
Démarche documentaire  Par Dr. Hassan El OuazzaniDémarche documentaire  Par Dr. Hassan El Ouazzani
Démarche documentaire Par Dr. Hassan El OuazzaniElmahdi FRID
 
Réflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligneRéflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligneOpenEdition
 
Etude ipsos liste_etude_def-2
Etude ipsos liste_etude_def-2Etude ipsos liste_etude_def-2
Etude ipsos liste_etude_def-2Silicon Village
 

Ähnlich wie Du document à la donnée et retour : la fourmilière ou les Lumières (20)

Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...
Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...
Pour une documentologie digitale : La vie numérique de Robert Escarpit de 200...
 
Questions vives à l'école
Questions vives à l'écoleQuestions vives à l'école
Questions vives à l'école
 
Numérique et société : outils, usages et perspectives
Numérique et société : outils, usages et perspectivesNumérique et société : outils, usages et perspectives
Numérique et société : outils, usages et perspectives
 
La valorisation des réseaux socionumériques dans la recherche
La valorisation des réseaux socionumériques dans la rechercheLa valorisation des réseaux socionumériques dans la recherche
La valorisation des réseaux socionumériques dans la recherche
 
Bibliothèques et crowdsourcing
Bibliothèques et crowdsourcingBibliothèques et crowdsourcing
Bibliothèques et crowdsourcing
 
Former aux « littératies médiatiques »
, bâtir un socle de compétences pour f...
Former aux « littératies médiatiques »
, bâtir un socle de compétences pour f...Former aux « littératies médiatiques »
, bâtir un socle de compétences pour f...
Former aux « littératies médiatiques »
, bâtir un socle de compétences pour f...
 
Cersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutionsCersic: culture informationnelle et institutions
Cersic: culture informationnelle et institutions
 
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
De la recherche d'information aux pratiques scientifiques : vers de nouveaux ...
 
La curation d'information en bibliothèque
La curation d'information en bibliothèqueLa curation d'information en bibliothèque
La curation d'information en bibliothèque
 
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...
Les médiations socio-techniques de l’observation en ligne. Analyse réflexive ...
 
Usages des archives : définitions, théories et typologies
Usages des archives : définitions, théories et typologiesUsages des archives : définitions, théories et typologies
Usages des archives : définitions, théories et typologies
 
Homo interneticus internet modifie t il nos modes d'apprentissages?
Homo interneticus   internet modifie t il nos modes d'apprentissages?Homo interneticus   internet modifie t il nos modes d'apprentissages?
Homo interneticus internet modifie t il nos modes d'apprentissages?
 
Web numérique et littérature jeunesse #introduction
Web numérique et littérature jeunesse #introduction Web numérique et littérature jeunesse #introduction
Web numérique et littérature jeunesse #introduction
 
Actualité.net 12 19nov10
Actualité.net 12 19nov10Actualité.net 12 19nov10
Actualité.net 12 19nov10
 
Actualité.net 12 19nov10
Actualité.net 12 19nov10Actualité.net 12 19nov10
Actualité.net 12 19nov10
 
Rapport humanités numériques
Rapport humanités numériquesRapport humanités numériques
Rapport humanités numériques
 
De la lecture à la navigation: quelles compétences médiatiques
De la lecture à la navigation: quelles compétences médiatiquesDe la lecture à la navigation: quelles compétences médiatiques
De la lecture à la navigation: quelles compétences médiatiques
 
Démarche documentaire Par Dr. Hassan El Ouazzani
Démarche documentaire  Par Dr. Hassan El OuazzaniDémarche documentaire  Par Dr. Hassan El Ouazzani
Démarche documentaire Par Dr. Hassan El Ouazzani
 
Réflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligneRéflexions éditoriales sur l'administration de la preuve en ligne
Réflexions éditoriales sur l'administration de la preuve en ligne
 
Etude ipsos liste_etude_def-2
Etude ipsos liste_etude_def-2Etude ipsos liste_etude_def-2
Etude ipsos liste_etude_def-2
 

Du document à la donnée et retour : la fourmilière ou les Lumières

  • 1. Du document à la donnée et retour La fourmilière ou les Lumières Jean-Michel Salaün Séminaire INRIA – IST « Le document numérique à l'heure du web de données » 30 septembre 2012 © Nicolas Taffin
  • 2. Epistemic infrastructure © Nicolas Taffin L’infrastructure épistémique de l’économie de la connaissance repose sur les bibliothèques, les archives, les musées, les galeries, les zoos, les aquariums et d’autres collections systématiques encore qui permettent aux individus de savoir ce qu’ils savent et de faire ce qu’ils font. Le rassemblement, la conservation, l’organisation, la représentation et la diffusion des documents d’archives, des plantes et des animaux, des objets rares ou communs, des œuvres d’art, etc. est au cœur de la production de connaissances, de l’enseignement, de la prise de décision et du commerce. Margaret Hedstrom et John Leslie King, « Epistemic infrastructure in the rise of the knowledge economy », in Brian Kahin et Dominique Foray, Advancing Knowledge and the Knowledge Economy, MIT Press, Cambridge (Mass.), USA, 2006, p. 113-134. INRIA-IST-Carnac-2012 2 JM Salaun
  • 3. Cyberinfrastructure © Nicolas Taffin L’arrivée de l’internet a transformé les pratiques dans les sciences sociales et humaines (SHS), plus lentement que certains l’avaient espéré mais plus profondément que d’autres auraient attendu. Les ressources du patrimoine culturel numérique forment un ensemble de données essentielles pour les SHS : ces ressources, traitées grâce aux réseaux et aux logiciels, organisent aujourd’hui la façon dont les scientifiques découvrent et donnent du sens aux traces humaines tout en organisant la manière dont leurs résultats sont transmis à leurs étudiants, leurs collègues et au public en général Our Cultural Commonwealth. The report of the American Council of Learned Societies Commission on Cyberinfrastructure for the Humanities and Social Sciences, 2006, 51p. INRIA-IST-Carnac-2012 3 JM Salaun
  • 4. Google © Nicolas Taffin Il s’agit de cartographier le monde réel d’une façon que les ordinateurs puissent comprendre. Il s’agit de prendre des objets du monde réel, de comprendre ce que sont ces choses et quelles sont les choses importantes à leur sujet ainsi que leurs relations à d’autres choses. C’est la partie que je trouve la plus fascinante : quelle est la relation entre toutes ces choses différentes ? Entretien avec la responsable du Knowledge Graph de Google, RWW, 26 juillet 2012. INRIA-IST-Carnac-2012 4 JM Salaun
  • 5. La documentarisation (à la Bibliothèque du Congrès début 20ème siècle) © Nicolas Taffin Wikipédia INRIA-IST-Carnac-2012 5 JM Salaun
  • 6. De la manufacture à l’industrie © Nicolas Taffin INRIA-IST-Carnac-2012 6 JM Salaun
  • 7. Les trois dimensions du document (Roger T. Pédauque) © Nicolas Taffin 1. Anthropologique : Forme Vu Document = Support + Inscription Contrat 2. Intellectuelle :Texte Lu de lecture Document = Code + représentation 3. Sociale : Médium Su Document = Mémoire + transaction INRIA-IST-Carnac-2012 7 JM Salaun
  • 8. Du document à la donnée © Nicolas Taffin • 19e-20e : Document scientifique = article de revue et livre » Transmettre et prouver • 21e : Document scientifique = – Documents numériques (hyper-) (Web 1 modifie le vu) • ArXive, ScienceDirect… • Gallica, Europeana, Google-Book… – Néodocuments (Web 2 modifie le su) • Blogues • Wikipédia • Réseaux sociaux • Sites dynamiques, etc. – Données (Web 3 modifie le lu) » Partager et reconstruire ? INRIA-IST-Carnac-2012 8 JM Salaun
  • 9. La documentarisation (vue par P. Otlet) © Nicolas Taffin Première modernité (première et deuxième révolution industrielle) P.Otlet, Traité de documentation, 1934, p.41 INRIA-IST-Carnac-2012 9 JM Salaun
  • 10. Le Web des données (vue par le W3C) © Nicolas Taffin Seconde modernité ou modernité tardive (troisième révolution industrielle) 2007 : web des données W3C INRIA-IST-Carnac-2012 10 JM Salaun
  • 11. L’inversion de la logique de documentarisation © Nicolas Taffin On construit le savoir à partir On reconstruit le savoir de l’observation de la nature à partir des ressources disponibles INRIA-IST-Carnac-2012 11 JM Salaun
  • 12. Le rapport au savoir change © Nicolas Taffin Bienvenue sur Wikipédia Le projet d’encyclopédie libre que vous pouvez améliorer Les articles de Wikipédia devraient reposer principalement sur des sources secondaires fiables. Toute utilisation de sources primaires devrait s'appuyer sur des sources secondaires, et ne pas être une sélection, analyse, synthèse ou interprétation inédite réalisée par un contributeur de Wikipédia. Les sources primaires seules sont acceptées si elles consistent en des assertions factuelles et non sujettes à interprétation ou polémique. Wkp INRIA-IST-Carnac-2012 12 JM Salaun
  • 13. Transparence et accélération © Nicolas Taffin Le dialogue de sourds entre Ph. Roth et Wikipédia : • 20 août première correction : j'ai retiré la référence à Anatole Broyard sur l'insistance de Philip Roth, je suis son biographe. • Une minute après, un éditeur de wkp remet le texte initial : Pouvez-vous le vérifier ?. • Vingt minutes plus tard, correction renouvelée : Une nouvelle fois, j'ai enlevé la référence à Anatole Broyard. C'est tout à fait inexact et donc sans objet. Je suis le biographe de Roth et j'ai fait cette correction à sa demande. • Six minutes après, un autre éditeur de wkp remet de nouveau le texte initial et ajoute de nouveaux détails pour confirmer l'inspiration du roman par le personnage d'A. Broyard. Cet éditeur prendra deux heures de son temps pour cette rédaction. Comme l'indique le wikipédien qui relate l'histoire : cet éditeur a du se prendre pour un vrai détective ! • 7 septembre Ph Roth publie une Lettre ouverte à Wikipédia sur The New Yorker, très largement commentée dans la presse et sur le web. • 18h54 correction réalisée par un membre de la Wikimedia Foundation. INRIA-IST-Carnac-2012 13 JM Salaun
  • 14. Wikipédia, au centre du web de données © Nicolas Taffin INRIA-IST-Carnac-2012 14 JM Salaun
  • 15. Wikipédia + Google = le sens commun © Nicolas Taffin • Carnac • François Hollande • Barak Obama • Marilyn Monroe • Jean-Michel Salaün INRIA-IST-Carnac-2012 15 JM Salaun
  • 16. Web de données + traces = Knowledge Graph © Nicolas Taffin Avant, Metaweb était un référentiel d'entités et de faits et les employés de la société utilisaient beaucoup leur intuition pour trouver ce qui importait pour les usagers et quelle information chercher. Depuis qu'ils ont été rachetés par Google, Google dispose de tous ces usagers cherchant de l'information, et de là nous savons quelles choses du monde sont importantes (...) Google sait que les gens qui cherchent une chose en cherchent aussi d'autres. Ainsi on peut trouver des relations intéressantes en regardant les sessions agrégées des usagers. Une des prochaines étapes est en effet d'expliquer ces relations fortuites. Entretien avec la responsable du Knowledge Graph de Google, RWW, 26 juillet 2012. INRIA-IST-Carnac-2012 16 JM Salaun
  • 17. Pour une histoire des (bases de) données © Nicolas Taffin • Les cartes perforées au service du contrôle • La classification au service du partage du savoir • Les hobbyistes au service de l’autonomie • Le « big data » et le retour du contrôle ? Driscoll, Kevin. « From Punched Cards to “Big Data”: A Social History of Database Populism ». communication 1 1, no. 1 (août 29, 2012). INRIA-IST-Carnac-2012 17 JM Salaun
  • 18. Le « big data » Publication vs transparence © Nicolas Taffin Ce sont les petites miettes de données que vous laissez derrière vous quand vous vous déplacez sur terre. Ce que ces miettes racontent, c'est l'histoire de votre vie. Elles disent ce que vous avez choisi de faire. C'est très différent de ce que vous mettez sur Facebook. Ce que vous mettez sur Facebook, c'est ce que vous voudriez dire aux gens, rédigé selon les normes d'aujourd'hui. (...) Si je peux connaitre certains de vos comportements, je peux inférer le reste juste en vous comparant avec la foule de ceux qui vous ressemblent. (…) Ce qui compte vraiment, c'est comment les gens sont reliés les uns aux autres par les machines et comment ils créent un marché financier, un gouvernement, une entreprise et d'autres structures sociales. Alex Pentland in Reinventing Society In The Wake Of Big Data. Edge, août 30, 2012. INRIA-IST-Carnac-2012 18 JM Salaun
  • 19. Le risque : la fourmilière © Nicolas Taffin • Selon Thomas Bern, la transparence conduit à un gouvernement « inoffensif » où les décisions politiques ne sont plus discutées et sont diluées dans le social. • Selon Harmut Rosa, accélération rime avec aliénation. INRIA-IST-Carnac-2012 19 JM Salaun
  • 20. Analyser l’histoire de la statistique © Nicolas Taffin Dans son architecture actuelle, la statistique se présente comme la combinaison de deux types d’outillages distincts (…). Le premier est politico-administratif : peu à peu se sont mis en place, depuis le 18e siècle, des systèmes d’enregistrement, de codage, de tabulation et de publications de « statistiques » au sens de description chiffrée de divers aspects du monde social. Le second est cognitif, et implique la mise en forme de schèmes scientifiques (moyenne, dispersion, corrélation, échantillonnage probabiliste), destinés à résumer, notamment par des outils mathématiques une diversité supposée non maîtrisable. (A. Desrosières) Dans son architecture actuelle, le web de données se présente comme la combinaison de deux types d’outillages distincts. Le premier est politico- administratif : peu à peu se sont mis en place, à partir de la fin du 19e siècle des systèmes d’enregistrement, de codage, de classification et de publication de « bases de données » au sens de description factuelles de divers aspects du monde social. Le second est cognitif et implique la constitution de schémas logiques destinés à résumer grâce à des algorithmes une diversité supposée non maîtrisable. INRIA-IST-Carnac-2012 20 JM Salaun
  • 21. Analyser La théorie du document © Nicolas Taffin • Mieux comprendre le passage du « transmettre et prouver » au « partager et reconstruire ». • Suivre les stratégies commerciales et non commerciales sur le vu, le lu et le su. • Observer et comprendre le nouveau contrat de lecture dans les formes ordinaires de consultations documentaires numériques. INRIA-IST-Carnac-2012 21 JM Salaun
  • 22. Réinventer un contrat de lecture © Nicolas Taffin La constitution d’un espace rendant possible le débat contradictoire sur les options de la cité suppose l’existence d’un minimum d’éléments de référence communs aux divers acteurs : langage pour mettre en forme les choses, pour dire les fins et les moyens de l’action, pour en discuter les résultats. Ce langage ne préexiste pas au débat : il est négocié, stabilisé, inscrit, puis déformé et défait peu à peu, au fil des interactions propres à un espace et une période historique données. Alain Desrosières, La politique des grands nombres : histoire de la raison statistique. Paris : La Découverte, 2000, INRIA-IST-Carnac-2012 22 JM Salaun
  • 23. Agir Vers de nouvelles Lumières © Nicolas Taffin • Participer au mouvement : ouverture et agilité. • Gérer l’hybride sans sectarisme. • Vers une « architecture de l’information ». INRIA-IST-Carnac-2012 23 JM Salaun
  • 24. En résumé © Nicolas Taffin • Le web des données est une étape supplémentaire dans une longue histoire des systèmes documentaires. • L’évolution du web favorise une modification de la notion de document vers « partager et reconstruire ». • Transparence et accélération marquent cette étape, non sans risque. • Nous avons une responsabilité à tenir dans cette dynamique. INRIA-IST-Carnac-2012 24 JM Salaun