SlideShare ist ein Scribd-Unternehmen logo
1 von 19
Downloaden Sie, um offline zu lesen
One Index To Rule Them All
De Paul Otlet à l’internet des objets.
Ertzscheid Olivier. www.Affordance.info. Université de Nantes. Novembre 2017.
1
Préambule.
Le web a à peine plus de 25 ans.
• Aucun média n’a jamais permis de toucher autant de monde en
même temps, aussi régulièrement. Aucun média n’a jamais connu
autant de changements structurels en si peu de temps
• En moins de 25 ans le web a changé 3 fois de nature et d’objet.
• Il a changé (au moins) 3 fois d’index. 2
Le web est AVANT TOUT une histoire d’index.
A nous de faire en sorte qu’il ne devienne pas, APRÈS TOUT, une forme de mise à l’index.
• LES INDEX INCONNUS.
– Index des objets => ? … ?
– Index du génome => ? … ?
– Index des … émotions ? (web / informatique affective)
• LES INDEX CONNUS.
– Index des produits => Amazon (1994)
– Index des adresses (URL) => Yahoo! (1995)
– Index des documents => Google (1998)
– Index des profils => Facebook (2004)
3
One ring Index To Rule Them All
• Des index sur les informations et les connaissances que NOUS avons
produites. Des index bâtis sur des algorithmes que NOUS avons entraînés.
A l’aide de données que NOUS leur avons confiées. #DigitalLabor
• Ce sont les commerçants qui ont construit l’index d’Amazon :
– Index des produits => Amazon (1994)
• Ce sont les internautes qui ont construit l’index de Google et « formé »
son algorithme
– Index des documents => Google (1998)
• Ce sont les internautes qui ont fait Facebook (données servitude
volontaire)
– Index des profils => Facebook (2004)
4
On a donc plusieurs « problèmes paradoxaux ».
« Si c’est gratuit c’est vous le produit »
Si vous ne trouvez pas la solution c’est parce que c’est souvent vous le problème.
• Problème 1 : Des GAFAM / NATU / BATX que tout le monde commence à raison à trouver
effrayants et qui ne cachent pas leur ambition de réguler l’ensemble de la sphère commerciale
mais aussi publique, régalienne, politique.
• Problème 2 : Des données / pages / profils / contenus publics (ou qui pourraient rapidement le
redevenir) mais qui sont captés et - paradoxalement - rendus publics uniquement par des services
/ acteurs privés
• Problème 3 : Ces acteurs, autour de leurs index, ont fini par « propriétariser » des ressources et
des individus qui avaient vocation à rester en dehors de toute appropriation, de toute
« enclosure ». Et ils ont organisé leur mise en concurrence et des formes inédites de spéculation
(sur la langue et le vocabulaire => cf F. Kaplan et le capitalisme linguistique)
• Effet paradoxal : ces acteurs privés n’essaient même plus de garder leurs algos secrets et les
mettent en Open Source (la chaîne de valeur s’étant déplacée des algorithmes aux données*) mais
les acteurs publics ou associatifs n’arrivent pas à « passer à l’échelle ».
Résultat =>
5
* http://affordance.typepad.com//mon_weblog/2016/05/nationaliser-code-republique-algorithmique.html)
Ceux qui veulent / peuvent changer la donne ont un très gros problème de
Scalabilité / Montée en charge / Passage à l’échelle.
6
Scalabilité / Montée en charge / Passage à l’échelle.
7
ALGORITHMIQUES
Prévisibilité
Transparence
Robustesse
Bostrom et Yudowsky, 2011, « The Ethics of Artificial Intelligence » : « Les algorithmes de plus en plus complexes de prise de décision sont à la
fois souhaitables et inévitables, tant qu'ils restent transparents à l'inspection, prévisibles pour ceux qu'ils gouvernent, et robustes contre toute
manipulation. »
No-Go Zones Algorithmiques
8
On fait
quoi ?
9
On réinvente
le rêve d’Otlet
10
Réinventer le rêve d’Otlet
• Il était : « l’homme qui voulait classer le monde ».
– Nous avons des sociétés commerciales qui y sont parvenues ; mais sur les bases d’un capitalisme linguistique
dont la version triviale consiste à dire que la langue, que les mots ont une valeur marchande qui l’emporte sur
leur sens et a pour seule vocation de permettre la mise en concurrence de ressources et d’individus et à s’enrichir
de la spéculation qu’ils organisent et contrôlent.
• Il pensait que le document, que la documentation avait un rôle déterminant à jouer dans la
pacification du monde.
– Nous avons des sociétés qui dessinent le projet politique fasciste de nouveaux « sous-hommes » sans documents
(http://affordance.typepad.com/mon_weblog/2017/02/undocumented-men.html) face à de nouveaux « sur-
hommes » sur-documentés.
11
Source de l’image : http://globalnation.inquirer.net/119385/undocumented-california-youth-can-get-health-care-but-many-dont-know-it
On fait
comment ?
12
On crée un index
in-dé-pen-dant.
• C’est quoi l’idée ? Recréer les conditions d’une concurrence algorithmique saine.
• Pas de concurrence car impossible (trop coûteux) pour « petits acteurs industriels » de maintenir un index complet et à
jour du web (sauf pour Google et Microsoft) => Monopole => TINA (There Is No Alternative) => En attendant Godot un
Google Killer qui ne viendra pas.
• Pour recréer les conditions d’une concurrence il faut, pour le web, un index indépendant, qui réponde à 3 conditions :
– être ouvert et accessible à tout le monde.
– à des conditions équitables (= Accès à l’index gratuit + accès payant à l’API sauf pour projets « non-profit »).
– l’accès doit être « complet » (on doit accéder au texte intégral, pas simplement à une « vue » du document). Il ne
doit pas y avoir de « limites » à l’extraction de documents.
• Lewandowski : « an ideology free-ranking algorithm is not possible and would also not be desirable. (…) We should
trive for diversity achieved through multiple ranking algorithms competing against one another. »
13
« Why we need an independant index of the web »
https://arxiv.org/abs/1405.2212 Mai 2014.
Pourquoi ce n’est pas si compliqué que ça ?
(et pourquoi c’est urgent aussi …)
• TECHNIQUEMENT
• Parce que toutes technos du web sont dans le domaine public depuis le 30 Avril 1993.
• Parce qu’en plus la plupart des algos et des technos d’IA portées par les GAFAM sont aussi en Open
Source.
• CÔTÉ CONTENUS
• Parce que plusieurs pièces du puzzle n’attendent que d’être rassemblées : Hathi Trust (copie
suffisamment significative de la base de donnée Google Books), fondation Internet Archive, Common
Crawl, Dépôt légal du Web, Gallica / BnF, INA, Archives Ouvertes, WorldCat … + ressources propres (des
archives et des bases de données de chaque titre de presse nationale, de PQR, de chaque bibliothèque,
de chaque université, de chaque entreprise, etc).
• SOCIOLOGIQUEMENT ET POLITIQUEMENT
• Parce que les gens sont (presque) prêts. Ils ont en tout cas conscience du problème.
• COMMERCIALEMENT
• Parce qu’une offre alternative existe (Qwant, CHATONS, Framasoft, Degooglisons, DuckDuckGo) et a
besoin de passer à l’échelle
• OUI MAIS ÇA VA COÛTER CHER …
• Oui. Mais on a l’argent. Et ça vaut le coup non ?
• Et puis …
14
15
Paul Otlet n’est pas vraiment arrivé à réaliser son rêve
mais il nous a laissé ça :
• « Les buts de la documentation consistent à
pouvoir offrir sur tout ordre de fait et de
connaissance, des informations documentées :
1. universelles quant à leur objet
2. sûres et vraies
3. complètes,
4. rapides,
5. à jour
6. faciles à obtenir
7. réunies d’avance et prêtes à être communiquées,
8. mises à la disposition du plus grand nombre ».
16
Si nous n’arrivons pas à réaliser le rêve d’Otlet
• Nous aurons des informations uniquement
1. universelles quant à leur objet
2. sûres et vraies
3. complètes,
4. rapides,
5. à jour
6. faciles à obtenir
7. réunies d’avance et prêtes à être communiquées,
8. mises à la disposition du plus grand nombre
• Nous aurons donc raté l’essentiel.
17
Et c’est déjà très problématique.
18• https://www.theguardian.com/commentisfree/2016/dec/11/google-frames-shapes-and-distorts-how-we-see-world
On est passé du problème du jaguar (comment choisir un sens plutôt qu’un
autre) au problème de l’holocauste (comment savoir ce qui a du sens).
Les algorithmes n’y arriveront pas seuls. Et il ne faut pas laisser ces enjeux aux
seules mains des GAFA.
Il nous faut un index indépendant du web. Envisagé comme un commun de la
connaissance à part entière.
Index des documents Index des profils Index indépendant ;-)
19Merci de votre attention
Moralité ?

Weitere ähnliche Inhalte

Was ist angesagt?

Podcast cult-num-1-2-3
Podcast cult-num-1-2-3Podcast cult-num-1-2-3
Podcast cult-num-1-2-3olivier
 
Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?olivier
 
Monde selon Zuckerberg
Monde selon ZuckerbergMonde selon Zuckerberg
Monde selon Zuckerbergolivier
 
memoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-webmemoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-webolivier
 
Abf clermont-oe
Abf clermont-oeAbf clermont-oe
Abf clermont-oeolivier
 
Objets-connectes
Objets-connectesObjets-connectes
Objets-connectesolivier
 
Fadben ertzscheid-olivier
Fadben ertzscheid-olivierFadben ertzscheid-olivier
Fadben ertzscheid-olivierolivier
 
Forum medias-ertzscheid
Forum medias-ertzscheidForum medias-ertzscheid
Forum medias-ertzscheidolivier
 
Editorialisation
EditorialisationEditorialisation
Editorialisationolivier
 
Fif 85-ertzscheid
Fif 85-ertzscheidFif 85-ertzscheid
Fif 85-ertzscheidolivier
 
Montaigu web-ouvert-def
Montaigu web-ouvert-defMontaigu web-ouvert-def
Montaigu web-ouvert-defolivier
 
Attac-appetit-geants
Attac-appetit-geantsAttac-appetit-geants
Attac-appetit-geantsolivier
 
Ertzscheid Ehess
Ertzscheid EhessErtzscheid Ehess
Ertzscheid Ehessolivier
 
Profil ertzscheid - copie
Profil ertzscheid - copieProfil ertzscheid - copie
Profil ertzscheid - copieolivier
 
Reseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oeReseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oeolivier
 
appetit-geants-ertzscheid
appetit-geants-ertzscheidappetit-geants-ertzscheid
appetit-geants-ertzscheidolivier
 
Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?olivier
 
Les bibliotheques numeriques
Les bibliotheques numeriquesLes bibliotheques numeriques
Les bibliotheques numeriquesolivier
 
Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.olivier
 
FakeNews
FakeNewsFakeNews
FakeNewsolivier
 

Was ist angesagt? (20)

Podcast cult-num-1-2-3
Podcast cult-num-1-2-3Podcast cult-num-1-2-3
Podcast cult-num-1-2-3
 
Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?Digital Intelligence : pour une éthique algorithmique ?
Digital Intelligence : pour une éthique algorithmique ?
 
Monde selon Zuckerberg
Monde selon ZuckerbergMonde selon Zuckerberg
Monde selon Zuckerberg
 
memoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-webmemoire-ina-atelier-depotlegal-web
memoire-ina-atelier-depotlegal-web
 
Abf clermont-oe
Abf clermont-oeAbf clermont-oe
Abf clermont-oe
 
Objets-connectes
Objets-connectesObjets-connectes
Objets-connectes
 
Fadben ertzscheid-olivier
Fadben ertzscheid-olivierFadben ertzscheid-olivier
Fadben ertzscheid-olivier
 
Forum medias-ertzscheid
Forum medias-ertzscheidForum medias-ertzscheid
Forum medias-ertzscheid
 
Editorialisation
EditorialisationEditorialisation
Editorialisation
 
Fif 85-ertzscheid
Fif 85-ertzscheidFif 85-ertzscheid
Fif 85-ertzscheid
 
Montaigu web-ouvert-def
Montaigu web-ouvert-defMontaigu web-ouvert-def
Montaigu web-ouvert-def
 
Attac-appetit-geants
Attac-appetit-geantsAttac-appetit-geants
Attac-appetit-geants
 
Ertzscheid Ehess
Ertzscheid EhessErtzscheid Ehess
Ertzscheid Ehess
 
Profil ertzscheid - copie
Profil ertzscheid - copieProfil ertzscheid - copie
Profil ertzscheid - copie
 
Reseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oeReseaux sociaux-et-entreprise-def-oe
Reseaux sociaux-et-entreprise-def-oe
 
appetit-geants-ertzscheid
appetit-geants-ertzscheidappetit-geants-ertzscheid
appetit-geants-ertzscheid
 
Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?Wikipédia : former ou interdire ?
Wikipédia : former ou interdire ?
 
Les bibliotheques numeriques
Les bibliotheques numeriquesLes bibliotheques numeriques
Les bibliotheques numeriques
 
Gestion des donnees personnelles.
Gestion des donnees personnelles.Gestion des donnees personnelles.
Gestion des donnees personnelles.
 
FakeNews
FakeNewsFakeNews
FakeNews
 

Andere mochten auch

Identite numerique
Identite numeriqueIdentite numerique
Identite numeriqueolivier
 
Indexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseIndexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseolivier
 
Internet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploiInternet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploiolivier
 
blogs-scientifiques
blogs-scientifiquesblogs-scientifiques
blogs-scientifiquesolivier
 
l'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mèmel'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mèmeolivier
 
identitenumeriqueacademique
identitenumeriqueacademiqueidentitenumeriqueacademique
identitenumeriqueacademiqueolivier
 
Histoire et réforme de l’orthographe
Histoire et réforme de l’orthographeHistoire et réforme de l’orthographe
Histoire et réforme de l’orthographeolivier
 
Rennes-archive-ertzscheid
Rennes-archive-ertzscheidRennes-archive-ertzscheid
Rennes-archive-ertzscheidolivier
 
Editorialisation algorithmique
Editorialisation algorithmiqueEditorialisation algorithmique
Editorialisation algorithmiqueolivier
 
Pecha kucha-ertzscheid
Pecha kucha-ertzscheidPecha kucha-ertzscheid
Pecha kucha-ertzscheidolivier
 
Digital Detox
Digital DetoxDigital Detox
Digital Detoxolivier
 
Identite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociauxIdentite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociauxolivier
 
Veille rennes-def-oe
Veille rennes-def-oeVeille rennes-def-oe
Veille rennes-def-oeolivier
 
La médiation à l'heure du numérique
La médiation à l'heure du numériqueLa médiation à l'heure du numérique
La médiation à l'heure du numériqueolivier
 
Jounee numerique
Jounee numeriqueJounee numerique
Jounee numeriqueolivier
 

Andere mochten auch (17)

Identite numerique
Identite numeriqueIdentite numerique
Identite numerique
 
Indexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masseIndexation sociale et bibliothéconomie de masse
Indexation sociale et bibliothéconomie de masse
 
Identité numérique et e réputation
Identité numérique et e réputationIdentité numérique et e réputation
Identité numérique et e réputation
 
Internet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploiInternet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploi
 
blogs-scientifiques
blogs-scientifiquesblogs-scientifiques
blogs-scientifiques
 
l'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mèmel'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mème
 
identitenumeriqueacademique
identitenumeriqueacademiqueidentitenumeriqueacademique
identitenumeriqueacademique
 
Elpenor
ElpenorElpenor
Elpenor
 
Histoire et réforme de l’orthographe
Histoire et réforme de l’orthographeHistoire et réforme de l’orthographe
Histoire et réforme de l’orthographe
 
Rennes-archive-ertzscheid
Rennes-archive-ertzscheidRennes-archive-ertzscheid
Rennes-archive-ertzscheid
 
Editorialisation algorithmique
Editorialisation algorithmiqueEditorialisation algorithmique
Editorialisation algorithmique
 
Pecha kucha-ertzscheid
Pecha kucha-ertzscheidPecha kucha-ertzscheid
Pecha kucha-ertzscheid
 
Digital Detox
Digital DetoxDigital Detox
Digital Detox
 
Identite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociauxIdentite-numerique-reseaux-sociaux
Identite-numerique-reseaux-sociaux
 
Veille rennes-def-oe
Veille rennes-def-oeVeille rennes-def-oe
Veille rennes-def-oe
 
La médiation à l'heure du numérique
La médiation à l'heure du numériqueLa médiation à l'heure du numérique
La médiation à l'heure du numérique
 
Jounee numerique
Jounee numeriqueJounee numerique
Jounee numerique
 

Ähnlich wie Index independant du web ertzscheid

Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteursolivier
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptxolivier
 
Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)Coraia
 
Logiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheursLogiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheurspyg
 
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Charles Ruelle
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Philippe METAYER
 
Open data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospectiveOpen data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospectiveSilvère Mercier
 
Le renseignement humain augmenté
Le renseignement humain augmentéLe renseignement humain augmenté
Le renseignement humain augmentéTerry ZIMMER
 
Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014EricVion
 
Formation documentation movilab
Formation documentation movilabFormation documentation movilab
Formation documentation movilabYoann Duriaux
 
Atelier juriconnexion 2009
Atelier juriconnexion 2009Atelier juriconnexion 2009
Atelier juriconnexion 2009Geemik
 
Plateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entreprisePlateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entrepriseCecil Dijoux
 
Design, données personnelles et vie privée
Design, données personnelles et vie privéeDesign, données personnelles et vie privée
Design, données personnelles et vie privéeSylvia Fredriksson
 
Fork les gouvernements
Fork les gouvernementsFork les gouvernements
Fork les gouvernementsAudrey Tang
 

Ähnlich wie Index independant du web ertzscheid (20)

Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteurs
 
Oeinria
OeinriaOeinria
Oeinria
 
CGT-digital-week.pptx
CGT-digital-week.pptxCGT-digital-week.pptx
CGT-digital-week.pptx
 
Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)Accés et production d'information (by Fil Numérique Roanne)
Accés et production d'information (by Fil Numérique Roanne)
 
Movilab en 2020
Movilab en 2020Movilab en 2020
Movilab en 2020
 
Logiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheursLogiciels libres - Concepts et intérêts pour les chercheurs
Logiciels libres - Concepts et intérêts pour les chercheurs
 
9 louis montagne af83
9 louis montagne af839 louis montagne af83
9 louis montagne af83
 
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
 
Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"Formation professionnelle "Big data : concepts et enjeux"
Formation professionnelle "Big data : concepts et enjeux"
 
Coex12 - Je l'ai trouvé sur internet
Coex12 - Je l'ai trouvé sur internetCoex12 - Je l'ai trouvé sur internet
Coex12 - Je l'ai trouvé sur internet
 
Open data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospectiveOpen data, biens communs et bibliothèques : perspectives et prospective
Open data, biens communs et bibliothèques : perspectives et prospective
 
Conference efb 190112
Conference efb 190112Conference efb 190112
Conference efb 190112
 
Le renseignement humain augmenté
Le renseignement humain augmentéLe renseignement humain augmenté
Le renseignement humain augmenté
 
Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014Le_libre_conference_iutnc_oct_2014
Le_libre_conference_iutnc_oct_2014
 
Formation documentation movilab
Formation documentation movilabFormation documentation movilab
Formation documentation movilab
 
Atelier juriconnexion 2009
Atelier juriconnexion 2009Atelier juriconnexion 2009
Atelier juriconnexion 2009
 
Plateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entreprisePlateformes collaboratives et sociales d'entreprise
Plateformes collaboratives et sociales d'entreprise
 
Design, données personnelles et vie privée
Design, données personnelles et vie privéeDesign, données personnelles et vie privée
Design, données personnelles et vie privée
 
Fork les gouvernements
Fork les gouvernementsFork les gouvernements
Fork les gouvernements
 
Ibrain
IbrainIbrain
Ibrain
 

Mehr von olivier

IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.olivier
 
programme-iut-collectif.pdf
programme-iut-collectif.pdfprogramme-iut-collectif.pdf
programme-iut-collectif.pdfolivier
 
libre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptxlibre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptxolivier
 
Bruire-2
Bruire-2Bruire-2
Bruire-2olivier
 
communiquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptxcommuniquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptxolivier
 
Le web a la carte
Le web a la carteLe web a la carte
Le web a la carteolivier
 
education-reseaux-sociaux
education-reseaux-sociauxeducation-reseaux-sociaux
education-reseaux-sociauxolivier
 
Revue Bruire
Revue BruireRevue Bruire
Revue Bruireolivier
 
Fenetre sur-cours
Fenetre sur-coursFenetre sur-cours
Fenetre sur-coursolivier
 
Le Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.tricesLe Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.tricesolivier
 
Google Books Milestones
Google Books MilestonesGoogle Books Milestones
Google Books Milestonesolivier
 
Communication-reseaux-sociaux
Communication-reseaux-sociauxCommunication-reseaux-sociaux
Communication-reseaux-sociauxolivier
 
Obsolescence-programmee
Obsolescence-programmeeObsolescence-programmee
Obsolescence-programmeeolivier
 
Presidentielle-google-suggest
Presidentielle-google-suggestPresidentielle-google-suggest
Presidentielle-google-suggestolivier
 
Lutter contre la haine
Lutter contre la haineLutter contre la haine
Lutter contre la haineolivier
 
Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016olivier
 

Mehr von olivier (16)

IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
IA bien qui IA le dernier. Les effets sociétaux des IA génératives.
 
programme-iut-collectif.pdf
programme-iut-collectif.pdfprogramme-iut-collectif.pdf
programme-iut-collectif.pdf
 
libre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptxlibre-educatif-olivier-ertzscheid.pptx
libre-educatif-olivier-ertzscheid.pptx
 
Bruire-2
Bruire-2Bruire-2
Bruire-2
 
communiquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptxcommuniquer-reseaux-sociaux.pptx
communiquer-reseaux-sociaux.pptx
 
Le web a la carte
Le web a la carteLe web a la carte
Le web a la carte
 
education-reseaux-sociaux
education-reseaux-sociauxeducation-reseaux-sociaux
education-reseaux-sociaux
 
Revue Bruire
Revue BruireRevue Bruire
Revue Bruire
 
Fenetre sur-cours
Fenetre sur-coursFenetre sur-cours
Fenetre sur-cours
 
Le Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.tricesLe Monde selon Zuckerberg selon ses lecteur.trices
Le Monde selon Zuckerberg selon ses lecteur.trices
 
Google Books Milestones
Google Books MilestonesGoogle Books Milestones
Google Books Milestones
 
Communication-reseaux-sociaux
Communication-reseaux-sociauxCommunication-reseaux-sociaux
Communication-reseaux-sociaux
 
Obsolescence-programmee
Obsolescence-programmeeObsolescence-programmee
Obsolescence-programmee
 
Presidentielle-google-suggest
Presidentielle-google-suggestPresidentielle-google-suggest
Presidentielle-google-suggest
 
Lutter contre la haine
Lutter contre la haineLutter contre la haine
Lutter contre la haine
 
Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016Gazette 5 - Samedi et Dimanche. Festival international du film 2016
Gazette 5 - Samedi et Dimanche. Festival international du film 2016
 

Kürzlich hochgeladen

Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxPrésentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxJCAC
 
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxDIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxMartin M Flynn
 
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24BenotGeorges3
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneTxaruka
 
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 37
 
Apprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursApprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursStagiaireLearningmat
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfbdp12
 
Calendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avrilCalendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avrilfrizzole
 
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 37
 
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfVulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfSylvianeBachy
 
Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Gabriel Gay-Para
 
Aux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècleAux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècleAmar LAKEL, PhD
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx   Film     françaisPas de vagues.  pptx   Film     français
Pas de vagues. pptx Film françaisTxaruka
 
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 37
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx      Film   françaisPas de vagues.  pptx      Film   français
Pas de vagues. pptx Film françaisTxaruka
 

Kürzlich hochgeladen (16)

Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptxPrésentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
Présentation - Initiatives - CECOSDA - OIF - Fact Checking.pptx
 
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptxDIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
DIGNITAS INFINITA - DIGNITÉ HUMAINE; déclaration du dicastère .pptx
 
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
Newsletter SPW Agriculture en province du Luxembourg du 10-04-24
 
Chana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienneChana Orloff.pptx Sculptrice franco-ukranienne
Chana Orloff.pptx Sculptrice franco-ukranienne
 
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
Bibdoc 2024 - L’Éducation aux Médias et à l’Information face à l’intelligence...
 
Apprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceursApprendre avec des top et nano influenceurs
Apprendre avec des top et nano influenceurs
 
Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024Bulletin des bibliotheques Burkina Faso mars 2024
Bulletin des bibliotheques Burkina Faso mars 2024
 
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdfLa Base unique départementale - Quel bilan, au bout de 5 ans .pdf
La Base unique départementale - Quel bilan, au bout de 5 ans .pdf
 
Calendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avrilCalendrier de la semaine du 8 au 12 avril
Calendrier de la semaine du 8 au 12 avril
 
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdfBibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
Bibdoc 2024 - Sobriete numerique en bibliotheque et centre de documentation.pdf
 
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdfVulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
Vulnérabilité numérique d’usage : un enjeu pour l’aide à la réussitepdf
 
Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)Faut-il avoir peur de la technique ? (G. Gay-Para)
Faut-il avoir peur de la technique ? (G. Gay-Para)
 
Aux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècleAux origines de la sociologie : du XIXème au début XX ème siècle
Aux origines de la sociologie : du XIXème au début XX ème siècle
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx   Film     françaisPas de vagues.  pptx   Film     français
Pas de vagues. pptx Film français
 
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdfBibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
Bibdoc 2024 - Les intelligences artificielles en bibliotheque.pdf
 
Pas de vagues. pptx Film français
Pas de vagues.  pptx      Film   françaisPas de vagues.  pptx      Film   français
Pas de vagues. pptx Film français
 

Index independant du web ertzscheid

  • 1. One Index To Rule Them All De Paul Otlet à l’internet des objets. Ertzscheid Olivier. www.Affordance.info. Université de Nantes. Novembre 2017. 1
  • 2. Préambule. Le web a à peine plus de 25 ans. • Aucun média n’a jamais permis de toucher autant de monde en même temps, aussi régulièrement. Aucun média n’a jamais connu autant de changements structurels en si peu de temps • En moins de 25 ans le web a changé 3 fois de nature et d’objet. • Il a changé (au moins) 3 fois d’index. 2
  • 3. Le web est AVANT TOUT une histoire d’index. A nous de faire en sorte qu’il ne devienne pas, APRÈS TOUT, une forme de mise à l’index. • LES INDEX INCONNUS. – Index des objets => ? … ? – Index du génome => ? … ? – Index des … émotions ? (web / informatique affective) • LES INDEX CONNUS. – Index des produits => Amazon (1994) – Index des adresses (URL) => Yahoo! (1995) – Index des documents => Google (1998) – Index des profils => Facebook (2004) 3
  • 4. One ring Index To Rule Them All • Des index sur les informations et les connaissances que NOUS avons produites. Des index bâtis sur des algorithmes que NOUS avons entraînés. A l’aide de données que NOUS leur avons confiées. #DigitalLabor • Ce sont les commerçants qui ont construit l’index d’Amazon : – Index des produits => Amazon (1994) • Ce sont les internautes qui ont construit l’index de Google et « formé » son algorithme – Index des documents => Google (1998) • Ce sont les internautes qui ont fait Facebook (données servitude volontaire) – Index des profils => Facebook (2004) 4
  • 5. On a donc plusieurs « problèmes paradoxaux ». « Si c’est gratuit c’est vous le produit » Si vous ne trouvez pas la solution c’est parce que c’est souvent vous le problème. • Problème 1 : Des GAFAM / NATU / BATX que tout le monde commence à raison à trouver effrayants et qui ne cachent pas leur ambition de réguler l’ensemble de la sphère commerciale mais aussi publique, régalienne, politique. • Problème 2 : Des données / pages / profils / contenus publics (ou qui pourraient rapidement le redevenir) mais qui sont captés et - paradoxalement - rendus publics uniquement par des services / acteurs privés • Problème 3 : Ces acteurs, autour de leurs index, ont fini par « propriétariser » des ressources et des individus qui avaient vocation à rester en dehors de toute appropriation, de toute « enclosure ». Et ils ont organisé leur mise en concurrence et des formes inédites de spéculation (sur la langue et le vocabulaire => cf F. Kaplan et le capitalisme linguistique) • Effet paradoxal : ces acteurs privés n’essaient même plus de garder leurs algos secrets et les mettent en Open Source (la chaîne de valeur s’étant déplacée des algorithmes aux données*) mais les acteurs publics ou associatifs n’arrivent pas à « passer à l’échelle ». Résultat => 5 * http://affordance.typepad.com//mon_weblog/2016/05/nationaliser-code-republique-algorithmique.html)
  • 6. Ceux qui veulent / peuvent changer la donne ont un très gros problème de Scalabilité / Montée en charge / Passage à l’échelle. 6
  • 7. Scalabilité / Montée en charge / Passage à l’échelle. 7
  • 8. ALGORITHMIQUES Prévisibilité Transparence Robustesse Bostrom et Yudowsky, 2011, « The Ethics of Artificial Intelligence » : « Les algorithmes de plus en plus complexes de prise de décision sont à la fois souhaitables et inévitables, tant qu'ils restent transparents à l'inspection, prévisibles pour ceux qu'ils gouvernent, et robustes contre toute manipulation. » No-Go Zones Algorithmiques 8
  • 10. On réinvente le rêve d’Otlet 10
  • 11. Réinventer le rêve d’Otlet • Il était : « l’homme qui voulait classer le monde ». – Nous avons des sociétés commerciales qui y sont parvenues ; mais sur les bases d’un capitalisme linguistique dont la version triviale consiste à dire que la langue, que les mots ont une valeur marchande qui l’emporte sur leur sens et a pour seule vocation de permettre la mise en concurrence de ressources et d’individus et à s’enrichir de la spéculation qu’ils organisent et contrôlent. • Il pensait que le document, que la documentation avait un rôle déterminant à jouer dans la pacification du monde. – Nous avons des sociétés qui dessinent le projet politique fasciste de nouveaux « sous-hommes » sans documents (http://affordance.typepad.com/mon_weblog/2017/02/undocumented-men.html) face à de nouveaux « sur- hommes » sur-documentés. 11 Source de l’image : http://globalnation.inquirer.net/119385/undocumented-california-youth-can-get-health-care-but-many-dont-know-it
  • 13. On crée un index in-dé-pen-dant. • C’est quoi l’idée ? Recréer les conditions d’une concurrence algorithmique saine. • Pas de concurrence car impossible (trop coûteux) pour « petits acteurs industriels » de maintenir un index complet et à jour du web (sauf pour Google et Microsoft) => Monopole => TINA (There Is No Alternative) => En attendant Godot un Google Killer qui ne viendra pas. • Pour recréer les conditions d’une concurrence il faut, pour le web, un index indépendant, qui réponde à 3 conditions : – être ouvert et accessible à tout le monde. – à des conditions équitables (= Accès à l’index gratuit + accès payant à l’API sauf pour projets « non-profit »). – l’accès doit être « complet » (on doit accéder au texte intégral, pas simplement à une « vue » du document). Il ne doit pas y avoir de « limites » à l’extraction de documents. • Lewandowski : « an ideology free-ranking algorithm is not possible and would also not be desirable. (…) We should trive for diversity achieved through multiple ranking algorithms competing against one another. » 13 « Why we need an independant index of the web » https://arxiv.org/abs/1405.2212 Mai 2014.
  • 14. Pourquoi ce n’est pas si compliqué que ça ? (et pourquoi c’est urgent aussi …) • TECHNIQUEMENT • Parce que toutes technos du web sont dans le domaine public depuis le 30 Avril 1993. • Parce qu’en plus la plupart des algos et des technos d’IA portées par les GAFAM sont aussi en Open Source. • CÔTÉ CONTENUS • Parce que plusieurs pièces du puzzle n’attendent que d’être rassemblées : Hathi Trust (copie suffisamment significative de la base de donnée Google Books), fondation Internet Archive, Common Crawl, Dépôt légal du Web, Gallica / BnF, INA, Archives Ouvertes, WorldCat … + ressources propres (des archives et des bases de données de chaque titre de presse nationale, de PQR, de chaque bibliothèque, de chaque université, de chaque entreprise, etc). • SOCIOLOGIQUEMENT ET POLITIQUEMENT • Parce que les gens sont (presque) prêts. Ils ont en tout cas conscience du problème. • COMMERCIALEMENT • Parce qu’une offre alternative existe (Qwant, CHATONS, Framasoft, Degooglisons, DuckDuckGo) et a besoin de passer à l’échelle • OUI MAIS ÇA VA COÛTER CHER … • Oui. Mais on a l’argent. Et ça vaut le coup non ? • Et puis … 14
  • 15. 15
  • 16. Paul Otlet n’est pas vraiment arrivé à réaliser son rêve mais il nous a laissé ça : • « Les buts de la documentation consistent à pouvoir offrir sur tout ordre de fait et de connaissance, des informations documentées : 1. universelles quant à leur objet 2. sûres et vraies 3. complètes, 4. rapides, 5. à jour 6. faciles à obtenir 7. réunies d’avance et prêtes à être communiquées, 8. mises à la disposition du plus grand nombre ». 16
  • 17. Si nous n’arrivons pas à réaliser le rêve d’Otlet • Nous aurons des informations uniquement 1. universelles quant à leur objet 2. sûres et vraies 3. complètes, 4. rapides, 5. à jour 6. faciles à obtenir 7. réunies d’avance et prêtes à être communiquées, 8. mises à la disposition du plus grand nombre • Nous aurons donc raté l’essentiel. 17
  • 18. Et c’est déjà très problématique. 18• https://www.theguardian.com/commentisfree/2016/dec/11/google-frames-shapes-and-distorts-how-we-see-world On est passé du problème du jaguar (comment choisir un sens plutôt qu’un autre) au problème de l’holocauste (comment savoir ce qui a du sens). Les algorithmes n’y arriveront pas seuls. Et il ne faut pas laisser ces enjeux aux seules mains des GAFA. Il nous faut un index indépendant du web. Envisagé comme un commun de la connaissance à part entière.
  • 19. Index des documents Index des profils Index indépendant ;-) 19Merci de votre attention Moralité ?