3. Données, etc.
(selon les résumés des présentations)
Base de données (di Filippi)
Contenus, contenus numériques (Bermès, Domange)
Document (Peccatte, Simon)
Données, data, données ouvertes, open data
(Aillagon, Artin, Bermès, di Filippi, Labelle & Holken,
Nepote, Simon Vernet)
Information (Artin, Domange, Peccatte)
Rédactionnels, monographies, œuvres d'art,
photographies, témoignages (Bekkers)
Ressources, ressources numériques
(Aillagon, Bermès, Simon)
4. Actions sur les données ?
(selon les résumés des présentations)
Accès (Domange)
Appropriation (Aillagon)
Consommation (Aillagon)
Diffusion (Aillagon, Bermès, di Filippi)
Exploitation (Simon)
Exposition (Simon)
Indexation (Peccatte)
Mashup (Artin)
Mise à disposition (Domange)
Navigation (Bermès)
Ouverture (Intro, Simon, Vernet)
Partage (Bekkers)
Réutilisation (Intro, di Filippi, Simon)
Restitution (Artin, Bekkers)
Usage (Aillagon, Vernet)
Valorisation (Aillagon)
5. Opérations informatiques majeures
Stockage
Recherche, accès
(et quelques autres...)
Types de données
Textes
Nombres et visualisations de nombres
Sons
Images fixes
Images animées
Structures (tables, triplets, etc.)
6. Deux notions importantes à ajouter
Programmation
✔
implicite car les données dont nous parlons
sont numériques
Métadonnées (≈ description des données)
✔
implicite car les métadonnées sont des
données
7. Le projet "Digital Public Library of America"
Les données sont documentarisées à travers les métadonnées ?
8. Recherche de texte
Une phrase énigmatique
« Tap da sac'h 'ta, breur kozh »
???
9. Recherche de texte
« Tap da sac'h 'ta, breur kozh »
Prends donc ton sac, vieux frère
Poème de Youenn Gwernig (en breton)
13. Reconnaissance de musique
Des logiciels grand public comme Shazam ou SoundHound
permettent de reconnaître des mélodies
14. Culture et mémorisation
La culture ne peut plus être considérée comme une
accumulation passive de connaissances diverses
La reconnaissance des œuvres peut être efficacement
simulée par des algorithmes
Thèse faible
✔
Ces applications Internet ne constituent qu'une
extension de notre mémoire
Thèse forte
✔
Notre rapport au savoir et à la culture est profondément
modifié par les nouvelles possibilités informationnelles
15. "Penser en objets" - Background
Philosophie
✔
Ontologie (plutôt analytique...)
✔
Philosophie de l'information (Luciano Floridi)
Informatique
✔
Représentation des connaissances [ontologies]
✔
Programmation par objets
17. L'information – un concept très complexe
théories de l'information (plusieurs)
information sémantique
information physique
information biologique
information économique
SIC: Sciences de l'information et de la communication
etc.
Informatique :
traitement des données, traitement de l'information
18. Théories de l'information
Théorie de Shannon (1948)
Théorie algorithmique de l'information
✔
Solomonov, Kolmogorov (années 1960)
✔
Chaitin
✔
etc.
19. Théorie algorithmique de l'information
(grosso modo...)
Évaluation de la complexité d'une suite de signes S
≈ quantité d'information
Une suite de signes est toujours le résultat de l'exécution
d'au moins un programme
✔
À la recherche du temps perdu
✔
print "Longtemps, je me suis couché de bonne
heure, etc."
La quantité d'information d'une suite S est la longueur du
plus court programme qui engendre S
20. Conception sémantique de l'information
Donnée = défaut d'uniformité représentable à
l'aide de symboles
Information = Données + Interprétation
21. Objet computationnel et Objet informationnel
Objet computationnel (informatique)
✔
collection de données numériques (informatiques)
brutes formant un tout
Objet informationnel
✔
collection structurée d'informations
(pas obligatoirement numériques) formant un tout
✔
un objet informationnel numérique est un objet
informatique
(mais l'inverse n'est pas toujours vrai)
22. Un objet computationnel est une instance de classe
Old cars all in a neat row, by deflam, Creative Commons
http://www.flickr.com/photos/freeparking/502609973/
23. Méréologie
Petite typologie des objets informationnels
objet informationnel = collection structurée d'informations formant un tout
auquel on accède à travers une ou plusieurs de ses parties
objet informationnel [o. i.]
► o.i. immatériel
► o.i. numérique
► o.i. numérique du Web
► o.i. numérique du Web recherchable
► o.i. numérique du Web recherchable
par une ou plusieurs de ses parties
Aspect méréologique des objets informationnels numériques
(la méréologie est l'étude des relations entre la partie et le tout)
24. La hiérarchisation des objets
informationnels sur le Web
ressource
ressource
ressource
ressource
ressource
ressource
ressource
Liste de ressources dont on ne consulte que le haut.
vue sur Google ≈ rasoir d'Occam
25. Représentation des textes - codage Unicode
Important et "invisible": Unicode Collation Algorithm (UCA) algorithme
définissant un ordre normalisé pour le tri, la reconnaissance et la
recherche de texte
26. Représentation des sons et des images –
empreintes (fingerprints)
Une empreinte acoustique d'un son (ou une empreinte
visuelle d'une image) est une représentation simplifiée
d'un signal audio (ou vidéo)
Conception unifiée mettant en œuvre des méthodes
d'accès aux objets à partir de fragments
27. Méthodes d'accès
Algorithmes
✔
sur des classements, des hiérarchisations et valorisations
✔
sur des représentations textuelles directes (codages) ou
indirectes (contextes de publication, métadonnées)
mais en fait, nommer ou décrire, c'est déjà classer
✔
sur des représentations d'objets ou de fragments d'objets
(empreintes)
Accès aux objets
≈ détermination des parties communes
28. Puissance (et limite) du calcul
"Calculabilité externe"
Les objets informationnels numériques sont
construits pour être ordonnés, recherchés et
retrouvés, comparés et reliés entre eux
Les recherches d'informations quelconques peuvent
alors s'effectuer "mécaniquement"
29. Puissance (et limite) du calcul
"Calculabilité interne"
Exemple Computable Document Format de Wolfram
30. Le document devient objet informationnel
Document Objet informationnel
Indexation, Méthodes d'accès
métadonnées
Statique Calculé, dynamique
Localisé Non localisé
Ce n'est pas seulement la mémoire humaine qui est
impactée par le Web.
C'est notre conception même de la culture.
31. Objection 1 : Ce n'est que du calcul
Réponses
La théorie algorithmique de l'information lie les
concepts d'information et de programme
Les propositions pour lesquelles il existe une
démonstration [un algorithme] constituent une classe
bien particulière
Il est remarquable que l'on puisse répondre à une
question en mettant en œuvre un algorithme sur un
corpus de données
32. Objection 2: Les humains ne fonctionnent pas ainsi
Grief semblable formulé à l'encontre du programme de l'Intelligence
Artificielle dans les années 60
Big Mouth by angel_shark, (Flickr, Creative Commons) / Cyana by Ifremer, (Wikimedia Commons)
« Se demander si un ordinateur peut penser n'a pas plus d'intérêt
que de se demander si un sous-marin peut nager. » Edsger Dijkstra
33. Émergence ?
Apparition de nouvelles informations qui s'agglomèrent
aux objets informationnels sur le Web, provoquée par:
✔
l'interconnexion de ressources diverses
✔
l'ouverture aux ressources dans des langues
inconnues auparavant inaccessibles
✔
l'insertion dans des flux informationnels
✔
la sérendipité (capacité de découvrir quelque chose
sans l'avoir cherché)
L'émergence en ontologie: apparition de nouvelles
propriétés des objets au delà d'une certaine complexité
34. Émergence et cultures
Émergence d'applications et d'usages nouveaux lors de
l'ouverture des données
Cultures: organisations selon des propriétés
émergentes de la masse informationnelle rendue
intelligible par des méthodes d'accès diverses
Une multiplicité de cultures émergent et remplacent
une culture classique normative
Vers une "pluralité et une relativité" des ontologies
culturelles (?)