Portails documentaires et référentiels du Web sémantique : exemples et enjeu...
Archilab 2013
1. Le numérique au-delà du naturalisme
et du nihilisme.
Penser les objets sur le Web
Alexandre Monnin, PhD
Chercheur associé @Inria
Membre du réseau d’experts Open data d’Etalab
Co-chair du « PhiloWeb » community group (W3C)
Organisateur des « Rencontres du web de données » Meetup
Twitter: @aamonnz/@PhiloWeb, URI : web-and-philosophy.org
2. Métadonnées et objets numériques :
dénaturalisation & re-naturalisation
Crédit image : Metadata is a Love Note to the
Future, @kissane
3. Préalable
• Pas de définition canonique des métadonnées
• Caractéristique relative et non absolue : une
métadonnée qualifie une autre donnée, ou un
document
• Les rôles s’échangent aisément, ce qui n’est pas le
cas avec la notion de métalangage par exemple
• Ne pas confondre trace et métadonnées (la trace
pour être exploitable nécessite un modèle de
données – des métadonnées)
5. La même chose sur le Web ?
?
Schéma : Nicolas Delaforge
6. Contre le naturalisme, le nihilisme* ?
Réduction à la trace binaire, « ressource anonyme », désémantisée :
- fragmentation / recombinaison : puisque le numérique repose sur la discrétisation et la
manipulation, il en résulte que toute réalité touchée par le numérique sera réduite en unités
vides de sens sur lesquelles des règles formelles de manipulation seront appliquées. La
discrétisation fragmente la réalité considérée, la manipulation la recombine, fragmentation
et recombinaison se faisant de manière arbitraire par rapport à la nature de la réalité
considérée, à son sens ou à sa signification. Les unités auxquelles aboutit la
discrétisation, les entités reconstruites par la recombinaison sont définies de manière
totalement arbitraire par rapport à la nature des contenus considérés ;
désémantisation / ré-interprétation : de même, la discrétisation implique une rupture avec
la sémantique propre aux contenus manipulés. Il en résulte donc une désémantisation, une
perte de sens, qu’il faudra gérer à travers un processus de re-sémantisation explicitement
assumé. Sinon, la numérisation, comme on le voit très souvent aujourd’hui, est vécue
comme une perte de sens, une montée de l’arbitraire technicien.
(Bruno Bachimont, Le sens de la technique : le numérique et le calcul, p. 160)
Autre ex : la grammatisation remplace l’ontologie chez Stiegler
* Au sens de la métaphysique analytique (les objets « n’existent » pas)
9. Du numérique en général à
l’architecture du Web en particulier
10. 3 composantes de l’architecture du web
• identification (URI) & adressage (URL)
http://www.inria.fr
http://ns.inria.fr/fabien.gandon#me
ldap://[2001:db8::7]/c=GB?objectClass?one
• communication / protocole (HTTP)
GET /centre/sophia HTTP/1.1
Host: www.inria.fr
User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de)
AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4
Safari/523.10
Accept-Encoding: gzip
Accept: text/html,application/xhtml+xml,application/xml
Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3
Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7
Referer: http://fabien.info/
• langage de représentation (HTML / RDF)
Fabien travaille chez <a href="http://www.inria.fr">Inria</a>
<http://www.inria.fr> foaf:member data:fabien
11. 3 fonctions
• identification des ressources (URI)
• accès aux représentations (HTTP URI)
• Encodage des représentations (HTML , RDF,
etc.)
12. Les métadonnées et le HTTP Range 14
Surtout ! ne parlons pas du HTTP-Range 14!
Code HTTP
200 (OK)
303 (voir
autre)
4XX, 5XX
(erreur)
Résultat
… Ils en ont parlé
Indication
Ressource informationnelle (IR) et
Représentation
non informationnelle (NIR) ?
Tout type de ressource notamment
URI
des NIR
Message
Aucune déduction possible
d’erreur
13. Le style d’architecture REST
La ressource
«
L’état de la ressource
L’état représentationnel de la
ressource, d’où l’acronyme REST
Ceci explique pourquoi il n’y a pas à proprement parler de lien sur le Web avant l’apparition d’un
acteur comme Google (pourquoi le Web est « devenu un hypertexte »). En lieu et place des liens, on ne
trouve en effet que des pointeurs vers des ressources à l’intérieur de représentations d’autres
ressources (pointeurs qui sont susceptibles à leur tout de ne pas être déréférençables, ou l’inverse de
donner accès à une multitudes de contenus variables, et donc quoi qu’il arrive, de ne pas connecter
deux relata).
»
14. A une URI ne correspond jamais une
« page »
Negociation de contenu
client
http
serveur
L’ancêtre: System 33 (1991-1993)
Servicing
Client
Application
Computers
Psychophysically
equivalents
RPC
Rendering
service
Electronic
documents
Other encoding
formats
appearences database
15. Les mêmes métadonnées au-delà du HTTP
Range 14
• communication / protocole (HTTP)
GET /centre/sophia HTTP/1.1
Host: www.inria.fr
User-Agent: Mozilla/5.0 (Macintosh; U; Intel Mac OS X; de-de)
AppleWebKit/523.10.3 (KHTML, like Gecko) Version/3.0.4
Safari/523.10
Accept-Encoding: gzip
Accept: text/html,application/xhtml+xml,application/xml
Accept-Language: en,en-us;q=0.8,fr;q=0.5,fr-fr;q=0.3
Accept-Charset: ISO-8859-1,UTF-8;q=0.7,*;q=0.7
Referer: http://fabien.info/
Les métadonnées spécifient une variété très importante de formats de
représentations : il s’agit moins de réaliser un objet informationnel sans pertes
que de multiplier les prises sur l’objet/ressource (cf. ci après)
16. Sur le Web, pas de « ressources
anonymes » = montée en généricité
Nom
Métadonnées
Données
structurées
Importance de « l’engagement éditorial »
(Monnin, Gandon, Delaforge) : identifier et individuer des objets +
générer et donner accès à leurs représentations
17. Du document à la ressource
Ressource :
Manipulation indirecte
«…»
locus
Bruno Bachimont : Archivage audiovisuel et numérique: les enjeux de la longue durée
18. Les ressources sont des ombres :
not a bug but one of the Web’s
greatest features
“7.1.2 Manipulating Shadows. Defining resource such that a
URI identifies a concept rather than a document leaves us
with
another
question:
how
does
a
user
access, manipulate, or transfer a concept such that they can
get something useful when a hypertext link is selected? REST
answers that question by defining the things that are
manipulated to be representations of the identified
resource, rather than the resource itself. An origin server
maintains a mapping from resource identifiers to the set of
representations corresponding to each resource. A resource
is therefore manipulated by transferring representations
through the generic interface defined by the resource
identifier.”
20. Echec de la référence ?
Identification
Inaccessibilité
Monde
URI
Accès
Autothéticité
Monde
Pas de salto mortale (B. Latour) à condition de ne
pas négliger les médiations (référentialisation)
22. De la référence à la référentialisation
(les objets sont des « ombres »)
“the presence of an object inherently involves its absence. The reason is simply the standard one:
in order for a subject to take an object as an object, there must be a separation between them –
enough separation to make room for intrinsic abstraction, of detachment, of stabilization. So it is
essentially an ontological theorem of this metaphysics that no object, for any given subject, will be
wholly there, in the sense of being fully effectively accessible. Or, to put it more carefully: in order to be
present ontologically – i.e., in order to be materially present – an object must also be (at least partially)
absent metaphysically, in the sense of being partly out of effective reach.” (Brian Cantwell Smith)
De même qu’un objet n’est jamais entièrement présent, une ressource n’est jamais
entièrement accessible, seules ses « représentations » le sont – en tant que
coupes de trajectoires. De nombreux philosophes considèrent que le monde ne se
compose pas d’objets prédéfinis, pré-individués (au sens de « déjà individué »,
prêt-à-individuer), en attente d’être désignés ou nommés.
Or, selon les conceptions précédentes, ce que l’on désigne, ce sont davantage des
régularités, des patterns, qui demandent à être préservés et maintenus (cf.
« l’ange de l’œuvre » chez Etienne Souriau). Comme chez Bruno Latour, la question
est bien celle de la subsistance qu’aucune substance ne vient garantir. La
subsistance est gagée ici sur un rapport indirect et régulier aux représentations : cf.
l’idée de « continuation réticulaire » de Justin Erenkrantz
Les métadonnées spécifient une variété très importante de formats de
représentations : il s’agit moins de réaliser un objet informationnel sans pertes que
de multiplier les prises sur l’objet/ressource, autrement dit, de l’instaurer de
manière plurielle
23. « Il faut désormais varier les prises »
(Claude Imbert)
L’instauration (E. Souriau)
… l’existence accomplie n’est pas seulement un espoir, elle correspond à un
pouvoir. Elle exige un faire, une action instauratrice. Cet être accompli dont je
parlais tout à l’heure, est œuvre à faire. (…) il en est ainsi de toute chose. J’ai
dit : cette table, ces murs sont dans une condition semblable et telle qu’on ne
puisse répondre à la question : « Ceci existerait? » que par Plus ou Moins, non
par Oui ou Non. Et vous me direz peut-être que j’ai tort, ou que j’exagère, ces
choses ayant une existence physique, positive, non susceptible de plus ou
moins, et telle qu’il faille bien répondre : physiquement, oui, ces choses
existent. (…) je dis que cette table, malgré sa suffisante existence
physique, reste encore à peine ébauchée, si je songe aux accomplissements
spirituels qui lui manquent. (…) Si bien que si cette table physiquement est
faite, par le menuisier, elle est encore à faire, en ce qui concerne l’artiste ou le
philosophe.
(Etienne Souriau, De l’œuvre à faire)
25. Les ressources : sociétés* & régularités
DNS, TCP/IP, Web
http://mon.org/ma/ressource
règles négociation
calculs
composition
rendu
…
…
* Au sens de Whitehead ou Tarde
…
…
…
…
…
…
26. Bilan
• Les ressources sont les objets quelconques de l’architecture du Web
• Des ombres rétives : cf. le « faire faire agir » de la régularité
(comme conformité)
• Dotées d’une agency distribuée au-delà du sujet et de l’objet : les
ressources comme sociétés et l’importance des médiateurs pour la
référentialisation (vs. la référence)
• La régularité s’entend également au sens de la continuation
réticulaire qui caractérise la ressource au titre de la subsistance
• Dialectique de la présence (représentations/coupe) et de l’absence
(ressources/objet),
• Importance du caractère constitutivement inachevé des
objets/ressources/règles (« trajets » risqués plutôt que « projets » :
pas d’anticipation du suivi de la règle au sens de Wittgenstein, pas
de « futurité » au sens de Souriau – des objets non faits mais à
faire…)