Using Semantics to Improve Corporate Online Communities
Ontologies et Web 2.0 : une Expérimentation en Entreprise
1. Ontologies et
Web 2.0 :
Une
expérimentation
en entreprise
Alexandre Passant : EDF R&D / LaLIC – Paris-Sorbonne
Philippe Laublet : LaLIC – Paris-Sorbonne
1 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ IC2007
2. Web 2.0 …
• Remettre l’utilisateur comme producteur au centre des outils
• Faciliter la publication et les échanges d’information
• Blogs, wikis …
• Systèmes de partage d’information et de documents
• Popularisation de RSS comme format d’échange
• « Tagging » pour la catégorisation de l’information
• Taggage collaboratif largement répandu comme activité sociale
• Folksonomies (Vander Wal 2004)
• Etude des phénomènes de convergence …
2 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
3. « Logiciels sociaux » : quelques exemples …
• Plateforme de blogs (Blogger)
• Partage de photos (Flickr)
• Partage de vidéos (YouTube)
• Bookmarking collaboratif (Delicious)
• Encyclopédie ouverte (Wikipédia)
• Réseaux sociaux (LinkedIn)
• Agrégateur RSS (FeedBurner)
• Homepage personnelle (Netvibes)
•…
3 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
4. Le Web 2.0 en Entreprise
• Objectifs du projet
• Faciliter
• La consultation d’information externe (flux RSS)
• Le partage d’informations internes (blogs personnels)
• La mise en place de connaissances pérennes (wikis thématiques)
• Remettre en cause l’asymétrie de l’information
• Limiter l’adhérence au mail et à la diffusion restreinte d’informations
• Migration des systèmes classiques vers des intranets «2.0»
• Contraintes organisationnelles
• Quel intérêt à partager ses connaissances ?
• Peur de l’ouverture des wikis
4 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
5. Le projet Athena (EDF R&D)
• Une plateforme Web 2.0 pour l’intelligence collective
5 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
6. Web 2.0 et Web Sémantique au sein d’Athena
• Bénéficier des qualités des deux approches
• Facilité d’utilisation et forte acceptabilité des outils et des concepts
sociaux (Web 2.0)
• Formalisation, consensus, Inférences, requêtes (WS)
• Eviter les inconvénients des deux approches
• Résultats de recherche dépendants des tags (Web 2.0)
• Obliger tous les utilisateurs à accéder à l’ontologie et à modéliser la
connaissance de façon formelle (WS)
6 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
7. Problèmes d’hétérogénéité
• Dans les textes (appellations, …)
• Des tags
• Des outils
• Blogs
• Wikis
• Flux RSS
7 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
8. Problèmes d’hétérogénéité dans les textes
• Problématiques des documents « Web 2.0 »:
• Une majorité d’outils non structurés (blogs, wikis …) et en texte libre
• Abbréviations, acronymes
• Synonymes …
• Variations morphologiques, typographiques
• Recherche d’information « plein texte »
• Nécessité d’élargir manuellement la recherche d’information aux
différentes normalisations d’une même notion … et donc de les
connaître à priori !
8 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
9. Problèmes d’hétérogénéité des tags
• Utilisation partagée de mots-clés libres ou tags
• Flickr, del.icio.us
• Association libre (en nombre et en type) de mots-clés aux documents pour
les catégoriser et regrouper
• Composante sociale : émergence de folksonomies
• Différents problèmes
• Les mêmes …
• Un mot-clé pour plusieurs notions (peu fréquent dans notre cas)
• « Apple » … ?
• Une notion pour plusieurs mots-clés
• « Semantic Web », « SemWeb » …
• Dépend fortement de la pratique et de l’expérience de tagging de chacun
9 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
10. Une seule notion … une multitude de tags
10 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
11. Combinaison des 2 hétérogénéités
• Billets de blogs taggés:
• Hétérogénéité au niveau des textes et des tags
• Nécessité d’une indexation unique pour retrouver l’information
11 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
12. Utilisation d’ontologies pour gérer l’hétérogénéité
• Solution ?
• Etablir un lien entre documents et classes / instances d’une ontologie du
domaine afin de palier aux problèmes de recherche d’information
• Moyens
• Une notion, plusieurs formalisations
• Un concept de l’ontologie est associé à un certain nombre de marques qui
peuvent être des labels (rdfs:label) ou des tags (tag:hasTag)
• Marque (C) = {Label(C)} U {Tag(C)}
• Marque (EDF) = {EDF, Electricité de France, …}
U {company_EDF, elec-edf, …}
• Distinction nécessaire entre label - admis par tous - et tag – vision
personnelle.
12 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
13. Représentation
• Lien entre concept (classe ou instance) et un ensemble de
tags et labels associés
13 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
14. Du document à l’ontologie
• Propriété sioc:topic pour établir le lien entre données
sources (billet de blog, page wiki …) et ontologie
• Interface de validation pour éviter et résoudre l’ambiguïté
• Création contrôlée de nouvelles instances
14 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
15. Mise en place de la solution
• Modélisation de l’ontologie
• Analyse des tags pour définir les instances nécessaires
• Extension d’ontologies existantes (FOAF, DOAP, geonames …)
• Adaptation et création d’ontologies du domaine
• Mélange d’approche Top-down et Bottom-up
• Intégration des billets
• SIOC (Breslin et al. 05)
• Interface d’association entre tags et ontologie
• Stockage et interrogation des données
• Entrepôt RDF pour centraliser les données produites
• Plug-ins de navigation et de recherche greffés sur l’interface SPARQL
(Parsia 06)
15 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
16. Vers une recherche sémantique d’information (1/2)
•Deux grandes étapes
• 1) Proposition des concepts de l’ontologie incluant dans leur label
ou tag le terme de recherche
• Permet d’affiner et désambiguïser la recherche
• « EDF » => « EDF », « EDF R&D », « EDF Energy » ?
• 2) Recherche des documents en fonction du concept déterminé et
non plus du mot-clé (et des propriétés des concepts)
• Identifie l’ensemble des documents quelque soit le tag ou label
d’origine
16 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
17. Vers une recherche sémantique d’information (2/2)
• 1) Validation du terme recherché
• 2) Récupération des billets concernés
• Gestion de l’hétérogénéité des mots-clés d’origine
17 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
18. Extension des possibilités de recherche
• Utilisation de l’ontologie, des instances, et des relations pour
aller plus loin dans la recherche d’information
• Instances de la même classes, propriétés communes …
18 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
19. Conclusion
• L’ontologie permet de résoudre une partie des problèmes d’hétérogénéité
posés par les applications Web 2.0
• Approche utilisant des technologies standard et ouvertes (RDF, SPARQL,
FOAF …)
• Travaux à développer :
• Indexation semi-automatique et sémantique des flux RSS
• Extension des possibilités de suggestion d’information
• Amélioration de nouveaux outils (wikis …) pour le peuplement d’ontologie
• Médiateur pour les différents outils du Web 2.0
• Pour l’accès à l’information …
Alexandre PASSANT, Jean-David STA, Philippe LAUBLET, Folksonomies, Ontologies and
corporate blogging, in Blogtalk reloaded – Social Software, Research and Cases, T.N.Burg,
J.Schmidt (eds), Herstellung : Books on Demand GmbH 2007.
19 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007
20. Web 2.0 et WS : d’autres questions
• Dériver une sémantique émergente des interactions
collaboratives du Web 2.0 ?
• Entre autres du marquage collaboratif (folksonomie)
• Modéliser cette sémantique émergente dans des ontologies ?
• Gérer les évolutions des documents et des … tags ?
• Faire bénéficier les applications collaboratives des
ontologies et des technologies du WS
20 2 Juillet 2007 Ontologies et Gestion de l’Hétérogénéité Sémantique @ AFIA-2007