Data analytics beyond data processing and how it affects Industry 4.0
Le Web Sémantique et les Données Liées : Principes et Applications
1. Le Web Sémantique et les Données
Liées: Principes et Applications
Mathieu d’Aquin
@mdaquin – http://mdaquin.net
Knowledge Media Institute, The Open University
6. Lié comment ? Retour aux sources
Open University
Website
Open University
VLE
Le Web
M366 Course
page
Mathieu’s
Homepage
Mathieu’s
List of Mathieu’s
Publications Twitter
12. Exemple (super simple)
Carte interactive des
bâtiments de l’Open
University en
Angleterre
13. data.open.ac.uk
name
“Berrill
building”
bat1
Milton
Keynes
bat1-‐
address
inDistrict
inCounty
Postcode-‐
mk76aa
Buckingh
Espaces
amshire
Etages
loca4on
Mk76aa-‐
Bâ4ments
loca4on
ID
Address
Code
lat
long
postal
52.024924
-‐0.709726
data.ordnancesurvey.co.uk
14. Autre exemple (toujours simple)
Academics in “Arts and Humanities” Topics most commonly mentioned by
most often involved with the media (in news outlets own by the BBC (in
number of news items)! number of news items)!
From dataset about
From news From dbpedia.org
our researchers
clipping data
15. Challenges
• Créer des liens !
– S’assurer que les URIs (adresses web de référence sont
facile a découvrir
– Données liables à données liés
– Outils pour la création automatique de liens
(e.g. Silk, KnowFuss - http://technologies.kmi.open.ac.uk/knofuss/)
• Intégration
– Trouver les données
– Comprendre les données (ce qu’elle peuvent faire)
– Travailler avec des données distribuées et hétérogènes
• Sémantique ?
16. Le Web Sémantique
rNews!
Music
Ontology! Geo
Ontology!
SIOC! Media
Ontology!
Dublin
Core!
DBPedia
FOAF!
Ontology!
DOAP!
FMA BIBO!
Ontology!
LODE!
Gene
Ontology!
17. Le Web Sémantique
Ontologies !
Schemas pour le données (liées)
Modèles formels pour le raisonement
Connaissances du domaine sur le Web
20. Exemple : Analyse de logs de servers web
(voir uciad.info)
Utilise une ontologie
des activités sur le
Web pour:
- Intégrer des logs de
plusieurs systèmes
- Présenter les
activités d’un
utilisateur à cet
utilisateur
- Raisonner sur ces
activités pour en
fournir une
agrégation
personnalisée
21. User Centric Activity Data
Ac4vity
analysis
Consolida4on
for
and
by
Integra4on
Ontologies
individual
users
Interpreta4on
Logs
2
Logs
4
Logs
1
Logs
3
Website
2
Website
4
Website
1
Website
3
Organisa4on
Users
23. Challenges
• Contrôle
– Peut-on vraiment faire quelque chose avec des
connaissances qui proviennent du Web
(voir Sabou et al. @ ISWC2007)
• Trouver, connecter, sélectionner, combiner des
connaissances
– Semantic Web Search Engines
(Sindice, Swoogle, Watson - http://watson.kmi.open.ac.uk - d’aquinmotta @
Semantic Web Journal – d’Aquin et al. @ Semantic Technology Handbook)
– Alignement d’ontologies
– …
• Connaissances a l’échelle du Web
àApplications intelligentes ?
24. Applications intelligentes sur le Web
Peut on réutiliser les principes des systèmes à
base de connaissances pour le Web sémantique ?
NLP!
Data Mining!
Information! Recommender!
retrieval! Systems!
Données/Information/Connaisances sur le Web Sémantique
28. Resources URIs Similarity-
Interface
+ common topics
Based Search
BBC Programme or iPlayer page
Resource
descriptions
Indexes
Synopsis
Named Entity Semantic Entities Semantic
Recognition
(Dbpedia)
Indexing
Podcasts, Indexes
OpenLearn Units
and Articles
data.open.ac.uk
Semantic Index
30. Plus d’exemples
Scarlet – Alignement
d’ontologies avec des ontologies
intermediaires en ligne
Natural language question answering
Avec des données et ontologies du Web
Evolution automatique
d’ontologies
Detection et
Semantisation automatique de utilisation de
folksonomies
relations entre
ontologies
31. Challenges
• Comprendre ce que l’on peut faire avec les
connaissances et données trouvées sur le
Web
(voir Daga @ ISWC 2012 doctoral symposium,
d’Aquin Motta @ KCAP 2011)
• Réconcilier données a grande échelle,
hétérogénéité et l’interprétation des résultats
• Comprendre les différents points de vue
(voir d’Aquin @ K-CAP 2009)
• Boucler entre émergence de connaissances a
partir des données et modélisation
ontologique des données et connaissances
(voir d’Aquin et al. @ Know@LOD 2012)
32. Conclusion
• Linked Data est un
mechanism simple
d’asbtraction : enlever les
barrieres et silos
technologiques a l’echange et
la reutilisation des données
• Ca marche !
• Mais ce n’est que la premiere
couche qui ouvre un chemin
vers les promesses du Web
Sémantique
33. Merci !
Plus d’info :
@mdaquin
m.daquin@open.ac.uk
http://mdaquin.net