SlideShare une entreprise Scribd logo
1  sur  57
Télécharger pour lire hors ligne
Web 3.0 Hosting & Factory
Karima Rafes, BorderCloud
30/11/2015
Le Web des données
L’introduction aux ontologies
et au Web sémantique
2
Sommaire
1. Historique du mouvement
2. Définition
3. Qui en a besoin ?
4. En avez-vous besoin ?
5. Le Web des données était utopique.
6. Le Web sémantique est-il encore utopique ?
1. Historique du mouvement
4
Si on reliait tous les documents sur Internet !?
Et le Web fut ?
1989
Le concept
"informations liées"
apparaît dès les
origines.
{
Dès ses origines, le Web n’avait pas la finalité de relier
seulement des documents mais de relier les informations.
En 1999, le concept de Web sémantique est créé/structuré
pour décrire la finalité du Web mais le concept fut mal
compris et souvent détourné.
7
Objectif du
Web sémantique
Pouvoir créer de nouvelles connaissances
avec l’aide de machines.
Iron Man
8
Le Web des données…
en route vers le Web sémantique
2000
2015
Web des données
Linked Data
En 2025-30, le Web sémantique ?
Travaux de
recommandations
en cours
En 2006, on crée un point d’étape au Web sémantique que l’on
nomme le Web des données ou Linked Data. Ce concept offre un
objectif plus simple à comprendre/expliquer et moins utopique car il
est de + en + facile de faire des démonstrations.
9
Objectif du
Web des données
Pouvoir accéder aux informations disponibles
avec l’aide de machines.
Cortana
2.Définition
Du chaos naîtra l’ordre…
11
Définition :
le Web de données
ou Linked Data
Initiative visant à favoriser la publication de données :
Interopérables à l’aide d’un modèle commun pour
représenter une information
Structurées à l’aide d’ontologies
Accessibles à travers le Web
Reliées entre elles pour constituer un réseau global
d'informations
12
Historique
Le lancement de l'initiative, en 2006, avait pour objectifs de :
• promouvoir une vision du Web comme
une base de données globale
• naviguer à travers les données sur le Web
de la même façon que l'hypertexte permet de relier des
pages Web
Le Consortium World Wide Web (W3C) à travers cette
initiative, poursuit sa mission qui est d’assurer au Web une
croissance à long terme
3. Qui en a besoin ?
1 Prise de
conscience
Il est impossible de
traiter humainement
l’information
disponible sur le Web.
2 Besoins
Les donneurs d’ordres
demandent des solutions pour
prendre de meilleurs décisions
sans manipulations
extérieures.
3 Diffusion
Le Linked Data permet l’accès aux données sans
intermédiaires et de manières décentralisées. La
technologie se diffuse dans les laboratoires et les
institutions gouvernementales.
4 Disponibilité (en cours)
Les données sont de plus en plus
accessibles, de plus en plus liées et
mises à jour en temps réel.
5 Réutilisation
Les données sont maintenant
réutilisables à travers toutes
les machines sans
intermédiaires.
Le Web des données permettra…
la réutilisation de toutes les données
WoT
RDF
Sciences City
Open
Data
Web
Agent
datadata
Faciliter
l’intégration de
Web Agent
pour aider les
humains dans
cet océan de
données
Le Web des données permettra…
l’émergence des Web agents
4. En avez-vous besoin ?
L’équivalent de SQL dans le Linked Data est SPARQL
17
Approche classique
ou Linked Data ?
1. Est-ce que vous maîtrisez le modèle des
données dont vous avez besoin ?
2. Est-ce que vous connaissez à l’avance les
questions que les utilisateurs souhaitent
poser aux données ?
3. Est-ce que vous êtes habilités à
héberger/traiter toutes les données
nécessaires pour répondre aux questions ?
Données en temps réel par exemple...
18
Approche classique
ou Linked Data ?
Si vous répondez non à une seule de ces
questions une BDD SQL n’est pas adapté. Il
faut commencer à mettre œuvre une
solution de type Linked Data.
Si la QoS des solutions Linked Data est insuffisante,
il faudra mettre en œuvre une solution hybride (avec
des BDD SQL ou NoSQL).
 Hors démo dans 95% des cas les solutions sont hybrides
19
Approche
SQL ou NoSQL?
Si vous répondez oui à toutes ces
questions, vous pouvez centraliser les
données et travailler de manière classique.
Cependant, si la quantité des données
entraîne une QoS insuffisante, il faut
envisager de faire du NoSQL (Big Data).
20
SQL/NoSQL nécessitent
de centraliser les données
NoSQL = une BDD pour tous
(exemple: Google, Facebook, etc...)
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Organisation 1
Organisation 2
Organisation 3
21
SPARQL
Le Linked Data supporte
les données décentralisées
avec plusieurs structures
SPARQL
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Data
Organisation 1
Organisation 2
Organisation 3
SPARQL
httpLa décentralisation des données avec des structures différentes
à travers le Web permet aussi de garder le contrôle des données
par leurs propriétaires.
Le croisement des données peut se faire du côté du client
(respect des données privées) ou des serveurs.
Comment interroger une BDD
sans structure préalable ?
Web des
données
Linked Data
2 à 5 ans
> 5 ans
23
IRI
(Internationalized Resource Identifier)
Chaque chose doit être représentée par un IRI.
Un IRI doit être :
• Unique sur le Web
• Valide : un IRI dans un navigateur doit afficher un document
• Lisible : (si possible) dans la langue de l'être humain qui l’a créé
• Lié : si vous décrivez une chose qui est déjà décrite sur le web
avec un IRI, il faut lier les IRIs.
Un IRI pointe sur un document qui doit également être lisible pour
les humains et les machines. Un IRI affiche
• une page HTML pour un être humain,
• un document RDF pour une machine.
24
RDF
(Resource Description Framework)
Triplets
Modèle de graphe destiné à décrire de façon formelle les
ressources Web et leurs métadonnées, de façon à permettre
le traitement automatique (par des machines) de telles
descriptions.
Un document structuré en RDF est constitué d'un
ensemble de triplets.
Objet
Valeur
Ou
Objet
Prédicat/Propriété
https://en.wikipedia.org/wiki/Voyager_1
https://www.wikidata.org/wiki/Property:P18 (Image)
https://commons.wikimedia.org/wiki/File:Voyager.jpg
25
Les structures de
représentation des faits
avec des ontologies
A travers RDF :
Les données peuvent prendre
n’importe quelle structure. On
parle aussi d’ontologie.
Plusieurs structures/ontologies
peuvent exister simultanément
dans la même BDD
26
Ontologie
Un peu d’histoire
L’ontologie est une branche de la philosophie
concernant l'étude de l'être, de ses modalités
et de ses propriétés. (Remonte à Platon)
Comment décrire une entité ?
Qu’est ce qui est semblable ?
Qu’est ce qui est différent ?
Peut on classifier ce qui est différent ?
27
Ontologie
Un peu d’histoire
Le concept d’ontologie rentre dans les
entreprises comme le résultat de ce
questionnement dés lors que des questions
d'organisations de connaissances se posent.
Exemple : j’ai terminé de faire l’ontologie de votre
domaine.
On peut le traduire par :
j’ai effectué un processus intellectuel afin de pouvoir
rendre explicite les connaissances de votre domaine en
utilisant un modèle de représentation.
28
Ontologie
Définition pour le W3C
Une ontologie est un modèle formel qui permet de
représenter les connaissances d'un domaine spécifique.
Une ontologie décrit
• les types de choses qui existent (classes),
• les relations entre eux (propriétés ou attributs) et
• les raisonnements logiques qui portent sur ces types et ces
propriétés (axiomes).
Exemple : si A est ami de B donc B est aussi ami de A.
Attention pour un chercheur : l’ontologie contient également les faits…
c’est-à-dire toutes les données. C’est une source de confusion…
http://www.w3.org/TR/ld-glossary/#ontology
29
Ontologies
Simple ou complexe ?
Plus les connaissances dans un domaine
seront complexes plus l’ontologie sera
complexe.
W3C propose 2 boîtes à outils pour décrire
son ontologie :
– RDFS  opérationnel ds les BDD
– OWL Lite, DL, Full, OWL 2…  expérimentales
W3C propose plusieurs syntaxes :
XML et Turtle
30
Ontologies
Conceptions ?
Connaissances
Services
Développeurs
Web
Ontologistes
Archives
Développeurs
Web
31
Ontologies
…le chaos ?
Le plus grand avantage de RDF est de pouvoir
supporter toutes les structures simultanément
 facilite l’archivage et les migrations
On pensait que c’était en même temps son
plus gros problème  infinité de structures
= temps de développement infini
32
SPARQL
prononcer « sparkle »
SPARQL deviendra au Web ce que le SQL est à une base de données.
SELECT ?image
WHERE {
<http://www.wikidata.org/entity/Q48469>
<http://www.wikidata.org/prop/direct/P18>
?image .
}
image
<http://commons.wikimedia.org/wiki/Special:FilePath/Voyager.jpg>
<http://commons.wikimedia.org/wiki/Special:FilePath/Voyager%20probe.jpg>
5. Le Web des données
est était utopique
34
Il était une fois…
Le LOD (Linked Open Data)
Le GGG (Geant Global Graph)
Et si le Web devenait une base de données ?
http://lod-cloud.net/versions/2007-11-10/lod-cloud.png
35
SPARQL, l’étincelle du LOD
(Linked Open Data)
Première recommandation du W3C en
2008 mais des BDD seulement en lecture
« sparkle », en anglais « étincelle »…
36
DBPedia, Yago, etc…
Extraction automatique des pages de
Wikipédia.
En 2008, seulement des démos… mais surtout
des IRI uniques.
37
2009, les sciences
s’emparent du LOD
Dbpedia permet d’offrir des identifiants
uniques de manière transversale aux
différents domaines scientifiques.
http://lod-cloud.net/versions/2009-03-05/lod-cloud_colored.png
38
2010, L’Open Data
bascule dans le LOD
L’Open Data au UK bascule à son tour. On commence à
parler de Web Science.
En France, le buzzword de l’Open Data commence mais
la question du format des données est clairement
éludée.
http://lod-cloud.net/versions/2010-09-22/lod-cloud_colored.png
39
Exemple :
Data.gov.uk Education
40
Hackathon
Stabilité des technos + des données
= développeurs
Les widgets et applications
pour mobile se multiplient.
Le SPARQL occulte
complétement le RDF pour les
consommateurs de données.
RDF devient un format
"Dump" de BDD.
Buzzword des Hackathons
dans le monde.
En France, on parle licences
de données…
41
2007 2008 2009
Nombredepointsd’accèsinteropérables
Augmentation exponentielle
des silos accessibles à travers
le protocole SPARQL
2010
Augmentation
exponentielle
SPARQL 1.0 W3C Recommendation 15 January 2008
SPARQL 1.1
W3C Working Draft
26 January 2010
http://lod-cloud.net/versions/2014-08-30/lod-cloud_colored.png
2014, 570 Endpoints SPARQL déclarés dans le
Linked Open Data mais la QoS est encore faible
Le Web sémantique
est-il encore utopique ?
6.
25/05/2015
Alors une infinité de structures ?
45
Ontologies
dynamiques et partagées
Demo 1/3 : Wikipedia affichera les données de Wikidata
Demo 2/3 : Wikidata agrègera
toutes les données structurées disponibles
Demo 3/3 : Wikidata remet déjà à disposition
les données dans le Linked Open Data
49
Conclusion en 2015
Le Web des données fonctionne avec un volume de données
stables
– QoS des technologies/données s’améliorent mais elles sont encore
insuffisantes pour pouvoir utiliser toutes les données du Web sans
intermédiaires
– Les ontologies doivent converger pour permettre la réutilisation des
données
Une question de temps pour que les ontologies convergent…
Et c’est déjà en cours.
Et ensuite, le Web sémantique ?
– Les chercheurs en IA commencent à utiliser le Linked Data pour pouvoir
accéder aux données du Web... La Data Science
Web 3.0 Hosting & Factory
Karima Rafes, BorderCloud
Services de BorderCloud
TP OnLine
11/09/2015
Service pour donner
des formations interactives
Catalogue sur http://bordercloud.com
TPO sur http://tpo.bordercloud.com
Auto-complétion de Wikidata, prefixes, etc.
11/09/2015
11/09/2015
Service pour partager vos découvertes
Demo http://tpo.bordercloud.com/K.php?i=1abdb0c0e9df986a715e76bb5ea0977f
LinkedWiki Plateforme
Un logiciel pour la découverte
des données privées ou ouvertes
au sein d’une structure.
http://io.datascience-paris-saclay.fr/
11/09/2015
LinkedWiki Plateforme
Un logiciel pour exposer vos données.
https://io.datascience-paris-saclay.fr/query/Population_in_Europe_after_1960
LinkedWiki Plateforme
Un logiciel pour réutiliser vos données.
https://io.datascience-paris-saclay.fr/query/Population_in_Europe_after_1960
LinkedWiki extension
pour afficher vos données dans votre Wiki
11/09/2015
http://www.bordercloud.com
contact@bordercloud.com
Web 3.0 Hosting & Factory

Contenu connexe

Tendances

Ontology concept et applications
Ontology concept et applicationsOntology concept et applications
Ontology concept et applicationsbenouini rachid
 
Introduction aux données liées
Introduction aux données liéesIntroduction aux données liées
Introduction aux données liéesOpen Data Support
 
Introduction au web sémantique
Introduction au web sémantiqueIntroduction au web sémantique
Introduction au web sémantiqueStéphane Traumat
 
Les 4 normes de description archivistique
Les 4 normes de description archivistiqueLes 4 normes de description archivistique
Les 4 normes de description archivistiqueDanis Habib
 
Base de données graphe et Neo4j
Base de données graphe et Neo4jBase de données graphe et Neo4j
Base de données graphe et Neo4jBoris Guarisma
 
base de données fédérés
base de données fédérésbase de données fédérés
base de données fédérésOussama Yoshiki
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business IntelligenceLilia Sfaxi
 
Bases de donnees fondamentaux
Bases de donnees fondamentauxBases de donnees fondamentaux
Bases de donnees fondamentauxRokhaya CISSE
 
BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4JLilia Sfaxi
 
Cours Base de données relationnelles
Cours Base de données relationnellesCours Base de données relationnelles
Cours Base de données relationnellesAymen Kasmi
 
Bases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er coursBases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er coursHatim CHAHDI
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4jNeo4j
 
Android-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateursAndroid-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateursLilia Sfaxi
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleLilia Sfaxi
 
Introduction à l'informatique documentaire
Introduction à l'informatique documentaireIntroduction à l'informatique documentaire
Introduction à l'informatique documentaireSylvain Machefert
 
Spark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsSpark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsMICHRAFY MUSTAFA
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Gautier Poupeau
 

Tendances (20)

Ontology concept et applications
Ontology concept et applicationsOntology concept et applications
Ontology concept et applications
 
Introduction aux données liées
Introduction aux données liéesIntroduction aux données liées
Introduction aux données liées
 
Introduction au web sémantique
Introduction au web sémantiqueIntroduction au web sémantique
Introduction au web sémantique
 
Les 4 normes de description archivistique
Les 4 normes de description archivistiqueLes 4 normes de description archivistique
Les 4 normes de description archivistique
 
Base de données graphe et Neo4j
Base de données graphe et Neo4jBase de données graphe et Neo4j
Base de données graphe et Neo4j
 
base de données fédérés
base de données fédérésbase de données fédérés
base de données fédérés
 
Business Intelligence
Business IntelligenceBusiness Intelligence
Business Intelligence
 
Bases de donnees fondamentaux
Bases de donnees fondamentauxBases de donnees fondamentaux
Bases de donnees fondamentaux
 
Les systèmes de recommandations
Les systèmes de recommandationsLes systèmes de recommandations
Les systèmes de recommandations
 
BigData_TP5 : Neo4J
BigData_TP5 : Neo4JBigData_TP5 : Neo4J
BigData_TP5 : Neo4J
 
Cours Base de données relationnelles
Cours Base de données relationnellesCours Base de données relationnelles
Cours Base de données relationnelles
 
Bases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er coursBases de Données non relationnelles, NoSQL (Introduction) 1er cours
Bases de Données non relationnelles, NoSQL (Introduction) 1er cours
 
Introduction à Neo4j
Introduction à Neo4jIntroduction à Neo4j
Introduction à Neo4j
 
Android-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateursAndroid-Tp2: liste et adaptateurs
Android-Tp2: liste et adaptateurs
 
Chp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique DécisionnelleChp1 - Introduction à l'Informatique Décisionnelle
Chp1 - Introduction à l'Informatique Décisionnelle
 
Introduction à l'informatique documentaire
Introduction à l'informatique documentaireIntroduction à l'informatique documentaire
Introduction à l'informatique documentaire
 
Spark RDD : Transformations & Actions
Spark RDD : Transformations & ActionsSpark RDD : Transformations & Actions
Spark RDD : Transformations & Actions
 
Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...Big data, Intelligence artificielle, quelles conséquences pour les profession...
Big data, Intelligence artificielle, quelles conséquences pour les profession...
 
Les BD NoSQL
Les BD NoSQLLes BD NoSQL
Les BD NoSQL
 
Big data : défis & technologies
Big data : défis & technologiesBig data : défis & technologies
Big data : défis & technologies
 

Similaire à Introduction au web des données (Linked Data)

Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataBorderCloud
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011Y. Nicolas
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Gautier Poupeau
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesGautier Poupeau
 
États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantiqueIvan Herman
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information SystemsSerge Garlatti
 
Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?Antidot
 
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Anne-Gaëlle Gaudion
 
Big data: NoSQL comme solution
Big data: NoSQL comme solutionBig data: NoSQL comme solution
Big data: NoSQL comme solutionJEMLI Fathi
 
Introduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensFICEL Hemza
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Antidot
 
Web 2.0 contre Web sémantique : un point de vue philosophique
Web 2.0 contre Web sémantique : un point de vue philosophiqueWeb 2.0 contre Web sémantique : un point de vue philosophique
Web 2.0 contre Web sémantique : un point de vue philosophiquePeccatte
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web SémantiqueYves Otis
 
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDF
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDFAcfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDF
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDFFrançois Belleau
 

Similaire à Introduction au web des données (Linked Data) (20)

Initiation à SPARQL avec Wikidata
Initiation à SPARQL avec WikidataInitiation à SPARQL avec Wikidata
Initiation à SPARQL avec Wikidata
 
metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011metadata_pour_dirbu_mars2011
metadata_pour_dirbu_mars2011
 
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
Les technologies du Web appliquées aux données structurées (2ème partie : Rel...
 
Armadillo - Web sémantique, les outils d’un open data culturel
Armadillo  - Web sémantique, les outils d’un open data culturelArmadillo  - Web sémantique, les outils d’un open data culturel
Armadillo - Web sémantique, les outils d’un open data culturel
 
Les professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de donnéesLes professionnels de l'information face aux défis du Web de données
Les professionnels de l'information face aux défis du Web de données
 
États des lieux du Web sémantique
États des lieux du Web sémantiqueÉtats des lieux du Web sémantique
États des lieux du Web sémantique
 
Web 3.0
Web 3.0Web 3.0
Web 3.0
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Semantic Information Systems
Semantic Information SystemsSemantic Information Systems
Semantic Information Systems
 
Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?Le Web de données ou comment gérer l'interopérabilité ?
Le Web de données ou comment gérer l'interopérabilité ?
 
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
Les nouvelles normes de catalogage en bibliothèque : l'alimentation future de...
 
Big data: NoSQL comme solution
Big data: NoSQL comme solutionBig data: NoSQL comme solution
Big data: NoSQL comme solution
 
Web sémantique
Web sémantique Web sémantique
Web sémantique
 
Introduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sensIntroduction au web sémantique : quand le lient fait sens
Introduction au web sémantique : quand le lient fait sens
 
Web sémantique
Web sémantiqueWeb sémantique
Web sémantique
 
Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?Web sémantique et Web de données, et si on passait à la pratique ?
Web sémantique et Web de données, et si on passait à la pratique ?
 
Web 2.0 contre Web sémantique : un point de vue philosophique
Web 2.0 contre Web sémantique : un point de vue philosophiqueWeb 2.0 contre Web sémantique : un point de vue philosophique
Web 2.0 contre Web sémantique : un point de vue philosophique
 
Applications du Web Sémantique
Applications du Web SémantiqueApplications du Web Sémantique
Applications du Web Sémantique
 
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDF
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDFAcfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDF
Acfas 2013 - Comment publier sur le web sémantique : la méthode de Bio2RDF
 

Dernier

ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attalcontact Elabe
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...France Travail
 
analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxHadJer61
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentationbahija babzine
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformersbahija babzine
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023France Travail
 

Dernier (6)

ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel AttalELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
 
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
Montant moyen du droit d'allocation chômage versé aux demandeurs d'emploi ind...
 
analyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptxanalyse husseindey AMIROUCHE Abdeslem.pptx
analyse husseindey AMIROUCHE Abdeslem.pptx
 
To_understand_transformers_together presentation
To_understand_transformers_together presentationTo_understand_transformers_together presentation
To_understand_transformers_together presentation
 
Bidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from TransformersBidirectional Encoder Representations from Transformers
Bidirectional Encoder Representations from Transformers
 
Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023Le contrôle de la recherche d'emploi en 2023
Le contrôle de la recherche d'emploi en 2023
 

Introduction au web des données (Linked Data)

  • 1. Web 3.0 Hosting & Factory Karima Rafes, BorderCloud 30/11/2015 Le Web des données L’introduction aux ontologies et au Web sémantique
  • 2. 2 Sommaire 1. Historique du mouvement 2. Définition 3. Qui en a besoin ? 4. En avez-vous besoin ? 5. Le Web des données était utopique. 6. Le Web sémantique est-il encore utopique ?
  • 3. 1. Historique du mouvement
  • 4. 4 Si on reliait tous les documents sur Internet !? Et le Web fut ? 1989
  • 5. Le concept "informations liées" apparaît dès les origines. { Dès ses origines, le Web n’avait pas la finalité de relier seulement des documents mais de relier les informations.
  • 6. En 1999, le concept de Web sémantique est créé/structuré pour décrire la finalité du Web mais le concept fut mal compris et souvent détourné.
  • 7. 7 Objectif du Web sémantique Pouvoir créer de nouvelles connaissances avec l’aide de machines. Iron Man
  • 8. 8 Le Web des données… en route vers le Web sémantique 2000 2015 Web des données Linked Data En 2025-30, le Web sémantique ? Travaux de recommandations en cours En 2006, on crée un point d’étape au Web sémantique que l’on nomme le Web des données ou Linked Data. Ce concept offre un objectif plus simple à comprendre/expliquer et moins utopique car il est de + en + facile de faire des démonstrations.
  • 9. 9 Objectif du Web des données Pouvoir accéder aux informations disponibles avec l’aide de machines. Cortana
  • 11. 11 Définition : le Web de données ou Linked Data Initiative visant à favoriser la publication de données : Interopérables à l’aide d’un modèle commun pour représenter une information Structurées à l’aide d’ontologies Accessibles à travers le Web Reliées entre elles pour constituer un réseau global d'informations
  • 12. 12 Historique Le lancement de l'initiative, en 2006, avait pour objectifs de : • promouvoir une vision du Web comme une base de données globale • naviguer à travers les données sur le Web de la même façon que l'hypertexte permet de relier des pages Web Le Consortium World Wide Web (W3C) à travers cette initiative, poursuit sa mission qui est d’assurer au Web une croissance à long terme
  • 13. 3. Qui en a besoin ?
  • 14. 1 Prise de conscience Il est impossible de traiter humainement l’information disponible sur le Web. 2 Besoins Les donneurs d’ordres demandent des solutions pour prendre de meilleurs décisions sans manipulations extérieures. 3 Diffusion Le Linked Data permet l’accès aux données sans intermédiaires et de manières décentralisées. La technologie se diffuse dans les laboratoires et les institutions gouvernementales. 4 Disponibilité (en cours) Les données sont de plus en plus accessibles, de plus en plus liées et mises à jour en temps réel. 5 Réutilisation Les données sont maintenant réutilisables à travers toutes les machines sans intermédiaires. Le Web des données permettra… la réutilisation de toutes les données
  • 15. WoT RDF Sciences City Open Data Web Agent datadata Faciliter l’intégration de Web Agent pour aider les humains dans cet océan de données Le Web des données permettra… l’émergence des Web agents
  • 16. 4. En avez-vous besoin ? L’équivalent de SQL dans le Linked Data est SPARQL
  • 17. 17 Approche classique ou Linked Data ? 1. Est-ce que vous maîtrisez le modèle des données dont vous avez besoin ? 2. Est-ce que vous connaissez à l’avance les questions que les utilisateurs souhaitent poser aux données ? 3. Est-ce que vous êtes habilités à héberger/traiter toutes les données nécessaires pour répondre aux questions ? Données en temps réel par exemple...
  • 18. 18 Approche classique ou Linked Data ? Si vous répondez non à une seule de ces questions une BDD SQL n’est pas adapté. Il faut commencer à mettre œuvre une solution de type Linked Data. Si la QoS des solutions Linked Data est insuffisante, il faudra mettre en œuvre une solution hybride (avec des BDD SQL ou NoSQL).  Hors démo dans 95% des cas les solutions sont hybrides
  • 19. 19 Approche SQL ou NoSQL? Si vous répondez oui à toutes ces questions, vous pouvez centraliser les données et travailler de manière classique. Cependant, si la quantité des données entraîne une QoS insuffisante, il faut envisager de faire du NoSQL (Big Data).
  • 20. 20 SQL/NoSQL nécessitent de centraliser les données NoSQL = une BDD pour tous (exemple: Google, Facebook, etc...) Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Organisation 1 Organisation 2 Organisation 3
  • 21. 21 SPARQL Le Linked Data supporte les données décentralisées avec plusieurs structures SPARQL Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Organisation 1 Organisation 2 Organisation 3 SPARQL httpLa décentralisation des données avec des structures différentes à travers le Web permet aussi de garder le contrôle des données par leurs propriétaires. Le croisement des données peut se faire du côté du client (respect des données privées) ou des serveurs.
  • 22. Comment interroger une BDD sans structure préalable ? Web des données Linked Data 2 à 5 ans > 5 ans
  • 23. 23 IRI (Internationalized Resource Identifier) Chaque chose doit être représentée par un IRI. Un IRI doit être : • Unique sur le Web • Valide : un IRI dans un navigateur doit afficher un document • Lisible : (si possible) dans la langue de l'être humain qui l’a créé • Lié : si vous décrivez une chose qui est déjà décrite sur le web avec un IRI, il faut lier les IRIs. Un IRI pointe sur un document qui doit également être lisible pour les humains et les machines. Un IRI affiche • une page HTML pour un être humain, • un document RDF pour une machine.
  • 24. 24 RDF (Resource Description Framework) Triplets Modèle de graphe destiné à décrire de façon formelle les ressources Web et leurs métadonnées, de façon à permettre le traitement automatique (par des machines) de telles descriptions. Un document structuré en RDF est constitué d'un ensemble de triplets. Objet Valeur Ou Objet Prédicat/Propriété https://en.wikipedia.org/wiki/Voyager_1 https://www.wikidata.org/wiki/Property:P18 (Image) https://commons.wikimedia.org/wiki/File:Voyager.jpg
  • 25. 25 Les structures de représentation des faits avec des ontologies A travers RDF : Les données peuvent prendre n’importe quelle structure. On parle aussi d’ontologie. Plusieurs structures/ontologies peuvent exister simultanément dans la même BDD
  • 26. 26 Ontologie Un peu d’histoire L’ontologie est une branche de la philosophie concernant l'étude de l'être, de ses modalités et de ses propriétés. (Remonte à Platon) Comment décrire une entité ? Qu’est ce qui est semblable ? Qu’est ce qui est différent ? Peut on classifier ce qui est différent ?
  • 27. 27 Ontologie Un peu d’histoire Le concept d’ontologie rentre dans les entreprises comme le résultat de ce questionnement dés lors que des questions d'organisations de connaissances se posent. Exemple : j’ai terminé de faire l’ontologie de votre domaine. On peut le traduire par : j’ai effectué un processus intellectuel afin de pouvoir rendre explicite les connaissances de votre domaine en utilisant un modèle de représentation.
  • 28. 28 Ontologie Définition pour le W3C Une ontologie est un modèle formel qui permet de représenter les connaissances d'un domaine spécifique. Une ontologie décrit • les types de choses qui existent (classes), • les relations entre eux (propriétés ou attributs) et • les raisonnements logiques qui portent sur ces types et ces propriétés (axiomes). Exemple : si A est ami de B donc B est aussi ami de A. Attention pour un chercheur : l’ontologie contient également les faits… c’est-à-dire toutes les données. C’est une source de confusion… http://www.w3.org/TR/ld-glossary/#ontology
  • 29. 29 Ontologies Simple ou complexe ? Plus les connaissances dans un domaine seront complexes plus l’ontologie sera complexe. W3C propose 2 boîtes à outils pour décrire son ontologie : – RDFS  opérationnel ds les BDD – OWL Lite, DL, Full, OWL 2…  expérimentales W3C propose plusieurs syntaxes : XML et Turtle
  • 31. 31 Ontologies …le chaos ? Le plus grand avantage de RDF est de pouvoir supporter toutes les structures simultanément  facilite l’archivage et les migrations On pensait que c’était en même temps son plus gros problème  infinité de structures = temps de développement infini
  • 32. 32 SPARQL prononcer « sparkle » SPARQL deviendra au Web ce que le SQL est à une base de données. SELECT ?image WHERE { <http://www.wikidata.org/entity/Q48469> <http://www.wikidata.org/prop/direct/P18> ?image . } image <http://commons.wikimedia.org/wiki/Special:FilePath/Voyager.jpg> <http://commons.wikimedia.org/wiki/Special:FilePath/Voyager%20probe.jpg>
  • 33. 5. Le Web des données est était utopique
  • 34. 34 Il était une fois… Le LOD (Linked Open Data) Le GGG (Geant Global Graph) Et si le Web devenait une base de données ? http://lod-cloud.net/versions/2007-11-10/lod-cloud.png
  • 35. 35 SPARQL, l’étincelle du LOD (Linked Open Data) Première recommandation du W3C en 2008 mais des BDD seulement en lecture « sparkle », en anglais « étincelle »…
  • 36. 36 DBPedia, Yago, etc… Extraction automatique des pages de Wikipédia. En 2008, seulement des démos… mais surtout des IRI uniques.
  • 37. 37 2009, les sciences s’emparent du LOD Dbpedia permet d’offrir des identifiants uniques de manière transversale aux différents domaines scientifiques. http://lod-cloud.net/versions/2009-03-05/lod-cloud_colored.png
  • 38. 38 2010, L’Open Data bascule dans le LOD L’Open Data au UK bascule à son tour. On commence à parler de Web Science. En France, le buzzword de l’Open Data commence mais la question du format des données est clairement éludée. http://lod-cloud.net/versions/2010-09-22/lod-cloud_colored.png
  • 40. 40 Hackathon Stabilité des technos + des données = développeurs Les widgets et applications pour mobile se multiplient. Le SPARQL occulte complétement le RDF pour les consommateurs de données. RDF devient un format "Dump" de BDD. Buzzword des Hackathons dans le monde. En France, on parle licences de données…
  • 41. 41 2007 2008 2009 Nombredepointsd’accèsinteropérables Augmentation exponentielle des silos accessibles à travers le protocole SPARQL 2010 Augmentation exponentielle SPARQL 1.0 W3C Recommendation 15 January 2008 SPARQL 1.1 W3C Working Draft 26 January 2010
  • 42. http://lod-cloud.net/versions/2014-08-30/lod-cloud_colored.png 2014, 570 Endpoints SPARQL déclarés dans le Linked Open Data mais la QoS est encore faible
  • 43. Le Web sémantique est-il encore utopique ? 6.
  • 46. Demo 1/3 : Wikipedia affichera les données de Wikidata
  • 47. Demo 2/3 : Wikidata agrègera toutes les données structurées disponibles
  • 48. Demo 3/3 : Wikidata remet déjà à disposition les données dans le Linked Open Data
  • 49. 49 Conclusion en 2015 Le Web des données fonctionne avec un volume de données stables – QoS des technologies/données s’améliorent mais elles sont encore insuffisantes pour pouvoir utiliser toutes les données du Web sans intermédiaires – Les ontologies doivent converger pour permettre la réutilisation des données Une question de temps pour que les ontologies convergent… Et c’est déjà en cours. Et ensuite, le Web sémantique ? – Les chercheurs en IA commencent à utiliser le Linked Data pour pouvoir accéder aux données du Web... La Data Science
  • 50. Web 3.0 Hosting & Factory Karima Rafes, BorderCloud Services de BorderCloud TP OnLine 11/09/2015
  • 51. Service pour donner des formations interactives Catalogue sur http://bordercloud.com TPO sur http://tpo.bordercloud.com Auto-complétion de Wikidata, prefixes, etc. 11/09/2015
  • 52. 11/09/2015 Service pour partager vos découvertes Demo http://tpo.bordercloud.com/K.php?i=1abdb0c0e9df986a715e76bb5ea0977f
  • 53. LinkedWiki Plateforme Un logiciel pour la découverte des données privées ou ouvertes au sein d’une structure. http://io.datascience-paris-saclay.fr/ 11/09/2015
  • 54. LinkedWiki Plateforme Un logiciel pour exposer vos données. https://io.datascience-paris-saclay.fr/query/Population_in_Europe_after_1960
  • 55. LinkedWiki Plateforme Un logiciel pour réutiliser vos données. https://io.datascience-paris-saclay.fr/query/Population_in_Europe_after_1960
  • 56. LinkedWiki extension pour afficher vos données dans votre Wiki 11/09/2015