Washington Football Commanders Redskins Feathers Shirt
Modèles de données et langages de description ouverts 6 - 2021-2022
1. Modèles de données et langages
de description ouverts - 6
Licence DIST
2021-2022
2. Rappel programme global
• Comprendre la notion de métadonnée,
approche des langages à balises (s1)
• Comprendre le XML et ses applications (s2-4)
• Données ouvertes, traitements et
matérialisations informatiques (s5-6)
3. Programme de ce cours
1. Evaluation finale
2. Rappel : le web de données
3. Modèles de données et infrastructure
4. Questions-réponses dossiers
5. Bilan du cours
5. 2) Rappel : le web de données
• Les bases en web de données sont
constituées d’un ensemble de déclarations
sujet - relation - prédicat, des triplets
• D’une logique de tables de données avec des
relations binaires clé / valeur, on passe alors à
un système de graphe de données (la
structure des liens tissés par les triplets)
5
6. Le web de données
Exemple issu du RDF 1.1 Primer
<Bob> <is a> <person>.
<Bob> <is a friend of> <Alice>.
<Bob> <is born on> <the 4th of July 1990>.
<Bob> <is interested in> <the Mona Lisa>.
<the Mona Lisa> <was created by> <Leonardo da Vinci>.
<the video 'La Joconde à Washington'> <is about> <the Mona Lisa>
8. Le web de données
• Un modèle de données fondamentalement
ouvert
–Des points d’accès stables (via les URI)
–Une logique de réutilisation permettant les
enrichissements à l’infini
–Une conception partagée sans limitation, un
“commun”
9. Le web de données
Photo par Michael Dziedzic sur Unsplash
Photo par DevVrat Jadon sur Unsplash
https://commons.wikimedia.org/wiki/File:Super_glue.jpg
Ce modèle de données, si puissant soit-il, est UNE option technique parmi
d’autres, avec ses utilisations privilégiées. Est-ce qu’on imaginerait:
- Clouer une Tour Eiffel en allumettes ?
- Coller les rails des lignes du TGV ?
10. Le web de données
Après la phase de “hype” puis la frustration des pionniers, montée en
usage progressive
Hype Cycle du Gartner, Jérémy Kemp, CC-BY-SA
11. Le web de données
Sur des plans très différents, situation du XML (format de métadonnées),
du Web de données (modèle de données, donc de métadonnées) et de
JSON (JavaScript Object Notation - encodage de données)
Hype Cycle du Gartner, Jérémy Kemp, CC-BY-SA
JSON
Web3
XML
12. 3) Modèle de données et
infrastructure
Les modèles de données reposent sur une
infrastructure technique à ne pas négliger
(issu de https://medium.com/sogetiblogsnl/the-role-of-the-dba-on-modern-data-platforms-da40f5ad8f78)
S’appuyer sur des modèles de données
ouverts facilite la portabilité et
l’interopérabilité des services /
applications
Le stockage et le traitement informatique
de bas niveau sont plus ou moins adaptés
à (=optimisés pour) ces modèles de
données
13. Modèle de données et
infrastructure
• Les services permis
par un modèle de
données ne
fonctionnent que
si l’infrastructure
technique les rend
aussi possibles /
réalisables
14. Modèle de données et
infrastructure
• La typologie des bases de données n’est pas
très figée, en voici une en guise d’exemple.
(OLTP)
Dans https://iaobs.com/blog/bases-de-donnees-relationnelles-et-nosql-dans-gcp/
XML ? Web
de données ?
15. Modèle de données et
infrastructure
• La plupart du temps, une infrastructure peut
gérer tous les modèles de données mais pas
avec les mêmes performances (ici du RDF)
Dans https://www.sciencedirect.com/science/article/pii/S0268401219306097
16. Modèle de données et
infrastructure
• Les performances varient surtout selon les
opérations lancées sur les données (1/2)
Dans https://medium.com/profil-software-blog/database-compare-sql-vs-nosql-mysql-vs-postgresql-vs-redis-vs-mongodb-3da5f41c31b5
17. Modèle de données et
infrastructure
• Les performances varient surtout selon les
opérations lancées sur les données (2/2)
Dans https://medium.com/profil-software-blog/database-compare-sql-vs-nosql-mysql-vs-postgresql-vs-redis-vs-mongodb-3da5f41c31b5
18. Modèle de données et
infrastructure
Base de données
relationnelles
Base de données
document
Base de données
graphes
Moteur de
recherche
• Beaucoup de lecture/écriture
• Données très structurées
• Garantie de la transaction
• Peu ou pas de mise à jour
• Données semi structurées
• Montée en charge sécurisée en
volume de données
• Données très structurées
• Inférences sur les données
• Respect de la logique des données
• Requête plein texte
• Rapidité des réponses
• Montée en charge pour le
nombre d’utilisateurs
Forces et faiblesses des différents systèmes de bases de données.
Il n’existe pas une base de données idéale, chacune présente ses forces et ses faiblesses.
CC-BY Gautier Poupeau - 2019
19. Modèle de données et
infrastructure
• Logique “data-centrée”-> de + en + des
réservoirs différents pour services multiples
Extrait de Data Lake for Enterprises - Tomcy John et Pankaj Misra - Pakt - ISBN 9781787281349
20. Modèle de données et
infrastructure
• La destruction du format unique 💍
(le destin sans doute…)
• Pourquoi se préoccuper
de choisir des formats
ouverts de stockage ou d’expression des
métadonnées (XML, RDF, JSON…) ?
21. Modèle de données et
infrastructure
• Choisir des formats ouverts de stockage ou
d’expression des métadonnées ?
–Reprendre la maîtrise
sur les données publiques
(ou en tirer profit!)
–Ouvrir sur l’inconnu
24. Et pour la suite...
Bon courage !
Entraînez-vous à repérer le XML ou équivalent, et
vous savez maintenant que ça peut être maîtrisé
avec des connaissances et du bon sens.
Merci enfin pour vos efforts pour gérer cet aspect
technique du métier...