1. XML – un panorama
Ivry 28 juin 2005
Michel GRECH
INFOTIQUE
2. L’information électronique, l’état des lieux
Typologie de l’information électronique: information
structurée – information faiblement structurée
L’association contenu et présentation, la confusion
L’échange des documents électroniques, les obstacles
La pérennité de l’information
La question des documents multilingues
3. Typologie de l’information électronique
structurée / non structurée
L’information structurée : les bases de données et les
applications « ad hoc »
– Mécanismes de structuration et de vérification de la cohérence
efficaces
– Ne contiennent en pratique que les méta données
L’information semi structurée : exemple des tableurs
– Structure « à plat » - pas de vérification de la cohérence
L’information pas ou peu structurée : le texte
4. Contenu et présentation, les effets de la
confusion
Maintenance du contenu
Maintenance de la présentation
La question du multi-supports
5. L’échange des documents électroniques
les obstacles
Des formats propriétaires (formats de données,
formats de fichiers)
Des formats standards mais pas universel (rtf pour le
texte, csv pour les bases de données)
Des formats « pauvres » en sémantique
La question du multilinguisme
6. La question de la pérennité des informations
électroniques
La vraie nature de l’information électronique et de son
support
Les formats propriétaires (formats de données, formats
de fichiers ou de stockage) et pas documentés
8. Ce qu’est XML, ce qu’il n’est pas
XML est un langage à balise (comme HTML)
XML est un métalangage (pas comme HTML)
XML n’est pas un langage de programmation
XML n’est pas un protocole de transport réseau
9. Les objectifs de XML : sémantique, portabilité
et pérennité
Capturer la sémantique des documents électroniques
– Le balisage sémantique, auto-description des documents XML
Constituer un format d’échange riche, standard et universel -
garantir la pérennité des informations électroniques
– XML Norme du W3C (non propriétaire) abondamment documentée
– Format texte « pur » (multi plate-forme, multi-OS …) avec sémantique
– Support UNICODE
– Possibilité de partager une « grammaire commune » pour les
échanges inter-applications
Séparer contenu et présentation pour l’édition multi-supports
10. Les concepts clefs
Documents XML
DTD (Document Type Description) et Schémas XML
Présentation et transformation
11. Documents XML
Anatomie d’un document XML
Arbre d’un document XML
Eléments de syntaxe : prologue, encodage, balises,
éléments, attributs
Les parseurs, documents XML bien formés
Exemple de documents XML narratifs
Exemple de documents « orientés données »
12. XML et le multillinguisme
Représentation de l’information électronique
Jeux de caractères, codes de caractères
Au commencement était l’ASCII
Puis vint l’ASCII étendu et les codes « Latin-n »
Enfin apparut UNICODE
Les codifications UNICODE USC-2, UTF-16, UTF-8
XML et UNICODE
13. Les DTD (Document Type Description)
Le rôle d’une DTD
– Assurer un niveau minimum de qualité de l’information
– Partager des structures de documents « métiers »
Anatomie d’une DTD
Déclaration des éléments et des attributs
DTD internes et DTD externes
Validation d’un document XML
XML et applications XML
Limites des DTD
14. Schémas XML
Rôle des schémas XML
Le traitement des métadonnées : typage, nombre
d’occurrences …
Les espaces de noms
Choix : DTD ou schémas XML ?
15. XML comme « bus de données »
Échange de données – Échanges inter-
applications
DTD
XML Schéma
Messages
XML
Application
+ parseur
Application
+ parseur
Application
+ parseur
Application
+ parseur
Application
+ parseur
Messages
XML
Stockage
Format XML
17. Transformation d’un document XML avec
XSLT
Le rôle d’une feuille de style XSLT : transformer les
documents XML
Les feuilles de style XML sont écrites en XML
Processeurs XSLT
Modèles et règles modèles
19. Outils et applications XML,
Éditeurs et Parseurs
Les « Applications XML » : Dublin Core, TEI …
Open Office et XML
Les bases de données et XML, exportation de
requêtes, importation de XML schémas
20. Bibliographie
Introduction à XML – éditions O’REILLY
Introduction : http://www.chez.com/xml/
Plus complet : http://xmlfr.org/
Pour les développeurs : http://xml.developpez.com/