Intervention à l'INRIA : "L’ouverture des données au niveau national (Etalab)"
1. Charles RUELLE – @charlesruelle
Directeur technique
Etalab (data.gouv.fr) – @etalab
L'ouverture des données au
niveau national
Séminaire IN’Tech
INRIA Grenoble
5 Juin 2012
2. 2
Les missions
• Coordonner l’action des administrations de l’Etat et de ses
établissements publics administratifs pour faciliter la réutilisation
la plus large possible de leurs informations publiques
• Création d’une plateforme destinée à rassembler et à mettre à
disposition librement et le plus largement possible les
informations publiques de l’Etat, de ses établissements publics
administratifs, et si elles le souhaitent, des collectivités
territoriales.
3. 3
Animer et coordonner le travail des producteurs
•13 coordinateurs « Open Data » ministériels
•+ de 200 contributeurs réguliers sur data.gouv.fr
•+ de 105 administrations impliquées à ce jour
•Ateliers de travail (« Workshop ») avec la communauté « Open
data » et les producteurs de données
•Plusieurs collectivités territoriales (Longjumeau, Saint Quentin,
Conseil Général du Loir et Cher…)
•Des autorités administratives indépendantes, entreprises
publiques, etc. (SNCF, la Poste, CSA, ARCEP…)
4. 4
Permettre la réutilisation la plus large
• Libre et gratuite
• Autorise la reproduction, la redistribution, l’adaptation et
l’exploitation commerciale des données
• Compatible avec les autres grands standards internationaux (ODC-
BY, CC-BY 2.0) et les standards développées à l’étranger (Open
Government Licence – data.gov.uk)
5. 5
Objectifs :
1. Proposer un catalogue interopérable,
2. De données structurées et qualifiées,
3. En libre téléchargement,
4. Accessibles à tous, à un même endroit,
5. Depuis un moteur de recherche,
6. Qui fournit des réponses pertinentes (liste de résultats)
7. Et des capacités de recherche structurée (facettes contextuelles et
dynamique…)
8. Et offre une navigation sémantique entre concepts (producteur,
licence, ressources, échanges de la communauté…)
Data.gouv.fr : la plateforme de diffusion des données
6. 6
Data.gouv.fr : la plateforme de diffusion des données
Le catalyseur des données publiques de l’Etat
»Back office dédié aux producteurs de données, supportant le processus
et les fonctionnalités de la publication en équipe des jeux de données
»Intégration de technologies sémantiques, de thésaurus et modélisation
de l’ontologie
»Une qualification harmonisée (syntaxique et sémantique) des jeux de
données publiques
»Extraction et publication de données issues des bases de données de
l’Etat
7. 7
Data.gouv.fr : la plateforme de diffusion des données
Le point d’accès aux données publiques de l’Etat
»Présentation de l’Open Data, des producteurs de données, des
réutilisations de données publiques
»Recherche et navigation dans l’inventaire des jeux de données publiés
»Téléchargement des jeux de données publiques
»Base de connaissance collaborative sur l’open data : échanges et
discussions sur son actualité, ses acteurs, ses perspectives, les jeux de
données et leurs réutilisations…
9. 9
Data.gouv.fr : la plateforme de diffusion des données
Les travaux en cours pour faciliter la réutilisation des données
»Amélioration de la recherche
•Multiplication des facettes
•Suggestions de recherches
•Hiérarchisation des facettes
•Recherche multicritères (ciblage sur les propriétés)
•Recherche spécialisée (géographique…)
»Suivre les évolutions du modèle DCAT (Data Catalog Vocabulary)
•Format standardisé (W3C) de publication de catalogues de
données gouvernementales
•Publier le catalogue sémantique (Linked Open Data)
10. 10
Data.gouv.fr : la plateforme de diffusion des données
Les travaux en cours pour faciliter la réutilisation des données
»Travaux d’harmonisation des données
Tim Berners Lee (W3C) a établi une notation qualitative sur 5 étoiles
pour la mise en ligne des données :
★ Données accessibles sur le web (sans conditions
de formats)
★★ Données accessibles structurées (exemple: Excel
au lieu de l’image d’un tableau)
★★★ Formats non-propriétaires (exemple: csv au
lieu d’Excel)
★★★★ Usage d’URL pour identifier les données
★★★★★ Données liées sémantiquement
18. 18
Producteur
Annuaire de l’administration (Alimenté à partir de Service-Public.fr )
Découpage administratif
Code Officiel Géographique (http://rdf.insee.fr/geo/)
Thématiques
Eurovoc 4.3 : Thématiques (http://eurovoc.europa.eu/drupal/?q=fr)
Pays et
Territoires
Pays et
Territoires
Pays et
Territoires
Pays et
Territoires
Pays et
Territoires
Pays et
Territoires
Matière et
Thème
Matière et
Thème
Pays et
Territoires
Pays et
Territoires
Pays et
Territoires
Pays et
Territoires
Pays et
Territoires
Pays et
Territoires
Pays et
territoires
Pays et
territoires
Des mots clé libres s'appliquent à tous les vocabulaires contrôlés.
Ils servent à accueillir l'indexation correspondante dans la source et permettre l'ajout de
mots clé non présents dans les vocabulaires proposés.
Data.gouv.fr : précisions sur l’ontologie