Cette affirmation résume parfaitement l ’esprit de l’open data. Cette présentation va permettre de donner plus de corps à cette affirmation en précisant de nombreux points: « Ouverture des données = philosophie » « Certaines données » => Toute donnée ne peut pas être une donnée ouverte Une donnée ne s ’ouvre pas n’importe comment L ’ouverture de données permet la réutilisation de celle-ci
Le mouvement open n ’est pas quelque chose de nouveau. Tout le monde connaît le mouvement open source: logiciel libre qui consiste à partager le code source des programmes. Cette philosophie était depuis très longtemps en place chez les développeurs et pionniers de l ’internet mais formalisée par Richard Stallman par le projet GNU en 1983 (création de la free software foundation). Il faut bien réaliser l’importance de ce mouvement basé sur la partage de la connaissance. Pour schématiser plus de 60% de la technique logicielle sur laquelle repose internet est basée sur l’open source (Apache, Linux). Le concept de logiciel libre a ensuite été étendu aux œuvres à la fin des années 90 avec l ’open content avec notamment la licence creative commons, souvent utilisée sur de la musique ou des créations graphiques. Le mouvement open access se focalise lui sur le libre accès de contenus numériques que ceux-ci soient libres ou non. Tous ces mouvements open sont assimilés au terme plus général d ’Open Knowledge (qui a sa propre fondation). Plus globalement les pionniers de l ’internet avaient des liens très importants avec la communauté scientifique au sein de laquelle le partage de la connaissance est ancrée depuis des décennies. Un exemple est la mise en place d’un accès institutionnel ouvert sur des données scientifiques de géophysiques dans les années 50. Déjà à l’époque plusieurs data centers avaient été mis en place pour réduire le risque de perte de données et maximiser l’accès à ces donneés. Ces capacités de partage numérique ont bien évidemment connu une accélération importante avec l’avènement d’internet. Des initiatives privées ont aussi mené à de l ’ouverture de données: Amazon (API sur les livres), Google Maps (fort levier d’innovation), … pratique généralisée désormais (twitter, facebook, …) Sur le partage de données publiques il faut citer d ’abord les pays anglo-saxons avec d’abord le gouvernement de Barrack Obama suivi rapidement par le Royaume Uni, qui se sont lancés dès 2009 dans le partage de données gouvernementales avec leur propres plateformes. En France comme vous devez le savoir, la ville pionnière est Rennes, avec d ’abord des données relatives au vélib local et 6 mois plus tard de nombreuses autres données. Enfin il convient de citer comme mentor sur ce sujet, Tim berners Lee: inventeur du World Wide Web. Il le créa pour partager des documents. Il proposa un peu avant 2009 de partager des données. Il s ’en expliqua dans une conférence TED que je vous encourage à visionner. RAW DATA NOW ! Le potentiel sous exploité des données. Tim berners Lee est co-directeur de l ’institut de l’open data en Angleterre et très impliqué dans l’ouverture de données dans l’open data Anglais. Par ailleurs il est membre du W3C qui régis les normes internet. Cet organisme a publié dès 2009 recommandations sur l ’ouverture des données publiques : http://www.w3.org/TR/gov-data/ .
Le mouvement open n ’est pas quelque chose de nouveau. Tout le monde connaît le mouvement open source: logiciel libre qui consiste à partager le code source des programmes. Cette philosophie était depuis très longtemps en place chez les développeurs et pionniers de l ’internet mais formalisée par Richard Stallman par le projet GNU en 1983 (création de la free software foundation). Il faut bien réaliser l’importance de ce mouvement basé sur la partage de la connaissance. Pour schématiser plus de 60% de la technique logicielle sur laquelle repose internet est basé sur l’open source (Apache, Linux). Le concept de logiciel libre a ensuite été étendu aux œuvres à la fin des années 90 avec l ’open content avec notamment la licence creative commons, souvent utilisée sur de la musique ou des créations graphiques. Le mouvement open access se focalise lui sur le libre accès de contenus numériques que ceux-ci soient libres ou non. Tous ces mouvements open sont assimilés au terme plus général d ’Open Knowledge (qui a sa propre fondation). Plus globalement les pionniers de l ’internet avaient des liens très importants avec la communauté scientifique au sein de laquelle le partage de la connaissance est ancrée depuis des décennies. Un exemple est la mise en place d’un accès institutionnel ouvert sur des données scientifiques de géophysiques dans les années 50. Déjà à l’époque plusieurs data centers avaient été mis en place pour réduire le risque de perte de données et maximiser l’accès à ces donneés. Ces capacités de partage numérique ont bien évidemment connu une accélération importante avec l’avènement d’internet. Des initiatives privées ont aussi mené à de l ’ouverture de données: Amazon (API sur les livres), Google Maps (fort levier d’innovation), … pratique généralisée désormais (twitter, facebook, …) Sur le partage de données publiques il faut citer d ’abord les pays anglo-saxons avec d’abord le gouvernement de Barrack Obama suivi rapidement par le Royaume Uni, qui se sont lancés dès 2009 dans le partage de données gouvernementales avec leur propres plateformes. En France comme vous devez le savoir, la ville pionnière est Rennes, avec d ’abord des données relatives au vélib local et 6 mois plus tard de nombreuses autres données. Enfin il convient de citer comme mentor sur ce sujet, Tim berners Lee: inventeur du World Wide Web. Il le créa pour partager des documents. Il proposa un peu avant 2009 de partager des données. Il s ’en expliqua dans une conférence TED que je vous encourage à visionner. RAW DATA NOW ! Le potentiel sous exploité des données. Tim berners Lee est co-directeur de l ’institut de l’open data en Angleterre et très impliqué dans l’ouverture de données dans l’open data Anglais. Par ailleurs il est membre du W3C qui régis les normes internet. Cet organisme a publié dès 2009 recommandations sur l ’ouverture des données publiques : http://www.w3.org/TR/gov-data/ .
Le mouvement open n ’est pas quelque chose de nouveau. Tout le monde connaît le mouvement open source: logiciel libre qui consiste à partager le code source des programmes. Cette philosophie était depuis très longtemps en place chez les développeurs et pionniers de l ’internet mais formalisée par Richard Stallman par le projet GNU en 1983 (création de la free software foundation). Il faut bien réaliser l’importance de ce mouvement basé sur la partage de la connaissance. Pour schématiser plus de 60% de la technique logicielle sur laquelle repose internet est basé sur l’open source (Apache, Linux). Le concept de logiciel libre a ensuite été étendu aux œuvres à la fin des années 90 avec l ’open content avec notamment la licence creative commons, souvent utilisée sur de la musique ou des créations graphiques. Le mouvement open access se focalise lui sur le libre accès de contenus numériques que ceux-ci soient libres ou non. Tous ces mouvements open sont assimilés au terme plus général d ’Open Knowledge (qui a sa propre fondation). Plus globalement les pionniers de l ’internet avaient des liens très importants avec la communauté scientifique au sein de laquelle le partage de la connaissance est ancrée depuis des décennies. Un exemple est la mise en place d’un accès institutionnel ouvert sur des données scientifiques de géophysiques dans les années 50. Déjà à l’époque plusieurs data centers avaient été mis en place pour réduire le risque de perte de données et maximiser l’accès à ces donneés. Ces capacités de partage numérique ont bien évidemment connu une accélération importante avec l’avènement d’internet. Des initiatives privées ont aussi mené à de l ’ouverture de données: Amazon (API sur les livres), Google Maps (fort levier d’innovation), … pratique généralisée désormais (twitter, facebook, …) Sur le partage de données publiques il faut citer d ’abord les pays anglo-saxons avec d’abord le gouvernement de Barrack Obama suivi rapidement par le Royaume Uni, qui se sont lancés dès 2009 dans le partage de données gouvernementales avec leur propres plateformes. En France comme vous devez le savoir, la ville pionnière est Rennes, avec d ’abord des données relatives au vélib local et 6 mois plus tard de nombreuses autres données. Enfin il convient de citer comme mentor sur ce sujet, Tim berners Lee: inventeur du World Wide Web. Il le créa pour partager des documents. Il proposa un peu avant 2009 de partager des données. Il s ’en expliqua dans une conférence TED que je vous encourage à visionner. RAW DATA NOW ! Le potentiel sous exploité des données. Tim berners Lee est co-directeur de l ’institut de l’open data en Angleterre et très impliqué dans l’ouverture de données dans l’open data Anglais. Par ailleurs il est membre du W3C qui régis les normes internet. Cet organisme a publié dès 2009 recommandations sur l ’ouverture des données publiques : http://www.w3.org/TR/gov-data/ .
Le mouvement open n ’est pas quelque chose de nouveau. Tout le monde connaît le mouvement open source: logiciel libre qui consiste à partager le code source des programmes. Cette philosophie était depuis très longtemps en place chez les développeurs et pionniers de l ’internet mais formalisée par Richard Stallman par le projet GNU en 1983 (création de la free software foundation). Il faut bien réaliser l’importance de ce mouvement basé sur la partage de la connaissance. Pour schématiser plus de 60% de la technique logicielle sur laquelle repose internet est basé sur l’open source (Apache, Linux). Le concept de logiciel libre a ensuite été étendu aux œuvres à la fin des années 90 avec l ’open content avec notamment la licence creative commons, souvent utilisée sur de la musique ou des créations graphiques. Le mouvement open access se focalise lui sur le libre accès de contenus numériques que ceux-ci soient libres ou non. Tous ces mouvements open sont assimilés au terme plus général d ’Open Knowledge (qui a sa propre fondation). Plus globalement les pionniers de l ’internet avaient des liens très importants avec la communauté scientifique au sein de laquelle le partage de la connaissance est ancrée depuis des décennies. Un exemple est la mise en place d’un accès institutionnel ouvert sur des données scientifiques de géophysiques dans les années 50. Déjà à l’époque plusieurs data centers avaient été mis en place pour réduire le risque de perte de données et maximiser l’accès à ces donneés. Ces capacités de partage numérique ont bien évidemment connu une accélération importante avec l’avènement d’internet. Des initiatives privées ont aussi mené à de l ’ouverture de données: Amazon (API sur les livres), Google Maps (fort levier d’innovation), … pratique généralisée désormais (twitter, facebook, …) Sur le partage de données publiques il faut citer d ’abord les pays anglo-saxons avec d’abord le gouvernement de Barrack Obama suivi rapidement par le Royaume Uni, qui se sont lancés dès 2009 dans le partage de données gouvernementales avec leur propres plateformes. En France comme vous devez le savoir, la ville pionnière est Rennes, avec d ’abord des données relatives au vélib local et 6 mois plus tard de nombreuses autres données. Enfin il convient de citer comme mentor sur ce sujet, Tim berners Lee: inventeur du World Wide Web. Il le créa pour partager des documents. Il proposa un peu avant 2009 de partager des données. Il s ’en expliqua dans une conférence TED que je vous encourage à visionner. RAW DATA NOW ! Le potentiel sous exploité des données. Tim berners Lee est co-directeur de l ’institut de l’open data en Angleterre et très impliqué dans l’ouverture de données dans l’open data Anglais. Par ailleurs il est membre du W3C qui régis les normes internet. Cet organisme a publié dès 2009 recommandations sur l ’ouverture des données publiques : http://www.w3.org/TR/gov-data/ .
Le mouvement open n ’est pas quelque chose de nouveau. Tout le monde connaît le mouvement open source: logiciel libre qui consiste à partager le code source des programmes. Cette philosophie était depuis très longtemps en place chez les développeurs et pionniers de l ’internet mais formalisée par Richard Stallman par le projet GNU en 1983 (création de la free software foundation). Il faut bien réaliser l’importance de ce mouvement basé sur la partage de la connaissance. Pour schématiser plus de 60% de la technique logicielle sur laquelle repose internet est basé sur l’open source (Apache, Linux). Le concept de logiciel libre a ensuite été étendu aux œuvres à la fin des années 90 avec l ’open content avec notamment la licence creative commons, souvent utilisée sur de la musique ou des créations graphiques. Le mouvement open access se focalise lui sur le libre accès de contenus numériques que ceux-ci soient libres ou non. Tous ces mouvements open sont assimilés au terme plus général d ’Open Knowledge (qui a sa propre fondation). Plus globalement les pionniers de l ’internet avaient des liens très importants avec la communauté scientifique au sein de laquelle le partage de la connaissance est ancrée depuis des décennies. Un exemple est la mise en place d’un accès institutionnel ouvert sur des données scientifiques de géophysiques dans les années 50. Déjà à l’époque plusieurs data centers avaient été mis en place pour réduire le risque de perte de données et maximiser l’accès à ces donneés. Ces capacités de partage numérique ont bien évidemment connu une accélération importante avec l’avènement d’internet. Des initiatives privées ont aussi mené à de l ’ouverture de données: Amazon (API sur les livres), Google Maps (fort levier d’innovation), … pratique généralisée désormais (twitter, facebook, …) Sur le partage de données publiques il faut citer d ’abord les pays anglo-saxons avec d’abord le gouvernement de Barrack Obama suivi rapidement par le Royaume Uni, qui se sont lancés dès 2009 dans le partage de données gouvernementales avec leur propres plateformes. En France comme vous devez le savoir, la ville pionnière est Rennes, avec d ’abord des données relatives au vélib local et 6 mois plus tard de nombreuses autres données. Enfin il convient de citer comme mentor sur ce sujet, Tim berners Lee: inventeur du World Wide Web. Il le créa pour partager des documents. Il proposa un peu avant 2009 de partager des données. Il s ’en expliqua dans une conférence TED que je vous encourage à visionner. RAW DATA NOW ! Le potentiel sous exploité des données. Tim berners Lee est co-directeur de l ’institut de l’open data en Angleterre et très impliqué dans l’ouverture de données dans l’open data Anglais. Par ailleurs il est membre du W3C qui régis les normes internet. Cet organisme a publié dès 2009 recommandations sur l ’ouverture des données publiques : http://www.w3.org/TR/gov-data/ .
Document = lisible par un être humain. Donnée = lisible par une machine.
Document = lisible par un être humain. Donnée = lisible par une machine.
Document = lisible par un être humain. Donnée = lisible par une machine.
Document = lisible par un être humain. Donnée = lisible par une machine.
Document = lisible par un être humain. Donnée = lisible par une machine.
Document = lisible par un être humain. Donnée = lisible par une machine.
Donné publique : sans commentaires Donnée ouverte : Complète : toutes les données sont mises à disposition (sauf limititations relatives à la vie privée et à la sécurité). Primaire : données non modifiées/traitées et sous la granularité la plus fine possible. Opportune : les données sont mises à disposition aussi rapidement que nécessaire pour préserver leur valeur. Accessible : les données sont accessible au plus grand nombre et pour des usages aussi divers que possibles. (A noter qu’il est possible de faire de l’ouverture des données en proposant un accès payant à la donnée ? Privilégiant l’accessibilité au plus grand nombre, je n’ai pas choisi de m’intéresser à ce volet de l’open data ….) Exploitable : les données sont exploitables par ordinateur ou lisibles par les machines. Non discriminatoire : les données sont accessibles à tous sans aucune obligation préalable ni inscription. Non propriétaire : les données sont accessibles dans un format sur lequel aucune entité a d ’un contrôle exclusif. Libre de droit : les données ne sont pas soumises au droit d ’auteur, à brevet, au droit des marques ou au secret commercial.
Aucun commentaire.
Exemples de données ouvrables ( Non exhaustive ) Données géographiques sur la description du territoire: cadastre, cartes, Fonds documentaires: études, statistiques, … Localisations et horaires des services publics et des commerces Fonctionnement d ’un réseau de transport urbain Des informations événementielles Données culturelles et touristiques Capteurs urbains temps réels Les dépenses anonymisées de nos députés Etc… En cherchant on peut toujours trouver de nouvelles données à ouvrir.
Exemples de données ouvrables ( Non exhaustive ) Données géographiques sur la description du territoire: cadastre, cartes, Fonds documentaires: études, statistiques, … Localisations et horaires des services publics et des commerces Fonctionnement d ’un réseau de transport urbain Des informations événementielles Données culturelles et touristiques Capteurs urbains temps réels Les dépenses anonymisées de nos députés Etc… En cherchant on peut toujours trouver de nouvelles données à ouvrir.
Exemples de données ouvrables ( Non exhaustive ) Données géographiques sur la description du territoire: cadastre, cartes, Fonds documentaires: études, statistiques, … Localisations et horaires des services publics et des commerces Fonctionnement d ’un réseau de transport urbain Des informations événementielles Données culturelles et touristiques Capteurs urbains temps réels Les dépenses anonymisées de nos députés Etc… En cherchant on peut toujours trouver de nouvelles données à ouvrir.
Exemples de données ouvrables ( Non exhaustive ) Données géographiques sur la description du territoire: cadastre, cartes, Fonds documentaires: études, statistiques, … Localisations et horaires des services publics et des commerces Fonctionnement d ’un réseau de transport urbain Des informations événementielles Données culturelles et touristiques Capteurs urbains temps réels Les dépenses anonymisées de nos députés Etc… En cherchant on peut toujours trouver de nouvelles données à ouvrir.
Exemples de données ouvrables ( Non exhaustive ) Données géographiques sur la description du territoire: cadastre, cartes, Fonds documentaires: études, statistiques, … Localisations et horaires des services publics et des commerces Fonctionnement d ’un réseau de transport urbain Des informations événementielles Données culturelles et touristiques Capteurs urbains temps réels Les dépenses anonymisées de nos députés Etc… En cherchant on peut toujours trouver de nouvelles données à ouvrir.
Exemples de données non ouvrables Sécurité : défense nationale, sécurité de l ’état, … Vie privée: casier judiciaire, historique des hospitalisations, … Question de droit: données appartenant à un tiers, …
Dors et déjà il faut savoir que la législation européenne et française encourage fortement à pratiquer l ’ouverture des données publiques. Du côté de l ’Europe les choses ont pris forme avec une première directive en 2003 visant à encourager et encadrer l’ouverture de documents administratifs. Celle-ci a ensuite été transposée dans le droit français en 2005. Vient ensuite en 2007 la directive INSPIRE visant à faciliter et accélérer la libération de données géographiques par les administrations : cadastre, PLU, transports, données environnementales …. Par ailleurs le plan France Numérique 2012 et le volet numérique du plan de relance prévoient des mesures pour accompagner l ’ouverture des données. A noter qu ’il y a un précédent dans la législation française la loi du 17 Juillet 1978. Elle définit un cadre légal propre à l’exploitation des données publiques et reconnaît à toute personne un droit d’accès et de réutilisation des informations publiques. Le concept n’est donc pas nouveau, mais seulement actualisé, élargi et mis en œuvre. En France, l ’organisme responsable de la veille sur le respect de cette loi est la CADA : Commission d’Accès aux Documents administratifs. Peut vous aider pour obtenir un document administratif qui vous a été refusé. Dans les faits tout n ’est pas encore accessible. Un exemple : l’accès au fichier avec la liste des stations d’essence et leurs tarifs coûte 38 500 euros pour un usage commercial. Idem pour la liste des voitures commercialisées en France.
http://doc.openfing.org/RDPU/GuidePratiqueDonneesPubliquesv1beta.pdf Améliorer les processus bureaucratiques sont des objectifs fréquemment avancés par les acteurs publics: baisser les coûts, gagner en efficacité, supprimer les redondances, mieux évaluer l’action publique … Les administrations produisent, seules ou à l’aide de tiers, des informations destinées à éclairer les choix dans les politiques publiques. Ces données sont souvent coûteuses à produire et difficile à partager car bloquées dans un intranet … La circulation de ces informations n’est pas chose aisée.
http://doc.openfing.org/RDPU/GuidePratiqueDonneesPubliquesv1beta.pdf Décloisonner l’action publique Les divers ministères ou directions d’une collectivité travaillent bien souvent sur des objets communs. Comment éviter de reproduire 2 fois le même travail ? Comment échanger ces données pour travailler sur des bases communes ou croiser les données pour mieux évaluer l’action publique ? l’open data peut être un début de solution. Rendre l’action publique plus lisible La mise à disposition des données est une manière indirecte de rendre l’action plus intelligible. Les longs documents administratifs sont parfois assez indigestes et une visualisation des données intelligentes peut être un bon moyen pour rendre plus compréhensible l’action publique, voire même détecter des corrélations invisibles. Nous verrons tout à l’heure un exemple très parlant de treemapping dans ce domaine. Inviter au partage et à la collaboration En ouvrant ses données l’administration invite de fait d’autres acteurs (citoyens, associations ou entreprises) à enrichir une sorte de « domaine public » de l’information. Par exemple en bretagne la petite commune de plouarzel s’est rendu compte qu’elle n’avait pas les moyens nécessaires pour maintenir son plan communal. Elle a donc fait le choix d’ouvrir son plan sur open street map et a organisé avec les habitants une cartopartie pour la mettre jour.
http://doc.openfing.org/RDPU/GuidePratiqueDonneesPubliquesv1beta.pdf Dédramatiser la transparence A l’évidence l’open data est un outil de transparence. Elle permet à des tiers d’analyser les politiques publiques et pourquoi pas de proposer des axes d’améliorations ou de mettre en exergue des dysfonctionnements. La transparence a relativement mauvaise presse en France. Elle est vue comme un objet de soupçon systématique ou de dénonciation, surtout après l’affaire wikileaks. C’est pourtant un vecteur important d’amélioration des politiques publiques et de moralisation de la vie politique. En suède, une loi de 1776 autorise tout citoyen à accéder en moins de 24h aux notes de frais des ministres. Bon en France, je crois que nos amis députés sont relativement réticents ? Chacun porte là dessus le regard qu’il souhaite. Je pense pour ma part que c’est un élément important pour le renouvellement de nos démocraties. La participation sur des bases communes On connaît l’importance et les limites de la démocratie participative. Les acteurs variés participant au débat sont souvent les mêmes (associations de consommateurs, personnes syndiquées) qui arrivent bien souvent avec chacun leurs chiffres. Ouvrir des données permet au moins de partager des chiffres communs, voire même des outils d’analyse, sur lesquels une analyse commune peut permettre probablement de faire mieux avancer le débat. Exemple : article du monde. Des chercheurs ont prouvé la nocivité du maïs transgénique de mon santo résultats en open data.
http://doc.openfing.org/RDPU/GuidePratiqueDonneesPubliquesv1beta.pdf Innovation sociale et innovation économique Face à l’urgence et la complexité des enjeux territoriaux, aux contraintes financières et à l’émergence de nouveaux défis (ville durable, vieillissement, …), à la diversité des besoins, les acteurs publics ne peuvent plus être les seuls à délivrer des services aux citoyens. Ouvrir des données c’est permettre à d’autres acteurs de développer des nouveaux services au bénéfice de tous. L’exemple des données transport est frappant. A Rennes par exemple, développer des applications mobiles de qualité pour les transports et bien maintenues aurait probablement été trop coûteux. Les citoyens se sont donc emparés des données ouvertes relatives aux transports pour développer des applications. Certaines applications sont utilisées par plus de 600 personnes par jour. Certaines proposent même des services de calcul multimodal, pourtant si complexes et coûteux à mettre en place. Certains réutilisateurs feront des miracles techniques, d’autres proposeront des idées novatrices, d’autres échoueront. Mais globalement, à moindre coût ont peut espérer des nouveaux services aux citoyens. Un effet sur l ’attractivité des territoires La mise à disposition de certaines données, par exemple relatives à la culture, à l’économie, au tourisme, … peut contribuer à des réutilisations renforçant l’attractivité du territoire. On verra tout à l’heure un exemple avec Home’n’go ou encore dans le cadre du ROI.
http://doc.openfing.org/RDPU/GuidePratiqueDonneesPubliquesv1beta.pdf Mettre en valeur les données culturelles, patrimoniales Faute de moyen, les collectivités publiques exploitent souvent assez mal leur patrimoine d’information. C’est souvent le cas des données culturelles : fonds documentaires, œuvres numérisées, affiches documents audiovisuels, … L’open data permet d’augmenter considérablement la visibilité de ces ressources. Un exemple : les cartes postales de Saône-et-loire est un des jeux de données les plus réutilisé.
La réutilisation des données prend des formes multiples et parfois même inattendues. Attention : l ’open data ne permet pas l’innovation => il la facilite. Il n’est pas la seule condition. Exemple sur l ’étude de physique sociale sur les velov de lyon => difficulté à récupérer les données. Parmi celles-ci : La simple analyse des données ou bien même le croisement des données entre elles peut être source d ’études et de statistiques. Le journalisme peut lui aussi s ’appuyer sur des données ouvertes pour analyser, voire critiquer les politiques publiques. Les données brutes peuvent servir à créer des visualisations diverses et variées permettant de mettre en perspective les données. Comme on a pu déjà le voir, les données ouvertes peuvent servir à créer des applications web ou mobiles utiles au citoyen. C ’est le cas des données transport qui ont donné lieu à de nombreuses applications. Les données peuvent aussi être utilisées pour enrichir des services existants. Enfin, les formes de réutilisation sont toujours très variées et parfois surprenantes. Il n ’est pas exclu que les données soient des éléments constituant d’une œuvre originale. Après il y a des exemples concrets très frappant. L ’ouverture de données environnementales au royaume uni a permis de belles trouvailles: La comparaison des hôpitaux sur les infections nosocomiales a permis de les réduire de 80 % Le croisement des données ouvertes a permis la réduction de 30% la facture énergétique des bâtiments publics en seulement deux mois.
Un premier exemple simple sur des données transports. Lauréat du concours Rennais. Succès populaire. Open source => déploiement sur d ’autres villes open data. (En recherche de contacts sur Rouen).
Un autre exemple plus abouti. Celui-ci n ’existe pas seulement grâce à l’open data, mais s’enrichi des données ouvertes.
Quelques exemples simples de data journalisme et data visualisation. Le premier qui je trouve est très frappant : Il permet de mieux appréhender le budget de l ’état. Le second permet de situer où se trouvent riches ! Viennent ensuite 2 data viz. Une originale qui montre bien la force de la représentation des données. Une autre permet de mieux voir quels sont les types d ’athlètes en fonction des pays et des sports. De nombreuses surperbes data visualisations disponibles ici : http://www.informationisbeautifulawards.com
Bien évidemment quand une collectivité investit dans l ’open data elle attend un retour sur investissement. Bien sûr c ’est là que le bât blesse car évidemment il est très difficile à évaluer. Des études ont été réalisées, notamment au niveau européen. Une étude de 2006 évaluaient le marché global (je dis bien global, cela va au-delà du seul mouvement de réutilisation des données publiques) à 27 milliards d ’euros. J’avoue que ce chiffre me laisse perplexe et je serais curieux de voir comment il a été calculé. Quoiqu ’il en soit cela n’est pas un ROI. Parmi les formes de calcul de ROI on trouve souvent ce genre de calcul. Je prends l ’exemple le plus connu de Washington qui avait lancé un concours d’application déjà en 2008. Ils ont fait un calcul de ROI que je qualifierais de bête et méchant ! Bête surtout ! 47 applications ont été créées pour une valeur totale estimée aux environs de 2 000 000 de dollars => Comme ils avaient investit 50 000 $ pour faire leur concours on obtient un ROI de 4 000 %. Formidable !!!! Tous à l ’open data !!! Comme vous vous en doutez c ’est une approche très partielle du problème. Quels problèmes voyez-vous dans ce calcul ? Pas de reflet des bénéfices collectifs ça a servi ces applications ? Y a pas des applications redondantes ? Applications sur les transports ! Ces applications sont-elles utiles, durables et maintenues ? Il n ’y a pas que les applications ! Etudes, statistiques, …. Comme on le voit l ’évaluation ROI est une équation avec une infinité d’inconnus.
C ’est pourquoi je vous propose de prendre en considération ces quelques éléments (non exhaustifs) dans votre appréhension du ROI. Certes tout n’est pas calculable, mais parcontre tout mérite d’être pris en compte. Le ROI ne se mesure pas seulement avec le nombre de start ups créées. Bénéfice d ’image : innovation ! Territoire numérique ! Quel bénéfice d’image ai-je tiré de mon investissement dans l’open data ? Quelles retombées médiatiques ? C ’est un peu moins vrai maintenant, car il y a maintenant de nombreux précédents en France. Néanmoins ça reste toujours d’actualité, surtout si de nombreuses applications sont développées. D’où l’intérêt de faire des concours de développement. Cela est bien sûr un élément qui renforce l’attractivité du territoire.
Rationalisation du SI : collecte des données Ai-je amélioré mon SI pour collecter et mettre à disposition des données ? Les utilisateurs de mon SI sont ils plus performants dans son exploitation ? Collecter des données, les formater, les mettre à disposition sont des opérations complexes, techniques, répétitives. Tous les processus liés doivent être améliorés dans le cadre de l ’open data. En les améliorant on les maîtrise mieux, on en réduit les coût et on les fluidifie. Cela profite à tout le monde. Exemple du fichier excel à Rennes Métropole.
Meilleur partage des données Mes données ont-elles été réutilisées ? Ont-elle profité à du monde ? D’autres collectivités publiques ? Des associations ? Des particuliers ? Toutes ses améliorations permettent nécessairement un meilleur partage de la donnée. Et les premiers bénéficiaires de ces progrès sont avant tout les collectivités elles-même !!! Cela peut surprendre, mais c ’est la réalité. Après comme on l’a vu tout un chacun peut exploiter alors la donnée laissant place à la créativité de chacun tout en leur épargnant l’effort auparavant important de « recherche » la donnée. Les applications créées ont-elles été utilisées
Transparence Ai-je contribué à renforcer la transparence de mon administration ? Cet effort a-t-il été remarqué ? L’action publique locale a-t-elle mieux comprise ou promue ? Cela a-t-il permet de mettre en exergue des disfonctionnements ? L ’effort de transparence est toujours remarqué. A terme ce sera réellement, je crois, un vecteur important d’améliorations de nos démocraties. Dans ce domaine je vous invite à vous renseigner sur les progrès de l’Australie dans ce que l’on appelle le gouvernement 2.0. http://www.regardscitoyens.org/le-gouvernement-2-0-en-australie/
Dynamisation secteur numérique local Ai-je dynamisé le secteur numérique local ? Des scientifiques ont-ils réutilisé nos données ? Des étudiants ? Des entreprises ? Des start-ups ont-elles été créées ? Des applications ou services innovants sont-ils apparus ? Bien évidemment, la mise à disposition de données dynamise forcément toutes les structures relatives aux numériques. Que ce soit des entreprises à stratégie nationale comme Home ’n’go ou des entreprises ou instituts scientifiques locaux. Mettre à disposition des données lève réellement un frein : bien souvent les données auraient été sinon difficile ou impossible à obtenir.
Naissance de collaborations Administrations <-> citoyens Enfin le bénéfice principal et qui à mon sens n ’a pas de prix, c’est le renouvellement du dialogue et des collaborations entre administration et citoyens. L’ouverture des données a-t-elle donné lieu à des échanges et des collaborations entre pouvoir publics et réutilisateurs ? Cela peut se faire sur des axes différents: La réutilisation des données => à quoi correspondent ces données ? L ’administration productrice peut les expliquer, voire même les justifier. L ’amélioration des données => difficile de bien comprendre les formats, de détecter toutes les erreurs => sur Rennes le SIG et Keolis ont réellement profiter de « l’expertise citoyenne » Enfin l ’analyse des données peut permettre de mettre en exergue des pistes d’améliorations des politiques publiques ou de l’utilisation des fonds publiques. On en a donné un exemple au Royaume Uni avec l’énergie dans les bâtiments publics ou bien encore les maladies nosocomiales… De nombreuses autres choses sont encore à trouver ! Voilà pour quelques pistes à prendre en compte dans votre évaluation du retour sur investissement dans votre futur implication je l ’espère dans l’open data.
Alors où en est-on en France ? Sans avoir l ’ordre exact. Rennes pionniers : vélo puis transports puis plein d ’autres données. Concours déjà réalisé plus de 40 applications. (Beaucoup moins un an à près ! Comment pérenniser ?) Paris. Avec même la RATP et bientôt JCDecaux Saône et loire : bonne initiative. Concours déjà réalisé. Plateforme windows Azure avec des prémices de datavisualisations. Nantes: concours terminé. Suivi de la loire-atlantique et des pays de La Loire. Bordeaux : la cub et la region aquitaine. Région PACA. Toulouse : concours en cours. Versailles, le mans, rouen, brest, le havre, A noter la SNCF n ’est pas sur la carte…
Quels sont les principaux enjeux pour les collectivités pour les années à venir dans le domaine de l ’open data ? Je souhaite dans un premier temps souligné un point important qui dépasse un peu le cadre de l ’open data. L ’informatisation croissante du monde et des administrations en général nous oblige à développer la culture de la donnée. Développer la culture de la donnée c ’est : - Faire de la pédagogie : Qu ’est-ce qu’une donnée ? Comment on la représente ? Comment on la produit ? Comment les gens la réutilisent ? pour promouvoir l’open data dans vos administrations et le mettre en place cette compréhension de la notion de données est essentielle ! TOUS INFORMATICIENS ! - Montrer ce que sont les données que l ’on met à disposition. Il faut donc faire des efforts dans la promotion des données mises à disposition. Des progrès dans ce domaine peuvent être fait. Certainement plus facilement en partenariat avec les réutilisateurs. A l’heure actuelle la promotion passe beaucoup par des concours de développement. Il faut innover dans ce domaine. Les concours montrent aussi certaines limites. Des synergies sont à mettre en place. Plus les données seront connues, réutilisées et « appréciées » plus il sera simple de justifier la maintenance de ces données. Plus de mutualisation. L ’open data a un coût important. Néanmoins il y a de nombreux aspects techniques et répétitifs lesquels peuvent évidemment être plus automatisés (création d’outils de génération des données). Cela peut être un axe important de réduction de coût. Au-delà du partage des coûts, la mutualisation apporte du partage d’expérience de notoriété. La mutualisation représente aussi un axe majeur dans l ’homogénéisation indispensable des formats d’ouverture et des licences. Des efforts doivent être réalisés dans la maintenance des données. Pour cela de meilleurs outils pour produire les données dans les bons formats peuvent être développés et partagés. Par exemple, les données transports sont la plupart du temps (pas tout le temps) ouvert dans un format appelé GTFS. L ’exploitation de ce format n’est pas la même d’une initiative open data à l’autre et la mise à jours de ces données transport est par ailleurs tout à fait inégale. Exemple de Rennes, Nantes et Bordeaux. Une plus grande transparence dans le processus de sélection des données à ouvrir serait profitable à tous. Aux réutilisateurs, comme aux autres initiatives open data. On trouve à l ’heure actuelle une grande disparité dans les données ouvertes. Pourquoi une ville ouvre ses données culturelles et une autre non ? Faut-il légiférer pour uniformiser ? Le dialogue aussi entre administration et réutilisateurs est à améliorer. Cela passe notamment par : De meilleurs outils pour échanger (le forum est-il suffisant ?) Une meilleure réactivité de l ’administration (moins d’intermédiaire) Enfin bien sûr plus de données !!!! On ne fera pas de l ’innovation seulement avec la géolocalisation des plantes vertes ! On en fera avec ! Mais on en fera encore plus avec plus de données et plus variées.
Quels sont les principaux enjeux pour les collectivités pour les années à venir dans le domaine de l ’open data ? Je souhaite dans un premier temps souligné un point important qui dépasse un peu le cadre de l ’open data. L ’informatisation croissante du monde et des administrations en général nous oblige à développer la culture de la donnée. Développer la culture de la donnée c ’est : - Faire de la pédagogie : Qu ’est-ce qu’une donnée ? Comment on la représente ? Comment on la produit ? Comment les gens la réutilisent ? pour promouvoir l’open data dans vos administrations et le mettre en place cette compréhension de la notion de données est essentielle ! TOUS INFORMATICIENS ! - Montrer ce que sont les données que l ’on met à disposition. Il faut donc faire des efforts dans la promotion des données mises à disposition. Des progrès dans ce domaine peuvent être fait. Certainement plus facilement en partenariat avec les réutilisateurs. A l’heure actuelle la promotion passe beaucoup par des concours de développement. Il faut innover dans ce domaine. Les concours montrent aussi certaines limites. Des synergies sont à mettre en place. Plus les données seront connues, réutilisées et « appréciées » plus il sera simple de justifier la maintenance de ces données. Plus de mutualisation. L ’open data a un coût important. Néanmoins il y a de nombreux aspects techniques et répétitifs lesquels peuvent évidemment être plus automatisés (création d’outils de génération des données). Cela peut être un axe important de réduction de coût. Au-delà du partage des coûts, la mutualisation apporte du partage d’expérience de notoriété. La mutualisation représente aussi un axe majeur dans l ’homogénéisation indispensable des formats d’ouverture et des licences. Des efforts doivent être réalisés dans la maintenance des données. Pour cela de meilleurs outils pour produire les données dans les bons formats peuvent être développés et partagés. Par exemple, les données transports sont la plupart du temps (pas tout le temps) ouvert dans un format appelé GTFS. L ’exploitation de ce format n’est pas la même d’une initiative open data à l’autre et la mise à jours de ces données transport est par ailleurs tout à fait inégale. Exemple de Rennes, Nantes et Bordeaux. Une plus grande transparence dans le processus de sélection des données à ouvrir serait profitable à tous. Aux réutilisateurs, comme aux autres initiatives open data. On trouve à l ’heure actuelle une grande disparité dans les données ouvertes. Pourquoi une ville ouvre ses données culturelles et une autre non ? Faut-il légiférer pour uniformiser ? Le dialogue aussi entre administration et réutilisateurs est à améliorer. Cela passe notamment par : De meilleurs outils pour échanger (le forum est-il suffisant ?) Une meilleure réactivité de l ’administration (moins d’intermédiaire) Enfin bien sûr plus de données !!!! On ne fera pas de l ’innovation seulement avec la géolocalisation des plantes vertes ! On en fera avec ! Mais on en fera encore plus avec plus de données et plus variées.
Du côté des réutilisateurs citoyens, collectifs ou entreprises il y a plusieurs aussi plusieurs axes d ’amélioration. Le premier est la pérennisation des applications et visualisations des données créées. Une application ne fonctionnant plus, une application ou une visualisation utilisant des données dépassées est une mauvaise pub pour tout le monde. Pérenniser passe par deux choses: Bien développer pour faciliter la maintenance Trouver un retour sur investissement justifiant de maintenir les services développés. Les réutilisateurs doivent aussi être une force active dans la promotion de la culture de la donnée. Dans la pédagogie et dans la promotion des données ouvertes. Elles peuvent contribuer à rallier différents métiers autour de la réutilisation des données. Bien sûr c ’est un travail de longue haleine mais qui doit être fait. Que ce soit pour la pérennisation des applications ou bien la promotion de la culture de la donné une créativité sans limite est le meilleur faire valoir. A nous de nous creuser les méninges pour prouver tous les jours la puissance de l ’ouverture des données.
Du côté des réutilisateurs citoyens, collectifs ou entreprises il y a plusieurs aussi plusieurs axes d ’amélioration. Le premier est la pérennisation des applications et visualisations des données créées. Une application ne fonctionnant plus, une application ou une visualisation utilisant des données dépassées est une mauvaise pub pour tout le monde. Pérenniser passe par deux choses: Bien développer pour faciliter la maintenance Trouver un retour sur investissement justifiant de maintenir les services développés. Les réutilisateurs doivent aussi être une force active dans la promotion de la culture de la donnée. Dans la pédagogie et dans la promotion des données ouvertes. Elles peuvent contribuer à rallier différents métiers autour de la réutilisation des données. Bien sûr c ’est un travail de longue haleine mais qui doit être fait. Que ce soit pour la pérennisation des applications ou bien la promotion de la culture de la donné une créativité sans limite est le meilleur faire valoir. A nous de nous creuser les méninges pour prouver tous les jours la puissance de l ’ouverture des données.
Enfin il faut souligner que l ’on a séparé les axes de progression pour producteurs de données et réutilisateurs, mais en réalité les deux ne progresseront que s’ils collaborent ! On y arrivera mieux ensemble. C’est pourquoi les outils et les pratiques d’échange et de collaboration entre administration et réutilisateurs jouent un rôle essentiel. Exemple à Rennes : étude coproduite avec les citoyens sur leur comportement piéton. Ces synergies sont à mettre en place, le risque sinon est que l ’open data ne devienne qu’un outil de communication de plus, loin des promesses de transparence et de démocratie 2.0.
Si vous souhaitez allez plus loin dans l ’open data en tant que DSI. Je vous renvoi vers le site Open data France qui regroupe un collectif information sur la libération des données publiques. Il regroupe de nombreux documents sur le sujet. Puis 2 excellents documents : Guide pratique de l ’ouverture des données publiques territoriales : http://doc.openfing.org/RDPU/GuidePratiqueDonneesPubliquesv1beta.pdf Pour une politique ambitieuse des données publiques : http://www.ladocumentationfrancaise.fr/var/storage/rapports-publics/114000407/0000.pdf Voilà et si vous voulez élargir votre connaissance de la culture de la donnée, il y a des sujets connexes intéressants comme notamment : Big data : comment exploiter la masse de données aujourd ’hui à notre disposition. Les licences : nous avons évoqué ce sujet. Celui-ci est très vaste et mérite que l ’on y regarde de près.
Voilà enfin quelques références pour vos recherches. http://www.gfi.fr/fr/shareholders/communiques/2012/communique_10052012.php http://internetactu.blog.lemonde.fr/2011/12/02/open-data-lavenir-de-la-reutilisation-des-donnees-publiques/
Stratégie participative (Posture défensive) Prévenir l ’usage sauvage Contrôler ma marque Le fait d ’ouvrir des données en leur appliquant une licence spécifique vous permet de contrôler la qualité de l’information fournie et d’éviter l’utilisation sauvage des données, problème qui peut être très complexe à gérer après coup. L’exemple bien connu de la RATP ou encore JCDecaux. La licence peut permettre de fixer un cadre à la réutilisation des données, permettant par exemple de mettre à disposition des données de transport tout en obligeant à ne pas s’associer à l’image de la société de transport en commun. La posture défensive est souvent un point de départ et permet de se diriger plus rapidement vers une posture ensuite offensive. (Posture offensive) Valoriser son patrimoine informationnel. Profiter de l ’externalité des réseaux. Faire développer par des tiers On ne peut pas financer des réutilisations ni même toutes les imaginer. En ouvrant des données, on a une chance de mieux les valoriser qu ’en les mettant sur un site web. Devant l’augmentation du nombre de supports numériques (tablettes, tv connectée, …) est-il préférable de valoriser ces données plutôt que de s’engager dans une course coûteuse de récupération d’audience vers un site officiel ? Exemple du tourisme : le site data.visitprovence.com fourni quantité de données touristiques sur la région provence. On utilise les autres réseaux pour valoriser son propre patrimoine de données. Ses réseaux peuvent être par exemple des développeurs de services ou d ’applications. Eux auront la capacité à réutiliser les données, à les faire valoir sur différents supports, à développer des services très spécifiques que l’on n’aurait jamais eut les moyens d’adresser. Il existe des sites spécifiques pour les camping-caristes qui recense les aire de service pour camping cars en France. Stratégie de transparence (Posture défensive) Rendre des comptes : certaines activités soumises à la pression publique (énergie, finance) et/ou à un droit de regard d ’un régulateur. Cette pression peut être l’élément déclencheur de la mise en place d’une démarche d’ouverture de données. Datawashing : similaire à l ’éco blanchiment « greewashing ». On peut envisager d’ouvrir des données pour la simple motivation de donner une image de transparence. C’est notamment vraie dans le secteur privé. Par exemple Apple très critiqué pour l’écologie et les conditions de fabrication de ses produits fait un effort important de transparence sur ces aspects. C’est souvent les entreprises les plus critiquées qui font le plus gros effort de transparence. Ce faut le cas aussi notamment de nike aux USA, ou encore de TOTAL, … (Posture offensive) Répondre à un enjeu de gouvernance : Il s ’agit d’anticiper la demande de transparence en publiant des données sur le fonctionnement de son activité ou de ses missions. La qualité de service par l ’information : pour les activités de service, le fait même de fournir une information sur la qualité de service tend à améliorer la perception des usagers (image). La sncf en est exemple : l’ouverture des données ne fait certes pas arriver les trains en l’heure mais elle est jugée postivement par les utilisateurs. Préparer au changement : diffuser des données peut être un élément déclencheur dans la réalisation d ’un diagnostique commun.
Lorsque l ’on ouvre des données publiques, on fait déjà un effort de transparence sur le travail des pouvoirs publics concernés par ces données. Plus de transparence implique forcément plus de confiance chez les citoyens. Plus on met à disposition des données, plus on délivre des informations et donc des outils pour la compréhension et la participation des citoyens. Si on développe la participations de citoyens, mais aussi celle des pouvoirs publics, on développe la collaboration. Il est important de noter que les pouvoirs publics doivent s ’impliquer dans l’échange autour des données. Sur Rennes certains services interagissent directement via un forum sur les données ouvertes. Cela donne lieu à des correctins, améliorations ou parfois même d’explications. Si on développe la collaboration on facilite l ’innovation. L ’innovation et le progrès autour des données peut prendre différentes formes : Innovation dans l ’exploitation des données => l’analyse et le croisement des données est source de créativité Innovation dans la collecte et le partage des données => La collecte de données est souvent un processus complexe qui a un coût qui peut souvent être optimisé (automatisé). Le partage de l ’information est aussi un processus techniquement complexe. Une mise à disposition de données de qualité est souvent complexe à mettre en place et à optimiser : standard, accessibilité, disponibilité, … Innovation dans les politiques publiques => il y a nombre de budgets qui pourraient être optimisés, mais aussi des politiques écologiques, … Pour cela les amateurs passionnés doivent avoir les éléments pour proposer leur éclairage.
Comme évoqué dans le précédent Slide, l ’open data permet de mettre en place un nouveau modèle d’échange. C ’est que ce schéma résume. Comme on peut le voir, autour des données peuvent se mettre en place de nouveaux modes de collaborations entre les citoyens et l ’état: que ce soit l’administration ou les politiques publiques.
Au final pour résumer comment fait-on pour ouvrir des données ? La première étape est bien sûr de faire de la pédagogie en local, d ’expliquer la démarche et d’obtenir l’adhésion du plus grand nombre car bien évidemment ce sera l’affaire de nombreux services différents de trouver et d’ouvrir des données. La deuxième étape est que les différents acteurs identifient les données à ouvrir. Cela peut engendrer d ’avoir à reconsidérer les clauses des contrats. En effet, il faudra vérifier que dans vos appels d’offres que le commanditaire aura tous les droits sur les données collectées. Il faut ensuite choisir la licence que vous souhaitez appliquer sur vos données. Je vous invite à aller voir wikipédia pour voir quel a été le choix de licence des différentes initiatives open data française. Et puis il faut diffuser ces données. Doit-on avoir notre propre site ? Doit-on avoir une solution propriétaire ou éprouvée ? Dois-je gérer cette plateforme ? Dois-je publier ces données sur une plateforme déjà en place ? C ’est un sujet vaste sur lequel je n’ai pas choisi de m’attarder, mais je vous invite à faire le tour. Voilà ! Tout cela fait, il faut faire la promotion de ces données, de la pédagogie, installer des canaux d ’échanges entre les personnes qui ouvrent les données et les ré utilisateurs pour que des synergies pour améliorer la qualité technique des données ou bien même les politiques qui ont amené aux résultats mis en exergue par les données. Les réutilisations de données alors viendront. Il sera bon à ce moment là de les soutenir si cela présente un intérêt pour la collectivité. Communication, aides diverses, etc …
Si vous êtes convaincu de l ’ouverture des données il faudra choisir une licence ouverte sous laquelle vous réalisez l’ouverture de données. Une licence défini les conditions d ’accès et de réutilisation des données ouvertes. Il y plusieurs conditions d ’accès Accord exclusif : une seule entreprise est déléguée pour diffuser les données Licence payante Conditions sous licence ouverte : l ’accès est ouvert mais la rediffusion sous une autre forme est soumise à conditions Sur demande : accès sous conditions. Sans aucune restriction : accès libre. Cas des données entrées dans le domaine public. Quelles formes de contraintes sur la réutilisation peut-on mettre dans une licence ? Puis-je monter une activité rémunératrice ? Dois-je citer mes sources ? Puis-je modifier la donnée affichée ? Ils en existent de nombreuses avec chacune leur subtilité sur ces différents points (accès et réutilisation). Je vous invite à vous renseigner sur la licence ouverte etalab, odbl, creative commons, …
Un premier exemple simple sur des données transports. Lauréat du concours Rennais. Succès populaire. Open source => déploiement sur d ’autres villes open data. (En recherche de contacts sur Rouen).