Restitution des groupes de travail du Bar Camp Datapride du 11 octobre 2012 à Nantes.
Quatre groupes se sont constitués lors de ce Bar Camp pour approfondir les thématiques identifiées en introduction : les données structurées et le web sémantique ; l'usage, la monétisation et les questions juridiques ; la fouille de données ; la transformation des données.
Ces éléments de rélfexion nous permettront de planifier de futurs rendez-vous autour de la donnée pour approfondir les thèmes ainsi identifiés.
Bar Camp Datapride 11/10/2012 - Compte rendu des groupes de travail
1. Barcamp Datapride – 11 oct. 2012
Restitution des groupes de travail
1. Données structurées et web sémantique
2. Usages, monétisation, questions juridiques
3. Fouille de données
4. Transformation des données
2. Problématiques Générales
● Production ● Visualisation de données
● Crowdsourcing ● Capture, traçabilité et
● Qualité des données : validation
homogénéisation et ● Stockage, duplication,
normalisation partitionnement
● Web sémantique ● Interfaces de modélisation
● Linked data des données
● Analyse de données non ● Droit d'usage des données
structurées ● Transformation de formats
● Séries temporelles ● Interopérabilité
● Métadonnées ● Fouille dans les données
● Données géographiques ● Éditorialisation, curation
● Transport des données ● Data journalisme
● Statistiques et data mining
4. Sujets identifiés sur ce thème
● Choix entre API ou données structurées ?
● Distribution des données - télécharger pour utiliser le Web
comme base de données : quelles implications techniques
(mémoire, etc.) ?
● Migration de l'existant, semantisation - outils / formats
interopérables... Quels outils pour sémantiser les données ?
● Montée à l'echelle des données, de leur stockage et du
requêtage
● Les triple-store sont-t-il adaptés pour la fouille de donnée ?
● Accès au grand public de ces technologies pour produire des
données ?
● Marché du web semantique - besoin, compétences,
opportunités ?
6. Sujets identifiés sur ce thème
● Modes d'exploitation et publication des données
● Licences : comparatif, contraintes, éxistant
● Droits dérivés: la transformation change-t-elle le droit des données ?
● Quelles diifférences juridiques entre les pays ?
● Quelle position de la CNIL et exemples d'abus ?
● Question de la tracabilité des données
● Qualité de la donnée: standards, cohérence dans les démarches ?
● Monétisation: comment gagner sa vie avec des données libres ?
● Usages: implication du grand public important, comment le former à
la consultation, production, interpretation ?
● Développer des démoparty pour montrer au grand public ce que l'on
fait avec les données ?
● Points licence droit d'auteur- Démoparty avec partenaires spécialisés
dans la formation ?
● Formations possibles : exploitations des données, cycles des
données, qui vit des données, demo party
9. Sujets identifiés sur ce thème
Approche philosophique, différentes dimensions : Parallèle avec
l'archéologie, on la trouve, on l'extrait, on la travaille.
● Exploration (scrapping, données structurées ou non-
structurées)
● Comment les trouver: idée d'un catalogue/search - datapedia ?
● Fouille: faire le lien entre une donnée et la valorisation qu'on
va en faire, répondre à un problème, à un besoin - design
d'utilisation. Ateliers sur les process de valorisation ?
● Quelles représentations pour ces données (images, graphs,
tableaux, etc) - sous forme de jeux : à partir de la même
donnée, quelles visualisations ?
10. 4. Transformation des données
"Tout travail sur les données est une transformation:
croiser, enrichir, simplifier, etc" (le groupe)
11. Sujets identifiés sur ce thème
● Transformations entre format de données - à semantique
identique.
● Transformations en changeant la sémantique
● Comment formaliser cette transformation de donnée ?
● 2 types de rencontres à envisager ? En largeur (plusieurs pitchs
de différents exemples de transformations) et en profondeur
(conférence avec intervenant unique )
● Themes pour les rencontres : classification des transformations
(taxonomie par exemple - à travailler avant présentation)
● Problème central : l'expression des transformations, dans quel
language exprime-t-on la transformation ? SQL ? Interface
évoluées ? Languages naturels simplifiés ? Nécessité de
reflechir sur la génération de transformation
● Simplification des transformations, Transformation "usages et
publics" ? Pourquoi transformer les données ?
● Proposition d'échanges: Smallest Federated Wiki : http:
//wardcunningham.github.com/