SlideShare ist ein Scribd-Unternehmen logo
1 von 11
Downloaden Sie, um offline zu lesen
Barcamp Datapride – 11 oct. 2012



    Restitution des groupes de travail

 1. Données structurées et web sémantique
2. Usages, monétisation, questions juridiques
           3. Fouille de données
      4. Transformation des données
Problématiques Générales
●   Production                    ●   Visualisation de données
●   Crowdsourcing                 ●   Capture, traçabilité et
●   Qualité des données :             validation
    homogénéisation et            ●   Stockage, duplication,
    normalisation                     partitionnement
●   Web sémantique                ●   Interfaces de modélisation
●   Linked data                       des données
●   Analyse de données non        ●   Droit d'usage des données
    structurées                   ●   Transformation de formats
●   Séries temporelles            ●   Interopérabilité
●   Métadonnées                   ●   Fouille dans les données
●   Données géographiques         ●   Éditorialisation, curation
●   Transport des données         ●   Data journalisme
●   Statistiques et data mining
1. Données structurées
  et Web sémantique
Sujets identifiés sur ce thème
●   Choix entre API ou données structurées ?
●   Distribution des données - télécharger pour utiliser le Web
    comme base de données : quelles implications techniques
    (mémoire, etc.) ?
●   Migration de l'existant, semantisation - outils / formats
    interopérables... Quels outils pour sémantiser les données ?
●   Montée à l'echelle des données, de leur stockage et du
    requêtage
●   Les triple-store sont-t-il adaptés pour la fouille de donnée ?
●   Accès au grand public de ces technologies pour produire des
    données ?
●   Marché du web semantique - besoin, compétences,
    opportunités ?
2. Usages, monétisation
 et questions juridiques
Sujets identifiés sur ce thème
● Modes d'exploitation et publication des données
● Licences : comparatif, contraintes, éxistant
● Droits dérivés: la transformation change-t-elle le droit des données ?
● Quelles diifférences juridiques entre les pays ?
● Quelle position de la CNIL et exemples d'abus ?
● Question de la tracabilité des données
● Qualité de la donnée: standards, cohérence dans les démarches ?
● Monétisation: comment gagner sa vie avec des données libres ?
● Usages: implication du grand public important, comment le former à
  la consultation, production, interpretation ?
● Développer des démoparty pour montrer au grand public ce que l'on
  fait avec les données ?
● Points licence droit d'auteur- Démoparty avec partenaires spécialisés
  dans la formation ?
● Formations possibles : exploitations des données, cycles des
  données, qui vit des données, demo party
Carte heuristique produite par le groupe
3. Fouille de données
Sujets identifiés sur ce thème
Approche philosophique, différentes dimensions : Parallèle avec
l'archéologie, on la trouve, on l'extrait, on la travaille.


● Exploration (scrapping, données structurées ou non-
  structurées)
● Comment les trouver: idée d'un catalogue/search - datapedia ?
● Fouille: faire le lien entre une donnée et la valorisation qu'on
  va en faire, répondre à un problème, à un besoin - design
  d'utilisation. Ateliers sur les process de valorisation ?
● Quelles représentations pour ces données (images, graphs,
  tableaux, etc) - sous forme de jeux : à partir de la même
  donnée, quelles visualisations ?
4. Transformation des données




 "Tout travail sur les données est une transformation:
      croiser, enrichir, simplifier, etc" (le groupe)
Sujets identifiés sur ce thème
● Transformations entre format de données - à semantique
  identique.
● Transformations en changeant la sémantique
● Comment formaliser cette transformation de donnée ?
● 2 types de rencontres à envisager ? En largeur (plusieurs pitchs
  de différents exemples de transformations) et en profondeur
  (conférence avec intervenant unique )
● Themes pour les rencontres : classification des transformations
  (taxonomie par exemple - à travailler avant présentation)
● Problème central : l'expression des transformations, dans quel
  language exprime-t-on la transformation ? SQL ? Interface
  évoluées ? Languages naturels simplifiés ? Nécessité de
  reflechir sur la génération de transformation
● Simplification des transformations, Transformation "usages et
  publics" ? Pourquoi transformer les données ?
● Proposition d'échanges: Smallest Federated Wiki : http:
  //wardcunningham.github.com/

Weitere ähnliche Inhalte

Andere mochten auch

Options secteurs t et p
Options secteurs t et pOptions secteurs t et p
Options secteurs t et pgillesroman
 
Marché du travail 22 12 11
Marché du travail   22 12 11Marché du travail   22 12 11
Marché du travail 22 12 11gillesroman
 
Opinionway APEL / La Croix - « Parent d’élève, un métier pour l'avenir »
Opinionway APEL / La Croix - « Parent d’élève, un métier pour l'avenir »Opinionway APEL / La Croix - « Parent d’élève, un métier pour l'avenir »
Opinionway APEL / La Croix - « Parent d’élève, un métier pour l'avenir »contactOpinionWay
 
LE CIDFF AU COLLEGE
LE CIDFF AU COLLEGELE CIDFF AU COLLEGE
LE CIDFF AU COLLEGEDG WEB
 
Pinceau d or-2013 2 eme tour
Pinceau d or-2013 2 eme tourPinceau d or-2013 2 eme tour
Pinceau d or-2013 2 eme tourGRIPON-MURALS
 
French powerpoint
French powerpointFrench powerpoint
French powerpointbrian0x
 
La geopolitica de los think tanks
La geopolitica de los think tanksLa geopolitica de los think tanks
La geopolitica de los think tanksFernando Cáceres
 

Andere mochten auch (10)

Pariscup
PariscupPariscup
Pariscup
 
Options secteurs t et p
Options secteurs t et pOptions secteurs t et p
Options secteurs t et p
 
Marché du travail 22 12 11
Marché du travail   22 12 11Marché du travail   22 12 11
Marché du travail 22 12 11
 
Opinionway APEL / La Croix - « Parent d’élève, un métier pour l'avenir »
Opinionway APEL / La Croix - « Parent d’élève, un métier pour l'avenir »Opinionway APEL / La Croix - « Parent d’élève, un métier pour l'avenir »
Opinionway APEL / La Croix - « Parent d’élève, un métier pour l'avenir »
 
LE CIDFF AU COLLEGE
LE CIDFF AU COLLEGELE CIDFF AU COLLEGE
LE CIDFF AU COLLEGE
 
Pinceau d or-2013 2 eme tour
Pinceau d or-2013 2 eme tourPinceau d or-2013 2 eme tour
Pinceau d or-2013 2 eme tour
 
Conclusion
ConclusionConclusion
Conclusion
 
French powerpoint
French powerpointFrench powerpoint
French powerpoint
 
Tarea3
Tarea3Tarea3
Tarea3
 
La geopolitica de los think tanks
La geopolitica de los think tanksLa geopolitica de los think tanks
La geopolitica de los think tanks
 

Bar Camp Datapride 11/10/2012 - Compte rendu des groupes de travail

  • 1. Barcamp Datapride – 11 oct. 2012 Restitution des groupes de travail 1. Données structurées et web sémantique 2. Usages, monétisation, questions juridiques 3. Fouille de données 4. Transformation des données
  • 2. Problématiques Générales ● Production ● Visualisation de données ● Crowdsourcing ● Capture, traçabilité et ● Qualité des données : validation homogénéisation et ● Stockage, duplication, normalisation partitionnement ● Web sémantique ● Interfaces de modélisation ● Linked data des données ● Analyse de données non ● Droit d'usage des données structurées ● Transformation de formats ● Séries temporelles ● Interopérabilité ● Métadonnées ● Fouille dans les données ● Données géographiques ● Éditorialisation, curation ● Transport des données ● Data journalisme ● Statistiques et data mining
  • 3. 1. Données structurées et Web sémantique
  • 4. Sujets identifiés sur ce thème ● Choix entre API ou données structurées ? ● Distribution des données - télécharger pour utiliser le Web comme base de données : quelles implications techniques (mémoire, etc.) ? ● Migration de l'existant, semantisation - outils / formats interopérables... Quels outils pour sémantiser les données ? ● Montée à l'echelle des données, de leur stockage et du requêtage ● Les triple-store sont-t-il adaptés pour la fouille de donnée ? ● Accès au grand public de ces technologies pour produire des données ? ● Marché du web semantique - besoin, compétences, opportunités ?
  • 5. 2. Usages, monétisation et questions juridiques
  • 6. Sujets identifiés sur ce thème ● Modes d'exploitation et publication des données ● Licences : comparatif, contraintes, éxistant ● Droits dérivés: la transformation change-t-elle le droit des données ? ● Quelles diifférences juridiques entre les pays ? ● Quelle position de la CNIL et exemples d'abus ? ● Question de la tracabilité des données ● Qualité de la donnée: standards, cohérence dans les démarches ? ● Monétisation: comment gagner sa vie avec des données libres ? ● Usages: implication du grand public important, comment le former à la consultation, production, interpretation ? ● Développer des démoparty pour montrer au grand public ce que l'on fait avec les données ? ● Points licence droit d'auteur- Démoparty avec partenaires spécialisés dans la formation ? ● Formations possibles : exploitations des données, cycles des données, qui vit des données, demo party
  • 8. 3. Fouille de données
  • 9. Sujets identifiés sur ce thème Approche philosophique, différentes dimensions : Parallèle avec l'archéologie, on la trouve, on l'extrait, on la travaille. ● Exploration (scrapping, données structurées ou non- structurées) ● Comment les trouver: idée d'un catalogue/search - datapedia ? ● Fouille: faire le lien entre une donnée et la valorisation qu'on va en faire, répondre à un problème, à un besoin - design d'utilisation. Ateliers sur les process de valorisation ? ● Quelles représentations pour ces données (images, graphs, tableaux, etc) - sous forme de jeux : à partir de la même donnée, quelles visualisations ?
  • 10. 4. Transformation des données "Tout travail sur les données est une transformation: croiser, enrichir, simplifier, etc" (le groupe)
  • 11. Sujets identifiés sur ce thème ● Transformations entre format de données - à semantique identique. ● Transformations en changeant la sémantique ● Comment formaliser cette transformation de donnée ? ● 2 types de rencontres à envisager ? En largeur (plusieurs pitchs de différents exemples de transformations) et en profondeur (conférence avec intervenant unique ) ● Themes pour les rencontres : classification des transformations (taxonomie par exemple - à travailler avant présentation) ● Problème central : l'expression des transformations, dans quel language exprime-t-on la transformation ? SQL ? Interface évoluées ? Languages naturels simplifiés ? Nécessité de reflechir sur la génération de transformation ● Simplification des transformations, Transformation "usages et publics" ? Pourquoi transformer les données ? ● Proposition d'échanges: Smallest Federated Wiki : http: //wardcunningham.github.com/