SlideShare ist ein Scribd-Unternehmen logo
1 von 9
Downloaden Sie, um offline zu lesen
Ibrain
Laissez la matrice vous prévenir.




Projet 50A - Recherche & Développements
2011 - 2014

Avec le partenariat du CNRS
2
1




    Nous sommes entrés définitivement dans une ère numérique
    où chaque jour de fantastiques volumes de données sont
    partagées, échangées, stockées, mais aussi analysées,
    modifiées, comparées, transformées, utilisées ou traitées…
    Ce trop plein de données peut contenir des               avec des personnes plus ou moins qualifiées,
    informations dont la prise en compte n’est pas           (relations professionnelles, famille, amis,
    instantanée, car elle est cachée : c’est parfois un      groupes d’intérêts, fans de stars, etc.)
    traitement statistique de l’information qui la fait
    apparaître ; parfois c’est la juxtaposition voire     2) l’information pure ; avec deux sous classes
    même la corrélation qui font apparaître ou créer         importantes. Les données du temps comme les
    cette connaissance ; parfois encore, c’est un long       « pure players », (site d’information) et les
    travail de datamining qui sera la bonne méthode in       données d’un espace propre et délimité : les
    fine.                                                    blogs, les forums, mais aussi les sites d’emploi
                                                             par exemple. #Monothématique.
    Quand bien même cette problématique
    d’extraction est promise à un avenir florissant, il   3) le domaine privé ; typiquement un flickr privé,
    n’y a pas de recette simple et aujourd’hui, les          mes bookmarks sous Chrome, les données de
    techniques et les technologies qui s’y attaquent         compte bancaire, mes whish listes secrètes, ...
    sont simplement naissantes.                              Tout ce qui est information, numérique, non
                                                             partagée et m’appartenant strictement.
    En effet, extraire la connaissance de ce magma est
    compliqué tant les structures, les usages, les        4) le librement disponible ; dans ce cadre,
    protocoles, les accès, et tant de nombreux autres        l’OpenData est le meilleur exemple actuel.
    paramètres sont intrinsèquement différents.
                                                          5) Les données à but commercial qui sont poussées
    Pourtant, 50A veut se donner les moyens de relever       vers l’utilisateur (Foursquare avec les « conseils
    ce défi en créant un département de R&D, en              pro » ou les api « pages jaunes » par exemple)
    faisant appel à un expert, en s’associant à un
    laboratoire de recherche du CNRS et enfin en          6) Le Quantified Self, apparu début 2011, n’est pas
    intégrant un doctorant CIFRE afin de développer la       traité pour l’instant par manque de repères et
    partie théorique en même temps que les                   de bases solides et cohérentes même si le
    prototypes plus appliqués et industriels.                paradigme se promet un bel avenir...

    Pour l’ensemble de ces données et ces flux, 50A       7) Toutes les données qui peuvent être en
    pense qu’ils répondent à une classification en 7         interaction avec des usages mais qui ne rentrent
    grandes branches :                                       pas dans une des grandes catégories ci dessus et
                                                             qui pourtant, avec une simple API, pourraient
    1) des réseaux sociaux et plus généralement à            (peuvent déjà ?) permettre de donner de
       toutes les interactions que nous pouvons avoir        l’information qui pourrait m’être utile.             2
1




    Les réseaux sociaux, dont Facebook est le
    meilleur représentant, sont depuis quelques
    années désormais, un outil puissant de
    dispersion d’information et de sa qualification.
    Les réseaux sociaux, dont Facebook est le meilleur représentant, sont, depuis
    quelques années désormais, un puissant outil de dispersion d’information. Avec près
    de 700 millions de membres, 100 milliards de photos, des dizaines de millions de
    statuts, de commentaires, et des centaines de milliers d’applications et autant de
    pages fan, il existe nativement de la connaissance inexploitée qui pourrait être
    fabriquée par exemple grâce une connaissance fine de la nature du lien qui unit les
    gens et de leurs interactions. Que pensent mes amis Facebook, du Canon 7D ? Qui,
    parmi mes relations LinkedIn, pense que telle entreprise à Paris est meilleure que
    telle autre ? Qui est allé voir tel film ? Qui est non loin de moi alors que moi même,
                                                 je suis loin de chez moi?
     L’exemple Paris vs Washington D.C :
     Paris se met progressivement à l’Open           Dans les données génériques, certaines sont
     Data avec le site OpenData.Paris.fr, mais       librement accessibles ; elles peuvent se
     il reste encore très limité par rapport à son
     homologue américain Data.gov qui
                                                     trouver dans les réseaux sociaux, dans les
     propose une multitude des données très          applications ou sont volontairement rendues
     fournies et capables d’être « mappées »         disponibles : c’est l’openData. Son
     rapidement sur des sujets tels que le           paradigme est de faire que toute entité
     climat, la santé, l’éducation et même les
     dépenses de l’État.                             (personne, programme, ...) puisse disposer
                                                     librement de données, délivrées de toute
    forme de copyright trop contraignant, dont l’acquisition   Certes, c’est moins vrai pour
    est rendue simple. La Team R&D 50A a organisé en           les flux d’information qui par
    février 2011 une Hacking Party sur la thématique “Open     nature évoquent les mêmes
                                                               sujets au même moment. Mais
    Data et Utilité”. Pendant longtemps la France a été en     même s’ils sont une catégorie à
    retard sur le plan international au niveau de l’Open       part, nous considérons qu’il
    Data. 50A R&D propose une hypothèse forte : L’ère de       sont néanmoins porteurs de
    l’Open Data, en permettant la capture puis le              connaissance
    traitement par recorrélation des différents flux
    d’information, permettra l’apparition de nouveaux usages. Nous n’en sommes qu’au
    début et des révolutions sont assurément à venir dans ce domaine. #NoLimit
                                                                                                   3
3
2




    Les données d’information pure, où la connaissance
    est très directement accessible, sont les news
    (information) mais aussi tous les billets de blogs,
    leurs commentaires et les forums qui représentent
    des quantités astronomiques de connaissance dont la
    corrélation n’est pas assurée et la connaissance                           Les innovations sont presque
    induite non encore produite : que pensent les
    journalistes de l’action de la présidente du                              toujours le fait d'explorateurs
    Chabichou ? Comment traite-t-on du passage de                                    individuels ou de petits
    Windows à Linux dans les forums ? Est ce difficile ?
    Le chromebook a-t-il un avenir ? Quel journal est le                         groupes, et presque jamais
    plus optimiste en moyenne ?                                                       celui de bureaucraties
    Les données commerciales sont les données payantes                            importantes et hautement
    ou les données des comparateurs de prix, ou encore                                           structurées.
    les données des centrales de voyages. Celles ci sont
    plus de l’ordre du « pull » : « je vais les chercher ».
    Il faut ajouter toutes celles qui poussées (push) vers                                             - Harold J. Leavitt
    nous, de la pub en passant par les corrélations pré
    calculées. Leur connaissance et leur étude, mise en
    face de choix ou de goûts déclarés, peuvent être
    utile. Poser une alerte automatique sur les “voyages
    au Mexique” ayant le critère “plutôt en août, et                    De la même façon, comment exploiter les
    moins de 2000 euros” doit être une entité repérable,                informations qui se trouvent uniquement en format
    traitable, et manipulable. La géolocalisation et la                 graphique, ou sans aucun accès simplifié de type API
    disponibilité d’une offre de discount doivent pouvoir               ? Comment relier les informations météorologiques
    matcher sans autre intervention que leurs                           de meteofrance.fr avec mes données de TripIt.com
    existences.                                                         (organisation de voyage) pour que la recorrélation
                                                                        des données fassent apparaître par exemple :
    Il est encore difficile d’imaginer les possibilités                 «Attention, vous devriez prendre un parapluie » ?
    qu’ouvre le traitement de ces flux et de leurs                      Comment savoir si mes amis Facebook et Twitter
    données et nous pouvons déjà entre apercevoir que                   sont “dans l’ensemble, plutôt heureux en ce
    ces travaux pourraient :                                            moment” ? Qui, parmi mes amis, est disponible pour
                                                                        m’accompagner en vacances avec moi pendant deux
      Favoriser l’intelligence collective et la créativité              mois cet été au Mexique ?
      ! en permettant l’accès à plus
      d’information                               Il existe une multitude de flux auxquels     Dans le projet qui se dessine ci
      Permettre de compiler des données           nous sommes rattachés : ces flux sont        dessus, nous avons repéré trois
      pour inventer de nouveaux usages            ! privés (les DM twitter, Compte
                                                                                               principales difficultés qui marquent
                                                  bancaire, Flickr privé, bookmark, etc),
      ! en retravaillant ces données              ! restreints (Les walls Facebook,            trois grandes étapes :
      Créer de nouveaux services pour             Typad avec abonnement, …) ou encore
      faciliter la vie quotidienne des            ! publics (le flux d’info économique de      D’une part, gérer la masse de
      citoyens ou d’usagers.                      lemonde.fr, le rss des blogs, les API X.fr
                                                  etc).                                        données, les différents flux et
      ! en permettant la création de                                                           toute les informations qui y sont
      prototype alimenté                                                                       contenues. Y compris celles qui
      Permettre plus de transparence                                        sont invisibles par leur mode d’utilisation : vous
      ! en donnant la possibilité d’analyser les                            n’aurez jamais accès à aucune donnée de votre
      données.                                                              timeline Twitter de 9h à 11h si vous vous connectez
                                                                            à votre compte pour la première fois aujourd’hui
    A chaque instant, ces données et ces gigantesques                       vers 18h et que vous avez plus de quelques
    flux d’information entrants et sortants transitent sur                  centaines de followers actifs.
    nos réseaux ; ils représentent une mine
    d’informations encore inexploitée car il n’est encore                   D’autre part, aller au coeur de l’information sans
    pas possible de les corréler nativement entre elles :                   tenir compte des structures, des protocoles, des
    protocoles mais aussi data ou sémantique : ce que                       différentes couches, des logiciels, des accès aux
    nous pouvons voir dans un flux donné ne dépend pas                      bases de données, du temps, est une autre
    des autres flux.                                                        difficulté. Les applications, leurs éventuelles API,
                                                                            leurs limitations sont autant de possibilités mais ne
    Rien dans l'information ne permet de relier les                         sont pas nativement dédiées à ce type de
    informations entre elles : que ce soit la date de                       traitement. Il nous faudra donc traiter avec du brut
    parution ou le protocole ou encore le propriétaire :                    dont il faudra faire faire du bruit place nette : aller
    quand un ami utilise « Facebook Lieux » et moi                          chercher l’information est une chose, recorréler en
    « Foursquare » ou « Google Latitude », rien,                            est une autre : in finé, qu’est ce qu’une
    nativement, ne permet re-corréler les données et de                     information ? Qu’est ce que veut dire « être riche »,
    faire apparaître éventuellement l’information “telle                    « être en forme », « être heureux » ou « je suis en
    personne est tout près de vous”.                                        vacances », « je ne suis pas à Paris » ?                  4
Si des informations de type géolocalisation sont
concrètes (des coordonnées) « comprendre » la
nature même d’une information n’est pas chose
aisée. La stocker encore moins.

Enfin, il importe à la fin du traitement, quand tout a        Imagination is more important
été récupéré, débruité, recorrélé, de présenter une
information propre à l’utilisateur final : que ce soit        than knowledge. Knowledge is
du domaine alimentaire, en e-commerce local, en                limited. Imagination encircles
sport, en géolocalisation, en étude sur une marque,
le travail à faire est conséquent afin de tirer la                                the world.
substantifique moelle des (Giga, Tera, Exa, ....)
octets d’informations quotidiennes, transitantes et
disponibles.


DIRECTION
Le projet de 50A R&D est ambitieux : au contraire                                        Albert Einstein
de ceux qui cherchent à savoir qui est le
plus influent ou quelle est l’information la plus
intéressante, iBrain, du nom du projet de Recherche
et Développement, est une application qui tente de
vous apporter l’information cachée dans vos flux en      Les grands moyens : l’association avec le CNRS.
re-corrélant les informations qui lui semblent
pertinentes ; rappelez vous : si une personne fait un    En février 2011, 50A a noué un partenariat avec
Foursquare, c’est bien. Si iBrain détecte qu’elle et     l’UTC (Université Technologique de Compiègne) et
vous êtes amies ET qu’elle et vous êtes à moins de       notamment un de ses laboratoires, HEUDIASYC,
30m l’une de l’autre : c’est mieux !                     Unité Mixte de Recherches CNRS 6599
                                                         (http://www.hds.utc.fr/), dont le directeur de
De la même façon, comment profiter de l’Open Data        recherches est Ali Charara.
public : comment iBrain peut-il prendre
l’initiative de me proposer tel restaurant parce que     Spécialisé dans l’extraction et la manipulation de la
ce dernier aura proposé une offre intéressante parce     connaissance, l’équipe de recherches considérée est
que iBrain l’aura de lui-même qualifié comme telle!?     ICI (Information Connaissance Interaction) dont la
                                                         responsable est MH Abel.
50A se lance donc dans une processus de R&D afin de
développer iBrain. Inférence et probabilités             Une thèse CIFRE va démarrer et aura pour titre :
bayésiennes, Datamining, Corrélation sémantique, la      “Système d’analyse de systèmes sociaux :
grande Aventure scientifique commence.                   extraction et gestion d’informations pour
                                                         l’élaboration d’un système multidimensionnel de
                                                         connaissances corrélées”

                                                         Cette thèse sera co encadrée par M.H. Abel, P.
                                                         Morizet-Mahoudeaux, du laboratoire HEUDIASYC.




           L’objet de cette recherche en collaboration est de réaliser un modèle multidimensionnel
           de connaissances corrélées construit à partir de connaissances publiques et libres des
           utilisateurs, de données d’intérêt et des environnements d’exploitation. Elle s’appuiera
           sur l’étude de méthodes d’identification et de caractérisation d’un utilisateur dans un
           environnement socio-professionnel, la collection de données d’intérêt et la définition
           d’un contexte d’exploitation.

           Elle devra permettre de corréler l’ensemble de ces ressources et systèmes d’information
           pour proposer spontanément ou suite à une requête une information pertinente en
           fonction des circonstances et des besoins d’exploitation.




                                                                                                                 5
Certaines des données et informations du réseau
internet deviennent de façon croissante maintenant
librement accessibles et réutilisables, soit de fait
dans les réseaux sociaux, soit suite à une mise à            L’objet de cette recherche en
disposition publique volontaire comme dans                   collaboration est de réaliser un
l’OpenData. La juxtaposition de ces ressources
d’information représente un potentiel de                     modèle multidimensionnel de
connaissances que l’on ne sait pas encore bien               connaissances corrélées
exploiter. En effet, les bases de données qui
stockent ces informations et les flux relatifs à leur        construit à partir de
exploitation sont totalement déconnectés et ne               connaissances publiques et
partagent presqu’aucune méta-information qui
permettrait de les lier les uns aux autres.                  libres des utilisateurs, de
                                                             données d’intérêt et des
Contrairement aux données privées que l’on ne peut
exploiter que sous licence, ces données publiques,           environnements d’exploitation.
bien qu’accessibles librement, n’offrent aucune
structure simple, qui permet de les ré-utiliser
ensemble. En revanche, leur massification, leur
diversité et leur universalité ne laisse planer aucun
doute sur l’accroissement de connaissance que l’on
peut espérer d’une exploitation qui s’appuierait sur
des recoupements, des associations et la recherche       Les méthodes utilisées s’appuient sur des techniques
de leurs corrélations. A ce constat il faut ajouter le   de relevance feedback (retour sur pertinence) selon
développement d’un environnement pervasif (ou            deux approches principales. La première repose sur
ubiquitaire) qui, grâce à une informatique diffuse,      une sélection, par l’utilisateur, des réponses les plus
permet aux objets communicants tels les téléphones       appropriées à une requête initiale, puis, à partir de
ou les tablettes interactives de se reconnaître entre    cette sélection affiner la requête initiale pour
eux et de se localiser automatiquement.                  relancer une recherche.

Une fois repérées, retraitées et recoupées, la mise      La seconde consiste, dans une première phase
en commun de ces informations laisse présager            d’apprentissage à donner une valeur de pertinence
l’éclosion d’une intelligence collective. Elle devrait   (par l’utilisateur) aux informations retournées pour
ainsi favoriser de nouvelles formes de                   un ensemble aléatoire de requêtes, puis, à partir
créativité, permettre l’émergence de nouveaux            d’évaluations statistiques, à donner un poids aux
usages, le développement de nouveaux services pour       descripteurs qui constituent le corpus de ces
la vie quotidienne privée et professionnelle, la         requêtes.
démocratisation et la transparence des savoirs.
                                                         Ces deux approches, même si elles apportent une
Les tentatives actuelles de mise en commun               amélioration notable dans la sélection de documents
s’appuient, pour la plupart, sur l’exploitation des      appropriés, restent lourdes à mettre en place et ne
descripteurs de l’information tels, le taux de tweets    prennent pas en compte des informations
le plus retweetés, les vidéos les plus échangées, les    spécifiques aux utilisateurs et aux circonstances de
articles de journaux les plus souvent répétés pour       la requête.
faire des regroupements, des cures et des
classifications. Cela se traduit généralement par        En effet, elles améliorent la sélection des
l’utilisation des données statistiques sur ces           documents uniquement par une analyse des
descripteurs, auxquels on peut parfois ajouter des       requêtes indépendamment du contexte dans lequel
éléments d’une ontologie descriptive du domaine          elles ont été formulées.
concerné.
                                                         Autrement dit, deux utilisateurs distincts peuvent
Des efforts importants de recherche sont menés dans      formuler la même requête mais ne pas vouloir
le domaine des systèmes de recherche                     obtenir les mêmes résultats, selon, par exemple,
d’informations disponibles sur le web ou les sites       que l’un veut approfondir un domaine dans lequel il
internes des entreprises pour proposer aux               est déjà expert ou sur lequel il a déjà obtenu des
utilisateurs une réponse appropriée à leurs besoins      informations et que l’autre souhaite avoir une
et la pertinence (relevance) de l’information            approche synthétique d’un domaine qu’il aborde
retournée en réponse à une requête.                      pour une première fois.

Le principe général consiste à sélectionner dans la
masse des informations retournées, celles qui
semblent être le mieux adaptées à la requête qui a
été formulée


                                                                                                                   6
De même, un utilisateur donné peut formuler deux requêtes semblables mais dans des circonstances d’espace et de temps
différentes qui impliquent deux réponses distinctes. L’estimation de la pertinence nécessite alors une double interprétation :
celle du contenu de l’information retournée et celle du besoin informationnel de l’utilisateur.

L’estimation de la
pertinence est une mesure
qui est évaluée en fonction
de plusieurs paramètres :

    •    ceux relatifs à
         l’utilisateur
    •    ceux relatifs aux
         informations,
    •    ceux relatifs à
         l’environnement.

L’ensemble de ces
paramètres définit la
notion de contexte.

Les éléments qui
définissent le contexte
utilisateur sont également
de plusieurs ordres : son
profil, ses préférences, son
expertise, son objectif, la
tâche à résoudre, … Ils
s’appuient sur un modèle
qui peut se construire a
priori à l’aide, par
exemple, d’un
questionnaire d’auto
description rempli par
l’utilisateur, mais aussi a
posteriori par
apprentissage sur des
comportements observés.

Ceux qui définissent une information (un document textuel, un fichier vidéo, une page web d’un journal, …) sont par exemple
une date de création ou de modification, un type, une origine, une disponibilité, une accessibilité et des descripteurs de
contenu (les mots d’un texte, des données d’UNE image…).

Ceux qui définissent l’environnement sont, par exemple, le lieu, l’heure, le groupe professionnel concerné, le niveau de
sécurité, …

Cependant, comme indiqué en introduction, la simple juxtaposition de ces connaissances ne suffit pas pour apporter la
réponse souhaitée ; son élaboration nécessite de les faire interagir. Cela signifie qu’avant l’émission de la requête (voire
l’envoi d’un message sans sollicitation) les liens entre les sources d’information aient été établis pour construire une
connaissance. L’hypothèse est donc qu’un système constitué d’un individu, faisant partie d’une sphère d’intérêt (un réseau
social, une entreprise, un domaine culturel, …) voulant acquérir une connaissance constitué de plusieurs sources
d’informations liées, à un instant et en un lieu donnés, répondent à un certain nombre de critères qui permettent de
construire un modèle. Ce modèle, multi-dimensionnel, réunit l’individu, les informations et l’environnement en un seul
ensemble qui a construit les associations potentielles entre les éléments qui le constituent. Ce sont, par exemple, une
mémoire collaborative d’un groupe socio-professionnel, une organisation des informations par centre d’intérêt, une
géolocalisation des accès aux ressources.




     La vérification de cette hypothèse et la réalisation de ce modèle reposent sur la
     construction d’un réceptacle, noté iBrain, qui collationnerait en permanence l’ensemble
     des données (utilisateur, information, environnement) pour construire et mettre à jour
     les liens potentiels entre celles-ci.
                                                                  Bienvenue dans la Matrice.




                                                                                                                                 7
« L'ordinateur ne peut que restituer, sous une forme plus ou moins
élaborée, les concepts que le chercheur y a introduits. Il est incapable de
faire preuve d'intuition, démarche subtile encore mal comprise qui seule
peut conduire à la découverte. [...] La vocation première d'un chercheur
est de créer de l'information nouvelle et non pas de manipuler d'une
manière de plus en plus élaborée l'information déjà disponible ».

                   [Pierre Joliot] Extrait de « La Recherche passionnément »

                  Nicolas Bermond : Fondateur et Directeur de 50 A, Nicolas est titulaire d’un
                  master dont la thèse a porté sur l’étude des small world (la fameuse théorie
                  des 6 degrés de séparation). Il a une connaissance parfaite du web, de ses
                  modèles, de ses pratiques, des techniques et des protocoles. Il a une expertise
                  reconnue en réseaux sociaux et en web 2.0. Nicolas chapeaute donc le projet




                Vincent Mulard : Ingénieur, Vincent est le spécialiste du développement : MVC,
                C#, extends et autre preg_match, tous ces mots n’ont un secret pour lui et c’est
                ainsi que les flux plongent dans ses API, s’associent et corrélationnent dans l’infini
                pour créer créent les connaissances pertinentes dans une nouvelle expérience
                utilisateur digne de 50A et du XXIèS




                Vincent Pinte Deregnaucourt : Ingénieur, Mathématicien, consultant en R&D et
                agréé par le ministère de l’enseignement supérieur et de la recherche, Vincent
                pilote le projet de R&D en interne et apporte son expertise de chercheur et son
                expérience d’entrepreneur.




                Jordan Bracco: 20 ans, 2m et déjà beaucoup d’années dans le WEB! Ce grand
                génie a été séduit par le projet de 50A et c’est tout naturellement qu’il a rejoint
                l’équipe. Dans ces derniers faits d’armes, Jordan est allé en Afrique pour
                permettre aux Tunisiens de faire leur révolution, en installant des modems dans la
                nuit...



                Damien Houille : Ingénieur, HEC, Damien est l'expat’ de l'équipe. Passionné par
                les réseaux sociaux et spécialiste de l'analyse de la réputation des entreprises, il
                participe aux prototypes liés à iBrain depuis le soleil d'Afrique du Sud.




                Glenn Rolland : Normalien, Glenn a une expertise d’entrepreneur et des réseaux
                sociaux sans pareil. Il apporte son concours dans le projet, à travers également un
                autre projet plus personnel qui pourrait s’intercaler dans le notre.




                Xuan Truong VU : 23 ans, arrive avec sa culture du Vietnam et en France depuis
                mars 2007, il termine tout juste un diplôme d'ingénieur en Informatique à l'UTC
                (Compiègne) et s'apprête à faire une thèse CIFRE, chez 50A, encadrée par l’UTC.
                Passionné de nouvelles technos, il aime aussi le football et la photographie.



                                                                                                         8
iBrain
Par 50A.fr




Nicolas Bermond
Directeur de 50 A, PARIS

Nicolas@50A.fr

@Nicolas2fr

Weitere ähnliche Inhalte

Was ist angesagt?

Communication-reseaux-sociaux
Communication-reseaux-sociauxCommunication-reseaux-sociaux
Communication-reseaux-sociauxolivier
 
Circulation et visibilité des fausses informations dans un écosystème socionu...
Circulation et visibilité des fausses informations dans un écosystème socionu...Circulation et visibilité des fausses informations dans un écosystème socionu...
Circulation et visibilité des fausses informations dans un écosystème socionu...ComSanté
 
Zad et cyberespace
Zad et cyberespaceZad et cyberespace
Zad et cyberespaceolivier
 
reseaux-sociaux-ertzscheid
reseaux-sociaux-ertzscheidreseaux-sociaux-ertzscheid
reseaux-sociaux-ertzscheidolivier
 
Comment vérifier l’information à l’ère des medias sociaux
Comment vérifier l’information à l’ère des medias sociauxComment vérifier l’information à l’ère des medias sociaux
Comment vérifier l’information à l’ère des medias sociauxJerome Deiss
 
2014 02 web20 rsn pour réseauter cafoc nantes_itg
2014 02 web20 rsn pour réseauter cafoc nantes_itg2014 02 web20 rsn pour réseauter cafoc nantes_itg
2014 02 web20 rsn pour réseauter cafoc nantes_itgJean Vanderspelden
 
Web predictif-ertzscheid
Web predictif-ertzscheidWeb predictif-ertzscheid
Web predictif-ertzscheidolivier
 
Info, intox : comment faire le tri avec les élèves ?
Info, intox : comment faire le tri avec les élèves ?Info, intox : comment faire le tri avec les élèves ?
Info, intox : comment faire le tri avec les élèves ?KDerraze
 
Veille rennes-def-oe
Veille rennes-def-oeVeille rennes-def-oe
Veille rennes-def-oeolivier
 
Internet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploiInternet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploiolivier
 
La médiation à l'heure du numérique
La médiation à l'heure du numériqueLa médiation à l'heure du numérique
La médiation à l'heure du numériqueolivier
 
identité numérique et réseaux sociaux : atouts pour mon entreprise
identité numérique et réseaux sociaux : atouts pour mon entrepriseidentité numérique et réseaux sociaux : atouts pour mon entreprise
identité numérique et réseaux sociaux : atouts pour mon entrepriseolivier
 
Le troll dans le militantisme politique : quels enjeux sur le débat public fr...
Le troll dans le militantisme politique : quels enjeux sur le débat public fr...Le troll dans le militantisme politique : quels enjeux sur le débat public fr...
Le troll dans le militantisme politique : quels enjeux sur le débat public fr...Tatiana Robert
 
Introduction - Mettre en place un système de veille avec des outils gratuits
Introduction - Mettre en place un système de veille avec des outils gratuitsIntroduction - Mettre en place un système de veille avec des outils gratuits
Introduction - Mettre en place un système de veille avec des outils gratuitsTerry ZIMMER
 
Ertzscheid Ehess
Ertzscheid EhessErtzscheid Ehess
Ertzscheid Ehessolivier
 
Profil ertzscheid - copie
Profil ertzscheid - copieProfil ertzscheid - copie
Profil ertzscheid - copieolivier
 
Identite numerique
Identite numeriqueIdentite numerique
Identite numeriqueolivier
 
Les médias sociaux : initiation et défrichage
Les médias sociaux : initiation et défrichageLes médias sociaux : initiation et défrichage
Les médias sociaux : initiation et défrichageClaire-Marie MERIAUX
 
l'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mèmel'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mèmeolivier
 

Was ist angesagt? (20)

Communication-reseaux-sociaux
Communication-reseaux-sociauxCommunication-reseaux-sociaux
Communication-reseaux-sociaux
 
Circulation et visibilité des fausses informations dans un écosystème socionu...
Circulation et visibilité des fausses informations dans un écosystème socionu...Circulation et visibilité des fausses informations dans un écosystème socionu...
Circulation et visibilité des fausses informations dans un écosystème socionu...
 
Zad et cyberespace
Zad et cyberespaceZad et cyberespace
Zad et cyberespace
 
reseaux-sociaux-ertzscheid
reseaux-sociaux-ertzscheidreseaux-sociaux-ertzscheid
reseaux-sociaux-ertzscheid
 
Comment vérifier l’information à l’ère des medias sociaux
Comment vérifier l’information à l’ère des medias sociauxComment vérifier l’information à l’ère des medias sociaux
Comment vérifier l’information à l’ère des medias sociaux
 
2014 02 web20 rsn pour réseauter cafoc nantes_itg
2014 02 web20 rsn pour réseauter cafoc nantes_itg2014 02 web20 rsn pour réseauter cafoc nantes_itg
2014 02 web20 rsn pour réseauter cafoc nantes_itg
 
Web predictif-ertzscheid
Web predictif-ertzscheidWeb predictif-ertzscheid
Web predictif-ertzscheid
 
Info, intox : comment faire le tri avec les élèves ?
Info, intox : comment faire le tri avec les élèves ?Info, intox : comment faire le tri avec les élèves ?
Info, intox : comment faire le tri avec les élèves ?
 
Veille rennes-def-oe
Veille rennes-def-oeVeille rennes-def-oe
Veille rennes-def-oe
 
Internet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploiInternet et réseaux sociaux : mode d'emploi
Internet et réseaux sociaux : mode d'emploi
 
La médiation à l'heure du numérique
La médiation à l'heure du numériqueLa médiation à l'heure du numérique
La médiation à l'heure du numérique
 
identité numérique et réseaux sociaux : atouts pour mon entreprise
identité numérique et réseaux sociaux : atouts pour mon entrepriseidentité numérique et réseaux sociaux : atouts pour mon entreprise
identité numérique et réseaux sociaux : atouts pour mon entreprise
 
Le troll dans le militantisme politique : quels enjeux sur le débat public fr...
Le troll dans le militantisme politique : quels enjeux sur le débat public fr...Le troll dans le militantisme politique : quels enjeux sur le débat public fr...
Le troll dans le militantisme politique : quels enjeux sur le débat public fr...
 
Introduction - Mettre en place un système de veille avec des outils gratuits
Introduction - Mettre en place un système de veille avec des outils gratuitsIntroduction - Mettre en place un système de veille avec des outils gratuits
Introduction - Mettre en place un système de veille avec des outils gratuits
 
Ertzscheid Ehess
Ertzscheid EhessErtzscheid Ehess
Ertzscheid Ehess
 
Didactique journalisme
Didactique journalismeDidactique journalisme
Didactique journalisme
 
Profil ertzscheid - copie
Profil ertzscheid - copieProfil ertzscheid - copie
Profil ertzscheid - copie
 
Identite numerique
Identite numeriqueIdentite numerique
Identite numerique
 
Les médias sociaux : initiation et défrichage
Les médias sociaux : initiation et défrichageLes médias sociaux : initiation et défrichage
Les médias sociaux : initiation et défrichage
 
l'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mèmel'avenir des collections : la bibliothèque comme mème
l'avenir des collections : la bibliothèque comme mème
 

Andere mochten auch

Université d'été
Université d'étéUniversité d'été
Université d'étébasileniane
 
Plus de 10 000 jobs d'été en Italie 2020
Plus de 10 000 jobs d'été en Italie 2020Plus de 10 000 jobs d'été en Italie 2020
Plus de 10 000 jobs d'été en Italie 2020Club TELI
 
Publicité in-game - Les fondamentaux
Publicité in-game - Les fondamentauxPublicité in-game - Les fondamentaux
Publicité in-game - Les fondamentauxAntoine Dubuquoy
 
Réseau mobile open source
Réseau mobile open sourceRéseau mobile open source
Réseau mobile open sourcedilan23
 
Heuvelman presentatie
Heuvelman presentatieHeuvelman presentatie
Heuvelman presentatieCPHam
 
Rue89modeleparticip
Rue89modeleparticipRue89modeleparticip
Rue89modeleparticipPoisson
 
Presentation ConféRence Ot Mopa Aecom
Presentation ConféRence Ot Mopa AecomPresentation ConféRence Ot Mopa Aecom
Presentation ConféRence Ot Mopa AecomAgence Indixit
 
Guide Pratique des communications életroniques
Guide Pratique des communications életroniquesGuide Pratique des communications életroniques
Guide Pratique des communications életroniquesJean-Baptiste Lesaulnier
 
Dominique Sciamma PréSentation Paris 2.0 Design
Dominique Sciamma PréSentation Paris 2.0 DesignDominique Sciamma PréSentation Paris 2.0 Design
Dominique Sciamma PréSentation Paris 2.0 Designcharafs
 
Slideshare15 09-2014 prgm svb
Slideshare15 09-2014 prgm svbSlideshare15 09-2014 prgm svb
Slideshare15 09-2014 prgm svbEmma Vila
 
PUERTAS BLANCAS
PUERTAS BLANCASPUERTAS BLANCAS
PUERTAS BLANCASelilucas
 

Andere mochten auch (20)

Université d'été
Université d'étéUniversité d'été
Université d'été
 
Plus de 10 000 jobs d'été en Italie 2020
Plus de 10 000 jobs d'été en Italie 2020Plus de 10 000 jobs d'été en Italie 2020
Plus de 10 000 jobs d'été en Italie 2020
 
Publicité in-game - Les fondamentaux
Publicité in-game - Les fondamentauxPublicité in-game - Les fondamentaux
Publicité in-game - Les fondamentaux
 
Réseau mobile open source
Réseau mobile open sourceRéseau mobile open source
Réseau mobile open source
 
Heuvelman presentatie
Heuvelman presentatieHeuvelman presentatie
Heuvelman presentatie
 
La Vie 3s
La Vie 3sLa Vie 3s
La Vie 3s
 
Rue89modeleparticip
Rue89modeleparticipRue89modeleparticip
Rue89modeleparticip
 
Metacognici+ôn
Metacognici+ônMetacognici+ôn
Metacognici+ôn
 
Presentation ConféRence Ot Mopa Aecom
Presentation ConféRence Ot Mopa AecomPresentation ConféRence Ot Mopa Aecom
Presentation ConféRence Ot Mopa Aecom
 
Guide Pratique des communications életroniques
Guide Pratique des communications életroniquesGuide Pratique des communications életroniques
Guide Pratique des communications életroniques
 
test
test	test
test
 
Actinie Productions
Actinie ProductionsActinie Productions
Actinie Productions
 
Ma france
Ma franceMa france
Ma france
 
Catalogue ETE 2017
Catalogue ETE 2017Catalogue ETE 2017
Catalogue ETE 2017
 
Pres janua-v2
Pres janua-v2Pres janua-v2
Pres janua-v2
 
Tempotraxx Fiche Produit
Tempotraxx Fiche ProduitTempotraxx Fiche Produit
Tempotraxx Fiche Produit
 
Dominique Sciamma PréSentation Paris 2.0 Design
Dominique Sciamma PréSentation Paris 2.0 DesignDominique Sciamma PréSentation Paris 2.0 Design
Dominique Sciamma PréSentation Paris 2.0 Design
 
Slideshare15 09-2014 prgm svb
Slideshare15 09-2014 prgm svbSlideshare15 09-2014 prgm svb
Slideshare15 09-2014 prgm svb
 
PUERTAS BLANCAS
PUERTAS BLANCASPUERTAS BLANCAS
PUERTAS BLANCAS
 
Chiots
ChiotsChiots
Chiots
 

Ähnlich wie Ibrain

La veille dans un environnement numérique mouvant
La veille dans un environnement numérique mouvantLa veille dans un environnement numérique mouvant
La veille dans un environnement numérique mouvantChristophe Deschamps
 
Utiliser des outils collaboratifs en BU
Utiliser des outils collaboratifs en BUUtiliser des outils collaboratifs en BU
Utiliser des outils collaboratifs en BUAnne-Gaëlle Gaudion
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxChloé Marty
 
Avant la veille : tentative de grammaire du web
Avant la veille : tentative de grammaire du webAvant la veille : tentative de grammaire du web
Avant la veille : tentative de grammaire du webrichard peirano
 
L'homme est un document come les autres
L'homme est un document come les autresL'homme est un document come les autres
L'homme est un document come les autresolivier
 
Comment le social augment l'accès à l'information
Comment le social augment l'accès à l'informationComment le social augment l'accès à l'information
Comment le social augment l'accès à l'informationLecko
 
Livre blanc : Le Document au coeur de la Collaboration - Mars 2014
Livre blanc : Le Document au coeur de la Collaboration - Mars 2014Livre blanc : Le Document au coeur de la Collaboration - Mars 2014
Livre blanc : Le Document au coeur de la Collaboration - Mars 2014Nextmodernity
 
Livre blanc information reseaux sociaux et innovation - david fayon
Livre blanc   information reseaux sociaux et innovation - david fayonLivre blanc   information reseaux sociaux et innovation - david fayon
Livre blanc information reseaux sociaux et innovation - david fayonAlban Jarry
 
Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteursolivier
 
20080911 Intro Conference Yves
20080911 Intro Conference Yves20080911 Intro Conference Yves
20080911 Intro Conference YvesSocial Computing
 
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...Stéphane Possamai
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoirenoucher
 
Éducation et numérique : quelques étapes
Éducation et numérique : quelques étapesÉducation et numérique : quelques étapes
Éducation et numérique : quelques étapesBenoit Lacherez
 
identitenumeriqueacademique
identitenumeriqueacademiqueidentitenumeriqueacademique
identitenumeriqueacademiqueolivier
 
Réseaux sociaux et recherche d'information
Réseaux sociaux et recherche d'informationRéseaux sociaux et recherche d'information
Réseaux sociaux et recherche d'informationFFFOD
 
Livre blanc information reseaux sociaux et innovation - dimitri hommel vikt...
Livre blanc   information reseaux sociaux et innovation - dimitri hommel vikt...Livre blanc   information reseaux sociaux et innovation - dimitri hommel vikt...
Livre blanc information reseaux sociaux et innovation - dimitri hommel vikt...Alban Jarry
 
Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...
Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...
Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...Anne-Gaëlle Gaudion
 
Présentation programme "Identites actives" - Orange 20080620
Présentation programme "Identites actives" - Orange 20080620Présentation programme "Identites actives" - Orange 20080620
Présentation programme "Identites actives" - Orange 20080620Fing
 
Livre blanc information reseaux sociaux et innovation - jean-francois ceci
Livre blanc   information reseaux sociaux et innovation - jean-francois ceciLivre blanc   information reseaux sociaux et innovation - jean-francois ceci
Livre blanc information reseaux sociaux et innovation - jean-francois ceciAlban Jarry
 

Ähnlich wie Ibrain (20)

La veille dans un environnement numérique mouvant
La veille dans un environnement numérique mouvantLa veille dans un environnement numérique mouvant
La veille dans un environnement numérique mouvant
 
Utiliser des outils collaboratifs en BU
Utiliser des outils collaboratifs en BUUtiliser des outils collaboratifs en BU
Utiliser des outils collaboratifs en BU
 
Mémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociauxMémoire de fin d'étude - La big data et les réseaux sociaux
Mémoire de fin d'étude - La big data et les réseaux sociaux
 
Avant la veille : tentative de grammaire du web
Avant la veille : tentative de grammaire du webAvant la veille : tentative de grammaire du web
Avant la veille : tentative de grammaire du web
 
L'homme est un document come les autres
L'homme est un document come les autresL'homme est un document come les autres
L'homme est un document come les autres
 
Comment le social augment l'accès à l'information
Comment le social augment l'accès à l'informationComment le social augment l'accès à l'information
Comment le social augment l'accès à l'information
 
Livre blanc : Le Document au coeur de la Collaboration - Mars 2014
Livre blanc : Le Document au coeur de la Collaboration - Mars 2014Livre blanc : Le Document au coeur de la Collaboration - Mars 2014
Livre blanc : Le Document au coeur de la Collaboration - Mars 2014
 
Livre blanc information reseaux sociaux et innovation - david fayon
Livre blanc   information reseaux sociaux et innovation - david fayonLivre blanc   information reseaux sociaux et innovation - david fayon
Livre blanc information reseaux sociaux et innovation - david fayon
 
Urfist bordeaux-moteurs
Urfist bordeaux-moteursUrfist bordeaux-moteurs
Urfist bordeaux-moteurs
 
Profils des utilisateurs des réseaux sociaux
Profils des utilisateurs des réseaux sociauxProfils des utilisateurs des réseaux sociaux
Profils des utilisateurs des réseaux sociaux
 
20080911 Intro Conference Yves
20080911 Intro Conference Yves20080911 Intro Conference Yves
20080911 Intro Conference Yves
 
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
Les consommateurs sont-ils conscients des données privées qu’ils consentent à...
 
AGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoireAGMQ 2011 : Les données libres et le territoire
AGMQ 2011 : Les données libres et le territoire
 
Éducation et numérique : quelques étapes
Éducation et numérique : quelques étapesÉducation et numérique : quelques étapes
Éducation et numérique : quelques étapes
 
identitenumeriqueacademique
identitenumeriqueacademiqueidentitenumeriqueacademique
identitenumeriqueacademique
 
Réseaux sociaux et recherche d'information
Réseaux sociaux et recherche d'informationRéseaux sociaux et recherche d'information
Réseaux sociaux et recherche d'information
 
Livre blanc information reseaux sociaux et innovation - dimitri hommel vikt...
Livre blanc   information reseaux sociaux et innovation - dimitri hommel vikt...Livre blanc   information reseaux sociaux et innovation - dimitri hommel vikt...
Livre blanc information reseaux sociaux et innovation - dimitri hommel vikt...
 
Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...
Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...
Portails, blogs et wikis, des outils pour la médiathèque - CNFPT Corse - sept...
 
Présentation programme "Identites actives" - Orange 20080620
Présentation programme "Identites actives" - Orange 20080620Présentation programme "Identites actives" - Orange 20080620
Présentation programme "Identites actives" - Orange 20080620
 
Livre blanc information reseaux sociaux et innovation - jean-francois ceci
Livre blanc   information reseaux sociaux et innovation - jean-francois ceciLivre blanc   information reseaux sociaux et innovation - jean-francois ceci
Livre blanc information reseaux sociaux et innovation - jean-francois ceci
 

Mehr von Nicolas Bermond

Décryptage des mutations sociétales & technologiques 12/12/16
Décryptage des mutations sociétales & technologiques 12/12/16Décryptage des mutations sociétales & technologiques 12/12/16
Décryptage des mutations sociétales & technologiques 12/12/16Nicolas Bermond
 
Baromètre consommateur France via Google 06/2015
Baromètre consommateur France via Google 06/2015Baromètre consommateur France via Google 06/2015
Baromètre consommateur France via Google 06/2015Nicolas Bermond
 
Barcamp EreputatioCamp4 Thémathique : Data & Reputation #DataReputation
Barcamp EreputatioCamp4 Thémathique : Data & Reputation #DataReputationBarcamp EreputatioCamp4 Thémathique : Data & Reputation #DataReputation
Barcamp EreputatioCamp4 Thémathique : Data & Reputation #DataReputationNicolas Bermond
 
Orange labs et le bon APIculteur by MyDatalabs
Orange labs et le bon APIculteur by MyDatalabsOrange labs et le bon APIculteur by MyDatalabs
Orange labs et le bon APIculteur by MyDatalabsNicolas Bermond
 
50A vous présente L'auberge
50A vous présente L'auberge50A vous présente L'auberge
50A vous présente L'aubergeNicolas Bermond
 
Nom de code : iLife / Présentation
Nom de code : iLife / PrésentationNom de code : iLife / Présentation
Nom de code : iLife / PrésentationNicolas Bermond
 
Production Digitale : We love Basecamp
Production Digitale : We love BasecampProduction Digitale : We love Basecamp
Production Digitale : We love BasecampNicolas Bermond
 
E-reputation quand tu nous tiens !
E-reputation quand tu nous tiens !E-reputation quand tu nous tiens !
E-reputation quand tu nous tiens !Nicolas Bermond
 
Barcamp(r) Tunis Paris #EvolutionCamp
Barcamp(r) Tunis Paris #EvolutionCampBarcamp(r) Tunis Paris #EvolutionCamp
Barcamp(r) Tunis Paris #EvolutionCampNicolas Bermond
 
50A présentation agence communication digitale
50A présentation agence communication digitale50A présentation agence communication digitale
50A présentation agence communication digitaleNicolas Bermond
 
KarmaRiser : Criteria Grid For Social Platform
KarmaRiser : Criteria Grid For Social PlatformKarmaRiser : Criteria Grid For Social Platform
KarmaRiser : Criteria Grid For Social PlatformNicolas Bermond
 
Social Media / Community Management / Theorie Pratique et Business
Social Media / Community Management / Theorie Pratique et BusinessSocial Media / Community Management / Theorie Pratique et Business
Social Media / Community Management / Theorie Pratique et BusinessNicolas Bermond
 

Mehr von Nicolas Bermond (14)

Décryptage des mutations sociétales & technologiques 12/12/16
Décryptage des mutations sociétales & technologiques 12/12/16Décryptage des mutations sociétales & technologiques 12/12/16
Décryptage des mutations sociétales & technologiques 12/12/16
 
Baromètre consommateur France via Google 06/2015
Baromètre consommateur France via Google 06/2015Baromètre consommateur France via Google 06/2015
Baromètre consommateur France via Google 06/2015
 
Re-Invent 50A
Re-Invent 50ARe-Invent 50A
Re-Invent 50A
 
Indie
IndieIndie
Indie
 
Barcamp EreputatioCamp4 Thémathique : Data & Reputation #DataReputation
Barcamp EreputatioCamp4 Thémathique : Data & Reputation #DataReputationBarcamp EreputatioCamp4 Thémathique : Data & Reputation #DataReputation
Barcamp EreputatioCamp4 Thémathique : Data & Reputation #DataReputation
 
Orange labs et le bon APIculteur by MyDatalabs
Orange labs et le bon APIculteur by MyDatalabsOrange labs et le bon APIculteur by MyDatalabs
Orange labs et le bon APIculteur by MyDatalabs
 
50A vous présente L'auberge
50A vous présente L'auberge50A vous présente L'auberge
50A vous présente L'auberge
 
Nom de code : iLife / Présentation
Nom de code : iLife / PrésentationNom de code : iLife / Présentation
Nom de code : iLife / Présentation
 
Production Digitale : We love Basecamp
Production Digitale : We love BasecampProduction Digitale : We love Basecamp
Production Digitale : We love Basecamp
 
E-reputation quand tu nous tiens !
E-reputation quand tu nous tiens !E-reputation quand tu nous tiens !
E-reputation quand tu nous tiens !
 
Barcamp(r) Tunis Paris #EvolutionCamp
Barcamp(r) Tunis Paris #EvolutionCampBarcamp(r) Tunis Paris #EvolutionCamp
Barcamp(r) Tunis Paris #EvolutionCamp
 
50A présentation agence communication digitale
50A présentation agence communication digitale50A présentation agence communication digitale
50A présentation agence communication digitale
 
KarmaRiser : Criteria Grid For Social Platform
KarmaRiser : Criteria Grid For Social PlatformKarmaRiser : Criteria Grid For Social Platform
KarmaRiser : Criteria Grid For Social Platform
 
Social Media / Community Management / Theorie Pratique et Business
Social Media / Community Management / Theorie Pratique et BusinessSocial Media / Community Management / Theorie Pratique et Business
Social Media / Community Management / Theorie Pratique et Business
 

Ibrain

  • 1. Ibrain Laissez la matrice vous prévenir. Projet 50A - Recherche & Développements 2011 - 2014 Avec le partenariat du CNRS
  • 2. 2 1 Nous sommes entrés définitivement dans une ère numérique où chaque jour de fantastiques volumes de données sont partagées, échangées, stockées, mais aussi analysées, modifiées, comparées, transformées, utilisées ou traitées… Ce trop plein de données peut contenir des avec des personnes plus ou moins qualifiées, informations dont la prise en compte n’est pas (relations professionnelles, famille, amis, instantanée, car elle est cachée : c’est parfois un groupes d’intérêts, fans de stars, etc.) traitement statistique de l’information qui la fait apparaître ; parfois c’est la juxtaposition voire 2) l’information pure ; avec deux sous classes même la corrélation qui font apparaître ou créer importantes. Les données du temps comme les cette connaissance ; parfois encore, c’est un long « pure players », (site d’information) et les travail de datamining qui sera la bonne méthode in données d’un espace propre et délimité : les fine. blogs, les forums, mais aussi les sites d’emploi par exemple. #Monothématique. Quand bien même cette problématique d’extraction est promise à un avenir florissant, il 3) le domaine privé ; typiquement un flickr privé, n’y a pas de recette simple et aujourd’hui, les mes bookmarks sous Chrome, les données de techniques et les technologies qui s’y attaquent compte bancaire, mes whish listes secrètes, ... sont simplement naissantes. Tout ce qui est information, numérique, non partagée et m’appartenant strictement. En effet, extraire la connaissance de ce magma est compliqué tant les structures, les usages, les 4) le librement disponible ; dans ce cadre, protocoles, les accès, et tant de nombreux autres l’OpenData est le meilleur exemple actuel. paramètres sont intrinsèquement différents. 5) Les données à but commercial qui sont poussées Pourtant, 50A veut se donner les moyens de relever vers l’utilisateur (Foursquare avec les « conseils ce défi en créant un département de R&D, en pro » ou les api « pages jaunes » par exemple) faisant appel à un expert, en s’associant à un laboratoire de recherche du CNRS et enfin en 6) Le Quantified Self, apparu début 2011, n’est pas intégrant un doctorant CIFRE afin de développer la traité pour l’instant par manque de repères et partie théorique en même temps que les de bases solides et cohérentes même si le prototypes plus appliqués et industriels. paradigme se promet un bel avenir... Pour l’ensemble de ces données et ces flux, 50A 7) Toutes les données qui peuvent être en pense qu’ils répondent à une classification en 7 interaction avec des usages mais qui ne rentrent grandes branches : pas dans une des grandes catégories ci dessus et qui pourtant, avec une simple API, pourraient 1) des réseaux sociaux et plus généralement à (peuvent déjà ?) permettre de donner de toutes les interactions que nous pouvons avoir l’information qui pourrait m’être utile. 2
  • 3. 1 Les réseaux sociaux, dont Facebook est le meilleur représentant, sont depuis quelques années désormais, un outil puissant de dispersion d’information et de sa qualification. Les réseaux sociaux, dont Facebook est le meilleur représentant, sont, depuis quelques années désormais, un puissant outil de dispersion d’information. Avec près de 700 millions de membres, 100 milliards de photos, des dizaines de millions de statuts, de commentaires, et des centaines de milliers d’applications et autant de pages fan, il existe nativement de la connaissance inexploitée qui pourrait être fabriquée par exemple grâce une connaissance fine de la nature du lien qui unit les gens et de leurs interactions. Que pensent mes amis Facebook, du Canon 7D ? Qui, parmi mes relations LinkedIn, pense que telle entreprise à Paris est meilleure que telle autre ? Qui est allé voir tel film ? Qui est non loin de moi alors que moi même, je suis loin de chez moi? L’exemple Paris vs Washington D.C : Paris se met progressivement à l’Open Dans les données génériques, certaines sont Data avec le site OpenData.Paris.fr, mais librement accessibles ; elles peuvent se il reste encore très limité par rapport à son homologue américain Data.gov qui trouver dans les réseaux sociaux, dans les propose une multitude des données très applications ou sont volontairement rendues fournies et capables d’être « mappées » disponibles : c’est l’openData. Son rapidement sur des sujets tels que le paradigme est de faire que toute entité climat, la santé, l’éducation et même les dépenses de l’État. (personne, programme, ...) puisse disposer librement de données, délivrées de toute forme de copyright trop contraignant, dont l’acquisition Certes, c’est moins vrai pour est rendue simple. La Team R&D 50A a organisé en les flux d’information qui par février 2011 une Hacking Party sur la thématique “Open nature évoquent les mêmes sujets au même moment. Mais Data et Utilité”. Pendant longtemps la France a été en même s’ils sont une catégorie à retard sur le plan international au niveau de l’Open part, nous considérons qu’il Data. 50A R&D propose une hypothèse forte : L’ère de sont néanmoins porteurs de l’Open Data, en permettant la capture puis le connaissance traitement par recorrélation des différents flux d’information, permettra l’apparition de nouveaux usages. Nous n’en sommes qu’au début et des révolutions sont assurément à venir dans ce domaine. #NoLimit 3
  • 4. 3 2 Les données d’information pure, où la connaissance est très directement accessible, sont les news (information) mais aussi tous les billets de blogs, leurs commentaires et les forums qui représentent des quantités astronomiques de connaissance dont la corrélation n’est pas assurée et la connaissance Les innovations sont presque induite non encore produite : que pensent les journalistes de l’action de la présidente du toujours le fait d'explorateurs Chabichou ? Comment traite-t-on du passage de individuels ou de petits Windows à Linux dans les forums ? Est ce difficile ? Le chromebook a-t-il un avenir ? Quel journal est le groupes, et presque jamais plus optimiste en moyenne ? celui de bureaucraties Les données commerciales sont les données payantes importantes et hautement ou les données des comparateurs de prix, ou encore structurées. les données des centrales de voyages. Celles ci sont plus de l’ordre du « pull » : « je vais les chercher ». Il faut ajouter toutes celles qui poussées (push) vers - Harold J. Leavitt nous, de la pub en passant par les corrélations pré calculées. Leur connaissance et leur étude, mise en face de choix ou de goûts déclarés, peuvent être utile. Poser une alerte automatique sur les “voyages au Mexique” ayant le critère “plutôt en août, et De la même façon, comment exploiter les moins de 2000 euros” doit être une entité repérable, informations qui se trouvent uniquement en format traitable, et manipulable. La géolocalisation et la graphique, ou sans aucun accès simplifié de type API disponibilité d’une offre de discount doivent pouvoir ? Comment relier les informations météorologiques matcher sans autre intervention que leurs de meteofrance.fr avec mes données de TripIt.com existences. (organisation de voyage) pour que la recorrélation des données fassent apparaître par exemple : Il est encore difficile d’imaginer les possibilités «Attention, vous devriez prendre un parapluie » ? qu’ouvre le traitement de ces flux et de leurs Comment savoir si mes amis Facebook et Twitter données et nous pouvons déjà entre apercevoir que sont “dans l’ensemble, plutôt heureux en ce ces travaux pourraient : moment” ? Qui, parmi mes amis, est disponible pour m’accompagner en vacances avec moi pendant deux Favoriser l’intelligence collective et la créativité mois cet été au Mexique ? ! en permettant l’accès à plus d’information Il existe une multitude de flux auxquels Dans le projet qui se dessine ci Permettre de compiler des données nous sommes rattachés : ces flux sont dessus, nous avons repéré trois pour inventer de nouveaux usages ! privés (les DM twitter, Compte principales difficultés qui marquent bancaire, Flickr privé, bookmark, etc), ! en retravaillant ces données ! restreints (Les walls Facebook, trois grandes étapes : Créer de nouveaux services pour Typad avec abonnement, …) ou encore faciliter la vie quotidienne des ! publics (le flux d’info économique de D’une part, gérer la masse de citoyens ou d’usagers. lemonde.fr, le rss des blogs, les API X.fr etc). données, les différents flux et ! en permettant la création de toute les informations qui y sont prototype alimenté contenues. Y compris celles qui Permettre plus de transparence sont invisibles par leur mode d’utilisation : vous ! en donnant la possibilité d’analyser les n’aurez jamais accès à aucune donnée de votre données. timeline Twitter de 9h à 11h si vous vous connectez à votre compte pour la première fois aujourd’hui A chaque instant, ces données et ces gigantesques vers 18h et que vous avez plus de quelques flux d’information entrants et sortants transitent sur centaines de followers actifs. nos réseaux ; ils représentent une mine d’informations encore inexploitée car il n’est encore D’autre part, aller au coeur de l’information sans pas possible de les corréler nativement entre elles : tenir compte des structures, des protocoles, des protocoles mais aussi data ou sémantique : ce que différentes couches, des logiciels, des accès aux nous pouvons voir dans un flux donné ne dépend pas bases de données, du temps, est une autre des autres flux. difficulté. Les applications, leurs éventuelles API, leurs limitations sont autant de possibilités mais ne Rien dans l'information ne permet de relier les sont pas nativement dédiées à ce type de informations entre elles : que ce soit la date de traitement. Il nous faudra donc traiter avec du brut parution ou le protocole ou encore le propriétaire : dont il faudra faire faire du bruit place nette : aller quand un ami utilise « Facebook Lieux » et moi chercher l’information est une chose, recorréler en « Foursquare » ou « Google Latitude », rien, est une autre : in finé, qu’est ce qu’une nativement, ne permet re-corréler les données et de information ? Qu’est ce que veut dire « être riche », faire apparaître éventuellement l’information “telle « être en forme », « être heureux » ou « je suis en personne est tout près de vous”. vacances », « je ne suis pas à Paris » ? 4
  • 5. Si des informations de type géolocalisation sont concrètes (des coordonnées) « comprendre » la nature même d’une information n’est pas chose aisée. La stocker encore moins. Enfin, il importe à la fin du traitement, quand tout a Imagination is more important été récupéré, débruité, recorrélé, de présenter une information propre à l’utilisateur final : que ce soit than knowledge. Knowledge is du domaine alimentaire, en e-commerce local, en limited. Imagination encircles sport, en géolocalisation, en étude sur une marque, le travail à faire est conséquent afin de tirer la the world. substantifique moelle des (Giga, Tera, Exa, ....) octets d’informations quotidiennes, transitantes et disponibles. DIRECTION Le projet de 50A R&D est ambitieux : au contraire Albert Einstein de ceux qui cherchent à savoir qui est le plus influent ou quelle est l’information la plus intéressante, iBrain, du nom du projet de Recherche et Développement, est une application qui tente de vous apporter l’information cachée dans vos flux en Les grands moyens : l’association avec le CNRS. re-corrélant les informations qui lui semblent pertinentes ; rappelez vous : si une personne fait un En février 2011, 50A a noué un partenariat avec Foursquare, c’est bien. Si iBrain détecte qu’elle et l’UTC (Université Technologique de Compiègne) et vous êtes amies ET qu’elle et vous êtes à moins de notamment un de ses laboratoires, HEUDIASYC, 30m l’une de l’autre : c’est mieux ! Unité Mixte de Recherches CNRS 6599 (http://www.hds.utc.fr/), dont le directeur de De la même façon, comment profiter de l’Open Data recherches est Ali Charara. public : comment iBrain peut-il prendre l’initiative de me proposer tel restaurant parce que Spécialisé dans l’extraction et la manipulation de la ce dernier aura proposé une offre intéressante parce connaissance, l’équipe de recherches considérée est que iBrain l’aura de lui-même qualifié comme telle!? ICI (Information Connaissance Interaction) dont la responsable est MH Abel. 50A se lance donc dans une processus de R&D afin de développer iBrain. Inférence et probabilités Une thèse CIFRE va démarrer et aura pour titre : bayésiennes, Datamining, Corrélation sémantique, la “Système d’analyse de systèmes sociaux : grande Aventure scientifique commence. extraction et gestion d’informations pour l’élaboration d’un système multidimensionnel de connaissances corrélées” Cette thèse sera co encadrée par M.H. Abel, P. Morizet-Mahoudeaux, du laboratoire HEUDIASYC. L’objet de cette recherche en collaboration est de réaliser un modèle multidimensionnel de connaissances corrélées construit à partir de connaissances publiques et libres des utilisateurs, de données d’intérêt et des environnements d’exploitation. Elle s’appuiera sur l’étude de méthodes d’identification et de caractérisation d’un utilisateur dans un environnement socio-professionnel, la collection de données d’intérêt et la définition d’un contexte d’exploitation. Elle devra permettre de corréler l’ensemble de ces ressources et systèmes d’information pour proposer spontanément ou suite à une requête une information pertinente en fonction des circonstances et des besoins d’exploitation. 5
  • 6. Certaines des données et informations du réseau internet deviennent de façon croissante maintenant librement accessibles et réutilisables, soit de fait dans les réseaux sociaux, soit suite à une mise à L’objet de cette recherche en disposition publique volontaire comme dans collaboration est de réaliser un l’OpenData. La juxtaposition de ces ressources d’information représente un potentiel de modèle multidimensionnel de connaissances que l’on ne sait pas encore bien connaissances corrélées exploiter. En effet, les bases de données qui stockent ces informations et les flux relatifs à leur construit à partir de exploitation sont totalement déconnectés et ne connaissances publiques et partagent presqu’aucune méta-information qui permettrait de les lier les uns aux autres. libres des utilisateurs, de données d’intérêt et des Contrairement aux données privées que l’on ne peut exploiter que sous licence, ces données publiques, environnements d’exploitation. bien qu’accessibles librement, n’offrent aucune structure simple, qui permet de les ré-utiliser ensemble. En revanche, leur massification, leur diversité et leur universalité ne laisse planer aucun doute sur l’accroissement de connaissance que l’on peut espérer d’une exploitation qui s’appuierait sur des recoupements, des associations et la recherche Les méthodes utilisées s’appuient sur des techniques de leurs corrélations. A ce constat il faut ajouter le de relevance feedback (retour sur pertinence) selon développement d’un environnement pervasif (ou deux approches principales. La première repose sur ubiquitaire) qui, grâce à une informatique diffuse, une sélection, par l’utilisateur, des réponses les plus permet aux objets communicants tels les téléphones appropriées à une requête initiale, puis, à partir de ou les tablettes interactives de se reconnaître entre cette sélection affiner la requête initiale pour eux et de se localiser automatiquement. relancer une recherche. Une fois repérées, retraitées et recoupées, la mise La seconde consiste, dans une première phase en commun de ces informations laisse présager d’apprentissage à donner une valeur de pertinence l’éclosion d’une intelligence collective. Elle devrait (par l’utilisateur) aux informations retournées pour ainsi favoriser de nouvelles formes de un ensemble aléatoire de requêtes, puis, à partir créativité, permettre l’émergence de nouveaux d’évaluations statistiques, à donner un poids aux usages, le développement de nouveaux services pour descripteurs qui constituent le corpus de ces la vie quotidienne privée et professionnelle, la requêtes. démocratisation et la transparence des savoirs. Ces deux approches, même si elles apportent une Les tentatives actuelles de mise en commun amélioration notable dans la sélection de documents s’appuient, pour la plupart, sur l’exploitation des appropriés, restent lourdes à mettre en place et ne descripteurs de l’information tels, le taux de tweets prennent pas en compte des informations le plus retweetés, les vidéos les plus échangées, les spécifiques aux utilisateurs et aux circonstances de articles de journaux les plus souvent répétés pour la requête. faire des regroupements, des cures et des classifications. Cela se traduit généralement par En effet, elles améliorent la sélection des l’utilisation des données statistiques sur ces documents uniquement par une analyse des descripteurs, auxquels on peut parfois ajouter des requêtes indépendamment du contexte dans lequel éléments d’une ontologie descriptive du domaine elles ont été formulées. concerné. Autrement dit, deux utilisateurs distincts peuvent Des efforts importants de recherche sont menés dans formuler la même requête mais ne pas vouloir le domaine des systèmes de recherche obtenir les mêmes résultats, selon, par exemple, d’informations disponibles sur le web ou les sites que l’un veut approfondir un domaine dans lequel il internes des entreprises pour proposer aux est déjà expert ou sur lequel il a déjà obtenu des utilisateurs une réponse appropriée à leurs besoins informations et que l’autre souhaite avoir une et la pertinence (relevance) de l’information approche synthétique d’un domaine qu’il aborde retournée en réponse à une requête. pour une première fois. Le principe général consiste à sélectionner dans la masse des informations retournées, celles qui semblent être le mieux adaptées à la requête qui a été formulée 6
  • 7. De même, un utilisateur donné peut formuler deux requêtes semblables mais dans des circonstances d’espace et de temps différentes qui impliquent deux réponses distinctes. L’estimation de la pertinence nécessite alors une double interprétation : celle du contenu de l’information retournée et celle du besoin informationnel de l’utilisateur. L’estimation de la pertinence est une mesure qui est évaluée en fonction de plusieurs paramètres : • ceux relatifs à l’utilisateur • ceux relatifs aux informations, • ceux relatifs à l’environnement. L’ensemble de ces paramètres définit la notion de contexte. Les éléments qui définissent le contexte utilisateur sont également de plusieurs ordres : son profil, ses préférences, son expertise, son objectif, la tâche à résoudre, … Ils s’appuient sur un modèle qui peut se construire a priori à l’aide, par exemple, d’un questionnaire d’auto description rempli par l’utilisateur, mais aussi a posteriori par apprentissage sur des comportements observés. Ceux qui définissent une information (un document textuel, un fichier vidéo, une page web d’un journal, …) sont par exemple une date de création ou de modification, un type, une origine, une disponibilité, une accessibilité et des descripteurs de contenu (les mots d’un texte, des données d’UNE image…). Ceux qui définissent l’environnement sont, par exemple, le lieu, l’heure, le groupe professionnel concerné, le niveau de sécurité, … Cependant, comme indiqué en introduction, la simple juxtaposition de ces connaissances ne suffit pas pour apporter la réponse souhaitée ; son élaboration nécessite de les faire interagir. Cela signifie qu’avant l’émission de la requête (voire l’envoi d’un message sans sollicitation) les liens entre les sources d’information aient été établis pour construire une connaissance. L’hypothèse est donc qu’un système constitué d’un individu, faisant partie d’une sphère d’intérêt (un réseau social, une entreprise, un domaine culturel, …) voulant acquérir une connaissance constitué de plusieurs sources d’informations liées, à un instant et en un lieu donnés, répondent à un certain nombre de critères qui permettent de construire un modèle. Ce modèle, multi-dimensionnel, réunit l’individu, les informations et l’environnement en un seul ensemble qui a construit les associations potentielles entre les éléments qui le constituent. Ce sont, par exemple, une mémoire collaborative d’un groupe socio-professionnel, une organisation des informations par centre d’intérêt, une géolocalisation des accès aux ressources. La vérification de cette hypothèse et la réalisation de ce modèle reposent sur la construction d’un réceptacle, noté iBrain, qui collationnerait en permanence l’ensemble des données (utilisateur, information, environnement) pour construire et mettre à jour les liens potentiels entre celles-ci. Bienvenue dans la Matrice. 7
  • 8. « L'ordinateur ne peut que restituer, sous une forme plus ou moins élaborée, les concepts que le chercheur y a introduits. Il est incapable de faire preuve d'intuition, démarche subtile encore mal comprise qui seule peut conduire à la découverte. [...] La vocation première d'un chercheur est de créer de l'information nouvelle et non pas de manipuler d'une manière de plus en plus élaborée l'information déjà disponible ». [Pierre Joliot] Extrait de « La Recherche passionnément » Nicolas Bermond : Fondateur et Directeur de 50 A, Nicolas est titulaire d’un master dont la thèse a porté sur l’étude des small world (la fameuse théorie des 6 degrés de séparation). Il a une connaissance parfaite du web, de ses modèles, de ses pratiques, des techniques et des protocoles. Il a une expertise reconnue en réseaux sociaux et en web 2.0. Nicolas chapeaute donc le projet Vincent Mulard : Ingénieur, Vincent est le spécialiste du développement : MVC, C#, extends et autre preg_match, tous ces mots n’ont un secret pour lui et c’est ainsi que les flux plongent dans ses API, s’associent et corrélationnent dans l’infini pour créer créent les connaissances pertinentes dans une nouvelle expérience utilisateur digne de 50A et du XXIèS Vincent Pinte Deregnaucourt : Ingénieur, Mathématicien, consultant en R&D et agréé par le ministère de l’enseignement supérieur et de la recherche, Vincent pilote le projet de R&D en interne et apporte son expertise de chercheur et son expérience d’entrepreneur. Jordan Bracco: 20 ans, 2m et déjà beaucoup d’années dans le WEB! Ce grand génie a été séduit par le projet de 50A et c’est tout naturellement qu’il a rejoint l’équipe. Dans ces derniers faits d’armes, Jordan est allé en Afrique pour permettre aux Tunisiens de faire leur révolution, en installant des modems dans la nuit... Damien Houille : Ingénieur, HEC, Damien est l'expat’ de l'équipe. Passionné par les réseaux sociaux et spécialiste de l'analyse de la réputation des entreprises, il participe aux prototypes liés à iBrain depuis le soleil d'Afrique du Sud. Glenn Rolland : Normalien, Glenn a une expertise d’entrepreneur et des réseaux sociaux sans pareil. Il apporte son concours dans le projet, à travers également un autre projet plus personnel qui pourrait s’intercaler dans le notre. Xuan Truong VU : 23 ans, arrive avec sa culture du Vietnam et en France depuis mars 2007, il termine tout juste un diplôme d'ingénieur en Informatique à l'UTC (Compiègne) et s'apprête à faire une thèse CIFRE, chez 50A, encadrée par l’UTC. Passionné de nouvelles technos, il aime aussi le football et la photographie. 8
  • 9. iBrain Par 50A.fr Nicolas Bermond Directeur de 50 A, PARIS Nicolas@50A.fr @Nicolas2fr