2. Chaque minute:
• 48 hrs de vidéo sont téléchargées sur Youtube
• 320 nouveaux comptes et 98,000 tweets sur
Twitter
• 168,000,000 millions de courriels envoyés
• 20,000 nouveaux billets sur Tumblr
• 6,600 photos téléchargées sur Flickr
• De plus 20% de tous les site web sont des
CMS/wordpress/etc…
@cgtheoret
11. Mais…
• Facebook a perdu 1,5 million d’utilisateurs aux
Canada et 6 millions aux Etats-Unis
• Étude de Yahoo: 50% du contenu lu et partagé
par des humains est généré par seulement
20 000 comptes
@cgtheoret
13. Alors, ce flux diluvien de données ne se
mesure pas seulement à une échelle presque
humainement inconcevable, il y a aussi
plusieurs dynamiques internes qui entrent en
cause et qui compliquent la compréhension…
@cgtheoret
16. Ceci est tellement compliqué que Standford
offre maintenant un cours sur le sujet :
@cgtheoret
17. Qui est le professeur qui donne ces cours de statistiques et de
marketing ?
Un physicien bien sûr…
Andreas Wiegend : avant d’accepter une position à Stanford, il était
« Chief Data Scientist » chez Amazon. L’appellation « Social Data
Revolution » lui appartient.
@cgtheoret
18. Facebook (et Zynga) sont assis sur la base de données
sociologique la plus vaste et détaillée jamais créée par l’être
humain.
Facebook possède toutes ces données et il ne les partage pas.
Cette base de données est utilisée exclusivement pour mieux
vous vendre de la publicité et …?
@cgtheoret
19. Le cas du Robin des Bois des données sociales ?
Pete Warden
@cgtheoret
20. Pete Warden était un ingénieur chez Apple et a décidé de partir
pour créer une startup…
La startup n’a pas fonctionné et dans son temps libre, il a
développé un crawler de Facebook, légal, tout en utilisant leur
API de développeur.
En 2010, son crawler a roulé pendant 6 mois et a recueilli de
l’information sur 215 million d’utilisateurs, qu’il a regroupés
par ville, état, etc., tout en conservant leur anonymat.
@cgtheoret
24. En 2010, LinkedIn a embauché une équipe de
17 personnes pour faire la même chose :
@cgtheoret
25. Mais est-ce qu’une personne ou une entreprise
“normale” peut faire du sens de cette masse
de données sans avoir recours à des équipes
d’experts et d’énormes budgets ?
Il existe actuellement des centaines d’outils pour
faire le « monitoring » des médias sociaux :
195 outils ici:
http://www.salesrescueteam.com/social-media-measurement-tools/
@cgtheoret
26. Il existe même un wiki qui répertorie 224 outils :
http://wiki.kenburbary.com/
@cgtheoret
27. Mais même avec le succès monstre de certaines
compagnies de « monitoring » :
Radian6 : 326 $millions / revenues ~20 $Millions
Sysomos : 34 $millions / revenues ~2 $Millions
Scoutlabs : 20$ millions / revenues ~1 $Millions
Postrank : acheté par Google, BackType : acheté
par Twitter, ect…
@cgtheoret
30. Monitoring / Analyse
• Les outils de « monitoring » présentent les
données du web social comme un tableau
Excel:
– Une liste de “nodes”, i.e., billets de blogues,
tweets, etc.
– Présenté en séquence, un après l’autre par
ordre de date
– L’emphase est mise sur le temps réel
– Cela fonctionne pour quelques dizaines, des
centaines de billets… mais que faire avec des
milliers de billets ?
– Cela devient très cher et laborieux de faire du
sens de tous ces billets
@cgtheoret
31. Monitoring / Analyse
• La valeur ajoutée – supplémentaire -
dans les médias sociaux n’est pas
dans les données brute, mais dans
les connexions entre les personnes
Et entre les idées
• C’est fondamentalement un réseau
…et un réseau = les relations
• Pour comprendre le réseau, il faut
comprendre les relations
• Pour bien comprendre un élément
dans les réseaux, il faut comprendre
son contexte
@cgtheoret
32. Avec le « Social Graph » on peut calculer « qui
parle à qui », « qui est connecté à qui », et
possiblement où.
Mais on peut aller plus loin…
@cgtheoret
33. Avec plus d’informations et de calculs, on peut
voir ce qui intéresse les gens et comment leurs
intérêts sont liés…
Ceci est le deuxième défi
de Facebook :
« The interest graph »
Comment les idées et les conversations se
connectent sur le web social.
@cgtheoret
42. Ça mange quoi en hiver un « interest graph »?
Prenons un exemple concret.
Appelons le Réjean…
6’2’’, 35 ans, marié, habite Val D’Or…
Selon la recherche marketing traditionnelle…
@cgtheoret
49. Pourquoi faut-il un physicien pour comprendre
la révolution des données sociale ?
Parce qu’il n’est pas seulement un physicien!! Il
comprend le comportement social humain…
@cgtheoret