ELABE BFMTV L'Opinion en direct - Les Français et les 100 jours de Gabriel Attal
Analyse du capitalisme social sur Twitter
1. Analyse du capitalisme social sur Twitter
Nicolas Dugu´e
Dirig´e par :
Jean-Michel Couvreur, Professeur `a l’universit´e d’orl´eans
Encadr´e par :
Fr´ed´eric Moal, Maˆıtre de conf´erences `a l’Universit´e d’Orl´eans
Anthony Perez, Maˆıtre de conf´erences `a l’Universit´e d’Orl´eans
29 juin 2015
2. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Twitter
R´eseau social num´erique
Cr´e´e en 2006
302 millions d’utilisateurs mensuels
Profils publics
Connexions entre utilisateurs
micro-blogging
2/63
N. Dugu´e
3. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Twitter
R´eseau social num´erique
Cr´e´e en 2006
302 millions d’utilisateurs mensuels
Profils publics
Connexions entre utilisateurs
micro-blogging
2/63
N. Dugu´e
4. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Twitter - Syst`eme d’abonnements
3/63
N. Dugu´e
5. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Twitter - Timeline
4/63
N. Dugu´e
6. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Twitter - Hashtags
5/63
N. Dugu´e
7. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Twitter - Hashtags
5/63
N. Dugu´e
8. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Twitter - Mentions
6/63
N. Dugu´e
9. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
7/63
N. Dugu´e
10. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Un outil massivement utilis´e
Un milliard de tweets sont post´es tous les deux jours et demi
Un usage abondant dans les m´edias
94% des 100 plus grandes compagnies (classement Interbrand) :
au moins un par jour
Barack Obama pour sa campagne [HHSS14]
Plus de 260 publications recens´ees sur le site de Danah Boyd
8/63
N. Dugu´e
11. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Un outil massivement utilis´e
Un milliard de tweets sont post´es tous les deux jours et demi
Un usage abondant dans les m´edias
94% des 100 plus grandes compagnies (classement Interbrand) :
au moins un par jour
Barack Obama pour sa campagne [HHSS14]
Plus de 260 publications recens´ees sur le site de Danah Boyd
8/63
N. Dugu´e
12. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Un outil massivement utilis´e
Un milliard de tweets sont post´es tous les deux jours et demi
Un usage abondant dans les m´edias
94% des 100 plus grandes compagnies (classement Interbrand) :
au moins un par jour
Barack Obama pour sa campagne [HHSS14]
Plus de 260 publications recens´ees sur le site de Danah Boyd
8/63
N. Dugu´e
13. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Un outil massivement utilis´e
Un milliard de tweets sont post´es tous les deux jours et demi
Un usage abondant dans les m´edias
94% des 100 plus grandes compagnies (classement Interbrand) :
au moins un par jour
Barack Obama pour sa campagne [HHSS14]
Plus de 260 publications recens´ees sur le site de Danah Boyd
8/63
N. Dugu´e
14. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Un outil massivement utilis´e
Un milliard de tweets sont post´es tous les deux jours et demi
Un usage abondant dans les m´edias
94% des 100 plus grandes compagnies (classement Interbrand) :
au moins un par jour
Barack Obama pour sa campagne [HHSS14]
Plus de 260 publications recens´ees sur le site de Danah Boyd
8/63
N. Dugu´e
15. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Recherche acad´emique
Diffusion de l’information
Fouille de donn´ees
Visibilit´e, influence
D´etection des utilisateurs malicieux
8/63
N. Dugu´e
16. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Recherche acad´emique
Diffusion de l’information
Fouille de donn´ees
Visibilit´e, influence
D´etection des utilisateurs malicieux
8/63
N. Dugu´e
17. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Recherche acad´emique
Diffusion de l’information
Fouille de donn´ees
Visibilit´e, influence
D´etection des utilisateurs malicieux
8/63
N. Dugu´e
18. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Recherche acad´emique
Diffusion de l’information
Fouille de donn´ees
Visibilit´e, influence
D´etection des utilisateurs malicieux
8/63
N. Dugu´e
19. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Le capitalisme social sur Twitter
9/63
N. Dugu´e
20. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Capital social ?
Bourdieu : ”l’ensemble des ressources actuelles ou potentielles qui
sont li´ees `a la possession d’un r´eseau durable de relations”
10/63
N. Dugu´e
21. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Capital social ?
Bourdieu : ”l’ensemble des ressources actuelles ou potentielles qui
sont li´ees `a la possession d’un r´eseau durable de relations”
Capital social sur Twitter
Acc´eder `a une information pertinente
Diffuser de l’information
Lier de nouveaux contacts
Se sentir visible
10/63
N. Dugu´e
22. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Capital social sur Twitter [GVK+12]
Introduit par Ghosh et al. : Utilisateurs ”r´eels” qui suivent le plus les
spammeurs.
Liste de 100.000 utilisateurs.
11/63
N. Dugu´e
23. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Capital social sur Twitter [GVK+12]
Introduit par Ghosh et al. : Utilisateurs ”r´eels” qui suivent le plus les
spammeurs.
Liste de 100.000 utilisateurs.
Maximiser le nombre d’abonn´es pour maximiser le capital social
11/63
N. Dugu´e
24. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Strat´egies des capitalistes sociaux
I Follow You, Follow Me (IFYFM)
Follow Me, I Follow You (FMIFY)
in out
in out
12/63
N. Dugu´e
25. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Strat´egies des capitalistes sociaux
Figure : Figure issue de Lee et al. [LEC11]
IFYFM
Utilisateur
r´egulier
12/63
N. Dugu´e
26. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Objectifs
Spam [LCKC12]
Narcissime [MKD12]
Obtenir de la visibilit´e
Vendre de la visibilit´e
13/63
N. Dugu´e
27. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Objectifs
Spam [LCKC12]
Narcissime [MKD12]
Obtenir de la visibilit´e
Vendre de la visibilit´e
13/63
N. Dugu´e
28. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Objectifs
Spam [LCKC12]
Narcissime [MKD12]
Obtenir de la visibilit´e
Vendre de la visibilit´e
13/63
N. Dugu´e
29. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Objectifs
Spam [LCKC12]
Narcissime [MKD12]
Obtenir de la visibilit´e
Vendre de la visibilit´e
13/63
N. Dugu´e
30. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les capitalistes sociaux
Collecte de jeux de donn´ees sur le ph´enom`ene
D´etection automatique
´Evaluation de la visibilit´e qu’ils obtiennent
Mod´elisation de ces utilisateurs
Pond´eration de l’influence attribu´ee `a ces utilisateurs
14/63
N. Dugu´e
31. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les capitalistes sociaux
Collecte de jeux de donn´ees sur le ph´enom`ene
D´etection automatique
´Evaluation de la visibilit´e qu’ils obtiennent
Mod´elisation de ces utilisateurs
Pond´eration de l’influence attribu´ee `a ces utilisateurs
14/63
N. Dugu´e
32. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les capitalistes sociaux
Collecte de jeux de donn´ees sur le ph´enom`ene
D´etection automatique
´Evaluation de la visibilit´e qu’ils obtiennent
Mod´elisation de ces utilisateurs
Pond´eration de l’influence attribu´ee `a ces utilisateurs
14/63
N. Dugu´e
33. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les capitalistes sociaux
Collecte de jeux de donn´ees sur le ph´enom`ene
D´etection automatique
´Evaluation de la visibilit´e qu’ils obtiennent
Mod´elisation de ces utilisateurs
Pond´eration de l’influence attribu´ee `a ces utilisateurs
14/63
N. Dugu´e
34. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les capitalistes sociaux
Collecte de jeux de donn´ees sur le ph´enom`ene
D´etection automatique
´Evaluation de la visibilit´e qu’ils obtiennent
Mod´elisation de ces utilisateurs
Pond´eration de l’influence attribu´ee `a ces utilisateurs
14/63
N. Dugu´e
35. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
1 Introduction
2 Capitalisme social : des m´ethodes efficaces
Des hashtags d´edi´es
Capitalisme social automatique
D´etection topologique
Evolution des capitalistes sociaux entre 2009 et 2013
3 Visibilit´e : rˆoles communautaires
Structure de communaut´es
Rˆoles communautaires
Position des capitalistes sociaux
4 Influence perc¸ue
Mesurer l’influence sur Twitter
Influence des capitalistes sociaux
Pond´erer leur influence
5 Conclusion
15/63
N. Dugu´e
36. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
#TeamFollowBack
16/63
N. Dugu´e
37. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
#TeamFollowBack
725.000 tweets r´ecolt´es en f´evrier 2013
Nombre de hashtags moyen par tweet : 5,8
Nombre de mentions moyen par tweet : 1
25.000 hashtags diff´erents
Quelles sont les sources des tweets ?
Quels sont les autres hashtags utilis´es ?
L’automatisation de cette m´ethode est elle efficace ?
16/63
N. Dugu´e
38. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les hashtags
Figure : Les 10 hashtags les plus utilis´es (50% du jeu de donn´ees).
17/63
N. Dugu´e
39. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les sources
Figure : Sources utilis´ees pour 90% des tweets du jeu de donn´ees. Sources
automatiques en haut `a droite.
18/63
N. Dugu´e
40. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
1 Introduction
2 Capitalisme social : des m´ethodes efficaces
Des hashtags d´edi´es
Capitalisme social automatique
D´etection topologique
Evolution des capitalistes sociaux entre 2009 et 2013
3 Visibilit´e : rˆoles communautaires
Structure de communaut´es
Rˆoles communautaires
Position des capitalistes sociaux
4 Influence perc¸ue
Mesurer l’influence sur Twitter
Influence des capitalistes sociaux
Pond´erer leur influence
5 Conclusion
19/63
N. Dugu´e
41. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Compte automatis´e
Une IA digne de DeepBlue
Rejoue les tweets du jeu de donn´ees
”Follow back”
S’abonne aux utilisateurs qui le mentionnent
S’abonne aux utilisateurs qui le retweetent
20/63
N. Dugu´e
42. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Compte automatis´e
20/63
N. Dugu´e
45. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
1 Introduction
2 Capitalisme social : des m´ethodes efficaces
Des hashtags d´edi´es
Capitalisme social automatique
D´etection topologique
Evolution des capitalistes sociaux entre 2009 et 2013
3 Visibilit´e : rˆoles communautaires
Structure de communaut´es
Rˆoles communautaires
Position des capitalistes sociaux
4 Influence perc¸ue
Mesurer l’influence sur Twitter
Influence des capitalistes sociaux
Pond´erer leur influence
5 Conclusion
23/63
N. Dugu´e
46. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Strat´egies des capitalistes sociaux
I Follow You, Follow Me (IFYFM)
Follow Me, I Follow You (FMIFY)
in out
in out
24/63
N. Dugu´e
47. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
D´etection topologique
Indice de chevauchement
Ic(A, B) =
|A ∩ B|
min {|A|, |B|}
25/63
N. Dugu´e
48. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
D´etection topologique
Indice de chevauchement
Ic(A, B) =
|A ∩ B|
min {|A|, |B|}
q
q q q q q
q
q
q
q
q
0.0 0.2 0.4 0.6 0.8 1.0
0.00.20.40.60.81.0
overlap index
Cumulativeusersproportion
0.74
25/63
N. Dugu´e
49. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
´Evolution
Une capture du r´eseau de Twitter
Un graphe collect´e par Kwak et. al en 2009 [KLPM10] :
41 millions d’utilisateurs
1,4 milliard d’arcs
Capitalistes sociaux
145.000 d´etect´es
⇒ Echantillon de 75% en 2013
26/63
N. Dugu´e
50. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
´Evolution
Une capture du r´eseau de Twitter
Un graphe collect´e par Kwak et. al en 2009 [KLPM10] :
41 millions d’utilisateurs
1,4 milliard d’arcs
Capitalistes sociaux
145.000 d´etect´es
⇒ Echantillon de 75% en 2013
26/63
N. Dugu´e
54. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
1 Introduction
2 Capitalisme social : des m´ethodes efficaces
Des hashtags d´edi´es
Capitalisme social automatique
D´etection topologique
Evolution des capitalistes sociaux entre 2009 et 2013
3 Visibilit´e : rˆoles communautaires
Structure de communaut´es
Rˆoles communautaires
Position des capitalistes sociaux
4 Influence perc¸ue
Mesurer l’influence sur Twitter
Influence des capitalistes sociaux
Pond´erer leur influence
5 Conclusion
30/63
N. Dugu´e
55. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Le graphe de Twitter
Les utilisateurs sont des sommets
Les liens d’abonnement sont des arcs orient´es.
31/63
N. Dugu´e
56. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Le graphe de Twitter
Les utilisateurs sont des sommets
Les liens d’abonnement sont des arcs orient´es.
Visibilit´e des capitalistes sociaux
Au centre du r´eseau ?
A la marge du r´eseau ?
Connect´es `a qui ?
31/63
N. Dugu´e
57. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Le graphe de Twitter
Les utilisateurs sont des sommets
Les liens d’abonnement sont des arcs orient´es.
Niveau interm´ediaire du r´eseau
31/63
N. Dugu´e
58. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
1 Introduction
2 Capitalisme social : des m´ethodes efficaces
Des hashtags d´edi´es
Capitalisme social automatique
D´etection topologique
Evolution des capitalistes sociaux entre 2009 et 2013
3 Visibilit´e : rˆoles communautaires
Structure de communaut´es
Rˆoles communautaires
Position des capitalistes sociaux
4 Influence perc¸ue
Mesurer l’influence sur Twitter
Influence des capitalistes sociaux
Pond´erer leur influence
5 Conclusion
32/63
N. Dugu´e
59. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Structure de communaut´es
D´efinition
Partition du graphe telle que les noeuds d’une partie sont plus
connect´es entre eux qu’avec le reste du graphe.
615
10
19
2
4
9
2114
85
22
16
18 12
1
7
3 13
11
17
20
33/63
N. Dugu´e
60. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Structure de communaut´es
Modularit´e [GN02]
Q =
1
2m
i,j
(Aij −
d(i)d(j)
2m
)δ(ci, cj)
d(i) le degr´e du noeud i
m le nombre d’arˆetes du r´eseau
Aij le poids de l’arˆete entre i et j ou 0 s’il n’y en a pas
ci la communaut´e du noeud i
δ(ci , cj ) ´egal `a 1 si i et j sont dans la mˆeme communaut´e, 0 sinon.
34/63
N. Dugu´e
61. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Structure de communaut´es
Modularit´e orient´ee [LN08]
Qo =
1
2m
i,j
(Aij −
d−(i)d+(j)
2m
)δ(ci, cj)
d−
(i) le degr´e entrant du noeud i
d+
(i) le degr´e entrant du noeud i
m le nombre d’arˆetes du r´eseau
Aij le poids de l’arˆete entre i et j ou 0 s’il n’y en a pas
ci la communaut´e du noeud i
δ(ci , cj ) ´egal `a 1 si i et j sont dans la mˆeme communaut´e, 0 sinon.
34/63
N. Dugu´e
62. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Structure de communaut´es
Modularit´e orient´ee [LN08]
Qo =
1
2m
i,j
(Aij −
d−(i)d+(j)
2m
)δ(ci, cj)
Algorithme de Louvain [BGLL08]
Optimisation : NP-difficile
→ Louvain : Algorithme glouton
34/63
N. Dugu´e
63. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
1 Introduction
2 Capitalisme social : des m´ethodes efficaces
Des hashtags d´edi´es
Capitalisme social automatique
D´etection topologique
Evolution des capitalistes sociaux entre 2009 et 2013
3 Visibilit´e : rˆoles communautaires
Structure de communaut´es
Rˆoles communautaires
Position des capitalistes sociaux
4 Influence perc¸ue
Mesurer l’influence sur Twitter
Influence des capitalistes sociaux
Pond´erer leur influence
5 Conclusion
35/63
N. Dugu´e
64. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Rˆole communautaire
Objectif
Sont ils hubs dans les
communaut´es ?
Sont ils isol´es dans leurs
communaut´es ?
Sont ils tr`es connect´es aux
communaut´es ext´erieures ?
36/63
N. Dugu´e
65. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Rˆole communautaire
Objectif
Sont ils hubs dans les
communaut´es ?
Sont ils isol´es dans leurs
communaut´es ?
Sont ils tr`es connect´es aux
communaut´es ext´erieures ?
36/63
N. Dugu´e
66. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Rˆole communautaire
Objectif
Sont ils hubs dans les
communaut´es ?
Sont ils isol´es dans leurs
communaut´es ?
Sont ils tr`es connect´es aux
communaut´es ext´erieures ?
36/63
N. Dugu´e
67. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
M´ethode de Guimer`a & Amaral [GA05]
Principe :
Caract´eriser la position d’un
nœud en fonction de sa
connectivit´e communautaire
Connectivit´e communautaire
d´ecrite par 2 mesures
Processus :
1 Identification des
communaut´es
2 Calcul des 2 mesures
nodales
3 Partition de l’espace 2D
obtenu
4 Mise en correspondance des
rˆoles
37/63
N. Dugu´e
68. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
M´ethode de Guimer`a & Amaral [GA05]
Principe :
Caract´eriser la position d’un
nœud en fonction de sa
connectivit´e communautaire
Connectivit´e communautaire
d´ecrite par 2 mesures
Processus :
1 Identification des
communaut´es
2 Calcul des 2 mesures
nodales
3 Partition de l’espace 2D
obtenu
4 Mise en correspondance des
rˆoles
37/63
N. Dugu´e
69. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
M´ethode de Guimer`a & Amaral [GA05]
Principe :
Caract´eriser la position d’un
nœud en fonction de sa
connectivit´e communautaire
Connectivit´e communautaire
d´ecrite par 2 mesures
Processus :
1 Identification des
communaut´es
2 Calcul des 2 mesures
nodales
3 Partition de l’espace 2D
obtenu
4 Mise en correspondance des
rˆoles 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
-10123
Within-CommunityDegreez
Participation Coefficient P
37/63
N. Dugu´e
70. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
M´ethode de Guimer`a & Amaral [GA05]
Principe :
Caract´eriser la position d’un
nœud en fonction de sa
connectivit´e communautaire
Connectivit´e communautaire
d´ecrite par 2 mesures
Processus :
1 Identification des
communaut´es
2 Calcul des 2 mesures
nodales
3 Partition de l’espace 2D
obtenu
4 Mise en correspondance des
rˆoles 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
-10123
Within-CommunityDegreez
Participation Coefficient P
Provincial Hubs
Peripheral Non-Hubs
Ultra-PeripheralNon-Hubs
ConnectorNon-Hubs
Kinless Non-Hubs
Connector Hubs Kinless Hubs
37/63
N. Dugu´e
71. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
M´ethode de Guimer`a & Amaral [GA05]
Principe :
Caract´eriser la position d’un
nœud en fonction de sa
connectivit´e communautaire
Connectivit´e communautaire
d´ecrite par 2 mesures
Processus :
1 Identification des
communaut´es
2 Calcul des 2 mesures
nodales
3 Partition de l’espace 2D
obtenu
4 Mise en correspondance des
rˆoles 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
-10123
Within-CommunityDegreez
Participation Coefficient P
Provincial Hubs
Peripheral Non-Hubs
Ultra-PeripheralNon-Hubs
ConnectorNon-Hubs
Kinless Non-Hubs
Connector Hubs Kinless Hubs
37/63
N. Dugu´e
72. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Mesures de rˆole
Connectivit´e interne
z(u) = dint (u)−µi (dint)
σi (dint ) , u ∈ Ci
z-score du degr´e interne dint
z=0.27
z=0.27 z=0.27
z=0.27
z=1.07
z=–2.14
z=–0.45
z=–0.45
z=–0.45
z=–0.45
z=–0.45
z=2.24
38/63
N. Dugu´e
73. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Mesures de rˆole
Connectivit´e externe
P(u) = 1 − i
di (u)
d(u)
2
di : degr´e pour Ci
P(u) = 0 :
Une seule communaut´e
P(u) ≈ 1 :
Nombreuses
communaut´es
Mˆeme nombre de liens
P=0.19 P=0.89
38/63
N. Dugu´e
74. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les rˆoles
Seuils Universels
8 r´eseaux du r´eel
8 r´eseaux artificiels
Distribution des mesures de connectivit´e
39/63
N. Dugu´e
75. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les rˆoles
Seuils Universels
8 r´eseaux du r´eel
8 r´eseaux artificiels
Distribution des mesures de connectivit´e
Degr´e intra-communautaire Coefficient de Participation
Hub z ≥ 2, 5 Provincial P ≤ 0, 30
Connecteur P ∈]0, 30; 0, 75]
Orphelin P > 0, 75
Non-Hub z < 2, 5 Ultra-p´eriph´erique P ≤ 0, 05
P´eriph´erique P ∈]0, 05; 0, 62]
Connecteur P ∈]0, 62; 0, 80]
Orphelin P > 0, 80
39/63
N. Dugu´e
77. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Limitations de l’approche
Hypoth`ese : Seuils universels
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
-10123
Within-CommunityDegreez
Participation Coefficient P
Provincial Hubs
Peripheral Non-Hubs
Ultra-PeripheralNon-Hubs
ConnectorNon-Hubs
Kinless Non-Hubs
Connector Hubs Kinless Hubs
Seuils Universels
8 r´eseaux du r´eel
Une seule m´ethode de d´etection de communaut´es
Proportion de hubs : 2% → 0, 35% dans notre r´eseau
40/63
N. Dugu´e
78. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Limitations de l’approche
Hypoth`ese : Seuils universels
0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
-10123
Within-CommunityDegreez
Participation Coefficient P
Provincial Hubs
Peripheral Non-Hubs
Ultra-PeripheralNon-Hubs
ConnectorNon-Hubs
Kinless Non-Hubs
Connector Hubs Kinless Hubs
Orientation des liens ignor´ee
Syst`emes `a relations asym´etriques
Twitter : followers / followees → Quels seuils utiliser en orient´e ?
40/63
N. Dugu´e
79. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Limitations de l’approche
P = 0.58
40/63
N. Dugu´e
80. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Limitations de l’approche
P = 0.58
Interpr´etation de la mesure de connectivit´e externe
Degr´e, nombre de communaut´es, distribution des liens
Liens externes, mais aussi internes
40/63
N. Dugu´e
81. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Connectivit´e externe : nouvelle approche
Restriction aux communaut´es externes
3 aspects distincts consid´er´es :
Diversit´e D
(u) : nombre de communaut´es externes
D(u) : z-score de
Intensit´e externe Iext
dext : nombre de liens externes
Iext (u) : z-score de kext
H´et´erog´en´eit´e H
Dispersion des liens externes
λ(u) : ´ecart type de ki
H(u) : z-score de λ
= 2, dext = 5, λ = 1.5
= 2, dext = 6, λ = 2
= 3, dext = 4, λ = 0.5
41/63
N. Dugu´e
82. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Connectivit´e externe : nouvelle approche
Restriction aux communaut´es externes
3 aspects distincts consid´er´es :
Diversit´e D
(u) : nombre de communaut´es externes
D(u) : z-score de
Intensit´e externe Iext
dext : nombre de liens externes
Iext (u) : z-score de kext
H´et´erog´en´eit´e H
Dispersion des liens externes
λ(u) : ´ecart type de ki
H(u) : z-score de λ
= 2, dext = 5, λ = 1.5
= 2, dext = 6, λ = 2
= 3, dext = 4, λ = 0.5
41/63
N. Dugu´e
83. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Connectivit´e externe : nouvelle approche
Restriction aux communaut´es externes
3 aspects distincts consid´er´es :
Diversit´e D
(u) : nombre de communaut´es externes
D(u) : z-score de
Intensit´e externe Iext
dext : nombre de liens externes
Iext (u) : z-score de kext
H´et´erog´en´eit´e H
Dispersion des liens externes
λ(u) : ´ecart type de ki
H(u) : z-score de λ
= 2, dext = 5, λ = 1.5
= 2, dext = 6, λ = 2
= 3, dext = 4, λ = 0.5
41/63
N. Dugu´e
84. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Identification non-supervis´ee des rˆoles
Apprentissage non-supervis´e
des seuils
Chaque groupe obtenu
correspond `a un rˆole
R1R1
R2R2
R3R3
R5R5
R6R6
R4R4
42/63
N. Dugu´e
85. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
1 Introduction
2 Capitalisme social : des m´ethodes efficaces
Des hashtags d´edi´es
Capitalisme social automatique
D´etection topologique
Evolution des capitalistes sociaux entre 2009 et 2013
3 Visibilit´e : rˆoles communautaires
Structure de communaut´es
Rˆoles communautaires
Position des capitalistes sociaux
4 Influence perc¸ue
Mesurer l’influence sur Twitter
Influence des capitalistes sociaux
Pond´erer leur influence
5 Conclusion
43/63
N. Dugu´e
86. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Donn´ees & outils
R´eseau ´etudi´e
Collect´e en 2009 [CHBG10]
55 millions de nœuds (utilisateurs)
2 milliards de liens orient´es (liens d’abonnements)
44/63
N. Dugu´e
87. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Donn´ees & outils
M´ethodologie
D´etection des capitalistes sociaux
D´etection de communaut´es : Louvain orient´e
Calcul des mesures
Analyse de regroupement : k-moyennes distribu´e [Lia09]
S´election des groupes : indice Davies-Bouldin [DB79]
44/63
N. Dugu´e
88. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Propri´et´es des groupes
45/63
N. Dugu´e
89. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Propri´et´es des groupes
45/63
N. Dugu´e
90. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les capitalistes sociaux sont visibles !
Pr´esence dans des groupes bien sp´ecifiques
Hubs, connecteurs et tr`es connecteurs
→ Seulement 15% de noeuds p´eriph´eriques et non hubs.
46/63
N. Dugu´e
91. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
1 Introduction
2 Capitalisme social : des m´ethodes efficaces
Des hashtags d´edi´es
Capitalisme social automatique
D´etection topologique
Evolution des capitalistes sociaux entre 2009 et 2013
3 Visibilit´e : rˆoles communautaires
Structure de communaut´es
Rˆoles communautaires
Position des capitalistes sociaux
4 Influence perc¸ue
Mesurer l’influence sur Twitter
Influence des capitalistes sociaux
Pond´erer leur influence
5 Conclusion
47/63
N. Dugu´e
92. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Faux ´Ev`enements
Tweet du 4 septembre 2013
Information d´ementie par l’AFP le lendemain
48/63
N. Dugu´e
93. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Faux ´Ev`enements
Figure : Evolution des 5 ´ev`enements les plus populaires, d´etect´es au cours
des 24 heures pr´ec´edant le 1er mars 2014 `a 8h30.
Mention-Anomaly-Based Event Detection : MABED [GF14]
Vagues r´eguli`eres en mars : 6 mois apr`es → Une majorit´e de
capitalistes sociaux
48/63
N. Dugu´e
94. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Hashtags populaires
Figure : Hashtags les plus corr´el´es au hashtag #fathersday d’apr`es
http://hashtagify.me/
49/63
N. Dugu´e
95. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Hashtags populaires
Figure : Hashtags les plus populaires d’apr`es http://hashtags.org/
49/63
N. Dugu´e
96. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Klout
Outil de mesure de l’influence
Klout achet´e par Lithium Technology 200 millions de dollars en
mars 2014
”Your Klout Score : Why You Can’t Afford to Ignore It”, consultant
num´erique
”Identifying and Measuring Influencers in Social Marketing with
@Klout”, Simply Measured
50/63
N. Dugu´e
97. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Klout
Outil de mesure de l’influence
Klout achet´e par Lithium Technology 200 millions de dollars en
mars 2014
”Your Klout Score : Why You Can’t Afford to Ignore It”, consultant
num´erique
”Identifying and Measuring Influencers in Social Marketing with
@Klout”, Simply Measured
Principalement bas´e sur le nombre d’interactions
50/63
N. Dugu´e
98. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Influence des capitalistes sociaux
51/63
N. Dugu´e
99. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Influence des capitalistes sociaux
Compte automatis´e [MSOB13]
51/63
N. Dugu´e
100. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Influence des capitalistes sociaux
51/63
N. Dugu´e
101. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Influents ?
52/63
N. Dugu´e
102. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Influents ?
Sont-ils r´eellement influents ?
L’influence qui leur est accord´ee est elle l´egitime ?
52/63
N. Dugu´e
103. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
1 Introduction
2 Capitalisme social : des m´ethodes efficaces
Des hashtags d´edi´es
Capitalisme social automatique
D´etection topologique
Evolution des capitalistes sociaux entre 2009 et 2013
3 Visibilit´e : rˆoles communautaires
Structure de communaut´es
Rˆoles communautaires
Position des capitalistes sociaux
4 Influence perc¸ue
Mesurer l’influence sur Twitter
Influence des capitalistes sociaux
Pond´erer leur influence
5 Conclusion
53/63
N. Dugu´e
104. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Pond´erer leur influence
Collecte d’un jeu de donn´ees
Cr´eation d’un outil de d´etection qui ne n´ecessite pas tout le r´eseau
Impl´ementation en ligne
54/63
N. Dugu´e
105. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Jeu de donn´ees
Exemples positifs
Utilisateurs ayant tweet´e au moins trois tweets contenant le hashtag :
#TeamFollowBack, #instantfollowback ou #teamautofollow.
→ 23.000 instances crawl´ees.
Exemples n´egatifs
1 Choix d’ids Twitter al´eatoires
2 R´ecup´eration de leurs abonnements (friends, followees)
→ 54.000 instances crawl´ees.
55/63
N. Dugu´e
106. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les attributs
Topologie locale
L’activit´e de l’utilisateur
Les caract´eristiques des tweets
Le retweet
Les sources utilis´ees pour tweeter
56/63
N. Dugu´e
107. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Les attributs
20 40 60 80 100 120 140
AVERAGE NUMBER OF CHARACTERS PER TWEET
0
500
1000
1500
2000
2500
NUMBEROFUSERS
RANDOM USERS' FRIENDS
SOCIAL CAPITALISTS
0 1 2 3 4 5 6
AVERAGE NUMBER OF HASHTAGS PER TWEET
0
5000
10000
15000
20000
25000
NUMBEROFUSERS
RANDOM USERS' FRIENDS
SOCIAL CAPITALISTS
10-3
10-2
10-1
100
101
102
103
104
105
AVERAGE NUMBER OF RETWEETS PER TWEET
0
500
1000
1500
2000
2500
3000
NUMBEROFUSERS
RANDOM USERS' FRIENDS
SOCIAL CAPITALISTS
0 20 40 60 80 100
PERCENTAGE OF RETWEETS AMONG TWEETS
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
NUMBEROFUSERS
RANDOM USERS' FRIENDS
SOCIAL CAPITALISTS
56/63
N. Dugu´e
108. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
R´egression Logistique
Principe
Classification binaire en estimant les param`etres Θ de la fonction
VΘ(X) = 1
1+exp(ΘT X)
Avantages
Bonne performance
Une estimation de la probabilit´e d’ˆetre un capitaliste social est
obtenue
Portabilit´e : seulement quelques coefficients `a stocker
57/63
N. Dugu´e
109. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
R´egression Logistique
0.0 0.2 0.4 0.6 0.8 1.0
PREDICTED PROBABILITY OF BEING A SOCIAL CAPITALIST
0
1
2
3
4
5
6
NUMBEROFUSERS(NORMALIZED) RANDOM USERS' FRIENDS
SOCIAL CAPITALISTS
F-score de 91% en coupant `a 0.5 57/63
N. Dugu´e
110. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
R´egression Logistique
Groupe Fs
Activit´e 90,06%
Topologie locale 89,16%
Contenu des tweets 89,55%
Caract´eriques des tweets 86,03%
Sources 89,65%
Table : R´esultats obtenus en supprimant un seul groupe d’attributs.
57/63
N. Dugu´e
111. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Pond´erer leur influence
SDDP =
SKlout if PKsoc ≤ 0.5
2(1 − PKsoc)SKlout if PKsoc > 0.5
0.0 0.2 0.4 0.6 0.8 1.0
PROBABILITY OF BEING A SOCIAL CAPITALIST
0.0
0.2
0.4
0.6
0.8
1.0
HANDICAPFACTOR
58/63
N. Dugu´e
112. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Application en ligne
59/63
N. Dugu´e
113. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Application en ligne
Attributs suppl´ementaires
Polarit´e des tweets
Similarit´e des tweets
Caract´eristiques des tweets
Topologie locale
59/63
N. Dugu´e
114. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Application en ligne
Fonctionnalit´es utilisateur
Connexion via compte Twitter
R´ecup´eration et visualisation des attributs
Pond´eration du score Klout
R´ecup´eration du jeu de donn´ees
59/63
N. Dugu´e
115. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Application en ligne
Fonctionnalit´es administrateur
Mode batch
´Etiquetage manuel des utilisateurs test´es
Renforcement du classifieur
59/63
N. Dugu´e
116. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
1 Introduction
2 Capitalisme social : des m´ethodes efficaces
Des hashtags d´edi´es
Capitalisme social automatique
D´etection topologique
Evolution des capitalistes sociaux entre 2009 et 2013
3 Visibilit´e : rˆoles communautaires
Structure de communaut´es
Rˆoles communautaires
Position des capitalistes sociaux
4 Influence perc¸ue
Mesurer l’influence sur Twitter
Influence des capitalistes sociaux
Pond´erer leur influence
5 Conclusion
60/63
N. Dugu´e
117. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Conclusion
Le capitalisme social sur Twitter
Mise en lumi`ere du ph´enom`ene
´Evaluation des m´ethodes des capitalistes sociaux
M´ethode de d´etection topologique
´Evaluation de la visibilit´e des capitalistes sociaux
Pond´eration d’une mesures d’influence globale
Collecte de plusieurs jeux de donn´ees
61/63
N. Dugu´e
118. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Conclusion
Le capitalisme social sur Twitter
Mise en lumi`ere du ph´enom`ene
´Evaluation des m´ethodes des capitalistes sociaux
M´ethode de d´etection topologique
´Evaluation de la visibilit´e des capitalistes sociaux
Pond´eration d’une mesures d’influence globale
Collecte de plusieurs jeux de donn´ees
61/63
N. Dugu´e
119. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Conclusion
Le capitalisme social sur Twitter
Mise en lumi`ere du ph´enom`ene
´Evaluation des m´ethodes des capitalistes sociaux
M´ethode de d´etection topologique
´Evaluation de la visibilit´e des capitalistes sociaux
Pond´eration d’une mesures d’influence globale
Collecte de plusieurs jeux de donn´ees
61/63
N. Dugu´e
120. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Conclusion
Le capitalisme social sur Twitter
Mise en lumi`ere du ph´enom`ene
´Evaluation des m´ethodes des capitalistes sociaux
M´ethode de d´etection topologique
´Evaluation de la visibilit´e des capitalistes sociaux
Pond´eration d’une mesures d’influence globale
Collecte de plusieurs jeux de donn´ees
61/63
N. Dugu´e
121. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Conclusion
Le capitalisme social sur Twitter
Mise en lumi`ere du ph´enom`ene
´Evaluation des m´ethodes des capitalistes sociaux
M´ethode de d´etection topologique
´Evaluation de la visibilit´e des capitalistes sociaux
Pond´eration d’une mesures d’influence globale
Collecte de plusieurs jeux de donn´ees
61/63
N. Dugu´e
122. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Conclusion
Le capitalisme social sur Twitter
Mise en lumi`ere du ph´enom`ene
´Evaluation des m´ethodes des capitalistes sociaux
M´ethode de d´etection topologique
´Evaluation de la visibilit´e des capitalistes sociaux
Pond´eration d’une mesures d’influence globale
Collecte de plusieurs jeux de donn´ees
61/63
N. Dugu´e
123. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Conclusion
Le capitalisme social sur Twitter
Mise en lumi`ere du ph´enom`ene
´Evaluation des m´ethodes des capitalistes sociaux
M´ethode de d´etection topologique
´Evaluation de la visibilit´e des capitalistes sociaux
Pond´eration d’une mesures d’influence globale
Collecte de plusieurs jeux de donn´ees
Apports m´ethodologiques
Validation empirique de la modularit´e orient´ee
Rˆoles communautaires
D´etection des capitalistes sociaux
61/63
N. Dugu´e
124. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Perspectives
Un r´eel commerce ?
Quantifier les valeurs ´echang´ees
Quantifier l’impact r´eel
Lee et al. [LTC13] : ”Crowdturfers”
62/63
N. Dugu´e
125. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Perspectives
Rˆoles communautaires
Impact de la m´ethode de d´etection de communaut´es
Impact de l’apprentissage
´Etude d’autres r´eseaux
Corr´elation rˆoles et mesures de centralit´e
62/63
N. Dugu´e
126. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Perspectives
Fouilles des donn´ees Twitter
Assainir le r´eseau
Aiguille dans une botte de foin
Nouvelle mesure d’influence
62/63
N. Dugu´e
127. INTRODUCTION HASHTAGS D ´EDI ´ES VISIBILIT ´E : R ˆOLES COMMUNAUTAIRES INFLUENCE PERC¸ UE CONCLUSION
Revues internationales avec comit´e de lecture
N. DUGU ´E, V. LABATUT et A. PEREZ – “A community role approach to assess social capitalists visibility in the twitter
network”, Social Network Analysis and Mining 5 (2015), no. 1, p. 1–13.
N. DUGU ´E et A. PEREZ – “Social capitalists on Twitter: detection, evolution and behavioral analysis”, Social Network
Analysis and Mining 4 (2014), no. 1, p. 1–15, Springer Vienna.
Conf´erences internationales avec actes et comit´e de lecture
M. DANISCH, N. DUGU ´E et A. PEREZ – “On the importance of considering social capitalism when measuring influence on
twitter”, 2014 IEEE/ACM International Conference on Behavioral, Economic, and Socio-Cultural Computing, 2014.
N. DUGU ´E, V. LABATUT et A. PEREZ – “Identifying the community roles of social capitalists in the twitter network”, 2014
IEEE/ACM International Conference Advances in Social Networks Analysis and Mining, Aug 2014, p. 371–374.
N. DUGU ´E et A. PEREZ – “Detecting social capitalists on Twitter using similarity measures”, Complex Networks IV, Studies
in Computational Intelligence, vol. 476, 2013, p. 1–12.
Travaux soumis
J.-V. COSSU, N. DUGU ´E et V. LABATUT – “Detecting Real-World Influence Through Twitter”, 2015.
N. DUGU ´E, A. PEREZ, M. DANISCH, F. BRIDOUX, A. DAVIAU, T. KOLUBAKO, S. MUNIER et H. DURBANO – “A reliable and
evolutive web application to detect social capitalists”, 2015.
63/63
N. Dugu´e
128. R´ef´erences I
[BGLL08] Vincent Blondel, Jean-Loup Guillaume, Renaud Lambiotte, and
Etienne Lefebvre.
Fast unfolding of communities in large networks.
J. Stat. Mech., 10:P10008, Oct 2008.
[CHBG10] Meeyoung Cha, Hamed Haddadi, Fabricio Benevenuto, and
Krishna Gummadi.
Measuring user influence in twitter: The million follower fallacy.
In international AAAI Conference on Weblogs and Social Media,
2010.
[DB79] David Davies and Donald Bouldin.
A cluster separation measure.
IEEE Transactions on Pattern Analysis and Machine Intelligence,
1(2):224–227, 1979.
64/63
N. Dugu´e
129. R´ef´erences II
[GA05] R. Guimer`a and L. Amaral.
Functional cartography of complex metabolic networks.
Nature, 433:895–900, 2005.
[GF14] Adrien Guille and C´ecile Favre.
Une m´ethode pour la d´etection de th´ematiques populaires sur
twitter.
In EGC, pages 83–88, 2014.
[GN02] M. Girvan and M. E. J. Newman.
Community structure in social and biological networks.
Proceedings of the National Academy of Sciences,
99(12):7821–7826, 2002.
65/63
N. Dugu´e
130. R´ef´erences III
[GVK+
12] Saptarshi Ghosh, Bimal Viswanath, Farshad Kooti, Naveen
Sharma, Gautam Korlam, Fabricio Benevenuto, Niloy Ganguly, and
Krishna Gummadi.
Understanding and combating link farming in the twitter social
network.
In 21st International Conference on WWW, pages 61–70, 2012.
[HHSS14] C.P.M.C.J.A. Hendricks, J.A. Hendricks, A.P.C.S.D. Schill, and
D. Schill.
Presidential Campaigning and Social Media: An Analysis of the
2012 Campaign.
Oxford University Press, 2014.
66/63
N. Dugu´e
131. R´ef´erences IV
[KLPM10] Haewoon Kwak, Changhyun Lee, Hosung Park, and Sue Moon.
What is Twitter, a social network or a news media?
In Proc. of the 19th int. conference on World wide web, WWW ’10,
pages 591–600, 2010.
[LCKC12] Kyumin Lee, James Caverlee, Krishna Y Kamath, and Zhiyuan
Cheng.
Detecting collective attention spam.
In Proceedings of the 2nd Joint WICOW/AIRWeb Workshop on
Web Quality, pages 48–55. ACM, 2012.
[LEC11] Kyumin Lee, Brian David Eoff, and James Caverlee.
Seven months with the devils: A long-term study of content
polluters on twitter.
Citeseer, 2011.
67/63
N. Dugu´e
132. R´ef´erences V
[Lia09] Wei-Keng Liao.
Parallel k-means data clustering, Oct 2009.
[LN08] E. A. Leicht and M. E. J. Newman.
Community structure in directed networks.
Phys. Rev. Lett., 100(11):118703, 2008.
[LTC13] Kyumin Lee, Prithivi Tamilarasan, and James Caverlee.
Crowdturfers, campaigns, and social media: Tracking and
revealing crowdsourced manipulation of social media.
2013.
[MKD12] Bruce C. McKinney, Lynne Kelly, and Robert L. Duran.
Narcissism or openness?: College students use of facebook and
twitter.
Communication Research Reports, 29(2):108–118, 2012.
68/63
N. Dugu´e
133. R´ef´erences VI
[MSOB13] J. Messias, L. Schmidt, R. Oliveira, and F. Benevenuto.
You followed my bot! transforming robots into influential users in
Twitter.
First Monday, 18(7), 2013.
69/63
N. Dugu´e
134. Les capitalistes sociaux dans le graphe ?
Intuition
Les strat´egies de capitalisme social devraient mieux marcher si les
cibles de ces strat´egies sont des capitalistes sociaux.
70/63
N. Dugu´e
135. Les capitalistes sociaux dans le graphe ?
Intuition
Les strat´egies de capitalisme social devraient mieux marcher si les
cibles de ces strat´egies sont des capitalistes sociaux.
Un ensemble de sommets tr`es connect´es
Une composante faiblement connexe
Un coefficient de clustering sup´erieur `a la moyenne
Un voisinage de capitalistes sociaux
70/63
N. Dugu´e
136. Les capitalistes sociaux dans le graphe ?
Coefficient de Clustering
Soit G = (V, E) un graphe, et v ∈ V n’importe quel de ses sommets.
Le coefficient de clustering ccv de v est d´efini comme :
ccv = 2 · nedges/(dv (dv − 1))
o`u nedges est le nombre d’arˆetes entre les voisins de v, et dv le nombre
de voisins de v.
71/63
N. Dugu´e
137. Coefficient de Clustering
q
q
q
q q q q q q q q q q
0.0 0.1 0.2 0.3 0.4 0.5 0.6
0.00.20.40.60.81.0
Local clustering coefficient
Cumulativeusersproportion
q Not social capitalists
Social capitalists
72/63
N. Dugu´e
140. Observation sur le positionnement des
capitalistes sociaux
Pr´esence dans des groupes bien sp´ecifiques
Constituent 38% de G2 et 14% de G3
Forte concentration dans G6 (60% des faibles degr´es) et G3 (90%
des degr´es ´elev´es)
Hubs : G2 et G3
Connecteurs : G3 et G6
Tr`es connecteurs : G2 → capitalistes sociaux passifs
Confirmation mode passif : 31% de G2 (mesures entrantes
´elev´ees)
Connecteurs et tr`es connecteurs : Connect´es au reste du graphe
Diversit´e sortante ´elev´ee (G3, G6) → suivre de nombreuses
communaut´es 75/63
N. Dugu´e