Présentation sur l'analyse de réseaux en sciences sociales et en histoire faite à l'école d'été Ferney-Voltaire le 25 août 2014 (http://ferney2014.sciencesconf.org/)
L'expression du but : fiche et exercices niveau C1 FLE
Analyse de réseaux en sciences sociales en général... et en histoire en particulier
1. Analyse de réseaux en SHS
Analyse de réseaux en sciences sociales en
général. . . et en histoire en particulier
Laurent Beauguitte (CNRS, UMR IDEES)
http://groupefmr.hypotheses.org/
Août 2014 - École thématique Ferney-Voltaire
2. Analyse de réseaux en SHS
Introduction et rappels
Graphe & réseau
Sommets, liens et attributs
Mesures locales et globales
Cliques, clusters et communautés
3. Analyse de réseaux en SHS
Introduction et rappels
Graphe : points et lignes. Graphe + attributs = réseau
Points : n÷uds, sommets, acteurs, vertex (plu. vertices), nodes,
actors
Lignes : arêtes, arcs, liens, edges, links
3 manières courantes de représenter un graphe : graphe, matrice,
liste(s)
4. Analyse de réseaux en SHS
Introduction et rappels
Format matriciel très lourd : non recommandé
Format le plus économique : 1 ligne par sommet (attributs et
relations)
code;nom;sexe;age;dom;rel1;rel2 etc.
1;Bob;M;29;Paris;2;3
2;Bobby;M;32;Pau;1
3;Bobette;F;27;Frejus;1
Format trop compliqué pour les logiciels. . .
5. Analyse de réseaux en SHS
Introduction et rappels
Manière la plus courante de structurer ses données :
I liste de liens (et attributs)
I liste de sommets (et attributs)
#fichier liens
1;2
2;1
1;3
...
#fichier sommets
code;nom;sexe;age;dom;
1;Bob;M;29;Paris
2;Bobby;M;32;Pau
3;Bobette;F;27;Frejus
10. Analyse de réseaux en SHS
Introduction et rappels
Mesures locales : au niveau d'un sommet ou d'un lien. Surtout des
mesures de centralité (degré, intermédiarité, etc.)
Mesures globales : caractériser le graphe dans son ensemble
(densité, diamètre, nombre de composantes connexes, etc.)
Cliques, clusters, communautés : recherche des sous-groupes
fortement inter-connectés
Modélisations statistiques (dynamique ou écart à un modèle)
Connaître le vocabulaire anglophone est nécessaire. . .
11. Analyse de réseaux en SHS
Introduction et rappels
Analyse de réseau issue de la théorie des graphes
Mesures sur graphe = calcul matriciel
Calcul matriciel = logiciel obligatoire
Au moins 80 logiciels permettant de faire de l'analyse de réseaux. . .
http://www.gmw.rug.nl/ huisman/sna/software.html
http://groupefmr.hypotheses.org/1750
12. Analyse de réseaux en SHS
Précisions terminologiques
Réseau6= analyse d'un réseau6= analyse de réseau
Réseaux sociaux et/ou réseaux spatiaux et/ou réseaux complexes
Réseaux sociaux6= supports techniques (facebook, twitter, etc.)
13. Analyse de réseaux en SHS
Précisions terminologiques
3 grands modèles = 3 processus de formation
Proximité, attachement préférentiel et processus aléatoire
Source : http://jasss.soc.surrey.ac.uk/8/4/8/Figure%201.gif
14. Analyse de réseaux en SHS
Un survol historiographique multi-disciplinaire
Mathématiques : théorie des graphes (depuis 1759 - Euler et les
ponts de Königsberg)
Sociologie : sociométrie (30s), anthropologie (50s), Social Network
Analysis (70s à nos jours)
Géographie (60s à nos jours)
Biologie : interactions moléculaires (depuis 90s ?)
Écologie : réseau biparti (proie - prédateur ; plante - pollinisateur
etc.). Mesures et outils spéciques ((50s à nos jours)
Physique et informatique (90s à nos jours)
15. Analyse de réseaux en SHS
Un survol historiographique multi-disciplinaire
Tradition mathématique : graphe eulérien, hamiltonien, plus court
chemin, etc.
Source : http://jmbellot.blogs.com/personnel/images/koenigsberg_bridges.jpg
16. Social network analysis, issue de la sociométrie, 2 grandes
traditions : réseau de relations entre personnes (petit graphe,
orienté, booléen), réseau biparti (conseils d'administration :
interlock)
Nombreuses intuitions dans Moreno (1934) mais suppose calcul
matriciel - développement années 70. Ouverture longtemps faible
aux autres disciplines (colloques, associations, logiciels)
Source : http://www.pnas.org/content/103/23/8577/F2.large.jpg
17. Analyse de réseaux en SHS
Un survol historiographique multi-disciplinaire
Tradition en géographie : réseaux d'infrastructures (transport,
énergie, etc.), planaires, le plus souvent valués et non orientés. Peu
d'interactions avec les autres disciplines.
Utilisation de logiciels (SIG) et de mesures spéciques
Questions de recherche : accessibilité, optimisation des ux,
vulnérabilité
Source : Kansky, 1963, Structure of transportation networks, p. 19
18. Analyse de réseaux en SHS
Un survol historiographique multi-disciplinaire
L'arrivée sauvage des physiciens (90s à aujourd'hui)
Absence totale de complexe par rapport aux données, capacités de
modélisation et de programmation, force de frappe scientique,
ignorance quasi totale (au départ) des autres disciplines
Réseaux de grande taille (dit complexes) : suppose l'élaboration de
nouveaux outils et de nouvelles méthodes
Modèles innovants (small-world, scale-free) et quelques avancées
majeures
19. Et en histoire ?
Dans monde francophone, liens forts avec l'analyse de réseaux
sociaux
Tradition de modélisation forte en archéologie
Hybridation croissante des approches et des méthodes :
collaboration de plus en plus fréquente avec des informaticiens, des
géographes, etc.
Jernite et al., 2014, The random subgraph model for the analysis of an ecclesiastical network
in Merovingian Gaul, The Annals of Applied Statistics, 8(1) :377-405
20. Analyse de réseaux en SHS
Quand et comment utiliser l'analyse de réseaux ?
Quand utiliser l'analyse de réseaux ?. . .
. . .quand vous en avez envie !
Quelques atouts :
I eet de mode scientique ;
I présentation des résultats (parfois) attrayante ;
I outil favorisant dialogue inter-disciplinaire ;
I pas (pas encore) de normes scientiques rigides (mais ça
viendra. . .)
21. Analyse de réseaux en SHS
Quand et comment utiliser l'analyse de réseaux ?
Comment utiliser l'analyse de réseaux ?
Au départ : questions de recherche et hypothèses
Structure des données
I que représentent les points ?
I que représentent les liens ?
I comment peut-on transformer ces données ?
I quels sont les indicateurs pertinents ?
I comment interpréter les résultats ?
I d'autres méthodes sont-elles utilisables ?
22. Analyse de réseaux en SHS
Quand et comment utiliser l'analyse de réseaux ?
Un exemple sur les votes à l'AG de l'ONU
Hypothèse : étude des votes à l'ONU permet de mettre en évidence
une régionalisation politique du monde
Données : résultats de votes de résolutions par session
Création d'un tableau État - résolution avec 4 modalités de vote
Transformation de ce tableau en matrice de similarité État - État
(0, votes toujours diérents à 100, votes toujours identiques) :
graphe valué non orienté
23. Session 59 (2005-2006), similarité supérieure ou égale à 98%
I que représentent les points et les liens ?
I comment peut-on transformer ces données ?
I quels sont les indicateurs pertinents et comment interpréter les
résultats ?
I d'autres méthodes sont-elles utilisables ?
24. Méthode de clustering dérivée de l'algorithme CONCOR
(corrélation de corrélation) : permet de garder l'intensité des liens,
crée une partition au niveau mondial
I d'autres méthodes sont-elles utilisables ?
25. Analyse de réseaux en SHS
Quand et comment utiliser l'analyse de réseaux ?
Un exemple sur les discours onusiens
Orateurs : représentants d'États, de groupes régionaux, d'OIG, etc.
Hypothèses :
I les groupes prennent de plus en plus souvent la parole ;
I les États soutiennent de plus en plus souvent les déclarations
faites par des groupes
Données : PV des sessions de l'Assemblée générale
26. Analyse de réseaux en SHS
Quand et comment utiliser l'analyse de réseaux ?
Recherche d'occurrences du type : le représentant de l'État A
soutient la déclaration faite au nom du groupe A0
Transformation en graphe biparti État - groupe
Mesures (ordre, taille, densité) et visualisation
27. I que représentent les points et les liens ?
I comment peut-on transformer ces données ?
I quels sont les indicateurs pertinents et comment interpréter les
résultats ?
I d'autres méthodes sont-elles utilisables ?
28. Analyse de réseaux en SHS
Quand et comment utiliser l'analyse de réseaux ?
L'AR en histoire : vraies questions et faux problèmes
(Quelques) vraies questions :
I pertinence de l'approche
29. Analyse de réseaux en SHS
Quand et comment utiliser l'analyse de réseaux ?
L'AR en histoire : vraies questions et faux problèmes
(Quelques) vraies questions :
I pertinence de l'approche
I choix des méthodes et des outils
30. Analyse de réseaux en SHS
Quand et comment utiliser l'analyse de réseaux ?
L'AR en histoire : vraies questions et faux problèmes
(Quelques) vraies questions :
I pertinence de l'approche
I choix des méthodes et des outils
I structuration des données
31. Analyse de réseaux en SHS
Quand et comment utiliser l'analyse de réseaux ?
(Quelques) faux problèmes :
I l'incomplétude des données
32. Analyse de réseaux en SHS
Quand et comment utiliser l'analyse de réseaux ?
(Quelques) faux problèmes :
I l'incomplétude des données
I ce n'est pas un vrai réseau
33. Analyse de réseaux en SHS
Quand et comment utiliser l'analyse de réseaux ?
(Quelques) faux problèmes :
I l'incomplétude des données
I ce n'est pas un vrai réseau
I c'est trop compliqué et il faut apprendre des tas de logiciels. . .
34. Analyse de réseaux en SHS
Visualisation des données
Le graphe comme image : exploration vs communication
Exploration
I scripts et lignes de commande
I esthétique superue
I plus les données sont complètes et précises, mieux c'est
35. Analyse de réseaux en SHS
Visualisation des données
Le graphe pour communiquer
I nécessité d'une légende claire, précise, complète
I transparence sur l'outil et la méthode (quel logiciel ? quel
algorithme de visualisation ?)
I plus le graphe reète vos données, moins il est lisible :
sélection indispensable
36. Analyse de réseaux en SHS
Visualisation des données
Nécessité de ltrer les données (+ de 20 sommets et 30 liens)
Varier les teintes, les couleurs, les épaisseurs, déplacer les sommets,
ajouter une légende
37. Sortie brute de logiciel
library(statnet)
g - rgraph(40, tprob = 0.1, mode=graph)
gplot(g)
38. Supprimer les èches, taille proportionnelle au degré (ssi le degré
est pertinent. . .)
gplot(g, vertex.cex=sqrt(degree(g))/2, usearrows=FALSE,
mode=fruchtermanreingold)
39. Pour quoi faire ?. . .
Source : http://msb.embopress.org/content/2/1/42
40. Quelques options
I visualiser autrement (distribution des degrés, matrice bloquée)
I zoomer sur les lieux denses
I passer du graphe à l'ego-network
41. Analyse de réseaux en SHS
Visualisation des données
Combiner les approches
Visualisation mixte graphe - matrice (logiciel NodeTrix)
http://www.aviz.fr/wiki/uploads/Research/NodeTrix.png