1. Réseaux, Graphes, Cartographie
IC05 – Semestre Printemps 2012
Université de Technologie de Compiègne
INTRODUCTION
a) Networks
L’émergence de la thématique des réseaux
Le cas des Information networks : la diversité des sources de documents numériques
L’importance actuelle des réseaux sociaux
b) Quels modèles explicatifs, quels dispositifs d’observation, quelles
données ?
Mais : comment expliquer des architectures massivement distribuées et dynamiques?
Retour des questions d’ingénierie (instruments) et des outils d’exploration du complexe
L’avènement des NetWork Sciences
Application(s) aux Information networks
La recherche des clefs de la maîtrise des Grandes Masses de Données numériques, distribuées
et dynamiques
Des origines, des emprunts, des migrations
Les années 96-99 et les Web Sciences
c) Une démarche globale d’ingénierie
Observer, comprendre, agir
Les Networks Sciences vs « sciences du complexe »
Un projet global d’infrastructure, de projets et d’acteurs (Linkfluence, GEPHI, Medialab…)
Des terrains d’application…
Les projets cartographiques
Franck GHITALLA / 2012 1
2. I) OBSERVER (Networks Analysis : Measures and Metrics)
I-1) Networks and their representation (M.E.J. Newman, Networks – An introduction)
• Graph theory (backgrounds and history)
• Adjency Matrix
• Weighted Networks
• Directed networks
• Bi and Tri-partite networks / Graph transformation
• Acyclic directed networks
• Data aggregation
FOCUS : Les Cartes des Sciences : méthodes et
enjeux
I-2) Degree, Paths and Distances (M.E.J. Newman, Networks – An introduction)
• Density
• Dense/sparse networks
• Regular networks
• IN-Degree, OUT-Degree
• Distribution of links / degree distribution and power-law
• Path length / shortest path length
• Diameter
FOCUS : Ecological networks and Food Webs
(M.Buchanan, “The Tangled Web”)
I-3) Components / Groups of nodes / Clustering (M.E.J. Newman, Networks – An
introduction)
“The hard task” (cf. M.-J. Newman) / between tradition (sociology) and the new Computational
Social Sciences (CSS)
Franck GHITALLA / 2012 2
3. I-3-a) Backgrounds
• Connected/disconnected
• Directed graph and weakly connected components / Giant component / Strongly connected
component
• Sets, sub-sets, cut sets
I-3-b) Structural properties / Connectedness
• Degree centrality
• Eigenvector centrality
• PageRank
• Hubs and Authorities (HITS)
I-3-c) Structural properties / Distances
• Closeness centrality
• Betweenness centrality
FOCUS : Modèle topologique de
l’agrégat dans un set de données
(exemples de mesures avec GEPHI
sur les données du WebDatarium)
I-3-d) Grouping nodes through linkage distribution
• Groups, communities, cliques, clusters, k-plex
• Triades and transitivity
• Local clustering and redundancy
• Reciprocity
• Similarity, cosine similarity
• Regular equivalence
• Homophily and Assortative Mixing
• Assortative mixing by enumerative characteristics
I-3-e) Dividing networks into clusters
• Clustering coefficients
• Social Data Mining and social engineering
• Graph partitioning / from existing categories / from statistical properties (hard task)
• Community detection / algorithms (modularity methods, dynamic methods, edges weights,
actors and e-cologic competition)
• Hierarchical clustering
Franck GHITALLA / 2012 3
4. FOCUS : Linkfluence et les
Computational Social
Sciences
I-4) Dynamics, Evolution, Temporal Aspects (M.E.J. Newman, Networks – An
introduction)
I-4-a) Backgrounds
• Networks formation / Genèse des patterns
• Information IN/ON the net
• Removal/addition of nodes/edges
• Propagation, diffusion, spreadings
I-4-b) Spreadings
• Epidemics model(s)
• The S.I.R.S. model
I-4-c) Evolution
• Preferential attachement / time and fitness (Price, Albert-Barabasi)
• Vertex copying model(s) (Kleinberg)
I-4-d) Structure
• Phase transition
• Percolation
• Thresholds
• Transition phase and “cascades” / Equilibrium
FOCUS : le « cascade model » de D.Watts (Chapitre 8 de
Six Degrees "Thresholds, Cascades and Predictibility")
Franck GHITALLA / 2012 4
5. II) COMPRENDRE (Patterns and Canonical Models)
II-1) Small World Experiments
• “Six degrees of separation” (Barabasi, Linked)
• M.Granovetter
• S.Milgram (chapitre 5, Six Degrees, D. Watts)
II-2) Le « tunner analytique » (D. Watts, Six Degrees, chapitre 4, S.Strogatz, Synch., chap.9)
• Clusters, proximity and long distances
• Randomness, universality and complex systems
• Le paramètre p (Strogatz-Watts) et les modèles alpha et beta. / The « order-randomness-
spectrum » (D. Watts, S. Strogatz)
FOCUS : le
« tunner
analytique » et
la typologie
des réseaux
II-3) Corrélation contenu/structure et modèle en agrégats
II-3-a) Networks of content Data, Knowledge discovery, WWW and Hyperlinked worlds, Text as
Data, Keywords and Citation networks, Topics Detection and Tracking (TDT), Focus-crawling
FOCUS : Des contenus, des liens et
des acteurs : StarGIT et CpanExplorer
Franck GHITALLA / 2012 5
6. II-3-b) Principes du modèle en agrégats / Expansion / Attraction / Le modèle gravitationnel du
web (Montgolfier et al.) / Couches (layers) et propriétés / Topical localities, agrégats (Kleinberg
et HITS)
FOCUS : un modèle
experimental : le “modèle en
couches” (network layers)
II-4) Other dimensions
• Beyond “power-law” : Scale-free Networks (Barabasi, Albert et al.)
• Robustness and Aschile’ Heel / structural holes
• Networks layers : la diversité des modèles topologiques mobilisés et l’imbrication des
niveaux d’analyse
• Synchronized Chaos and Small Worlds Networks (S.Strogatz, Synch, the emerging science
of spontaneous order, chapitres 7, 8 et 9)
FOCUS : la Fabrique du vivant (Biological Networks)
Franck GHITALLA / 2012 6
7. III) VISUALISER-CARTOGRAPHIER
III-1) Interfaces, graphes et cartographies de l’information
• Visualisation de graphes / Le point de vue sur les visualisations de S.Strogatz (Sync.) et D.
Watts (Six Degrees)
• Mapping knowledge tools / Synthèse et exploration
FOCUS : Infovis, exploration, cognition
• Les Cartographies de l’information : comment les définir ? (graphes et cartographie,
espaces de représentation d’un corpus de données, organisation sous-jacente et patterns,
solutions graphiques et codes communs)
• Les cartographies de l’information : quels enjeux ? (Le dispositif sémiologique : écriture,
espace de projection et vue sur les données, composition, Cartes des réseaux : Les
localités thématiques, Hybridation des espaces d'action, La carte et le territoire, L'acte
cartographique : "Où suis-je?", Le sceau du pouvoir, Cartes : collections et Atlas)
III-2) GEPHI : la pierre angulaire
• Le format GEXF
• Trois espaces de travail
• Algorithmes d’analyse des réseaux
• Algorithmes de spatialisation / La famille des force-directed (Ifan-Hu, Fruchterman
Rheingold, ForceAtlas 1, ForceAtlas2)
FOCUS : Anatomy of ForceAtlas2 algorithm
III-3) Recherche de l’ordre, construction des vues
• A différentes échelles (zoom, seuils statistiques…)
Franck GHITALLA / 2012 7
8. • Selon différentes dimensions (une ou plusieurs dimensions, principes de corrélation…)
Géographie de la « coopération » scientifique : le réseau des co-
publications en Chimie (2006-2010)
Identification des communautés par les mots-
clefs et identification des mots-clefs
spécialisés par les communautés
(chercheurs spécialisés
et vocabulaire expert)
Production d’un graphe bi-partite
97.559 auteurs
85.381 mots-clefs
1.990.981 liens
Visualisation des principales communautés de
co-publication en Chimie (au moins 30
chercheurs et plus de 10 co-publications)
• Temporalité(s) / La question des interfaces pour quels modèles et systèmes de mesure du
temps dans les réseaux…
• Vues possibles intégrant à la fois variations d’échelles et de dimensions / la nécessaire
scénarisation d’un jeu de cartographies multiples
Franck GHITALLA / 2012 8
9. III-4) Le projet cartographique
• Processing/Cycle de production / Les étapes préparatoires d’un projet cartographique
• Types de méthodes / Traitement, filtrage et enrichissement des données
- REDUIRE LES MASSES ET LES DIMENSIONS
Produire des indicateurs de masses, de densité, de clustering, de voisinage et de centration
Concevoir des filtres
Décomposer les dimensions (topologie hypertexte, texte et contenu, indicateurs d’usage…)
Modèle(s) de distribution des propriétés des corpus
- FAIRE EMERGER DES PATTERNS
Méthodes de projection spatiale, visualisation des données
Identification de saillances logico-graphiques
Capitaliser/archiver les phases de transformation des corpus
Ingénierie de l’exploration des corpus par :
Fusion des données de données hétérogènes
Niveaux de navigation/zoom
Réduction (algorithmes de hiérarchisation/clustering…)
Projection (fonds géoréférencés, schémas fonctionnels, organigrammes…)
- CONSTRUIRE DES FIGURES
Principes d’agrégation
Organisation, architecture et sous-ensembles
Couches et profondeurs des corpus
Temporalités et événements
• Classes (techniques) de cartographies de l’information
FOCUS : Anatomie d’une Fondation de recherche
Franck GHITALLA / 2012 9
10. IV) AGIR (Network Services Design)
Computing for Networks
FOCUS : INmaps
Indicateurs et aide à la décision
Le projet cartographique et classes de cartographies de l’information
Social and Geographical monitoring of complex and distributed organizations
Indicateurs d’aide à la gouvernance, I.S.T.
Bases de connaissances et analyse des savoirs et/ou de la production scientifique
Veille territoriale
FOCUS : Le RADAR d’un pôle de compétitivité
Veille, Valeur de l’information stratégique
Veille / IST / brevets / documentation
Connaissances et opinions / le marché de l’influence, e-reputation and social management
Stratégies et dispositifs d’observation des réseaux
Observer l’Agora numérique (courant politiques et éthiques, controverses, opinions
et croyances…)
FOCUS : Opinions, diasporas, Controverses : un moteur web de recherche dédié à
l’observation et à la cartographie des controverses sociétales est-il réalisable ?
Franck GHITALLA / 2012 10
11. Exploration, Science
Data scientist, scientific applications, e-sciences, data and scientific networks
FOCUS : les Socio-economic networks (Boards, companies, markets, products)
Design, graphisme, esthétique
FOCUS : Data-Flights
Défense / Sécurité
FOCUS : Thee March 11th Terrorist Network: In its weakness lies its strength (José A.
Rodríguez)
Franck GHITALLA / 2012 11
12. REFERENCES
BIBLIOGRAPHIE (top 10)
BARABASI A.-L., linked, the new science of network, Perseus Publishing, 2003.
BORNER K., Atlas of Science: Visualizing What We Know, MIT Press, 2010.
BUCHANAN M., Nexus, Small Worlds and the groundbreaking Theory of Networks 2003.
CHAKRABARTI S., mining the web, 2002.
DAVISON B.-D., « Unifying Text and Link Analysis », IBM, Palo-Alto, 2003.
KLEINBERG J., LAWRENCE S., « The Structure Of The Web », Science, vol.294, 30, november,
2001.
KLEINBERG J., “Authoritative Sources in a Hyperlinked Environment“, Proceedings of the ACM-SIAM
Symposium on Discret Algorithms, ACM Press,1998.
NEWMAN M., The structure and dynamics of networks, Princeton University Press, 2003.
STROGATZ S. Sync: the emerging science of spontaneous order, MIT-Press2004.
WATTS D. Six Degrees. The Sciences of a Connected Age, Duncan Watts, Eds.W.W.Norton, New-
York-London, 2004.
Sites web sur les Network Sciences
Santa Fe institute (http://www.santafe.edu/)
CSCS (Center for the Study of Complex Systems) (http://cscs.umich.edu/)
UCLA-HCS Human Complex Systems (http://hcs.ucla.edu/)
New England Complex Systems Institute (http://necsi.edu/)
Center for Computational Analysis of Social and Organizational Systems (CASOS)
(http://www.casos.cs.cmu.edu/)
CNets Center for Complex Networks and Systems Research (http://cnets.indiana.edu/)
Argonne National Laboratory (http://www.anl.gov/)
Center for Social Complexity (Georges Mason University) (http://socialcomplexity.gmu.edu/)
Center for Social Dynamics and Complexity (Arizona State university) (http://csdc.asu.edu/)
NICO (Northwestern Institute on Complex Systems) (http://www.northwestern.edu/nico/)
Park Center for Complex Systems (M.I.T.) (http://web.mit.edu/pccs/)
Sites web de référence
L’Atelier de Cartographie, http://ateliercartographie.wordpress.com/
Linkfluence, http://fr.linkfluence.net/
Le projet TicMigrations, http://ticmigrations.fr/
GEPHI, http://gephi.org/
Medialab Sciences-Po, http://www.medialab.sciences-po.fr/
Les chercheurs
Victor-Laszlo Barabasi, Northeastern University, Center for Complex Network Research,
http://www.barabasilab.com/
Cyberinfrastructure for Network Science, http://cns.iu.edu/
Duncan Watts, YAHOO ! Research, http://research.yahoo.com/Duncan_Watts
Jon Kleinberg, Department of Computer Science Cornell University
http://www.cs.cornell.edu/home/kleinber/
Marc E.-J. Newman, Department of Physics and Center for the Study of Complex Systems, University
of Michiganhttp://www-personal.umich.edu/~mejn/
Places and Spaces, Mapping Science, http://scimaps.org/
Steven Strogatz, Cornell University, Theorical and Applied Mechanics, http://tam.cornell.edu/faculty-
bio.cfm?NetID=shs7
Franck GHITALLA / 2012 12