SlideShare ist ein Scribd-Unternehmen logo
1 von 138
多層ネットワークによる
構造データ分析
村田剛志
東京工業大学 情報理工学院 情報工学系
murata@c.titech.ac.jp
http://www.net.c.titech.ac.jp/
令和元年度 東北大学電気通信研究所 共同プロジェクト研究会
応用物理学会プラズマエレクトロニクス分科会 第32回プラズマ新領域研究会
物理 化学混成系プラズマにおける情報系機能発現
~プラズマ反応場をネットワーク科学として捉える~
本スライドはslideshareにて公開 上記サイトにリンクあり
村田剛志(むらたつよし)
• 東京工業大学 情報理工学院 情報工学系
准教授
• 専門:人工知能、ネットワーク科学、機械学習
• 人工知能学会、情報処理学会、日本ソフトウェ
ア科学会、AAAI、ACM 各会員
• 本を出しました
Pythonで学ぶネットワーク分析
---ColaboratoryとNetworkXを使った実践入門---
村田 剛志 著
発売日:2019/09/15
発行元:オーム社
https://atarum.github.io/
「多層ネットワークによる
構造データ分析」
• 概要: ネットワーク分析は、対象世界における
構造やプロセスを理解する上で重要であるが、
現実のソーシャルメディア等は多種類の頂点
や辺から構成されており、従来の分析手法で
は不十分であることが少なくない。本講演で
は、交通網や動的ネットワークなどの現実の
多様な構造データを表現し分析するための枠
組みとして注目されてきている多層ネットワー
ク研究について紹介する。
目次
1. ネットワーク科学における課題
2. multilayer networkとは
3. 研究事例
4. トピックス
– テンソルによる表現
– ランダムウオーク、移動可能性(navigability)
– ランキング
– temporal networkとmultilayer network
– ネットワーク特徴量
– 生成モデル
– コミュニティ抽出
5. ツール/データセット/関連会議/参考文献
1.ネットワーク科学における課題
特徴量
モデル プロセス
アルゴリズム
1.ネットワーク科学における課題
特徴量
モデル プロセス
アルゴリズム
パス長、密度、直径、時数分布、
クラスタ係数、 …
ダイクストラ法、グラフ分割、中
心性の計算、 …
ランダムネットワーク、スケール
フリーネットワーク、スモール
ワールドネットワーク、べき法則、
configuration model、…
口コミ/病気の伝搬、影響最大
化、SI model、SIR model、リンク
予測 …
中心性・ランキング
• どの頂点が中心的か?
– ソーシャルメディアでのオピニオンリーダー
– 街のどこへでも短時間で駆けつけられるような場所
– …
• 次数中心性(Degree Centrality)
– 他の多くの頂点とつながっている頂点を中心的とみなす
• 固有ベクトル中心性(Eigenvector Centrality)
– 周囲の頂点の中心性も加味し、多くの中心的な頂点とつながってい
る頂点を中心的とみなす
• 近接中心性(Closeness Centrality)
– ネットワーク中の他の頂点へ短い距離で到達できる頂点を中心的と
みなす
• 媒介中心性(Betweenness Centrality)
– その頂点がなくなると多くの経路が分断されてしまうような頂点を中
心的とみなす
中心性の例
参考: https://aksakalli.github.io/2017/07/17/network-centrality-measures-and-their-visualization.html
特徴量計算
• 頂点数は同じでも、ネットワークはさまざま
ランダムグラフ
ピーターセングラフ
完全グラフ
サイクルグラフ
2部グラフ
バーベルグラフ
スターグラフ
ホイールグラフ
スケールフリーグラフ
特徴量の例
• 密度
• 直径
• クラスタ係数
• 平均次数
• 次数分布
• 平均パス長
• 次数相関
• …
コミュニティ抽出
• 密に結びついた部分ネットワーク(コミュニ
ティ)
– 友人グループや派閥などに対応
– 類似頂点がコミュニティを構成→嗜好の似た人
に商品や情報を推薦
• さまざまな定義、さまざまな抽出手法
参考: https://python-graph-gallery.com/324-map-a-color-to-network-nodes/
http://ryancompton.net/2014/06/16/community-detection-and-colored-plotting-in-networkx/
2.Multilayer networkとは
• 単純なネットワークでは扱えないような、現実
のより複雑な関係を表現・分析したい
– 複数の交通機関(鉄道、バス…)での輸送網
– 複数のSNS(Facebook, Twitter, …)での情報伝搬
異なる種類の人間関係
(友好、敵対、職斡旋…)
複数の航空会社による
航空網
輸送ネットワーク
• ヨーロッパの航空ネットワーク
(http://muxviz.net/gallery.php)
異種ネットワーク上の災害の連鎖
• 2003年イタリアの大規模停電
– 発電所の停止→インターネットのノード故障→さら
なる発電所の停止→…
Sergey V. Buldyrev et al., "Catastrophic Cascade of Failures in Interdependent Networks"
Nature 464, pp.1025-1028, 2010
発電所ネット
インターネット
様々な用語
• multilayer network, multiplex network, multivariate
network, multinetwork, multirelational network,
multirelational data, multilayered network,
multidimensional network, multisilice network,
multiplex of interdependent networks, hypernetwork,
overlay network, composite network, multilevel
network, multiweighted graph, heterogeneous
network, multitype network, interconnected networks,
interdependent networks, partially interdependent
networks, network of networks, coupled networks,
interconnecting networks, interacting networks,
heterogeneous information network, meta-network, …
様々な用語
• (Kivela et al., “Multilayer Networks”より)
multilayer networksの定義
• M=(VM, EM, V, L)
– V: 頂点集合
– L: レイヤの集合の列(0次元:通常ネットワーク, 1
次元:上図, 2次元:下図)
– VM:頂点とレイヤのタプルの集合
– EM:辺集合(タプルの組の集合)
V={1,2,3,4}
L={L1,L2},
L1={A,B}, L2={X,Y}
VM={(1,A,X), (2,A,X),
(3,A,X),…}
EM={((1,A,X),(2,A,X)),
((1,A,X),(1,B,X)),…}
Layer間のつながり
• 1次元vs2次元
異なる種類のインタラクション
• Kivera et.al, “Multilayer Networks”, Journal of Complex Networks, Vol.2, No.3, pp.203-271, 2014
異
な
る
会
議
異なる種類の接触
同一人物
単純ネットワークでの表現MAP, MB, YYA, ACの4人のネットワーク
単純ネットワークへの変換
• 便宜的に単純なネットワークへの変換(aggregation,
projection)
– 全てのlayerを1枚のlayerに押しつぶす
• 情報が失われる
– layer内の辺の差の情報が失われる
– layer間の辺の情報が失われる
– layer毎の異なる性質(次数分布等)が不明確にな
る
multiplex(multislice) :単純化した
multilayer
• Lが1次元、全頂点が各レイヤに出現、レイヤ
間を結ぶ辺(coupling)が
– 全ての対応頂点間のもの(categorical coupling)
– 隣接する対応頂点間のもの(ordinal coupling)
ordinal coupling
categorical coupling
3.研究事例
• 多層ネットワークの制約付きコミュニティ抽出
– "マルチスライスネットワークにおける制約付きコミュニティ抽出
法“, 江口 幸司, 村田 剛志, 人工知能学会論文誌, Vol.32, No.1,
p.WII-C_1-9, 2017.
https://www.jstage.jst.go.jp/article/tjsai/32/1/32_WII-
C/_article/-char/ja/
• 動的ネットワークの情報伝搬の最大化
– "Selecting Seed Nodes for Influence Maximization in Dynamic
Networks“, Shogo Osawa, Tsuyoshi Murata, Proceedings of the
6th Workshop on Complex Networks (CompleNet2015), Vol.597,
pp.91-98, 2015. https://link.springer.com/chapter/10.1007/978-
3-319-16112-9_9
– "Extended methods for influence maximization in dynamic
networks“, Tsuyoshi Murata, Hokuto Koga, Computational Social
Networks 5:8, 21 pages, 2018.
https://computationalsocialnetworks.springeropen.com/articles
/10.1186/s40649-018-0056-8
マルチプレックスネットワークにおける
制約付きコミュニティ抽出法の拡張
江口幸司
情報理工学院 情報工学系 情報工学コース
村田研究室
242018/2/2
コミュニティ抽出
• ネットワークからエッジのつながりが密な
部分ネットワーク(コミュニティ)を見つけ出す
→ネットワーク構造の分析、情報推薦などに応
用
25
コミュニティ抽出結果
制約付きコミュニティ抽出
• 制約を考慮したコミュニティ抽出
– 背景知識
– ユーザからのフィードバック
• 精度の向上が期待される
26
Tokyo
Chiba
Chiba
制約付き
コミュニティ抽出結果
マルチプレックスネットワーク
• マルチレイヤネットワークの一種
–複数のネットワークをエッジでつないで
組み合わせたもの
27
各レイヤは
同じノードの集合を持つ
レイヤ間エッジ
(同じノード間だけに存在)
レイヤ
レイヤ内
エッジ
マルチプレックスネットワークにおける
コミュニティ抽出
• ノード同士が複数の種類のつながり(エッジ)を
持つようなネットワークを分析することができる
28
Aarhus University の
Computer Scienceにおける
教員のネットワーク
ロンドンの交通網のネットワーク
従来法
評価関数:制約付きハミルトニアン[3][4]
最適化法:Louvain法[5]
マルチプレックスネットワークにおける
制約付きコミュニティ抽出法[7]
29
評価関数を
最適化する
アルゴリズム
拡張
1
2
評価関数:モジュラリティ[1][2]
最適化法:Gen Louvain法 [6]
[4]Eaton and Mansbach, 2012.
[3]Reichardt and Bornholdt, 2006.
[5]Blondel et al., 2008.
[2]Newman and Girvan, 2004.
[6]Jutla et al., 2011-2014.
[1]Mucha et al., 2010.
コミュニティ
抽出の結果
を定量化モノ
制約付き
マルチ
制約なし
[7]Eguchi and Murata, 2017.
目的
• 応用範囲の拡大
– 人間関係の分析
– 交通網の分析
– 論文の参照関係の分析
など 30
マルチプレックスネットワークにおける
制約付きコミュニティ抽出法を
大規模ネットワークに拡張する
マルチプレックスネットワークにおける
ハミルトニアン[7]
31
multiplex
報酬項:コミュニティ内にエッジが存在
罰則項:コミュニティ間にエッジが存在
レイヤ内エッジ
について(既存)
レイヤ間エッジ
について(追加)
𝑨𝒊𝒋𝒔:レイヤ𝒔における
隣接行列𝑨の(𝒊, 𝒋)要素
𝒈𝒊𝒔:レイヤ𝒔のノード𝒊が属する
コミュニティのインデックス
𝜹:クロネッカーのデルタ
報酬項:コミュニティ間にエッジがない
罰則項:コミュニティ間にエッジが存在
報酬項:コミュニティ内にエッジが存在
罰則項:コミュニティ内にエッジがない
[7]Eguchi and Murata, 2017.
マルチプレックスネットワークにおける
制約付きハミルトニアン[7]
32
multiplex
(node 𝑖 and 𝑗 have must-link constraint)
(nodes 𝑗 in layer s and 𝑟 have cannot-link constraint)
(nodes 𝑗 in layer s and 𝑟 have must-link constraint)
(node 𝑖 and 𝑗 have cannot-link constraint)
(otherwise)
(otherwise)
(otherwise)
(otherwise)
制約付き
ハミルトニアン
同一レイヤ上のノードのペア (既存)
異なるレイヤ上のノードのペア(追加)
Gen Louvain法で
最適化
multiplex multiplex multiplex
𝜇 𝑐
[7]Eguchi and Murata, 2017.
従来法の問題点
33
制約を人手によって与えている
•大規模ネットワークには適用が困難
•ユーザにかかる負担が大きい
適用できる対象が限られる
•小規模な無向ネットワークのみ
従来法を改良
提案法:大規模ネットワークへの拡張
制約付与の自動化
• ネットワークの構造的特徴に基づいて
できるだけ人手の場合に近い制約を
自動的に付与
処理の高速化・省メモリ化
• 実装をOctaveからC++に変更
• メモリの動的確保を活用
34
制約付与の自動化
• 制約付与戦略にしたがって自動的に制約付与
– 制約を付与すべきノードを選択する基準
• 3つの制約付与戦略を提案
35
異なるコミュニティに属する隣接ノードの数が
隣接ノードの総数に占める割合
• boundary:
隣接コミュニティ率が高い
ものを優先
• degree:
次数が高いものを優先
• mix:
隣接コミュニティの数が
多いものを優先
boundary戦略
36
隣接コミュニティ率
•3,4,7,8→0
•2 →0.33
•5,6 →0.5
•1 →0.67
degree戦略
次数
•3,4,5,7,8→2
•1,2 →3
•6 →4
37
mix戦略
38
隣接コミュニティ数
•3,4,7,8→0
•2,5 →1
•1,6 →2
隣接コミュニティの
種類
•6→1
•1→2
提案法のアルゴリズム(1/2)
39
制約付与戦略を選択
制約付きコミュニティ抽出(従来法と同様)
提案法のアルゴリズム(2/2)
40
精度を計算
制約を自動的に付与
レイヤ間
レイヤ内
NMI: コミュニティ抽出結果を[0,1]で定量化
1に近いほど精度が高い
処理の高速化・省メモリ化
メリット デメリット
Octave • 行列演算が容易
• 反復処理に時間
を要する
• 行列宣言の際に
確保できるメモリ
が大きくない
C++
• 反復処理がOctave
に比べて高速
• メモリの動的確保
によって省メモリ化
• 行列演算が面倒
41[10]Eigen: http://eigen.tuxfamily.org/
行列演算用ライブラリ
Eigen[10]を用いる
実験
42
従来法と提案法の比較実験
• 同じ実験の結果を比較
• 自動の場合にも、人手の場合と同様の
制約を付与できるか?
高速化に関する実験
• 大規模な実ネットワークでコミュニティ抽出、
従来法と提案法で計算時間の比較
大規模化・制約付与戦略に関する実験
• 大規模な人工ベンチマークにおいて
提案法によって制約付きコミュニティ抽出
従来法と提案法の比較実験
• 人工ベンチマークネットワークにおいて
制約付きコミュニティ抽出を繰り返す
– 制約付与戦略: boundary戦略
– 従来法:実装→Octave, 制約付与→手作業
– 提案法:実装→C++, 制約付与→自動
コミュニティ抽出の精度(NMI)を比較
制約付与を自動化した場合にも、人手による
場合と同等の制約を付与することができるか?
43
• パラメータ
– 𝜔 = 1 (レイヤ間エッジの重み)
– 𝜇 𝑐 = 2 (制約項の重み)
44
ノード数 エッジ数 レイヤ数
Sample1-1 10 11 3
Sample1-2 20 36 3
Sample1-3 30 54 3
Sample1-4 40 67 3
Sample1-5 50 78 3
※ネットワーク間に依存性はない
従来法と提案法の比較実験
従来法と提案法の結果の比較
45
正解コミュニティ構造が得られるまでの
変化の仕方はほぼ同じ
NMI
(精度)
制約数 制約数
従来法 提案法
高速化に関する実験
• 比較的大規模な実ネットワークにおいて
コミュニティ抽出
–正解ラベルがない→制約なし
–従来法(Octave)と提案法(C++)で計算時
間を比較
46
ノード数 エッジ数 レイヤ数
YEAST
LANDSCAPE
MULTIPLEX
NETWORK
4,458 8,473,997 4
PIERRE AUGER
MULTIPLEX 514 7,153 16
高速化に関する実験
実験結果:計算時間[sec]
47
従来法 提案法 高速化
YEAST
LANDSCAPE
MULTIPLEX
NETWORK
15,658.7 664.90 23.6倍
PIERRE
AUGER
MULTIPLEX
54.29 52.91 1.03倍
ノード数が多い場合に、より高速化の効果を発揮
大規模化・制約付与戦略に関する実験
• 提案法を用いて制約付きコミュニティ抽出
–各パラメータを変化させた複数のネットワーク
(人工ベンチマークネットワーク)で比較
–制約付与戦略の比較:boundary, degree, mix
48
[11]Bazzi et al., 2016.
Bazziらのベンチマーク[11]
• レイヤ間に任意の依存性を持たせる
• マルチプレックスだけでなく、テンポラルなど
さまざまなマルチレイヤネットワークを生成可能
大規模化・制約付与戦略に関する実験
• パラメータ:
– 𝑝 = 0.95
(レイヤ間の類似度)
– 𝜇 𝑐 = 2
(制約項の重み)
– 𝜇 = 0.1 or 0.2
(ランダムエッジの割合)
– 𝜔 = 0.7 or 0.9
(レイヤ間エッジの重み) 49
𝑝
𝜔
𝑝𝜇 𝑐
𝜇
各実験の設定
50
𝜔の値が異なる
場合
• Sample3-1、
𝜔 = 0.7
• Sample3-1、
𝜔 = 0.9
𝜇の値が異なる
場合
• Sample3-1、
𝜔 = 0.7
• Sample3-2、
𝜔 = 0.7
ノード数が異なる
場合
• Sample3-1、
𝜔 = 0.7
• Sample3-3、
𝜔 = 0.7
データセット ノード数 エッジ数 レイヤ数 𝝁
Sample3-1 1,000 29,380 5 0.1
Sample3-2 1,000 28,614 5 0.2
Sample3-3 2,000 58,983 5 0.1
制約付きコミュニティ抽出
(𝜔の値が異なる場合)
51
NMI
(精度)
制約数 制約数
𝜔 = 0.7 𝜔 = 0.9
• レイヤ間エッジによるつながりが強い
→他のレイヤ上の変化の影響を受けやすい
• レイヤ間エッジによるつながりが弱い
→柔軟なコミュニティ抽出
制約付きコミュニティ抽出
(𝜇の値が異なる場合)
52
NMI
(精度)
制約数 制約数
𝜇 = 0.1 𝜇 = 0.2
ランダムエッジの割合が大きい→
• ネットワークの構造情報だけでは
正解コミュニティ構造を得ることが難しい
• (構造に基づいた)制約が有効になりづらい
制約付きコミュニティ抽出
(ノード数が異なる場合)
53
NMI
(精度)
制約数 制約数
𝑁 = 1000 𝑁 = 2000
ノード数が多い→
• すべてのノードが正解コミュニティに属すること
が難しい(誤ったコミュニティに属しやすい)
• 他のノードに影響されうるノードが多い
制約付与戦略の比較(1/3)
54
NMI
(精度)
制約数 制約数
𝜔 = 0.7, 𝜇 = 0.1,
𝑁 = 1000
𝜔 = 0.9, 𝜇 = 0.1,
𝑁 = 1000
制約数25あたりから
degreeが最も良い
boundaryが最も良い
制約付与戦略の比較(2/3)
55
NMI
(精度)
制約数 制約数
𝜔 = 0.7, 𝜇 = 0.2,
𝑁 = 1000
𝜔 = 0.7, 𝜇 = 0.1,
𝑁 = 2000
ほぼ変わらない
わずかにmixが良い
degreeとmixが同程度
初めはboundaryが良い
制約付与戦略の比較(3/3)
56
いかなる場合にも有効で
あるような(万能な)戦略はない
• 𝜔の値が大きい、𝜇の値が小さい
→boundary戦略
• 𝜔の値が小さい、𝜇の値が小さい
→degree戦略
• 𝜇の値が大きい、またはノード数が多い→mix戦略
ノード数が多い時、途中まではboundary戦略を
用いた場合に最も精度が良い
• 最初にboundary戦略→
途中でdegree戦略またはmix戦略に切り替える?
𝜔
𝜇
まとめ
57
マルチプレックスネットワークにおける
制約付きコミュニティ抽出法の拡張
• 制約付与を自動化:制約付与戦略にしたがう
• 高速化、省メモリ化: C++によって実装
結果
• 提案法で従来法と同様の制約を付与できた
• 提案法により高速化に成功した
• 大規模な人工ネットワークにおいて制約付き
コミュニティ抽出をおこなうことができた
• ネットワークの特徴に応じて制約付与戦略の
使い分けが必要であるとわかった
3.研究事例
• 多層ネットワークの制約付きコミュニティ抽出
– "マルチスライスネットワークにおける制約付きコミュニティ抽出
法“, 江口 幸司, 村田 剛志, 人工知能学会論文誌, Vol.32, No.1,
p.WII-C_1-9, 2017.
https://www.jstage.jst.go.jp/article/tjsai/32/1/32_WII-
C/_article/-char/ja/
• 動的ネットワークの情報伝搬の最大化
– "Selecting Seed Nodes for Influence Maximization in Dynamic
Networks“, Shogo Osawa, Tsuyoshi Murata, Proceedings of the
6th Workshop on Complex Networks (CompleNet2015), Vol.597,
pp.91-98, 2015. https://link.springer.com/chapter/10.1007/978-
3-319-16112-9_9
– "Extended methods for influence maximization in dynamic
networks“, Tsuyoshi Murata, Hokuto Koga, Computational Social
Networks 5:8, 21 pages, 2018.
https://computationalsocialnetworks.springeropen.com/articles
/10.1186/s40649-018-0056-8
動的ネットワークにおける
影響最大化
計算工学専攻 村田研究室
大澤 翔吾
59
発表内容
• 研究背景
• 関連研究
• 提案手法
• 実験
• 考察
• まとめ
60
情報や病気の広がり
ネットワーク上の情報拡散として表現可能
61
拡散
拡散
情報を最も広く拡散する
ノード集合を見つける
• 病気の感染拡大防止
• 口コミマーケティングの最
適化
拡散が始まるノード
集合が変わると拡散
規模も大きく変わる
影響最大化問題
62
入力
• ネットワーク
• 情報拡散モデル
• シード数𝑘
出力
情報を最も広く拡散で
きるノード集合𝒮
𝒮 = 𝑘
• 影響最大化問題は NP-Hard [Kempe 2003]
• 多くの近似手法が提案されている [Chen 2013][Ohsaka 2014]
– ほとんどは静的ネットワークが対象
• 現実世界のネットワークは動的
– 時間の経過に伴って構造が変化
動的ネットワーク向けの既存手法
63
精度 速度
中心性ベース 低い 非常に高速
MCSベース 非常に高い 低速
速度と精度を両立した手法がない
• 大きく分けて二種類
– 中心性ベース [Holme 2013]
– Monte-Carloシミュレーションベース(MCS)
[Berger-Wolf 2007]
研究概要
• 動的ネットワークにおける影響最大化問題の
新しい近似手法を提案
– ノード集合の拡散力を高速なヒューリスティックを用いて
近似
• 精度と速度を両立
64
精度 速度
中心性ベース 低い 非常に高速
MCSベース 非常に高い 低速
提案手法 高い 高速
発表内容
• 研究背景
• 関連研究
• 提案手法
• 実験
• 考察
• まとめ
65
𝑡 = 1
情報拡散モデル
• SI modelを考える
66
I
情報を持っている
(Infected)
S
情報を持っていない
(Susceptible)
I
S S
I
S
シード集合𝑈
𝑡 = 2
I
S
I
S
𝑡 = 3
I I
S
確率𝜆で状態Iになる
(感染率)
I I S
𝑈 の拡散力𝜎 𝑈 = 拡散終了時の
𝐼ノード数の期待値
中心性ベースの手法
67
拡散先に重複が多い
ノードを複数選んでしまう
1. 全ノードの中心性計算
2. 中心性が最も高い𝑘個の
ノードを出力
高速だが低精度
アルゴリズム なぜ低精度か
中心性ベースの手法の問題点(1)
68
中心性が最も高い2つのノードを選ぶ
C D
BA
E
G
F
0.166 0.300
0.143 0.315
0.143
0.20.143
Closeness中心性
中心性ベースの手法の問題点(2)
69
中心性が最も高い2ノード(B, D):
拡散先に重複が多く,拡散力が大きく増加しない
C D
BA
E
G
F
0.166 0.300
0.143 0.315
0.143
0.20.143
中心性ベースの手法の問題点(3)
70
D, Fを選べばより広く拡散
→中心性の情報だけでは判断不可能
C D
BA
E
G
F
0.166 0.300
0.143 0.315
0.143
0.20.143
MCSベースの手法
71
拡散力の近似 𝜎 ⋅ の
計算コストが膨大
[𝜎 ⋅ の厳密計算は#P-Hard]
1. 空のノード集合𝒮 = ∅
から始める
2. 拡散力の近似の増分
𝜎 𝒮 ∪ 𝑛 が最大の
ノード𝑛を𝒮に順次追加
高精度だが低速
アルゴリズム なぜ低速か
𝝈 𝒮 の近似計算
𝒮をシードとした情報拡散シミュレーションを𝑅回行い,
拡散規模(情報拡散終了時のIノード数)の平均を 𝜎 𝒮 とする
72
試行回数 拡散規模
1 2ノード
2 4ノード
3 3ノード
平均 𝝈 𝒮 =
𝟐 + 𝟒 + 𝟑
𝟑
= 𝟑
𝑅 = 3のときの例
𝜎 ⋅ を精度よく近似する
には大きい𝑅が必要
情報拡散シミュレーションを何
回も行うので低速
発表内容
• 研究背景
• 関連研究
• 提案手法
• 実験
• 考察
• まとめ
73
提案手法の処理
1. 空のノード集合𝒮 = ∅から始める
2. 拡散力の近似 𝜎 ⋅ の増分が最大になる
ノード𝑛を追加
• 𝑛 = argmax
𝑖∉𝑈
𝜎 𝒮 ∪ 𝑖 − 𝜎 𝒮
3. 𝒮 = 𝑘となるまで追加し続ける
74
基本的なアルゴリズムはMCSと同じ
𝝈 ⋅ の近似手法が異なる
拡散力𝝈 ⋅ の近似計算
75
1. 𝑝 𝑛 𝑡 = ノード𝑛が時刻𝑡で状態Iである確率の近似
𝑝 𝑛 1 =
1 𝑛 ∈ 𝒮
0 𝑛 ∉ 𝒮
2. 各時刻 𝑡 = 1,2, … 𝑇 に対して
𝑝 𝑛 𝑡 + 1 = 1 − 1 − 𝑝 𝑛 𝑡
𝑖∈neighbors 𝑛,𝑡
1 − 𝑝𝑖 𝑡 𝜆
3. 拡散力の近似 𝜎 𝒮 は
𝑛
𝑖1
𝑖2 𝑖 𝑚
𝜎 𝒮 =
𝑛
𝑝 𝑛 𝑇 + 1
ノードの確率が互いに独立であると仮定する近似
…
76
厳密計算との比較
A
B
C
D
F
E
<厳密計算> A~Fの経路上にあるノードの
確率は互いに依存している
全経路を列挙して
依存関係を調べるので
計算コストが膨大
A
B
C
D
F
E
<提案手法>
各確率は互いに独立と仮定
隣接ノードだけ見れば良い
𝑃 𝐶, 𝐸 ≠ 𝑃 𝐶 × 𝑃(𝐸)
𝑃 𝐶, 𝐸 = 𝑃 𝐶 × 𝑃(𝐸)として近似
1
1
2
2
3
4
4
1
1
2
2
3
4
4
MCSとの計算量比較
77
手法 𝝈 ⋅ の近似計算量 全体の計算量
MCSベース 𝒪 𝑚𝑅 𝒪 𝑁𝑘𝑚𝑅
提案手法 𝓞 𝒎 𝓞 𝑵𝒌𝒎
MCSのように情報拡散シミュレーションを何回
も実行しないで済むので高速
発表内容
• 研究背景
• 関連研究
• 提案手法
• 実験
• 考察
• まとめ
78
実験
• 提案手法との比較対象
– 中心性が高い順に選ぶ手法 (closeness, broadcast)
– Monte-Carloシミュレーションを用いた手法 (MCS)
𝑅 = 1,000
• 評価指標
– 各手法が選んだノード集合の拡散力:高いほど良い
(情報を拡散できたノードの割合)
• データセット
79
名前 ノード数 エッジ数 期間[分]
Hospital 75 2,424 5,792
High school 2011 126 28,563 4,539
High school 2012 180 45,049 12,158
Infectious 200 943 469
TI model 500 308,000 3,000
パラメータ設定
1. シード数𝑘を変化させる
– 感染率𝜆 = 0.01, 𝑘 = 1,2,3,4,5
– 手法の精度と速度を見る
2. 感染率𝜆を変化させる
– 𝜆 = 0.001,0.005,0.01,0.05, 𝑘 = 5
– 精度だけ見る(速度は𝜆に依存しない)
80
𝒌を変化させる実験(精度)
81
Hospital
提案手法は中心性
ベースの手法より
一貫して精度がよい
MCSに精度は劣るが
はるかに高速
(次のスライド)
シード数𝑘
ノード集合の拡散力[%]
全てのネットワークで
同様の傾向
𝒌を変化させる実験(速度)
82
TI model
提案手法は,中心性
ベースの手法より低速
だが現実的な計算時間
(30万エッジ,18分)
シード数𝑘
実行時間[秒]
MCSは192時間もの
計算時間を要した
提案手法の640倍低速
192時間
18分
感染率𝝀を変化させる実験
83
名前 ノード数 エッジ数 期間[分]
Hospital 75 2,424 5,792
High school 2011 126 28,563 4,539
High school 2012 180 45,049 12,158
Infectious 200 943 469
TI model 500 308,000 3,000
A
B
感染率の値に対する精度の
振る舞いが2種類に別れた
実験結果(2-A)
84
Hospital
提案手法は中心性
ベースの手法より
一貫して精度がよい
感染率𝜆の値が増えると
拡散力の差が縮まる
感染率𝜆
ノード集合の拡散力[%]
グループAの
ネットワークで
同様の傾向
実験結果(2-B)
85
TI model
提案手法は中心性
ベースの手法より
一貫して精度がよい
感染率𝜆の値が減ると
拡散力の差が縮まる
(前スライドと逆の傾向)
感染率𝜆
ノード集合の拡散力[%]
グループBの
ネットワークで
同様の傾向
発表内容
• 研究背景
• 関連研究
• 提案手法
• 実験
• 考察
• まとめ
86
考察
87
ネットワーク
手法間に差異が
見られない条件
Hospital 感染率が高い
High school 2011 感染率が高い
High school 2012 感染率が高い
Infectious 感染率が低い
TI model 感染率が低い
ネットワークによって
情報の広がりやすさが
大きく異なることが原因
情報が広がりやすいネットワーク:
感染率が大きいと
どの手法でも広く拡散
情報が広がりにくいネットワーク:
感染率が小さいと
ほとんど拡散しない
A
B
情報の広がりやすさ
• 各ノード𝑛に対して拡散力𝜎 𝑛 を計算
– シードノードが𝑛だけの時に,
情報がどれくらい拡散するか
• 各ノードの拡散力の分布を求めて
情報の広がりやすさを判断
88
拡散力の分布(グループA)
89
単一ノードの拡散力 %
ノード数
𝜆 = 0.05のとき
大多数のノードが
80~90%以上の
拡散力を持つ
情報が非常に
広がりやすい
グループAの
ネットワークで
同様の傾向
Hospital
拡散力の分布(グループB)
90
単一ノードの拡散力 %
ノード数
𝜆 = 0.001のとき
2%以上の拡散力を持つ
ノードが存在しない
情報がほとんど
広がらない
グループBの
ネットワークで
同様の傾向
TI model
考察のまとめ
91
ネットワーク
手法間に差異が
見られない条件
←のときの
情報の広がりやすさ
Hospital 感染率が高い 非常に広がりやすい
High school 2011 感染率が高い 非常に広がりやすい
High school 2012 感染率が高い 非常に広がりやすい
Infectious 感染率が低い ほとんど広がらない
TI model 感染率が低い ほとんど広がらない
情報が非常に広がりやすい(にくい)
極端な状況でなければ提案手法は特に有効
発表内容
• 研究背景
• 関連研究
• 提案手法
• 実験
• 考察
• まとめ
92
まとめ
• 動的ネットワークにおける影響最大化問題の
新しい近似手法を提案
– 拡散力を高速に近似する貪欲アルゴリズム
– 精度と速度を両立
• 比較実験
– 感染率によっては手法間に違いが見られなかった
– 情報が非常に広がりやすいかほとんど広がらない
という極端な状況以外では,提案手法は特に有効
93
4. トピックス
• テンソルによる表現
• ランダムウオーク、移動可能性(navigability)
• multilayer networkのランキング
• temporal networkとmultilayer network
• multilayer networkのネットワーク特徴量
• multilayer networkの生成モデル
• multilayer networkのコミュニティ抽出
隣接行列とテンソル
• 通常ネットワークG=(V,E)における隣接行列
– A∈{0,1} |V|×|V| (2次元行列)
– Aij = 1 iff (i,j) ∈E
• multilayer networkM=(VM, EM, V, L)における隣
接テンソル
– A∈{0,1} |V|×|V|×|L1|×|L1|×…×|Ld|×|Ld|
– Auvαβ = 1 iff ((u,α),(v,β)) ∈EM
テンソル
• n次元の隣接行列
頂点 レイヤ
レイヤ間
基底
レイヤ内
基底
“Mathematical Formulation of
Multilayer Networks”
• Manlio De Domenico, Albert Sole-Ribalta, Emanuele
Cozzo, Mikko Kivela, Ytamir Moreno, Mason A. Porter,
Sergio Gomez and Alex Arenas
• Physical Review X, 3, 041022, 2013, 15pages
• ネットワーク特徴量(次数中心性、クラスタ係数、固有
ベクトル中心性、モジュラリティ、von Neumann
entropy, diffusion)をテンソル表現に拡張。特殊な場合
として単一レイヤネットワークでのテンソル表現は既
存の特徴量と同一になることを示す。
• multiplexに限定されず、一般的なmultilayerでの枠組。
“Diffusion Dynamics on Multiplex
Networks”
• S. Gomez, A. Diaz-Guilera, J. Gomez-Gardenes,
C. J. Perez-Vicente, Y. Moreno, A. Arenas
• Physical Review Letters, 110, 028701, 5pages,
2013
• 2層のmultiplex networkにおけるsupra-
Laplacianの定義 ((N1+N2)×(N1+N2)の行列で
表記)
• Layer間の係数が小さい場合と大きい場合に
分けて議論
移動可能性(navigability)
• multilayer networkでのランダムウオーク
– 時刻t+Δtのレイヤβの
頂点jでの滞在確率
同一頂点
に留まる
他レイヤ
の対応頂
点に移動
同一レイ
ヤの他頂
点に移動
他レイヤ
の他頂点
に移動
Multilayer networkとしてのロンドン交
通網
• ランダムな故障に対する理論的耐性
(resilience)は、実際の地下鉄不通のtweetに
よる実データとかなり一致
“Navigability of interconnected
networks under random failures”
• Manlio De Domenico, Albert Sole-Ribalta, Sergio
Gomez, and Alex Arenas, PNAS, doi
10.1073/pnas.1318469111 (2014)
• ランダムウオークによるカバレッジ、ランダムな
故障に対するresilienceについて
• Navigationを(i)同じノードに留まる(ii)同じレイヤ
内i->jに移動(iii)同じノードでレイヤα->βに移動
(iv)異なるノードi->j異なるレイヤα->βに移動に分
けて定式化
• London地下鉄や航空ネットワークなどのシミュ
レーションと実データとの比較
multilayer networkでのランキング
• multilayer networkとそれをaggregateした単
純ネットワークとではランキングが異なる
– 周辺的なノードの中心性を過剰評価する傾向
“Ranking in interconnected multilayer
networks reveals versatile nodes”
• Manlio De Domenico, Albert Sole-Ribalta, Elisa
Omodei, Sergio Gomez, Alex Arenas
• Nature Communications 6, Article
number:6868, Published 23 April 2015
• doi:10.1038/ncomms7868
• Multilayer networkの中心性としてversatile
centralityを提案。Aggregateなものと比較して
予測精度が向上。航空会社ネットワークでの
渋滞シミュレーションなどで実験
temporal networkとしてのmultilayer
network
• 一定の間隔毎に切ってmultilayer network化
– 「一定の時間間隔」をどう決めるか
– layer間の辺の強さをどう決めるか
A
B C
D
EF
0<=t < 5
A
B C
D
EF
5<=t < 10
A
B C
D
EF
10<=t < 15
"Temporal Networks", Petter Holme, Jari Saramakid, Physics Reports, Vol.519, Issue 3,
pp.97–125, 2012
“Temporal Networks”でのランダム化
時刻をランダム化
頂点ペアは不変
元の動的グラフ
頂点ペアをランダ
ム化 時刻は不変
RP
RE
RPとRE
• RP(randomly permuted times):
– コンタクト時刻をランダム化
– トポロジーは不変
• RE(randomized edges)
– 各辺の端点を他辺のとランダムに交換
– トポロジーは変わる
各時刻の辺出現数は不変
コンタクト順序の影響
を調べるのに使う
トポロジーの影響
を調べるのに使う
RP
RE
ネットワーク特徴量
• 例: クラスタ係数
• [Manlio De Domenico,
2013]は次数中心性、
クラスタ係数、固有
ベクトル中心性、モ
ジュラリティ、von
Neumann entropy,
diffusion)をテンソル
表現に拡張。
Multilayer networkの特徴量
• (Kivela et al., “Multilayer Networks”より)
• layer内networkを比較する特徴量
– global overlap[45]: 2つのlayerで共有する辺の数
– global inter-clustering coefficient[259]:layerにまたがるクラスタ係数
– layer間の隣接行列要素の相関[19]
– degree of multiplexity[178]:(複数の型の辺をもつ頂点ペア数)/(全ての頂点ペ
ア数)
– 次数やlocal clustering coefficientの相関[19,104,182,250,259]
• 純粋にmulti-layerに特有の特徴量
– interdependence[234,250]:最短パスの中で、複数のlayer辺が使われる割合
– 全頂点が全layerにあるmultiplex network以外の特徴量
• 頂点のmultiplexity degree [285]:その頂点が存在するlayerの数
• [67]:社会ネットでmultiplexity degreeが1のものと2以上のもの(bridge)を比較
– layer毎に別communityと解釈なら、assortativityやmodularityも特徴量[226]
ネットワーク生成モデル
• (節番号や論文引用はKivela et al.,
“Multilayer Networks”のもの)
4.3 Models of Multiplex Networks
• 人工multiplex networksを作る単純な方法
– 通常の生成モデル(ER random graph や
configuration model)を用いて各層を作り、次に
layer間を辺でつなぐ[125,199,231][125,217]
– 各層を独立に作ったmultiplex networkから始め
て、次に(ノードのラベルを変えるなどして)layer間
の相関を作り出す方法[104]
• Exponential random graph models (ERGMs)は
multilevel networksやmultiplex networksを扱
える [122,273,274][153]𝑃(𝐺 𝑀) = exp 𝜃 ∙ 𝑓 𝐺 𝑀 𝑍 𝜃
model parameter
を表すベクトル
正規化関数
network diagnostics(異
種辺の△)のベクトル
microcanonical/canonical network
ensembles[256,316]
• microcanonical ensembles
– 制約集合を厳密に満たすネットワークの集合
• canonical network ensembles
– Shannon entropy最大化:平均的に制約を満たす
– multiplex networkよりも辺の重なりに対して有効
• (空間に埋め込まれた)spatial networksのモデ
ル化に使われる[150]
他の生成モデル
• 優先的選択などの手法をmultiplex networkに拡
張したもの
– Criado[95](一部の頂点だけを含んだ)layerを増やすこ
とでmultiplex networkの成長をモデル化
– 優先的戦略で辺や頂点を追加するもの[182,214,250]
• layer間の辺が作られる確率は、layer内の次数(からなる関
数)に比例
• attachment kernelがaffine(平行移動を伴う線形写像)
• 異なるlayerに頂点が異なる回数だけ生成されるのを許すモ
デル
• 非線形のattachment kernel
attachment kernel
4.4 Models of interconnected
networks
• monoplexネットワークの生成モデルを他のmultilayer
に一般化
– 動的プロセスの研究にモデルは有効
• 似通ったネットワークモデルの研究
– interacting network, node color, node type, module
– block modelやmixture modelによるモデル化も
• 単純な方法は各layerを作って、異なるlayer間をランダ
ムに辺で結ぶ(lattice, ER random graph, configuration
network, BA network)
– 均一にランダムにする必要はない
• layer間を結ぶ異なる戦略で中心性がどう変わるかの研究
• SIRでの伝搬にどう影響するかの研究
configuration modelの拡張
• 複数の次数分布を多変数で表す
– [10,200]
– Soderberg
– Newman
– Gleeson
– [17] node-colored graphのERモデル
– [9] node-colored 2部グラフのconfiguration model
• layer内-layer間の次数相関を取り入れたモデ
ル
𝑃𝛼(𝑘1, … , 𝑘 𝑏) layer αの頂点がlayer βの頂点kβ個とつながる確率
𝑃(𝑘1, … , 𝑘 𝑏) layer独立な多次元分布 + 𝜏 𝛼𝛽
layerαとβ間
の辺の割合
𝑃𝛼(𝑘) 各layerの次数分布 + mixing matrix layer間の
辺の割合
結合確率行列P 𝑃 𝛼𝛽(𝑘)
layerαの頂点がk個のlayerβ
の頂点とつながる確率
𝑃 𝛼𝛽(𝑘, 𝑘′) layerα内で次数kの頂点がk’個のlayerβの頂点とつながる確率
𝑃 𝛼𝛽(𝑘 𝛼𝛼, 𝑘 𝛼𝛽, 𝑘′
𝛽𝛽, 𝑘′
𝛼𝛽)
layer間次数layer内次数
configuration model
• (2頂点をランダムに選んで辺を追加する)
random graphでは次数分布がポアソン分布
• 任意の次数分布のネットワークを生成する手
法
– 与えられた次数の切り株を用意
– 切り株の間をランダムにつなぐ
頂
点
次
数
a 2
b 2
c 3
d 3
e 4
a b c d e
b
c
ed
a
a
b
c
d
e
パラメータ
Stochastic block model (1)
• 与えられたグラフの背後にある生成モデルの
パラメータ
– k:グループ数
– 𝑧:各頂点のグループID
– M:グループ間の結合確率の行列(k*k)
• モデルからグラフを生成
– 頂点iとjの間の辺をMzizjの確率で生成(ziとzjは頂
点iとjが属するグループのID)
• グラフからモデルを推定
予め与える
http://tuvalu.santafe.edu/~aaronc/courses/5352/fall2013/
Stochastic block model (2)
• M(stochastic block matrix)と生成されるグラフ
– グループ内:ランダムグラフ、グループ間:ランダム
2部グラフ
http://tuvalu.santafe.edu/~aaronc/courses/5352/fall2013/
対角成分0.50
それ以外0.01
→グループ内が密
対角成分0.01
それ以外0.12
→グループ間が密
コミュニティ抽出
• (節番号や論文引用はKivela et al.,
“Multilayer Networks”のもの)
4.5 Communities and other mesoscale
structures
• monoplex networkでもコミュニティの定義は様々
• multilayer networkではさらにひどい状況
– 次数ひとつとってもいろいろな拡張があるから
• blockmodeling[33,112,152,350]
– 類似結合パターンの頂点集合を出力
– 必ずしも密な部分を見つけるものではない
• roleを割り当てる[264]
• monoplexからスタートしてlayerを割り当てて
multilayerにする[83,270]
Community structure in multilayer
networks (1)
• multilayerでのコミュニティ抽出研究は僅か
• Muchaによるmodularityの拡張[237,238]
– ひとつの頂点がlayerによって別のコミュニティに
属しても良い
– 最適化は計算量的に問題
• 特にtemporal networkの時に顕著
• 最適解を維持してサイズを小さくする手法[12]を
multislice modularity最適化に適用[74]
𝑄 𝑚𝑢𝑙𝑡𝑖𝑠𝑙𝑖𝑐𝑒 =
1
2𝜇
𝑖𝑗𝑠𝑟
𝐴𝑖𝑗𝑠 − 𝛾𝑠
𝑘𝑖𝑠 𝑘𝑗𝑠
2𝑚 𝑠
𝛿 𝑠𝑟 + 𝛿𝑖𝑗 𝐶𝑗𝑠𝑟 𝛿 𝑔𝑖𝑠, 𝑔𝑗𝑟
i,j:node
r,s:slice
Aijs:slice sのnode i-j間の辺
Cjsr:node iのslice s-r間の辺
Kis:node iのslice s内の次数
2ms:slice s内の辺総数
γs:slice s内のresolution parameter
2μ:全sliceの辺総数
slice
node
"Community Structure in Time-Dependent, Multiscale, and
Multiplex Networks",Peter J. Mucha et al., Science Vol.328
No. 5980 pp.876-878 2010.
Community structure in multilayer
networks (2)
• multilayer networkのnull modelをどうするか
– modularityは「ランダムな」ネットワークと比べて密かを調べる
関数
– null modelの決め方によって、得られるコミュニティも異なる
– [29]はいろいろなnull modelを提案
– Multislice modularityの最適化
• 政党の再組織化[237,238]
• 振る舞いのダイナミクス[362]
• 脳機能ネットワーク[30,32]
• 非線形振動子の動的な出力の振る舞い[29,31]
• 国際関係ネットワーク[94]
– モジュラリティだけでなくコミュニティ抽出手法もmultilayerに拡
張[237,238][96]
Community structure in multilayer
networks (3)
• Spectral clusteringの拡張
– [228]はspectral clusteringと、 hypergraphへのPerron-
Frobenius theoremを拡張し、multilayer networkを
hypergraphに写像したものに適用
– [204]:heavy subgraphの拡張(recurrent heavy network)
• 各layerで従来手法でコミュニティを抽出
– [20]では各layerでのコミュニティと、全layerをつぶした
aggregated networkのコミュニティを比較→かなりの違い
あり→aggregationによって情報欠損
– [44]では各layerでコミュニティを抽出し、各頂点を
tuple(c,α)で表現し、(閾値以上出現する)layer内コミュニ
ティの集合としてmultilayer communityを定義
Community structure in multilayer
networks (4)
• multilayer networkをaggregateすれば(つぶせば)、従来のコミュニ
ティ抽出手法が適用可→全ての可能な(2bの)aggregationを試す
[213]
• [333]:各layerでの目的関数(utility matrix)の和をutility integration
と定義
– modularityならutility matrix=modularity matrix
• Inverse community detection
– 真のcommunityが与えられている→aggregateしたネットワークから真
のコミュニティが抽出されるようにaggregateの際の線形結合の重みを
調整する[72]
– [275]:より複雑な重みづけ(metaclustering)
• ランダムな重みづけでいろいろaggregateして、それぞれをclusteringして、異
なるclusterの距離行列を作る←階層クラスタリングを用いてコミュニティ抽出
• Multi-relational dataのクラスタリング手法[319-321]
4.5.2 methods based on tensor
decomposition
• monoplex networkに対するSVDのように、
multiplex networkに対してはtensor-
decompositionを用いる
– CANDECOM/PARAFAC(CP):𝐴 𝑢𝑣𝛼 ≈ 𝑟
𝑅 𝑥 𝑢𝑟 𝑦𝑣𝑟 𝑧 𝛼𝑟
• 𝑥, 𝑦 ∈ 𝑅 𝑛×𝑅, 𝑧 ∈ 𝑅 𝑏×𝑅
– three-way DEDICOM, Tucker decomposition
[14,322]
– Nonnegative tensor factorization [131]
– hypergraphのクラスタリング手法を利用[207]
“Comparison of communities
detection algorithms for multiplex”
• Chuan Wen Loe, Henrik Jeldtoft Jensen
• Physica A: Statistical Mechanics and its Applications, Volume 431, 1 August
2015, Pages 29–45
• http://www.sciencedirect.com/science/article/pii/S0378437115002125
• multiplex networkからのコミュニティ抽出手法の比較を行った論文。人工
ネットワークとして、Erdos-Renyiランダムグラフ、WSスモールワールドグラ
フ、BAスケールフリーグラフの3つを組み合わせた6通りの2層グラフに対
して、projection3種類(A1A2A3)、クラスタベース類似度分割(A4)、一般カ
ノニカル相関(A5)、CLECC bridge検出(A6)、頻出パターンマイニング(A7)、
テンソル分解(A8)の8通りでコミュニティ抽出を行い、類似点や相違点を
比較。Redundancy, CLECC, modularityに注目して2層コミュニティを結合し
たSSRM(structured synthetic random multiplex)というベンチマークを提案
• 評価手法としてはNMIの他に、overlapping communitiesの評価手法とし
てOmega Indexを使う。これは同じコミュニティに属する頂点ペアの集合を
考え、二つの分割でのその集合のANDの大きさをもとに計算する指標。
“Finding Redundant and
Complementary Communities in
Multidimensional Networks”• Michele Berlingerio, Michele Coscia, Fosca Giannotti, CIKM 2011,
pp.2181-2184, 2011.
• Multidimensional networkにおけるコミュニティの評価指標として、
complementarityとredundancyを提案
• コミュニティ抽出手法自体は、multilayerを単一layerに重みづけ
projectionして既存手法を利用。
• IMDbの実データで3つのコミュ抽出手法(Label propagation,
random walk, fast greedy optimization)、3つの重みづけ手法
(flattening, 重み付きflattening, common neighbor重みづけ)の結
果を比較
• 3つの問いQ1:異なる重みづけとコミュ抽出手法での性能評価、Q2:
重みづけとコミュ抽出手法が、complementarityとredundancyの分
布に与える影響、Q3:重みづけとコミュ抽出手法のベストパラメータ
• コミュニティの実例も示す。
multilayer networkをaggregateして
コミュニティ抽出する論文も多い
5. ツール
• MuxViz
– http://muxviz.net/
– Multilayer networkの可視化・分析ツール
• GenLouvain
– http://www.plexmath.eu/?page_id=327
– コミュニティ抽出手法のLouvain法[Blodel 2008]を
multiplexに拡張
• MapEquation
– http://www.mapequation.org/
– ランダムウオークによるコミュニティ抽出手法Infomap
[Rosvall, 2008]をmultiplexに拡張
Multilayer Networksの可視化
• http://www.plexmath.eu/?page_id=327
• http://muxviz.net/
Pythonベースの分析・可視化ツール
• Pymnet
– http://www.mkivela.com/pymnet/index.html
– 大規模化を考慮した実装
• multiNetX
– https://github.com/nkoub/multinetx
– 従来のツール(networkX)の拡張
• Py3Plex
– https://github.com/SkBlaz/Py3plex
– 可視化、アニメーションを重視
5. データセット(1)
• 実データ [Kivela 2014]参照
5. データセット(2)
• 人工データ
– mLFR Benchmark: Testing Community Detection
Algorithms in Multi-layered, Multiplex and
Multiple Social Networks (Netsci2015 talk)
– https://www.ii.pwr.edu.pl/~brodka/mlfr.php
5. データセット(3)
• Mark Newman's Website
– http://www-personal.umich.edu/~mejn/netdata/
• Stanford Network Analysis Project
– http://snap.stanford.edu/
• Network Repository
– http://networkrepository.com/
• Sociopatterns
– http://www.sociopatterns.org/datasets/
• Kaggle (for data science)
– https://www.kaggle.com/
• Google Dataset Search
– https://toolbox.google.com/datasetsearch
5. 関連国際会議(物理系)
• NetSci (2020.7.6-10?, Rome)
– https://netscisociety.net/home
• NetSci-X (2020.1.20-23, Tokyo)
– https://netscix2020tokyo.github.io/
• CompleNet (2020.3.31-4.3, Exeter, UK)
– https://complenet.weebly.com/
• CCS(ECCS) (2019.9.30-10.4, Singapore)
– http://event.ntu.edu.sg/ccs2019/Pages/Home.aspx
• Complex Networks (2019.12.10-12, Lisbon)
– http://www.complexnetworks.org/
関連国際会議
(人工知能、機械学習、Web、社会学)
• IC2S2 (2019.7.17-20, Amsterdam)
– https://2019.ic2s2.org/
• KDD (2019.8.4-8, Anchorage)
– https://www.kdd.org/kdd2019/
• IJCAI (2019.8.10-16, Macao)
– https://ijcai19.org/
• ECML/PKDD 2019.9.16-20,
Wurzburg)
– http://ecmlpkdd2019.org/
• CIKM (2019.11.3-7, Beijing)
– http://www.cikm2019.net/
• ICDM (2019.11.8-11, Beijing)
– http://icdm2019.bigke.org/
• BigData (2019.12.9-12, Los
Angeles)
– http://cci.drexel.edu/bigdata/bigda
ta2019/index.html
• NeurIPS (2019.12.2-8, Vancouver)
– https://nips.cc/
• WSDM 2020.2.5-9, Houston)
– http://www.wsdm-
conference.org/2020/
• AAAI (2020.2.7-12, New York)
– https://aaai.org/Conferences/AAAI
-20/
• TheWeb(WWW) (2020.4.20-24,
Taipei)
– https://www2020.thewebconf.org/
• Sunbelt (2020.6.1-7, Paris)
– https://www.insna.org/news/sunb
elt-2020-save-the-date---june-1-7-
2020
• ICWSM (2020.6.?-?, Atlanta)
– https://www.icwsm.org/2020/
関連国内会議
• ネットワーク生態学研究会 (2020.3.2-3)
– http://www.neteco.jp/symposium.html
• 計算社会科学研究会
– https://css-japan.com/
• ネットワークが創発する知能研究会
– http://www.ai.comp.ae.keio.ac.jp/jwein19/
• (電子情報通信学会情報ネットワーク科学特別
研究専門委員会(活動終了))
– https://www.ieice.org/~netsci/
5.参考文献
• チュートリアル
– Mason Porter: “Multilayer Network Tutorial”
https://web.stanford.edu/group/networkforum/cgi-bin/drupal/node/53
– Alex Arena: “Multilayer interconnected complex networks: an
introduction”
http://lbs.epfl.ch/files/content/sites/lbs/files/shared/talks-
guests/EPFL_Arenas.pdf
– Rushed Kanawati: “Mining Multiplex Network: A tutorial”
http://lipn.fr/munm/MUNM/Home.html
• サーベイ論文
– Kivela et al., “Multilayer Networks”, Journal of Complex Networks 2 (3),
pp.203 - 271 (2014),
http://comnet.oxfordjournals.org/content/early/2014/07/14/comnet.c
nu016
– Boccaletti et al., “The structure and dynamics of multilayer networks”,
Physics Reports, 544, pp.1-122 (2014),
http://www.sciencedirect.com/science/article/pii/S0370157314002105
• ネットワーク分析全般のリンク集
– Awesome Network Analysis https://github.com/briatte/awesome-
network-analysis
まとめ
• 現実の複雑な関係を表現・分析する枠組みと
しての多層ネットワーク
– そもそもデータからネットワークをどう作るか、
ネットワークとして捉えるのが適切か
– 未観測部分、ノイズ、動的変化などをどうするか
– ネットワークを「分析」したら、どう「制御」するか
多層ネットワークによる
構造データ分析
村田剛志
東京工業大学 情報理工学院 情報工学系
murata@c.titech.ac.jp
http://www.net.c.titech.ac.jp/
令和元年度 東北大学電気通信研究所 共同プロジェクト研究会
応用物理学会プラズマエレクトロニクス分科会 第32回プラズマ新領域研究会
物理 化学混成系プラズマにおける情報系機能発現
~プラズマ反応場をネットワーク科学として捉える~
本スライドはslideshareにて公開 上記サイトにリンクあり

Weitere ähnliche Inhalte

Was ist angesagt?

機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門hoxo_m
 
[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network A...
[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network A...[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network A...
[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network A...Deep Learning JP
 
実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022Teruyuki Sakaue
 
Pythonでカスタム状態空間モデル
Pythonでカスタム状態空間モデルPythonでカスタム状態空間モデル
Pythonでカスタム状態空間モデルHamage9
 
深層学習の非常に簡単な説明
深層学習の非常に簡単な説明深層学習の非常に簡単な説明
深層学習の非常に簡単な説明Seiichi Uchida
 
機械学習によるハイスループット 第一原理計算の代替の可能性_日本化学会_20230323
機械学習によるハイスループット 第一原理計算の代替の可能性_日本化学会_20230323機械学習によるハイスループット 第一原理計算の代替の可能性_日本化学会_20230323
機械学習によるハイスループット 第一原理計算の代替の可能性_日本化学会_20230323Matlantis
 
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3までYahoo!デベロッパーネットワーク
 
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎Preferred Networks
 
ナレッジグラフ入門
ナレッジグラフ入門ナレッジグラフ入門
ナレッジグラフ入門KnowledgeGraph
 
組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門Norishige Fukushima
 
【DL輪読会】Unpaired Image Super-Resolution Using Pseudo-Supervision
【DL輪読会】Unpaired Image Super-Resolution Using Pseudo-Supervision【DL輪読会】Unpaired Image Super-Resolution Using Pseudo-Supervision
【DL輪読会】Unpaired Image Super-Resolution Using Pseudo-SupervisionDeep Learning JP
 
何となく勉強した気分になれるパーサ入門
何となく勉強した気分になれるパーサ入門何となく勉強した気分になれるパーサ入門
何となく勉強した気分になれるパーサ入門masayoshi takahashi
 
バンディット問題について
バンディット問題についてバンディット問題について
バンディット問題についてjkomiyama
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方joisino
 
Prophet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツールProphet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツールhoxo_m
 
スペクトラルグラフ理論入門
スペクトラルグラフ理論入門スペクトラルグラフ理論入門
スペクトラルグラフ理論入門irrrrr
 
いまさら聞けない!CUDA高速化入門
いまさら聞けない!CUDA高速化入門いまさら聞けない!CUDA高速化入門
いまさら聞けない!CUDA高速化入門Fixstars Corporation
 
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介Deep Learning JP
 

Was ist angesagt? (20)

機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門機械学習のためのベイズ最適化入門
機械学習のためのベイズ最適化入門
 
[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network A...
[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network A...[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network A...
[DL輪読会]Live-Streaming Fraud Detection: A Heterogeneous Graph Neural Network A...
 
プログラムを高速化する話
プログラムを高速化する話プログラムを高速化する話
プログラムを高速化する話
 
実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022実務と論文で学ぶジョブレコメンデーション最前線2022
実務と論文で学ぶジョブレコメンデーション最前線2022
 
Pythonでカスタム状態空間モデル
Pythonでカスタム状態空間モデルPythonでカスタム状態空間モデル
Pythonでカスタム状態空間モデル
 
深層学習の非常に簡単な説明
深層学習の非常に簡単な説明深層学習の非常に簡単な説明
深層学習の非常に簡単な説明
 
機械学習によるハイスループット 第一原理計算の代替の可能性_日本化学会_20230323
機械学習によるハイスループット 第一原理計算の代替の可能性_日本化学会_20230323機械学習によるハイスループット 第一原理計算の代替の可能性_日本化学会_20230323
機械学習によるハイスループット 第一原理計算の代替の可能性_日本化学会_20230323
 
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
 
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」  佐野正太郎
明治大学講演資料「機械学習と自動ハイパーパラメタ最適化」 佐野正太郎
 
ナレッジグラフ入門
ナレッジグラフ入門ナレッジグラフ入門
ナレッジグラフ入門
 
独立成分分析 ICA
独立成分分析 ICA独立成分分析 ICA
独立成分分析 ICA
 
組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門組み込み関数(intrinsic)によるSIMD入門
組み込み関数(intrinsic)によるSIMD入門
 
【DL輪読会】Unpaired Image Super-Resolution Using Pseudo-Supervision
【DL輪読会】Unpaired Image Super-Resolution Using Pseudo-Supervision【DL輪読会】Unpaired Image Super-Resolution Using Pseudo-Supervision
【DL輪読会】Unpaired Image Super-Resolution Using Pseudo-Supervision
 
何となく勉強した気分になれるパーサ入門
何となく勉強した気分になれるパーサ入門何となく勉強した気分になれるパーサ入門
何となく勉強した気分になれるパーサ入門
 
バンディット問題について
バンディット問題についてバンディット問題について
バンディット問題について
 
最適輸送の解き方
最適輸送の解き方最適輸送の解き方
最適輸送の解き方
 
Prophet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツールProphet入門【Python編】Facebookの時系列予測ツール
Prophet入門【Python編】Facebookの時系列予測ツール
 
スペクトラルグラフ理論入門
スペクトラルグラフ理論入門スペクトラルグラフ理論入門
スペクトラルグラフ理論入門
 
いまさら聞けない!CUDA高速化入門
いまさら聞けない!CUDA高速化入門いまさら聞けない!CUDA高速化入門
いまさら聞けない!CUDA高速化入門
 
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
[DL輪読会]Convolutional Conditional Neural Processesと Neural Processes Familyの紹介
 

Ähnlich wie Structural data analysis based on multilayer networks

大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズムTakuya Akiba
 
20160901 jwein
20160901 jwein20160901 jwein
20160901 jweintm1966
 
mi-5. ディープラーニング
mi-5. ディープラーニングmi-5. ディープラーニング
mi-5. ディープラーニングkunihikokaneko1
 
深層学習の数理
深層学習の数理深層学習の数理
深層学習の数理Taiji Suzuki
 
Scan Registration for Autonomous Mining Vehicles Using 3D-NDT
Scan Registration for Autonomous Mining Vehicles Using 3D-NDTScan Registration for Autonomous Mining Vehicles Using 3D-NDT
Scan Registration for Autonomous Mining Vehicles Using 3D-NDTKitsukawa Yuki
 
Top-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender SystemTop-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender Systemharmonylab
 
how-calculate-cluster-coefficience
how-calculate-cluster-coefficiencehow-calculate-cluster-coefficience
how-calculate-cluster-coefficienceNorihiro Shimoda
 
令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -Yutaka KATAYAMA
 
Fast community structure identification of small world networks
Fast community structure identification of small world networksFast community structure identification of small world networks
Fast community structure identification of small world networksTokyo Institute of Technology
 
[DL輪読会]CNN - based Density Estimation and CrowdCounting A Survey
[DL輪読会]CNN - based Density Estimation and CrowdCounting A Survey[DL輪読会]CNN - based Density Estimation and CrowdCounting A Survey
[DL輪読会]CNN - based Density Estimation and CrowdCounting A SurveyDeep Learning JP
 
LAB-ゼミ資料-1-20150413
LAB-ゼミ資料-1-20150413LAB-ゼミ資料-1-20150413
LAB-ゼミ資料-1-20150413Yuki Ogasawara
 
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)STAIR Lab, Chiba Institute of Technology
 
点群深層学習 Meta-study
点群深層学習 Meta-study点群深層学習 Meta-study
点群深層学習 Meta-studyNaoya Chiba
 
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太Preferred Networks
 
【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?Masanao Ochi
 
Lab-ゼミ資料-4-20150430
Lab-ゼミ資料-4-20150430Lab-ゼミ資料-4-20150430
Lab-ゼミ資料-4-20150430Yuki Ogasawara
 

Ähnlich wie Structural data analysis based on multilayer networks (20)

大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム大規模ネットワークの性質と先端グラフアルゴリズム
大規模ネットワークの性質と先端グラフアルゴリズム
 
20160901 jwein
20160901 jwein20160901 jwein
20160901 jwein
 
mi-5. ディープラーニング
mi-5. ディープラーニングmi-5. ディープラーニング
mi-5. ディープラーニング
 
Jokyokai
JokyokaiJokyokai
Jokyokai
 
深層学習の数理
深層学習の数理深層学習の数理
深層学習の数理
 
Scan Registration for Autonomous Mining Vehicles Using 3D-NDT
Scan Registration for Autonomous Mining Vehicles Using 3D-NDTScan Registration for Autonomous Mining Vehicles Using 3D-NDT
Scan Registration for Autonomous Mining Vehicles Using 3D-NDT
 
Top-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender SystemTop-K Off-Policy Correction for a REINFORCE Recommender System
Top-K Off-Policy Correction for a REINFORCE Recommender System
 
how-calculate-cluster-coefficience
how-calculate-cluster-coefficiencehow-calculate-cluster-coefficience
how-calculate-cluster-coefficience
 
令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -令和元年度 実践セミナー - Deep Learning 概論 -
令和元年度 実践セミナー - Deep Learning 概論 -
 
Fast community structure identification of small world networks
Fast community structure identification of small world networksFast community structure identification of small world networks
Fast community structure identification of small world networks
 
[DL輪読会]CNN - based Density Estimation and CrowdCounting A Survey
[DL輪読会]CNN - based Density Estimation and CrowdCounting A Survey[DL輪読会]CNN - based Density Estimation and CrowdCounting A Survey
[DL輪読会]CNN - based Density Estimation and CrowdCounting A Survey
 
LAB-ゼミ資料-1-20150413
LAB-ゼミ資料-1-20150413LAB-ゼミ資料-1-20150413
LAB-ゼミ資料-1-20150413
 
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
教師なしオブジェクトマッチング(第2回ステアラボ人工知能セミナー)
 
点群深層学習 Meta-study
点群深層学習 Meta-study点群深層学習 Meta-study
点群深層学習 Meta-study
 
Wssit slide
Wssit slideWssit slide
Wssit slide
 
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
東大大学院 電子情報学特論講義資料「深層学習概論と理論解析の課題」大野健太
 
NeurIPS2019参加報告
NeurIPS2019参加報告NeurIPS2019参加報告
NeurIPS2019参加報告
 
DeepCas
DeepCasDeepCas
DeepCas
 
【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?
 
Lab-ゼミ資料-4-20150430
Lab-ゼミ資料-4-20150430Lab-ゼミ資料-4-20150430
Lab-ゼミ資料-4-20150430
 

Mehr von tm1966

情報理工学院情報工学系村田研究室.pptx
情報理工学院情報工学系村田研究室.pptx情報理工学院情報工学系村田研究室.pptx
情報理工学院情報工学系村田研究室.pptxtm1966
 
Networks, Deep Learning and COVID-19
Networks, Deep Learning and COVID-19Networks, Deep Learning and COVID-19
Networks, Deep Learning and COVID-19tm1966
 
友人関係と感染症伝搬をネットワークで理解する
友人関係と感染症伝搬をネットワークで理解する友人関係と感染症伝搬をネットワークで理解する
友人関係と感染症伝搬をネットワークで理解するtm1966
 
Graph Neural Networks
Graph Neural NetworksGraph Neural Networks
Graph Neural Networkstm1966
 
Network analysis and visualization by Google Colaboratory
Network analysis and visualization by Google ColaboratoryNetwork analysis and visualization by Google Colaboratory
Network analysis and visualization by Google Colaboratorytm1966
 
Networks, Deep Learning (and COVID-19)
Networks, Deep Learning (and COVID-19)Networks, Deep Learning (and COVID-19)
Networks, Deep Learning (and COVID-19)tm1966
 
20191107 deeplearningapproachesfornetworks
20191107 deeplearningapproachesfornetworks20191107 deeplearningapproachesfornetworks
20191107 deeplearningapproachesfornetworkstm1966
 
Introduction of network analysis with Google Colaboratory -- Diffusion in Net...
Introduction of network analysis with Google Colaboratory -- Diffusion in Net...Introduction of network analysis with Google Colaboratory -- Diffusion in Net...
Introduction of network analysis with Google Colaboratory -- Diffusion in Net...tm1966
 
Introduction of network analysis with Google Colaboratory -- Network Models
Introduction of network analysis with Google Colaboratory -- Network ModelsIntroduction of network analysis with Google Colaboratory -- Network Models
Introduction of network analysis with Google Colaboratory -- Network Modelstm1966
 
Introduction of network analysis with Google Colaboratory -- Network Algorithms
Introduction of network analysis with Google Colaboratory -- Network AlgorithmsIntroduction of network analysis with Google Colaboratory -- Network Algorithms
Introduction of network analysis with Google Colaboratory -- Network Algorithmstm1966
 
Introduction of network analysis with Google Colaboratory -- Network Metrics
Introduction of network analysis with Google Colaboratory -- Network MetricsIntroduction of network analysis with Google Colaboratory -- Network Metrics
Introduction of network analysis with Google Colaboratory -- Network Metricstm1966
 
Introduction of network analysis with Google Colaboratory -- Example of Netwo...
Introduction of network analysis with Google Colaboratory -- Example of Netwo...Introduction of network analysis with Google Colaboratory -- Example of Netwo...
Introduction of network analysis with Google Colaboratory -- Example of Netwo...tm1966
 
Introduction of network analysis with Google Colaboratory -- Introduction of ...
Introduction of network analysis with Google Colaboratory -- Introduction of ...Introduction of network analysis with Google Colaboratory -- Introduction of ...
Introduction of network analysis with Google Colaboratory -- Introduction of ...tm1966
 
Introduction of network analysis with Google Colaboratory -- Orientation
Introduction of network analysis with Google Colaboratory -- OrientationIntroduction of network analysis with Google Colaboratory -- Orientation
Introduction of network analysis with Google Colaboratory -- Orientationtm1966
 
20140925 multilayernetworks
20140925 multilayernetworks20140925 multilayernetworks
20140925 multilayernetworkstm1966
 

Mehr von tm1966 (15)

情報理工学院情報工学系村田研究室.pptx
情報理工学院情報工学系村田研究室.pptx情報理工学院情報工学系村田研究室.pptx
情報理工学院情報工学系村田研究室.pptx
 
Networks, Deep Learning and COVID-19
Networks, Deep Learning and COVID-19Networks, Deep Learning and COVID-19
Networks, Deep Learning and COVID-19
 
友人関係と感染症伝搬をネットワークで理解する
友人関係と感染症伝搬をネットワークで理解する友人関係と感染症伝搬をネットワークで理解する
友人関係と感染症伝搬をネットワークで理解する
 
Graph Neural Networks
Graph Neural NetworksGraph Neural Networks
Graph Neural Networks
 
Network analysis and visualization by Google Colaboratory
Network analysis and visualization by Google ColaboratoryNetwork analysis and visualization by Google Colaboratory
Network analysis and visualization by Google Colaboratory
 
Networks, Deep Learning (and COVID-19)
Networks, Deep Learning (and COVID-19)Networks, Deep Learning (and COVID-19)
Networks, Deep Learning (and COVID-19)
 
20191107 deeplearningapproachesfornetworks
20191107 deeplearningapproachesfornetworks20191107 deeplearningapproachesfornetworks
20191107 deeplearningapproachesfornetworks
 
Introduction of network analysis with Google Colaboratory -- Diffusion in Net...
Introduction of network analysis with Google Colaboratory -- Diffusion in Net...Introduction of network analysis with Google Colaboratory -- Diffusion in Net...
Introduction of network analysis with Google Colaboratory -- Diffusion in Net...
 
Introduction of network analysis with Google Colaboratory -- Network Models
Introduction of network analysis with Google Colaboratory -- Network ModelsIntroduction of network analysis with Google Colaboratory -- Network Models
Introduction of network analysis with Google Colaboratory -- Network Models
 
Introduction of network analysis with Google Colaboratory -- Network Algorithms
Introduction of network analysis with Google Colaboratory -- Network AlgorithmsIntroduction of network analysis with Google Colaboratory -- Network Algorithms
Introduction of network analysis with Google Colaboratory -- Network Algorithms
 
Introduction of network analysis with Google Colaboratory -- Network Metrics
Introduction of network analysis with Google Colaboratory -- Network MetricsIntroduction of network analysis with Google Colaboratory -- Network Metrics
Introduction of network analysis with Google Colaboratory -- Network Metrics
 
Introduction of network analysis with Google Colaboratory -- Example of Netwo...
Introduction of network analysis with Google Colaboratory -- Example of Netwo...Introduction of network analysis with Google Colaboratory -- Example of Netwo...
Introduction of network analysis with Google Colaboratory -- Example of Netwo...
 
Introduction of network analysis with Google Colaboratory -- Introduction of ...
Introduction of network analysis with Google Colaboratory -- Introduction of ...Introduction of network analysis with Google Colaboratory -- Introduction of ...
Introduction of network analysis with Google Colaboratory -- Introduction of ...
 
Introduction of network analysis with Google Colaboratory -- Orientation
Introduction of network analysis with Google Colaboratory -- OrientationIntroduction of network analysis with Google Colaboratory -- Orientation
Introduction of network analysis with Google Colaboratory -- Orientation
 
20140925 multilayernetworks
20140925 multilayernetworks20140925 multilayernetworks
20140925 multilayernetworks
 

Structural data analysis based on multilayer networks

Hinweis der Redaktion

  1. コミュニティ抽出はネットワーク分析の手法の一つ ネットワークからエッジのつながりが密な部分ネットワーク(コミュニティ)を見つけ出すことをいう 背景知識やユーザからのフィードバックなどを考慮したコミュニティ抽出を制約付きコミュニティ抽出という 制約を考慮することで精度の向上が期待される このネットワークでは、たとえばこのようなコミュニティ構造を得ることができる 居住地の情報を制約として考慮した場合、このようにコミュニティ構造が変化することが考えられる
  2. コミュニティ抽出はネットワーク分析の手法の一つ ネットワークからエッジのつながりが密な部分ネットワーク(コミュニティ)を見つけ出すことをいう 背景知識やユーザからのフィードバックなどを考慮したコミュニティ抽出を制約付きコミュニティ抽出という 制約を考慮することで精度の向上が期待される このネットワークでは、たとえばこのようなコミュニティ構造を得ることができる 居住地の情報を制約として考慮した場合、このようにコミュニティ構造が変化することが考えられる
  3. 複数のネットワークをエッジでつなぐことによって組み合わせたネットワークをマルチプレックスネットワークという これを構成するそれぞれのネットワークをレイヤーと呼ぶ 各レイヤーは同じノードの集合を持ち、レイヤー間のエッジは同じノード間のみに存在する
  4. マルチプレックスネットワークは交通網や人間関係といったノード間に複数の種類のつながりがあるようなネットワークを表現するのに役立つ マルチプレックスネットワークにおいてコミュニティ抽出をおこなうことで、そのようなネットワークの分析が可能
  5. コミュニティ抽出は評価関数と呼ばれる、コミュニティ抽出の結果の質を定量化するための関数を何らかのアルゴリズムによって最適化することでおこなわれる 評価関数にはモジュラリティやそれを一般化したハミルトニアンなどがある これまでの研究では、モノプレックスネットワークの制約付きコミュニティ抽出の評価関数である制約付きハミルトニアンをマルチプレックスネットワークに拡張し、その最適化法にマルチプレックスネットワークのモジュラリティ最適化法であるGen Louvain法を用いることでマルチプレックスネットワークにおける制約付きコミュニティ抽出をおこなう方法を提案していた
  6. この問題を解決するため、本研究ではマルチプレックスネットワークにおいて制約付きコミュニティ抽出を適用できる対象を広げることが目的 主に大規模ネットワークと有向ネットワークに対応することを目指す これによって制約付きコミュニティ抽出をSNSや人間関係、論文の引用関係などの分析に用いることができるなど、応用範囲が広がることが期待される 大規模ネットワークに対応するために制約付与を自動化する 有向グラフで表されるネットワークに対応するために評価関数を拡張する
  7. 本研究では、マルチスライスネットワークにおけるハミルトニアンを、このように定義しました。 まず、初めの四つの項は同一スライス上に存在するノード同士の関係を考慮しています。 これは、シングルスライスネットワークにおけるハミルトニアンと同じものであり、同じコミュニティに属するノード同士にエッジがあれば報酬、なければ罰則、異なるコミュニティに属するノード同士にエッジがあれば罰則、なければ報酬を与えています。 これに、異なるスライス上に存在するノード同士の関係を考慮するための項を付け加えます。 五項目は同じコミュニティに属するノード同士にエッジがあれば報酬を、異なるコミュニティに属するノード同士にエッジがあれば罰則を与えています。 なお、ハミルトニアンは、値が小さいほどいいコミュニティ抽出結果であることを表します。
  8. 次に、マルチスライスネットワークのハミルトニアンに制約を与えるための制約項をこのように定義します。 本研究では、ノードのペアに対して、同じコミュニティに属するべきであるという正の制約、または異なるコミュニティに属するべきであるという負の制約を与えることにします。 一つ目の項は、同じスライス内に存在するノード同士に関する制約を考慮しています。 これは、シングルスライスネットワークにおける制約項と同じです。 二項目は、異なるスライス上に存在するノード同士に関する制約を考慮しています。 ここでは、異なるスライス上に存在するノードのペアは、同じノードのみを考えます。 この二つの項は、制約が与えられたノード同士が属するコミュニティが、与えられた制約と異なる場合に制約を与えています。 たとえば、正の制約が与えられたノード同士が異なるコミュニティに属する場合には罰則が与えられます。 この制約項にパラメータμで重み付けして、ハミルトニアンに付加することで、マルチスライスネットワークにおける制約付きハミルトニアンを構築します。
  9. この問題を解決するため、本研究ではマルチプレックスネットワークにおいて制約付きコミュニティ抽出を適用できる対象を広げることが目的 主に大規模ネットワークと有向ネットワークに対応することを目指す これによって制約付きコミュニティ抽出をSNSや人間関係、論文の引用関係などの分析に用いることができるなど、応用範囲が広がることが期待される 大規模ネットワークに対応するために制約付与を自動化する 有向グラフで表されるネットワークに対応するために評価関数を拡張する
  10. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  11. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  12. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  13. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  14. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  15. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  16. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  17. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  18. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  19. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  20. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  21. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  22. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  23. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  24. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  25. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  26. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  27. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  28. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  29. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  30. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  31. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  32. 大規模ネットワークに対応するために、入力されたネットワークに対して何らかの戦略に則って自動的に制約を付与するプログラムの実装を目指す 制約付与の際に用いる戦略としては、先行研究である仲田らがおこなった制約付きコミュニティ抽出の実験で用いられたものを中心に検討する boundary、hub、betweenness、deltaHなど
  33. 村田研究室の大澤です. 動的ネットワークにおける影響最大化の研究について発表します.
  34. まず,研究背景から説明します.
  35. インフルエンザなどの感染症や,噂や口コミなどの情報が人々の間に広がっていく現象は,ネットワーク上の情報拡散として表現することができます. ネットワーク上の情報拡散の性質の一つとして,拡散が始まるノード集合が変わると,拡散の規模も大きく変わることが挙げられます. もし,情報を最も広く拡散するノード集合を見つけることができれば,病気の感染拡大を防止したり,効率的に口コミマーケティングを行うのに役に立ちます.
  36. 最も情報を広く拡散できるノード集合を見つける問題は,影響最大化問題として定式化されています. 影響最大化問題は,ネットワーク構造,情報拡散モデル,ノード数kを入力として,情報を最も広く拡散できる,大きさkのノード集合を出力する問題です. 影響最大化はNP-Hardであることが証明されています. そのため,多くの近似解法が提案されていますが,これらの近似解法はほとんど静的ネットワークを対象としています. 一方で,現実世界のネットワークは動的,つまり,時間の経過に伴って構造が変化するため,動的ネットワークを対象とした手法の開発が求められています.
  37. 動的ネットワーク向けの既存手法には,大きく分けて中心性ベースの手法と,Monte-Carloシミュレーションベースの手法があります. 詳細は後ほど説明しますが,中心性ベースの手法は高速ですが低精度,MCSベースの手法は高精度ですが低速で,速度と精度を両立した手法がまだありません.
  38. そこで本研究では,動的ネットワーにおける影響最大化問題の新しい近似手法を提案します. 提案手法は,貪欲なアルゴリズムで,ノード集合の拡散力を,高速なヒューリスティックを用いて近似するものです. この新しいヒューリスティックによって,MCSベースほどではありませんが,高い精度を保ちつつ,影響最大化問題を高速に解くことができるようになりました.
  39. 次に関連研究について説明します.
  40. 影響最大化問題を解くには、ネットワーク上をどのように情報が広がるかを定義する必要があります。 その定義を与えるものが情報拡散モデルです。 本研究では,情報拡散モデルとして代表的なSIモデルを考えます. SIモデルでは,ノードは2つの状態,SかIのどちらかに割り当てられます. 状態Sは,情報を持っていない状態,状態Iは,情報を持っている状態を表しています. ここにある時刻3つのネットワークにおいて,SIモデルによる情報拡散の例を考えてみます. 最初の時刻では,シード集合と呼ばれる集合に属するノードのみが状態Iであり,他のノードはすべて状態Sです. 状態Iのノードが状態Sのノードと隣接した時に,状態Sのノードは次の時刻において,感染率と呼ばれる確率λで状態Iになります. ここで、一度状態Iになったノードはその後状態Sに戻ることはなく、情報を拡散する機会を与えられ続けます。 この操作を時刻1から最終時刻まで繰り返し,最終時刻に達したら情報拡散を終了します. ここで,SIモデルにおけるノード集合Uの拡散力σ(U)は,情報拡散終了時のIノード数の期待値として定義します. 影響最大化問題はすなわち,σ(U)を最大化する大きさkの集合Uを見つける問題です.
  41. 次に,動的ネットワーク向けの既存手法について説明します. 中心性ベースの手法は,ノードの中心性が最も高いk個のノードを出力する手法で,高速ですが低精度です. 精度が低い理由は,拡散先に重複が多いノードを複数選んでしまうからです.
  42. この問題点を詳しく見るために,このネットワークから中心性が最も高い2つのノードを選ぶことを考えてみます.
  43. このネットワークで中心性が最も高いノードはBとDですが,この2つのノードは情報を拡散できる集合が全く同じ{A,B,C,D,E}なので,Dに加えてBを選んでも拡散力が大きく増加しません.
  44. この場合,Dに加えてFを選べば情報を広く拡散できますが,そのことを中心性の情報だけから判断することはできません.
  45. 次にMCSベースの手法について説明します. MCSベースの手法は,空のノード集合Sから始めて,拡散力の近似の増分が最大となるノードを順次Sに追加していく貪欲なアルゴリズムで,高精度ですが低速です. 低速な理由は,拡散力の近似計算の計算コストが膨大だからです. 拡散力σの厳密な計算は#P-Hardなので、何らかの近似が必要ですが、MCSベースの近似では時間がかかります。
  46. MCSベースの手法では,拡散力σを近似するために,R回の情報拡散シミュレーションを行い、拡散規模の平均をσの近似値とします. 例えば,R=3とすると,1回目のシミュレーションの結果がIノード数2,2回目が4,3回目が3だったとすると,これらの平均がσの近似値となります. ここで、大規模なネットワークにおいてσを精度よく求めるためにはRを大きくする必要があります。 この何回もシミュレーションを繰り返すことが速度低下の原因になっています.
  47. 次に,提案手法について説明します
  48. 提案手法のアルゴリズムは基本的にはMCSと同じ貪欲なものですが,σの近似手法が異なります.
  49. 提案手法によるσの近似方法を説明します. まず,各ノードが各時刻において状態Iである確率の近似を考えます. これは,最初の時刻では,シードに属すれば1,そうでなければ0で,この時点では厳密な確率と一致します. その後,各時刻について,各ノードの確率をこの式で更新します. この式は,各ノードの確率間が互いに独立であると仮定した時に得られる確率です. 最終時刻の確率が求まったら,その確率を足し合わせることでσの近似値としています.
  50. 提案手法による近似を,厳密計算と比較してみます. ここで,ノードAがシードであり,時刻5におけるFの確率を求めたいとします. エッジの数字はエッジが出現する時刻を表しています。 Fの確率を求めるためには,前の時刻における隣接ノード,CとEの同時確率分布を求める必要があります. しかし,シードノードからの経路上にあるノードは互いに依存しているため,厳密な同時確率分布を求めるためには,AからFの経路を列挙して,依存関係を調べて、その依存関係を加味したうえで同時確率を求める必要があり、計算コストが膨大になります. ここで,提案手法では,各ノードの確率が独立であると仮定します. この仮定により,同時確率を各ノードの確率の積で表すことができるので,隣接ノードだけ見ればよく,高速に計算が終わります。
  51. MCSベースの近似手法と計算量を比較すると、MCSベースの手法ではエッジ数×Rの時間がかかるのに対して、提案手法はエッジ数の計算量だけですみます。 提案手法は、MCSのように情報拡散シミュレーションを何回も実行しないで済むので高速です。
  52. 実験について説明します.
  53. 提案手法との比較対象に使うのは,中心性が高い順に選ぶ手法と,MCSベースの手法です. 中心性ベースの手法で使う中心性には,closeness中心性とbroadcast中心性を使います. MCSベースの手法では,σの近似に使うRの値を1,000とします. 評価指標には,各手法が選んだノード集合の拡散力を使います. 影響最大化問題は拡散力の高いノード集合を見つける問題なので,この値が高いほど手法の精度は良いと言えます. 実験には,ここに示す5つのネットワークを用います.
  54. 影響最大化問題のパラメータ設定として、感染率を固定してkを変化させるパターンと、感染率を変化させてkを固定するパターンの、2通りのパラメータ設定を行いました。
  55. ここで,ネットワークにおける情報の広がりやすさを調べるために,シードノードがノード一つだけの時の拡散力を全ノードについて計算して,その分布を求めて情報の広がりやすさを判断します.
  56. ネットワークにおける情報の広がりやすさを調べるために,ネットワークにおける各ノードの拡散力のヒストグラムを求めた. 結果はこのチャートになっていて横軸がノードの拡散力,縦軸がノード数になっています. 例えばここは,λが0.05の時に,自分一人で情報を60%のノードに拡散できるノードが20ノードあることを示しています.