3. 0. Information
• Author
-Cheng Li, Jiaqi Ma, Xiaoxiao Guo, Qiaozhu Mei
• Submitted on 16 Nov 2016
• Society
-WWW 2017 accepted
• About
-Social and Information Networks
• arXiv: https://arxiv.org/abs/1611.05373
4. 1. Introduction
information diffusion
• For types of information diffusion
1. herd behavior
Activated because many people are activated
2. information cascades
Activated because neighborhood is activated
3. diffusion of innovation
Analyze how innovation spreads from a bird’s eye view
4. Epidemics
Object spread randomly like epidemic
5. 1. Introduction
What is information cascades?
• For types of information diffusion
1. herd behavior
Activated because many people are activated
2. information cascades
Activated because neighborhood is activated
3. diffusion of innovation
Analyze how innovation spreads from a bird’s eye view
4. Epidemics
Object spread randomly like epidemic
6. 1. Introduction
motivation of study
• Most modern social network platforms are designed to facilitate fast diffusion of
information.
If feature cascade* can be predicted,
one can make wiser decisions in all scenarios.
*Cascade’s size: how many nodes are adopted
Cascade’s growth: growth rate of num of nodes
Cascade’s shape: shape of graph of adopted people
7. 1. Introduction
problems of existing methods
• Previous studies required specific features to particular platform or to the particular
type of information being diffused
=> difficult to generalize, and there is no common principle of how to design and measure
the features
Is degree the correct measure of centrality?
Which algorithm should we use to extract communities?
How accurately can we detect and measure structural holes?
How do we systematically design those ‘magical’ features?
Apply End-to-end deep learning to information cascades prediction
8. 1. Introduction
challenge of this new method
cascade
input output
Cascade growth( size )
How to design a suitable architecture to learn the representations of
graphs remains a major challenge.
9. 2. Related work
2.1 Cascade Prediction
• 既存のcascade predictionを分類すると以下のようになる
• 予測するもの
1. Classification: ある情報が拡散するかどうか
2. Regression: numeric properties of a cascade in a feature
• 入力
1. 巨視的な変数(cascade size etc)
2. ミクロな視点から見た,確率的行動と情報推移=>強い仮定が必要だったり,過剰に簡易化する必要があった
結局,既存手法はいかに良い特徴量を設計できるかによってモデルの精度が決定していた
10. 2. Related work
2.1 Learning the Representation of Graphs
• 本研究は,ネットワークの構造を学習する研究とも関連している
• 旧来型のネットワーク構造の表し方は,隣接行列などの離散表現で表現していた.
• 近年は,ノードを高次元空間のベクトルで表現したり,サブグラフの構造を学習することを試
みる研究が多い=>DeepWalk[29]
• 他の似たような研究領域では,グラフカーネルがある
• グラフ同士の類似度を計算する
• いつくかの研究[40, 27]では,deep learningの手法を用いている
• グラフカーネルの研究は,グラフの構造を認知する研究であり,ノード固有の情報を取り扱う
ことには向いていない
• グラフ構造を画像として取り扱い,CNNを用いる手法もある
• これらも,ノード固有の情報を取り扱うことに向いていない
• 近年の研究[37]では,ツイートにおいて特定のユーザーを言及することで,爆発的に拡
散することも確認されており,ユーザー固有の情報を扱うことは重要
29. 5. EXPERIMENT RESULTS
5.4 Interpreting the Representations
• Deep learningを使って精度を上げたのは良いが,ネットワーク分野において,意味解釈
をする必要がる.
• いくつかの特徴量をハンドメイドして,学習した特徴量との類似性に注目して可視化
• DeepCasがcascadeネットワークのthe number of open, closed triangles, and the number of
communitiesといったプロパティを捉えられているだけでなく,グラフ全体の特徴量を捉えている
• Open, closed trianglesの数は予測に重要なパラメタ
• Deepcasがedgeやnodeの数だけでなく,非線形な関係を捉えていることを示している