2. 目標:関係パタンの意味の計算
• 関係抽出:エンティティ間の意味的関係の抽出
– 応用:質問応答,含意関係認識,…
• 関係パタンの意味の計算が非常に重要
– 関係パタン:エンティティ間を結ぶ統語パタン
• X increase the risk of Y,X prevent the growth of Y,…
– increase the risk of ≈ cause の計算
2
high-fat diet increases the risk of disease Cause(high-fat diet, disease)
Cephalexin reduce the risk of the bacteria Inhibit(Cephalexin, bacteria)
Pynchon is author of V. AuthorOf(Pynchon, V.)
3. 従来の関係パタンの意味獲得手法
• 関係パタンの意味を表すベクトルをコーパスから得る
– 例:ベクトル=共起する項の分布[Lin+ 01, Nakashole+ 12]
• 分布が似ている=似ている意味
3
Kafka
America
Pynchon
V.
… …
high-fatdiet
disease
smoking
cancer
…
…
X write Y 24 13 … 0 0 ...
X is author of Y 22 10 … 0 0 ...
… … … … … … ...
X cause Y 0 0 … 23 68 …
X increase the risk of Y 0 0 … 32 57 …
AuthorOf
Cause
11. 実験(学習)設定
• コーパス:ukWaC
– .ukドメインのWebページ
– 約20億単語
• 語彙:出現頻度10回以上の単語,関係パタン
– 前置詞,冠詞,数詞などは除く
– 関係パタン:動詞 or 動詞 + 名詞句 + 前置詞
• cause, take part in, increase the risk of, …
• 複数単語からなる関係パタンはReverb[Fader+ 11]で抽出
• 評価データに出現するものは除く(学習しない)
• ベクトル,行列の次元:50次元,50 * 50次元
11
12. 評価手法
• 評価の目的:複数単語からなる関係パタンの意味を計算可能か?
• データ:関係パタン間に含意関係を付与したデータ[Zeichner+ 12]
– 含意関係のペアを(擬似的に)同義のペアとする
– 関係パタンのペア数:5,409ペア
• 関係パタンをReverbの形式にすることで評価対象が予稿より増加
• 評価手法:関係パタン間のコサイン類似度でソートし,PR曲線を
描く
– 含意関係にあるペアが類似度上位になっているか?
12
パタン1 パタン2 関係パタンの
ベクトル間の
コサイン類似度
含意関係
(正例/負例)
inhibit prevent the growth of 0.7167 含意(正例)
be the part of be an essential part of 0.7166 非含意(負例)
await wait 0.7165 含意(正例)
……
15. 学習結果の行列を可視化
• haveは対角要素が強め
– 内容語の意味ベクトルをスルー(have access to, have an impact on)
– make, takeも同様の傾向が見られた(make change in, take care of)
• bringの行列は対角要素以外にも強い成分が出てくる
– bringの意味を行列に追加(bring an end to, bring a wealth of)
• reduceの行列では対角成分の筋が消えている
– 内容語の意味を変性させる(reduce the risk of)
15
16. まとめと今後の課題
• まとめ
– 関係パタンを構成要素から意味計算する手法の提案
• 意味の変性を行列で表しRNNで計算
• Skip-gramモデルにRNNを統合し行列とベクトルを同時に学習
• 未知の関係パタンについて意味を計算できる事を示した
– 意味の変性を扱うことで加法構成性よりも性能が向上する
ことを示した
• 今後の課題
– 機能的な表現,内容的な表現の区別を含めた学習
• [Socher+ 12]のように各単語に行列とベクトル両方持たせる?
– 関係パタンとして表す表現の計算もモデル化
• 一語にマップできる(すべき)表現,そうでない表現の計算
– increase the risk of ≈ cause(increase the risk ofは関係パタン)
– increase the population ofは関係パタン?
16