Weitere ähnliche Inhalte Ähnlich wie オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門 (20) Mehr von Kouji Kozaki (15) Kürzlich hochgeladen (12) オントロジー工学に基づくセマンティック技術(2)ナレッジグラフ入門2. 自己紹介
◼ コミュニティ活動
2019/6/5 2
研究成果として
公開中のソフト
◼ 古崎(こざき)晃司@koujikozaki
◼ 所属:大阪電気通信大学・教授
◼ 専門:オントロジー工学(情報科学・人工知能)
=“かしこい”コンピュータ(ソフトウェア)を作る
→学問にとどまらず,
世の中で使われる技術を作りたい
LOD技術普及の
ためのコンテスト
(2011~)
シビックテック
(市民×IT)活動
セマンティックウェブとオントロジー(SWO)研究会
の特別企画(2011~)
4. 講義概要
◼ セマンティックウェブ(Semantic Web)
◼ ナレッジグラフ(Knowledge Graph/知識グラフ)
◼ Linked Data/Linked Open Data(LOD)
◼ ナレッジグラフ/Linked Data/LODの利用技術
◼ ナレッジグラフの構築・利用例
◼ ナレッジグラフ推論チャレンジ
◼ 医療分野での応用事例~疾患コンパス~
2019/6/5 4
6. Webの基本的仕組み
◼ Webを構成する基本的な技術
◼ URL(Uniform Resource Locator)
◼ Web(インターネット)上の文書の置き場所を表す
◼ 現在は,URLの拡張版であるURI(Uniform Resource Identifier)
および,IRI(Internationalized Resource Identifier)が使用される
◼ HTML(HyperText Markup Language)
◼ Webページを記述するためのマークアップ言語.
◼ ハイパーリンク(hyperlink)により,他のWebページとの関連(リンク)
を記述することができる.
◼ (従来の)Webの本質
◼ URLで示された文書をハイパーリンクを用いて関連づけることにより,リン
クを辿って,世界中の(インターネットに接続された)コンピュータで公開さ
れた文章を,自由に閲覧(ブラウジング)できる.
◼ 誰でも,自由に情報を発信できる.
2019/6/5 6
7. 従来のWebから
セマンティック(Semantic Web)へ
◼ 従来のWeb
◼ 「人が読む(理解する)」ためのWeb
◼ 文書共有のためのWeb
◼ 人が「読みやすい」(=見た目)が大事
◼ セマンティックウェブ(Semantic Web)
◼ 「コンピュータが理解(意味処理)可能」
なWeb
◼ データのためのWeb
◼ データの「処理がしやすい」ことが大事
◼ データの「意味が理解できる(処理できる)」
2019/6/5 7
8. 従来のWebの仕組み:HTMLの例
2019/6/5 8
閲覧中のWebページのURL
<h3><a href=“http://headlines.yahoo.co.jp/hl?a=20130528-00000501-fsi-
bus_all”>デジタル家電価格に底入れの兆し 「数から質へ」競争も変化</a>
</h3>
デジタル家電の価格下落に底入れの兆しが出てきた。「値段が張っても機能性
を重視する消費者が増えてきた」(アナリスト)ことが要因だ。価格競争に苦しんで
きた電機メーカーにとっては吉報といえそうだ。夏商戦で各社はフルハイビジョンの
約4倍の解像度の「4K」に対応した次世代テレビなどを投入予定で、需要の掘り起
こしに躍起になっている。 (SankeiBiz) <br>
<a href="http://headlines.yahoo.co.jp/hl?a=20130528-00000501-fsi-
bus_all">[記事全文]</a><br>
<br>
◇価格低下から転換?<br>
・ <a href="http://headlines.yahoo.co.jp/hl?a=20130429-00000005-san-
bus_all">電機大手どうなる「通信簿」 脱デジタル家電で明暗</a> - 産経新聞
(4月29日) <br>
・ <a href="http://headlines.yahoo.co.jp/hl?a=20130416-00000004-rbb-
sci">デジタル家電が値上がり傾向、背景に“アベノミクス”と“円安”あり? カカクコ
ム調べ</a> - RBB TODAY(4月16日) <br>
ソースファイル(HTML)では,文書に「タ
グ」を付与することで様々な情報を付与
ハイパーリンクを表すタグ
文字サイズを
表すタグ
改行を表すタグ
9. Semantic Webの概要
◼ Semantic Webとは
◼ 従来の「人が読む(理解する)ためのWeb」から,
「コンピュータが理解(意味処理)可能なWeb」へ
◼ 技術的には,
◼ Web上のドキュメントにコンピュータによる意味処理に用
いる「メタデータ」を付与する(タグを付ける)」
◼ その際に用いるフォーマットが「RDF」
◼ メタデータに用いる語彙を定義するのが「オントロジー」
(RDFSやOWLで書かれる)
◼ RDFで書かれたメタデータを検索するためのクエリー言
語が「SPARQL」
◼ ...
2019/6/5 9
「データの意味を表す」メタデータ(タグ)
10. Layer Cake
◼ Semantic Webに必要な要素技術を階層状に表したもの
2019/6/5 10
http://www.w3.org/2001/09/06-ecdl/slide17-0.html http://www.dajobe.org/talks/200905-redland/
11. Semantic Webの研究動向の変遷
◼ 研究動向(流行トピック)の変遷
◼ 語彙(オントロジー)に基づいたメタデータによる意味処理の実現
◼ 誰がメタデータを?→Web2.0的共同構築
◼ データ(インスタンス)のLinkの重視:Linked Data
2019/6/5 11
リ
ッ
チ
な
意
味
記
述
スケーラビリティ(大量データ)
Semantic Web
(の理想)
すぐに使えるタグを(RSS,FOAF)
SNS利用・Web2.0
DBPedia
× Linked Data
2004-2006
2007
2008-
Knowledge Graph
2012-
13. Google Knowledge Graph
2019/6/5 13
• Knowledge Graph (知識グラフ)
と呼ばれる,知識の“つながり”を
活用した様々なサービスの開発が,
Google,Yahoo!,Facebookなど多
くのネット企業で進められている.
→Google Knowledge Graphは
2012年サービス開始
https://www.youtube.com/watch?v=mmQl6VGvX-c
15. ナレッジグラフの技術基盤
◼ 知識獲得
◼ どのようにして「知識」を集めるか?
◼ Webを知識源とした知識収集
例)Webマイニング,セマンティックWeb
◼ 知識表現
◼ あつめた「知識」をどのようにコンピュータ上で表現
するか?
◼ グラフ構造=意味ネットワーク
◼ ナレッジグラフの公開
◼ Web-API
◼ Linked Data,Linked Open Data(LOD)
2019/6/5 15
16. Google Knowledge Graphの場合
◼ 情報源
◼ Freebase, Wikipediaなどのオープンな情報源
◼ Googleのサービスから得られる様々なデータ
◼ データの規模(2012時点)
◼ 5億(500 million)以上のobjects
◼ 35億(3.5 billion)以上のfacts/relationships
◼ 想定している利用目的
◼ 1. Find the right thing
◼ 2. Get the best summary
◼ 3. Go deeper and broader
2019/6/5 16
Introducing the Knowledge Graph: things, not strings
May 16, 2012,https://googleblog.blogspot.jp/2012/05/introduci
ng-knowledge-graph-things-not.html より
20. Linked Data(2007頃-)
◼ Linked Data:Web上のデータを,つなぐ(linkする)ことで,新しい価値
を生み出そうとする取り組み.Webの創始者Tim Berners-Lee氏が提唱
※ Linked Open Data(LOD):オープンな形で公開されたLinked Data
2019/6/5 20
http://linkeddata.org/
“Webの仕組み”に基づいてデータを公開することで,
Web上に公開された膨大なデータを
統合した1つの知識ベースとして利用可能にする.
22. Webの仕組み→Linked Data
◼ URLを指定することで,Webページにアクセス
◼ 例) http://www.osakac.ac.jp 「大阪電気通信大学」の
ページ
◼ URLは,世界中“すべて”のWebページの場所(ID)
を一意に特定できる仕組み
◼ ハイパーリンクにより,Webページを“つなげる”
◼ リンク先のURLを指定することで,好きなWebページ
と自由に“リンク”できる
◼ リンクを辿って,様々な情報にたどり着ける
◼ リンクを解析による様々なビジネス
◼ 例)Googleなどの検索エンジン
2019/6/5 22
データ
データ
Linked Data
Webと同じ仕組みでデータを“公開”し,
相互に“つなぐ”(リンクする)
URI・IRI データ(モノ・コト)
データ(モノ・コト)
24. Linked Data (RDF)の表現例
2019/6/5 24
日本
大阪電気
通信大学
国
1924
設立
寝屋川市
129613133
(VIAF)
国立国会図書館典拠ID
位置する行政区
http://www.wikidata.org/entity/Q7105556 というIRIから得られ
る情報の一部(Wikidataより)
00370288
(Web NDL
Authorities)
skos:exactMatch
大阪電気通信大学標目
リソース:
IRIで表される事物
プロパティ:
リソース間(もしくはリ
ソースとリテラル間)の
関係を表す
リテラル
:文字列
主語 述語 目的語
トリプル(3つ組み)
①RDFは「トリプルの組み合わせ」
で表される
②目的語が他のリソースのとき,トリプル
を辿って更なる情報が得られる
25. Linked Data (RDF)の表現例
2019/6/5 25
http://www.wikidata.
org/entity/Q17
http://www.wikidata.
org/entity/Q7105556
https://www.wikidata.org/entry/P17 1924
https://www.wikidata.org/entry/P571
http://www.wikidata.
org/entity/Q389633
http://viaf.org/
viaf/129613133
https://www.wikidata.org/entry/P349
https://www.wikidata.org/entry/P131
http://id.ndl.go.jp/auth
/ndlna/00296951
http://www.w3.org/2004/02/skos/core#exactMatch
大阪電気通信大学
http://www.w3.org/2008/05/skos-xl#prefLabel
すべてのリソースおよび
プロパティはIRI用いて
表される
26. Linked Data (RDF)の表現例
2019/6/5 26
http://www.wikidata.
org/entity/Q17
http://www.wikidata.
org/entity/Q7105556
https://www.wikidata.org/entry/P17 1924
https://www.wikidata.org/entry/P571
http://www.wikidata.
org/entity/Q389633
http://viaf.org/
viaf/129613133
https://www.wikidata.org/entry/P349
https://www.wikidata.org/entry/P131
http://id.ndl.go.jp/auth
/ndlna/00296951
http://www.w3.org/2004/02/skos/core#exactMatch
大阪電気通信大学
http://www.w3.org/2008/05/skos-xl#prefLabel
すべてのリソースおよび
プロパティはIRI用いて
表される
部分的に同じよ
うなIRIが多数,
用いられる
wd:
wdt:
wdt:
wdt:
wdt:
wd:
PREFIX(接頭語)
で置き換える
wd:
29. RDFSとOWL
◼ セマンティックウェブにおいてオントロジー記述に用いら
れる言語
◼ RDFS(RDF Schema)
◼ クラスおよびプロパティのis-a階層
◼ プロパティの定義域(domain)/値域(range):主語/目的語と
なれるリソースの種類
◼ OWL(Web Ontology Language)
◼ あるクラスの持つプロパティの値域に関する制約
→述語論理における全称記号(∀),存在記号(∃)に相当する表現
◼ あるクラスが持つプロパティの数に関する制約
◼ プロパティの推移律(例:「子孫の子孫」は「子孫」)
◼ ..など,より詳細なオントロジーの記述が可能
2019/6/5 29
30. Linked Dataの公開方法
◼ 参照解決可能なhttp IRIs(URL,URI)を用いた公開
◼ IRIでデータにアクセスが可能
◼ 通常のWebページと同様に,データのURIを用いて
「つながり」を辿ることが出来る
=システムによる処理(リンク解析等)が可能
◼ SPARQLエンドポイントの公開
◼ RDF用のクエリ言語SPARQLにより検索可能なAPIを公開
◼ クエリによるデータ検索・抽出が可能
◼ RDFファイルのダンプの公開
◼ 全データをダウンロードできる形で公開
◼ ダウロードしたファイルをRDFパーサー,RDF-DBなどの
ツールを用いて処理可能
2019/6/5 30
31. Linked Open Data (LOD)
Linked Open Data
=Linked Data + Open Data(オープンデータ)
=Linked Dataとして公開されたOpen Data
2019/6/5 31
32. オープンデータとは
◼ オープンデータとは
◼ 誰でも自由に使える形で公開されているデータ
◼ オープンデータの定義(Open Definition)
◼ “Open data and content can be freely used, modified,
and shared by anyone for any purpose”
(http://opendefinition.org/)
◼ オープンデータでない例
◼ 改変や再配布が禁止されている
◼ 利用者を限定 例)学術機関のみ,個人利用不可
◼ 利用目的を限定 例)商用利用不可,コンテスト応募目的のみ
2019/6/5 32
35. TED Talk by Tim Berrners Lee (1) 2009/2
~Raw Data Now!~
http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html
データを抱え込むのでは無く,
誰もが使えるように(オープンに)
することを呼びかける
=Raw Data Now!
(生データをすぐに!)
352018/9/25
36. TED Talk by Tim Berrners Lee (1) 2010/2
~LODの活用事例~
http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html
オープンデータの活用事例を紹介
・白人/黒人の住む家と水道管の整備状況
の相関を見える化→裁判で勝利へ
・Where does my money go?
(税金はどこへ行った?)
(英国) http://wheredoesmymoneygo.org/
(横浜市) http://spending.jp/
362018/9/25
49. LOD/Linked Dataの例
Web NDL Authorities
2019/6/5 49
https://id.ndl.go.jp/auth/ndla/
・SPARQLエンドポイントあり
・参照解決可能
.rdf .ttl .json
55. まとめ:
Linked Open Dataの基盤技術
◼ Linked Dataは,Web上で公開されたデータを
「つなぐ」仕組み
◼ URL(IRI)を用いたグローバルに一意なデータの識別
◼ データ間の“リンク”
◼ Webと同じ仕組みを用いたデータのアクセス
◼ IRIによる直接アクセス
◼ SPARQLエンドポイント(API)によるアクセス
◼ これらの仕組みが標準化されているため,
データの共有が容易に行える.
◼ オープンに公開されているLinked Data(LOD)を利用す
ることで,
-データ構築コストの削減,
-データへのセマンティクスの付与 が可能に!
2019/6/5 55
57. RDFを扱うための技術・ツール
◼ SPARQL
◼ RDFデータベース用のクエリ言語
◼ SPARQLハンズオン資料
https://github.com/KnowledgeGraphJapan/LODws1st/tree/m
aster/SPARQL-Lec
◼ RDF用のライブラリ
◼ https://github.com/KnowledgeGraphJapan/sparql-library-
examples にプログラム言語でのサンプルあり
◼ Javaを使うなら,Apache Jenaがおススメ
◼ OWL形式のファイルを開くには
◼ protégéなどのオントロジーエディタを使用(RDFファイルも開ける)
https://protege.stanford.edu/
◼ RDFファイルをDBに格納して使用するには
◼ FusekiやVirtuosoなどのRDF-DBを使用
◼ チュートリアル資料
◼ Jena,Fusekiの簡単な使用方法,SPARQLクエリの書き方など
https://github.com/KnowledgeGraphJapan/LODws2nd
2019/6/5 57
58. Linked Dataの利用形態
◼ Linked Dataから知識を検索/抽出
◼ 事実情報の取得
◼ 解析に用いるデータ(一覧)の取得
◼ 複数のLinked Dataの統合(マッシュアップ)
◼ Linked Dataを用いたメタデータの付与
◼ 文献等のメタデータとして利用
◼ 自然言語文へのアノテーションでの利用
2019/6/5 58
60. 例)Bpedia/Wikidataからの解析用
のデータ取得
◼ 簡単なランキングデータの取得
◼ 例)都道府県毎の「〇〇」の数
◼ 政治家(出生地)...1位は東京
◼ 「??」 ...1位は大阪
◼ 簡単な場所情報の取得
◼ 位置情報データの一覧
◼ 例:大阪市内の位置情報
http://lodosaka.jp/tool/wikidataMap/
◼ 例:東京都内の位置情報
http://lodosaka.jp/tool/wikidataMapTokyo/
2019/6/5 60
(解説)Qiita:DBpediaを使った都道府県別ランキング
http://qiita.com/koujikozaki/items/439fa7ce3e28b738fe10
61. DBpedia Japaneseの検索例
◼ 「各都道府県で生まれた政治家の数」を調べる
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX dbpedia-ja: <http://ja.dbpedia.org/resource/>
PREFIX category-ja: <http://ja.dbpedia.org/resource/Category:>
select distinct ?pref (count(?s) AS ?c) where {
?pref rdf:type dbpedia-owl:Place.
?pref dbpedia-owl:wikiPageWikiLink category-ja:日本の都道府県.
?s rdf:type dbpedia-owl:Politician;
dbpedia-owl:birthPlace ?pref.
}GROUP BY ?pref
ORDER BY ?c
2019/6/5 61
(解説)Qiita:DBpediaを使った都道府県別ランキング
http://qiita.com/koujikozaki/items/439fa7ce3e28b738fe10
62. DBpedia Japaneseの検索例
◼ 「各都道府県で生まれた芸人の数」を調べる
PREFIX rdfs: <http://www.w3.org/2000/01/rdf-schema#>
PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>
PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
PREFIX dbpedia-ja: <http://ja.dbpedia.org/resource/>
PREFIX category-ja: <http://ja.dbpedia.org/resource/Category:>
select distinct ?pref (count(?s) AS ?c) where {
?pref rdf:type dbpedia-owl:Place.
?pref dbpedia-owl:wikiPageWikiLink category-ja:日本の都道府県.
?s rdf:type dbpedia-owl:Comedian;
dbpedia-owl:birthPlace ?pref.
}GROUP BY ?pref
ORDER BY ?c
2019/6/5 62
ここを,
Politician→Comedian
に変えるだけ!
63. Wikidataを用いたランキング
◼ 「日本の政治家の出身大学」ランキング
→実行結果
select ?univ ?univl (count(?s) As ?c) where{
?univ wdt:P31/wdt:P279* wd:Q3918. #大学の一覧取得
?s wdt:P27 wd:Q17; #国籍=日本
wdt:P106 wd:Q82955; #職業=政治家
wdt:P69 ?univ. #出身大学
OPTIONAL{
?s rdfs:label ?name. FILTER(lang(?name)="ja")
?univ rdfs:label ?univl . FILTER (lang(?univl) = "ja") .
}
}GROUP BY ?univ ?univl
ORDER BY DESC(?c)
LIMIT 100
2019/6/5 63
政治家の出身大学ランキング
https://qiita.com/koujikozaki/it
ems/a049e2ac1051e0e43be6
64. Wikidataを用いたランキング
◼ 「日本の総理大臣の出身大学」ランキング
→実行結果
select ?univ ?univl (count(?s) As ?c) where{
?univ wdt:P31/wdt:P279* wd:Q3918. #大学の一覧取得
?s wdt:P27 wd:Q17; #国籍=日本
wdt:P106 wd:Q82955; #職業=政治家
wdt:P39 wd:Q274948; #公職=内閣総理大臣
wdt:P69 ?univ. #出身大学
OPTIONAL{
?s rdfs:label ?name. FILTER(lang(?name)="ja")
?univ rdfs:label ?univl . FILTER (lang(?univl) = "ja") .
}
}GROUP BY ?univ ?univl
ORDER BY DESC(?c)
LIMIT 100
2019/6/5 64
政治家の出身大学ランキング
https://qiita.com/koujikozaki/it
ems/a049e2ac1051e0e43be6
この1行を
追加する
66. SPARQLによるRDFの検索
◼ SPARQL
◼ RDFデータに対するクエリ言語
◼ 「指定したグラフ構造」に一致するトリプルを検索する
◼ 最も基本的な検索
select ?s ?p ?o
where {
?s ?p ?o .
}
LIMIT 100
↑取得する数の制限
←検索するグラフのパターン
←返す要素
このパターンを変
えることで,欲しい
データを取得する
2019/6/5
「.」(ピリオド)
を忘れない
?x(x:任意の文字列)は変数を表す
66
73. 例2-1:複数の述語を指定して,
目的語を取得する
◼ 「大阪大学」の“本部所在地”と“創立日”取得する
PREFIX wdt: <http://www.wikidata.org/prop/direct/>
PREFIX wd: <http://www.wikidata.org/entity/>
select ?o1 ?o1Label ?o2
where {
wd:Q651233 wdt:P159 ?o1.
wd:Q651233 wdt:P571 ?o2.
SERVICE wikibase:label { bd:serviceParam wikibase:language
"[AUTO_LANGUAGE],ja". }
}
2019/6/5
本部所在地
73
創立日
クエリを複数書くと,AND
条件として検索される
84. CC-BY4.0:人工知能学会 セマンティクWebとオントロジー(SWO)研究会
第1回:開催スケジュール
2017/02/26 推論チャレンジ(仮称)の構想開始
in 第41回SWO研究会@志賀島
2017/11/25 第1回公開WS:推論チャレンジ(仮称)開催予告
in 第43回SWO研究会@人工知能学会合同研究会2017
2017/12/19 第2回公開WS:スキーマ検討会
2018/02/28 第3回公開WS:スキーマ設計会
2018/03/18 第4回公開WS:ナレッジグラフの構築テスト
in 第44回SWO研究会@五島市(合宿)併設ワークショップ
2018/04/23 第5回公開WS:「推論チャレンジ」ワークショップ
2018/06/05 ナレッジグラフ公開・チャレンジ開始
2018/08/07 応募に向けた技術勉強会
2018/10/18:応募に向けた技術勉強会(2回目)
2018/10/30: チャレンジ応募締切(11/11まで延長)
2018/11/25: 発表会&授賞式
in 第45回SWO研究会@淡路島(JIST2018併設イベント)
84
構想9カ月
開催準備
6カ月
106. 第2回推論チャレンジ-開催スケジュール-
2019年3-5月
➢ ナレッジグラフ構築
➢ 応募要項等の検討・準備
➢ 第1回開催報告:人工知能学会誌5月号掲載(「AI書庫」で無料閲覧可)
2019年6月4日 応募開始
➢ 人工知能学会全国大会(JSAI2019)@新潟にて,
第1回開催報告&第2回応募開始の宣言
➢ 対象とするナレッジグラフについては,調整中のものを仮公開.
2019年7月 改良版のナレッジグラフを公開
2019年7-9月 ワークショップ開催(企画検討中)
2019年10月末 応募締切
2019年11月末-12月 最終選考会&授賞式
➢ 人工知能学会合同研究会(11月下旬)@慶応大日吉キャンパス
内での実施を検討中
106
114. 臨床医学オントロジーを用いた
応用システム開発の枠組み
◼ 「法造」の拡張機能としての開発
◼ Is-a階層の動的生成
◼ OWLなど他形式のオントロジー
への変換 → 他システムで利用
◼ 「法造API」を用いた開発
◼ クライアントシステム
◼ 疾患連鎖編集ツール,因果連鎖探索ツール,
接続探索ツール
◼ Webシステム
◼ オントロジーWebビューア,医療知識ナビゲータ
◼ 「Linked Data技術」を用いた開発
◼ 疾患連鎖LD
:疾患オントロジーをRDF化し,Linked Dataとして公開
◼ 疾患コンパス
:疾患知識のナビゲーション
2019/6/5 114
医療知識
ナビゲーター
因果連鎖探索
ツール
疾患連鎖編集
ツール
125. 疾患連鎖LD(Linked Data)
◼ Linked Data化のメリット
◼ Linked Dataの標準仕様に準拠することで,既存の
LOD(Linked Open Data)との連携が効率的に行える.
◼ 疾患連鎖LD(Linked Data)
◼ 疾患オントロジーに含まれる「異常状態の因果連鎖」
に基づいた疾患定義と,その患者に典型的に見られ
る異常状態(原因や症状)の因果連鎖をLinked Data
化したもの.
◼ 各疾患がどのような原因で発症し,どのような症状を引き起
こすか?
◼ ある異常がどのような因果連鎖を経て,どのような状態を引
き起こし,どのような疾患となるか? …など
2019/6/5 125
得
ら
れ
る
情
報
126. 疾患連鎖LDのデータモデル
◼ 「疾患オントロジー」から
異常状態の因果連鎖」に
関する情報のみを抽出し
てRDF化
◼ 「クラス(概念)レベル」の
情報も,Linked Dataとし
て利用する際の利便性を
考え,全てインスタンス
(RDFリソース)に変換.
2019/6/5 126
異常状態1 異常状態2
異常状態3
異常状態4 異常状態5 異常状態6
「疾患A」の
疾患定義連鎖
「疾患B」の疾患派生連鎖
「疾患A」の
疾患派生連鎖
「疾患B」の疾患定義連鎖
異常状態を
表すノード
因果関係を
表すリンク
凡例
疾患A
異常状態1 異常状態2 異常状態3
hasCoreState
hasCoreState
hasDerivedState
疾患B
異常状態4 異常状態5 異常状態6
hasCoreState hasDerivedState
hasDerivedState
hasResult
hasCause
hasResult
hasCause
hasResult
hasCause
hasResult
hasCause
hasResult hasCause
subDiseaseOf
Disease typeのインスタンス
Abnormal_State typeのインスタンス
凡例 ◼ 疾患連鎖の概念定義を構成し
ている全情報が,SPARQLクエリ
(=RDF用の問い合わせ言語)
を繰り返すことで,直感的に取
得できるように設計.
128. SPARQLクエリの例
◼ Ex.1) すべての異常状態を取得
Select ?abn
Where { ?abn rdf:type don’t:Abnormal_State }
◼ Ex.2) 異常状態<abn_id>の全原因を取得
select ?o
where {<abn_id> dont:hasCause* ?o }
◼ Ex.3 異常状態<abn_id>を定義連鎖に含む疾患を取得
select ?dis
where {?dis rdf:type dont:Disease ;
dont:hasCoreState <abn_id>}
2019/6/5 128
* “dont:” 疾患連鎖LDのURLを示すprefix
**<abn_id> 特定の異常状態のID
比較的簡単なクエリで,必要な情報の取得が利用可能
129. まとめ
:疾患オントロジーのRDF化
◼ 疾患コンパス
◼ 疾患オントロジーをLinked Data化した「疾患連鎖LD」を他
のデータセットとつなげることで「疾患に関する様々な情報
を統合的に閲覧」できるWebサービス.
◼ 現状の機能
◼ DBpedia(日本語/英語)を介した,疾患の概要表示,ICD,
Meshなど既存コード体系へのリンク
◼ DBCLSが提供しているBodyPart3Dとの連携による,疾患
影響範囲(関連する部位)の3D画像を表示
◼ 異常状態オントロジー/汎用因果連鎖のViewerとの連携
◼ 公開ページ
◼ http://lodc.med-ontology.jp/
2019/6/5 129
130. まとめ
◼ ナレッジグラフ
◼ “知識のつながり”をグラフ構造で表すことで,さまざまな知識
システムの知識基盤を与える.
◼ Linked Data/オントロジーはナレッジグラフ構築に必要な技術.
◼ Linked Data/オントロジー自体もナレッジグラフの一種.
◼ 参考資料 http://knowledge-graph.jp/ (鋭意作成中)
◼ Linked Data/Linked Open Data(LOD)
◼ Webの仕組みを用いて“データのつながり”を公開する仕組み
◼ すでに,多くのLODが公開されている!
◼ まずは,WikidataやDBpediaから使ってみましょう!
◼ ナレッジグラフ推論チャレンジ
◼ ナレッジグラフ利用のテストベッドとして,ご活用ください!
2019/6/5 130
131. 参考資料
◼ SPARQL仕様(W3Cのドキュメント)
◼ SPARQL 1.1 Query Language
https://www.w3.org/TR/sparql11-query/
◼ SPARQLの解説本
◼ オープンデータ時代の標準Web API SPARQL
http://sparqlbook.jp/
◼ SPARQL入門スライド(by古崎)
◼ DBpedia Japaneseを例にした解説
https://www.slideshare.net/KoujiKozaki/4lod
◼ 大阪市のオープンデータを例にした解説
https://www.slideshare.net/KoujiKozaki/apisparql
◼ 解説記事
◼ DBpediaを使った都道府県別ランキング
http://bit.ly/2oDPl0Q
◼ Wikidataを使った日本の政治家の出身大学ランキング
http://bit.ly/2PBt8fn
2019/6/5 131
http://sparqlbook.jp/より
132. 参考資料
◼ 人工知能学会セマンティックウェブとオントロジー(SWO)研究会
◼ http://www.sigswo.org/ 研究会資料公開あり
◼ ISWCサーベイ
◼ 分野のトップカンファレンスISWCの発表論文をSWO研究会有志でサーベイし,
日本語スライドにまとめた資料
◼ ISWC2018サーベイ
https://github.com/sigswo/files/raw/master/SIG-SWO-047-ISWC2018-
Survey.pdf
◼ ISWC2017サーベイ http://id.nii.ac.jp/1004/00009109/
◼ ISWC2016サーベイ http://id.nii.ac.jp/1004/00008619/
◼ 主な関連国際会議
◼ International Semantic Web Conference (ISWC)
http://swsa.semanticweb.org/content/international-semantic-web-
conference-iswc
◼ ESWC(Extended Semantic Web Conference)
◼ The Conferences on Formal Ontology in Information Systems (FOIS)
◼ KEOD(International Joint Conference on Knowledge Discovery,
Knowledge Engineering and Knowledge Management)
http://www.keod.ic3k.org/websites.aspx
2019/6/5 132
133. 参考資料:関連ジャーナル
オントロジー・ナレッジグラフ関連の発表がある主なジャーナル
◼ Journal of Web Semantics
◼ https://www.journals.elsevier.com/journal-of-web-semantics
◼ Semantic Web Journal
◼ http://www.semantic-web-journal.net/
◼ Applied Ontology
◼ https://www.iospress.nl/journal/applied-ontology/
◼ Journal of Biomedical Semantics
◼ https://jbiomedsem.biomedcentral.com/
◼ 人工知能学会論文誌
◼ https://www.jstage.jst.go.jp/browse/tjsai/-char/ja/
2019/6/5 133