SlideShare ist ein Scribd-Unternehmen logo
1 von 45
Linked Open Data for ACademia
LODAC Project
-学術リソースのためのオープン・ソーシャル・セマンティックWeb基盤の構
築 -
武田英明
takeda@nii.ac.jp
国立情報学研究所
Linked Dataでつくる新しいデータの世界
情報・システム研究機構 新領域融合研究センター「異分野共有資源共有・協働基盤の構築」プロジェクト 中間報告会
2012年12月10日
Linked Open Data for ACademia
本プロジェクトの狙い
• Linked Dataによるデータ共有を実現する仕組
みを確立する
–実践による探求:実際にデータをつくる
• サービス化、サービス提供
• 経験の蓄積と方法論化
• 問題の洗い出しと解決
Linked Open Data for ACademia
Linked Data
• Tim Berners-Leeが提唱する新しいデータ共有
の仕組み
– これまでのWeb:文書のWeb (Web of Documents)
– Linked Data: データのWeb (Web of Data)
• 孤立したデータの島から世界でつながるデータの
cloudへ
Linked Open Data for ACademia
文書のWeb
Linked Open Data for ACademia
データのWeb
このデータに
対応する別の
データ
このデータに
別のデータと
同じ
この属性の意
味は?
異なるデータ源のデータが相互に結びつ
く
Linked Open Data for ACademia
Linked Dataの記述のしかた
• RDF(+RDFS, OWL)の利用
– 簡便な記述方法:<主語> <述語> <目的語> .
<http://www-kasm.nii.ac.jp/~takeda#me> rdfs:type foaf:Person .
<http://www-kasm.nii.ac.jp/~takeda#me> foaf:name “武田英明” .
<http://www-kasm.nii.ac.jp/~takeda#me> foaf:gender “male” .
<http://www-kasm.nii.ac.jp/~takeda#me> foaf:knows <http://foaf.me/danbri#me> .
<http://www-kasm.nii.ac.jp/
~takeda#me>
<http://foaf.me/danbri#me>
foaf:knows
foaf:Person
rdfs:type
“武田英明” “male”
foaf:name foaf:gender
Linked Open Data for ACademia
Linked Open Data (LOD)
• オープンでリンクできるデータ
– 今のWebが“文書のWeb” 、LODは“データのWeb”
• Linked Dataの5原則
– 事柄の名前にURIを使うこと
– 名前の参照がHTTP URIでできること
– URIを参照したときに関連情報が手に入るように
理解可能なデータを提供
– 外部へのリンクも含めよう
(必ずしもオープンとは限らない⇒Linked Data)
Linked Open Data for ACademia
LOD Cloud: 相互リンクがある200以上のデータセット
世界におけるLODへの取り組み
Linked Open Data for ACademia
Bio2rdf
Linked Open Data for ACademia
本プロジェクトの成果
• 美術館・博物館データのLOD化による統合
(LODAC MUSEUM)
• 生物種データのLOD化による統合
(LODAC SPECIES)
• 関係するデータ、ソフトウエアの構築
– 地理データ (LODAC LOCATION)
– DBpedia Japanese
– CKAN日本語化
Linked Open Data for ACademia
本プロジェクトでの構築したDB
LODAC SPECIES: 種名をベースに多様なDBをリンクで接続
博物館
標本
DB
種情報
DB
Taxon
Name DBGBIF BioSci.
DB
個別
研究
DB
名前数: 113118
トリプル数:14,532,449
Data from Source BIntegrated data
dc:references dc:references
dc:references dc:references
dc:references dc:references
dc:creator
dc:creator
crm:P55_has_current_location
crm:P55_has_current_location
crm:P55_has_current_location
dc:creator
Data from Source A
Work
Museum
Creator
Minimum Data to identify entitiesRaw Data for entities Raw Data for entities
LODAC Museum: 博物館・美術館のデータのLOD
検索拡張アプリ
CKAN (日本語):
データセット登録レジストリ
DBPedia Japanese
LODAC Location:
位置情報統合
Linked Open Data for ACademia
Linked Dataに基づくデータ処理
• 収集:RDB等からの変換、Webスクレイピ
ング
• 洗練:スキーマ定義、スキーマに基づく
変換
• 統合:スキーママッピング、IDマッピング
• 公開:RDFデータ公開、SPARQLエンドポイ
収集 洗練 統合 公開 利用
RDF
ほとんどの処理はRDFで行われる
Linked Open Data for ACademia
LODAC Museum
• Linked Dataによるデータ処理のテストベッ
ド
• 美術館・博物館情報の特徴
– 分散性:国内だけでも6,000
– 大規模性:それぞれが102~104のデータ
– スキーマの統一性と多様性:一定の標準+α
– 統合可能性:作者、作品、場所、モチーフな
ど
– リンク性:様々な分野の他のデータとのリン
クの可能性
Linked Open Data for ACademia
LODAC Museum
• 国内の美術館の収集公開品に関するDB
– 現在
• トリプル数:
40,059,131
– 館数:114
• 博物館Webサイトからのコレクション情報
• サイエンスミュージアムネットからの標本情報
• 作者、施設等によるデータ統合
• RDFによるデータ公開
• いくつかのアプリケーション
Linked Open Data for ACademia
Webサイトから収集した情報のRDF化の効率
化
属性 属性値
{
"institution": "iwate_art_museum",
“segment": "20110516142455",
"digest": "c9d1c62a480d8d80005a24583ec1fb12",
"作品分類": "彫刻等[金属]",
"tstamp": "20110516052459778",
"作品名": "三人の妖精(さんにんのようせい)",
"anchor": "004790001_sakuhin.html",
"title": "岩手県立美術館 日本語版", “
“institutionalId": "004790001_sakuhin",
… ・・・
"技法/材質": "/ブロンズ/",
"作家名": "アリスティード・マイヨール“
}
属性・属性値(JSON)
RDF生成
RDF
subject:
自動生成したURI
predicate:
属性にマッピングしたプロパティ
object:
属性値
コレクション全体のプロパティ
コレクションごとのマッピングルール
変換処理と
マッピングルー
ルの考案を分離
博物館Webサイト
スクレイピン
グ
(Apache Solr)
マッピングルール(JSON)
{
"meta": {
"institutionalURI": "http://lod.ac/id/8144",
"institutionalName": "岩手県立美術館",
"dc:source": "http://www.ima.or.jp",
"dc:rights": "岩手県立美術館"
},
"rules": {
"lodac:genre": [ { "name": "作品分類" } ],
"dc:title": [
{ "name": "作品名",
”lang": "ja",
・・・
],
"dc:created": [ { "name": "制作年" } ],
"dc11:creator": [ { "name": "作家名", "lang": "ja" } ],
......
}
ルール考案
専門知識を
有するユーザ
<http://lod.ac/ref/821708>
<http://lod.ac/ns/lodac#genre> "彫刻等[金属]" ;
<http://purl.org/dc/elements/1.1/creator> "アリスティード・マイヨール
"@ja ;
<http://purl.org/dc/terms/created> "1937年" ;
<http://purl.org/dc/terms/extent> "高さ158.0" ;
<http://purl.org/dc/terms/isReferencedBy> <http://lod.ac/id/821708> ;
<http://purl.org/dc/terms/medium> "/ブロンズ/"@ja ;
<http://purl.org/dc/terms/rights> "岩手県立美術館" ;
収集
Linked Open Data for ACademia
メタデータ設計
• 基本構造
– 作品 – 作者 – 収蔵館
• 専門的正確さより相互運用可能性、簡便性を優先
– DC> DCTerm> FOAF> iCal >SKOS>NDLSH> RDA> CIDOC CRM
– できるだけフラット構造
PREFIX URI
crm http://purl.org/NET/cidoc-crm/core#
dc http://purl.org/dc/terms/
dc11 http://purl.org/dc/elements/1.1/
foaf http://xmlns.com/foaf/0.1/
skos http://www.w3.org/2004/02/skos/core#
rdfs http://www.w3.org/2000/01/rdf-
schema#
ical http://www.w3.org/2002/12/cal/ical#
rda2 http://RDVocab.info/ElementsGr2
lodac http://lod.ac/ns/lodac#
lodac:Work Property(一部項目省略)
資料分類 lodac:genre
文化財 lodac:culturalAssets
制作者 dc:creator / dc11:creator
国籍 crm:P7_took_place_at
作品名 dc:title / skos:prefLabel
作品名読み dc:title @ja-hrkt / skos:altLabel
作品名英語 dc:title @en / skos:altLabel
銘文 crm:P62I_is_depicted_by
印章 crm:P65_shows_visual_item
員数 crm:P57_has_number_of_parts
コレクション dc:isPartOf
制作年 dc:created
推定始年 lodac:estimatedStartYear
材質 dc:medium / crm:P45_consists_of
メタデータ要素
作品: 46
作者: 23
組織: 13
書誌: 12
洗練
Linked Open Data for ACademia
統合のポリシー
• どうやって異なる情報源の情報を統合するか
– 責任の分担
• 各情報源はその情報に対する責任
– LODACは単にIDを同定して管理。
• LODACは統合の部分だけの責任
– LODAC IDを各情報源IDに関連づける
Data from Source BIntegrated data
dc:references dc:references
dc:references dc:references
dc:references dc:references
dc:creator
dc:creator
crm:P55_has_current_location crm:P55_has_current_location
crm:P55_has_current_location dc:creator
Data from Source A
Work
Museum
Creator
統合
Linked Open Data for ACademia
例:作者情報の統合
• 作者情報統合の手順
– 統合元:日本美術シソーラス絵画編
– 統合対象:各情報源データ中の作者情報
– 統合元:文字列マッチング
– 作品情報中の作者と作者ノードを関連づける
LODAC data
Link to Work
DBpedia
Basic Information
for Creators
Links
統合
Linked Open Data for ACademia
データ統合
19
情報源 情報種別 データ数
国立美術館(西美を除く3館) 作品 25180
国立西洋美術館 作品 4373
京都国立博物館 作品 5819
奈良国立博物館 作品 431
福島県立美術館 作品 20
栃木県立美術館 作品 32
秋田県立近代美術館 作品 22
岩手県立美術館 作品 1558
徳島県立近代美術館 作品 18482
山梨県立美術館 作品 262
東京都現代美術館 作品 5416
香川県立東山魁夷せとうち美術館 作品 266
日本美術シソーラスDB 作品 3800
日本美術シソーラスDB 人物 1332
日本美術シソーラスDB グループ 289
日本美術シソーラスDB 所蔵館情報 648
文化遺産オンライン 所蔵館情報 915
国指定文化財データベース 作品 10115
合計 103096
総データ数 特定項目キーの単純文字列統合実験結果
統合項目 情報源 データ数 統合数
所蔵館名 日本美術シソーラス 648 77
文化遺産オンライン 915
国宝・重文
資料タイトル
日本美術シソーラス(作品) 3800 74
国指定文化財DB(作品) 10115
作者名による
資料タイトル
日本美術シソーラス(人物) 1332 15020
各館(作品) 61861
作者名 日本美術シソーラス(人物) 1332 615
各館(作品) 61861
「国宝・重文」
日本美術シソーラスに略称のタイトル表記が多く,
単純文字列マッチでは少ない値となった
「機械処理による可能性」
複合的な項目に対して複数アルゴリズムによる抽出
統合
Linked Open Data for ACademia
データ公開
• RDF公開
– 参照解決可能なかたちでの公開
• SPARQLアクセス
– SPARQLエンドポイント
公開
Linked Open Data for ACademia
Name of creator
LODAC ID and associated Ref-Resource IDs
作者ページの例公開
Linked Open Data for ACademia公開
Linked Open Data for ACademia
Linked Dataの利用
- Yokohama Art Spot -
• 博物館情報と横浜の地域情報のLODを
連携したWebアプリケーション
• 横浜市内のアート関連情報
– 施設情報
– イベント情報
– 収蔵品情報(一部の施設のみ)
– Q&A情報
LODAC Museum × 横浜LOD ×
PinQA
(博物館情報)
(地域情
報)
http://lod.ac/apps/yas/
利用
スポット情
報
Linked Open Data for ACademia
施 設
ユーザ
Yokohama Art Spot
RDF
ストア
SPARQL
エンドポイント
RDF
ストア
SPARQL
エンドポイント
LODAC Museum
横浜LOD
作品
所蔵館
アーティスト
アーティス
ト
施設
イベント
Yokohama Art Spot の構成
全体マップ表示における処理
施設
イベント
HTML
JavaScript
Python
SPARQLWrapper
OWLIM SE
ARC2
RDF
ストア
SPARQL
エンドポイント
PinQA
質問
回答
ユーザ
SPARQL
JSON
D2R
スポッ
ト
Linked Open Data for ACademia
施設情報ページにおける情報取得と表
示
•施設名
•アクセ
ス
•ジャンル
•休館日
•住所
•周辺地図
イベント情報
(タイムライン表
示)
イベント情報
(リスト表
示)
すべて横浜LODの
データを使用
利用
Linked Open Data for ACademia
施設情報ページにおける情報取得と表
示
標準化された形式で記述
ユーザに適した表示が
簡単に実現可能
利用
Linked Open Data for ACademia
施設情報ページにおける情報取得と表
示
所蔵品情報
(リスト表示)
所蔵品の提示・リンクは
LODAC Museum から取得
横浜LODだけでは
不可能な情報探索が実現可能
利用
Linked Open Data for ACademia
LODAC Species
• 生物多様性情報のLinked Data化
• 特徴
– 分散性:多数のDB
• 分子生物学から生態学まで
• 個別の種ごと、個別の関心ごと
– 大規模性:
– スキーマの統一性と多様性
• 一定の統一性(学名など)、分野固有データ
– 統合可能性:種やタクソンは共有
– リンク性:多様な分野とのつながり
• 他の科学(極域科学、バイオミメティクス)
• 市民科学
• 教育
Linked Open Data for ACademia
生物多様性情報
• 種名情報
– 生物名の目録の情報
• 分布情報
– 標本や観察記録などの情報
• 種情報
– 生物種の特徴を示す情報
学名:Papilio xuthus
和名:ナミアゲハ
界名:動物界
門名:節足動物門
綱名:昆虫綱
目名:鱗翅目
科名:アゲハチョウ科
標本所蔵館:茨城自然博物館
:
Linked Open Data for ACademia
Photo of Papilio xuthus:
北九州市立自然史・歴史博物館
Papilio xuthus
標本
種の同定
採集者
採集場所
命名
文献
言及
著者
シーケンス
著者
種情報
Papilio
上位/下位
タクソン
文献
Linked Open Data for ACademia
生物種情報の現状
種名情報
分子情報
Encyclopedia of Life
サイエンス
ミュージアムネット
BOLD
目的に応じて収録する種
の範囲が異なる
(収録ポリシーの違い:
広く/深く/特定の目的
/…)
Wikipedia
Wikispecies
NCBI
目的に応じて異なるサイ
ト
(それぞれに異なる情
報)
相互のリンクは必ずしも
あるわけではない
分布・標本情報
種情報
GBIF
Catalogue of Life
Species 2000
ITIS (Integrated Taxonomic
Information System)
Linked Open Data for ACademia
公開されている生物多様性情報
• GBIF:The Global Biodiversity Information Facility
– 地球規模生物多様性情報機構
– 種名・分布情報
• EoL:Encyclopedia of Life
– 種情報
• CoL:Catalogue of Life
– 種名情報
– 分類群に関する情報
• BOLD:Barcode of Life Data Systems
– DNA・標本情報
• サイエンスミュージアムネット(S-Net)
– 標本情報
– GBIF と連携
– 国立科学博物館が運営
Linked Open Data for ACademia
LODAC Species
• データベース:辞書、専門図鑑、標本データ
• 統合的データモデルの構築とデータ統合
– “名前による緩やかな統合”
• インターフェース
– HTML
• 個別の標本情報を閲覧
• 関連する情報をリンク経由で閲覧
– SPARQL endpoint
• ある種に関する標本情報の取得など柔軟な検索
• アプリケーション
– タクソンを使った検索支援
• CiNiiにおける文献検索
• DBCLSにおけるデータベースメタデータ検索支援
– GISを使った可視化
Linked Open Data for ACademia
LODAC Species
• 統合データベース
– 図鑑等の文献
• 生物学辞書(BDLS): DBCLSが多数の図鑑等から作成したもの
– 生物標本情報
• サイエンスミュージアムネット(国立科学博物館/JBIF)
– 専門家が管理しているDB
• 日本産蝶類和名学名便覧(日本昆虫学会/JBIF)
• 南極昭和基地周辺の蘚苔類・地衣類・種子植物の標本
データ(極地研)
– 蘚苔類 (例: http://lod.ac/id/2571912 )
– 地衣類(Lichens) (例: http://lod.ac/id/2631214 )
• 動物標本データベース (例: http://lod.ac/id/2628412 )
収集
Linked Open Data for ACademia
統合のアプローチ
• 種名・分類体系のグラフ
• 緩やかに関係を辿れるように
• リンクのルーティング
Chinese
Swallowtail
Papilio xuthus
Linnaeus, 1767
ナミアゲハ
Papilio
Papilio xuthus
Taxon
species
type
http://eol.org/....
http://www.catalogueoflife.org/...
http://ja.wikipedia.org/....
http://www.ncbi.nlm.nih.gov/...
タクソン名のネット
ワーク
統合
Linked Open Data for ACademia
統合データモデル
Specimen
rdf:type
species
institutionName
collectedDate
collectionLocality
crm:has_current_location
Bryophytes
TaxonName
ScientificName
CommonName TaxonRank
species
rdfs:subClassOf
rdfs:subClassOf
rdf:type
rdf:type
hasCommonName
hasScientificName hasSuperTaxon
rdf:type
hasTaxonRank
rdf:type
hasTaxonRank
rdf:type
Butterfly
BDLS
dcterms:source
dcterms:publisher
: Named Graph
: owl:Class
統合
Linked Open Data for ACademia
統合結果
• トリプル数
– 14,532,449
• Taxon names
– 443,248
• Scientific name
– 226,141
• Common name
– 219,865
• hasScientificName property node
– 87,160
• hasCommonName property node
– 84,610
統合
Linked Open Data for ACademia
LODAC Museum
LODAC Species
S-Net
表示例
http://lod.ac/ref/1674506
公開
Linked Open Data for ACademia
検索支援
公開
http://lod.ac/apps/lsdcs
Linked Open Data for ACademia
GISインタフェース
公開
http://dl.dropbox.com/u/22017402/nipr_map.html
Linked Open Data for ACademia
知見
• データベース統合における分野依存性、
非依存性の発見
– 多くの共通性:
• 名前による統合の有効性と限界
• ID付与方針
– 個別性
• 学名の扱い、名前のない個物の扱い
• 統合データベースの有効性
– 新たなるデータの価値への誘導
Linked Open Data for ACademia
今後の展開
Linked Open Data for ACademia
共有
収集
利用 創造
公開
データ中心科学のための
オープン・データ・ライフサイクル基盤の研究
開発• データ・ライフサイクル
– データの生産(創造)から共有、再利用までの循環が重要
– このサイクルをいかにシームレス、ボーダレスに実現するか
• オープン・データ・ライフスタイル基盤構築の技術チャレン
ジ
– 利用
• 情報抽出技術
– 創造
• オントロジー構築技術
• データ統合技術
– 公開・共有
• Web技術
– 技術統合化
・目標
- 領域内データ共有の加速
- 横断的研究の促進
新たな発見、組み合わせ
- Citizen Scienceへのアプローチ
Linked Open Data for ACademia
オープン・データ・サイクル基盤構
築の実現に向けてのアプローチ
研究
デー
タ
研究
プログラ
ム
研究
デー
タ
研究
プログラ
ム
研究
デー
タ
研究
プログラ
ム
地層ハブ
データ
GISハブ
データ
Xハブ
データ
公開技術
情報抽出
統合技術
情報組織化
個別研究
個別研究
個別研究
データ・サイクル基盤
• Linked Dataに基づくプラットフォーム
– Web技術のデータへの
適用
• “文書のWeb”から
”データのWeb”へ
• 公開・共有の基盤技術
• オープンデータのデファクト
– セマンティックWebの
技術の利用
• 技術的蓄積
• 情報抽出、オントロジー
推論
Linked Open Data for ACademia
http://lod.ac

Weitere ähnliche Inhalte

Ähnlich wie LODAC プロジェクト 中間発表会 資料

SPARQLから入門するLinked Open Data(LOD)ハンズオン 第2回
SPARQLから入門するLinked Open Data(LOD)ハンズオン 第2回SPARQLから入門するLinked Open Data(LOD)ハンズオン 第2回
SPARQLから入門するLinked Open Data(LOD)ハンズオン 第2回yamahige
 
大阪市オープンデータポータルAPI(SPARQL)勉強会
大阪市オープンデータポータルAPI(SPARQL)勉強会大阪市オープンデータポータルAPI(SPARQL)勉強会
大阪市オープンデータポータルAPI(SPARQL)勉強会Kouji Kozaki
 
Linked Open Dataによる博物館情報および地域情報の連携活用(じんもんこん2011)
Linked Open Dataによる博物館情報および地域情報の連携活用(じんもんこん2011)Linked Open Dataによる博物館情報および地域情報の連携活用(じんもんこん2011)
Linked Open Dataによる博物館情報および地域情報の連携活用(じんもんこん2011)Fuyuko Matsumura
 
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ーFuyuko Matsumura
 
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開Linked Open Data勉強会2020 前編:LODの基礎・作成・公開
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開KnowledgeGraph
 
横浜アートLODプロジェクト
横浜アートLODプロジェクト横浜アートLODプロジェクト
横浜アートLODプロジェクトIwao KOBAYASHI
 
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)Ikki Ohmukai
 
オープンデータとLOD~オープンデータって何?~
オープンデータとLOD~オープンデータって何?~オープンデータとLOD~オープンデータって何?~
オープンデータとLOD~オープンデータって何?~Kouji Kozaki
 
Linked Open Dataによる多様なミュージアム情報の統合
Linked Open Dataによる多様なミュージアム情報の統合Linked Open Dataによる多様なミュージアム情報の統合
Linked Open Dataによる多様なミュージアム情報の統合KAMURA
 
つながるデータShare
つながるデータShareつながるデータShare
つながるデータShareSeiji Koide
 
じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」
じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」
じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」KAMURA
 
Linked Open Data(LOD)の基本理念と基盤となる技術
Linked Open Data(LOD)の基本理念と基盤となる技術Linked Open Data(LOD)の基本理念と基盤となる技術
Linked Open Data(LOD)の基本理念と基盤となる技術Kouji Kozaki
 
Google Dev Fest 2010 Japan LT: OpenSocial JavaScript API is good, Lightweight...
Google Dev Fest 2010 Japan LT: OpenSocial JavaScript API is good, Lightweight...Google Dev Fest 2010 Japan LT: OpenSocial JavaScript API is good, Lightweight...
Google Dev Fest 2010 Japan LT: OpenSocial JavaScript API is good, Lightweight...Nobuhiro Nakajima
 
汎用Web API“SPARQL”でオープンデータ検索
汎用Web API“SPARQL”でオープンデータ検索汎用Web API“SPARQL”でオープンデータ検索
汎用Web API“SPARQL”でオープンデータ検索uedayou
 
SPARQLでオープンデータ活用!
SPARQLでオープンデータ活用!SPARQLでオープンデータ活用!
SPARQLでオープンデータ活用!uedayou
 

Ähnlich wie LODAC プロジェクト 中間発表会 資料 (20)

SPARQLから入門するLinked Open Data(LOD)ハンズオン 第2回
SPARQLから入門するLinked Open Data(LOD)ハンズオン 第2回SPARQLから入門するLinked Open Data(LOD)ハンズオン 第2回
SPARQLから入門するLinked Open Data(LOD)ハンズオン 第2回
 
大阪市オープンデータポータルAPI(SPARQL)勉強会
大阪市オープンデータポータルAPI(SPARQL)勉強会大阪市オープンデータポータルAPI(SPARQL)勉強会
大阪市オープンデータポータルAPI(SPARQL)勉強会
 
Linked Open Dataによる博物館情報および地域情報の連携活用(じんもんこん2011)
Linked Open Dataによる博物館情報および地域情報の連携活用(じんもんこん2011)Linked Open Dataによる博物館情報および地域情報の連携活用(じんもんこん2011)
Linked Open Dataによる博物館情報および地域情報の連携活用(じんもんこん2011)
 
Linked Open Dataとは
Linked Open DataとはLinked Open Dataとは
Linked Open Dataとは
 
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー
地域のLinked Open Dataでできること
 ー 奈良の観光情報を例に ー
 
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開Linked Open Data勉強会2020 前編:LODの基礎・作成・公開
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開
 
横浜アートLODプロジェクト
横浜アートLODプロジェクト横浜アートLODプロジェクト
横浜アートLODプロジェクト
 
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
オープンデータと「つながる社会」@オープンデータ京都勉強会(2013.04.20)
 
Web API入門
Web API入門Web API入門
Web API入門
 
オープンデータとLOD~オープンデータって何?~
オープンデータとLOD~オープンデータって何?~オープンデータとLOD~オープンデータって何?~
オープンデータとLOD~オープンデータって何?~
 
学術分野の事例紹介
学術分野の事例紹介学術分野の事例紹介
学術分野の事例紹介
 
Linked Open Dataによる多様なミュージアム情報の統合
Linked Open Dataによる多様なミュージアム情報の統合Linked Open Dataによる多様なミュージアム情報の統合
Linked Open Dataによる多様なミュージアム情報の統合
 
つながるデータShare
つながるデータShareつながるデータShare
つながるデータShare
 
じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」
じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」
じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」
 
Linked Open Data(LOD)の基本理念と基盤となる技術
Linked Open Data(LOD)の基本理念と基盤となる技術Linked Open Data(LOD)の基本理念と基盤となる技術
Linked Open Data(LOD)の基本理念と基盤となる技術
 
Linked Open Dataとは
Linked Open DataとはLinked Open Dataとは
Linked Open Dataとは
 
Google Dev Fest 2010 Japan LT: OpenSocial JavaScript API is good, Lightweight...
Google Dev Fest 2010 Japan LT: OpenSocial JavaScript API is good, Lightweight...Google Dev Fest 2010 Japan LT: OpenSocial JavaScript API is good, Lightweight...
Google Dev Fest 2010 Japan LT: OpenSocial JavaScript API is good, Lightweight...
 
汎用Web API“SPARQL”でオープンデータ検索
汎用Web API“SPARQL”でオープンデータ検索汎用Web API“SPARQL”でオープンデータ検索
汎用Web API“SPARQL”でオープンデータ検索
 
SPARQLでオープンデータ活用!
SPARQLでオープンデータ活用!SPARQLでオープンデータ活用!
SPARQLでオープンデータ活用!
 
DOI勉強会@nii
DOI勉強会@niiDOI勉強会@nii
DOI勉強会@nii
 

Mehr von National Institute of Informatics (NII)

趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)
趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)
趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)National Institute of Informatics (NII)
 
趙簡単LOD入門 〜デジタル庁をデジタル化する〜
趙簡単LOD入門 〜デジタル庁をデジタル化する〜趙簡単LOD入門 〜デジタル庁をデジタル化する〜
趙簡単LOD入門 〜デジタル庁をデジタル化する〜National Institute of Informatics (NII)
 
セマンティックWeb技術を用いた農業分野の標準語彙の構築
セマンティックWeb技術を用いた農業分野の標準語彙の構築セマンティックWeb技術を用いた農業分野の標準語彙の構築
セマンティックWeb技術を用いた農業分野の標準語彙の構築National Institute of Informatics (NII)
 
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ National Institute of Informatics (NII)
 
Presenting and Preserving the Change in Taxonomic Knowledge for Linked Data
Presenting and Preserving the Change in Taxonomic Knowledge for Linked DataPresenting and Preserving the Change in Taxonomic Knowledge for Linked Data
Presenting and Preserving the Change in Taxonomic Knowledge for Linked DataNational Institute of Informatics (NII)
 
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜National Institute of Informatics (NII)
 
研究データ利活用に関する国内活動及び国際動向について
研究データ利活用に関する国内活動及び国際動向について研究データ利活用に関する国内活動及び国際動向について
研究データ利活用に関する国内活動及び国際動向についてNational Institute of Informatics (NII)
 

Mehr von National Institute of Informatics (NII) (20)

趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)
趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)
趙簡単LOD入門 〜デジタル庁をデジタル化する〜 (改訂版)
 
趙簡単LOD入門 〜デジタル庁をデジタル化する〜
趙簡単LOD入門 〜デジタル庁をデジタル化する〜趙簡単LOD入門 〜デジタル庁をデジタル化する〜
趙簡単LOD入門 〜デジタル庁をデジタル化する〜
 
"分人"型社会とAI
"分人"型社会とAI"分人"型社会とAI
"分人"型社会とAI
 
セマンティックWeb技術を用いた農業分野の標準語彙の構築
セマンティックWeb技術を用いた農業分野の標準語彙の構築セマンティックWeb技術を用いた農業分野の標準語彙の構築
セマンティックWeb技術を用いた農業分野の標準語彙の構築
 
研究オープンデータにおける大学と研究者の役割
研究オープンデータにおける大学と研究者の役割研究オープンデータにおける大学と研究者の役割
研究オープンデータにおける大学と研究者の役割
 
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ
NII研究100連発 ウェブと人工知能の融合 -人間の創造性を刺激するコンピュータ
 
Presenting and Preserving the Change in Taxonomic Knowledge for Linked Data
Presenting and Preserving the Change in Taxonomic Knowledge for Linked DataPresenting and Preserving the Change in Taxonomic Knowledge for Linked Data
Presenting and Preserving the Change in Taxonomic Knowledge for Linked Data
 
Crop vocabulary (CVO): Core vocabulary of crop names
Crop vocabulary (CVO): Core vocabulary of crop namesCrop vocabulary (CVO): Core vocabulary of crop names
Crop vocabulary (CVO): Core vocabulary of crop names
 
ORCIDとオープンサイエンス
ORCIDとオープンサイエンスORCIDとオープンサイエンス
ORCIDとオープンサイエンス
 
How to build ontologies - a case study of Agriculture Activity Ontology
How to build ontologies - a case study of Agriculture Activity OntologyHow to build ontologies - a case study of Agriculture Activity Ontology
How to build ontologies - a case study of Agriculture Activity Ontology
 
LODとオープンデータ (DBpediaとIMIの周辺を中心に)
LODとオープンデータ(DBpediaとIMIの周辺を中心に)LODとオープンデータ(DBpediaとIMIの周辺を中心に)
LODとオープンデータ (DBpediaとIMIの周辺を中心に)
 
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
共通語彙の構築の基本的な考え方と方法 〜研究データのために語彙・スキーマを作るには〜
 
Working with Global Infrastructure at a National Level
Working with Global Infrastructure at a National LevelWorking with Global Infrastructure at a National Level
Working with Global Infrastructure at a National Level
 
Activities of JaLC as a national service
Activities of JaLC as a national serviceActivities of JaLC as a national service
Activities of JaLC as a national service
 
Development and Application of Agriculture Ontologies
Development and Application of Agriculture Ontologies Development and Application of Agriculture Ontologies
Development and Application of Agriculture Ontologies
 
Design Process of Agriculture Ontologies
Design Process of Agriculture OntologiesDesign Process of Agriculture Ontologies
Design Process of Agriculture Ontologies
 
AIの未来 ~技術と社会の関係のダイナミクス~
AIの未来~技術と社会の関係のダイナミクス~AIの未来~技術と社会の関係のダイナミクス~
AIの未来 ~技術と社会の関係のダイナミクス~
 
Towards Knowledge-Enabled Society
Towards Knowledge-Enabled SocietyTowards Knowledge-Enabled Society
Towards Knowledge-Enabled Society
 
研究データ利活用に関する国内活動及び国際動向について
研究データ利活用に関する国内活動及び国際動向について研究データ利活用に関する国内活動及び国際動向について
研究データ利活用に関する国内活動及び国際動向について
 
オープンサイエンスとオープンデータ
オープンサイエンスとオープンデータオープンサイエンスとオープンデータ
オープンサイエンスとオープンデータ
 

Kürzlich hochgeladen

スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 

Kürzlich hochgeladen (9)

スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 

LODAC プロジェクト 中間発表会 資料

  • 1. Linked Open Data for ACademia LODAC Project -学術リソースのためのオープン・ソーシャル・セマンティックWeb基盤の構 築 - 武田英明 takeda@nii.ac.jp 国立情報学研究所 Linked Dataでつくる新しいデータの世界 情報・システム研究機構 新領域融合研究センター「異分野共有資源共有・協働基盤の構築」プロジェクト 中間報告会 2012年12月10日
  • 2. Linked Open Data for ACademia 本プロジェクトの狙い • Linked Dataによるデータ共有を実現する仕組 みを確立する –実践による探求:実際にデータをつくる • サービス化、サービス提供 • 経験の蓄積と方法論化 • 問題の洗い出しと解決
  • 3. Linked Open Data for ACademia Linked Data • Tim Berners-Leeが提唱する新しいデータ共有 の仕組み – これまでのWeb:文書のWeb (Web of Documents) – Linked Data: データのWeb (Web of Data) • 孤立したデータの島から世界でつながるデータの cloudへ
  • 4. Linked Open Data for ACademia 文書のWeb
  • 5. Linked Open Data for ACademia データのWeb このデータに 対応する別の データ このデータに 別のデータと 同じ この属性の意 味は? 異なるデータ源のデータが相互に結びつ く
  • 6. Linked Open Data for ACademia Linked Dataの記述のしかた • RDF(+RDFS, OWL)の利用 – 簡便な記述方法:<主語> <述語> <目的語> . <http://www-kasm.nii.ac.jp/~takeda#me> rdfs:type foaf:Person . <http://www-kasm.nii.ac.jp/~takeda#me> foaf:name “武田英明” . <http://www-kasm.nii.ac.jp/~takeda#me> foaf:gender “male” . <http://www-kasm.nii.ac.jp/~takeda#me> foaf:knows <http://foaf.me/danbri#me> . <http://www-kasm.nii.ac.jp/ ~takeda#me> <http://foaf.me/danbri#me> foaf:knows foaf:Person rdfs:type “武田英明” “male” foaf:name foaf:gender
  • 7. Linked Open Data for ACademia Linked Open Data (LOD) • オープンでリンクできるデータ – 今のWebが“文書のWeb” 、LODは“データのWeb” • Linked Dataの5原則 – 事柄の名前にURIを使うこと – 名前の参照がHTTP URIでできること – URIを参照したときに関連情報が手に入るように 理解可能なデータを提供 – 外部へのリンクも含めよう (必ずしもオープンとは限らない⇒Linked Data)
  • 8. Linked Open Data for ACademia LOD Cloud: 相互リンクがある200以上のデータセット 世界におけるLODへの取り組み
  • 9. Linked Open Data for ACademia Bio2rdf
  • 10. Linked Open Data for ACademia 本プロジェクトの成果 • 美術館・博物館データのLOD化による統合 (LODAC MUSEUM) • 生物種データのLOD化による統合 (LODAC SPECIES) • 関係するデータ、ソフトウエアの構築 – 地理データ (LODAC LOCATION) – DBpedia Japanese – CKAN日本語化
  • 11. Linked Open Data for ACademia 本プロジェクトでの構築したDB LODAC SPECIES: 種名をベースに多様なDBをリンクで接続 博物館 標本 DB 種情報 DB Taxon Name DBGBIF BioSci. DB 個別 研究 DB 名前数: 113118 トリプル数:14,532,449 Data from Source BIntegrated data dc:references dc:references dc:references dc:references dc:references dc:references dc:creator dc:creator crm:P55_has_current_location crm:P55_has_current_location crm:P55_has_current_location dc:creator Data from Source A Work Museum Creator Minimum Data to identify entitiesRaw Data for entities Raw Data for entities LODAC Museum: 博物館・美術館のデータのLOD 検索拡張アプリ CKAN (日本語): データセット登録レジストリ DBPedia Japanese LODAC Location: 位置情報統合
  • 12. Linked Open Data for ACademia Linked Dataに基づくデータ処理 • 収集:RDB等からの変換、Webスクレイピ ング • 洗練:スキーマ定義、スキーマに基づく 変換 • 統合:スキーママッピング、IDマッピング • 公開:RDFデータ公開、SPARQLエンドポイ 収集 洗練 統合 公開 利用 RDF ほとんどの処理はRDFで行われる
  • 13. Linked Open Data for ACademia LODAC Museum • Linked Dataによるデータ処理のテストベッ ド • 美術館・博物館情報の特徴 – 分散性:国内だけでも6,000 – 大規模性:それぞれが102~104のデータ – スキーマの統一性と多様性:一定の標準+α – 統合可能性:作者、作品、場所、モチーフな ど – リンク性:様々な分野の他のデータとのリン クの可能性
  • 14. Linked Open Data for ACademia LODAC Museum • 国内の美術館の収集公開品に関するDB – 現在 • トリプル数: 40,059,131 – 館数:114 • 博物館Webサイトからのコレクション情報 • サイエンスミュージアムネットからの標本情報 • 作者、施設等によるデータ統合 • RDFによるデータ公開 • いくつかのアプリケーション
  • 15. Linked Open Data for ACademia Webサイトから収集した情報のRDF化の効率 化 属性 属性値 { "institution": "iwate_art_museum", “segment": "20110516142455", "digest": "c9d1c62a480d8d80005a24583ec1fb12", "作品分類": "彫刻等[金属]", "tstamp": "20110516052459778", "作品名": "三人の妖精(さんにんのようせい)", "anchor": "004790001_sakuhin.html", "title": "岩手県立美術館 日本語版", “ “institutionalId": "004790001_sakuhin", … ・・・ "技法/材質": "/ブロンズ/", "作家名": "アリスティード・マイヨール“ } 属性・属性値(JSON) RDF生成 RDF subject: 自動生成したURI predicate: 属性にマッピングしたプロパティ object: 属性値 コレクション全体のプロパティ コレクションごとのマッピングルール 変換処理と マッピングルー ルの考案を分離 博物館Webサイト スクレイピン グ (Apache Solr) マッピングルール(JSON) { "meta": { "institutionalURI": "http://lod.ac/id/8144", "institutionalName": "岩手県立美術館", "dc:source": "http://www.ima.or.jp", "dc:rights": "岩手県立美術館" }, "rules": { "lodac:genre": [ { "name": "作品分類" } ], "dc:title": [ { "name": "作品名", ”lang": "ja", ・・・ ], "dc:created": [ { "name": "制作年" } ], "dc11:creator": [ { "name": "作家名", "lang": "ja" } ], ...... } ルール考案 専門知識を 有するユーザ <http://lod.ac/ref/821708> <http://lod.ac/ns/lodac#genre> "彫刻等[金属]" ; <http://purl.org/dc/elements/1.1/creator> "アリスティード・マイヨール "@ja ; <http://purl.org/dc/terms/created> "1937年" ; <http://purl.org/dc/terms/extent> "高さ158.0" ; <http://purl.org/dc/terms/isReferencedBy> <http://lod.ac/id/821708> ; <http://purl.org/dc/terms/medium> "/ブロンズ/"@ja ; <http://purl.org/dc/terms/rights> "岩手県立美術館" ; 収集
  • 16. Linked Open Data for ACademia メタデータ設計 • 基本構造 – 作品 – 作者 – 収蔵館 • 専門的正確さより相互運用可能性、簡便性を優先 – DC> DCTerm> FOAF> iCal >SKOS>NDLSH> RDA> CIDOC CRM – できるだけフラット構造 PREFIX URI crm http://purl.org/NET/cidoc-crm/core# dc http://purl.org/dc/terms/ dc11 http://purl.org/dc/elements/1.1/ foaf http://xmlns.com/foaf/0.1/ skos http://www.w3.org/2004/02/skos/core# rdfs http://www.w3.org/2000/01/rdf- schema# ical http://www.w3.org/2002/12/cal/ical# rda2 http://RDVocab.info/ElementsGr2 lodac http://lod.ac/ns/lodac# lodac:Work Property(一部項目省略) 資料分類 lodac:genre 文化財 lodac:culturalAssets 制作者 dc:creator / dc11:creator 国籍 crm:P7_took_place_at 作品名 dc:title / skos:prefLabel 作品名読み dc:title @ja-hrkt / skos:altLabel 作品名英語 dc:title @en / skos:altLabel 銘文 crm:P62I_is_depicted_by 印章 crm:P65_shows_visual_item 員数 crm:P57_has_number_of_parts コレクション dc:isPartOf 制作年 dc:created 推定始年 lodac:estimatedStartYear 材質 dc:medium / crm:P45_consists_of メタデータ要素 作品: 46 作者: 23 組織: 13 書誌: 12 洗練
  • 17. Linked Open Data for ACademia 統合のポリシー • どうやって異なる情報源の情報を統合するか – 責任の分担 • 各情報源はその情報に対する責任 – LODACは単にIDを同定して管理。 • LODACは統合の部分だけの責任 – LODAC IDを各情報源IDに関連づける Data from Source BIntegrated data dc:references dc:references dc:references dc:references dc:references dc:references dc:creator dc:creator crm:P55_has_current_location crm:P55_has_current_location crm:P55_has_current_location dc:creator Data from Source A Work Museum Creator 統合
  • 18. Linked Open Data for ACademia 例:作者情報の統合 • 作者情報統合の手順 – 統合元:日本美術シソーラス絵画編 – 統合対象:各情報源データ中の作者情報 – 統合元:文字列マッチング – 作品情報中の作者と作者ノードを関連づける LODAC data Link to Work DBpedia Basic Information for Creators Links 統合
  • 19. Linked Open Data for ACademia データ統合 19 情報源 情報種別 データ数 国立美術館(西美を除く3館) 作品 25180 国立西洋美術館 作品 4373 京都国立博物館 作品 5819 奈良国立博物館 作品 431 福島県立美術館 作品 20 栃木県立美術館 作品 32 秋田県立近代美術館 作品 22 岩手県立美術館 作品 1558 徳島県立近代美術館 作品 18482 山梨県立美術館 作品 262 東京都現代美術館 作品 5416 香川県立東山魁夷せとうち美術館 作品 266 日本美術シソーラスDB 作品 3800 日本美術シソーラスDB 人物 1332 日本美術シソーラスDB グループ 289 日本美術シソーラスDB 所蔵館情報 648 文化遺産オンライン 所蔵館情報 915 国指定文化財データベース 作品 10115 合計 103096 総データ数 特定項目キーの単純文字列統合実験結果 統合項目 情報源 データ数 統合数 所蔵館名 日本美術シソーラス 648 77 文化遺産オンライン 915 国宝・重文 資料タイトル 日本美術シソーラス(作品) 3800 74 国指定文化財DB(作品) 10115 作者名による 資料タイトル 日本美術シソーラス(人物) 1332 15020 各館(作品) 61861 作者名 日本美術シソーラス(人物) 1332 615 各館(作品) 61861 「国宝・重文」 日本美術シソーラスに略称のタイトル表記が多く, 単純文字列マッチでは少ない値となった 「機械処理による可能性」 複合的な項目に対して複数アルゴリズムによる抽出 統合
  • 20. Linked Open Data for ACademia データ公開 • RDF公開 – 参照解決可能なかたちでの公開 • SPARQLアクセス – SPARQLエンドポイント 公開
  • 21. Linked Open Data for ACademia Name of creator LODAC ID and associated Ref-Resource IDs 作者ページの例公開
  • 22. Linked Open Data for ACademia公開
  • 23. Linked Open Data for ACademia Linked Dataの利用 - Yokohama Art Spot - • 博物館情報と横浜の地域情報のLODを 連携したWebアプリケーション • 横浜市内のアート関連情報 – 施設情報 – イベント情報 – 収蔵品情報(一部の施設のみ) – Q&A情報 LODAC Museum × 横浜LOD × PinQA (博物館情報) (地域情 報) http://lod.ac/apps/yas/ 利用 スポット情 報
  • 24. Linked Open Data for ACademia 施 設 ユーザ Yokohama Art Spot RDF ストア SPARQL エンドポイント RDF ストア SPARQL エンドポイント LODAC Museum 横浜LOD 作品 所蔵館 アーティスト アーティス ト 施設 イベント Yokohama Art Spot の構成 全体マップ表示における処理 施設 イベント HTML JavaScript Python SPARQLWrapper OWLIM SE ARC2 RDF ストア SPARQL エンドポイント PinQA 質問 回答 ユーザ SPARQL JSON D2R スポッ ト
  • 25. Linked Open Data for ACademia 施設情報ページにおける情報取得と表 示 •施設名 •アクセ ス •ジャンル •休館日 •住所 •周辺地図 イベント情報 (タイムライン表 示) イベント情報 (リスト表 示) すべて横浜LODの データを使用 利用
  • 26. Linked Open Data for ACademia 施設情報ページにおける情報取得と表 示 標準化された形式で記述 ユーザに適した表示が 簡単に実現可能 利用
  • 27. Linked Open Data for ACademia 施設情報ページにおける情報取得と表 示 所蔵品情報 (リスト表示) 所蔵品の提示・リンクは LODAC Museum から取得 横浜LODだけでは 不可能な情報探索が実現可能 利用
  • 28. Linked Open Data for ACademia LODAC Species • 生物多様性情報のLinked Data化 • 特徴 – 分散性:多数のDB • 分子生物学から生態学まで • 個別の種ごと、個別の関心ごと – 大規模性: – スキーマの統一性と多様性 • 一定の統一性(学名など)、分野固有データ – 統合可能性:種やタクソンは共有 – リンク性:多様な分野とのつながり • 他の科学(極域科学、バイオミメティクス) • 市民科学 • 教育
  • 29. Linked Open Data for ACademia 生物多様性情報 • 種名情報 – 生物名の目録の情報 • 分布情報 – 標本や観察記録などの情報 • 種情報 – 生物種の特徴を示す情報 学名:Papilio xuthus 和名:ナミアゲハ 界名:動物界 門名:節足動物門 綱名:昆虫綱 目名:鱗翅目 科名:アゲハチョウ科 標本所蔵館:茨城自然博物館 :
  • 30. Linked Open Data for ACademia Photo of Papilio xuthus: 北九州市立自然史・歴史博物館 Papilio xuthus 標本 種の同定 採集者 採集場所 命名 文献 言及 著者 シーケンス 著者 種情報 Papilio 上位/下位 タクソン 文献
  • 31. Linked Open Data for ACademia 生物種情報の現状 種名情報 分子情報 Encyclopedia of Life サイエンス ミュージアムネット BOLD 目的に応じて収録する種 の範囲が異なる (収録ポリシーの違い: 広く/深く/特定の目的 /…) Wikipedia Wikispecies NCBI 目的に応じて異なるサイ ト (それぞれに異なる情 報) 相互のリンクは必ずしも あるわけではない 分布・標本情報 種情報 GBIF Catalogue of Life Species 2000 ITIS (Integrated Taxonomic Information System)
  • 32. Linked Open Data for ACademia 公開されている生物多様性情報 • GBIF:The Global Biodiversity Information Facility – 地球規模生物多様性情報機構 – 種名・分布情報 • EoL:Encyclopedia of Life – 種情報 • CoL:Catalogue of Life – 種名情報 – 分類群に関する情報 • BOLD:Barcode of Life Data Systems – DNA・標本情報 • サイエンスミュージアムネット(S-Net) – 標本情報 – GBIF と連携 – 国立科学博物館が運営
  • 33. Linked Open Data for ACademia LODAC Species • データベース:辞書、専門図鑑、標本データ • 統合的データモデルの構築とデータ統合 – “名前による緩やかな統合” • インターフェース – HTML • 個別の標本情報を閲覧 • 関連する情報をリンク経由で閲覧 – SPARQL endpoint • ある種に関する標本情報の取得など柔軟な検索 • アプリケーション – タクソンを使った検索支援 • CiNiiにおける文献検索 • DBCLSにおけるデータベースメタデータ検索支援 – GISを使った可視化
  • 34. Linked Open Data for ACademia LODAC Species • 統合データベース – 図鑑等の文献 • 生物学辞書(BDLS): DBCLSが多数の図鑑等から作成したもの – 生物標本情報 • サイエンスミュージアムネット(国立科学博物館/JBIF) – 専門家が管理しているDB • 日本産蝶類和名学名便覧(日本昆虫学会/JBIF) • 南極昭和基地周辺の蘚苔類・地衣類・種子植物の標本 データ(極地研) – 蘚苔類 (例: http://lod.ac/id/2571912 ) – 地衣類(Lichens) (例: http://lod.ac/id/2631214 ) • 動物標本データベース (例: http://lod.ac/id/2628412 ) 収集
  • 35. Linked Open Data for ACademia 統合のアプローチ • 種名・分類体系のグラフ • 緩やかに関係を辿れるように • リンクのルーティング Chinese Swallowtail Papilio xuthus Linnaeus, 1767 ナミアゲハ Papilio Papilio xuthus Taxon species type http://eol.org/.... http://www.catalogueoflife.org/... http://ja.wikipedia.org/.... http://www.ncbi.nlm.nih.gov/... タクソン名のネット ワーク 統合
  • 36. Linked Open Data for ACademia 統合データモデル Specimen rdf:type species institutionName collectedDate collectionLocality crm:has_current_location Bryophytes TaxonName ScientificName CommonName TaxonRank species rdfs:subClassOf rdfs:subClassOf rdf:type rdf:type hasCommonName hasScientificName hasSuperTaxon rdf:type hasTaxonRank rdf:type hasTaxonRank rdf:type Butterfly BDLS dcterms:source dcterms:publisher : Named Graph : owl:Class 統合
  • 37. Linked Open Data for ACademia 統合結果 • トリプル数 – 14,532,449 • Taxon names – 443,248 • Scientific name – 226,141 • Common name – 219,865 • hasScientificName property node – 87,160 • hasCommonName property node – 84,610 統合
  • 38. Linked Open Data for ACademia LODAC Museum LODAC Species S-Net 表示例 http://lod.ac/ref/1674506 公開
  • 39. Linked Open Data for ACademia 検索支援 公開 http://lod.ac/apps/lsdcs
  • 40. Linked Open Data for ACademia GISインタフェース 公開 http://dl.dropbox.com/u/22017402/nipr_map.html
  • 41. Linked Open Data for ACademia 知見 • データベース統合における分野依存性、 非依存性の発見 – 多くの共通性: • 名前による統合の有効性と限界 • ID付与方針 – 個別性 • 学名の扱い、名前のない個物の扱い • 統合データベースの有効性 – 新たなるデータの価値への誘導
  • 42. Linked Open Data for ACademia 今後の展開
  • 43. Linked Open Data for ACademia 共有 収集 利用 創造 公開 データ中心科学のための オープン・データ・ライフサイクル基盤の研究 開発• データ・ライフサイクル – データの生産(創造)から共有、再利用までの循環が重要 – このサイクルをいかにシームレス、ボーダレスに実現するか • オープン・データ・ライフスタイル基盤構築の技術チャレン ジ – 利用 • 情報抽出技術 – 創造 • オントロジー構築技術 • データ統合技術 – 公開・共有 • Web技術 – 技術統合化 ・目標 - 領域内データ共有の加速 - 横断的研究の促進 新たな発見、組み合わせ - Citizen Scienceへのアプローチ
  • 44. Linked Open Data for ACademia オープン・データ・サイクル基盤構 築の実現に向けてのアプローチ 研究 デー タ 研究 プログラ ム 研究 デー タ 研究 プログラ ム 研究 デー タ 研究 プログラ ム 地層ハブ データ GISハブ データ Xハブ データ 公開技術 情報抽出 統合技術 情報組織化 個別研究 個別研究 個別研究 データ・サイクル基盤 • Linked Dataに基づくプラットフォーム – Web技術のデータへの 適用 • “文書のWeb”から ”データのWeb”へ • 公開・共有の基盤技術 • オープンデータのデファクト – セマンティックWebの 技術の利用 • 技術的蓄積 • 情報抽出、オントロジー 推論
  • 45. Linked Open Data for ACademia http://lod.ac