SlideShare ist ein Scribd-Unternehmen logo
1 von 44
Is EDINET 5 star? N. Shimizu chikoski@gmail.com / @chikoski 2011.1.27 1 N. Shimizu <chikoski@gmail.com>
自己紹介 清水智公 / @chikoski 嘉悦大学情報メディアセンター / 慶應義塾大学政策・メディア研究科 http://chikoski.info/ 2011.1.27 2 N. Shimizu <chikoski@gmail.com>
http://xbrl.tom.sfc.keio.ac.jp/ 2011.1.27 3 N. Shimizu <chikoski@gmail.com>
http://edinet.chikoski.info/ 2011.1.27 4 N. Shimizu <chikoski@gmail.com>
概要 EDINET Web APIの概要 作成の背景 リストの取得方法 レポートの取得方法 作成しているときに思ったこと 今後の方向性 2011.1.27 5 N. Shimizu <chikoski@gmail.com>
EDINET Web APIの概要 2011.1.27 6 N. Shimizu <chikoski@gmail.com>
作成の背景 EDINETを機械に優しいサイトに 機械:プログラム 今のEDINETは機械に対してつめたい 他のシステムに対してオープンに 簡単な検索インタフェースの提供 XBRLファイルへのアクセス手段の提供 2011.1.27 7 N. Shimizu <chikoski@gmail.com>
設計の方針:リンク可能にする 報告書に固定のURLを与えること GETで取得できること トークン等はつかわないこと URLが検索文を兼ねること 2011.1.27 8 N. Shimizu <chikoski@gmail.com>
EDINET Web API 提出されたレポートの検索 日付、期間 EDINETコード 業種 レポートのダウンロード ZIP, xbrlファイル単体 書類管理番号がキー 2011.1.27 9 N. Shimizu <chikoski@gmail.com>
デモ 2011.1.27 10 N. Shimizu <chikoski@gmail.com>
検索:/list/{条件}[.形式] 条件 recent, today, yesterday YYYYMMDD YYYYMMDD-YYYYMMDD EDINETコード 業種 形式:JSON 2011.1.27 11 N. Shimizu <chikoski@gmail.com>
検索結果 2011.1.27 12 N. Shimizu <chikoski@gmail.com>
検索結果 報告書のURL 2011.1.27 13 N. Shimizu <chikoski@gmail.com>
報告書の取得:/report/{管理番号} EDINETの管理番号を指定する /report/S00070PB /report/S00071D9 取得できるレポート XBRLファイルのみ 全部入りのzipファイル 2011.1.27 14 N. Shimizu <chikoski@gmail.com>
システムの概要 2011.1.27 15 N. Shimizu <chikoski@gmail.com>
システムの構成 クローラー:ページなどをダウンロード スクレイパー:必要な情報を抽出 Webインタフェース:検索の受け口 2011.1.27 16 N. Shimizu <chikoski@gmail.com>
システムの構成 クローラー:ページなどをダウンロード スクレイパー:必要な情報を抽出 Webインタフェース:検索の受け口 一番面倒だった 2011.1.27 17 N. Shimizu <chikoski@gmail.com>
2011.1.27 18 N. Shimizu <chikoski@gmail.com>
機械に優しくないサイト 2011.1.27 19 N. Shimizu <chikoski@gmail.com>
クローラー作成の壁 ステータスコードを正しく返さない POSTパラメータの解析 セッションキーの取り扱い 2011.1.27 20 N. Shimizu <chikoski@gmail.com>
ステータスコードを正しく返さない 突然コネクションを切断する 処理に失敗しても200を返す 普通 400番台のコードを返して切断 500番台のコード+ページを返す 2011.1.27 21 N. Shimizu <chikoski@gmail.com>
ステータスコード アクセスの成否を示した数字 数字と意味 200番台:アクセス成功 300番台:転居届 400番台:アクセス失敗 500番台:エラー 2011.1.27 22 N. Shimizu <chikoski@gmail.com>
リクエストヘッダに不備->切断 Hostがinfo.edinet-fsa.go.jpではない User-Agentが対応ブラウザではない Firefox Chrome / Safari IE 2011.1.27 23 N. Shimizu <chikoski@gmail.com>
処理に失敗しても200を返す 処理に失敗するパターン POSTするパラメーターの組み合わせが不正 セッションタイムアウト ファイルが存在しない この全てで200が返ってくる ステータスコードからエラーが検知できない 原因は返ってくるページをみて初めてわかる 2011.1.27 24 N. Shimizu <chikoski@gmail.com>
POSTされる主なパラメーター uji.verb uji.bean TID PID pageUp / pageDown / be.page SESSIONKEY 2011.1.27 25 N. Shimizu <chikoski@gmail.com>
セッションがタイムアウトする原因 アクセス間隔が長い 30分くらい間を置くと切れている 正確な生存期間は不明… POSTするセッションキーとEDINET側のキーが異なる場合 2011.1.27 26 N. Shimizu <chikoski@gmail.com>
EDINETのセッション管理 クッキー セッションキー パラメータ名:SESSIONKEY 13桁の乱数 アクセスするごとに変わる 2011.1.27 27 N. Shimizu <chikoski@gmail.com>
EDINETのセッション管理 クッキー セッションキー パラメータ名:SESSIONKEY 13桁の乱数 アクセスするごとに変わる ポイント 2011.1.27 28 N. Shimizu <chikoski@gmail.com>
2011.1.27 29 N. Shimizu <chikoski@gmail.com>
機械に優しいサイトになるには ステータスコードをきちんと返すこと User-Agentを制限しないこと POSTではなくGETでページが取得できること 不必要なセッション管理をしないこと robots.txtを置くこと 2011.1.27 30 N. Shimizu <chikoski@gmail.com>
EDINETにはrobots.txtがない クローラーに対するポリシーがない キャッシュしてよいもの、悪いものの判断がつかない クローラーでアクセスしてよいの? 2011.1.27 31 N. Shimizu <chikoski@gmail.com>
APIの今後 2011.1.27 32 N. Shimizu <chikoski@gmail.com>
Web = Database 2011.1.27 33 N. Shimizu <chikoski@gmail.com>
よりオープンに 2011.1.27 34 N. Shimizu <chikoski@gmail.com>
Is your data 5star? ☆☆☆☆★:Web上で公開されていること。 オープンライセンスであること ☆☆☆★★:プログラム処理可能な構造化データであること ☆☆★★★:プロプライエタリなフォーマットではないこと ☆★★★★:RDFを利用してデータが表現されていること ★★★★★:他のデータとリンクしていること 2011.1.27 35 N. Shimizu <chikoski@gmail.com>
Is your data 5star? ☆☆☆☆★:Web上で公開されていること。 オープンライセンスであること ☆☆☆★★:プログラム処理可能な構造化データであること ☆☆★★★:プロプライエタリなフォーマットではないこと ☆★★★★:RDFを利用してデータが表現されていること ★★★★★:他のデータとリンクしていること 今ココ 2011.1.27 36 N. Shimizu <chikoski@gmail.com>
Is your data 5star? ☆☆☆☆★:Web上で公開されていること。 オープンライセンスであること ☆☆☆★★:プログラム処理可能な構造化データであること ☆☆★★★:プロプライエタリなフォーマットではないこと ☆★★★★:RDFを利用してデータが表現されていること ★★★★★:他のデータとリンクしていること ココを目指す 2011.1.27 37 N. Shimizu <chikoski@gmail.com>
直近の目標:4つ星を目指す 出力するもの 検索結果 XBRL, XSD, ラベルなど XBRLファイルの変換 XML2RDFを利用する スキーマはXSD2OWLを利用 http://rhizomik.net/html/redefer/ 2011.1.27 38 N. Shimizu <chikoski@gmail.com>
XML2RDFで行われる変換 [1]より 2011.1.27 39 N. Shimizu <chikoski@gmail.com>
5つ星になるには 全てのものをURLで表現 例 会社 業種 dbpedia.jpを参照する予定 2011.1.27 40 N. Shimizu <chikoski@gmail.com>
Linked Data 2011.1.27 41 N. Shimizu <chikoski@gmail.com>
5つ星になった後 企業情報におけるLOD.ACに c.f LODAC Museumhttp://lod.ac/ 2011.1.27 42 N. Shimizu <chikoski@gmail.com>
ご静聴ありがとうございました 2011.1.27 43 N. Shimizu <chikoski@gmail.com>
Linked Dataに関する情報 Tim Berners-Lee, “Linked Data”, http://goo.gl/katw http://linkeddata.org/ http://linkeddata.jp/ “Linked Data in Japan”, http://goo.gl/8pvAI http://lod.ac/ http://scholex.com/ocdi/ 2011.1.27 44 N. Shimizu <chikoski@gmail.com>

Weitere ähnliche Inhalte

Mehr von Noritada Shimizu

2016 gunma.web games-and-asm.js
2016 gunma.web games-and-asm.js2016 gunma.web games-and-asm.js
2016 gunma.web games-and-asm.jsNoritada Shimizu
 
20151128 firefoxos-handson
20151128 firefoxos-handson20151128 firefoxos-handson
20151128 firefoxos-handsonNoritada Shimizu
 
Inspection & Tweak: Firefox を使ったフロント開発
Inspection & Tweak: Firefox を使ったフロント開発Inspection & Tweak: Firefox を使ったフロント開発
Inspection & Tweak: Firefox を使ったフロント開発Noritada Shimizu
 
20150829 firefox-os-handson
20150829 firefox-os-handson20150829 firefox-os-handson
20150829 firefox-os-handsonNoritada Shimizu
 
20150727 Development tools for Firefox OS apps
20150727 Development tools for Firefox OS apps20150727 Development tools for Firefox OS apps
20150727 Development tools for Firefox OS appsNoritada Shimizu
 
Firefox OS でアプリを作るときに気をつけたい N 個のこと
Firefox OS  でアプリを作るときに気をつけたい N 個のことFirefox OS  でアプリを作るときに気をつけたい N 個のこと
Firefox OS でアプリを作るときに気をつけたい N 個のことNoritada Shimizu
 
Firefox OSアプリ開発ハンズオン(Hello World編)
Firefox OSアプリ開発ハンズオン(Hello World編)Firefox OSアプリ開発ハンズオン(Hello World編)
Firefox OSアプリ開発ハンズオン(Hello World編)Noritada Shimizu
 
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)Noritada Shimizu
 
Application submission, management and manetization in Firefox Marketplace
Application submission, management and manetization in Firefox MarketplaceApplication submission, management and manetization in Firefox Marketplace
Application submission, management and manetization in Firefox MarketplaceNoritada Shimizu
 
つくろう!Firefox OS アプリ
つくろう!Firefox OS アプリつくろう!Firefox OS アプリ
つくろう!Firefox OS アプリNoritada Shimizu
 
20150118 firefoxos-handson-helloworld
20150118 firefoxos-handson-helloworld20150118 firefoxos-handson-helloworld
20150118 firefoxos-handson-helloworldNoritada Shimizu
 
20141115 fx os-codereading
20141115 fx os-codereading20141115 fx os-codereading
20141115 fx os-codereadingNoritada Shimizu
 
20141030 html5j-firefox os-deviceapi
20141030 html5j-firefox os-deviceapi20141030 html5j-firefox os-deviceapi
20141030 html5j-firefox os-deviceapiNoritada Shimizu
 
20140830 firefox os-sampler
20140830 firefox os-sampler20140830 firefox os-sampler
20140830 firefox os-samplerNoritada Shimizu
 
20140801 webrtc on-firefox
20140801 webrtc on-firefox20140801 webrtc on-firefox
20140801 webrtc on-firefoxNoritada Shimizu
 

Mehr von Noritada Shimizu (20)

2016 gunma.web games-and-asm.js
2016 gunma.web games-and-asm.js2016 gunma.web games-and-asm.js
2016 gunma.web games-and-asm.js
 
20151224-games
20151224-games20151224-games
20151224-games
 
20151128 firefoxos-handson
20151128 firefoxos-handson20151128 firefoxos-handson
20151128 firefoxos-handson
 
20151117 devtools
20151117 devtools20151117 devtools
20151117 devtools
 
Inspection & Tweak: Firefox を使ったフロント開発
Inspection & Tweak: Firefox を使ったフロント開発Inspection & Tweak: Firefox を使ったフロント開発
Inspection & Tweak: Firefox を使ったフロント開発
 
20150822 osc-shimane
20150822 osc-shimane20150822 osc-shimane
20150822 osc-shimane
 
20150829 firefox-os-handson
20150829 firefox-os-handson20150829 firefox-os-handson
20150829 firefox-os-handson
 
20150829 firefox-os
20150829 firefox-os20150829 firefox-os
20150829 firefox-os
 
20150727 Development tools for Firefox OS apps
20150727 Development tools for Firefox OS apps20150727 Development tools for Firefox OS apps
20150727 Development tools for Firefox OS apps
 
Firefox OS でアプリを作るときに気をつけたい N 個のこと
Firefox OS  でアプリを作るときに気をつけたい N 個のことFirefox OS  でアプリを作るときに気をつけたい N 個のこと
Firefox OS でアプリを作るときに気をつけたい N 個のこと
 
Firefox OSアプリ開発ハンズオン(Hello World編)
Firefox OSアプリ開発ハンズオン(Hello World編)Firefox OSアプリ開発ハンズオン(Hello World編)
Firefox OSアプリ開発ハンズオン(Hello World編)
 
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)
WebVR(html5j TV部、WebVRとかVRのUIとか勉強会)
 
Application submission, management and manetization in Firefox Marketplace
Application submission, management and manetization in Firefox MarketplaceApplication submission, management and manetization in Firefox Marketplace
Application submission, management and manetization in Firefox Marketplace
 
つくろう!Firefox OS アプリ
つくろう!Firefox OS アプリつくろう!Firefox OS アプリ
つくろう!Firefox OS アプリ
 
20150118 firefoxos-handson-helloworld
20150118 firefoxos-handson-helloworld20150118 firefoxos-handson-helloworld
20150118 firefoxos-handson-helloworld
 
20141115 fx os-codereading
20141115 fx os-codereading20141115 fx os-codereading
20141115 fx os-codereading
 
20141030 html5j-firefox os-deviceapi
20141030 html5j-firefox os-deviceapi20141030 html5j-firefox os-deviceapi
20141030 html5j-firefox os-deviceapi
 
20140830 firefox os-sampler
20140830 firefox os-sampler20140830 firefox os-sampler
20140830 firefox os-sampler
 
20140801 webrtc on-firefox
20140801 webrtc on-firefox20140801 webrtc on-firefox
20140801 webrtc on-firefox
 
20140702 webide
20140702 webide20140702 webide
20140702 webide
 

Kürzlich hochgeladen

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 

Kürzlich hochgeladen (9)

【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 

Is EDINET 5 star?