Suche senden
Hochladen
DataProcessingInBuffettCode-20190213
•
2 gefällt mir
•
1,294 views
Shu (shoe116)
Folgen
バフェットコード(https://www.buffett-code.com/)における、データ処理の考え方をXBRLを例に話しました。
Weniger lesen
Mehr lesen
Daten & Analysen
Melden
Teilen
Melden
Teilen
1 von 16
Jetzt herunterladen
Downloaden Sie, um offline zu lesen
Empfohlen
ngx_mrubyを用いた柔軟なABテスト基盤
ngx_mrubyを用いた柔軟なABテスト基盤
Recruit Lifestyle Co., Ltd.
DLLab 異常検知ナイト 資料 20180214
DLLab 異常検知ナイト 資料 20180214
Kosuke Nakago
Hadoopエコシステムのデータストア振り返り
Hadoopエコシステムのデータストア振り返り
NTT DATA OSS Professional Services
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
Preferred Networks
イミュータブルデータモデル(入門編)
イミュータブルデータモデル(入門編)
Yoshitaka Kawashima
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
Hiroshi Ito
グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?
Insight Technology, Inc.
イミュータブルデータモデルの極意
イミュータブルデータモデルの極意
Yoshitaka Kawashima
Empfohlen
ngx_mrubyを用いた柔軟なABテスト基盤
ngx_mrubyを用いた柔軟なABテスト基盤
Recruit Lifestyle Co., Ltd.
DLLab 異常検知ナイト 資料 20180214
DLLab 異常検知ナイト 資料 20180214
Kosuke Nakago
Hadoopエコシステムのデータストア振り返り
Hadoopエコシステムのデータストア振り返り
NTT DATA OSS Professional Services
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
PFN のオンプレML基盤の取り組み / オンプレML基盤 on Kubernetes 〜PFN、ヤフー〜
Preferred Networks
イミュータブルデータモデル(入門編)
イミュータブルデータモデル(入門編)
Yoshitaka Kawashima
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
データ履歴管理のためのテンポラルデータモデルとReladomoの紹介 #jjug_ccc #ccc_g3
Hiroshi Ito
グラフデータベースは如何に自然言語を理解するか?
グラフデータベースは如何に自然言語を理解するか?
Insight Technology, Inc.
イミュータブルデータモデルの極意
イミュータブルデータモデルの極意
Yoshitaka Kawashima
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
NTT DATA OSS Professional Services
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
幸太朗 岩澤
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Preferred Networks
MLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめ
Kenichi Sonoda
これがCassandra
これがCassandra
Takehiro Torigaki
Bluetooth meshの基礎
Bluetooth meshの基礎
PIXELAcorporation
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
GREE VR Studio Lab
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
DeNA
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
Yusuke Uchida
強いて言えば「集約どう実装するのかな、を考える」な話
強いて言えば「集約どう実装するのかな、を考える」な話
Yoshitaka Kawashima
グラフ構造のデータモデルをPower BIで可視化してみた
グラフ構造のデータモデルをPower BIで可視化してみた
CData Software Japan
MapReduce入門
MapReduce入門
Satoshi Noto
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
Holden Karau
ゆとり向けErlang入門 (1): メッセージパッシングことはじめ
ゆとり向けErlang入門 (1): メッセージパッシングことはじめ
sleepy_yoshi
番組宣伝に関するAbemaTV分析事例の紹介
番組宣伝に関するAbemaTV分析事例の紹介
cyberagent
機械学習を使った時系列売上予測
機械学習を使った時系列売上予測
DataRobotJP
ServiceとRepository
ServiceとRepository
シオリ ショウノ
情報検索の基礎
情報検索の基礎
Retrieva inc.
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
Preferred Networks
Hadoop -NameNode HAの仕組み-
Hadoop -NameNode HAの仕組み-
Yuki Gonda
情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion
Rakuten Group, Inc.
FluentdやNorikraを使った データ集約基盤への取り組み紹介
FluentdやNorikraを使った データ集約基盤への取り組み紹介
Recruit Technologies
Weitere ähnliche Inhalte
Was ist angesagt?
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
NTT DATA OSS Professional Services
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
幸太朗 岩澤
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Preferred Networks
MLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめ
Kenichi Sonoda
これがCassandra
これがCassandra
Takehiro Torigaki
Bluetooth meshの基礎
Bluetooth meshの基礎
PIXELAcorporation
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
GREE VR Studio Lab
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
DeNA
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
Yusuke Uchida
強いて言えば「集約どう実装するのかな、を考える」な話
強いて言えば「集約どう実装するのかな、を考える」な話
Yoshitaka Kawashima
グラフ構造のデータモデルをPower BIで可視化してみた
グラフ構造のデータモデルをPower BIで可視化してみた
CData Software Japan
MapReduce入門
MapReduce入門
Satoshi Noto
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
Holden Karau
ゆとり向けErlang入門 (1): メッセージパッシングことはじめ
ゆとり向けErlang入門 (1): メッセージパッシングことはじめ
sleepy_yoshi
番組宣伝に関するAbemaTV分析事例の紹介
番組宣伝に関するAbemaTV分析事例の紹介
cyberagent
機械学習を使った時系列売上予測
機械学習を使った時系列売上予測
DataRobotJP
ServiceとRepository
ServiceとRepository
シオリ ショウノ
情報検索の基礎
情報検索の基礎
Retrieva inc.
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
Preferred Networks
Hadoop -NameNode HAの仕組み-
Hadoop -NameNode HAの仕組み-
Yuki Gonda
Was ist angesagt?
(20)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
Apache Sparkに手を出してヤケドしないための基本 ~「Apache Spark入門より」~ (デブサミ 2016 講演資料)
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
7. Vertex AI Model Registryで BigQuery MLのモデルを管理する
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
Kaggle Happywhaleコンペ優勝解法でのOptuna使用事例 - 2022/12/10 Optuna Meetup #2
MLflowで学ぶMLOpsことはじめ
MLflowで学ぶMLOpsことはじめ
これがCassandra
これがCassandra
Bluetooth meshの基礎
Bluetooth meshの基礎
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
強化学習を利用した自律型GameAIの取り組み ~高速自動プレイによるステージ設計支援~ #denatechcon
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
SIGNATE オフロードコンペ 精度認識部門 3rd Place Solution
強いて言えば「集約どう実装するのかな、を考える」な話
強いて言えば「集約どう実装するのかな、を考える」な話
グラフ構造のデータモデルをPower BIで可視化してみた
グラフ構造のデータモデルをPower BIで可視化してみた
MapReduce入門
MapReduce入門
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
PySparkによるジョブを、より速く、よりスケーラブルに実行するための最善の方法 ※講演は翻訳資料にて行います。 - Getting the Best...
ゆとり向けErlang入門 (1): メッセージパッシングことはじめ
ゆとり向けErlang入門 (1): メッセージパッシングことはじめ
番組宣伝に関するAbemaTV分析事例の紹介
番組宣伝に関するAbemaTV分析事例の紹介
機械学習を使った時系列売上予測
機械学習を使った時系列売上予測
ServiceとRepository
ServiceとRepository
情報検索の基礎
情報検索の基礎
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
PyData.Tokyo Meetup #21 講演資料「Optuna ハイパーパラメータ最適化フレームワーク」太田 健
Hadoop -NameNode HAの仕組み-
Hadoop -NameNode HAの仕組み-
Ähnlich wie DataProcessingInBuffettCode-20190213
情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion
Rakuten Group, Inc.
FluentdやNorikraを使った データ集約基盤への取り組み紹介
FluentdやNorikraを使った データ集約基盤への取り組み紹介
Recruit Technologies
AutoEncoderで特徴抽出
AutoEncoderで特徴抽出
Kai Sasaki
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
Insight Technology, Inc.
[社内勉強会]エンジニアな僕の情報収集法
[社内勉強会]エンジニアな僕の情報収集法
Takahiro Moteki
OSSとクラウドによるコンピューティングモデルの変化
OSSとクラウドによるコンピューティングモデルの変化
Nobuyori Takahashi
データをどこに溜めよう?ローカル?クラウド?どのデータベース?
データをどこに溜めよう?ローカル?クラウド?どのデータベース?
- Core Concept Technologies
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
Developers Summit
Big data解析ビジネス
Big data解析ビジネス
Mie Mori
Firestoreを勉強してみた
Firestoreを勉強してみた
ishikawa akira
Mr201206 no sql_security
Mr201206 no sql_security
FFRI, Inc.
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
Insight Technology, Inc.
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
Atsushi Kurumada
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
Recruit Technologies
[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoop
[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoop
Insight Technology, Inc.
1,000,000 foot view of Hadoop-like parallel data processing systems
1,000,000 foot view of Hadoop-like parallel data processing systems
Hiroyuki Yamada
データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜
データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜
Kazuhiro Mitsuhashi
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Hadoop / Spark Conference Japan
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
griddb
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
Recruit Technologies
Ähnlich wie DataProcessingInBuffettCode-20190213
(20)
情報爆発シンポジウム infoplosion
情報爆発シンポジウム infoplosion
FluentdやNorikraを使った データ集約基盤への取り組み紹介
FluentdやNorikraを使った データ集約基盤への取り組み紹介
AutoEncoderで特徴抽出
AutoEncoderで特徴抽出
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[db tech showcase Tokyo 2017] C25: 世界最速のAnalytic DBがHadoopとタッグを組んだ! ~スケールアウト検...
[社内勉強会]エンジニアな僕の情報収集法
[社内勉強会]エンジニアな僕の情報収集法
OSSとクラウドによるコンピューティングモデルの変化
OSSとクラウドによるコンピューティングモデルの変化
データをどこに溜めよう?ローカル?クラウド?どのデータベース?
データをどこに溜めよう?ローカル?クラウド?どのデータベース?
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
【17-E-3】Hadoop:黄色い象使いへの道 ~「Hadoop徹底入門」より~
Big data解析ビジネス
Big data解析ビジネス
Firestoreを勉強してみた
Firestoreを勉強してみた
Mr201206 no sql_security
Mr201206 no sql_security
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
リクルートライフスタイルの考えるストリームデータの活かし方(Hadoop Spark Conference2016)
ビッグデータ&データマネジメント展
ビッグデータ&データマネジメント展
[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoop
[INSIGHT OUT 2011] b21 ひとつのデータベース技術では生き残れない part2 no sql, hadoop
1,000,000 foot view of Hadoop-like parallel data processing systems
1,000,000 foot view of Hadoop-like parallel data processing systems
データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜
データ集計基盤のいままでとこれから 〜Hadoopからdataflowまで使い込んだ経験を徹底共有〜
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
Sparkによる GISデータを題材とした時系列データ処理 (Hadoop / Spark Conference Japan 2016 講演資料)
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
オープンソースのビッグデータ・IoT向け スケールアウト型データベースGridDBとPython連携 〜GridDBとPythonと私〜
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
Mehr von Shu (shoe116)
GCPでStreamなデータパイプライン作った
GCPでStreamなデータパイプライン作った
Shu (shoe116)
オープンデータを利用した企業分析ツール"Buffett-Code"について
オープンデータを利用した企業分析ツール"Buffett-Code"について
Shu (shoe116)
データ分析基盤の憂鬱と退屈
データ分析基盤の憂鬱と退屈
Shu (shoe116)
analists_rating_by_lda_hackday_201702
analists_rating_by_lda_hackday_201702
Shu (shoe116)
データサイエンティストの憂鬱と退屈
データサイエンティストの憂鬱と退屈
Shu (shoe116)
idoling_approval_desire
idoling_approval_desire
Shu (shoe116)
tokyo_webmining_no51
tokyo_webmining_no51
Shu (shoe116)
Hadoop Ops & Fabric
Hadoop Ops & Fabric
Shu (shoe116)
エンジニアが日々何を考えているのか、ということ
エンジニアが日々何を考えているのか、ということ
Shu (shoe116)
Mehr von Shu (shoe116)
(9)
GCPでStreamなデータパイプライン作った
GCPでStreamなデータパイプライン作った
オープンデータを利用した企業分析ツール"Buffett-Code"について
オープンデータを利用した企業分析ツール"Buffett-Code"について
データ分析基盤の憂鬱と退屈
データ分析基盤の憂鬱と退屈
analists_rating_by_lda_hackday_201702
analists_rating_by_lda_hackday_201702
データサイエンティストの憂鬱と退屈
データサイエンティストの憂鬱と退屈
idoling_approval_desire
idoling_approval_desire
tokyo_webmining_no51
tokyo_webmining_no51
Hadoop Ops & Fabric
Hadoop Ops & Fabric
エンジニアが日々何を考えているのか、ということ
エンジニアが日々何を考えているのか、ということ
DataProcessingInBuffettCode-20190213
1.
バフェットコードのデータ処理 -XBRLのデータ構造とparserの話- @shoe116
2.
0. 今日話すこと 1. 自己紹介的な 2.
バフェットコードについて ○ バフェットコードって何? ○ バフェットコードが生まれたわけ 3. バフェットコードの日次データ処理 4. XBRLデータ構造とparserの話 ○ XBRLとは ○ XBRLのデータ構造 ○ データ処理におけるparserの考え方 5. まとめ
3.
1. 自己紹介的な なまえ:しゅう (@shoe116) お仕事:広告系エンジニア→データ分析基盤屋さん 推し事:ももくろ→でんぱ組→BiSH→CY8ER、オサカナ 関連語:Hadoop,
Kafka, Storm, Tez, Beam, Cloud Dataflow 開発言語:Java or Scala, Python, Go バフェットコードはデータ処理を中心にwebアプリ以外を担当
4.
2.1 バフェットコードって何? オープンデータを用いた、効率的な企業分析を行うためのwebサイト 使い方は、https://www.buffett-code.com/ にアクセスするだけ 主な機能は以下の3つ 1.
財務・株価データの参照 2. スクリーニング 3. 企業比較 最近、ようやく有料機能出した
5.
機能①. 企業別財務数値・株価指標の参照 ● 国内の上場企業データベースを可視化して提供 ○
検索窓に企業名or銘柄コードを入力 ○ 業種から銘柄を探すことも可能 ○ 例:任天堂の企業詳細ページ ● 企業ごとに以下のデータを提供 ○ 基本的な財務数値と株価指標 ○ 株価推移とヒストリカルマルチプル ○ 大株主情報 ○ 四半期毎の業績と業績予想 ○ 開示資料へのリンク集
6.
機能②. スクリーニング(条件検索) 投資基準に当てはまる企業を検索する https://www.buffett-code.com/screening ● 多彩な検索条件を指定可能 ○
P/L、B/S、C/S ○ 収益性と成長性、財務健全性 ○ 財務数値 ○ キャッシュフロー ○ 研究開発費や上場年数
7.
機能③. 企業比較 複数企業の財務データ・株価指数を、指定した科目で一覧比較 https://www.buffett-code.com/comps ● 柔軟な科目指定 ●
見やすい表示 ○ 最大・最小を色付け ○ 代表値の自動表示 ● 同一銘柄の新旧比較も可能 ○ 3年前のデータの表示
8.
2.2 バフェットコードが生まれたわけ We created Buffet-Code
9.
3. バフェットコードの日次データ加工処理 1. OPENデータ(XBRL
file)を取得、保存 ○ EDINETから、該当日発行分の有価証券報告書(有報)を取得 ○ TDNETから、該当日発行分の決算短信を取得 ○ Edgarから、該当日発行分の10-K, 10-Qを取得 ○ それぞれをオブジェクトストレージに保存 2. 取得したXBRL fileをparseし、RDBに格納 3. 格納されたデータと、当日の株価を元に財務数値を計算、RDBに格納 4. RDB上のスクリーニング、比較用のデータセットを更新
10.
4.1 XBRLとは ● eXtensible
Business Reporting Language ● Edinet, Tdnet, Edgar 等から結構いい感じにDLできるXML ○ Edinet http://disclosure.edinet-fsa.go.jp ○ Tdnet https://www.jpx.co.jp/equities/listing/tdnet/index.html ○ Edgar https://www.sec.gov/edgar.shtml ● XMLのタグごとに、データが入っている $ grep ‘jppfs_cor:NetSales’ test.xbrl <jppfs_cor:NetSales contextRef="Prior1YearDuration" unitRef="JPY" decimals="-3">41275187000</jppfs_cor:NetSales> <jppfs_cor:NetSales contextRef="CurrentYearDuration" unitRef="JPY" decimals="-3">45089432000</jppfs_cor:NetSales>
11.
4.2 XBRLのデータ構造 Tag - contextRef -
unitRef - decimals - value - XBRLには、簡単に言うと ↓ の配列が入っている - 使うときはTag と contextRefでvalueを特定しdecimalsでオフセット - ライブラリ書いたよ! https://github.com/BuffetCode/edinet_xbrl <jppfs_cor:NetSales contextRef="Prior1YearDuration" unitRef="JPY" decimals="-3">41275187000</jppfs_cor:NetSales>
12.
4.3 データ処理におけるparserの考え方 ● 死ぬほど当たり前だけど、parse
:= Inv format ● 感覚的にはserializerとdeserializerを実装するときと似ている ○ 論理的なデータ構造は変えず、物理的なAlignmentだけ変換する ● 論理的なデータ構造から設計するべき 1. 論理的な財務データを考える (FinancialsObject) 2. def XBRL.formatter(financials: FinancialsObject) : XBRLFile を想像する 3. def XBRL.parser(xbrl: XBRLFile): FinancialsObject が決まる ● 論理的な中間表現を介して変換のペアを書くときれいに作れる ○ XBRL => JSONならXBRL parserとJSON Formatter ○ XBRL => TableRowなら、XBRL parserとTableRow Formatter
13.
4.4 「XBRLのparseは難しい」という人へ ● 難しいのparseじゃなくてformat ○
nestしているので、RDBのrowとかCSVにするのは難しい ○ XBRLってつまりXMLなので、難しいはずない ● Parserにparse以外のロジックを書いているコードはよく見る ○ 必要な情報だけ抽出する、内部の変数を上書きするetc ○ 戻り値をformatterに食わせて元に戻らないのはparserじゃない ● XX2YYConverterは↓って実装すると読みやすいしテストしやすい def convert(input: XX): YY obj = XXParser.parse(input) YYFormatter.format(obj)
14.
5. Appendix
15.
Buffett-Codeの現状 1. Buffett-Codeと周辺サービス ○ メインのWebアプリケーション
https://www.buffett-code.com/ ○ フォロワー26.5K超のTwitter https://twitter.com/buffett_code ○ 企業分析に役立つBlog https://blog.buffett-code.com/ ○ CampFire https://camp-fire.jp/projects/view/114594 2. Buffett-Codeの技術発信 ○ OSSの公開 https://github.com/buffetcode ○ Python Packageの公開 https://pypi.org/project/edinet-xbrl/ ○ Buffett-Codeの内部技術の紹介 ■ https://qiita.com/shoe116/items/dd362ad880f2b6baa96f ■ https://qiita.com/shoe116/items/a7b688d05b699cf403a1
16.
● Buffett-Code ○ WebApp
https://www.buffett-code.com/ ○ Usage https://blog.buffett-code.com/entry/18/02/01 ○ Twitter https://twitter.com/buffett_code ○ Blog https://blog.buffett-code.com/ ○ GitHub https://github.com/buffetcode ○ Dev Docs https://qiita.com/shoe116/items/dd362ad880f2b6baa96f ● Data Sources ○ Edinet, http://disclosure.edinet-fsa.go.jp ○ Tdnet, https://www.jpx.co.jp/equities/listing/tdnet/index.html ○ Edgar, https://www.sec.gov/edgar/searchedgar/companysearch.html ● XBRL Info ○ XBRL.org https://www.xbrl.org/ ○ 有報キャッチャー https://ufocatch.com/
Jetzt herunterladen