SlideShare ist ein Scribd-Unternehmen logo
1 von 7
Downloaden Sie, um offline zu lesen
データマネジメント概論
ーダベンポート、AWS、そしてデータサイエンティストー
中小企業診断士
岡野 道太郎
データマネジメントの歴史
• データベース(ツリー、ネットワーク)
• RDB:コッド博士→ラリー・エリソン(Oracle)
• データウェアハウス:ビル・インモン
• テラデータ
• データアナリティクス/データマイニング
• ダベンポート
• ビッグデータ解析+IoT
• データアナリティクス3.0
データアナリティクスのアーキテクチャ
• 全体像:
※IoTの場合、RDBで
なくNoSQLを使うこ
とも
※生産現場でアナロ
グのカウンタ、メー
タは機械学習(深層
学習)を使ってデジ
タル化可能
※センサ、PLCとGW
のつなぎはRS-485の
有線等、まだある
技術的ポイントを個別に
• RDBとデータウェアハウス
• データウェアハウスは更新が遅いものが多いため、トランザクション処理に
間に合わない。そこで、トランザクション処理は更新が早いRDB(MySQL
等)で行い、そのデータを後でまとめてデータウェアハウス(RedShift,テラ
データ等)に送る。その際データ変換に使うのがETLツールで Talendが有名
• データウェアハウスはNoSQL系を使うのが多い。NoSQLはこのほかにセッ
ションの代わりとして使うものがある( Redis,Memcached等)
• SQLでWindow関数が出てきて、データは扱いやすくなった
• BIツールとデータ分析
• 現場の人などがデータを使った分析をするにはOLAP/BIツールがいい(ドリル
ダウン、ダイス、スライス)有名どころはTableau,QlikView
• データアナリストが分析する場合はSPSS、RやScikit learnを使う
技術的ポイントを個別に(つづき)
• 通信
• 端末からクラウドへもっていくならAWS IoT経由→AWS Lambdaで送り、そ
こからAWS RDSと考えがちだが、これはアンチバターン
• https://qiita.com/teradonburi/items/86400ea82a65699672ad →NoSQLの利用
• 理屈ではソラコムの3G USBドングルを使えば、端末からAWS IoTにアク
セスはできる。ただ、料金や端末の性能を考えたときは、それがベストな選
択かどうかは?
• 生産現場はPLC+RS485の有線→インターネットでない(IoTでない)
• なんでもインターネットで接続する必要ある(インターネットは高くつくことも)?
• クラウド
• どこをクラウドにもっていくか(なんでもAWS?)
• 端末・GW
• PoCならラズパイでOKだが、実務ではラズパイだと電源・価格で問題
話題
• 昔、イトーヨーカドーがデータ分析で有名になった
• 仮説検証
• アカデミック的には、仮説発見と仮説検証の2つがある
• 仮説発見にはグラウンデッド・セオリー:アナログでは・・・・
• 現場とデータアナリストの間に・・・
1. 金儲けする方法を教えろ
2. 市場はどうなっていて、この商品はウケるのか?(STP分析)
3. ウケるための要因抽出((探索的)因子分析・コレポン)
4. Scikit learnで因子分析する
→2が現場、3がアナリストが理想だが、実際は1で手放される・・・
話題(つづき)
• セクシーな仕事はデータサイエンティスト!
• その一方でマーケターは昔ほど評価されないが、データサイエンティ
ストとマーケターの統計解析手法は異なる(主成分か因子分析か)
• モデルの考え方の違い
• 過去のデータからモデルを作る:データサイエンティスト
• モデルは誤差から真の値を救い出すためのフィルタ:マーケター
• 本当に、本当に・・・IoTなら5Gなの?
• 通信料考えてる?(通信量は考えてると思うけど)
• ローカル5Gやるの、やらないならどうするの?
• 「無線は切れる」が本来前提
• 通信を高度化すると、端末が肥大に→電源の確保
→結局、採算合うの?

Weitere ähnliche Inhalte

Ähnlich wie データマネジメント概論

データを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とはデータを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とは
griddb
 
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント
griddb
 

Ähnlich wie データマネジメント概論 (20)

もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
 
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
[db tech showcase Tokyo 2015] B12:カラムストアデータベースの技術と活用法 by 日本電気株式会社 田村稔
 
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
事例から見るNoSQLの使い方 - db tech showcase Tokyo 2015 2015/06/11
 
もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!?~両者を備えたスケールアウトデータベースGridDB~
 
Strata conference 2012
Strata conference 2012Strata conference 2012
Strata conference 2012
 
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version - ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
ビッグデータ処理データベースの全体像と使い分け - 2017年 Version -
 
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
 
ビッグデータやIoTシステムを支えるデータベース 『GridDB』
ビッグデータやIoTシステムを支えるデータベース 『GridDB』ビッグデータやIoTシステムを支えるデータベース 『GridDB』
ビッグデータやIoTシステムを支えるデータベース 『GridDB』
 
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
[db tech showcase Tokyo 2018] #dbts2018 #E28 『Hadoop DataLakeにリアルタイムでデータをレプリケ...
 
0151209 Oracle DDD OracleとHadoop連携の勘所
0151209 Oracle DDD OracleとHadoop連携の勘所0151209 Oracle DDD OracleとHadoop連携の勘所
0151209 Oracle DDD OracleとHadoop連携の勘所
 
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
Impala + Kudu を用いたデータウェアハウス構築の勘所 (仮)
 
ビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分けビッグデータ処理データベースの全体像と使い分け
ビッグデータ処理データベースの全体像と使い分け
 
【IVS CTO Night & Day】AWSにおけるビッグデータ活用
【IVS CTO Night & Day】AWSにおけるビッグデータ活用【IVS CTO Night & Day】AWSにおけるビッグデータ活用
【IVS CTO Night & Day】AWSにおけるビッグデータ活用
 
アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門アプリケーション開発者のためのAzure Databricks入門
アプリケーション開発者のためのAzure Databricks入門
 
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
[db tech showcase Tokyo 2017] A32: Attunity Replicate + Kafka + Hadoop マルチデータ...
 
データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門データ分析を支える技術 DWH再入門
データ分析を支える技術 DWH再入門
 
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
【ウェブ セミナー】AI 時代のクラウド データ ウェアハウス Azure SQL Data Warehouse [実践編]
 
データを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とはデータを事業に活かすために必要なデータ基盤とは
データを事業に活かすために必要なデータ基盤とは
 
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
[db tech showcase Tokyo 2017] E23: クラウド異種データベース(AWS)へのデータベース移行時の注意点 ~レプリケーション...
 
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント
【GridDB入門】 IoT、そしてサイバー・フィジカル・システムを支える オープンソースデータベース GridDB ~ こだわりの理由と実現方法のポイント
 

Mehr von Michitaro Okano

Mehr von Michitaro Okano (20)

イノベーションについて
イノベーションについてイノベーションについて
イノベーションについて
 
機械学習によるモデル自動生成の一考察 ー 決定表と決定木によるアプローチ -
機械学習によるモデル自動生成の一考察 ー 決定表と決定木によるアプローチ -機械学習によるモデル自動生成の一考察 ー 決定表と決定木によるアプローチ -
機械学習によるモデル自動生成の一考察 ー 決定表と決定木によるアプローチ -
 
高校・大学(院)の統計学の俯瞰図
高校・大学(院)の統計学の俯瞰図高校・大学(院)の統計学の俯瞰図
高校・大学(院)の統計学の俯瞰図
 
ワクワクする商店・製品を作るには?
ワクワクする商店・製品を作るには?ワクワクする商店・製品を作るには?
ワクワクする商店・製品を作るには?
 
経営学の俯瞰図
経営学の俯瞰図経営学の俯瞰図
経営学の俯瞰図
 
GSNを利用したゴール指向要求分析における要求間の依存性の検証手法に関する提案
GSNを利用したゴール指向要求分析における要求間の依存性の検証手法に関する提案GSNを利用したゴール指向要求分析における要求間の依存性の検証手法に関する提案
GSNを利用したゴール指向要求分析における要求間の依存性の検証手法に関する提案
 
機械学習活用のための要求分析手法の研究 AI版酒屋倉庫問題のケース
機械学習活用のための要求分析手法の研究 AI版酒屋倉庫問題のケース機械学習活用のための要求分析手法の研究 AI版酒屋倉庫問題のケース
機械学習活用のための要求分析手法の研究 AI版酒屋倉庫問題のケース
 
ゴール指向要求分析における不確かさの考察 ~ IoT・AIのケース ~
ゴール指向要求分析における不確かさの考察 ~ IoT・AIのケース ~ゴール指向要求分析における不確かさの考察 ~ IoT・AIのケース ~
ゴール指向要求分析における不確かさの考察 ~ IoT・AIのケース ~
 
IoT活用システムへのゴール指向要求分析の適用に関する考察
IoT活用システムへのゴール指向要求分析の適用に関する考察IoT活用システムへのゴール指向要求分析の適用に関する考察
IoT活用システムへのゴール指向要求分析の適用に関する考察
 
AI・機械学習の活用におけるソフトウェア工学の今後の課題~ノンプログラミングで作成する予測APIの事例から~
AI・機械学習の活用におけるソフトウェア工学の今後の課題~ノンプログラミングで作成する予測APIの事例から~AI・機械学習の活用におけるソフトウェア工学の今後の課題~ノンプログラミングで作成する予測APIの事例から~
AI・機械学習の活用におけるソフトウェア工学の今後の課題~ノンプログラミングで作成する予測APIの事例から~
 
ゴール指向分析KAOSにおける依存性を考慮した要求抽出法の考察
ゴール指向分析KAOSにおける依存性を考慮した要求抽出法の考察ゴール指向分析KAOSにおける依存性を考慮した要求抽出法の考察
ゴール指向分析KAOSにおける依存性を考慮した要求抽出法の考察
 
状態と状態遷移に着目したゴール指向要求分析手法の考察
状態と状態遷移に着目したゴール指向要求分析手法の考察状態と状態遷移に着目したゴール指向要求分析手法の考察
状態と状態遷移に着目したゴール指向要求分析手法の考察
 
中小規模のIoT
中小規模のIoT中小規模のIoT
中小規模のIoT
 
Rによるデータ分析手順入門
Rによるデータ分析手順入門Rによるデータ分析手順入門
Rによるデータ分析手順入門
 
仮説とデータ解析の関係2
仮説とデータ解析の関係2仮説とデータ解析の関係2
仮説とデータ解析の関係2
 
仮説とデータ解析の関係
仮説とデータ解析の関係仮説とデータ解析の関係
仮説とデータ解析の関係
 
ゴール指向要求分析における構成要素に着目した分解に関する一考察
ゴール指向要求分析における構成要素に着目した分解に関する一考察ゴール指向要求分析における構成要素に着目した分解に関する一考察
ゴール指向要求分析における構成要素に着目した分解に関する一考察
 
A study on the or decomposition of goal-oriented analysis using GSN
A study on the or decomposition of goal-oriented analysis using GSNA study on the or decomposition of goal-oriented analysis using GSN
A study on the or decomposition of goal-oriented analysis using GSN
 
要求分析におけるゴール抽出パターンについての考察
要求分析におけるゴール抽出パターンについての考察要求分析におけるゴール抽出パターンについての考察
要求分析におけるゴール抽出パターンについての考察
 
要求獲得過程の観測と評価に関するツールの開発
要求獲得過程の観測と評価に関するツールの開発要求獲得過程の観測と評価に関するツールの開発
要求獲得過程の観測と評価に関するツールの開発
 

データマネジメント概論