SlideShare ist ein Scribd-Unternehmen logo
1 von 32
Downloaden Sie, um offline zu lesen
© 2021 Toshiba Digital Solutions Corporation
第2回 AI/Analyticsカンファレンス
東芝デジタルソリューションズ株式会社
新規事業開発部 シニアエキスパート 望月 進一郎
2021年8月27日
データを事業に活かすために
必要なデータ基盤とは
2
© 2021 Toshiba Digital Solutions Corporation
東芝デジタルソリューションズ 2021年4月14日現在
リテール&プリンティングソリューション事業領域
エネルギーシステムソリューション事業領域
インフラシステムソリューション事業領域
東芝エネルギーシステムズ(株)
東芝インフラシステムズ(株)
(株)東芝
デジタルソリューション事業領域
東芝デジタルソリューションズ(株) (株)東芝 執行役上席常務
東芝デジタルソリューションズ(株)
取締役社長
島田 太郎
東芝デジタル&コンサルティング(株)
代表執行役社長
CEO
綱川 智 東芝テック(株)
ビルソリューション事業領域
東芝エレベータ(株) 東芝ライテック(株)
デバイス&ストレージソリューション事業領域
東芝デバイス&ストレージ(株)
東芝キヤリア(株)
3
© 2021 Toshiba Digital Solutions Corporation
東芝デジタルソリューションズ 会社概要
名称
名称
本社所在地
設立年月日
事業内容
資本金
売上高
関係会社
東芝デジタルソリューションズ株式会社(英文名 Toshiba Digital Solutions Corporation)
神奈川県川崎市幸区堀川町72番地34
2003年10月1日
システムインテグレーション及びIoT/AIを活用したICTソリューションの開発・製造・販売
235億円(東芝100%)
2,217億円(連結/2021年3月期)
8社(国内7社、海外1社)
従業員数 (単独) 3,816人 (連結) 8,247人 (2021年3月現在)
取締役社長 島田 太郎
【関係会社】
• 東芝デジタル&コンサルティング(株)・・・
• 東芝情報システム(株)・・・・・・・・・・
• 東芝ITサービス(株)・・・・・・・・・・・・
• 日本システム(株)・・・・・・・・・・・・・・
• 中部東芝エンジニアリング (株) ・・・・
• 九州東芝エンジニアリング (株) ・・・・
• イー・ビー・ソリューションズ (株) ・・・・
• 東芝瀋陽情報システム社・・・・・・・・
半導体エンジニアリング
地域対応SI、半導体エンジニアリング
各種コンサルティング
中国システム販売
デジタルビジネス戦略コンサルティング
SI、組込、半導体エンジニアリング
IT系保守、運用サービス
SIソフト開発
4
© 2021 Toshiba Digital Solutions Corporation
本日のアジェンダ
 データを事業に活かす上での課題
 データを活かす手法
 データ基盤に求められる要件
 OSSを使ったデータ基盤
 データ基盤向けデータベースの例(GridDB)
 データ基盤とAutoMLを連携させたAIソリューション(ケーススタディ)
 これからのデータ基盤
5
© 2021 Toshiba Digital Solutions Corporation
データを事業に活かす
属人的な勘や経験からデータに基づく経営へ
AIやビッグデータ分析を使って、データを事業に
活かす試みが盛んに行われている。
しかしそのような試みは短期的にはうまく行っても、
長続きしないといった話もよく聞く。
なぜだろう?
6
© 2021 Toshiba Digital Solutions Corporation
継続的に精度よく運用するには、半自動化されたデータ基盤が必要!
AIプロジェクトにおけるデータ管理の課題
とりあえずデータを集め、AIを活用したシステムを稼働させることはできた。
しかしそれが続かない。
データ収集 データ加工 データ蓄積 モデル展開
モデルの
運用管理・更新
データを誰が管理して
いるのかわからない。
社外データの入手
方法がわからない。
データ加工に
手間がかかる。
データが増えすぎて
対応できない。
データが増えるに
したがい、遅くなる。
データが古くなり、
AIの精度が落ちる。
新しいデータを
取り込めない。
7
© 2021 Toshiba Digital Solutions Corporation
データを活かす手法
レポーティング分析 データを抽出・分類して、データの並べ替えやグラフ化(見える化)
を行う。BIツールによるダッシュボードなどもこの一部。
アドホック分析 定期的かつ定型的なレポート分析と違い、そのときに必要な分析を
行う。事前にデータが整備されていると素早く対応できる。
AI・機械学習 機械学習やディープラーニングなどのAI技術を活用して分析を行う。
トライアンドエラーによるモデル作りを行うことが多い。
モニタリング・監視 ログデータやストリーミングデータを使って、リアルタイムに異常検知など
の監視を行う。
ビッグデータ分析 大量かつ多様なデータをクロス集計やクラスター分析といった手法を
使って分析を行う。
8
© 2021 Toshiba Digital Solutions Corporation
集めるべきデータ
業種や予測したい事象により集めるべきデータは異なってくるが、共通して言えること。
分散と偏りのないデータが必要
たとえば全国の分析を行うときに、特定の地域に偏ったデータを使うと分析の精度が
落ちる。全国のデータをバランスよく用意するべき。
季節性・社会性を常時反映するための継続的なデータの収集を行うべき
継続的にデータを集め、最新のデータを使用することで、大きな社会変動にも
対応可能になる。
自社のデータだけでなく、外部のデータも必要
自社特有のデータに、他社のデータや人流データ、気象データなど外部のデータを
組み合わせることにより、精度の高い分析が可能になる。
9
© 2021 Toshiba Digital Solutions Corporation
集めたデータをデータ活用にスムーズに導くのがデータ基盤
データ基盤
データ
基盤
10
© 2021 Toshiba Digital Solutions Corporation
データ基盤を用意するにあたって
データ基盤は長期にわたって使用するもの。
分析手法ごとにデータ基盤を用意するのは非効率。
今必要な仕様を満たすだけでなく、将来の活用も想像しながら
検討する必要がある。
できるだけシンプルな構成が望ましい。
どんなことにデータを
活用したいだろう?
データはどれくらいの
規模になるだろう?
どんなツールと
連携させることに
なるだろうか?
運用コストは
どれくらいが
適切だろうか?
11
© 2021 Toshiba Digital Solutions Corporation
データ基盤に求められる要件
1. 様々なデータを扱える。
2. 高速に分析できる。
3. 各種収集・加工・分析ツールを包含する、または連携できる。
4. データが急増しても取りこぼしなく収集できる。
5. 蓄積するデータが増えていっても柔軟に拡張できる。
6. 運用・メンテナンスが簡単。
7. クラウドとオンプレミスに対応できる。
8. リアルタイムで分析できる。
12
© 2021 Toshiba Digital Solutions Corporation
OSSで実現するデータ基盤
データ基盤に関係するOSS
OSS活用で注意すべきこと
 OSSを使いこなすだけの
技術力が必要。
 OSS間をつなぐ開発や
検証が必要。
 最新技術が次々に出てくる。
逆に開発が停滞するOSSも
ある。OSSの見極めが必要。
日本OSS推進フォーラム作成「OSS鳥観図 2021年版」から抜粋。
http://ossforum.jp/index.php/choukanzu-wg/
ビッグデータ
Apache Solr
検索エンジン
©日本OSS推進フォーラム
Apache Zeppelin
Jupyter Notebook
R
データ分析
Apache Drill
Apache Hive
Apache Impala
Apache Phoenix
Presto
SQLクエリエンジン
Apache HBase
Apache Kudu
GridDB
Infinispan
Redis
VoltDB
データストア
Apache Flink
Apache Storm
Apache Spark Streaming
ストリーム処理
Ceph
GlusterFS
Lustre
分散ストレージ・
分散ファイルシステム
Apache Flume
Apache NiFi
Apache Sqoop
Fluentd
データ収集
Apache Hadoop
Apache Spark
分散処理
データベース
Apache Derby
Firebird
MariaDB
MySQL
PostgreSQL
SQLite
RDBMS
Vitess
DBクラスタリング
pgAdmin
phpMyAdmin
DB管理
JanusGraph
neo4j
グラフ型
Apache Cassandra
Berkeley DB
etcd
memcached
Redis
KVS
Apache CouchDB
Couchbase
Realm
ドキュメント指向
Aerospike
memcached
VoltDB
インメモリDB
Pleasanter
WEBデータベース
Apache Avro
Apache Parquet
データシリアライザ
Apache Airflow
ワークフロー・スケジューラ
Apache Ambari
Apache Atlas
Apache Ranger
Apache Sentry
運用管理
AI
Apache Spark Mllib
Scikit-learn
機械学習 ディープラーニング・フレームワーク
Apache MXNet
Caffe2
Chainer
CNTK
Deeplearning4j
Keras
PyTorch
TensorFlow
Theano
torch7
Apache ActiveMQ
Apache Kafka
NATS
RabbitMQ
メッセージング
Grafana
ダッシュボード
GridDB
InfluxDB
Prometheus
TimescaleDB
時系列
ArangoDB
マルチモデル
Apache ManifoldCF
Apache Nutch
クローラ
IoT
Espruino
KNIME
mosquitto
Node-RED (JP)
13
© 2021 Toshiba Digital Solutions Corporation
データ基盤向けデータベース GridDB
ビッグデータ・IoTシステムに最適な超高速スケールアウト型データベース。
従来のデータベースでは不可能だったビッグデータのリアルタイム分析が可能に。
5つの特長
• IoT指向のデータモデル
• 高性能
• スケーラビリティ
• 高い信頼性と可用性
• NoSQLとSQLデュアルIF
NoSQLインターフェイス … 大量高頻度のデータ収集にはNoSQL
SQLインターフェイス … 分析や他システムとの連携にはSQL
・・・・
BI/BA 他のデータベース
他のシステム
分析アプリ
ビッグデータ
IoTデータ
14
© 2021 Toshiba Digital Solutions Corporation
データ基盤向けクラウドデータベースサービス GridDB Cloud
高性能スケールアウト型データベースGridDBをコアに持つ
AIやビッグデータなどの分析を支えるデータベースサービス
パブリッククラウドで稼働するマネージドサービス
データ量や処理量の変動に柔軟に対応。
運用・監視は当社が一括して実行。
クラウドネイティブアプリと簡単・高速に連携
JDBCやWebAPIを介して簡単にデータにアクセス。
アプリを同じクラウドに配置すればオンプレミスと同様な高速アクセスが可能。
データ収集やデータの見える化機能が充実
FluentdやAzure IoT Edgeと連携したデータ登録や、Grafanaによる
見える化が可能。SQLを介して分析ツールとの連携が可能。
15
© 2021 Toshiba Digital Solutions Corporation
データ基盤の要件と GridDB Cloud
データ基盤の要件 GridDB Cloudの場合
1. 様々なデータを扱える。 GridDB Cloudは構造化データの扱いに優れています。
非構造化データはクラウドストレージを併用します。
2. 高速に分析できる。 インメモリ処理を主とていますので、高速に分析できます。
3. 各種収集・加工・分析ツールを
包含する、または連携できる。
FluentdやEmbulk、Azure Functionsなどとの連携機能が
用意されています。またSQLを介して様々なツールと連携できます。
4. データが急増しても取りこぼしなく
収集できる。
高速なNoSQLを使うことにより、大量のデータも取りこぼしなく
収集します。
5. 蓄積するデータが増えていっても
柔軟に拡張できる。
スケールアップ、スケールアウト両方に対応できます。
6. 運用・メンテナンスが簡単。 収集から蓄積、分析ツールとの連携までを担い、データ基盤の
構成がシンプルになります。
7. クラウドとオンプレミスに対応できる。パブリッククラウドはもちろん、オンプレミスでの構築も可能です。
8. リアルタイムで分析できる。 収集と分析を1つのデータベースで対応でき、リアルタイムで
分析できます。次ページ参照。
16
© 2021 Toshiba Digital Solutions Corporation
要件8. リアルタイムで分析できる。
従来のデータ基盤
※1 ODS (Operational Data Store):収集データを一時的に保持するデータベース
※2 ETL (Extract/Transform/Load):データの整形、統合を専門に行うツール
※3 DWH (Data Warehouse):情報を時系列に整理して保管するデータベース
ODS※1
ETL※2
データ蓄積用DB
収集データ バッチによるデータ整形 データ分析用DB 分析
DWH※1
2つのデータベースを管理するのは面倒だ…。
リアルタイムに分析できないじゃないか⁉
リアルタイムの分析が可能に!
GridDB Cloudの場合
POS
データ
店舗
データ
気象
データ
人流
データ
…
…
収集データ 分析
蓄積&分析用DB
NoSQLによる
高速な収集
SQLによる
高度な分析
17
© 2021 Toshiba Digital Solutions Corporation
クラウドデータ基盤とAutoMLを連携させたAIソリューション
18
© 2021 Toshiba Digital Solutions Corporation
ケーススタディ:食品廃棄物の発生量を半減させよ!
悩みを抱えている人 出板 克洋さん(42歳)
• 現在、大手食品スーパーマーケットの本部で発注業務を担当。
• 食品廃棄物の発生量を数年以内に半減させるプロジェクトにアサイン中。
各店舗のID-POSデータを分析し、日々対策を検討している。
• その一方で、惣菜市場の成長に合わせた売上向上施策の立案も期待されており、
両立に頭を悩ませている。
デイタ カツヒロ
ビジネス上で測定すべき事象は何か?(品質、コスト、顧客満足度…etc)
機械学習は適切なアプローチか?(分類、予測、クラスタリング…etc)
どのようなデータを利用できるか?(利用可能なデータで十分か?)
何を目標とするか?(ビジネス目標、顧客価値の最大化、予測精度…etc)
どのような問題を解決する必要があるか?
各店舗で発生している食品廃棄物の発生量を50%削減と惣菜市場における売り上げ20%アップ
各店舗の生鮮食品・惣菜の「販売数」「売り上げ」「値引きした商品数」「廃棄した商品数」
時系列予測により、1時間単位の来客数予測する (ID-POSは導入済)
店舗毎のID-POSデータ、気象データ、地域イベント情報、人流データ…
当日内の来客数予測精度90%以上
19
© 2021 Toshiba Digital Solutions Corporation
Step1. データ準備
店舗 気象観測の位置 常住人口 昼間人口比率 駅からの距離 客タイプ 店舗面積
店舗1 東京 多い 増 普通 近所の住民、高級志向 中
店舗2 東京 普通 増 近い 若い主婦、学生 小
店舗3 東京 普通 減 普通 主婦 中
店舗4 東京 少ない 減 遠い 近所のお年寄り、買い溜め 大
店舗5 大阪 普通 減 普通 主婦 中
date time customerID storeID itemCategory itemName price
2021/2/16 9 294 1001 6 非食品3 200
2021/2/16 9 294 1001 3 惣菜4 360
2021/2/16 9 294 1001 5 一般食品5 600
2021/2/16 9 294 1001 5 一般食品5 600
2021/2/16 9 294 1001 4 日配品4 130
■ 店舗データ(店舗ごとの特性情報を含むデータ)
■ ID-POS データ(2021年2月の1ヶ月分のデータを時間帯別に抽出)
まずはすぐに利用可能なID-POSデータを利用して来客数の予測モデルを作成に着手。
特性の異なる以下の店舗を対象に、ID-POSのデータから時間帯別の来客数情報を抽出。
データ準備 モデル構築 モデル評価 モデル展開
モデルの
運用管理・更新
20
© 2021 Toshiba Digital Solutions Corporation
Step2. モデル構築
作成モデルを使って“時間帯別の来客数を予測した結果”と“実際の来客数データ”を比較してみた結果、
人の経験則と比べても見劣りするレベルの精度(予測誤差:±30%〜50%)に。
なぜ、このような結果になってしまったのか?
時間帯別
来客数データ
(複数店舗)
GCP AutoML
Tables
予測モデルA
予測モデルB
予測モデルC
Azure Machine
Learning
Amazon
SageMaker
生成
生成
生成
精度
比較
DATAFLUCT cloud terminal.の仕組み
マルチクラウドAutoMLサービス『DATAFLUCT cloud terminal.』に
データセットをアップロードし、来客数を予測するモデルを作成。
データ準備 モデル構築 モデル評価 モデル展開
モデルの
運用管理・更新
21
© 2021 Toshiba Digital Solutions Corporation
Step3. モデル評価
• 1日単位・1週間単位で分析した場合、予測誤差は±10%程度
だった。
• 時間帯別の来客数は平日でも曜日によって異なる上、店舗によって
も傾向が異なる。
• 人の店舗前の通行量は、天候によって変動する。
• イベントやSNSなどの外部要因による影響も考慮した方がよい。
• データ量と特性が異なる店舗データ混ぜてしまったことによって、教師データ
に分散と偏りが生じている可能性がある。
• 東京の店舗のデータ量が多すぎるため、大阪の店舗の予測が影響を受け
ている。
• 同じ年代の顧客でも駅近の店舗の方が人数が多いため、郊外の店舗の
予測に悪影響が出ている。
• 2021年2月のデータで作成したモデルは、季節性の違いや新型コロナなど
の社会情勢の違いによって、3ヶ月後、半年後、1年後には更に精度が下
がる可能性が考えられる。
機械学習の予測精度を高く維持し続けるためには、以下の対応が必要に。
• 「自社のデータと外部のデータを組み合わせた必要なデータの準備」
• 「季節性・社会性を常時反映するための継続的なデータの収集・加工・蓄積できるデータ基盤」
予測精度が低かった理由について考察し、精度改善に向けた対策を検討。
担当者の考察
データ準備 モデル構築 モデル評価 モデル展開
モデルの
運用管理・更新
データサイエンティストからの助言
22
© 2021 Toshiba Digital Solutions Corporation
Step1. データ準備(改善) データ準備 モデル構築 モデル評価 モデル展開
モデルの
運用管理・更新
店舗データ
date
store ID
area code
address
store area
…
気象データ
date
address
temperature
rain
…
ID-POS
date
store ID
customer ID
Item Category
price
…
・店舗周辺の天気
・店舗周辺の流動人口
・店舗の顧客ごとの
購買データ
・店舗の特性データ
GridDB Cloudへのデータ集約・データ整形
自社データ ID-POS、店舗データ 外部データ 気象データ、人流解析データ
教師データ
(整形済)
予測用データ
(整形済)
蓄積
加工
・
人流データ
date
day of week
area code
population
…
データ構造や更新頻度が異なるデータを全てGridDB Cloudに集約し、
店舗ごとに最適なモデルを構築できるようにデータを整形。
23
© 2021 Toshiba Digital Solutions Corporation
Step2. モデル構築/評価(改善)
各店舗毎に最適化したモデルを用意することで、当日内の来客数予測精度90%以上 を達成する精度に。
GridDB Cloud上に用意した店舗ごとに
整形済のデータセットを使い、AutoMLで予測モデルを作成。
データ準備 モデル構築 モデル評価 モデル展開
モデルの
運用管理・更新
時間帯別
来客数データ
(複数店舗)
GCP AutoML Tables
予測モデルA
予測モデルB
予測モデルC
Azure Machine
Learning
Amazon SageMaker
生成
生成
生成
精度
比較
DATAFLUCT cloud terminal.の仕組み
【店舗1】時間帯別
来客数データ
GCP AutoML
Tables
Azure Machine
Learning
Amazon
SageMaker
【店舗1】
予測モデル
【店舗2】
予測モデル
【店舗3】
予測モデル
…
生成
生成
生成
教師データ
(整形済み) 【店舗1】時間帯別
来客数データ
【店舗1】時間帯別
来客数データ
【店舗1】
予測モデル
【店舗2】
予測モデル
【店舗3】
予測モデル
…
【店舗1】
予測モデル
【店舗2】
予測モデル
【店舗3】
予測モデル
…
24
© 2021 Toshiba Digital Solutions Corporation
Step3. モデル展開・運用管理 データ準備 モデル構築 モデル評価 モデル展開
モデルの
運用管理・更新
時間帯別
来客数データ
(複数店舗)
GCP AutoML Tables
予測モデルA
予測モデルB
予測モデルC
Azure Machine
Learning
Amazon SageMaker
生成
生成
生成
精度
比較
ダッシュボードのイメージ図(年代別来客数予測)
店舗毎に最適化したモデルをアプリケーションから利用できるようにデプロイ。
年代別来客数の予測結果をリアルタイムに表示するダッシュボードを用意し、
惣菜品の調理タイミングや棚出し計画のリアルタイムな意思決定が改善に成功。
25
© 2021 Toshiba Digital Solutions Corporation
本ケーススタディのポイント
• 各店舗に導入しているID-POSデータを集約するデータ基盤GridDB Cloudを活用。
• 外部要因を考慮するために外部データ(気象データ、人流データ)をリアルタイムに収集・蓄積・加工。
• 収集した店舗別データと外部データを基に、店舗ごとに最適な予測モデルをAutoMLを使って構築。
ソリューションのフロー
データ基盤
データ準備 モデル作成 予測
AutoML
店舗
データ
気象
データ
ID-POS
人流解析
データ
自社データ
外部データ
1時間毎単位の
予測用データセット
店舗最適化
データセット
教師
データ
来客数
予測モデル
精度
比較
予測用
データ
リアルタイム予測
ダッシュボード
1. 需要予測・食品廃棄削減
2. 売り上げの改善
3. 人員配置の効率向上
期待できる効果
継続的に教師データと
予測用データを用意し
続ける仕組みが重要
26
© 2021 Toshiba Digital Solutions Corporation
本ケーススタディのホワイトペーパー配布中
http://resources.griddb.com/whitepaper/pdf/whitepaper-sales-forecast-datafluct-griddb.pdf
27
© 2021 Toshiba Digital Solutions Corporation
これからのデータ基盤
「過去の分析」から「将来の予測」へ。最新のデータを使ってリアルタイムに分析・予測。
DWHを使ったデータ基盤の弱点
リアルタイム分析を可能にするラムダアーキテクチャ
サービスレイヤー
バッチレイヤー
データ蓄積
スピードレイヤー
リアルタイム集計 リアルタイムビュー
バッチビュー
分析
データ
バッチ集計
リアルタイム分析は不可!
※1 ODS (Operational Data Store):収集データを一時的に保持するデータベース
※2 ETL (Extract/Transform/Load):データの整形、統合を専門に行うツール
※3 DWH (Data Warehouse):情報を時系列に整理して保管するデータベース
ODS※1
データ蓄積用DB
収集データ バッチによるデータ整形 データ分析用DB 分析
DWH※1
ETL※2
リアルタイム分析が可能。
28
© 2021 Toshiba Digital Solutions Corporation
これからのデータ基盤
「過去の分析」から「将来の予測」へ。最新のデータを使ってリアルタイムに分析・予測。
リアルタイム分析を可能にするラムダアーキテクチャ
今後は蓄積と分析をリアルタイムで行えるデータベースを活用したデータ基盤に
サービスレイヤー
バッチレイヤー
データ蓄積
スピードレイヤー
リアルタイム集計 リアルタイムビュー
バッチビュー
分析
データ
バッチ集計
欠点
・システムが複雑。
・問題の把握が難しい。
・シンプルなアーキテクチャ。
・運用・メンテナンスの負荷を軽減。
データ蓄積 リアルタイム集計 リアルタイムビュー 分析
データ
DBの高性能化が
ポイント
29
© 2021 Toshiba Digital Solutions Corporation
クラウドとオンプレミスのハイブリッド型へ
これからのデータ基盤
今後、企業が分析の対象とするデータはどんどん増えていく。
ビッグデータに対応していくにはクラウドの活用が効率的。
クラウドには出せないデータも依然として存在しており、オンプレミスも必要。
メリット デメリット
リソースネックになりにくい データの取り出しに費用がかかる
分析のためのサービスが豊富 クラウドベンダーロックインになりやすい
30
© 2021 Toshiba Digital Solutions Corporation
これからのデータ基盤
効率的かつ俊敏なデータ活用のための 「DataOps」
DataOpsとは
組織全体のデータ管理者とデータ利用者の間のコミュニケーションの向上と、データフローの
統合と自動化の改善に焦点を当てた共同作業によるデータ管理の手法。(ガートナー)
データ基盤といったツールだけでなく、担当者、プロセス、テクノロジーを連携させることで、
効率的かつ俊敏なデータ活用を目指す。
企業文化や組織的なアプローチも必要。
DataOpsの実現方法は、業種や組織の構造、利用技術などにより最適解が異なる。
「こうすればDataOpsが必ず実現できる」という万能解は残念ながら存在しない。
Web記事 「データ活用の障壁をDataOpsで回避する(第1回)」から引用。
https://dcross.impress.co.jp/docs/column/column20201007/001806-2.html
31
© 2021 Toshiba Digital Solutions Corporation
まとめ
データを継続的にビジネスに活用していくためには
半自動化されたデータ基盤が必要です。
長期間使用するデータ基盤は、将来を見越した設計を
行うことが重要でしょう。
これからはリアルタイムで分析可能なデータ基盤が
主流になっていくでしょう。
DataOpsについても注視していく必要があります。
32
© 2021 Toshiba Digital Solutions Corporation
ご清聴ありがとうございました。

Weitere ähnliche Inhalte

Was ist angesagt?

サイバーフィジカルシステム(CPS)に必要なデータ基盤を考える ~ NoSQL/SQLハイブリット型GridDB ~
サイバーフィジカルシステム(CPS)に必要なデータ基盤を考える ~ NoSQL/SQLハイブリット型GridDB ~サイバーフィジカルシステム(CPS)に必要なデータ基盤を考える ~ NoSQL/SQLハイブリット型GridDB ~
サイバーフィジカルシステム(CPS)に必要なデータ基盤を考える ~ NoSQL/SQLハイブリット型GridDB ~griddb
 
ビッグデータIoT向けDB GridDBの紹介
ビッグデータIoT向けDB GridDBの紹介ビッグデータIoT向けDB GridDBの紹介
ビッグデータIoT向けDB GridDBの紹介griddb
 
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~griddb
 
【ハンズオンセミナー】NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティ...
【ハンズオンセミナー】NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティ...【ハンズオンセミナー】NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティ...
【ハンズオンセミナー】NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティ...griddb
 
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティショニングを 使っ...
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティショニングを 使っ...NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティショニングを 使っ...
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティショニングを 使っ...griddb
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Insight Technology, Inc.
 
C34 ニッチだけど、社会インフラを支えるデータベース、HiRDB ~HiRDBを選ぶ人、選ばない人、その選択基準とは~ by Taichi Ishikawa
C34 ニッチだけど、社会インフラを支えるデータベース、HiRDB ~HiRDBを選ぶ人、選ばない人、その選択基準とは~ by Taichi IshikawaC34 ニッチだけど、社会インフラを支えるデータベース、HiRDB ~HiRDBを選ぶ人、選ばない人、その選択基準とは~ by Taichi Ishikawa
C34 ニッチだけど、社会インフラを支えるデータベース、HiRDB ~HiRDBを選ぶ人、選ばない人、その選択基準とは~ by Taichi IshikawaInsight Technology, Inc.
 
DXを支えるスケールアウト型NoSQL/SQLハイブリッドデータベース GridDB
DXを支えるスケールアウト型NoSQL/SQLハイブリッドデータベース GridDBDXを支えるスケールアウト型NoSQL/SQLハイブリッドデータベース GridDB
DXを支えるスケールアウト型NoSQL/SQLハイブリッドデータベース GridDBgriddb
 
[INSIGHT OUT 2011] C26 ミッションクリティカルを実現する国産データベースHiRDBの技術(hara)
[INSIGHT OUT 2011] C26 ミッションクリティカルを実現する国産データベースHiRDBの技術(hara)[INSIGHT OUT 2011] C26 ミッションクリティカルを実現する国産データベースHiRDBの技術(hara)
[INSIGHT OUT 2011] C26 ミッションクリティカルを実現する国産データベースHiRDBの技術(hara)Insight Technology, Inc.
 
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...NTT DATA Technology & Innovation
 
検証にもとづくビッグデータの分析に最適な環境とは
検証にもとづくビッグデータの分析に最適な環境とは検証にもとづくビッグデータの分析に最適な環境とは
検証にもとづくビッグデータの分析に最適な環境とはHortonworks Japan
 
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語るSnowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語るRyota Shibuya
 
小売データ×地理情報/Tableau×Snowflake データでクリエイティブになるあたらしい世界
小売データ×地理情報/Tableau×Snowflake データでクリエイティブになるあたらしい世界小売データ×地理情報/Tableau×Snowflake データでクリエイティブになるあたらしい世界
小売データ×地理情報/Tableau×Snowflake データでクリエイティブになるあたらしい世界K T
 
大量時空間データの処理 ~ 現状の課題と今後OSSが解決すべきこと。(Open Source Conference 2021 Online/Osaka講演資料)
大量時空間データの処理 ~ 現状の課題と今後OSSが解決すべきこと。(Open Source Conference 2021 Online/Osaka講演資料)大量時空間データの処理 ~ 現状の課題と今後OSSが解決すべきこと。(Open Source Conference 2021 Online/Osaka講演資料)
大量時空間データの処理 ~ 現状の課題と今後OSSが解決すべきこと。(Open Source Conference 2021 Online/Osaka講演資料)NTT DATA Technology & Innovation
 
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...Insight Technology, Inc.
 
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...Insight Technology, Inc.
 
オープンソースデータベース GridDBとそのオープンコミュニティ活動
オープンソースデータベース GridDBとそのオープンコミュニティ活動オープンソースデータベース GridDBとそのオープンコミュニティ活動
オープンソースデータベース GridDBとそのオープンコミュニティ活動griddb
 
Db2リブランディングと製品動向 201707
Db2リブランディングと製品動向 201707Db2リブランディングと製品動向 201707
Db2リブランディングと製品動向 201707IBM Analytics Japan
 
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)NTT DATA Technology & Innovation
 
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版IBM Analytics Japan
 

Was ist angesagt? (20)

サイバーフィジカルシステム(CPS)に必要なデータ基盤を考える ~ NoSQL/SQLハイブリット型GridDB ~
サイバーフィジカルシステム(CPS)に必要なデータ基盤を考える ~ NoSQL/SQLハイブリット型GridDB ~サイバーフィジカルシステム(CPS)に必要なデータ基盤を考える ~ NoSQL/SQLハイブリット型GridDB ~
サイバーフィジカルシステム(CPS)に必要なデータ基盤を考える ~ NoSQL/SQLハイブリット型GridDB ~
 
ビッグデータIoT向けDB GridDBの紹介
ビッグデータIoT向けDB GridDBの紹介ビッグデータIoT向けDB GridDBの紹介
ビッグデータIoT向けDB GridDBの紹介
 
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
もうSQLとNoSQLを選ぶ必要はない!? ~両者を備えたスケールアウトデータベースGridDB~
 
【ハンズオンセミナー】NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティ...
【ハンズオンセミナー】NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティ...【ハンズオンセミナー】NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティ...
【ハンズオンセミナー】NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティ...
 
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティショニングを 使っ...
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティショニングを 使っ...NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティショニングを 使っ...
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ GridDB CE 4.6のテーブルパーティショニングを 使っ...
 
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
Attunity社のソリューションの日本国内外適用事例及びロードマップ紹介[ATTUNITY & インサイトテクノロジー IoT / Big Data フ...
 
C34 ニッチだけど、社会インフラを支えるデータベース、HiRDB ~HiRDBを選ぶ人、選ばない人、その選択基準とは~ by Taichi Ishikawa
C34 ニッチだけど、社会インフラを支えるデータベース、HiRDB ~HiRDBを選ぶ人、選ばない人、その選択基準とは~ by Taichi IshikawaC34 ニッチだけど、社会インフラを支えるデータベース、HiRDB ~HiRDBを選ぶ人、選ばない人、その選択基準とは~ by Taichi Ishikawa
C34 ニッチだけど、社会インフラを支えるデータベース、HiRDB ~HiRDBを選ぶ人、選ばない人、その選択基準とは~ by Taichi Ishikawa
 
DXを支えるスケールアウト型NoSQL/SQLハイブリッドデータベース GridDB
DXを支えるスケールアウト型NoSQL/SQLハイブリッドデータベース GridDBDXを支えるスケールアウト型NoSQL/SQLハイブリッドデータベース GridDB
DXを支えるスケールアウト型NoSQL/SQLハイブリッドデータベース GridDB
 
[INSIGHT OUT 2011] C26 ミッションクリティカルを実現する国産データベースHiRDBの技術(hara)
[INSIGHT OUT 2011] C26 ミッションクリティカルを実現する国産データベースHiRDBの技術(hara)[INSIGHT OUT 2011] C26 ミッションクリティカルを実現する国産データベースHiRDBの技術(hara)
[INSIGHT OUT 2011] C26 ミッションクリティカルを実現する国産データベースHiRDBの技術(hara)
 
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
データ活用を俊敏に進めるためのDataOps実践方法とその高度化のためのナレッジグラフ活用の取り組み(NTTデータ テクノロジーカンファレンス 2020 ...
 
検証にもとづくビッグデータの分析に最適な環境とは
検証にもとづくビッグデータの分析に最適な環境とは検証にもとづくビッグデータの分析に最適な環境とは
検証にもとづくビッグデータの分析に最適な環境とは
 
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語るSnowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
Snowflakeって実際どうなの?数多のDBを使い倒した猛者が語る
 
小売データ×地理情報/Tableau×Snowflake データでクリエイティブになるあたらしい世界
小売データ×地理情報/Tableau×Snowflake データでクリエイティブになるあたらしい世界小売データ×地理情報/Tableau×Snowflake データでクリエイティブになるあたらしい世界
小売データ×地理情報/Tableau×Snowflake データでクリエイティブになるあたらしい世界
 
大量時空間データの処理 ~ 現状の課題と今後OSSが解決すべきこと。(Open Source Conference 2021 Online/Osaka講演資料)
大量時空間データの処理 ~ 現状の課題と今後OSSが解決すべきこと。(Open Source Conference 2021 Online/Osaka講演資料)大量時空間データの処理 ~ 現状の課題と今後OSSが解決すべきこと。(Open Source Conference 2021 Online/Osaka講演資料)
大量時空間データの処理 ~ 現状の課題と今後OSSが解決すべきこと。(Open Source Conference 2021 Online/Osaka講演資料)
 
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...
[db tech showcase Tokyo 2015] C14:30万のユーザ部門を抱える日立、情シスの「理想と現実」 by 株式会社日立製作所 情報...
 
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
[db tech showcase Tokyo 2018] #dbts2018 #E37 『Attunity Replicateが変えた Oracle D...
 
オープンソースデータベース GridDBとそのオープンコミュニティ活動
オープンソースデータベース GridDBとそのオープンコミュニティ活動オープンソースデータベース GridDBとそのオープンコミュニティ活動
オープンソースデータベース GridDBとそのオープンコミュニティ活動
 
Db2リブランディングと製品動向 201707
Db2リブランディングと製品動向 201707Db2リブランディングと製品動向 201707
Db2リブランディングと製品動向 201707
 
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
モノリスからマイクロサービスへの移行 ~ストラングラーパターンの検証~(Spring Fest 2020講演資料)
 
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
Db2 Warehouse on Cloud Flex テクニカルハンドブック 2020年3月版
 

Ähnlich wie データを事業に活かすために必要なデータ基盤とは

[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...Insight Technology, Inc.
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例Tetsutaro Watanabe
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューションDell TechCenter Japan
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...Google Cloud Platform - Japan
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data PlatformNaoki (Neo) SATO
 
Qlik TechFest A-3 Qlik Senseによる厚生労働省の国民向けサイト事例紹介
Qlik TechFest A-3 Qlik Senseによる厚生労働省の国民向けサイト事例紹介 Qlik TechFest A-3 Qlik Senseによる厚生労働省の国民向けサイト事例紹介
Qlik TechFest A-3 Qlik Senseによる厚生労働省の国民向けサイト事例紹介 QlikPresalesJapan
 
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
PCCC21:株式会社日立製作所 「研究開発力向上のための研究DXソリューション」
PCCC21:株式会社日立製作所 「研究開発力向上のための研究DXソリューション」PCCC21:株式会社日立製作所 「研究開発力向上のための研究DXソリューション」
PCCC21:株式会社日立製作所 「研究開発力向上のための研究DXソリューション」PC Cluster Consortium
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTT DATA Technology & Innovation
 
PostgreSQLの統計情報について(第26回PostgreSQLアンカンファレンス@オンライン 発表資料)
PostgreSQLの統計情報について(第26回PostgreSQLアンカンファレンス@オンライン 発表資料)PostgreSQLの統計情報について(第26回PostgreSQLアンカンファレンス@オンライン 発表資料)
PostgreSQLの統計情報について(第26回PostgreSQLアンカンファレンス@オンライン 発表資料)NTT DATA Technology & Innovation
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)日本マイクロソフト株式会社
 
C14_ひとつのdbでは夢を現実に変えられない!Human Dreams.Make IT Real by 石川太一
C14_ひとつのdbでは夢を現実に変えられない!Human Dreams.Make IT Real by 石川太一C14_ひとつのdbでは夢を現実に変えられない!Human Dreams.Make IT Real by 石川太一
C14_ひとつのdbでは夢を現実に変えられない!Human Dreams.Make IT Real by 石川太一Insight Technology, Inc.
 
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...NTT DATA Technology & Innovation
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナーmtanaka0111
 
[C32] 正確でスピーディーな決断を促す、日立の高速データアクセス基盤~性能検証事例と活用効果~ by Taichi Ishikawa
[C32] 正確でスピーディーな決断を促す、日立の高速データアクセス基盤~性能検証事例と活用効果~ by Taichi Ishikawa[C32] 正確でスピーディーな決断を促す、日立の高速データアクセス基盤~性能検証事例と活用効果~ by Taichi Ishikawa
[C32] 正確でスピーディーな決断を促す、日立の高速データアクセス基盤~性能検証事例と活用効果~ by Taichi IshikawaInsight Technology, Inc.
 
20201023 Builders Box 2nd Enterprise Architect
20201023 Builders Box 2nd Enterprise Architect20201023 Builders Box 2nd Enterprise Architect
20201023 Builders Box 2nd Enterprise Architectkounan13
 
新しいTERASOLUNA Batch Frameworkとは
新しいTERASOLUNA Batch Frameworkとは新しいTERASOLUNA Batch Frameworkとは
新しいTERASOLUNA Batch Frameworkとはapkiban
 
ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)伸夫 森本
 
ビッグデータによる価値創造を実現するデータ収集・蓄積・分析クラウドサービス “簡単!賢く!データを活かす!”東芝データレイクサービスの取り組みのご紹介
ビッグデータによる価値創造を実現するデータ収集・蓄積・分析クラウドサービス “簡単!賢く!データを活かす!”東芝データレイクサービスの取り組みのご紹介ビッグデータによる価値創造を実現するデータ収集・蓄積・分析クラウドサービス “簡単!賢く!データを活かす!”東芝データレイクサービスの取り組みのご紹介
ビッグデータによる価値創造を実現するデータ収集・蓄積・分析クラウドサービス “簡単!賢く!データを活かす!”東芝データレイクサービスの取り組みのご紹介griddb
 

Ähnlich wie データを事業に活かすために必要なデータ基盤とは (20)

[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例  by 株式会社日立製作所 ...
[db tech showcase Tokyo 2014] B33: 超高速データベースエンジンでのビッグデータ分析活用事例 by 株式会社日立製作所 ...
 
データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例データ収集の基本と「JapanTaxi」アプリにおける実践例
データ収集の基本と「JapanTaxi」アプリにおける実践例
 
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
【講演資料】ビッグデータ時代の経営を支えるビジネスアナリティクスソリューション
 
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
DeNA のデータ活用を支える BigQuery データの民主化とガバナンス強化の軌跡 | Google Cloud INSIDE Games & App...
 
Strata conference 2012
Strata conference 2012Strata conference 2012
Strata conference 2012
 
[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform[de:code 2019 振り返り Night!] Data Platform
[de:code 2019 振り返り Night!] Data Platform
 
Qlik TechFest A-3 Qlik Senseによる厚生労働省の国民向けサイト事例紹介
Qlik TechFest A-3 Qlik Senseによる厚生労働省の国民向けサイト事例紹介 Qlik TechFest A-3 Qlik Senseによる厚生労働省の国民向けサイト事例紹介
Qlik TechFest A-3 Qlik Senseによる厚生労働省の国民向けサイト事例紹介
 
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
PCCC21:株式会社日立製作所 「研究開発力向上のための研究DXソリューション」
PCCC21:株式会社日立製作所 「研究開発力向上のための研究DXソリューション」PCCC21:株式会社日立製作所 「研究開発力向上のための研究DXソリューション」
PCCC21:株式会社日立製作所 「研究開発力向上のための研究DXソリューション」
 
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
NTTデータが考えるデータ基盤の次の一手 ~AI活用のために知っておくべき新潮流とは?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
 
PostgreSQLの統計情報について(第26回PostgreSQLアンカンファレンス@オンライン 発表資料)
PostgreSQLの統計情報について(第26回PostgreSQLアンカンファレンス@オンライン 発表資料)PostgreSQLの統計情報について(第26回PostgreSQLアンカンファレンス@オンライン 発表資料)
PostgreSQLの統計情報について(第26回PostgreSQLアンカンファレンス@オンライン 発表資料)
 
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
【de:code 2020】 Power Platform で広がるデータ インテグレーションの世界 (1/2)
 
C14_ひとつのdbでは夢を現実に変えられない!Human Dreams.Make IT Real by 石川太一
C14_ひとつのdbでは夢を現実に変えられない!Human Dreams.Make IT Real by 石川太一C14_ひとつのdbでは夢を現実に変えられない!Human Dreams.Make IT Real by 石川太一
C14_ひとつのdbでは夢を現実に変えられない!Human Dreams.Make IT Real by 石川太一
 
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
Hadoop/Spark を使うなら Bigtop を使い熟そう! ~並列分散処理基盤のいま、から Bigtop の最近の取り組みまで一挙ご紹介~(Ope...
 
Datalake最新情報セミナー
Datalake最新情報セミナーDatalake最新情報セミナー
Datalake最新情報セミナー
 
[C32] 正確でスピーディーな決断を促す、日立の高速データアクセス基盤~性能検証事例と活用効果~ by Taichi Ishikawa
[C32] 正確でスピーディーな決断を促す、日立の高速データアクセス基盤~性能検証事例と活用効果~ by Taichi Ishikawa[C32] 正確でスピーディーな決断を促す、日立の高速データアクセス基盤~性能検証事例と活用効果~ by Taichi Ishikawa
[C32] 正確でスピーディーな決断を促す、日立の高速データアクセス基盤~性能検証事例と活用効果~ by Taichi Ishikawa
 
20201023 Builders Box 2nd Enterprise Architect
20201023 Builders Box 2nd Enterprise Architect20201023 Builders Box 2nd Enterprise Architect
20201023 Builders Box 2nd Enterprise Architect
 
新しいTERASOLUNA Batch Frameworkとは
新しいTERASOLUNA Batch Frameworkとは新しいTERASOLUNA Batch Frameworkとは
新しいTERASOLUNA Batch Frameworkとは
 
ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)ノーツが日本を救う(2002/3/13)
ノーツが日本を救う(2002/3/13)
 
ビッグデータによる価値創造を実現するデータ収集・蓄積・分析クラウドサービス “簡単!賢く!データを活かす!”東芝データレイクサービスの取り組みのご紹介
ビッグデータによる価値創造を実現するデータ収集・蓄積・分析クラウドサービス “簡単!賢く!データを活かす!”東芝データレイクサービスの取り組みのご紹介ビッグデータによる価値創造を実現するデータ収集・蓄積・分析クラウドサービス “簡単!賢く!データを活かす!”東芝データレイクサービスの取り組みのご紹介
ビッグデータによる価値創造を実現するデータ収集・蓄積・分析クラウドサービス “簡単!賢く!データを活かす!”東芝データレイクサービスの取り組みのご紹介
 

Mehr von griddb

ビッグデータ・IoTシステム向け高速スケールアウト型データベース GridDB - 従来のデータベースでは不可能だったビッグデータのリアルタイム分析が可...
ビッグデータ・IoTシステム向け高速スケールアウト型データベース GridDB  - 従来のデータベースでは不可能だったビッグデータのリアルタイム分析が可...ビッグデータ・IoTシステム向け高速スケールアウト型データベース GridDB  - 従来のデータベースでは不可能だったビッグデータのリアルタイム分析が可...
ビッグデータ・IoTシステム向け高速スケールアウト型データベース GridDB - 従来のデータベースでは不可能だったビッグデータのリアルタイム分析が可...griddb
 
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB - 強化された時系列データ管理・検索機能について -
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB - 強化された時系列データ管理・検索機能について -NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB - 強化された時系列データ管理・検索機能について -
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB - 強化された時系列データ管理・検索機能について -griddb
 
東芝のデータ処理技術基盤のご紹介(ポスター)
東芝のデータ処理技術基盤のご紹介(ポスター)東芝のデータ処理技術基盤のご紹介(ポスター)
東芝のデータ処理技術基盤のご紹介(ポスター)griddb
 
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ クラウドでGridDBを使ってみましょう ~
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ クラウドでGridDBを使ってみましょう ~NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ クラウドでGridDBを使ってみましょう ~
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ クラウドでGridDBを使ってみましょう ~griddb
 
IoT指向のクラウドデータベースサービスGridDB Cloud ~その特徴とデータ連携の方法~
IoT指向のクラウドデータベースサービスGridDB Cloud ~その特徴とデータ連携の方法~IoT指向のクラウドデータベースサービスGridDB Cloud ~その特徴とデータ連携の方法~
IoT指向のクラウドデータベースサービスGridDB Cloud ~その特徴とデータ連携の方法~griddb
 
ペタバイト級でも扱えるGridDBのアーキテクチャ Deep Dive
ペタバイト級でも扱えるGridDBのアーキテクチャ Deep Diveペタバイト級でも扱えるGridDBのアーキテクチャ Deep Dive
ペタバイト級でも扱えるGridDBのアーキテクチャ Deep Divegriddb
 
日本発のオープンソース・データベース GridDB
日本発のオープンソース・データベース GridDB日本発のオープンソース・データベース GridDB
日本発のオープンソース・データベース GridDBgriddb
 
NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~コマンドライン・インターフェース(CLI)を使ってみましょう~
NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~コマンドライン・インターフェース(CLI)を使ってみましょう~NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~コマンドライン・インターフェース(CLI)を使ってみましょう~
NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~コマンドライン・インターフェース(CLI)を使ってみましょう~griddb
 
GridDB: A Distributed SQL time series database for IoT and Big Data
GridDB: A Distributed SQL time series database for IoT and Big DataGridDB: A Distributed SQL time series database for IoT and Big Data
GridDB: A Distributed SQL time series database for IoT and Big Datagriddb
 
多様性時代のDB選択
多様性時代のDB選択多様性時代のDB選択
多様性時代のDB選択griddb
 
ビッグIoTデータに対応したデータベース GridDB
ビッグIoTデータに対応したデータベース GridDBビッグIoTデータに対応したデータベース GridDB
ビッグIoTデータに対応したデータベース GridDBgriddb
 
GridDBを使用する理由…IoTビッグデータ システムを支える分散スケールアウト型NoSQL/SQLハイブリットデータベースGridDB
GridDBを使用する理由…IoTビッグデータ システムを支える分散スケールアウト型NoSQL/SQLハイブリットデータベースGridDBGridDBを使用する理由…IoTビッグデータ システムを支える分散スケールアウト型NoSQL/SQLハイブリットデータベースGridDB
GridDBを使用する理由…IoTビッグデータ システムを支える分散スケールアウト型NoSQL/SQLハイブリットデータベースGridDBgriddb
 
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~ IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~ griddb
 
「情報爆発時代」を勝ち抜くためのIT基盤技術とは?膨大な情報から最適解を 「SmartEDA®」
「情報爆発時代」を勝ち抜くためのIT基盤技術とは?膨大な情報から最適解を 「SmartEDA®」「情報爆発時代」を勝ち抜くためのIT基盤技術とは?膨大な情報から最適解を 「SmartEDA®」
「情報爆発時代」を勝ち抜くためのIT基盤技術とは?膨大な情報から最適解を 「SmartEDA®」griddb
 
「ものづくり」の現場に必要な機能を備えたスケールアウト型データベース GridDBとそのオープンソース活動 ~膨大なIoTデータの管理を実現 ~
「ものづくり」の現場に必要な機能を備えたスケールアウト型データベース GridDBとそのオープンソース活動 ~膨大なIoTデータの管理を実現 ~「ものづくり」の現場に必要な機能を備えたスケールアウト型データベース GridDBとそのオープンソース活動 ~膨大なIoTデータの管理を実現 ~
「ものづくり」の現場に必要な機能を備えたスケールアウト型データベース GridDBとそのオープンソース活動 ~膨大なIoTデータの管理を実現 ~griddb
 
日本発オープンソース!! スケールアウト型データベース GridDB入門 ~ GitHubからダウンロードして使ってみましょう ~
日本発オープンソース!! スケールアウト型データベース GridDB入門 ~ GitHubからダウンロードして使ってみましょう ~日本発オープンソース!! スケールアウト型データベース GridDB入門 ~ GitHubからダウンロードして使ってみましょう ~
日本発オープンソース!! スケールアウト型データベース GridDB入門 ~ GitHubからダウンロードして使ってみましょう ~griddb
 

Mehr von griddb (16)

ビッグデータ・IoTシステム向け高速スケールアウト型データベース GridDB - 従来のデータベースでは不可能だったビッグデータのリアルタイム分析が可...
ビッグデータ・IoTシステム向け高速スケールアウト型データベース GridDB  - 従来のデータベースでは不可能だったビッグデータのリアルタイム分析が可...ビッグデータ・IoTシステム向け高速スケールアウト型データベース GridDB  - 従来のデータベースでは不可能だったビッグデータのリアルタイム分析が可...
ビッグデータ・IoTシステム向け高速スケールアウト型データベース GridDB - 従来のデータベースでは不可能だったビッグデータのリアルタイム分析が可...
 
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB - 強化された時系列データ管理・検索機能について -
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB - 強化された時系列データ管理・検索機能について -NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB - 強化された時系列データ管理・検索機能について -
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB - 強化された時系列データ管理・検索機能について -
 
東芝のデータ処理技術基盤のご紹介(ポスター)
東芝のデータ処理技術基盤のご紹介(ポスター)東芝のデータ処理技術基盤のご紹介(ポスター)
東芝のデータ処理技術基盤のご紹介(ポスター)
 
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ クラウドでGridDBを使ってみましょう ~
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ クラウドでGridDBを使ってみましょう ~NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ クラウドでGridDBを使ってみましょう ~
NoSQL/SQLデュアルインターフェースを備えた IoT向けデータベースGridDB ~ クラウドでGridDBを使ってみましょう ~
 
IoT指向のクラウドデータベースサービスGridDB Cloud ~その特徴とデータ連携の方法~
IoT指向のクラウドデータベースサービスGridDB Cloud ~その特徴とデータ連携の方法~IoT指向のクラウドデータベースサービスGridDB Cloud ~その特徴とデータ連携の方法~
IoT指向のクラウドデータベースサービスGridDB Cloud ~その特徴とデータ連携の方法~
 
ペタバイト級でも扱えるGridDBのアーキテクチャ Deep Dive
ペタバイト級でも扱えるGridDBのアーキテクチャ Deep Diveペタバイト級でも扱えるGridDBのアーキテクチャ Deep Dive
ペタバイト級でも扱えるGridDBのアーキテクチャ Deep Dive
 
日本発のオープンソース・データベース GridDB
日本発のオープンソース・データベース GridDB日本発のオープンソース・データベース GridDB
日本発のオープンソース・データベース GridDB
 
NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~コマンドライン・インターフェース(CLI)を使ってみましょう~
NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~コマンドライン・インターフェース(CLI)を使ってみましょう~NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~コマンドライン・インターフェース(CLI)を使ってみましょう~
NoSQL/SQLデュアルインタフェースを備えたIoT向けデータベースGridDB ~コマンドライン・インターフェース(CLI)を使ってみましょう~
 
GridDB: A Distributed SQL time series database for IoT and Big Data
GridDB: A Distributed SQL time series database for IoT and Big DataGridDB: A Distributed SQL time series database for IoT and Big Data
GridDB: A Distributed SQL time series database for IoT and Big Data
 
多様性時代のDB選択
多様性時代のDB選択多様性時代のDB選択
多様性時代のDB選択
 
ビッグIoTデータに対応したデータベース GridDB
ビッグIoTデータに対応したデータベース GridDBビッグIoTデータに対応したデータベース GridDB
ビッグIoTデータに対応したデータベース GridDB
 
GridDBを使用する理由…IoTビッグデータ システムを支える分散スケールアウト型NoSQL/SQLハイブリットデータベースGridDB
GridDBを使用する理由…IoTビッグデータ システムを支える分散スケールアウト型NoSQL/SQLハイブリットデータベースGridDBGridDBを使用する理由…IoTビッグデータ システムを支える分散スケールアウト型NoSQL/SQLハイブリットデータベースGridDB
GridDBを使用する理由…IoTビッグデータ システムを支える分散スケールアウト型NoSQL/SQLハイブリットデータベースGridDB
 
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~ IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~
IoT時代を迎えて、あなたのシステムは今までのDBで充分ですか?~ GridDBとその適用事例紹介 ~
 
「情報爆発時代」を勝ち抜くためのIT基盤技術とは?膨大な情報から最適解を 「SmartEDA®」
「情報爆発時代」を勝ち抜くためのIT基盤技術とは?膨大な情報から最適解を 「SmartEDA®」「情報爆発時代」を勝ち抜くためのIT基盤技術とは?膨大な情報から最適解を 「SmartEDA®」
「情報爆発時代」を勝ち抜くためのIT基盤技術とは?膨大な情報から最適解を 「SmartEDA®」
 
「ものづくり」の現場に必要な機能を備えたスケールアウト型データベース GridDBとそのオープンソース活動 ~膨大なIoTデータの管理を実現 ~
「ものづくり」の現場に必要な機能を備えたスケールアウト型データベース GridDBとそのオープンソース活動 ~膨大なIoTデータの管理を実現 ~「ものづくり」の現場に必要な機能を備えたスケールアウト型データベース GridDBとそのオープンソース活動 ~膨大なIoTデータの管理を実現 ~
「ものづくり」の現場に必要な機能を備えたスケールアウト型データベース GridDBとそのオープンソース活動 ~膨大なIoTデータの管理を実現 ~
 
日本発オープンソース!! スケールアウト型データベース GridDB入門 ~ GitHubからダウンロードして使ってみましょう ~
日本発オープンソース!! スケールアウト型データベース GridDB入門 ~ GitHubからダウンロードして使ってみましょう ~日本発オープンソース!! スケールアウト型データベース GridDB入門 ~ GitHubからダウンロードして使ってみましょう ~
日本発オープンソース!! スケールアウト型データベース GridDB入門 ~ GitHubからダウンロードして使ってみましょう ~
 

Kürzlich hochgeladen

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 

Kürzlich hochgeladen (8)

CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 

データを事業に活かすために必要なデータ基盤とは

  • 1. © 2021 Toshiba Digital Solutions Corporation 第2回 AI/Analyticsカンファレンス 東芝デジタルソリューションズ株式会社 新規事業開発部 シニアエキスパート 望月 進一郎 2021年8月27日 データを事業に活かすために 必要なデータ基盤とは
  • 2. 2 © 2021 Toshiba Digital Solutions Corporation 東芝デジタルソリューションズ 2021年4月14日現在 リテール&プリンティングソリューション事業領域 エネルギーシステムソリューション事業領域 インフラシステムソリューション事業領域 東芝エネルギーシステムズ(株) 東芝インフラシステムズ(株) (株)東芝 デジタルソリューション事業領域 東芝デジタルソリューションズ(株) (株)東芝 執行役上席常務 東芝デジタルソリューションズ(株) 取締役社長 島田 太郎 東芝デジタル&コンサルティング(株) 代表執行役社長 CEO 綱川 智 東芝テック(株) ビルソリューション事業領域 東芝エレベータ(株) 東芝ライテック(株) デバイス&ストレージソリューション事業領域 東芝デバイス&ストレージ(株) 東芝キヤリア(株)
  • 3. 3 © 2021 Toshiba Digital Solutions Corporation 東芝デジタルソリューションズ 会社概要 名称 名称 本社所在地 設立年月日 事業内容 資本金 売上高 関係会社 東芝デジタルソリューションズ株式会社(英文名 Toshiba Digital Solutions Corporation) 神奈川県川崎市幸区堀川町72番地34 2003年10月1日 システムインテグレーション及びIoT/AIを活用したICTソリューションの開発・製造・販売 235億円(東芝100%) 2,217億円(連結/2021年3月期) 8社(国内7社、海外1社) 従業員数 (単独) 3,816人 (連結) 8,247人 (2021年3月現在) 取締役社長 島田 太郎 【関係会社】 • 東芝デジタル&コンサルティング(株)・・・ • 東芝情報システム(株)・・・・・・・・・・ • 東芝ITサービス(株)・・・・・・・・・・・・ • 日本システム(株)・・・・・・・・・・・・・・ • 中部東芝エンジニアリング (株) ・・・・ • 九州東芝エンジニアリング (株) ・・・・ • イー・ビー・ソリューションズ (株) ・・・・ • 東芝瀋陽情報システム社・・・・・・・・ 半導体エンジニアリング 地域対応SI、半導体エンジニアリング 各種コンサルティング 中国システム販売 デジタルビジネス戦略コンサルティング SI、組込、半導体エンジニアリング IT系保守、運用サービス SIソフト開発
  • 4. 4 © 2021 Toshiba Digital Solutions Corporation 本日のアジェンダ  データを事業に活かす上での課題  データを活かす手法  データ基盤に求められる要件  OSSを使ったデータ基盤  データ基盤向けデータベースの例(GridDB)  データ基盤とAutoMLを連携させたAIソリューション(ケーススタディ)  これからのデータ基盤
  • 5. 5 © 2021 Toshiba Digital Solutions Corporation データを事業に活かす 属人的な勘や経験からデータに基づく経営へ AIやビッグデータ分析を使って、データを事業に 活かす試みが盛んに行われている。 しかしそのような試みは短期的にはうまく行っても、 長続きしないといった話もよく聞く。 なぜだろう?
  • 6. 6 © 2021 Toshiba Digital Solutions Corporation 継続的に精度よく運用するには、半自動化されたデータ基盤が必要! AIプロジェクトにおけるデータ管理の課題 とりあえずデータを集め、AIを活用したシステムを稼働させることはできた。 しかしそれが続かない。 データ収集 データ加工 データ蓄積 モデル展開 モデルの 運用管理・更新 データを誰が管理して いるのかわからない。 社外データの入手 方法がわからない。 データ加工に 手間がかかる。 データが増えすぎて 対応できない。 データが増えるに したがい、遅くなる。 データが古くなり、 AIの精度が落ちる。 新しいデータを 取り込めない。
  • 7. 7 © 2021 Toshiba Digital Solutions Corporation データを活かす手法 レポーティング分析 データを抽出・分類して、データの並べ替えやグラフ化(見える化) を行う。BIツールによるダッシュボードなどもこの一部。 アドホック分析 定期的かつ定型的なレポート分析と違い、そのときに必要な分析を 行う。事前にデータが整備されていると素早く対応できる。 AI・機械学習 機械学習やディープラーニングなどのAI技術を活用して分析を行う。 トライアンドエラーによるモデル作りを行うことが多い。 モニタリング・監視 ログデータやストリーミングデータを使って、リアルタイムに異常検知など の監視を行う。 ビッグデータ分析 大量かつ多様なデータをクロス集計やクラスター分析といった手法を 使って分析を行う。
  • 8. 8 © 2021 Toshiba Digital Solutions Corporation 集めるべきデータ 業種や予測したい事象により集めるべきデータは異なってくるが、共通して言えること。 分散と偏りのないデータが必要 たとえば全国の分析を行うときに、特定の地域に偏ったデータを使うと分析の精度が 落ちる。全国のデータをバランスよく用意するべき。 季節性・社会性を常時反映するための継続的なデータの収集を行うべき 継続的にデータを集め、最新のデータを使用することで、大きな社会変動にも 対応可能になる。 自社のデータだけでなく、外部のデータも必要 自社特有のデータに、他社のデータや人流データ、気象データなど外部のデータを 組み合わせることにより、精度の高い分析が可能になる。
  • 9. 9 © 2021 Toshiba Digital Solutions Corporation 集めたデータをデータ活用にスムーズに導くのがデータ基盤 データ基盤 データ 基盤
  • 10. 10 © 2021 Toshiba Digital Solutions Corporation データ基盤を用意するにあたって データ基盤は長期にわたって使用するもの。 分析手法ごとにデータ基盤を用意するのは非効率。 今必要な仕様を満たすだけでなく、将来の活用も想像しながら 検討する必要がある。 できるだけシンプルな構成が望ましい。 どんなことにデータを 活用したいだろう? データはどれくらいの 規模になるだろう? どんなツールと 連携させることに なるだろうか? 運用コストは どれくらいが 適切だろうか?
  • 11. 11 © 2021 Toshiba Digital Solutions Corporation データ基盤に求められる要件 1. 様々なデータを扱える。 2. 高速に分析できる。 3. 各種収集・加工・分析ツールを包含する、または連携できる。 4. データが急増しても取りこぼしなく収集できる。 5. 蓄積するデータが増えていっても柔軟に拡張できる。 6. 運用・メンテナンスが簡単。 7. クラウドとオンプレミスに対応できる。 8. リアルタイムで分析できる。
  • 12. 12 © 2021 Toshiba Digital Solutions Corporation OSSで実現するデータ基盤 データ基盤に関係するOSS OSS活用で注意すべきこと  OSSを使いこなすだけの 技術力が必要。  OSS間をつなぐ開発や 検証が必要。  最新技術が次々に出てくる。 逆に開発が停滞するOSSも ある。OSSの見極めが必要。 日本OSS推進フォーラム作成「OSS鳥観図 2021年版」から抜粋。 http://ossforum.jp/index.php/choukanzu-wg/ ビッグデータ Apache Solr 検索エンジン ©日本OSS推進フォーラム Apache Zeppelin Jupyter Notebook R データ分析 Apache Drill Apache Hive Apache Impala Apache Phoenix Presto SQLクエリエンジン Apache HBase Apache Kudu GridDB Infinispan Redis VoltDB データストア Apache Flink Apache Storm Apache Spark Streaming ストリーム処理 Ceph GlusterFS Lustre 分散ストレージ・ 分散ファイルシステム Apache Flume Apache NiFi Apache Sqoop Fluentd データ収集 Apache Hadoop Apache Spark 分散処理 データベース Apache Derby Firebird MariaDB MySQL PostgreSQL SQLite RDBMS Vitess DBクラスタリング pgAdmin phpMyAdmin DB管理 JanusGraph neo4j グラフ型 Apache Cassandra Berkeley DB etcd memcached Redis KVS Apache CouchDB Couchbase Realm ドキュメント指向 Aerospike memcached VoltDB インメモリDB Pleasanter WEBデータベース Apache Avro Apache Parquet データシリアライザ Apache Airflow ワークフロー・スケジューラ Apache Ambari Apache Atlas Apache Ranger Apache Sentry 運用管理 AI Apache Spark Mllib Scikit-learn 機械学習 ディープラーニング・フレームワーク Apache MXNet Caffe2 Chainer CNTK Deeplearning4j Keras PyTorch TensorFlow Theano torch7 Apache ActiveMQ Apache Kafka NATS RabbitMQ メッセージング Grafana ダッシュボード GridDB InfluxDB Prometheus TimescaleDB 時系列 ArangoDB マルチモデル Apache ManifoldCF Apache Nutch クローラ IoT Espruino KNIME mosquitto Node-RED (JP)
  • 13. 13 © 2021 Toshiba Digital Solutions Corporation データ基盤向けデータベース GridDB ビッグデータ・IoTシステムに最適な超高速スケールアウト型データベース。 従来のデータベースでは不可能だったビッグデータのリアルタイム分析が可能に。 5つの特長 • IoT指向のデータモデル • 高性能 • スケーラビリティ • 高い信頼性と可用性 • NoSQLとSQLデュアルIF NoSQLインターフェイス … 大量高頻度のデータ収集にはNoSQL SQLインターフェイス … 分析や他システムとの連携にはSQL ・・・・ BI/BA 他のデータベース 他のシステム 分析アプリ ビッグデータ IoTデータ
  • 14. 14 © 2021 Toshiba Digital Solutions Corporation データ基盤向けクラウドデータベースサービス GridDB Cloud 高性能スケールアウト型データベースGridDBをコアに持つ AIやビッグデータなどの分析を支えるデータベースサービス パブリッククラウドで稼働するマネージドサービス データ量や処理量の変動に柔軟に対応。 運用・監視は当社が一括して実行。 クラウドネイティブアプリと簡単・高速に連携 JDBCやWebAPIを介して簡単にデータにアクセス。 アプリを同じクラウドに配置すればオンプレミスと同様な高速アクセスが可能。 データ収集やデータの見える化機能が充実 FluentdやAzure IoT Edgeと連携したデータ登録や、Grafanaによる 見える化が可能。SQLを介して分析ツールとの連携が可能。
  • 15. 15 © 2021 Toshiba Digital Solutions Corporation データ基盤の要件と GridDB Cloud データ基盤の要件 GridDB Cloudの場合 1. 様々なデータを扱える。 GridDB Cloudは構造化データの扱いに優れています。 非構造化データはクラウドストレージを併用します。 2. 高速に分析できる。 インメモリ処理を主とていますので、高速に分析できます。 3. 各種収集・加工・分析ツールを 包含する、または連携できる。 FluentdやEmbulk、Azure Functionsなどとの連携機能が 用意されています。またSQLを介して様々なツールと連携できます。 4. データが急増しても取りこぼしなく 収集できる。 高速なNoSQLを使うことにより、大量のデータも取りこぼしなく 収集します。 5. 蓄積するデータが増えていっても 柔軟に拡張できる。 スケールアップ、スケールアウト両方に対応できます。 6. 運用・メンテナンスが簡単。 収集から蓄積、分析ツールとの連携までを担い、データ基盤の 構成がシンプルになります。 7. クラウドとオンプレミスに対応できる。パブリッククラウドはもちろん、オンプレミスでの構築も可能です。 8. リアルタイムで分析できる。 収集と分析を1つのデータベースで対応でき、リアルタイムで 分析できます。次ページ参照。
  • 16. 16 © 2021 Toshiba Digital Solutions Corporation 要件8. リアルタイムで分析できる。 従来のデータ基盤 ※1 ODS (Operational Data Store):収集データを一時的に保持するデータベース ※2 ETL (Extract/Transform/Load):データの整形、統合を専門に行うツール ※3 DWH (Data Warehouse):情報を時系列に整理して保管するデータベース ODS※1 ETL※2 データ蓄積用DB 収集データ バッチによるデータ整形 データ分析用DB 分析 DWH※1 2つのデータベースを管理するのは面倒だ…。 リアルタイムに分析できないじゃないか⁉ リアルタイムの分析が可能に! GridDB Cloudの場合 POS データ 店舗 データ 気象 データ 人流 データ … … 収集データ 分析 蓄積&分析用DB NoSQLによる 高速な収集 SQLによる 高度な分析
  • 17. 17 © 2021 Toshiba Digital Solutions Corporation クラウドデータ基盤とAutoMLを連携させたAIソリューション
  • 18. 18 © 2021 Toshiba Digital Solutions Corporation ケーススタディ:食品廃棄物の発生量を半減させよ! 悩みを抱えている人 出板 克洋さん(42歳) • 現在、大手食品スーパーマーケットの本部で発注業務を担当。 • 食品廃棄物の発生量を数年以内に半減させるプロジェクトにアサイン中。 各店舗のID-POSデータを分析し、日々対策を検討している。 • その一方で、惣菜市場の成長に合わせた売上向上施策の立案も期待されており、 両立に頭を悩ませている。 デイタ カツヒロ ビジネス上で測定すべき事象は何か?(品質、コスト、顧客満足度…etc) 機械学習は適切なアプローチか?(分類、予測、クラスタリング…etc) どのようなデータを利用できるか?(利用可能なデータで十分か?) 何を目標とするか?(ビジネス目標、顧客価値の最大化、予測精度…etc) どのような問題を解決する必要があるか? 各店舗で発生している食品廃棄物の発生量を50%削減と惣菜市場における売り上げ20%アップ 各店舗の生鮮食品・惣菜の「販売数」「売り上げ」「値引きした商品数」「廃棄した商品数」 時系列予測により、1時間単位の来客数予測する (ID-POSは導入済) 店舗毎のID-POSデータ、気象データ、地域イベント情報、人流データ… 当日内の来客数予測精度90%以上
  • 19. 19 © 2021 Toshiba Digital Solutions Corporation Step1. データ準備 店舗 気象観測の位置 常住人口 昼間人口比率 駅からの距離 客タイプ 店舗面積 店舗1 東京 多い 増 普通 近所の住民、高級志向 中 店舗2 東京 普通 増 近い 若い主婦、学生 小 店舗3 東京 普通 減 普通 主婦 中 店舗4 東京 少ない 減 遠い 近所のお年寄り、買い溜め 大 店舗5 大阪 普通 減 普通 主婦 中 date time customerID storeID itemCategory itemName price 2021/2/16 9 294 1001 6 非食品3 200 2021/2/16 9 294 1001 3 惣菜4 360 2021/2/16 9 294 1001 5 一般食品5 600 2021/2/16 9 294 1001 5 一般食品5 600 2021/2/16 9 294 1001 4 日配品4 130 ■ 店舗データ(店舗ごとの特性情報を含むデータ) ■ ID-POS データ(2021年2月の1ヶ月分のデータを時間帯別に抽出) まずはすぐに利用可能なID-POSデータを利用して来客数の予測モデルを作成に着手。 特性の異なる以下の店舗を対象に、ID-POSのデータから時間帯別の来客数情報を抽出。 データ準備 モデル構築 モデル評価 モデル展開 モデルの 運用管理・更新
  • 20. 20 © 2021 Toshiba Digital Solutions Corporation Step2. モデル構築 作成モデルを使って“時間帯別の来客数を予測した結果”と“実際の来客数データ”を比較してみた結果、 人の経験則と比べても見劣りするレベルの精度(予測誤差:±30%〜50%)に。 なぜ、このような結果になってしまったのか? 時間帯別 来客数データ (複数店舗) GCP AutoML Tables 予測モデルA 予測モデルB 予測モデルC Azure Machine Learning Amazon SageMaker 生成 生成 生成 精度 比較 DATAFLUCT cloud terminal.の仕組み マルチクラウドAutoMLサービス『DATAFLUCT cloud terminal.』に データセットをアップロードし、来客数を予測するモデルを作成。 データ準備 モデル構築 モデル評価 モデル展開 モデルの 運用管理・更新
  • 21. 21 © 2021 Toshiba Digital Solutions Corporation Step3. モデル評価 • 1日単位・1週間単位で分析した場合、予測誤差は±10%程度 だった。 • 時間帯別の来客数は平日でも曜日によって異なる上、店舗によって も傾向が異なる。 • 人の店舗前の通行量は、天候によって変動する。 • イベントやSNSなどの外部要因による影響も考慮した方がよい。 • データ量と特性が異なる店舗データ混ぜてしまったことによって、教師データ に分散と偏りが生じている可能性がある。 • 東京の店舗のデータ量が多すぎるため、大阪の店舗の予測が影響を受け ている。 • 同じ年代の顧客でも駅近の店舗の方が人数が多いため、郊外の店舗の 予測に悪影響が出ている。 • 2021年2月のデータで作成したモデルは、季節性の違いや新型コロナなど の社会情勢の違いによって、3ヶ月後、半年後、1年後には更に精度が下 がる可能性が考えられる。 機械学習の予測精度を高く維持し続けるためには、以下の対応が必要に。 • 「自社のデータと外部のデータを組み合わせた必要なデータの準備」 • 「季節性・社会性を常時反映するための継続的なデータの収集・加工・蓄積できるデータ基盤」 予測精度が低かった理由について考察し、精度改善に向けた対策を検討。 担当者の考察 データ準備 モデル構築 モデル評価 モデル展開 モデルの 運用管理・更新 データサイエンティストからの助言
  • 22. 22 © 2021 Toshiba Digital Solutions Corporation Step1. データ準備(改善) データ準備 モデル構築 モデル評価 モデル展開 モデルの 運用管理・更新 店舗データ date store ID area code address store area … 気象データ date address temperature rain … ID-POS date store ID customer ID Item Category price … ・店舗周辺の天気 ・店舗周辺の流動人口 ・店舗の顧客ごとの 購買データ ・店舗の特性データ GridDB Cloudへのデータ集約・データ整形 自社データ ID-POS、店舗データ 外部データ 気象データ、人流解析データ 教師データ (整形済) 予測用データ (整形済) 蓄積 加工 ・ 人流データ date day of week area code population … データ構造や更新頻度が異なるデータを全てGridDB Cloudに集約し、 店舗ごとに最適なモデルを構築できるようにデータを整形。
  • 23. 23 © 2021 Toshiba Digital Solutions Corporation Step2. モデル構築/評価(改善) 各店舗毎に最適化したモデルを用意することで、当日内の来客数予測精度90%以上 を達成する精度に。 GridDB Cloud上に用意した店舗ごとに 整形済のデータセットを使い、AutoMLで予測モデルを作成。 データ準備 モデル構築 モデル評価 モデル展開 モデルの 運用管理・更新 時間帯別 来客数データ (複数店舗) GCP AutoML Tables 予測モデルA 予測モデルB 予測モデルC Azure Machine Learning Amazon SageMaker 生成 生成 生成 精度 比較 DATAFLUCT cloud terminal.の仕組み 【店舗1】時間帯別 来客数データ GCP AutoML Tables Azure Machine Learning Amazon SageMaker 【店舗1】 予測モデル 【店舗2】 予測モデル 【店舗3】 予測モデル … 生成 生成 生成 教師データ (整形済み) 【店舗1】時間帯別 来客数データ 【店舗1】時間帯別 来客数データ 【店舗1】 予測モデル 【店舗2】 予測モデル 【店舗3】 予測モデル … 【店舗1】 予測モデル 【店舗2】 予測モデル 【店舗3】 予測モデル …
  • 24. 24 © 2021 Toshiba Digital Solutions Corporation Step3. モデル展開・運用管理 データ準備 モデル構築 モデル評価 モデル展開 モデルの 運用管理・更新 時間帯別 来客数データ (複数店舗) GCP AutoML Tables 予測モデルA 予測モデルB 予測モデルC Azure Machine Learning Amazon SageMaker 生成 生成 生成 精度 比較 ダッシュボードのイメージ図(年代別来客数予測) 店舗毎に最適化したモデルをアプリケーションから利用できるようにデプロイ。 年代別来客数の予測結果をリアルタイムに表示するダッシュボードを用意し、 惣菜品の調理タイミングや棚出し計画のリアルタイムな意思決定が改善に成功。
  • 25. 25 © 2021 Toshiba Digital Solutions Corporation 本ケーススタディのポイント • 各店舗に導入しているID-POSデータを集約するデータ基盤GridDB Cloudを活用。 • 外部要因を考慮するために外部データ(気象データ、人流データ)をリアルタイムに収集・蓄積・加工。 • 収集した店舗別データと外部データを基に、店舗ごとに最適な予測モデルをAutoMLを使って構築。 ソリューションのフロー データ基盤 データ準備 モデル作成 予測 AutoML 店舗 データ 気象 データ ID-POS 人流解析 データ 自社データ 外部データ 1時間毎単位の 予測用データセット 店舗最適化 データセット 教師 データ 来客数 予測モデル 精度 比較 予測用 データ リアルタイム予測 ダッシュボード 1. 需要予測・食品廃棄削減 2. 売り上げの改善 3. 人員配置の効率向上 期待できる効果 継続的に教師データと 予測用データを用意し 続ける仕組みが重要
  • 26. 26 © 2021 Toshiba Digital Solutions Corporation 本ケーススタディのホワイトペーパー配布中 http://resources.griddb.com/whitepaper/pdf/whitepaper-sales-forecast-datafluct-griddb.pdf
  • 27. 27 © 2021 Toshiba Digital Solutions Corporation これからのデータ基盤 「過去の分析」から「将来の予測」へ。最新のデータを使ってリアルタイムに分析・予測。 DWHを使ったデータ基盤の弱点 リアルタイム分析を可能にするラムダアーキテクチャ サービスレイヤー バッチレイヤー データ蓄積 スピードレイヤー リアルタイム集計 リアルタイムビュー バッチビュー 分析 データ バッチ集計 リアルタイム分析は不可! ※1 ODS (Operational Data Store):収集データを一時的に保持するデータベース ※2 ETL (Extract/Transform/Load):データの整形、統合を専門に行うツール ※3 DWH (Data Warehouse):情報を時系列に整理して保管するデータベース ODS※1 データ蓄積用DB 収集データ バッチによるデータ整形 データ分析用DB 分析 DWH※1 ETL※2 リアルタイム分析が可能。
  • 28. 28 © 2021 Toshiba Digital Solutions Corporation これからのデータ基盤 「過去の分析」から「将来の予測」へ。最新のデータを使ってリアルタイムに分析・予測。 リアルタイム分析を可能にするラムダアーキテクチャ 今後は蓄積と分析をリアルタイムで行えるデータベースを活用したデータ基盤に サービスレイヤー バッチレイヤー データ蓄積 スピードレイヤー リアルタイム集計 リアルタイムビュー バッチビュー 分析 データ バッチ集計 欠点 ・システムが複雑。 ・問題の把握が難しい。 ・シンプルなアーキテクチャ。 ・運用・メンテナンスの負荷を軽減。 データ蓄積 リアルタイム集計 リアルタイムビュー 分析 データ DBの高性能化が ポイント
  • 29. 29 © 2021 Toshiba Digital Solutions Corporation クラウドとオンプレミスのハイブリッド型へ これからのデータ基盤 今後、企業が分析の対象とするデータはどんどん増えていく。 ビッグデータに対応していくにはクラウドの活用が効率的。 クラウドには出せないデータも依然として存在しており、オンプレミスも必要。 メリット デメリット リソースネックになりにくい データの取り出しに費用がかかる 分析のためのサービスが豊富 クラウドベンダーロックインになりやすい
  • 30. 30 © 2021 Toshiba Digital Solutions Corporation これからのデータ基盤 効率的かつ俊敏なデータ活用のための 「DataOps」 DataOpsとは 組織全体のデータ管理者とデータ利用者の間のコミュニケーションの向上と、データフローの 統合と自動化の改善に焦点を当てた共同作業によるデータ管理の手法。(ガートナー) データ基盤といったツールだけでなく、担当者、プロセス、テクノロジーを連携させることで、 効率的かつ俊敏なデータ活用を目指す。 企業文化や組織的なアプローチも必要。 DataOpsの実現方法は、業種や組織の構造、利用技術などにより最適解が異なる。 「こうすればDataOpsが必ず実現できる」という万能解は残念ながら存在しない。 Web記事 「データ活用の障壁をDataOpsで回避する(第1回)」から引用。 https://dcross.impress.co.jp/docs/column/column20201007/001806-2.html
  • 31. 31 © 2021 Toshiba Digital Solutions Corporation まとめ データを継続的にビジネスに活用していくためには 半自動化されたデータ基盤が必要です。 長期間使用するデータ基盤は、将来を見越した設計を 行うことが重要でしょう。 これからはリアルタイムで分析可能なデータ基盤が 主流になっていくでしょう。 DataOpsについても注視していく必要があります。
  • 32. 32 © 2021 Toshiba Digital Solutions Corporation ご清聴ありがとうございました。