Weitere ähnliche Inhalte
Ähnlich wie Business Innovation cases driven by AI and BigData technologies (20)
Mehr von DataWorks Summit/Hadoop Summit (20)
Business Innovation cases driven by AI and BigData technologies
- 5. ビッグデータ活用によるイノベーション
Copyright 2016 FUJITSU LIMITED
経営層・分析の専門家に加え、現場部門が活用する時代
現場部門主導によるデータ活用でイノベーションを創出
知的処理/最適化 データ活用による
イノベーション
業務
基幹データ、ログデータ
外部
SNS 、オープンデータ
• 設備メンテ
• オムニチャネル
• 動画、音声
IoT
センサー、業界横断データ
• ものづくりロボット
• 人工知能/機械学習
• 未来医療
• インフラ保全
• 自動運転
データ利活用の
高度化
データ量拡大
分析/予測集計/可視化
4
- 9. 予兆検知による製造ラインの安定稼働の実現
Copyright 2016 FUJITSU LIMITED
製造機器から収集したセンサーデータをリアルタイム監視
予兆検知により、ライン停止に至るような重大障害になる前に予防保守
事例1
対象
⇒鋳造プレス機
データ項目数
⇒20項目
動力
温度
使用電力量
加重
予兆を検知
予防保守
リアルタイム機械学習を活用した予兆検知による計画保守の実現
Powered by ZinraiODMAソリューション
ODMA予兆監視モデル
関連企業
故障予兆を
検知し
予防保守を実施
無停止稼動で
関連企業の
生産にも貢献
Spark
(リアルタイム処理)
データ
取得・加工
ストリーミング
データ処理
アノマリ
検知
「いつもと違う」
を検知
インメモリ
並列分散処理
クレンジング
フィルタリング
8
- 10. Operational Data Management & Analytics
予兆検知ソリューション アノマリ技術とは
機械学習により「いつもの状態」や「遷移」をモデル化
アノマリ(いつもと違う状態)を検知することで、異常の予兆を監視
アノマリ検知従来の異常検知
過去に発生した異常パターンを学習
(教師あり機械学習)
過去に発生した異常パターンと一致
した場合、異常として検知
「いつも」のパターンを学習
(教師なし機械学習)
「いつも」のパターンからの外れ
値を、アノマリとして検知
状態1
状態2
状態3
状態4状態5
状態6
状態7
いつもの1日
の状態遷移
サイレント
異常
異常
状態
いつもの状態からの
逸脱(アノマリ)を検出
Copyright 2016 FUJITSU LIMITED
Powered by ZinraiODMAソリューション
9
- 14. Operational Data Management & Analytics
顧客行動分析ソリューション 利用シーン例
お客様のターゲット層ごとの特性を踏まえた
仮説による商品やサービスをタイムリーに推奨
Copyright 2016 FUJITSU LIMITED
Powered by ZinraiODMAソリューション
購買履歴
お客様情報
…
企画担当者
ライフスタイルこだわり型
健康・美への意識の高い
ミドル層主婦・所得高め
顧客
グループ
年齢
来店
頻度
立ち寄っては
いるが、購買は
していないフロアで
買い物して
いただくには・・・
!
休日の
リビングで20分
立ち止まって
いたら、
クーポンや
広告を配信
年齢 30代後半~40代
購買傾向
自然素材・自然食品等
オーガニック系が多い
来店頻度 1回/2ヶ月
顧客グループごとに
新しい買い物シーンを
提案
食品
婦人服
婦人
雑貨
紳士
飲食
リビング
動線
来店客の現在位置・
滞留時間
自然素材の
ソファカバー
広告 配送無料
クーポン
Wi-Fiで
位置捕捉
ルール
来店日=休日
場所=リビング
滞留=20分
判断
動線
休日はリビングに直行
13
- 18. Business Innovation cases
driven by AI and BigData
technologies
Copyright 2016 FUJITSU LABORATORIES LTD17
2016年10月27日
株式会社富士通研究所 知識情報処理研究所
人工知能研究センター
主管研究員 上田 晴康
E-Mail:hal_ueda@jp.fujitsu.com
【Hadoop Summit 2016 Tokyo】
- 21. Copyright 2016 FUJITSU LIMITED
ee p le arn ing
Neuroscience
Machine learning
Social receptivity Simulation
- Image recognition
- Voice recognition
- Emotion/state
recognition
- Natural-language
processing
- Knowledge processing
& discovery
- Pattern discovery
- Inference &
Planning
- Prediction &
optimization
- Interactivity &
recommendation
Human Centric AI Zinrai
知覚・認識 知識化 判断・支援
学習
先端研究
ディープラーニング 機械学習 強化学習
脳科学 社会受容性 シミュレーション
人 / 企業 / 社会
アクチュエーションセンシング
画像処理
音声処理
感情・状況認識
自然言語処理
知識処理・発見
パターン発見
推論、計画
予測、最適化
対話、推薦
富士通が考えるAIのフレームワーク
20
- 22. AI(機械学習)アプリケーション開発の課題
データからの学習は手間も時間もかかる
Copyright 2016 FUJITSU LABORATORIES LTD
学習は何度も行われる
分析相談 効果判定 現場試行 本格運用
•目的の明確化
•入手可能データ
確認
•分析専門家と手作り
で試行
データの整形
機械学習アルゴリ
ズムの選択
学習パラメータの
選択
学習実行・評価
目的の精度の予測
モデルが得られる
まで繰り返し
•手作業でコーディング
データの整形ルール
監視ルール
通知・連携機能
•データ追加への対応
•データ特性変化への
対応
•連携機能の拡張
重回帰分析?
それとも
SVR?
3カ月~半年
類似アプリへの展開
•データ追加への対応
•データ特性変化への
対応
•連携機能の拡張
分析し
なおし?
毎月分析しなおし?
お客様自身も
試したい
分析専門家
21
- 27. しかも、こんなに組合せがある…
Copyright 2016 FUJITSU LABORATORIES LTD
×10 1~数十 数百通り以上=× 2~5
Spark(並列)
R(逐次)
並列処理実装
R(逐次)
Spark(並列)
Spark(並列)
R(並列バギング)
R(逐次)
R(並列バギング)
R(逐次)
Python(逐次)
Spark(並列)
二値
分類
目的
SVM(Linear)
SVM (RBF)
Gradient Boosted
Tree
Random Forest
アルゴリズム
Naïve Bayes
動作条件
(ハイパーパラメータ)
C: 2-50
~250
NT: 20
~220
MD: 20
~220
C: 2-50
~250
γ: 2-50
~250
α: 0~100
NT: 20
~220
MD: 20
~220
R(並列バギング)
R(並列バギング)
Python(並列バギング)
力づくでやったら、絶対に終わらない
26
- 31. Wizz: Spark上に実装したプロトタイプ
Model
Perf.
Report
Wizz
Parallel Execution Platform
Task Optimizer
Input
Data
Hadoop(YARN/HDFS)
Algorithm Knowledge Base
Time/Space
Estimator
Model
Searcher
Preview
Instruction
UI
Scheduler
Shrink
Controller
Core API
Spark Runtime
MLLib
Launcher
External Lib (pipe)
Performance Evaluator (cross-validation)
Scala
Spark
Custom
parallel bagging
ShrinkerTask
Queue
Parallel
Executor
Copyright 2016 FUJITSU LABORATORIES LTD
分析専門家
Python R
sklearn R Lib
30
- 32. Wizzで利用可能な機械学習ライブラリ
Spark MLLib
データ量が多い場合に高速
並列処理ができないアルゴリズムは実装されておらず、精度に限界
オーバーヘッドが大きく(機械学習1回30秒)、小規模データに向か
ない
python sklearn
データサイエンティストも利用し始め、主流になりつつある
データ量が多い時には、バギング並列(独自実装)を併用
R 各種ライブラリ
機械学習に関するライブラリが最も充実
データ量が多い時には、バギング並列(独自実装)を併用
Copyright 2016 FUJITSU LABORATORIES LTD31
- 34. 機械学習自動化技術の効果: 6日⇒2時間
精
度
時間
6日弱2時間強
精度推定の準備期間 2時間に短縮
見込みのない候補を除外、有望な学習
候補のみに絞り込んで処理
色々な手法を並行して処理
手法(アルゴリズム)
データ量
10万 20万 40万 80万 … 2500万 5000万
Random Forest
[並列バギング]
51秒
76%
52秒
80%
69秒
81%
60秒
84%
1760秒
96%
†4338秒
97%
Random Forest
[Spark]
38秒
76%
49秒
76%
78秒
76%
114秒
76%
†1590秒
76%
†2695秒
76%
Gradient Boosting
[並列バギング]
96秒
76%
97秒
78%
119秒
81%
113秒
83%
1420秒
88%
3679秒
88%
Gradient Boosting [Spark] 434秒
88%
475秒
88%
544秒
88%
691秒
88%
†5221秒
88%
†7933秒
88%
Support Vector Machine
(RBF kernel) [並列バギング]
529秒
73%
609秒
73%
815秒
79%
1,348秒
81%
†1.3日 †約3日
Copyright 2016 FUJITSU LABORATORIES LTD33
- 36. 自動化でAIアプリケーション開発が容易に
Copyright 2016 FUJITSU LABORATORIES LTD
データ分析の一部に自動化を入れることで多くのメリット
分析相談 効果判定 現場試行 本格運用
•目的の明確化
•入手可能データ
確認
•分析専門家と手作り
で試行
データの整形
機械学習アルゴリ
ズムの選択
学習パラメータの
選択
学習実行・評価
目的の精度の予測
モデルが得られる
まで繰り返し
•手作業でコーディング
データの整形ルール
監視ルール
通知・連携機能
•データ追加への対応
•データ特性変化への
対応
•連携機能の拡張
3カ月~半年
類似アプリへの展開
•データ追加への対応
•データ特性変化への
対応
•連携機能の拡張
分析専門家
自動化技術入り
分析フロー
全部自動で
試して
みればいい
分析し
なおし?
分析フローを
再実行する
だけ
自動化技術入り
分析フロー
35