SlideShare ist ein Scribd-Unternehmen logo
1 von 38
Downloaden Sie, um offline zu lesen
“Manufacturing” your own AI
April 2020
Japan Virtual Meetup
Hiroyuki Oguchi Sales Engineer hiroyuki.oguchi@h2o.ai
Yasuyuki Asakura Account Executive yasuyuki.asakura@h2o.ai
Confidential2
H2O.ai ?
Confidential3
創立 Silicon Valley 2012
資金調達: $147M | Series D
投資家: Goldman Sachs, Ping An,
Wells Fargo, NVIDIA, Nexus Ventures
会社概要
製品
拠点
H2O Open Source Machine Learning
H2O Driverless AI: Automatic Machine Learning
H2O Q: AI platform for business users
Mountain View, NYC, London, Paris,
Ottawa, Prague, India, Singapore, Tokyo
220+ 1K
20K 180K
学術機関
H2O Open Source
ご利用の企業
ユーザー会
AI エキスパート
H2O.ai スナップショット
Confidential4
幅広い業種で活用されるH2O.ai
Insurance Manufacturing
Healthcare Ad Tech/MarTechRetail
Financial Services
Confidential5
典型的なデータサイエンス・ワークフロー
5
データの調達
生データの収集・加工、
ETL処理の実行
• データ・マイニング
• データ・クレンジング
• ETL
データセット
の準備
データの準備
• 前処理
• ターゲット変数の作成
• トレーニング/検証デー
タセットの作成
特徴量エンジ
ニアリング
特徴量を生成
• 相互作用
• カテゴリ効果
• クラスタ
モデルからの
出力
成果物の作成
• 予測値
• 解釈可能性
• ドキュメンテーション
• デプロイ可能なモデル
モデル
トレーニング
モデルトレーニング、
アンサンブル
• GLMs
• GBMs
• TensorFlow モデル
Confidential6
モデル作成 モデル
デプロイメント
H2O MOJO
Model Object
Smartphone Watch
Factory
T-Shirt
Engine
Predictive
Maintenance
IoTプラブイン
マシンラーニング フィードバック
AIモデル作成からデプロイメントへ
Load
Data
AutoML
開始
最良
モデル作成
Confidential7
製造業では?
Confidential8
製造業における機械学習適用分野
◼ IT システム管理
• 不具合予知
• 不良出力予知
• 事前メンテナンス
◼ 予知保全◼ サプライチェーン
• 需要予測
• 在庫数予測
• 生産数量予測
• 着荷遅延予測
• 返品・品質クレーム予測
• サイバーセキュリティ
• マスタデータ管理
◼ 品質管理
• 製造品質予測
• 市場品質予測
• 工程設計
Confidential9
• 予測モデル作成から実装運用
に要する時間を 25%短縮
• 製造業向け製品における、モデルトレーニン
グとチューニングで1か月の時間短縮
• 将来の顧客からの受注に対応する材料・資材の
所要量を、より高精度で予測
サプライチェーン(需要予測)
H2O Driverless AIが提供する特徴量設計
は、現在、他の手段で得られるものより
も優れている。
そして、スコアリング・パイプラインは更
に大きく役に立っている。これは大幅な
時間削減になる。
ロバート・クップ博士
シニア・データ・サイエンティスト
Stanley Black & Decker
プレスリリース
Confidential10
• 世界のブルーベリー市場の25%を担う
• モデル作成に要する時間を3~5ヶ月から3~5週間に短縮
• 生鮮品の品質クレームによる費用を削減
• 小さなデータ・サイエンス・チームが成果物を多数作成
入荷製品の品質予測
Gonzalo Bustos
Head of Data Analytics
Hortifrut
H2O Driverless AIの導入から大きな結果を得ています。
従来のデータ・サイエンス手法で数か月かかっていた作業が、今や、チーム
を増員することなく、数週間で完了するようになりました。
プレスリリース
Confidential11
予知保全 – 故障の予測
1
1
ペトロナス(Petroliam Nasional Berhad (PETRONAS))は、マレーシアの石油と天然
ガスの守り人であり、資源の採掘、製品の精製と供給により、社会の成長を支えている。
機器に設置されたセンサーの活用
タービン圧、ケース温度、負荷などのデー
タを収集。
また、過去の故障・不具合データを収集し、
学習データを作成
目的
1. 装置・機器の故障予測
2. 残存ライフ(Remaining useful life)の予測
3. 石油採掘サイトにおける様々な早期警報システムの実装と体制の構築
課題
1万7千ものセンサーから毎分データが生成され、
また、高頻度で予測を生成(推論)することが求められる
精度高いモデルを短時間で作成することが求められる
予測生成においては、即時処理・予測出力が求められる
高速処理を実現するために、NVIDIA® DGX-2™ サーバ(16 GPU)でDriverless AIを稼動
Confidential12
高まる予知保全の必要性
1
2
製造業・運輸業全体で、メンテナンスコストは上昇
傾向にあり、また、売上の拡大が難しいなか、利益
を圧迫する費目として、無視できない割合を持つに
至っている。
作業員の不足
メンテナンス作業を行える作業員は定常的に不足
しており、突発的かつ重大事象への対応は、さら
に状況を悪化させる。 計画に沿った作業による
要員計画による運用が要望されている。
メンテナンスコスト
メンテナンス不全により発生する事故は、安全性を脅か
すものである。 不具合・不良が発生してからのメンテ
ナンスは通常のメンテナンスに比べて、難易度が高く、
安全性の確保がより困難であることが多い。
停止時間
予期されたないメンテナンス作業や交換は機器の停止時
間を意味する。結果的に納期遅延につながる。または、
余剰なキャパシティを運用することにもつながる。
安全性
業績への影響
これらを踏まえると、直接的または間接的に、予知保全は、相当なコスト削減をもたらす
事が可能と見込まれる。数億円規模のコスト削減が可能なケースも見受けられる。
Confidential13
運輸・物流における予知保全
1
3
欧州の某大型トラックメーカーは、当社は、顧客と協業し、労務費を含む全体的なメンテナンス費用の削減と、
稼働率向上を目指した。
センサーの活用:
空気圧の機構はブレーキやギア変速などの様々な箇
所で使われている。高度な空気圧センサーを実装し、
各コンポーネントの不具合データを集めている。
1. メカニックによる不要なチェック $10
2. 問題あるトラックを見過ごす(故障発生あり得る) $500
目的
1. トラックに対してのサービスの要否を予測する
2. メンテナンスコストの最小化
コストモデル
総コスト = 10 x 1のケース + 500 x 2のケース
予測モデルにおいては…
総費用 = 10 x 偽陽性 + 500 x 偽陰性
正しいタイミングで正しい情報を提供し、予期せぬ非稼働を回避する
Confidential14
予知保全でのDAI活用
1
4
空気圧システムに実装され
たセンサーからのデータ
+
メンテナンス
要否判定
コスト削減
Driverless AI
自動化された機械学習
Confidential15
結果
• ベースモデルに比べて、6%もの精度向上
• 事後保全から予知保全に転換することにより、年間のコスト削減額は3~5百万ドルに上ると推定される。
結果
シンプルなモデル
Faulty Good
Faulty 95 105
Good 12 11788
ベースモデル (ランダムフォレスト)
Faulty Good
Faulty 183 17
Good 232 11568
トータルコスト
$52,620
トータルコスト
$10,820
DAI (基本的な設定)
Faulty Good
Faulty 367 8
Good 465 15160
トータルコスト
$8,650
Confidential16
デモ!
Confidential17
デモ: 予知保全 – 故障予測
1
7
BLACKBLAZEは、クラウドのストレージとバックアップ・システムを提供している。
個人向けから企業向けまで幅広くサービスを提供しており、膨大なデータを管理している。
個人向け:
パソコンのデータを自動バックアップ
どこからでもアクセス可能に
ドキュメント、写真、プロジェクトファイルなど
企業向け:
サーバー、仮装サーバ、NAS、パソコンなどの幅広い機器
のデータを自動的にバックアップ
API連携によるWEBサーバーのデータをバックアップ
課題:
データの保全
ハードディスク故障によるデータの消失を回避
Confidential18
デモ: 予知保全 – 状況・課題
1
8
データ:
ハードディスクのモデル名、シリアルナンバー
SMARTデータ (Self-Monitoring, Analysis and Reporting Technology)
列数:67 (数値 40列、2値 24列、カテゴリ 3列)
チャレンジ:
Failの割合が極めて低い(不均衡データ)
Failは全体の0.102%
データ提供: Blackblaze
https://www.backblaze.com/b2/hard-drive-test-data.html
Confidential19
デモ: 予知保全 – 予測モデル
1
9
基本設定項目:
トレーニングデータ、テストデータ
目的変数
学習から除外する列
モデル精度評価指標(Scorer)
精度、時間、解釈可能性
予測モデル作成(エクスペリメント)
Driverless AI は迅速なモデル作成を支援
多種多様な分析要請・AIシステム構築要請に備えた生産性を実現
Confidential20
デモ: 予知保全 – 予測モデル
2
0
予測モデル作成(エクスペリメント エキスパート設定)
モデル作成の詳細な仕様を設定
カスタムレシピの設定を含め、特徴量設計、アルゴリズム、モデルパラメータなどを設定
Confidential21
デモ: 予知保全 – 予測モデル
2
1
モデル作成上のキーポイント
スコアラー: F2を選択
再現率と適合率の調和平均
再現率により大きな重みを与える
偽陰性が擬陽性よりも大きな問題であるケースに適切
不均衡データ: AUTOを選択
必要に応じて、T/F いずれからもサンプリングを実行
アルゴリズム: 不均衡データに対応したモデルを候補に含める
ImbalancedLightGBM、ImbalancedXGBoost
BYOR: 10のトランスフォーマーを追加
Confidential22
デモ: 予知保全 – 予測モデル
2
2
作成されたモデル
ImbalancedLightGBMを選択
2つのパラメータセットが作成
5つの交互検証フォールドを作成
10のモデルからアンサンブルし、予測出力
Confidential23
デモ: 予知保全 – AutoReport
2
3
AutoReport:ドキュメントの自動生成
設定と動作環境、実行結果のレポートを自動生成
データの概要
エクスペリメント設定
作成されたモデルの内容
特徴量設計
モデル精度
部分従属プロット
学習データとテストデータの分布のシフト
などを出力
Confidential24
デモ: 予知保全 – モデル精度
2
4
モデル精度
不均衡データゆえ、大きなAUC(0.99)は、想定の範囲
0.102%という大きく不均衡データでのAUCPR(0.23)は、まずまずの出来と言える。
スコア上位2%については、通常の45倍もの故障リスクを抱えるH/D群を捕捉できている
Confidential25
デモ: 予知保全 – モデル精度
2
5
モデル診断
テストデータを投入し、モデルを診断
テストデータに対しても、AUCPR(0.21)であり、過学習は起きていない。
頑健性・汎用性高いモデルが作成されたと言える。
Confidential26
デモ: 予知保全 – モデル作成
2
6
閾値の決定: 擬陽性・偽陰性による発生するコストを勘案し、閾値を設定
Confidential27
デモ: 予知保全 – MLI
2
7
機械学習解釈可能性(Machine Learning Interpretablity (MLI))
特徴量設計を施された特徴量と、元データの特徴量、それぞれのShapley値を算出
Confidential28
デモ: 予知保全 – まとめ
2
8
不均衡データへの対応
多くの入力変数への対応
業務ニーズ・予測ニーズに対応したスコアラーの適用
業務ニーズ・予測ニーズに対応した閾値の探索
特徴量の重要度の出力
自動化による特徴量設計とモデル作成
データ・予測ニーズに対応し得る機能拡張性
Confidential29
生産性
Confidential30
企業における機械学習ワークフロー
モデル
定義
ソリューション
定義
データ取得 データ準備 特徴量設計 モデル選択
モデル学習 モデル確定 モデル検証
モデル
パッケージング
モデル
デプロイメント
モデル管理
6
機械学習システムの隠れた技術負荷
Confidential31
企業における機械学習ワークフロー
モデル
定義
ソリューション
定義
データ取得 データ準備 特徴量設計 モデル選択
モデル学習 モデル確定 モデル検証
モデル
パッケージング
モデル
デプロイメント
モデル管理
部分的な自動化
完全に自動化
完全に自動化かつ拡張性あり
Confidential32
SQL
Local
Amazon S3
HDFS
X Y
スコアリング
パイプライン
機会学習の解釈可能性
低レイテンシーの
実行モジュール
をデプロイ
モデル作成
データセット
モデルレシピ:
• 分類/回帰
• 独立同分布化
• 時系列
• 自然言語処理
特徴量設計 アルゴリズム モデルチューニング+ +
高精度モデルを作成
機械学習の自動処理
データの形容、外れ値、
欠損値、等を理解
GPUアクセラレーションによる高速処理
1
データをドラッグ
&ドロップ
2
可視化の自動処理
ベスト・プラクティスなモデル
と高性能コンピューティングに
より、特徴量抽出とパラメータ
試行を含む数千のモデルを繰り
返し作成
3
機械学習の自動処理
特徴量変換処理を含むモデルのス
コアリングパイプラインを作成、
レイテンシーの低い実行モジュー
ルをPython、Javaで作成
4 スコアリングパイプライン
の自動作成
クラウド、ビッグ
データ・システム、
パソコンから入力
Google BigQuery
Azure Blog Storage
Snowflake
モデルドキュメント
の自動作成
Driverless AI – その動き
5
BYOR+
Confidential33
H2O Driverless AIの主な機能
1. AutoML
2. 特徴量設計の自動実行
3. Bring-Your-Own Recipes
4. 時系列
5. TensorFlowによる自然言語処理
6. 機会学習解釈可能性 (MLI)
7. 自動的な可視化
8. GPU アクセラレーション
9. スコアリング・パイプラインの自動生成
10.データソースと稼動環境・デプロイの柔軟性
Confidential34
Q & A
Confidential35
次のステップ
Confidential36
Driverless AIは企業にAIを提供する
時間
洞察を得るまでの時間
人材
Kaggle Grandmasters
Top 10
データサイエンス・
エキスパート
機械学習のGPU処理
パイプラインの自動生成
数ヶ月が
数時間に
信頼
説明性と透明性
MLI
Auto Doc
Auto
Visualization
37
• H2Oウェブサイト: www.h2O.ai
• トライアル:21-day trial
• チュートリアル:tutorial
• ミートアップ:meetup
• ウェビナー:webinar
• リンクドイン:LinkedIn
• Twitter @h2oai
情報源(次のステップ)
ありがとうございました。
また、お会いしましょう。

Weitere ähnliche Inhalte

Mehr von Sri Ambati

Building Custom GenAI Apps at H2O
Building Custom GenAI Apps at H2OBuilding Custom GenAI Apps at H2O
Building Custom GenAI Apps at H2OSri Ambati
 
Applied Gen AI for the Finance Vertical
Applied Gen AI for the Finance Vertical Applied Gen AI for the Finance Vertical
Applied Gen AI for the Finance Vertical Sri Ambati
 
Cutting Edge Tricks from LLM Papers
Cutting Edge Tricks from LLM PapersCutting Edge Tricks from LLM Papers
Cutting Edge Tricks from LLM PapersSri Ambati
 
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...Sri Ambati
 
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...Sri Ambati
 
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...Sri Ambati
 
LLM Interpretability
LLM Interpretability LLM Interpretability
LLM Interpretability Sri Ambati
 
Never Reply to an Email Again
Never Reply to an Email AgainNever Reply to an Email Again
Never Reply to an Email AgainSri Ambati
 
Introducción al Aprendizaje Automatico con H2O-3 (1)
Introducción al Aprendizaje Automatico con H2O-3 (1)Introducción al Aprendizaje Automatico con H2O-3 (1)
Introducción al Aprendizaje Automatico con H2O-3 (1)Sri Ambati
 
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...Sri Ambati
 
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...Sri Ambati
 
AI Foundations Course Module 1 - An AI Transformation Journey
AI Foundations Course Module 1 - An AI Transformation JourneyAI Foundations Course Module 1 - An AI Transformation Journey
AI Foundations Course Module 1 - An AI Transformation JourneySri Ambati
 
ML Model Deployment and Scoring on the Edge with Automatic ML & DF
ML Model Deployment and Scoring on the Edge with Automatic ML & DFML Model Deployment and Scoring on the Edge with Automatic ML & DF
ML Model Deployment and Scoring on the Edge with Automatic ML & DFSri Ambati
 
Scaling & Managing Production Deployments with H2O ModelOps
Scaling & Managing Production Deployments with H2O ModelOpsScaling & Managing Production Deployments with H2O ModelOps
Scaling & Managing Production Deployments with H2O ModelOpsSri Ambati
 
Automatic Model Documentation with H2O
Automatic Model Documentation with H2OAutomatic Model Documentation with H2O
Automatic Model Documentation with H2OSri Ambati
 
Your AI Transformation
Your AI Transformation Your AI Transformation
Your AI Transformation Sri Ambati
 
AI Solutions in Manufacturing
AI Solutions in ManufacturingAI Solutions in Manufacturing
AI Solutions in ManufacturingSri Ambati
 
ICLR 2020 Recap
ICLR 2020 RecapICLR 2020 Recap
ICLR 2020 RecapSri Ambati
 
Getting Your Supply Chain Back on Track with AI
Getting Your Supply Chain Back on Track with AIGetting Your Supply Chain Back on Track with AI
Getting Your Supply Chain Back on Track with AISri Ambati
 
AI and AutoML: Debunking Myths
AI and AutoML: Debunking MythsAI and AutoML: Debunking Myths
AI and AutoML: Debunking MythsSri Ambati
 

Mehr von Sri Ambati (20)

Building Custom GenAI Apps at H2O
Building Custom GenAI Apps at H2OBuilding Custom GenAI Apps at H2O
Building Custom GenAI Apps at H2O
 
Applied Gen AI for the Finance Vertical
Applied Gen AI for the Finance Vertical Applied Gen AI for the Finance Vertical
Applied Gen AI for the Finance Vertical
 
Cutting Edge Tricks from LLM Papers
Cutting Edge Tricks from LLM PapersCutting Edge Tricks from LLM Papers
Cutting Edge Tricks from LLM Papers
 
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...
 
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
 
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...
 
LLM Interpretability
LLM Interpretability LLM Interpretability
LLM Interpretability
 
Never Reply to an Email Again
Never Reply to an Email AgainNever Reply to an Email Again
Never Reply to an Email Again
 
Introducción al Aprendizaje Automatico con H2O-3 (1)
Introducción al Aprendizaje Automatico con H2O-3 (1)Introducción al Aprendizaje Automatico con H2O-3 (1)
Introducción al Aprendizaje Automatico con H2O-3 (1)
 
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...
 
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...
 
AI Foundations Course Module 1 - An AI Transformation Journey
AI Foundations Course Module 1 - An AI Transformation JourneyAI Foundations Course Module 1 - An AI Transformation Journey
AI Foundations Course Module 1 - An AI Transformation Journey
 
ML Model Deployment and Scoring on the Edge with Automatic ML & DF
ML Model Deployment and Scoring on the Edge with Automatic ML & DFML Model Deployment and Scoring on the Edge with Automatic ML & DF
ML Model Deployment and Scoring on the Edge with Automatic ML & DF
 
Scaling & Managing Production Deployments with H2O ModelOps
Scaling & Managing Production Deployments with H2O ModelOpsScaling & Managing Production Deployments with H2O ModelOps
Scaling & Managing Production Deployments with H2O ModelOps
 
Automatic Model Documentation with H2O
Automatic Model Documentation with H2OAutomatic Model Documentation with H2O
Automatic Model Documentation with H2O
 
Your AI Transformation
Your AI Transformation Your AI Transformation
Your AI Transformation
 
AI Solutions in Manufacturing
AI Solutions in ManufacturingAI Solutions in Manufacturing
AI Solutions in Manufacturing
 
ICLR 2020 Recap
ICLR 2020 RecapICLR 2020 Recap
ICLR 2020 Recap
 
Getting Your Supply Chain Back on Track with AI
Getting Your Supply Chain Back on Track with AIGetting Your Supply Chain Back on Track with AI
Getting Your Supply Chain Back on Track with AI
 
AI and AutoML: Debunking Myths
AI and AutoML: Debunking MythsAI and AutoML: Debunking Myths
AI and AutoML: Debunking Myths
 

製造業におけるAIソリューション | AI Solutions in Manufacturing