SlideShare ist ein Scribd-Unternehmen logo
1 von 37
Confidential1
機械学習自動化プラットフォーム
H2O Driverless AIのご紹介
保険業界向け
2020年5月28日
H2O.ai, Inc.
Confidential2 Confidential2
本日のサマリ
H2O.aiを使用し、
H2O.aiは、AIの民主化をミッションとするAIマシンラーニングにおけるオープンソースリーダー
生命保険業界
損害保険業界
H2O Driverless AI: マシンラーニング自動化ツールを使って、あらゆる企業が自社のAIを作成
ミッション
どうする?
何を使って?
AIを構築する事で、時間・コストの削減や競争力、売上向上、新製品発表、商談の創造を実現
どうやって?
(コンセプト: Bring your own recipes) レシピという当社Kaggle Grandmasterが作成したビジネスの多様な要件に合
わせたAIに必要な150+のプログラム組合せ集(ライブラリ)
あらゆる企業がAI企業にスローガン
不正利用検知
支払査定
マーケティング
など
本日の
Agenda
H2O.ai会社概要
H2O.aiについて
H2O Driverless AI概
要
マシンラーニングの自動化
01
03
02
04保険業界における活用
H2O.aiの主な用途
デモ
支払査定業務
05
06
生産性
企業における機械学習
AIの道筋
次のステップ
H2O.ai会社概要
01
H2O.aiについて
Confidential5
創立: Silicon Valley 2012
資金調達: $147M | Series D
投資家: Goldman Sachs, Ping An,
Wells Fargo, NVIDIA, Nexus Ventures
会社概要
製品
拠点
H2O Open Source Machine Learning
H2O Driverless AI: 機械学習自動化
H2O Q: ビジネスユーザー向けAIプラットフォーム
Mountain View, NYC, London, Paris,
Ottawa, Prague, India, Singapore, Tokyo
220+ 1K
20K 180K
学術機関
H2O Open Source
ご利用の企業
ユーザー会
AI エキスパート
H2O.ai 会社概要
Confidential6 Confidential6
• 特徴量自動生成及びマシンラーニングと解
釈可能性 (説明性)
• データ取込みからデプロイメントまでのマシン
ラーニングモデル作成のプロセス自動化
• ユーザー サブスクリプション
• GUIインターフェースのend-to-end
データサイエンス プラットフォーム
• データプリパレーション
• データ拡張 (教師なし学習)
• データの可視化
• 目的別アルゴリズムApp Store
• シンプル、直感的なビジネスユー
ザー プラットフォーム
H2O.ai: AI プラットフォーム
H2O Driverless AI H2O Q
まもなく販売開始
H2O Model Ops
今期販売開始予定
• AI デプロイメント プラットフォーム
(DevOps & MLOps)
• モデルスコアリング遅延時間低減
• AI モデルモニタリング
• データドリフト検出、再学習
ModelOps
H2O Driverless AI概要
02
マシンラーニングの自動化
Confidential8 Confidential8
データサイエンスのワークフロー
データ
インテグレーション
可視化
特徴量設計
モデル
説明性
理解
デプロイメント
Confidential9
モデル最適化の自動実行
自分のAIを開発:BYOR
モデル・レシピ
• 独立同分布
• 時系列
• 自然言語処理
高度な特徴量の
エンジニアリング
アルゴリズム
モデル
チューニング+ +
フィットモデルの選択
課題
• 目的別のユースケースへのカスタマイズ
– アルゴリズム、特徴量エンジニアリング、スコアラーを加えることが
必要
• 既存の知的財産を活用(非公開ロジック)
• AIはイノベーションが速く、ベンダーによる実装を待てない
解決策
• モジュール化され拡張性ある機械学習の最適化
• AIのAppストア
– オープンソースのカタログ(150+)
– 非公開ロジックの活用
• 最新の機械学習テクニックとの統合
データ変換 アルゴリズム スコアラー
Confidential10 Confidential10
データサイエンスのワークフロー
データ
インテグレーション
可視化
特徴量設計
モデル
説明性
理解
デプロイメント
アップロード
(データレシピ)
修正
(データレシピ)
特徴量設計
(データ変換レシピ)
アルゴリズム
(モデルレシピ)
スコアレシピ
自動レポート
の修正
Confidential11
Model Training Scoring
スコアリング
パイプライン
MOJO
Smartphone Watch
Factory
T-Shirt
Engine
Predictive Maintenance
ダイレクトにプラグイン
IoT
再学習
モデル作成からデプロイメントまで
Data
ロード
AutoML
開始
モデル作成
モデルデプロイメント
管理・監視
*Model Opps
利用時
Model Deployment
Confidential12
AI自動化による
アドバンテージ
H2O Driverless AI
Talent
ビジネスの拡張
回答スピード向上
データサイエンスチームの増強
• より迅速なAIモデルの作成
• 時間の削減
• 環境適用への準備:時間 vs 月
• より高い精度の新しいAIモデルの作成
• 既存のAIモデルとの精度におけるベンチマーク
• あらゆる業務にデータサイエンティストが関わりを持つ
• 適用業務の拡張
• 新たなビジネスニーズの発生と回答
• ビジネス横断で成果
AIの拡張
生産性向上
AIモデルの改善
H2O.aiの活用
03
H2O.aiの主な用途と効果
Confidential14
保険業界のAIユースケース
• サイバーセキュリティ
• DoS攻撃検知及び対策
• 自動分類
ITインフラ
• 不正請求
• 共謀詐欺
• 支払業務の自動化
• 統計的異常検出
支払査定業務
• 保険料率管理
• 顧客離脱予測
• 支払遅延予測
• リアルタイム顧客ターゲティング
• 顧客とのマッチング
• 商品の組合せ
業務 / 営業
引受査定業務
• 支払傾向
• リスクスコアリング
• 本人確認手続き (KYC)
Confidential15
不正検知率支払査定期間
20%
支払査定期間4.7~5.5日 不正請求疑義 1/4件
40%
マーケティング増収効果
10%
マーケティング投下費用の最適
化
保険会社にとっての価値
デモ
04
支払査定業務
デモ: 保険金請求審査の効率化
1
7
BNP Paribas Cardifは、世界的な保険会社であり、プロセスのデジタル化を推進している。
保険金請求への対応の迅速化が顧客満足度を高く維持する上で、重要であると認識している。
保険金請求審査・対応プロセス(Claims Management)に機械学習のプロセスを組み込み、
業務プロセスの高速化、業務負荷軽減を図る。
デモ: 保険金請求審査の効率化
1
8
データ:
過去にkaggleコンペティションが実施
データは匿名化・マスク化ずみ
133もの項目
予測変数候補は131項目
目的変数は「target」であり、2値。trueの場合、2次審査プロセスへと進む。
デモ: 保険金請求審査の効率化
1
9
特徴量設計:
Bring your own Recipe (BYOR)により特徴量設計の機能を拡張
BYOR:
Pythonプログラムにより機能追加github
に豊富にサンプルを公開
https://github.com/h2oai/driverlessai-
recipes
テンプレートに沿って開発
本デモでは、数値変換、外れ値処理を追加
デモ: 保険金請求審査の効率化
2
0
モデル:
XGBoostGBMを選択
データを4分割し、交差検証
アンサンブルにより最終的な予測値を出力
デモ: 保険金請求審査の効率化
2
1
精度:
F1値(0.8741)、AUC 0.77を達成
テストデータに対しての混同行列を表示
F1は再現率と適合率の調和平均を算出
過学習を回避し、頑健性を維持
デモ: 保険金請求審査の効率化
2
2
特徴量設計:
2,508もの特徴量を試行。最終的に102の特徴量が選択
複雑かつ大規模な特徴量設計が実施された
デモ: 保険金請求審査の効率化
2
3
特徴量の重要度:
予測モデル内の重要度が高い特徴量を出力
交差検証ターゲットエンコーディング、Weight of Evidenceなどが上位に位置
BYORにより追加された特徴量も選択された
デモ: 保険金請求審査の効率化
2
4
MLI:
特徴量の重要度、部分従属プロットなどを表示
デモ: 保険金請求審査の効率化
2
5
MLI:
Adverse Impact Analysisを表示
Confidential26
デモ: 保険金請求審査 – まとめ
2
6
多くの入力変数への対応
特徴量設計の自動化
BYORによる機能拡張
特徴量の重要度の出力
モデル作成の自動化
業務ニーズ・予測ニーズに対応したスコアラーの適用
業務ニーズ・予測ニーズに対応した閾値の探索
生産性
05
企業における機械学習
企業における機械学習ワークフロー
モデル
定義
ソリューション
定義
データ取得 データ準備 特徴量設計 モデル選択
モデル学習 モデル確定 モデル検証
モデル
パッケージング
モデル
デプロイメント
モデル管理
6
機械学習システムの隠れた技術負荷
企業における機械学習ワークフロー
モデル
定義
ソリューション
定義
データ取得 データ準備 特徴量設計 モデル選択
モデル学習 モデル確定 モデル検証
モデル
パッケージング
モデル
デプロイメント
モデル管理
部分的な自動化
完全に自動化
完全に自動化かつ拡張性あり
SQL
Local
Amazon S3
HDFS
X Y
スコアリング
パイプライン
機会学習の解釈可能性
低レイテンシーの実
行モジュール
をデプロイ
モデル作成
データセット
モデルレシピ:
• 分類/回帰
• 独立同分布化
• 時系列
• 自然言語処理
特徴量設計 アルゴリズム モデルチューニング+ +
高精度モデルを作成
機械学習の自動処理
データの形容、外れ値、
欠損値、等を理解
GPUアクセラレーションによる高速処理
1
データをドラッグ
&ドロップ 2
可視化の自動処理
ベスト・プラクティスなモデル
と高性能コンピューティングに
より、特徴量抽出とパラメータ
試行を含む数千のモデルを繰り
返し作成
3
機械学習の自動処理
特徴量変換処理を含むモデルのス
コアリングパイプラインを作成、
レイテンシーの低い実行モジュー
ルをPython、Javaで作成
4 スコアリングパイプライン
の自動作成
クラウド、ビッグ
データ・システム、
パソコンから入力
Google BigQuery
Azure Blog Storage
Snowflake
モデルドキュメント
の自動作成
Driverless AI – その動き
5
BYOR+
H2O Driverless AIの主な機能
1. AutoML
2. 特徴量設計の自動実行
3. Bring-Your-Own Recipes
4. 時系列
5. TensorFlowによる自然言語処理
6. 機会学習解釈可能性 (MLI)
7. 自動的な可視化
8. GPU アクセラレーション
9. スコアリング・パイプラインの自動生成
10.データソースと稼動環境・デプロイの柔軟性
次のステップ
06
AIの道筋
Confidential33
チーム作りと、経営者、デー
タサイエンティスト、ビジネス
リーダー、スペシャリスト、IT
リーダーなどの人々の参画。
データはチームスポーツ
どの問題を解くのかを決める。指
標(時間、金額、顧客数、など)を
設定する
どんなデータがあるのか、さ
らにどんなデータが求められ
るのかを理解する。また、技
術的に、何に対しての答えと
予測が得られるのかを認識
する。
社内外のデータサイエンス・コ
ミュニティから学び、吸収する
正しいを問いを抱く
データと技術
コミュニティ
データ文化の醸成
モデルを理解し、説明できる
ようになる。バイアスなども含
め、モデルの振る舞いを理解
し、ビジネス部門からの信任
を得る
AIを信じる
2
1
3
4
5
AIの道筋の
5つの
ステップ
より効率的な
サプライチェー
ンが必要だ
「不正」の問
題はあるか?
売上をより良く予測
できる?
購入確率を高めること
はできる?
どうやったら、次の
優良顧客を見つける
ことができるか?
現在の、あたなの
ビジネスチャレンジ
は?
Confidential35
Driverless AIは企業にAIを提供する
時間
洞察を得るまでの時間
人材
Kaggle Grandmasters
Top 10
データサイエンス・
エキスパート
機械学習のGPU処理
パイプラインの自動生成
数ヶ月が
数時間に
信頼
説明性と透明性
MLI
Auto Doc
Auto
Visualization
• H2Oウェブサイト: www.h2O.ai
• トライアル:21-day trial
• チュートリアル:tutorial
• ミートアップ:meetup
• ウェビナー:webinar
• リンクドイン:LinkedIn
• Twitter @h2oai
情報源(次のステップ)
CONFIDENTIA
ありがとう
ございました

Weitere ähnliche Inhalte

Mehr von Sri Ambati

Building Custom GenAI Apps at H2O
Building Custom GenAI Apps at H2OBuilding Custom GenAI Apps at H2O
Building Custom GenAI Apps at H2OSri Ambati
 
Applied Gen AI for the Finance Vertical
Applied Gen AI for the Finance Vertical Applied Gen AI for the Finance Vertical
Applied Gen AI for the Finance Vertical Sri Ambati
 
Cutting Edge Tricks from LLM Papers
Cutting Edge Tricks from LLM PapersCutting Edge Tricks from LLM Papers
Cutting Edge Tricks from LLM PapersSri Ambati
 
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...Sri Ambati
 
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...Sri Ambati
 
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...Sri Ambati
 
LLM Interpretability
LLM Interpretability LLM Interpretability
LLM Interpretability Sri Ambati
 
Never Reply to an Email Again
Never Reply to an Email AgainNever Reply to an Email Again
Never Reply to an Email AgainSri Ambati
 
Introducción al Aprendizaje Automatico con H2O-3 (1)
Introducción al Aprendizaje Automatico con H2O-3 (1)Introducción al Aprendizaje Automatico con H2O-3 (1)
Introducción al Aprendizaje Automatico con H2O-3 (1)Sri Ambati
 
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...Sri Ambati
 
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...Sri Ambati
 
AI Foundations Course Module 1 - An AI Transformation Journey
AI Foundations Course Module 1 - An AI Transformation JourneyAI Foundations Course Module 1 - An AI Transformation Journey
AI Foundations Course Module 1 - An AI Transformation JourneySri Ambati
 
ML Model Deployment and Scoring on the Edge with Automatic ML & DF
ML Model Deployment and Scoring on the Edge with Automatic ML & DFML Model Deployment and Scoring on the Edge with Automatic ML & DF
ML Model Deployment and Scoring on the Edge with Automatic ML & DFSri Ambati
 
Scaling & Managing Production Deployments with H2O ModelOps
Scaling & Managing Production Deployments with H2O ModelOpsScaling & Managing Production Deployments with H2O ModelOps
Scaling & Managing Production Deployments with H2O ModelOpsSri Ambati
 
Automatic Model Documentation with H2O
Automatic Model Documentation with H2OAutomatic Model Documentation with H2O
Automatic Model Documentation with H2OSri Ambati
 
Your AI Transformation
Your AI Transformation Your AI Transformation
Your AI Transformation Sri Ambati
 
AI Solutions in Manufacturing
AI Solutions in ManufacturingAI Solutions in Manufacturing
AI Solutions in ManufacturingSri Ambati
 
ICLR 2020 Recap
ICLR 2020 RecapICLR 2020 Recap
ICLR 2020 RecapSri Ambati
 
Getting Your Supply Chain Back on Track with AI
Getting Your Supply Chain Back on Track with AIGetting Your Supply Chain Back on Track with AI
Getting Your Supply Chain Back on Track with AISri Ambati
 
AI and AutoML: Debunking Myths
AI and AutoML: Debunking MythsAI and AutoML: Debunking Myths
AI and AutoML: Debunking MythsSri Ambati
 

Mehr von Sri Ambati (20)

Building Custom GenAI Apps at H2O
Building Custom GenAI Apps at H2OBuilding Custom GenAI Apps at H2O
Building Custom GenAI Apps at H2O
 
Applied Gen AI for the Finance Vertical
Applied Gen AI for the Finance Vertical Applied Gen AI for the Finance Vertical
Applied Gen AI for the Finance Vertical
 
Cutting Edge Tricks from LLM Papers
Cutting Edge Tricks from LLM PapersCutting Edge Tricks from LLM Papers
Cutting Edge Tricks from LLM Papers
 
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...
Practitioner's Guide to LLMs: Exploring Use Cases and a Glimpse Beyond Curren...
 
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
Open Source h2oGPT with Retrieval Augmented Generation (RAG), Web Search, and...
 
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...
KGM Mastering Classification and Regression with LLMs: Insights from Kaggle C...
 
LLM Interpretability
LLM Interpretability LLM Interpretability
LLM Interpretability
 
Never Reply to an Email Again
Never Reply to an Email AgainNever Reply to an Email Again
Never Reply to an Email Again
 
Introducción al Aprendizaje Automatico con H2O-3 (1)
Introducción al Aprendizaje Automatico con H2O-3 (1)Introducción al Aprendizaje Automatico con H2O-3 (1)
Introducción al Aprendizaje Automatico con H2O-3 (1)
 
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...
From Rapid Prototypes to an end-to-end Model Deployment: an AI Hedge Fund Use...
 
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...
AI Foundations Course Module 1 - Shifting to the Next Step in Your AI Transfo...
 
AI Foundations Course Module 1 - An AI Transformation Journey
AI Foundations Course Module 1 - An AI Transformation JourneyAI Foundations Course Module 1 - An AI Transformation Journey
AI Foundations Course Module 1 - An AI Transformation Journey
 
ML Model Deployment and Scoring on the Edge with Automatic ML & DF
ML Model Deployment and Scoring on the Edge with Automatic ML & DFML Model Deployment and Scoring on the Edge with Automatic ML & DF
ML Model Deployment and Scoring on the Edge with Automatic ML & DF
 
Scaling & Managing Production Deployments with H2O ModelOps
Scaling & Managing Production Deployments with H2O ModelOpsScaling & Managing Production Deployments with H2O ModelOps
Scaling & Managing Production Deployments with H2O ModelOps
 
Automatic Model Documentation with H2O
Automatic Model Documentation with H2OAutomatic Model Documentation with H2O
Automatic Model Documentation with H2O
 
Your AI Transformation
Your AI Transformation Your AI Transformation
Your AI Transformation
 
AI Solutions in Manufacturing
AI Solutions in ManufacturingAI Solutions in Manufacturing
AI Solutions in Manufacturing
 
ICLR 2020 Recap
ICLR 2020 RecapICLR 2020 Recap
ICLR 2020 Recap
 
Getting Your Supply Chain Back on Track with AI
Getting Your Supply Chain Back on Track with AIGetting Your Supply Chain Back on Track with AI
Getting Your Supply Chain Back on Track with AI
 
AI and AutoML: Debunking Myths
AI and AutoML: Debunking MythsAI and AutoML: Debunking Myths
AI and AutoML: Debunking Myths
 

Insurance webinar jp ver 1.1