SlideShare a Scribd company logo
1 of 16
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
Copyright © 2018 SIGNATE, Inc.
All Rights Reserved.
Amazon SageMakerを使った機械学習モデル
管理運用システム構築
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
自己紹介
株式会社SIGNATE
Data Engineering Team CTO
名前:千(チョン)
ニックネーム:テル
ソフトウェアエンジニア
ビックデータアーキテクト
機械学習エンジニア
1
データサイ
エンティスト
エンジニア
株式会社
SIGNATE
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
2
AI開発コンサルティング
コンペティションによるAI開発
データサイエンティスト採用支援
データ活用人材の育成支援
イノベーションハブ
SIGNATEのサービス
10,000人を超えるデータサイエンティストが登録するSIGNATE。
オープンイノベーションによる開発コンペができるのは、SIGNATEだけの強みです。
AIの受託開発から採用、育成までトータルにAIソリューションを提供
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
3
【企業・政府】 賞金・名誉
AIアルゴリズム
各種権利
【SIGNATE会員】
AIを活用した
生産性の向上
新サービス開発
SERVICES - Competition
10,000人以上の
データサイエンティスト
が登録
AIアルゴリズムの精度を競う
オープンイノベーション型開発コンペ
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
How it works? 4
説明
データ
AI開発
結果
データ
予測
データ
AI予測
ゲーミフィケーション効果
上位目指してリトライ
結果
データ答え合わせ
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
Score 5
リアルタイムに精度をスコア化
コンペティションによる開発は精度比較を可視化でき、最高精度のアルゴリズムを調
達することが出来ます。
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
Member attribute 6
既に10,000名を超えるデータサイエンティストが登録
▼優秀な登録会員
SIGNATEには様々な分野の優秀なトップサイエンティストが登録しています。
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
Process 7
コンペ設計から納品まで約4ヶ月
AI開発におけるビジネス課題の設定から保有データの加工・整備、事前分析、コンペ
ティションの設計・開催、成果物の検証・確認までをトータルでサポートし、最高精
度のAI開発を実現します。
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
コンペティションによるAI開発課題
精度の高いモデル調達はできるが、運用化までハードルが高い
 ソースコードをもらってもデプロイ方法がわからない
 新しいデータで再学習を行いたいけど、どうすればいいかわからない
 モデルのバージョン管理はできるか
 既存ウェブアプリケーションとの連携方法やA/Bテスト
 可用性・拡張性のあるシステム設計が難しい
8
Aldebaran
機械学習モデル管理運用システム
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
Aldebaran 〜機械学習モデル管理運用システム 9
24時間・365日AIを高品質で運用、さらなる精度向上を支援します!
お客様はAI管理を意識せず、意思決定・アプリに集中いただけます!
【あらゆるAI】
・需要予測
・離脱・解約予測
・予兆検知
・画像認識・判定
Python製モデル
【多様な入出力】
・ダッシュボード可視化
・APIでのシステム連携
・CSV等ファイル入力
・リアルタイムやバッチデータに対する予測
【運用・保守・管理】
・ユーザ・外部データ管理
・AIバージョン管理
・API利用統計情報
・高パフォーマンス
API連携
運用実績データから再
学習し、使い続けるほ
ど賢くなるAIを実現!
弊社のデータサイエン
ティストサポート
Aldebaran
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
Machine Learning
Training & Hosting
Aldebaran System Architecture 10
SageMakerFARGATELoad
Balancer
Amazon S3
Web Application
Algorithm Management and Dashboards
SDK
API
EastiCacheRDS
Amazon ECR
CloudFront
client
Route 53
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
Amazon SageMakerとは
機械学習モデルを簡単に構築、トレーニング、デプロイできる
フルマネージド型サービス
(※ AWS re:Invent 2017 で発表されて、東京リージョンは2018年7月からサービス開始)
11
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
AWSが提供するMLサービススタック
https://www.slideshare.net/AmazonWebServicesJapan/aws-ml-update#5
12
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
特徴
• 誰が使う?データサイエンティスト、ソフトウェアエンジニア
• 利用方法
– AWS管理コンソール、AWS CLI、SDK(pip install sagemaker)
• モデル構築
– ホスト型のJupyterノートブックインスタンス
• モデルトレーニング
– 組み込みアルゴリズムやフレームワークの利用
• https://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/algos.html
• Apache MXNet, Tensorflow等
– Dockerコンテナによる独自の学習環境を作ることも可能
– 数十のインスタンスにスケールすることが可能
• モデルホスティング
– 推論HTTPS エンドポイントを提供
– トラフィックに対処するために自動スケールできる
– 同時に複数モデルで A/B テストが可能
13
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
感想
• Juptyer NotebookやSDKから機械学習の一連の作業がシームレスにできる
• 学習と予測に使う最適なコンピューティング環境を選べる
• 各モデルの特性に合った実行環境提(メモリ使うモデル、CPUを使うモデル)
• 必要なライブラリだけインストールするため、Dockerイメージを軽量化できる
• Amazon Lambdaと繋げれば、Serverless APIを実現できる
• ビジネスの最初のフェーズにすぐに対応可能
• 学習・推論共にDockerベースとなってるので、開発時はLocalで本番はCloud上
でと使い分けることができる
• Deploy環境はNginx+Gunicorn+Flaskで、Python実装モデルと相性が良い
• Deploy環境はDockerfileとして公開されてるため、AWS以外でも移植できる
• スケールしやすい
• インスタンス立ち上げ、停止に少し時間がかかる
• S3とデータやりとりするため追加費用がかかる
• モデルが増えたら管理するイメージも増える
14
Copyright © 2018 SIGNATE , Inc. All Rights Reserved.
ご静聴ありがとうございます
15

More Related Content

What's hot

What's hot (20)

Neural Network Intelligence 概要 (AutoML Platform)
Neural Network Intelligence 概要 (AutoML Platform)Neural Network Intelligence 概要 (AutoML Platform)
Neural Network Intelligence 概要 (AutoML Platform)
 
SmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_ccc
SmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_cccSmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_ccc
SmartNewsのニュース配信を支えるサーバ技術 / Kazhiro Sera @ SmartNews,Inc. #jjug_ccc
 
Let's BBQ with us!!
Let's BBQ with us!!Let's BBQ with us!!
Let's BBQ with us!!
 
MIO Prediction Engine(仮) with モブキャスト on GCP
MIO Prediction Engine(仮) with モブキャスト on GCPMIO Prediction Engine(仮) with モブキャスト on GCP
MIO Prediction Engine(仮) with モブキャスト on GCP
 
BSP Be.Cloudが実現する、ITコストの最適化
BSP Be.Cloudが実現する、ITコストの最適化BSP Be.Cloudが実現する、ITコストの最適化
BSP Be.Cloudが実現する、ITコストの最適化
 
CSP パートナー向け向け Azure マネージド サービス プレイブック
CSP パートナー向け向け Azure マネージド サービス プレイブックCSP パートナー向け向け Azure マネージド サービス プレイブック
CSP パートナー向け向け Azure マネージド サービス プレイブック
 
複数のデータベースを統合・連携したい!こんなときにおすすめ「Stambia」
複数のデータベースを統合・連携したい!こんなときにおすすめ「Stambia」複数のデータベースを統合・連携したい!こんなときにおすすめ「Stambia」
複数のデータベースを統合・連携したい!こんなときにおすすめ「Stambia」
 
Elastic on-microsoft-azure-0630-webinar-no-video
Elastic on-microsoft-azure-0630-webinar-no-videoElastic on-microsoft-azure-0630-webinar-no-video
Elastic on-microsoft-azure-0630-webinar-no-video
 
GCP本格採用で遭遇した課題とマイクロサービス的解決
GCP本格採用で遭遇した課題とマイクロサービス的解決GCP本格採用で遭遇した課題とマイクロサービス的解決
GCP本格採用で遭遇した課題とマイクロサービス的解決
 
[Cloud OnAir] お客様事例紹介 アサヒグループのデータと GCP の活用 2019年6月13日 放送
[Cloud OnAir] お客様事例紹介  アサヒグループのデータと GCP の活用 2019年6月13日 放送[Cloud OnAir] お客様事例紹介  アサヒグループのデータと GCP の活用 2019年6月13日 放送
[Cloud OnAir] お客様事例紹介 アサヒグループのデータと GCP の活用 2019年6月13日 放送
 
基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
基本から学ぶ ビッグデータ / データ分析 / 機械学習 サービス群
 
明日から役立つ BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
明日から役立つ  BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online明日から役立つ  BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
明日から役立つ BigQuery ML 活用 5 つのヒント | Google Cloud INSIDE Games & Apps: Online
 
今日からはじめようAWS IoT
今日からはじめようAWS IoT今日からはじめようAWS IoT
今日からはじめようAWS IoT
 
[Cloud OnAir] Next ’19 サンフランシスコ最新情報 G Suite 特集 2019年4月18日 放送
[Cloud OnAir] Next ’19 サンフランシスコ最新情報 G Suite 特集 2019年4月18日 放送[Cloud OnAir] Next ’19 サンフランシスコ最新情報 G Suite 特集 2019年4月18日 放送
[Cloud OnAir] Next ’19 サンフランシスコ最新情報 G Suite 特集 2019年4月18日 放送
 
[Cloud OnAir] Google Cloud 主催イベント Data Platform Day Recap!〜登壇企業インタビューと内容解説〜 2...
[Cloud OnAir] Google Cloud 主催イベント Data Platform Day Recap!〜登壇企業インタビューと内容解説〜 2...[Cloud OnAir] Google Cloud 主催イベント Data Platform Day Recap!〜登壇企業インタビューと内容解説〜 2...
[Cloud OnAir] Google Cloud 主催イベント Data Platform Day Recap!〜登壇企業インタビューと内容解説〜 2...
 
Developers Summit 2015 【19-B-L】 DevOpsの究極の形!?、クラウドで始めるドキュメント・データベース活用のポイント。
Developers Summit 2015 【19-B-L】 DevOpsの究極の形!?、クラウドで始めるドキュメント・データベース活用のポイント。Developers Summit 2015 【19-B-L】 DevOpsの究極の形!?、クラウドで始めるドキュメント・データベース活用のポイント。
Developers Summit 2015 【19-B-L】 DevOpsの究極の形!?、クラウドで始めるドキュメント・データベース活用のポイント。
 
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のりThe Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
The Design for Serverless ETL Pipeline データ分析基盤のレガシーなデータロードをサーバレスでフルリプレースするまで道のり
 
データから価値を生み続けるには
データから価値を生み続けるにはデータから価値を生み続けるには
データから価値を生み続けるには
 
GCE を利用した Sansan マイクロサービス移行とそのメリット
GCE を利用した Sansan マイクロサービス移行とそのメリットGCE を利用した Sansan マイクロサービス移行とそのメリット
GCE を利用した Sansan マイクロサービス移行とそのメリット
 
[Cloud OnAir] ビジネスの成長を加速するマーケティング データウェアハウス 2019年12月5日 放送
[Cloud OnAir] ビジネスの成長を加速するマーケティング データウェアハウス 2019年12月5日 放送[Cloud OnAir] ビジネスの成長を加速するマーケティング データウェアハウス 2019年12月5日 放送
[Cloud OnAir] ビジネスの成長を加速するマーケティング データウェアハウス 2019年12月5日 放送
 

Similar to Amazon SageMakerを使った機械学習モデル管理運用システム構築事例

メンバーズデータアドベンチャー新規部門事業計画書
メンバーズデータアドベンチャー新規部門事業計画書メンバーズデータアドベンチャー新規部門事業計画書
メンバーズデータアドベンチャー新規部門事業計画書
白井 恵里
 

Similar to Amazon SageMakerを使った機械学習モデル管理運用システム構築事例 (20)

国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例
国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例
国内外AIコンペティションからみるAI技術者のキャリアパスの潮流およびAIコンペサイトSIGNATEにおけるAWS活用事例
 
AI開発支援サービス
AI開発支援サービスAI開発支援サービス
AI開発支援サービス
 
AI活用におけるビジネス力とは何か?
AI活用におけるビジネス力とは何か?AI活用におけるビジネス力とは何か?
AI活用におけるビジネス力とは何か?
 
Wg for edu_20180713
Wg for edu_20180713Wg for edu_20180713
Wg for edu_20180713
 
Game technight16 lt_ai_drivensocialmedia
Game technight16 lt_ai_drivensocialmediaGame technight16 lt_ai_drivensocialmedia
Game technight16 lt_ai_drivensocialmedia
 
JSUG 2018 BTC
JSUG 2018 BTCJSUG 2018 BTC
JSUG 2018 BTC
 
WCAN 2018 Winter -2018年12月15日 -
WCAN 2018 Winter  -2018年12月15日 -WCAN 2018 Winter  -2018年12月15日 -
WCAN 2018 Winter -2018年12月15日 -
 
[db tech showcase Tokyo 2018] #dbts2018 #D23 『機械学習の自動化を実現するDataRobotによるAIの民主化とは』
[db tech showcase Tokyo 2018] #dbts2018 #D23 『機械学習の自動化を実現するDataRobotによるAIの民主化とは』[db tech showcase Tokyo 2018] #dbts2018 #D23 『機械学習の自動化を実現するDataRobotによるAIの民主化とは』
[db tech showcase Tokyo 2018] #dbts2018 #D23 『機械学習の自動化を実現するDataRobotによるAIの民主化とは』
 
メンバーズデータアドベンチャー新規部門事業計画書
メンバーズデータアドベンチャー新規部門事業計画書メンバーズデータアドベンチャー新規部門事業計画書
メンバーズデータアドベンチャー新規部門事業計画書
 
私たち企業がアクセシビリティに取り組む理由(2018年) #accfes
私たち企業がアクセシビリティに取り組む理由(2018年) #accfes私たち企業がアクセシビリティに取り組む理由(2018年) #accfes
私たち企業がアクセシビリティに取り組む理由(2018年) #accfes
 
第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる第4次産業革命 AIでビジネスの現場が変わる
第4次産業革命 AIでビジネスの現場が変わる
 
SCORER Partner Summit 2018_ TIS Nagai
SCORER Partner Summit 2018_ TIS NagaiSCORER Partner Summit 2018_ TIS Nagai
SCORER Partner Summit 2018_ TIS Nagai
 
ソフトウェアベンチャーのサポートエンジニア
ソフトウェアベンチャーのサポートエンジニアソフトウェアベンチャーのサポートエンジニア
ソフトウェアベンチャーのサポートエンジニア
 
06.ユニアデックス(株)_発表資料
06.ユニアデックス(株)_発表資料06.ユニアデックス(株)_発表資料
06.ユニアデックス(株)_発表資料
 
20180927 みやぎ IoT ビジネス共創ラボ 製造業から養豚まで、おいしい IoT & AI ビジネスのつくり方
20180927 みやぎ IoT ビジネス共創ラボ 製造業から養豚まで、おいしい IoT & AI ビジネスのつくり方20180927 みやぎ IoT ビジネス共創ラボ 製造業から養豚まで、おいしい IoT & AI ビジネスのつくり方
20180927 みやぎ IoT ビジネス共創ラボ 製造業から養豚まで、おいしい IoT & AI ビジネスのつくり方
 
海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会
海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会 海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会
海外先進IoT事例を材料に、日本のIoTビジネスを共に創ろう!(再) _IoTビジネス共創ラボ 第10回 勉強会
 
xDataTech profile 20190125
xDataTech profile 20190125xDataTech profile 20190125
xDataTech profile 20190125
 
[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...
[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...
[Track3-1] ビジネスで役立つAIリテラシーから機械学習エンジニアリングまで実践形式で学ぶ課題解決型AI人材育成とは?〜国内最大AIコンペサイトの...
 
MANABIYA 2018 DB kinoshita DB for AItech
MANABIYA 2018 DB kinoshita DB for AItechMANABIYA 2018 DB kinoshita DB for AItech
MANABIYA 2018 DB kinoshita DB for AItech
 
不足するAI人材に対する「パソナテックの人材育成ソリューション」
不足するAI人材に対する「パソナテックの人材育成ソリューション」不足するAI人材に対する「パソナテックの人材育成ソリューション」
不足するAI人材に対する「パソナテックの人材育成ソリューション」
 

Amazon SageMakerを使った機械学習モデル管理運用システム構築事例

  • 1. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. Copyright © 2018 SIGNATE, Inc. All Rights Reserved. Amazon SageMakerを使った機械学習モデル 管理運用システム構築
  • 2. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. 自己紹介 株式会社SIGNATE Data Engineering Team CTO 名前:千(チョン) ニックネーム:テル ソフトウェアエンジニア ビックデータアーキテクト 機械学習エンジニア 1 データサイ エンティスト エンジニア 株式会社 SIGNATE
  • 3. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. 2 AI開発コンサルティング コンペティションによるAI開発 データサイエンティスト採用支援 データ活用人材の育成支援 イノベーションハブ SIGNATEのサービス 10,000人を超えるデータサイエンティストが登録するSIGNATE。 オープンイノベーションによる開発コンペができるのは、SIGNATEだけの強みです。 AIの受託開発から採用、育成までトータルにAIソリューションを提供
  • 4. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. 3 【企業・政府】 賞金・名誉 AIアルゴリズム 各種権利 【SIGNATE会員】 AIを活用した 生産性の向上 新サービス開発 SERVICES - Competition 10,000人以上の データサイエンティスト が登録 AIアルゴリズムの精度を競う オープンイノベーション型開発コンペ
  • 5. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. How it works? 4 説明 データ AI開発 結果 データ 予測 データ AI予測 ゲーミフィケーション効果 上位目指してリトライ 結果 データ答え合わせ
  • 6. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. Score 5 リアルタイムに精度をスコア化 コンペティションによる開発は精度比較を可視化でき、最高精度のアルゴリズムを調 達することが出来ます。
  • 7. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. Member attribute 6 既に10,000名を超えるデータサイエンティストが登録 ▼優秀な登録会員 SIGNATEには様々な分野の優秀なトップサイエンティストが登録しています。
  • 8. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. Process 7 コンペ設計から納品まで約4ヶ月 AI開発におけるビジネス課題の設定から保有データの加工・整備、事前分析、コンペ ティションの設計・開催、成果物の検証・確認までをトータルでサポートし、最高精 度のAI開発を実現します。
  • 9. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. コンペティションによるAI開発課題 精度の高いモデル調達はできるが、運用化までハードルが高い  ソースコードをもらってもデプロイ方法がわからない  新しいデータで再学習を行いたいけど、どうすればいいかわからない  モデルのバージョン管理はできるか  既存ウェブアプリケーションとの連携方法やA/Bテスト  可用性・拡張性のあるシステム設計が難しい 8 Aldebaran 機械学習モデル管理運用システム
  • 10. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. Aldebaran 〜機械学習モデル管理運用システム 9 24時間・365日AIを高品質で運用、さらなる精度向上を支援します! お客様はAI管理を意識せず、意思決定・アプリに集中いただけます! 【あらゆるAI】 ・需要予測 ・離脱・解約予測 ・予兆検知 ・画像認識・判定 Python製モデル 【多様な入出力】 ・ダッシュボード可視化 ・APIでのシステム連携 ・CSV等ファイル入力 ・リアルタイムやバッチデータに対する予測 【運用・保守・管理】 ・ユーザ・外部データ管理 ・AIバージョン管理 ・API利用統計情報 ・高パフォーマンス API連携 運用実績データから再 学習し、使い続けるほ ど賢くなるAIを実現! 弊社のデータサイエン ティストサポート Aldebaran
  • 11. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. Machine Learning Training & Hosting Aldebaran System Architecture 10 SageMakerFARGATELoad Balancer Amazon S3 Web Application Algorithm Management and Dashboards SDK API EastiCacheRDS Amazon ECR CloudFront client Route 53
  • 12. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. Amazon SageMakerとは 機械学習モデルを簡単に構築、トレーニング、デプロイできる フルマネージド型サービス (※ AWS re:Invent 2017 で発表されて、東京リージョンは2018年7月からサービス開始) 11
  • 13. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. AWSが提供するMLサービススタック https://www.slideshare.net/AmazonWebServicesJapan/aws-ml-update#5 12
  • 14. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. 特徴 • 誰が使う?データサイエンティスト、ソフトウェアエンジニア • 利用方法 – AWS管理コンソール、AWS CLI、SDK(pip install sagemaker) • モデル構築 – ホスト型のJupyterノートブックインスタンス • モデルトレーニング – 組み込みアルゴリズムやフレームワークの利用 • https://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/algos.html • Apache MXNet, Tensorflow等 – Dockerコンテナによる独自の学習環境を作ることも可能 – 数十のインスタンスにスケールすることが可能 • モデルホスティング – 推論HTTPS エンドポイントを提供 – トラフィックに対処するために自動スケールできる – 同時に複数モデルで A/B テストが可能 13
  • 15. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. 感想 • Juptyer NotebookやSDKから機械学習の一連の作業がシームレスにできる • 学習と予測に使う最適なコンピューティング環境を選べる • 各モデルの特性に合った実行環境提(メモリ使うモデル、CPUを使うモデル) • 必要なライブラリだけインストールするため、Dockerイメージを軽量化できる • Amazon Lambdaと繋げれば、Serverless APIを実現できる • ビジネスの最初のフェーズにすぐに対応可能 • 学習・推論共にDockerベースとなってるので、開発時はLocalで本番はCloud上 でと使い分けることができる • Deploy環境はNginx+Gunicorn+Flaskで、Python実装モデルと相性が良い • Deploy環境はDockerfileとして公開されてるため、AWS以外でも移植できる • スケールしやすい • インスタンス立ち上げ、停止に少し時間がかかる • S3とデータやりとりするため追加費用がかかる • モデルが増えたら管理するイメージも増える 14
  • 16. Copyright © 2018 SIGNATE , Inc. All Rights Reserved. ご静聴ありがとうございます 15