アドテクに機械学習を組み込むための推論の高速化

アドテクに機械学習を組み込むための
推論の高速化
株式会社マイクロアドシステム開発部
データサイエンスユニット大庭淳史
Machine Learning 15 minutes!!
2022/07/30 Sat.

Contents
❶ インターネット広告とRTB
❷ 機械学習の推論が遅い原因
❸ 推論の高速化
2

Contents
3

インターネット広告の流れ
4
DSP
Demand Side Platform
RTB
Real Time Bidding
SSP
Supply Side Platform
広告ください
Aが一番高いな
A
B
C
入稿
入稿
入稿
広告主
WEBサイト
表示
90円！
30円！
50円！
90円で
Aを表示！

Demand Side Platform(DSP)
クリック確率予測購買確率予測落札額予測ユーザー行動予測
70円
広告情報広告在庫
機械学習モデル
5
DSP

Demand Side Platform(DSP)
クリック確率予測購買確率予測落札額予測ユーザー行動予測
70円
広告枠情報広告在庫
機械学習モデル
6
DSP
~5ms ~5ms ~5ms ~5ms
~50ms

本日の主旨
インターネット広告という時間制約の厳しい業界の中で
どのように機械学習を推論を高速化しているのか
7

Contents
① Pythonは並列処理が不得意
② 機械学習ライブラリは学習に特化している
8

機械学習の推論はなぜ遅いのか
PythonのマルチスレッドではCPUをフル活用できない
Global Interpreter Lock(GIL) とは
● Python3の処理系であるCPythonに存在する排他ロックの仕組み
● 実行できるバイトコードは１プロセスで１スレッドのみという制約
9

機械学習の推論はなぜ遅いのか
② 機械学習ライブラリは推論が低速
更新推論
評価
10
• Pythonの機械学習ライブラリは
C言語で実装されていてかなり高速
• しかし、機械学習ライブラリにはモデルを
学習する処理が含まれてしまっているた
め、推論処理にチューニングされていない

Contents
❷ 機械学習の推論はなぜ遅いのか
11

マルチプロセス✖マルチコンテナ構成
■ マルチプロセス
Pythonの低速なマルチスレッドを
回避するため複数プロセス化
12
■ マルチコンテナ
マルチコンテナを許容することで
モデルのABテストに対応
■ LBコンテナ
ポート毎のリクエストの振り分けと
ロギングを担当

推論特化フレームワーク
13
■ ONNX Runtime
ONNX 形式の実行エンジン
学習済みモデルのデファクトスタンダード
■ TensorRT
NVIDIA社が自社GPU向けに提供
ONNX始め多くのモデル形式に対応
モデルフォーマット
■ Open Neural Network Exchange(ONNX)
Protocol Buﬀerでモデルを定義するニューラルネットワーク用モデルフォーマット
PytorchやKerasなどの機械学習フレームワークからエクスポート可能
推論エンジン

ONNX Runtime の効果
推論速度(CPU) Docker imageサイズ
PyTorch 713 µs ± 13.5 µs 2.14 GB
ONNX Runtime 115 µs ± 14.4 µs 504 MB
落札額予測の事例
広告枠情報と広告を閲覧したユーザーの情報を入力とし
落札額、落札確率を予測するモデル
14
落札額予測モデルのアーキテクチャ
モデル構成
● 特徴量種別毎の Embedding 層
● 3層の Transformer 層
● 3層の Multi Layer Perceptron

まとめ
→ マルチプロセス✖マルチコンテナ
② 機械学習ライブラリは学習に特化している
→ 推論特化フレームワークの利用
15

アドテクに機械学習を組み込むための推論の高速化

Empfohlen

Empfohlen

Weitere ähnliche Inhalte

Was ist angesagt?

Was ist angesagt? (20)

Ähnlich wie アドテクに機械学習を組み込むための推論の高速化

Ähnlich wie アドテクに機械学習を組み込むための推論の高速化 (20)

Mehr von MicroAd, Inc.(Engineer)

Mehr von MicroAd, Inc.(Engineer) (20)

アドテクに機械学習を組み込むための推論の高速化