SlideShare ist ein Scribd-Unternehmen logo
1 von 26
Downloaden Sie, um offline zu lesen
 
敵対生成学習による外観検査のための異常検知手法
GTC Japan 2018 テクニカルセッション
2018/09/13
2
 
©2018 Ridge-i All Rights Reserved.
問題設定
3
 
©2018 Ridge-i All Rights Reserved.
● 画像内の異常を発見したいケースは数多く存在する
○ e.g. 工業製品の傷検知,車両進入禁止エリアの監視など...
● 発見したい異常部分が小さいほど,対象画像の解像度は高くなければいけない
高解像度画像内の小さな異常部分を発見したい
問題設定
4
 
©2018 Ridge-i All Rights Reserved.
● 異常部分と正常部分の視覚的識別
○ 傷なのか?模様なのか?
○ 同じような見た目でも,ある部分は傷,ある部分は模様という場合がある
■ 画像を細かく区切るパッチ処理ではなく画像全体を見なければいけない
● 微小な異常箇所の特定
○ 計算効率を考えて入力画像の解像度を落とすと,拾えない異常箇所が出てくる
○ できる限り元の解像度を保ったままモデル化する必要がある
高解像度画像内の異常検知の難しさ
5
 
©2018 Ridge-i All Rights Reserved.
画像生成モデルによる異常検知
6
 
©2018 Ridge-i All Rights Reserved.
● 画像内の異常検知を教師なしで行いたい
画像生成モデルによる異常検知
異常部分
正常画像 異常画像
7
 
©2018 Ridge-i All Rights Reserved.
● 正常画像の分布をモデル化して,異常箇所を特定する
○ VAE, GAN etc...
画像生成モデルによる異常検知
正常画像 異常画像
異常部分
8
 
©2018 Ridge-i All Rights Reserved.
敵対生成学習による異常検知
9
 
©2018 Ridge-i All Rights Reserved.
● Goodfellowらが提案 [1]
● GeneratorとDiscriminatorの二つのネットワークからなる
○ Generatorは学習データにありそうな画像を生成
○ Discriminatorは本物の画像なのか生成された画像なのかを分類
Generative Adversarial Networks (GAN)
10
 
©2018 Ridge-i All Rights Reserved.
Generative Adversarial Networks (GAN)
● 生成器Gと識別器Dの敵対学習
● GはDを騙せるような画像を作れるように学習
● DはGに騙されないように学習
11
 
©2018 Ridge-i All Rights Reserved.
敵対生成学習モデルによる異常検知 [2]
Normal Images Real Imagesを正常画像のみにして学習
正常画像しか作れないGeneratorを得る
12
 
©2018 Ridge-i All Rights Reserved.
敵対生成学習モデルによる異常検知
正常系
異常系
入力画像A
Generatorの生成範囲内なので正常
Generatorの生成範囲外なので異常
GANを利用した異
常検知の概要
GANで学習したGeneratorは正常な画像であれば完璧に生成できるはず
→ Generatorが生成できる画像は正常、できない画像は異常と判断する
入力画像B
• 特徴①:Discriminatorを騙せる程リアルな画像を生成
• 特徴②:良品画像しか作れない
• → 正常系とGeneratorが作れる画像集合が一致する
理想的なGeneratorが作れる画像の集合
13
 
©2018 Ridge-i All Rights Reserved.
● 生成画像と入力画像の差分をとって異常部分を検知する
● 正常部分であればGeneratorが生成できることを利用
敵対生成学習モデルによる異常検知
生成画像
入力画像
差分画像
14
 
©2018 Ridge-i All Rights Reserved.
● なぜ高解像度でなければいけないのか?
○ 微小な異常の場合,画像の解像度を落とすと消えてしまう
● パッチ処理 (画像を細分化して個別に異常検知)をすればいいのではないか
○ 画像全体を見ないと異常箇所 or 単なる模様の区別ができない
高解像度画像に対する異常検知
15
 
©2018 Ridge-i All Rights Reserved.
● Karrasらによって提案[3] (NVIDIA!!)
● 従来のGANsのクォリティを遥かに上回るGANsの学習手法
○ 低解像度画像から徐々に学習を進め,最終的に高解像度・高精細画像を得る
Progressive Growing of GANs
16
 
©2018 Ridge-i All Rights Reserved.
● α: K番目の解像度のフィルタと K-1番目のフィルタを足し合わせる比率
○ αを徐々に増加させていくことで K番目の解像度の学習に差し替える
● この手法によって,高解像度かつ高精細な画像を生成できるようになった
Progressive Growing of GANs (Main Contribution)
toRGB,fromRGBは1x1 Conv
17
 
©2018 Ridge-i All Rights Reserved.
実例
18
 
©2018 Ridge-i All Rights Reserved.
オープンデータセットに対する異常検知例
* UMN Unusual crowd activity datase (http://mha.cs.umn.edu/)
正常時画像
異常時画像
モデルの推論結果
19
 
©2018 Ridge-i All Rights Reserved.
オープンデータセットに対する異常検知例
入力 推論結果
* UMN Unusual crowd activity datase (http://mha.cs.umn.edu/)
20
 
©2018 Ridge-i All Rights Reserved.
現実のデータに対する異常検知例
21
 
©2018 Ridge-i All Rights Reserved.
● 正常画像は多ければ多いほど良い
○ Generatorの生成できる画像の分布が実際の分布に近づくため
○ 異常箇所以外のノイズを限りなく再現できるようになる
正常画像数と精度の推移
N = 100
N = 1000
正常画像数とスコアの推移
22
 
©2018 Ridge-i All Rights Reserved.
● 実際に得られたデータの水増しを行うデータ拡張は注意が必要
○ 適用するドメインによっては拡張結果がそのまま異常になる可能性
データ拡張について
23
 
©2018 Ridge-i All Rights Reserved.
● 高解像度画像内の異常検知について,画像生成モデルを用いて取り組んだ
○ 最新の敵対生成学習手法を実用
○ 異常箇所に対するアノテーションなしに学習可能であることを実証
● 今後の課題
○ 異常箇所以外のノイズを極力少なくするための精度改善手法の模索
○ どういうドメインにおいて特に手法が有効であるのかを調査
まとめ
24
 
©2018 Ridge-i All Rights Reserved.
参考文献
25
 
©2018 Ridge-i All Rights Reserved.
● [1] Goodfellow, Ian, et al. "Generative adversarial nets." Advances in neural information processing systems. 2014.
● [2] Schlegl, Thomas, et al. "Unsupervised anomaly detection with generative adversarial networks to guide marker discovery." International
Conference on Information Processing in Medical Imaging. Springer, Cham, 2017.
● [3] Karras, Tero, et al. "Progressive growing of gans for improved quality, stability, and variation." International Conference on Learning
Representations (ICLR 2018), 2018. 4, 2018.
参考文献
26
 
©2018 Ridge-i All Rights Reserved.
GTC2018ブース出展中(1Fスポンサー展示エリア)
Ridge-iの様々な事例や技術情報を展示しています
We’re hiring !
ビジネスストラクチャリング/ エンジニア / リサーチエンジニア
https://ridge-i.com/careers/

Weitere ähnliche Inhalte

Mehr von Masanari Kimura

曲線から多様体まで駆け抜ける微分幾何学入門
曲線から多様体まで駆け抜ける微分幾何学入門曲線から多様体まで駆け抜ける微分幾何学入門
曲線から多様体まで駆け抜ける微分幾何学入門Masanari Kimura
 
[NeurIPS2019 論文読み会] A Meta Analysis of Overfitting in Machine Learning
[NeurIPS2019 論文読み会] A Meta Analysis of Overfitting in Machine Learning[NeurIPS2019 論文読み会] A Meta Analysis of Overfitting in Machine Learning
[NeurIPS2019 論文読み会] A Meta Analysis of Overfitting in Machine LearningMasanari Kimura
 
[Ridge-i 論文読み会] ICLR2019における不完全ラベル学習
[Ridge-i 論文読み会] ICLR2019における不完全ラベル学習[Ridge-i 論文読み会] ICLR2019における不完全ラベル学習
[Ridge-i 論文読み会] ICLR2019における不完全ラベル学習Masanari Kimura
 
[NeurIPS2018論文読み会] Adversarial vulnerability for any classifier
[NeurIPS2018論文読み会] Adversarial vulnerability for any classifier[NeurIPS2018論文読み会] Adversarial vulnerability for any classifier
[NeurIPS2018論文読み会] Adversarial vulnerability for any classifierMasanari Kimura
 
[Ridge-i 論文よみかい] Wasserstein auto encoder
[Ridge-i 論文よみかい] Wasserstein auto encoder[Ridge-i 論文よみかい] Wasserstein auto encoder
[Ridge-i 論文よみかい] Wasserstein auto encoderMasanari Kimura
 

Mehr von Masanari Kimura (6)

曲線から多様体まで駆け抜ける微分幾何学入門
曲線から多様体まで駆け抜ける微分幾何学入門曲線から多様体まで駆け抜ける微分幾何学入門
曲線から多様体まで駆け抜ける微分幾何学入門
 
[NeurIPS2019 論文読み会] A Meta Analysis of Overfitting in Machine Learning
[NeurIPS2019 論文読み会] A Meta Analysis of Overfitting in Machine Learning[NeurIPS2019 論文読み会] A Meta Analysis of Overfitting in Machine Learning
[NeurIPS2019 論文読み会] A Meta Analysis of Overfitting in Machine Learning
 
NeurIPS2019参加報告
NeurIPS2019参加報告NeurIPS2019参加報告
NeurIPS2019参加報告
 
[Ridge-i 論文読み会] ICLR2019における不完全ラベル学習
[Ridge-i 論文読み会] ICLR2019における不完全ラベル学習[Ridge-i 論文読み会] ICLR2019における不完全ラベル学習
[Ridge-i 論文読み会] ICLR2019における不完全ラベル学習
 
[NeurIPS2018論文読み会] Adversarial vulnerability for any classifier
[NeurIPS2018論文読み会] Adversarial vulnerability for any classifier[NeurIPS2018論文読み会] Adversarial vulnerability for any classifier
[NeurIPS2018論文読み会] Adversarial vulnerability for any classifier
 
[Ridge-i 論文よみかい] Wasserstein auto encoder
[Ridge-i 論文よみかい] Wasserstein auto encoder[Ridge-i 論文よみかい] Wasserstein auto encoder
[Ridge-i 論文よみかい] Wasserstein auto encoder
 

Kürzlich hochgeladen

モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...博三 太田
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案sugiuralab
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineerYuki Kikuchi
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfFumieNakayama
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfFumieNakayama
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)UEHARA, Tetsutaro
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?akihisamiyanaga1
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)Hiroshi Tomioka
 

Kürzlich hochgeladen (8)

モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察  ~Text-to-MusicとText-To-ImageかつImage-to-Music...
モーダル間の変換後の一致性とジャンル表を用いた解釈可能性の考察 ~Text-to-MusicとText-To-ImageかつImage-to-Music...
 
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
TataPixel: 畳の異方性を利用した切り替え可能なディスプレイの提案
 
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
自分史上一番早い2024振り返り〜コロナ後、仕事は通常ペースに戻ったか〜 by IoT fullstack engineer
 
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdfAWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
AWS の OpenShift サービス (ROSA) を使った OpenShift Virtualizationの始め方.pdf
 
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdfクラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
クラウドネイティブなサーバー仮想化基盤 - OpenShift Virtualization.pdf
 
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
デジタル・フォレンジックの最新動向(2024年4月27日情洛会総会特別講演スライド)
 
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
CTO, VPoE, テックリードなどリーダーポジションに登用したくなるのはどんな人材か?
 
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
業務で生成AIを活用したい人のための生成AI入門講座(社外公開版:キンドリルジャパン社内勉強会:2024年4月発表)
 

[GTC2018] 敵対生成学習による外観検査のための異常検知手法 (Ridge-i 発表資料)

  • 2. 2   ©2018 Ridge-i All Rights Reserved. 問題設定
  • 3. 3   ©2018 Ridge-i All Rights Reserved. ● 画像内の異常を発見したいケースは数多く存在する ○ e.g. 工業製品の傷検知,車両進入禁止エリアの監視など... ● 発見したい異常部分が小さいほど,対象画像の解像度は高くなければいけない 高解像度画像内の小さな異常部分を発見したい 問題設定
  • 4. 4   ©2018 Ridge-i All Rights Reserved. ● 異常部分と正常部分の視覚的識別 ○ 傷なのか?模様なのか? ○ 同じような見た目でも,ある部分は傷,ある部分は模様という場合がある ■ 画像を細かく区切るパッチ処理ではなく画像全体を見なければいけない ● 微小な異常箇所の特定 ○ 計算効率を考えて入力画像の解像度を落とすと,拾えない異常箇所が出てくる ○ できる限り元の解像度を保ったままモデル化する必要がある 高解像度画像内の異常検知の難しさ
  • 5. 5   ©2018 Ridge-i All Rights Reserved. 画像生成モデルによる異常検知
  • 6. 6   ©2018 Ridge-i All Rights Reserved. ● 画像内の異常検知を教師なしで行いたい 画像生成モデルによる異常検知 異常部分 正常画像 異常画像
  • 7. 7   ©2018 Ridge-i All Rights Reserved. ● 正常画像の分布をモデル化して,異常箇所を特定する ○ VAE, GAN etc... 画像生成モデルによる異常検知 正常画像 異常画像 異常部分
  • 8. 8   ©2018 Ridge-i All Rights Reserved. 敵対生成学習による異常検知
  • 9. 9   ©2018 Ridge-i All Rights Reserved. ● Goodfellowらが提案 [1] ● GeneratorとDiscriminatorの二つのネットワークからなる ○ Generatorは学習データにありそうな画像を生成 ○ Discriminatorは本物の画像なのか生成された画像なのかを分類 Generative Adversarial Networks (GAN)
  • 10. 10   ©2018 Ridge-i All Rights Reserved. Generative Adversarial Networks (GAN) ● 生成器Gと識別器Dの敵対学習 ● GはDを騙せるような画像を作れるように学習 ● DはGに騙されないように学習
  • 11. 11   ©2018 Ridge-i All Rights Reserved. 敵対生成学習モデルによる異常検知 [2] Normal Images Real Imagesを正常画像のみにして学習 正常画像しか作れないGeneratorを得る
  • 12. 12   ©2018 Ridge-i All Rights Reserved. 敵対生成学習モデルによる異常検知 正常系 異常系 入力画像A Generatorの生成範囲内なので正常 Generatorの生成範囲外なので異常 GANを利用した異 常検知の概要 GANで学習したGeneratorは正常な画像であれば完璧に生成できるはず → Generatorが生成できる画像は正常、できない画像は異常と判断する 入力画像B • 特徴①:Discriminatorを騙せる程リアルな画像を生成 • 特徴②:良品画像しか作れない • → 正常系とGeneratorが作れる画像集合が一致する 理想的なGeneratorが作れる画像の集合
  • 13. 13   ©2018 Ridge-i All Rights Reserved. ● 生成画像と入力画像の差分をとって異常部分を検知する ● 正常部分であればGeneratorが生成できることを利用 敵対生成学習モデルによる異常検知 生成画像 入力画像 差分画像
  • 14. 14   ©2018 Ridge-i All Rights Reserved. ● なぜ高解像度でなければいけないのか? ○ 微小な異常の場合,画像の解像度を落とすと消えてしまう ● パッチ処理 (画像を細分化して個別に異常検知)をすればいいのではないか ○ 画像全体を見ないと異常箇所 or 単なる模様の区別ができない 高解像度画像に対する異常検知
  • 15. 15   ©2018 Ridge-i All Rights Reserved. ● Karrasらによって提案[3] (NVIDIA!!) ● 従来のGANsのクォリティを遥かに上回るGANsの学習手法 ○ 低解像度画像から徐々に学習を進め,最終的に高解像度・高精細画像を得る Progressive Growing of GANs
  • 16. 16   ©2018 Ridge-i All Rights Reserved. ● α: K番目の解像度のフィルタと K-1番目のフィルタを足し合わせる比率 ○ αを徐々に増加させていくことで K番目の解像度の学習に差し替える ● この手法によって,高解像度かつ高精細な画像を生成できるようになった Progressive Growing of GANs (Main Contribution) toRGB,fromRGBは1x1 Conv
  • 17. 17   ©2018 Ridge-i All Rights Reserved. 実例
  • 18. 18   ©2018 Ridge-i All Rights Reserved. オープンデータセットに対する異常検知例 * UMN Unusual crowd activity datase (http://mha.cs.umn.edu/) 正常時画像 異常時画像 モデルの推論結果
  • 19. 19   ©2018 Ridge-i All Rights Reserved. オープンデータセットに対する異常検知例 入力 推論結果 * UMN Unusual crowd activity datase (http://mha.cs.umn.edu/)
  • 20. 20   ©2018 Ridge-i All Rights Reserved. 現実のデータに対する異常検知例
  • 21. 21   ©2018 Ridge-i All Rights Reserved. ● 正常画像は多ければ多いほど良い ○ Generatorの生成できる画像の分布が実際の分布に近づくため ○ 異常箇所以外のノイズを限りなく再現できるようになる 正常画像数と精度の推移 N = 100 N = 1000 正常画像数とスコアの推移
  • 22. 22   ©2018 Ridge-i All Rights Reserved. ● 実際に得られたデータの水増しを行うデータ拡張は注意が必要 ○ 適用するドメインによっては拡張結果がそのまま異常になる可能性 データ拡張について
  • 23. 23   ©2018 Ridge-i All Rights Reserved. ● 高解像度画像内の異常検知について,画像生成モデルを用いて取り組んだ ○ 最新の敵対生成学習手法を実用 ○ 異常箇所に対するアノテーションなしに学習可能であることを実証 ● 今後の課題 ○ 異常箇所以外のノイズを極力少なくするための精度改善手法の模索 ○ どういうドメインにおいて特に手法が有効であるのかを調査 まとめ
  • 24. 24   ©2018 Ridge-i All Rights Reserved. 参考文献
  • 25. 25   ©2018 Ridge-i All Rights Reserved. ● [1] Goodfellow, Ian, et al. "Generative adversarial nets." Advances in neural information processing systems. 2014. ● [2] Schlegl, Thomas, et al. "Unsupervised anomaly detection with generative adversarial networks to guide marker discovery." International Conference on Information Processing in Medical Imaging. Springer, Cham, 2017. ● [3] Karras, Tero, et al. "Progressive growing of gans for improved quality, stability, and variation." International Conference on Learning Representations (ICLR 2018), 2018. 4, 2018. 参考文献
  • 26. 26   ©2018 Ridge-i All Rights Reserved. GTC2018ブース出展中(1Fスポンサー展示エリア) Ridge-iの様々な事例や技術情報を展示しています We’re hiring ! ビジネスストラクチャリング/ エンジニア / リサーチエンジニア https://ridge-i.com/careers/