2. 異常音検知とは
2
正常 正常 異常 正常
• 対象から発せられる音が正常なのか異常なのかを識別するタスク
• 工場の製造機器・インフラ設備の保守業務の効率化
• 人の入りにくい場所にある機器の監視
異常音検知システムの活用例
ファクトリーオートメーションをはじめとする
第四次産業革命に期待の技術 [1]
[1] B. Bayram, T. B. Duman, and G. Ince, “Real time detection of acousticanomalies in industrial processes using sequential autoencoders,”ExpertSystems,
vol. 38, no. 1, p. e12564, 202
fan :工場の換気に使用
異常内容:電圧低下, 詰まりe.g.
4. 提案手法の位置づけ
4
[2] L. Van der Maaten and G. Hinton, “Visualizing Data using t-SNE,” Journal of Machine Learning Research, vol. 9, no. 86, pp. 2579–2605, 2008
異常音検知
教師あり 教師なし
生成モデル
• 正常データの確率
分布をモデル化
• 異常データの活用
が容易でない
分類モデル
• 正常データと疑
似異常データの
決定境界を学習
• 異常データの活
用が容易
5. 提案手法の位置づけ
5
[2] L. Van der Maaten and G. Hinton, “Visualizing Data using t-SNE,” Journal of Machine Learning Research, vol. 9, no. 86, pp. 2579–2605, 2008
異常音検知
教師あり 教師なし
生成モデル
• 正常データの確率
分布をモデル化
• 異常データの活用
が容易でない
分類モデル
• 正常データと疑
似異常データの
決定境界を学習
• 異常データの活
用が容易
正例 正常 対象機器の正常な動作音
負例
異常 対象機器の異常な動作音
疑似異常 対象機器以外の正常な動作音
疑似異常
7. 従来手法:分類モデルによる手法
7
二値分類に基づく手法 [4] 距離学習に基づく手法 [5]
7
[4] P. Primus, V. Haunschmid, P. Praher, and G. Widmer, “Anomalous Sound Detection as a Simple Binary Classification Problem with Careful Selection of Proxy Outlier Examples,” 2020.
[5] L. Ruff, R. A. et. la., “Deep SemiSupervised Anomaly Detection,” in International Conference on Learning Representations, 2020.
二値分類
距離学習
8. 従来手法:二値分類に基づく手法
8
二値分類に基づく手法 [4]
8
[4] P. Primus, V. Haunschmid, P. Praher, and G. Widmer, “Anomalous Sound Detection as a Simple Binary Classification Problem with Careful Selection of Proxy Outlier Examples,” 2020.
目的:特徴量空間を線形分離
• 学習方法
• 正常データを正例,疑似
異常データを負例として
学習
• 疑似異常データの選択基準
• 録音条件の一致
• 対象音との類似性
• コンテンツの多様性
9. 従来手法:距離学習に基づく手法
9
距離学習に基づく手法 [5]
9
[5] L. Ruff, R. A. et. la., “Deep SemiSupervised Anomaly Detection,” in International Conference on Learning Representations, 2020.
目的:正常クラスの
クラス内分散を最小化
Deep Semi-supervised Anomaly
Detection(DSAD)損失関数
𝐿DSAD =
1
𝑁
𝑖=1
𝑁
𝒛𝒊 − 𝒄 2𝑦
疑似異常
• 正常を重心𝒄に近づける
• 疑似異常を重心𝒄から遠ざける
13. 実験条件:データセット
• データセット
• DCASE2020 Task2[6]のデータセットを使用
• ToyADMOS [7] : ToyCar, ToyConveyor
• MIMII Dataset [8] : fan, pump, slider, valve
• 合計6種類のマシンタイプ
• 各機器は7から8種類のマシンIDが割り当てられる
13
異物混入, 詰まり, 漏れ,
油不足, 電圧低下, e.g.
[6] Y. Koizumi, et. la., “Description and Discussion on DCASE2020 Challenge Task2: Unsupervised Anomalous Sound Detection for Machine Condition Monitoring,” in arXiv e-prints: 2006.05822, June 2020,
異常例
[7] Y. Koizumi, et. la., “ToyADMOS: A Dataset of Miniature-machine Operating Sounds for Anomalous Sound Detection,” in Proceedings of IEEE Workshop on Applications of Signal
Processing to Audio and Acoustics (WASPAA). IEEE, November 2019, pp. 308–312.
[8] H. Purohit, et. la., “MIMII Dataset: Sound Dataset for Malfunctioning Industrial Machine Investigation and Inspection,” in Proceedings of the Detection and Classification of Acoustic
Scenes and Events 2019 Workshop (DCASE2019), November 2019, pp. 209–213.
http://dcase.community/challenge2020/task-unsupervised-detection-of-anomalous-sounds
14. 実験条件:前提条件
14
学習データへのラベル付け
ラベル 種類 データの種類
正例 正常 対象機器の対象IDの正常データ
負例 疑似異常
対象機器の対象ID以外の正常データ
対象機器以外の正常データ
モデル PANNs [9] のResNet38
[9] Kong, Y. Cao, T. Iqbal, Y. Wang, W. Wang, and M. D. Plumbley, “PANNs: Large-Scale Pretrained Audio Neural Networks for Audio Pattern Recognition,”
IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 28, pp. 2880–2894, 2020.
ID毎にモデル
を作成
正常クラス
Fan ID 1
疑似異常クラス
Fan ID 2 Fan ID 3 Valve ID 1
1,000サンプル程度 20,000サンプル程度
Valve ID 2
15. 各手法のAUC [%] による評価
15
提案手法(DDCSAD, BCE+DDCSAD)によって性能改善するか調査
Machine Type BCE DSAD DDCSAD BCE+DSAD BCE+DDCSASD
fan 92.69±2.06 82.33 ± 3.00 91.05 ± 2.25 92.96 ± 2.02 95.14 ± 1.70
pump 94.39±1.88 88.88 ± 2.60 91.71 ± 2.27 89.91 ± 2.49 92.14 ± 2.21
slider 90.30±2.43 93.46 ± 2.01 89.97 ± 2.46 93.38 ± 2.03 97.60 ± 1.24
ToyCar 87.82 ± 1.77 84.10 ± 2.00 91.18 ± 1.51 83.72 ± 2.03 93.85 ± 1.26
ToyConveyor 75.21 ± 2.54 68.51 ± 2.74 68.37 ± 2.74 64.13 ± 2.82 82.05 ± 2.25
valve 89.92 ± 2.45 90.80 ± 2.35 88.62 ± 2.59 98.61 ± 0.94 96.08 ± 1.57
Machine
Average
88.39 84.68 86.82 87.12 92.81
AUC[%]の信頼区間は95% [7]
[7] J. A. Hanley and B. J. McNeil, “The Meaning and Use of the Area Under a Receiver Operating Characteristic (ROC) Curve,” Radiology, vol. 143, no. 1, pp.
29–36, 1982.
16. 距離学習に基づく手法の比較
16
DSAD(従来)とDDCSAD(提案)の比較
Machine Type BCE DSAD DDCSAD BCE+DSAD BCE+DDCSASD
fan 92.69±2.06 82.33 ± 3.00 91.05 ± 2.25 92.96 ± 2.02 95.14 ± 1.70
pump 94.39±1.88 88.88 ± 2.60 91.71 ± 2.27 89.91 ± 2.49 92.14 ± 2.21
slider 90.30±2.43 93.46 ± 2.01 89.97 ± 2.46 93.38 ± 2.03 97.60 ± 1.24
ToyCar 87.82 ± 1.77 84.10 ± 2.00 91.18 ± 1.51 83.72 ± 2.03 93.85 ± 1.26
ToyConveyor 75.21 ± 2.54 68.51 ± 2.74 68.37 ± 2.74 64.13 ± 2.82 82.05 ± 2.25
valve 89.92 ± 2.45 90.80 ± 2.35 88.62 ± 2.59 98.61 ± 0.94 96.08 ± 1.57
Machine
Average
88.39 84.68 86.82 87.12 92.81
正常・疑似異常の重心を定義し,更新可能にする
➡クラス間分散を最大化の効果
AUC[%]の信頼区間は95% [7]
[7] J. A. Hanley and B. J. McNeil, “The Meaning and Use of the Area Under a Receiver Operating Characteristic (ROC) Curve,” Radiology, vol. 143, no. 1, pp.
29–36, 1982.
17. マルチタスク学習による比較
17
BCE+DSADとBCE+DDCSADの比較
Machine Type BCE DSAD DDCSAD BCE+DSAD BCE+DDCSASD
fan 92.69±2.06 82.33 ± 3.00 91.05 ± 2.25 92.96 ± 2.02 95.14 ± 1.70
pump 94.39±1.88 88.88 ± 2.60 91.71 ± 2.27 89.91 ± 2.49 92.14 ± 2.21
slider 90.30±2.43 93.46 ± 2.01 89.97 ± 2.46 93.38 ± 2.03 97.60 ± 1.24
ToyCar 87.82 ± 1.77 84.10 ± 2.00 91.18 ± 1.51 83.72 ± 2.03 93.85 ± 1.26
ToyConveyor 75.21 ± 2.54 68.51 ± 2.74 68.37 ± 2.74 64.13 ± 2.82 82.05 ± 2.25
valve 89.92 ± 2.45 90.80 ± 2.35 88.62 ± 2.59 98.61 ± 0.94 96.08 ± 1.57
Machine
Average
88.39 84.68 86.82 87.12 92.81
BCE+DDCSADによる効果が大きい
➡疑似異常の重心を定義したことでBCEによる特徴量空間の線形分離が容易に
AUC[%]の信頼区間は95% [7]
[7] J. A. Hanley and B. J. McNeil, “The Meaning and Use of the Area Under a Receiver Operating Characteristic (ROC) Curve,” Radiology, vol. 143, no. 1, pp.
29–36, 1982.
18. 18
単一の損失関数とマルチタスク学習による比較
Machine Type BCE DSAD DDCSAD BCE+DSAD BCE+DDCSASD
fan 92.69±2.06 82.33 ± 3.00 91.05 ± 2.25 92.96 ± 2.02 95.14 ± 1.70
pump 94.39±1.88 88.88 ± 2.60 91.71 ± 2.27 89.91 ± 2.49 92.14 ± 2.21
slider 90.30±2.43 93.46 ± 2.01 89.97 ± 2.46 93.38 ± 2.03 97.60 ± 1.24
ToyCar 87.82 ± 1.77 84.10 ± 2.00 91.18 ± 1.51 83.72 ± 2.03 93.85 ± 1.26
ToyConveyor 75.21 ± 2.54 68.51 ± 2.74 68.37 ± 2.74 64.13 ± 2.82 82.05 ± 2.25
valve 89.92 ± 2.45 90.80 ± 2.35 88.62 ± 2.59 98.61 ± 0.94 96.08 ± 1.57
Machine
Average
88.39 84.68 86.82 87.12 92.81
マルチタスク学習により性能改善
➡仮定に近い特徴量空間への写像を獲得
AUC[%]の信頼区間は95% [7]
[7] J. A. Hanley and B. J. McNeil, “The Meaning and Use of the Area Under a Receiver Operating Characteristic (ROC) Curve,” Radiology, vol. 143, no. 1, pp.
29–36, 1982.
マルチタスク学習による比較
19. DCASE2021 Task2 [8] の結果
19
ドメインシフトを考慮した、工場機器の状態監視のための
教師無し異常音検知コンペティション
• 新たな機器種別に対しても適応可能
• ドメインシフトのある問題設定でも機能すること
順位
モデルの性能
[8] http://dcase.community/challenge2021/task-unsupervised-detection-of-anomalous-sounds-results
Kuroyanagi, et. la., ”Anomalous Sound Detection Using a
Binary Classification Model and Class Centroids,”
EUSIPCO, 2021
異常データを活用した場合の性能評価
提案手法を用いること
で、27チーム中4位に