15. 15
前処理(従来手法[Hasuike+, 2022] と共通)
• パーミュテーション不整合信号 に対して正規化処理を
行う [Sawada+, 2007]
– 同一音源の成分の相関を強調できる
– DNNの入力の値を区間 [0,1] に制限できる
Frequency
Time
Frequency
Time
Frequency
Time
Frequency
Time
Frequency
Frequency
Frequency
Time
Frequency
Time
Time
Time
19. 19
損失の導出方法(従来手法[Hasuike+, 2022] と共通)
• 損失関数の設計
– 推定分離信号と完全分離信号との間で平均二乗誤差(mean
squared error: MSE)を導入
– 分離信号の順序は予測の対象としないため,順序不変学習
(permutation invariant training: PIT)[Yu+, 2017] を導入
Frequency
Time Time
Frequency
Time Time
Frequency
Frequency
MSE & PIT