Weitere ähnliche Inhalte
Ähnlich wie CTCに基づく音響イベントからの擬音語表現への変換 (20)
Mehr von NU_I_TODALAB (18)
CTCに基づく音響イベントからの擬音語表現への変換
- 5. 擬音語に関連した研究
機械の異常音の擬音語表現 [Tanaka+1997]
– 故障の原因や兆候となる異常音を書き起こし
– シソーラス(擬音語類語辞書)としてまとめることで
工場内での意識の統一と作業の効率化
環境音を対象とした擬音語自動認識 [Ishihara+2014]
– 波形を音節ごとに分割し,分割した音節ごとに音素単位での認識
– 認識結果を結合し,聴こえ方の個人差を許容する手法を提案
2018/3/27
5
- 16. 実験条件
特徴量:Mel filter bank 40次元
ネットワーク構成:3層BLSTM
– パラメータはグリッドサーチにより決定
2018/3/27
16
実験条件
フレームサイズ 40 [ms]
フレームシフト 20 [ms]
LSTM unit 512
学習率 0.0001
初期スケール 0.001
Time step 350
Batch size 128
Epochs 20
- 18. 主観評価実験結果
20代男女8名による50サンプルの評価
実際の聞こえ方(1: 許容できる,2: 許容できない)
2018/3/27
18
許容できる 許容できない
74.5 [%] 25.5 [%]
CTC 被験者A 被験者B 被験者C 被験者D
ピポン ピンポーン, 1 ピポン, 1 テレン, 2 ピコーン, 1
シャラララ シャラララ, 1 チリリリン, 1 チリンチリン, 2 リンリン, 2
変換結果の妥当性を確認
個人差の影響、一意に定まらない