Weitere ähnliche Inhalte
Mehr von Deep Learning JP (20)
[DL輪読会]DurIAN: Duration Informed Attention Multimodal Synthesis
- 1. 1
DEEP LEARNING JP
[DL Papers]
http://deeplearning.jp/
DurIAN: Duration Informed Attention Multimodal Synthesis
Yoshine Hayashi, AlgoAge
- 3. 書誌情報
• 論文名:DurIAN: Duration Attention Multimodal Synthesis
• 著者:Chengzhu Yu, Heng Lu, Na Hu, Meng Yu, Chao Weng, Kun Xu,
Peng Liu, Deyi Tuo, Shiyin Kang, Guangzhi Lei, Dan Su, Dong Yu
• 所属:Tencent AI Lab
• 公開日:4 Sept. 2019
• デモ:Sound and Video demo
※ 特に明記していない場合は上記論文、デモから引用。
- 21. 提案手法
Style Control
• 音声のデータセット
• ゲーム実況者風音声合成用の男性話者の4時間分の音声データ
• 内0.5時間にexcitingのラベルをつける
• 内1時間に実況者のラベルをつける
• 残り2.5時間はnormalとして扱う
• 表情のデータセット
• face warehouse