Weitere ähnliche Inhalte
Mehr von Jiro Nishitoba (12)
20180609 chainer meetup_es_pnet
- 6. 便利なシチュエーショ ン
• 「 少し 寝たっ ぽいから 、 テレビつけてみよ」
( し ばし し て)
「 あら 、 泣き はじ めた…!」
( 抱っ こ )
( テレビ消し たい…が、 手がふさ がっ ている…!)
「 オッ ケーグーグル、 テレビ消し て!」
Kei Shiratsuchi, レトリバセミナー
- 18. ESPnet: End-to-End Speech Processing Toolkit
• Kaldiと連携
• データ取得
• データ加工
• 特徴抽出
• Deep Learning framework
• Chainer
• Pytorch
- 20. Chainer and Pytorch support
Chainer Pytorch
Performance ◎ ○
Speed ○ ◎
Multi-GPU 対応 対応
VGG-like encoder 対応 非対応
RNN言語モデル 対応 対応
Attention types 3種(no attention, dot,
location)
12種 (multihead attention
含む)
- 21. サポートしているデータセット
• 英語
• Wall Street Journal読み上げコーパス
• Librispeech
• etc.
• 日本語
• 日本語話し言葉コーパス(CSJ)
• 中国語
• HKUST Telephone speech
• その他含め全16データセット
- 22. 日本語話し言葉コーパス(CSJ)での音声認識
• git clone http://github.com/espnet/espnet.git
• cd espnet/tools
• make
• cd ../egs/csj/asr1
• (エディタでCSJのおいてあるディレクトリ設定を修正)
• ./run.sh
• 精度の算出
• 個別の結果出力