Submit Search
Upload
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
•
Download as PPTX, PDF
•
0 likes
•
788 views
S
sekizawayuuki
Follow
言語処理学会第23回年次大会ポスター発表の資料 タイトル:目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
Read less
Read more
Education
Report
Share
Report
Share
1 of 1
Download now
Recommended
日本語学習者の文章読解支援のための語彙制限 ブースター
日本語学習者の文章読解支援のための語彙制限 ブースター
kentshioda
日本語学習者の文章読解支援のための語彙制限
日本語学習者の文章読解支援のための語彙制限
kentshioda
英語学習者のための発話自動採点システムの開発.
英語学習者のための発話自動採点システムの開発.
Yutaka Ishii
英語学習者の文法的誤りをめぐって: 最近の動向とエッセイ自動評価のための基礎的検討.
英語学習者の文法的誤りをめぐって: 最近の動向とエッセイ自動評価のための基礎的検討.
Yutaka Ishii
paper introducing: Exploiting source side monolingual data in neural machine ...
paper introducing: Exploiting source side monolingual data in neural machine ...
sekizawayuuki
Emnlp読み会@2015 10-09
Emnlp読み会@2015 10-09
sekizawayuuki
Coling2016 pre-translation for neural machine translation
Coling2016 pre-translation for neural machine translation
sekizawayuuki
Nlp2016 sekizawa
Nlp2016 sekizawa
sekizawayuuki
Recommended
日本語学習者の文章読解支援のための語彙制限 ブースター
日本語学習者の文章読解支援のための語彙制限 ブースター
kentshioda
日本語学習者の文章読解支援のための語彙制限
日本語学習者の文章読解支援のための語彙制限
kentshioda
英語学習者のための発話自動採点システムの開発.
英語学習者のための発話自動採点システムの開発.
Yutaka Ishii
英語学習者の文法的誤りをめぐって: 最近の動向とエッセイ自動評価のための基礎的検討.
英語学習者の文法的誤りをめぐって: 最近の動向とエッセイ自動評価のための基礎的検討.
Yutaka Ishii
paper introducing: Exploiting source side monolingual data in neural machine ...
paper introducing: Exploiting source side monolingual data in neural machine ...
sekizawayuuki
Emnlp読み会@2015 10-09
Emnlp読み会@2015 10-09
sekizawayuuki
Coling2016 pre-translation for neural machine translation
Coling2016 pre-translation for neural machine translation
sekizawayuuki
Nlp2016 sekizawa
Nlp2016 sekizawa
sekizawayuuki
Translating phrases in neural machine translation
Translating phrases in neural machine translation
sekizawayuuki
Improving lexical choice in neural machine translation
Improving lexical choice in neural machine translation
sekizawayuuki
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...
sekizawayuuki
Incorporating word reordering knowledge into attention-based neural machine t...
Incorporating word reordering knowledge into attention-based neural machine t...
sekizawayuuki
Emnlp読み会@2017 02-15
Emnlp読み会@2017 02-15
sekizawayuuki
Acl reading@2016 10-26
Acl reading@2016 10-26
sekizawayuuki
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
sekizawayuuki
Acl読み会@2015 09-18
Acl読み会@2015 09-18
sekizawayuuki
読解支援@2015 08-10-6
読解支援@2015 08-10-6
sekizawayuuki
読解支援@2015 08-10-5
読解支援@2015 08-10-5
sekizawayuuki
読解支援@2015 08-10-4
読解支援@2015 08-10-4
sekizawayuuki
読解支援@2015 08-10-3
読解支援@2015 08-10-3
sekizawayuuki
読解支援@2015 08-10-2
読解支援@2015 08-10-2
sekizawayuuki
読解支援@2015 08-10-1
読解支援@2015 08-10-1
sekizawayuuki
読解支援@2015 07-24
読解支援@2015 07-24
sekizawayuuki
読解支援@2015 07-17
読解支援@2015 07-17
sekizawayuuki
読解支援@2015 07-13
読解支援@2015 07-13
sekizawayuuki
読解支援@2015 07-03
読解支援@2015 07-03
sekizawayuuki
読解支援@2015 06-26
読解支援@2015 06-26
sekizawayuuki
Naacl読み会@2015 06-24
Naacl読み会@2015 06-24
sekizawayuuki
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ssusere0a682
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
koheioishi1
More Related Content
More from sekizawayuuki
Translating phrases in neural machine translation
Translating phrases in neural machine translation
sekizawayuuki
Improving lexical choice in neural machine translation
Improving lexical choice in neural machine translation
sekizawayuuki
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...
sekizawayuuki
Incorporating word reordering knowledge into attention-based neural machine t...
Incorporating word reordering knowledge into attention-based neural machine t...
sekizawayuuki
Emnlp読み会@2017 02-15
Emnlp読み会@2017 02-15
sekizawayuuki
Acl reading@2016 10-26
Acl reading@2016 10-26
sekizawayuuki
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
sekizawayuuki
Acl読み会@2015 09-18
Acl読み会@2015 09-18
sekizawayuuki
読解支援@2015 08-10-6
読解支援@2015 08-10-6
sekizawayuuki
読解支援@2015 08-10-5
読解支援@2015 08-10-5
sekizawayuuki
読解支援@2015 08-10-4
読解支援@2015 08-10-4
sekizawayuuki
読解支援@2015 08-10-3
読解支援@2015 08-10-3
sekizawayuuki
読解支援@2015 08-10-2
読解支援@2015 08-10-2
sekizawayuuki
読解支援@2015 08-10-1
読解支援@2015 08-10-1
sekizawayuuki
読解支援@2015 07-24
読解支援@2015 07-24
sekizawayuuki
読解支援@2015 07-17
読解支援@2015 07-17
sekizawayuuki
読解支援@2015 07-13
読解支援@2015 07-13
sekizawayuuki
読解支援@2015 07-03
読解支援@2015 07-03
sekizawayuuki
読解支援@2015 06-26
読解支援@2015 06-26
sekizawayuuki
Naacl読み会@2015 06-24
Naacl読み会@2015 06-24
sekizawayuuki
More from sekizawayuuki
(20)
Translating phrases in neural machine translation
Translating phrases in neural machine translation
Improving lexical choice in neural machine translation
Improving lexical choice in neural machine translation
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...
Improving Japanese-to-English Neural Machine Translation by Paraphrasing the ...
Incorporating word reordering knowledge into attention-based neural machine t...
Incorporating word reordering knowledge into attention-based neural machine t...
Emnlp読み会@2017 02-15
Emnlp読み会@2017 02-15
Acl reading@2016 10-26
Acl reading@2016 10-26
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
[論文紹介]Selecting syntactic, non redundant segments in active learning for mach...
Acl読み会@2015 09-18
Acl読み会@2015 09-18
読解支援@2015 08-10-6
読解支援@2015 08-10-6
読解支援@2015 08-10-5
読解支援@2015 08-10-5
読解支援@2015 08-10-4
読解支援@2015 08-10-4
読解支援@2015 08-10-3
読解支援@2015 08-10-3
読解支援@2015 08-10-2
読解支援@2015 08-10-2
読解支援@2015 08-10-1
読解支援@2015 08-10-1
読解支援@2015 07-24
読解支援@2015 07-24
読解支援@2015 07-17
読解支援@2015 07-17
読解支援@2015 07-13
読解支援@2015 07-13
読解支援@2015 07-03
読解支援@2015 07-03
読解支援@2015 06-26
読解支援@2015 06-26
Naacl読み会@2015 06-24
Naacl読み会@2015 06-24
Recently uploaded
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ssusere0a682
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
koheioishi1
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
YukiTerazawa
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ssusere0a682
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
Takayuki Itoh
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScript
yuitoakatsukijp
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
Tokyo Institute of Technology
Recently uploaded
(7)
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScript
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善
1.
背景: ニューラル機械翻訳:語彙次元の分類問題 計算量を削減するため語彙制限 低頻度語は特殊記号で出力される 妥当性、流暢性が失われる 目的: 出力文の低頻度語(OOV)を削減する 言い換え1:言い換え確率を最大化する言い換え 妥当性を優先 言い換え2:言語モデル確率が最大化する言い換え 流暢性を優先 目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善 首都大学東京 関沢祐樹
梶原智之 小町守 sekizawa-yuuki@ed.tmu.ac.jp 背景と目的 実験 手法 言い換え確率 言語モデル確率 Bahdanau+ (2015) 20.63 (1,489) 1 回のみ (語) 20.55 (1,240) 20.49 (1,338) 2 回まで (語) 20.61 (1,301) 20.71 (1,231) 無制限 (語) 20.28 (1,322) 18.23 (1,229) 1 回のみ (語+句) 20.11 (1,274) 17.89 (1,451) 2 回まで (語+句) 19.29 (1,408) 18.38 (1,442) 無制限 (語+句) 19.61 (1,324) 18.65 (1,327) • 訓練方法の変更によって出力文の OOV を削減 • Jean et al. (2015) • Mi et al. (2016) • Luong et al. (2016) →訓練方法を変更する必要がある • 前処理・後処理によって出力文の OOV を削減 • Luong et al. (2015) →翻訳文対のアライメントが必要 • Sennrich et al. (2016) →意味を考慮せず貪欲な手法 先行研究 提案手法 通常の トレーニング コーパス 原言語 目的言語 目的言語 言い換え後 低頻度語を 高頻度語へ 言い換え ・2通り ・複数回可 (辞書使用)NMT トレーニング 手法 翻訳 input オゾン 生成 量 が 約 2 mg / h 増大 し た 。 reference ozone formation increased about 2mg / h . Bahdanau+ (2015) the amount of ozone generation increased by about “OOV” / h . 2 回まで (語、言語モデル確率) the ozone generation increased by about 2 mg / h . 日英翻訳結果 BLEUスコア(出力文に存在する OOV の数) 設定 • コーパス:アジア学術論文抜粋コーパス(ASPEC) トレーニング:827,503文対 • 言い換え辞書:PPDB • 言語モデル:ASPEC 2-gram • 翻訳モデル:Bahdanau et al. (2015) • 語彙数:入出力ともに30,000語 考察 • 言い換えは1回よりも2回の場合にBLEUスコアが高い • 無制限に言い換え繰り返し さらなる改善はなし 言い換えの意味の保持と OOV 削減のバランスを取ると良い • 語のみの言い換えは(語+句)の言い換えよりBLEU スコアが高い 句の内部の言語モデル確率を考慮していないため 流暢性を損なう言い換えが行われた可能性がある • トレーニングデータの OOV の減少に伴って 翻訳結果の OOV が削減されるとは限らない 出力文の流暢性の担保のために言い換え結果を出力しない 翻訳例 トレーニングデータのうち 目的言語の低頻度語を 同義な高頻度語に言い換え 原文 :the pedagogues had quarrels. 1回目の言い換え:the educators had discussions. 2回目の言い換え:the teachers had discussions. 改悪例 手法 翻訳 input 後者 の コイル は 液体 ヘリウム 中 で 2 . 2 t を 出し た 。 reference the latter coil generated 2.2t in liquid helium . Bahdanau+ (2015) the latter coil was 2.2 t. in the liquid helium . 2 回まで (語、言語モデル確率) the latter coil was “OOV” in liquid helium . they assert defending the rights guaranteeing the protection of the rights . 改善例
Download now