Item type |
SIG Technical Reports(1) |
公開日 |
2020-11-25 |
タイトル |
|
|
タイトル |
ニューラル機械翻訳のためのバイリンガルなサブワード分割 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Bilingual Subword Segmentation for Neural Machine Translation |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
分散表現 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
愛媛大学 |
著者所属 |
|
|
|
情報通信研究機構 |
著者所属 |
|
|
|
同志社大学 |
著者所属 |
|
|
|
愛媛大学 |
著者所属 |
|
|
|
情報通信研究機構 |
著者名 |
出口, 祥之
内山, 将夫
田村, 晃裕
二宮, 崇
隅田, 英一郎
|
著者名(英) |
Hiroyuki, Deguchi
Masao, Utiyama
Akihiro, Tamura
Takashi, Ninomiya
Eiichiro, Sumita
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
本論文ではニューラル機械翻訳のための新たなサブワード分割法を提案する.従来法では対訳関係を考慮せずに各言語ごとにサブワード分割を学習するため,機械翻訳タスクに適したサブワード分割になるとは限らない.本研究は対訳コーパスを用い,原言語文と目的言語文のサブワードトークン数の差がより小さくなるサブワード分割法を提案する.提案法は対訳情報を用いるため,より機械翻訳タスクに適したサブワードが得られると考えられる.従来法と提案法を用いて翻訳性能を比較したところ,WAT ASPEC 英日・日英翻訳タスクと WMT14 英独・独英翻訳タスクにおいて,Transformer NMT モデルの性能が最大 0.81 BLEU ポイント改善した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10442647 |
書誌情報 |
研究報告音声言語情報処理(SLP)
巻 2020-SLP-134,
号 22,
p. 1-8,
発行日 2020-11-25
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8663 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |