WEKO3
アイテム
統計的機械翻訳におけるフレーズ対応最適化を利用したN-best翻訳候補のリランキング
https://ipsj.ixsq.nii.ac.jp/records/70151
https://ipsj.ixsq.nii.ac.jp/records/70151cce81af2-e9e1-43a4-b91a-bf395cb150d4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-08-15 | |||||||
タイトル | ||||||||
タイトル | 統計的機械翻訳におけるフレーズ対応最適化を利用したN-best翻訳候補のリランキング | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | N-best Reranking Using Optimal Phrase Alignment for Statistical Machine Translation | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 一般論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
情報通信研究機構MASTARプロジェクト | ||||||||
著者所属 | ||||||||
大阪大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
中央大学理工学部情報工学科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
MASTAR Project, National Institute of Informaiton and Communications Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Osaka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information and System Engineering, Faculty of Science and Engineering, Chuo University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者名 |
越川, 満
× 越川, 満
|
|||||||
著者名(英) |
Mitsuru, Koshikawa
× Mitsuru, Koshikawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | フレーズベース統計的機械翻訳では,連続する単語列(フレーズ)を翻訳の最小単位とした確率的規則に基づいて翻訳候補の順位付けを行い,最も確率の高い候補を出力とする.しかし,入力文のフレーズ区切りや翻訳前後の訳語関係(フレーズ対応)の組合せ数は膨大である.そのため,従来の統計的機械翻訳システムは,翻訳候補およびフレーズ区切り・対応に対して大胆な近似を行うことで探索空間を狭めており,厳密な確率の最大化をしていない.本稿では,フレーズ対応・区切りに関する厳密な確率最大化を行う問題を,フレーズベース翻訳において広く用いられているすべての素性を考慮可能な形式で整数線形計画問題として定式化し,それを翻訳候補のリランキングに応用する手法を提案・実装する.評価実験の結果,提案手法は有意に翻訳精度を改善することが示されると同時に,フレーズベース翻訳における探索の課題は,フレーズ対応ではなく翻訳候補文についてより多くの候補を評価することにあるという示唆が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Phrase-based statistical machine translation system outputs the candidate having the highest probability based on the probabilistic phrase translation rules. However, there exist a huge number of translation candidates and ambiguities on phrase segmentations/alignments for source and target sentences. Therefore, the current statistical translation systems use various heuristics for reducing the number of translation candidates and approximating phrase-alignment probabilities, in order to narrow the search space. This paper proposes the formulation to strictly maximize the phrase-alignment probability computed from all features which most phrase-based statistical machine translation systems use within. We also propose a reranking method based on the proposed phrase alignment optimization. In evaluation experiments, our system improved significantly the translation quality. The experimental results also suggested that a variety of translation candidates are more important for increasing accuracy than exact phrase alignments. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 51, 号 8, p. 1443-1451, 発行日 2010-08-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |