2024-03-29T22:09:42Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000715812024-03-29T05:26:34Z01164:05159:06009:06234
統計的前編集のための対訳コーパスからの学習データの自動生成Automatic Generation of Training Data from Parallel Corpus for Statistical Pre-editingjpnSession-9 一般(ポスターセッション)http://id.nii.ac.jp/1001/00071581/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=71581&item_no=1&attribute_id=1&file_no=1Copyright (c) 2010 by the Information Processing Society of Japan龍谷大学理工学研究科龍谷大学理工学研究科龍谷大学理工学研究科山本, 祐司南條, 浩輝吉見, 毅彦機械翻訳システムを用いて自然性が高いテキストを翻訳すると,適当な結果が得られないことがある.逆に,自然性の低いテキストを機械翻訳システムに入力した方が好ましい翻訳ができることがある.このことから,自然な原文を機械翻訳しやすい文に前編集することで翻訳品質の向上が期待できる.そのため,本研究では,対訳コーパスを用いて統計的前編集モデルの自動学習を行う.具体的には,ある文とその対訳文を機械翻訳して得られる文のペアから,自然な文を翻訳しやすい文に変換するための学習データを自動作成し,自然性の低いテキスト,例えば直訳調の文に対してはうまく翻訳できることがある.統計的機械翻訳の枠組みに基づいて自動変換を行う方法について述べる.Most of MT systems do not work well for natural and fluent texts. On the other hand, for easily machine translatable texts, MT systems work well. Therefore, for an improvement of translation quality, rewriting a fluent text to a machine translatable text before translation is promising. Based on the background, in this paper, we study a statistical pre-editing method. Specifically, first, we show an automatic generation of training data for statistical models from Japanese to English (J-E) parallel corpus, and then, describe a pre-editing method based on a statistical translation framework.AN10442647研究報告音声言語情報処理(SLP)2010-SLP-8424172010-12-132010-12-07