WEKO3
アイテム
編集距離を使った用例翻訳の高速検索方式と翻訳性能評価
https://ipsj.ixsq.nii.ac.jp/records/10882
https://ipsj.ixsq.nii.ac.jp/records/10882fa7712b3-0c56-4a92-a4ad-98d715f39a11
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-06-15 | |||||||
タイトル | ||||||||
タイトル | 編集距離を使った用例翻訳の高速検索方式と翻訳性能評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Efficient Retrieval Method and Performance Evaluation of Example-based Machine Translation Using Edit-distance | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 自然言語 | |||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属 | ||||||||
ATR音声言語コミュニケーション研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Spoken Language Translation Research Laboratories | ||||||||
著者名 |
土居, 誉生
× 土居, 誉生
|
|||||||
著者名(英) |
Takao, Doi
× Takao, Doi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では編集距離を使った用例翻訳システムの実装方式と大規模コーパスを使った翻訳性能評価について報告する.この用例翻訳方式では,コーパスの中から最も類似した文を選び出す仕組みがその中核にある.その実装のための効率的で検索もれのない手法を提案する.提案手法では検索対象領域の分割と単語グラフ表現,A*アルゴリズムを利用する.翻訳性能評価では旅行会話ドメインの数10万文規模のコーパスを使用する.まず日英翻訳で,3種類の言語資源(対訳コーパス,対訳辞書,シソーラス)と翻訳性能の関係について検証する.また複数の言語対について翻訳システムを構築することにより多言語適用性を確認する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we report on the implementation method of the EBMT using edit-distance and the evaluation of its performance using a large-scale corpus. The core function of the EBMT is to retrieve the most similar sentences from a corpus. An efficient retrieval method is indispensable for implementation. We propose an efficient retrieval method without omissions. The proposed method utilizes division of search space, word graphs and an A* search algorithm. In the experiments for the performance evaluation, we use a corpus of hundreds of thousands of sentences from a travel conversation domain. In Japanese-to-English translation, we investigate correlations between the performance and three linguistic resources: a bilingual corpus, a bilingual dictionary and thesauri. Moreover, we verify the adaptability of the EBMT to multilingual translation by making translation systems for several language pairs. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 45, 号 6, p. 1681-1695, 発行日 2004-06-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |