Item type |
SIG Technical Reports(1) |
公開日 |
2015-09-22 |
タイトル |
|
|
タイトル |
文構造情報を用いた対訳コーパスからの対訳辞書作成 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Construction of Parallel Word Pair from Parallel Corpus Using Sentence Structure Information |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
株式会社NTTデータ技術開発本部 |
著者所属 |
|
|
|
株式会社NTTデータ技術開発本部 |
著者所属 |
|
|
|
株式会社NTTデータ技術開発本部 |
著者所属(英) |
|
|
|
en |
|
|
Research and Development Headquarters, NTT DATA CORPORATION |
著者所属(英) |
|
|
|
en |
|
|
Research and Development Headquarters, NTT DATA CORPORATION |
著者所属(英) |
|
|
|
en |
|
|
Research and Development Headquarters, NTT DATA CORPORATION |
著者名 |
新海, 正吾
佐藤, 大輔
松永, 務
|
著者名(英) |
Shogo, Shinkai
Daisuke, Sato
Tsutomu, Matsunaga
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
情報資産の有効活用の動きに伴い,異なる言語間で文対応の付いた対訳コーパスの取扱いの重要性が認識されつつある.これまでの対訳コーパスからの専門用語等の抽出には,同時出現頻度といった統計情報を基に対応付けるアプローチがとられていたが,新たな語のような出現頻度が低い場合には必ずしも有効でない問題がある.本稿では,対訳コーパスに言語解析処理を適用し,文構造情報を用いた対訳辞書作成の方法を提案する.提案方法では,言語特性に基づいて単語を並べ替え,語順を揃えた対訳文間で対応付いた単語対を抽出する.日英対訳コーパスを用いた実験結果から,低頻度の単語についても対訳辞書作成が可能となることを示す.また,英日機械翻訳における単語アライメント学習の強化前後で比較した実験結果を通して提案方法による対訳辞書の効果を明らかにする. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
With an effective utilization of information asset, an importance of handling existing limited corpus has been recognized. Conventional methods to extract parallel word pairs from parallel corpus, which have adopted statistical measures, have been indicated that they have a limitation in obtaining low frequency pairs of words such as new words. Using sentence structure information, a novel method to construct parrallel word pairs is proposed in this paper. Experimental results using Japanese-English parallel corpus demonstrate the effectiveness of the proposed method. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10505667 |
書誌情報 |
研究報告数理モデル化と問題解決(MPS)
巻 2015-MPS-105,
号 2,
p. 1-6,
発行日 2015-09-22
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8833 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |