WEKO3
アイテム
言語情報と統計情報を用いた対訳文書からの機械翻訳辞書作成
https://ipsj.ixsq.nii.ac.jp/records/49306
https://ipsj.ixsq.nii.ac.jp/records/49306c53951be-96ca-49fd-ac01-6bc1c550497d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1994 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1994-03-17 | |||||||
タイトル | ||||||||
タイトル | 言語情報と統計情報を用いた対訳文書からの機械翻訳辞書作成 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | BuiIding an MT Dictionary from Parallel Texts Based on Linguistic and Statistical Information | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
(株)東芝研究開発センター | ||||||||
著者所属 | ||||||||
(株)東芝研究開発センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research and Development Center, Toshiba Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research and Development Center, Toshiba Corporation | ||||||||
著者名 |
熊野, 明
× 熊野, 明
|
|||||||
著者名(英) |
Akira, Kumano
× Akira, Kumano
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 対訳文書から機械翻訳用専門用語辞書を作成する方法について述べる。本方法では、対訳コーパス中の語句の対応関係を抽出するために、言語情報と統計情報を統合して利用する。この2種類の情報を利用することにより、従来の言語情報のみによる方法では得られない、未知語の対訳関係なども抽出可能になる。言語間で文章構成の大きく異なる特許文書で実験した結果、300文程度の小規模な文書からでも、合成語に対する訳語を70%以上の精度で推定できた。未知語の訳語推定は小規模の文書では精度が低いが、文書量を増やすことで精度が向上する見通しを得た。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A method for generating a machine translation(MT) dictionary from parallel texts is described. This method utilizes both linguistic information and statistical information to obtain corresponding words or phrases in parallel texts. By combining these two types of information, translation pairs which cannot be obtained by a linguistic-based method can be extracted, and over 70% accurate translations are obtained as the first candidate from small Japanese/English parallel texts containing severe distortions. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1994, 号 28(1993-NL-100), p. 89-96, 発行日 1994-03-17 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |