WEKO3
アイテム
非対訳コーパスを用いた日本語複合名詞の英訳語推定
https://ipsj.ixsq.nii.ac.jp/records/48720
https://ipsj.ixsq.nii.ac.jp/records/48720164b35e0-8c0f-4d14-bdc4-790820cfac70
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-09-10 | |||||||
タイトル | ||||||||
タイトル | 非対訳コーパスを用いた日本語複合名詞の英訳語推定 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Identifying English Equivalents of Japanese Compound Nouns Using Non - aligned Corpora | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
豊橋技術科学大学知識情報工学系 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学知識情報工学系 | ||||||||
著者所属 | ||||||||
豊橋技術科学大学知識情報工学系 | ||||||||
著者所属 | ||||||||
ATR音声翻訳通信研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. of Knowledge - based Info. Eng., Toyohashi Univ. of Tech. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. of Knowledge - based Info. Eng., Toyohashi Univ. of Tech. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Dept. of Knowledge - based Info. Eng., Toyohashi Univ. of Tech. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ATR Interpreting Telecommunications Research Laboratories | ||||||||
著者名 |
イラムシャハザド
× イラムシャハザド
|
|||||||
著者名(英) |
Iram, Shahzad
× Iram, Shahzad
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 日本語では,複数の名詞を組み合わせることにより複合名詞が限りなく作り出される.従って,このような複合名詞を人手で辞書に収録することには限界がある.そこで,機械翻訳システムにおいては,これらの複合名詞の対訳を自動的に獲得する必要がある.複合名詞の構成語の訳語を利用する手法では,日英で構成語の対応がない複合名詞に対しては対処できない.本手法では,複合名詞の文脈を利用して,英語のコーパスから対訳が出現する可能性のある部分を特定し,ヒューリスティックス等を用いてその部分から対訳を抽出する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Japanese documents contain a lot of compound nouns. These compound nouns are created from different combinations of nouns and are too large in number to be contained in a manually-created dictionary. Automatic extraction of their translations from English corpus is highly desirable. Utilizing the translations of the constituent parts is not effective for those compound nouns which do not have correspondence with their translations in part-by-part basis. This leads to the necessity of a different approach for these kinds of compound nouns. Our method, at first, detects the parts of English corpus which may contain the translation by using the context of the compound noun, and then, identifies the translation using some heuristics. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1999, 号 73(1999-NL-133), p. 7-12, 発行日 1999-09-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |