WEKO3
アイテム
パテントファミリーを用いた専門用語訳語獲得における対訳文対非抽出部分およびフレーズテーブルの利用
https://ipsj.ixsq.nii.ac.jp/records/94375
https://ipsj.ixsq.nii.ac.jp/records/943751a4381e9-ba57-43ff-90eb-dd738215553f
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-07-11 | |||||||
タイトル | ||||||||
タイトル | パテントファミリーを用いた専門用語訳語獲得における対訳文対非抽出部分およびフレーズテーブルの利用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Utilizing a Phrase Translation Table and Portion of Patent Families with No Parallel Sentences Extracted in Estimating Translation of Technical Terms | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 機械翻訳 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学システム情報系 | ||||||||
著者所属 | ||||||||
筑波大学システム情報系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Information and Systems, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Information and Systems, University of Tsukuba | ||||||||
著者名 |
豊田, 樹生
× 豊田, 樹生
|
|||||||
著者名(英) |
Itsuki, Toyota
× Itsuki, Toyota
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 専門用語の対訳辞書は特許文書翻訳の過程において必要不可欠なものである.本論文では,日米パテントファミリーを情報源として,専門用語対訳辞書を生成する手法を提案する.従来より,日米パテントファミリーの対応特許文書中において,「背景」 および 「実施例」 の部分の日英対訳文対の対応付けを行い,これを情報源として専門用語の対訳辞書を生成する手法が提案されている.しかし,この方式では,対訳文対が抽出される部分は,「背景」 及び 「実施例」 全体の約 30% であり,約 70% は利用されていなかった.ここで,我々は,これまで,文献 [8] において,「背景」 および 「実施例」 のうちの残りの 70% の部分を言語資源として,既存の対訳辞書を用いて専門用語の訳語推定を行う方式の有効性を実証した.一方,本論文では,特に,人手で作成された辞書である英辞郎及びその部分対応対訳辞書に加えて,全体の約 30% を訓練例として学習したフレーズテーブルを併用して要素合成法を適用し,専門用語の訳語推定を行う方式を提案する.実際に,評価実験において,パテントファミリー 1,000 組当たり約 7,300 対の専門用語訳語対が獲得できることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In the previous methods of generating bilingual lexicon from parallel patent sentences extracted from patent families, the portion from which parallel patent sentences are extracted is about 30% out of the whole “Background” and “Embodiment” parts and about 70% are not used. Considering this situation, this paper proposes to generate bilingual lexicon for technical terms not only from the 30% but also from the remaining 70% out of the whole “Background” and “Embodiment” parts. The proposed method employs the compositional translation estimation technique utilizing the remaining 70% as a comparable corpus for validating translation candidates. As the bilingual constituent lexicons in compositional translation, we use an existing bilingual lexicon as well as the phrase translation table trained with the parallel patent sentences extracted from the 30%. Finally, we show that about 7,300 technical term translation pairs can be acquired from 1,000 patent families. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2013-NL-212, 号 12, p. 1-8, 発行日 2013-07-11 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |