@techreport{oai:ipsj.ixsq.nii.ac.jp:00094375, author = {豊田, 樹生 and 龍, 梓 and 董, 麗娟 and 宇津呂, 武仁 and 山本, 幹雄 and Itsuki, Toyota and Zi, Long and Lijuan, Dong and Takehito, Utsuro and Mikio, Yamamoto}, issue = {12}, month = {Jul}, note = {専門用語の対訳辞書は特許文書翻訳の過程において必要不可欠なものである.本論文では,日米パテントファミリーを情報源として,専門用語対訳辞書を生成する手法を提案する.従来より,日米パテントファミリーの対応特許文書中において,「背景」 および 「実施例」 の部分の日英対訳文対の対応付けを行い,これを情報源として専門用語の対訳辞書を生成する手法が提案されている.しかし,この方式では,対訳文対が抽出される部分は,「背景」 及び 「実施例」 全体の約 30% であり,約 70% は利用されていなかった.ここで,我々は,これまで,文献 [8] において,「背景」 および 「実施例」 のうちの残りの 70% の部分を言語資源として,既存の対訳辞書を用いて専門用語の訳語推定を行う方式の有効性を実証した.一方,本論文では,特に,人手で作成された辞書である英辞郎及びその部分対応対訳辞書に加えて,全体の約 30% を訓練例として学習したフレーズテーブルを併用して要素合成法を適用し,専門用語の訳語推定を行う方式を提案する.実際に,評価実験において,パテントファミリー 1,000 組当たり約 7,300 対の専門用語訳語対が獲得できることを示す., In the previous methods of generating bilingual lexicon from parallel patent sentences extracted from patent families, the portion from which parallel patent sentences are extracted is about 30% out of the whole “Background” and “Embodiment” parts and about 70% are not used. Considering this situation, this paper proposes to generate bilingual lexicon for technical terms not only from the 30% but also from the remaining 70% out of the whole “Background” and “Embodiment” parts. The proposed method employs the compositional translation estimation technique utilizing the remaining 70% as a comparable corpus for validating translation candidates. As the bilingual constituent lexicons in compositional translation, we use an existing bilingual lexicon as well as the phrase translation table trained with the parallel patent sentences extracted from the 30%. Finally, we show that about 7,300 technical term translation pairs can be acquired from 1,000 patent families.}, title = {パテントファミリーを用いた専門用語訳語獲得における対訳文対非抽出部分およびフレーズテーブルの利用}, year = {2013} }