WEKO3
アイテム
パテントファミリーを用いた専門用語訳語獲得における対訳文対非抽出部分の利用
https://ipsj.ixsq.nii.ac.jp/records/83596
https://ipsj.ixsq.nii.ac.jp/records/8359646025bf0-21fc-4b5b-a37e-992e48088cb1
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-08-26 | |||||||
タイトル | ||||||||
タイトル | パテントファミリーを用いた専門用語訳語獲得における対訳文対非抽出部分の利用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Utilizing Portion of Patent Families with No Parallel Sentences Extracted in Estimating Translation of Technical Terms | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 翻訳・曖昧性解消 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学システム情報系 | ||||||||
著者所属 | ||||||||
筑波大学システム情報系 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Information and Systems, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Engineering, Information and Systems, University of Tsukuba | ||||||||
著者名 |
豊田, 樹生
× 豊田, 樹生
|
|||||||
著者名(英) |
Itsuki, Toyota
× Itsuki, Toyota
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 専門用語の対訳辞書は特許文書翻訳の過程において必要不可欠なものである.本論文では,日米パテントファミリーを情報源として,専門用語対訳辞書を生成する手法を提案する.従来より,日米パテントファミリーの対応特許文書中において,「背景」および「実施例」の部分の日英対訳文対の対応付けを行い,これを情報源として専門用語の対訳辞書を生成する手法が提案されている.しかし,この方式では,対訳文対が抽出される部分は,「背景」及び「実施例」全体の約30%であり,約70%は利用されていなかった.そこで,本論文では,「背景」及び「実施例」の残りの70%の部分から専門用語の対訳辞書を生成する方式を提案する.NTCIR-7特許翻訳タスクにおいて配布された対訳特許文対を訓練例として学習したフレーズテーブル,および,既存の対訳辞書に登録されていない日本語複合名詞を対象として,既存の対訳辞書を用いた要素合成法を適用したところ,約13%については,対応特許文書の英語側に出現する英訳語が生成可能であり,その精度は90%以上であった.提案方式を日英対訳特許文書1,000文書対に適用したところ,一特許文書対あたり平均二組の対訳専門用語対を収集することができた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A bilingual lexicon for technical terms is necessary in the process of translating patent documents. This paper studies a method of generating bilingual lexicon for technical terms from parallel patent documents. In the previous methods of generating bilingual lexicon from parallel patent documents, the portion from which parallel patent sentences are extracted is composed of the parts of “Background” and “Embodiment”. However, this portion is about 30% out of the whole “Background” and “Embodiment” parts and about 70% are not used. Considering this situation, this paper proposes to generate bilingual lexicon for technical terms from the remaining 70% out of the whole “Background” and “Embodiment” parts. The proposed method employs the compositional translation estimation technique which uses an existing bilingual lexicon. We show that, for 13% of the Japanese compound nouns that are not included in the phrase translation table trained with parallel patent sentences nor in the existing bilingual lexicon, translation candidates can be generated through the compositional translation estimation technique, and can be found in the English part of the patent family. On the average, we generate about two pairs of bilingual technical terms per patent family and we achieve over 90% accuracy. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2012-NL-208, 号 2, p. 1-7, 発行日 2012-08-26 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |