WEKO3
アイテム
日米対応特許コーパスを用いた対訳抽出手法
https://ipsj.ixsq.nii.ac.jp/records/48472
https://ipsj.ixsq.nii.ac.jp/records/4847252e5b07b-9f0a-4811-88df-626388ea21b4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-09-10 | |||||||
タイトル | ||||||||
タイトル | 日米対応特許コーパスを用いた対訳抽出手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Bilingual Lexicon Extraction Using Japan - US Patent Family Corpora | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
(株)パトリス | ||||||||
著者所属 | ||||||||
(株)パトリス | ||||||||
著者所属 | ||||||||
図書館情報大学/科学技術振興事業団CREST | ||||||||
著者所属 | ||||||||
図書館情報大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
PATOLIS Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
PATOLIS Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Library and Information Science/CREST,Japan Science and Technology Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Library and Information Science | ||||||||
著者名 |
福井, 雅敏
× 福井, 雅敏
|
|||||||
著者名(英) |
Masatoshi, Fukui
× Masatoshi, Fukui
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | インターネット上の外国語情報を母国語によって活用するためには,新語に対応して迅速に翻訳辞書を更新する必要がある。本研究は,同一内容に関して日本語と米国に出願された対応特許をコーパスとして利用し,複合語単位の日英対訳を抽出する手法を提案する。本手法は,発明名称や要約などの特許項目から品詞パターンに基づいて日本語と英語の複合語を抽出し,さらに統計的な関連度スコアを計算して適切な対訳を選択する。1995?1999年に出願された約32 000件の対応特許を対象に評価実験を行った結果,本手法によって年間数千件の新語対訳を半自動的に取得できる見通しを得た。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | To facilitate utilizing foreign information over the Internet, it is crucial to update dictionaries by way of new translations. We propose a method to extract Japanese/English phrasal translations from patent families consisting of Japanese-US patents associated with the same invention. Our method first uses part-of-speech patterns to extract phrases from patent fields, such as titles and abstract, and then computes a statistical association score between each combination of Japanese and English phrases to select appropriate translations. For the purpose of experiments, we used approximately 32,000 patent families filed in 1995-1999, and showed that several thousand new translations per year could be obtained semi-automatically through our method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2001, 号 86(2001-NL-145), p. 23-28, 発行日 2001-09-10 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |