WEKO3
アイテム
特許情報処理を指向したテストコレクションの構築:情報検索と自然言語処理の融合を目指して
https://ipsj.ixsq.nii.ac.jp/records/40054
https://ipsj.ixsq.nii.ac.jp/records/40054a02af12c-ee23-4c40-a837-3cedabd6310e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2008 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2008-01-21 | |||||||
タイトル | ||||||||
タイトル | 特許情報処理を指向したテストコレクションの構築:情報検索と自然言語処理の融合を目指して | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Producing Test Collections for Patent Information Processing: Toward the Fusion of Information Retrieval and Natural Language Processing | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学 | ||||||||
著者所属 | ||||||||
広島市立大学 | ||||||||
著者所属 | ||||||||
東京工業大学/曰立製作所 | ||||||||
著者所属 | ||||||||
国立情報学研究所 | ||||||||
著者所属 | ||||||||
情報通信研究機構 | ||||||||
著者所属 | ||||||||
筑波大学 | ||||||||
著者所属 | ||||||||
筑波大学 | ||||||||
著者所属 | ||||||||
東京工業大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hiroshima City University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hitachi, Ltd. / Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Informatics | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Information and Communications Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Institute of Technology | ||||||||
著者名 |
藤井, 敦
× 藤井, 敦
|
|||||||
著者名(英) |
Atsushi, Fujii
× Atsushi, Fujii
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 情報検索や自然言語処理に関する技術を体系的に評価するためには,ベンチマークとして研究者が共有できる大規模なテストコレクションが必要である.本稿は,NTCIRワークショップにおいて構築している特許情報処理テストコレクションについて,検索,分類,機械翻訳,マイニングの観点から解説する.検索では技術動向調査,無効資料調査,パッセージ検索を目的とし,分類ではFタームに基づくカテゴリ分類を目的としたテストコレクションを構築した.現在進行中のワークショップでは,検索や分類で用いた日英特許情報を応用して,翻訳とマイニングに関するテストコレクションを構築している.翻訳では,対応特許(パテントファミリー)から抽出した文対応データをシステムの訓練や評価に用いる.マイニングでは,特許と技術論文を横断した技術動向分析を想定して,論文抄録に特許分類のカテゴリを付与することを目的とする. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | To evaluate technologies for information retrieval and natural language processing systemati cally, sharable large test collections as benchmark data are needed. This paper describes the test collections for patent information processing at the NTCIR workshop from retrieval, clas sification, machine translation, and mining perspectives. For the retrieval task, test collections for technology survey, invalidity search, and passage retrieval were produced. For the classifi cation task, test collections for the F-term patent classification system were produced. In the current workshop, applying the patent documents in Japanese and English that were used for the retrieval and classification tasks, test collections for machine translation and mining are being produced. For the translation task, sentence-aligned data extracted from patent families are used for training and evaluation purposes. For the mining task, aimed at the analysis of technology trends across patents and technical papers, the purpose is to categorize technical abstracts based on a patent classification system. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 2008, 号 4(2008-FI-089), p. 31-36, 発行日 2008-01-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |