WEKO3
アイテム
検索質問の主題分析に基づく類似文書検索と特許検索への応用
https://ipsj.ixsq.nii.ac.jp/records/10662
https://ipsj.ixsq.nii.ac.jp/records/10662cd4a24ba-7618-44b7-a569-127f8b9b0d00
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-04-15 | |||||||
タイトル | ||||||||
タイトル | 検索質問の主題分析に基づく類似文書検索と特許検索への応用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Associative Document Retrieval by Query Subtopic Analysis and its Application to Patent Search | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 情報検索 | |||||||
著者所属 | ||||||||
NTT データ技術開発本部,筑波大学大学院図書館情報メディア研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院図書館情報メディア研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院図書館情報メディア研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research and Development Headquarters, NTT DATA Corporation,Graduate School of Library Information and Media Studies University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Library, Information and Media Studies, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Library, Information and Media Studies, University of Tsukuba | ||||||||
著者名 |
高木, 徹
藤井, 敦
石川, 徹也
× 高木, 徹 藤井, 敦 石川, 徹也
|
|||||||
著者名(英) |
Toru, Takaki
Atsushi, Fujii
Tetsuya, Ishikawa
× Toru, Takaki Atsushi, Fujii Tetsuya, Ishikawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 類似文書検索において,検索質問文書に含まれる複数の主題を用いた高精度検索方式を提案する.本方式は,検索質問から抽出した主題ごとに通常の類似文書検索を行い,主題ごとに算出する主題重要度を用いて,最終的な類似文書検索結果を生成する.各主題から抽出される検索語の特定性をエントロピーを用いて算出することにより,各主題重要度を決定する.本方式を特許の請求項を検索質問とする無効特許検索に応用する.特許文書での請求項の前提部分や本質部分といった記述形式や構造情報を用いて,各主題重要度の補正を行う.NTCIR特許文書テストコレクションを用いた評価実験により,提案手法が従来手法より高精度な検索が可能であることを示す. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose an associative document retrieval method by query subtopic analysis. Our method uses the individual subtopic elements in a query document and retrieves the associative documents on a subtopic-by-subtopic basis. For each subtopic element, a subquery is produced and similar documents are retrieved with the relevance score. The relevance scores weighed by the importance of each subtopic element are integrated to determine the final relevant documents. In calculation of subtopic's importance, the specificity of a query term is evaluated using entropy, which is a deviation degree of term occurrences in each subtopic element. We applied the proposed method to an invalidity patent search in which subtopics are the composition elements in a query claim. We propose an additional calculation method of subtopic's importance using the feature of query patent claim, such as preamble and essential portions. We evaluated our method experimentally using the NTCIR patent IR test collection. The results showed that our method was effective than existing methods in retrieval accuracy. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 46, 号 4, p. 1074-1081, 発行日 2005-04-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |