WEKO3
アイテム
検索質問文書の主題分析に基づく類似文書検索
https://ipsj.ixsq.nii.ac.jp/records/40250
https://ipsj.ixsq.nii.ac.jp/records/402508907ad5b-7f81-4f88-a62b-8d09e5d05c22
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2004 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2004-05-14 | |||||||
タイトル | ||||||||
タイトル | 検索質問文書の主題分析に基づく類似文書検索 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Associative Document Retrieval by Query Theme Analysis | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTTデータ技術開発本部 | ||||||||
著者所属 | ||||||||
筑波大学大学院図書館情報メディア研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院図書館情報メディア研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research and Development Headquarters, NTT DATA Corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Library, Information and Media Studies, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Library, Information and Media Studies, University of Tsukuba | ||||||||
著者名 |
高木, 徹
× 高木, 徹
|
|||||||
著者名(英) |
Toru, Takaki
× Toru, Takaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 類似文書検索において、検索質問文書内に記述されている複数の主題要素を抽出し、主題要素ごとの検索結果と、記述特徴を考慮した主題重要度を用いた高精度な検索手法を提案する。主題要素別に、検索要求の生成、検索と主題要素重要度の付与を行い、主題要素重要度を加味した統合により最終検索結果を出力するものである。特に、本手法を特許の請求項を入力とする無効資料調査特許検索に適用する。従来の語の出現頻度の情報と、特許文書での請求項の前提部分や本質部分といった記述形式や構造情報を用いて、各構成要素重要度の算出を行う。5年分の特許文書データを用いた評価実験により、提案手法が従来手法より高精度な検索が可能であることを示す。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose an associative document retrieval method that uses individual composition elements in documents by a query theme analysis. For each composition element, a query is produced and similar documents are retrieved with the relevance score. The relevance scores weighted by the importance of the corresponding composition element are integrated to determine the final relevant documents. We also propose a method for determining the importance of each composition element. We applied the proposed method to invalidity patent search. This method uses the conventional word frequency value and document-structure features, such as the preamble and essential portions in patent claim description. We evaluated our proposed method experimentally using five years worth of Japanese patent documents, and the results showed that our method was effective. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 2004, 号 45(2004-FI-075), p. 91-98, 発行日 2004-05-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |