WEKO3
アイテム
文書間の類似度における単語寄与度を利用した検索式拡張手法
https://ipsj.ixsq.nii.ac.jp/records/19847
https://ipsj.ixsq.nii.ac.jp/records/19847d79ed7c5-bdc0-40ed-b8f0-db0de1c74937
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 1999-05-17 | |||||||
| タイトル | ||||||||
| タイトル | 文書間の類似度における単語寄与度を利用した検索式拡張手法 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Query Expansion Method Based on Word Contribution to Query - Document Similarity | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| KDD研究所 | ||||||||
| 著者所属 | ||||||||
| KDD研究所 | ||||||||
| 著者所属 | ||||||||
| KDD研究所 | ||||||||
| 著者所属 | ||||||||
| KDD研究所 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| KDD R&D Laboratories, Inc. | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| KDD R&D Laboratories, Inc. | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| KDD R&D Laboratories, Inc. | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| KDD R&D Laboratories, Inc. | ||||||||
| 著者名 |
帆足, 啓一郎
松本, 一則
井ノ上, 直己
橋本, 和夫
× 帆足, 啓一郎 松本, 一則 井ノ上, 直己 橋本, 和夫
|
|||||||
| 著者名(英) |
Keiichiro, Hoashi
Kazunori, Matsumoto
Naomi, Inoue
Kazuo, Hashimoto
× Keiichiro, Hoashi Kazunori, Matsumoto Naomi, Inoue Kazuo, Hashimoto
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | テキスト情報検索システムへの入力文から生成される検索式の情報を拡張することによってより高い精度の検索を図る「検索式拡張」の有効性はさまざまな研究発表などによって実証されている.しかし,検索式拡張に使用される単語の選択時には,TF*IDFなど,検索対象文書内での重要性のみが考慮される場合が多く,その単語が入力文と検索対象文書の間の類似度に与える影響は考慮されていない.そのため,検索式拡張において有効な単語が選択されていない可能性があると考えられる.本研究では類似度への単語の影響力を数値化した「単語寄与度」という概念を定義し,単語寄与度に基づいた新たな検索式拡張手法を提案する.また,Rocchioのアルゴリズムに基づく検索式拡張との比較実験を通し,提案手法の有効性を示す. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | In this paper, we propose a novel query expansion method based on a measure called word contribution. Word contribution is a measure which expresses the influence a word has on the similarity between a query and a document. We presumed that such words with significant negative contribution to the similarity of documents are discriminative words of document relevance. Therefore, by extracting such words from documents relevant to the quer, it is possible to make an effective query expansion. We describe the experiments for the evaluation of our proposed query expansion method, which was made on TREC data. Through the comparison of our method to the Rocchio-weight based query expansion method, the effectiveness of our method was proved. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10112482 | |||||||
| 書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 1999, 号 39(1999-DBS-118), p. 17-24, 発行日 1999-05-17 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||