WEKO3
アイテム
全文検索における構造化インデクスの性能評価
https://ipsj.ixsq.nii.ac.jp/records/19704
https://ipsj.ixsq.nii.ac.jp/records/19704a4cd8b45-2d5d-459b-a49a-7bd95c1c6709
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2000-07-26 | |||||||
| タイトル | ||||||||
| タイトル | 全文検索における構造化インデクスの性能評価 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Evaluation of Full - Text Search Using Structured Index | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 国立情報学研究所 | ||||||||
| 著者所属 | ||||||||
| 国立情報学研究所 | ||||||||
| 著者所属 | ||||||||
| 国立情報学研究所 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| National Institute of Informatics (NII) | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| National Institute of Informatics (NII) | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| National Institute of Informatics (NII) | ||||||||
| 著者名 |
松村, 敦
高須, 淳宏
安達, 淳
× 松村, 敦 高須, 淳宏 安達, 淳
|
|||||||
| 著者名(英) |
Atsushi, Matsumura
Atsuhiro, Takasu
Jun, Adachi
× Atsushi, Matsumura Atsuhiro, Takasu Jun, Adachi
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 全文検索において,単語間の関係を利用した二つの情報検索手法を提案する.一つは,一文中の単語間の係受け関係を用いるもので,もう一つはその近似として一文中での単語の順序付共起関係を利用する手法である.これらの手法を,単語間の係受け関係を二分木の形で表現する構造化インデクス上に実現した.これまでの研究では,我々の手法がTF-IDF法と比較して十分な検索精度の向上を達成できることを示した.本論文では,問合せの自然言語処理の精度を向上させることによって,検索性能の改善を行なった結果について報告する.日本語情報検索のためのテストコレクションNTCIR-1を使った実験の結果,これらの手法は改善前と比べて平均適合率の平均でそれぞれ12.1%,11.4%程度の精度向上となり,またTF-IDFに対してはそれぞれ18.8%,16.7%性能が向上した. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | We propose two Japanese full-text retrieval methods using relationships between words. One is method using dependency relationships between words in a sentence, and another is the method using the ordered co-occurrence information of words in a sentence as an approximation to the dependency relationships between them. These methods are constructed on Structured Index which is a set of binary trees representing dependency relationships between words. In our previous research, we showed our methods are superior to the TF-IDF method in retrieval effectiveness. In this paper, we show the effect of improving the accuracy of natural language processing in our methods on retrieval effectiveness. We make retrieval experiments using NTCIR-1. As a result, the mean average precisions of our dependency method and co-occurrence method are 12.1% and 11.4% higher than that of our previous system respectively, and is still about 18.8% and 16.7% higher than that of TF-IDF methods. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10112482 | |||||||
| 書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2000, 号 69(2000-DBS-122), p. 353-360, 発行日 2000-07-26 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||