WEKO3
アイテム
N-gram索引における複合検索条件の効率的な処理方法
https://ipsj.ixsq.nii.ac.jp/records/17784
https://ipsj.ixsq.nii.ac.jp/records/1778423063e35-7ca7-452d-b91a-8135123a6d90
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Trans(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 1999-05-15 | |||||||
| タイトル | ||||||||
| タイトル | N-gram索引における複合検索条件の効率的な処理方法 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Efficient evaluation method of complex queries in n-gram indexing | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 研究論文 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| (株)リコー ソフトウェア研究所 | ||||||||
| 著者所属 | ||||||||
| (株)リコー オフィスシステム開発センター | ||||||||
| 著者所属 | ||||||||
| リコーシステム開発(株) | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Software Research Center, Ricoh Co., Ltd. | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Office System Development Center, Ricoh Co., Ltd. | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Ricoh System Kaihatsu Co., Ltd. | ||||||||
| 著者名 |
小川, 泰嗣
松田, 透
橋本, 信次
× 小川, 泰嗣 松田, 透 橋本, 信次
|
|||||||
| 著者名(英) |
Yasushi, Ogawa
Toru, Matsuda
Shinji, Hashimoto
× Yasushi, Ogawa Toru, Matsuda Shinji, Hashimoto
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | N-gram索引のための単一検索語の効率的な処理方法として冗長n-gram法が提案されている。これは検索処理を、検索語から抽出される複数のn-gramを含む文書を検索する候補文書特定と、n-gram が文書中で連続位置にあるか調べる位置検査の2段階に分離し、位置検査をできる限り省略することで検索を高速化するものである。本論文では、位置検査の省略という考えをAND OR ANDNOT演算子に対して拡張し、複合検索条件処理を高速化する。さらに、AND OR演算子が入れ子になっている場合には、子ノード数に応じてOR標準形に変換することで検索処理を高速化する。新聞記事5年分を用いた評価により、これら手法の有効性が確認できた。 | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | In the redundant n-gram method proposed for query processing in n-gram indexing, retrieval is accelerated by dividing the processing into two steps - one is finding the potential documents that have all the n-grams in the query word, and the other is checking the proximity constraints among the n-grams - and by reducing the unnecessary proximity check. This paper extends this method to complex queries with AND, OR, ANDNOT operators. In addition, we selectively convert complex queries with both AND and OR operators to the OR normal form according to the number of child nodes in these operators. The results of experiments using five years of newspapers showed that the extensions worked quite well. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AA11464847 | |||||||
| 書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 40, 号 SIG05(TOD2), p. 43-53, 発行日 1999-05-15 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7799 | |||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||