WEKO3
アイテム
全文検索のための文字成分表方式の改良
https://ipsj.ixsq.nii.ac.jp/records/20318
https://ipsj.ixsq.nii.ac.jp/records/20318c64cb000-c0c1-4cac-a1d8-39baa547a659
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1994 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1994-07-20 | |||||||
タイトル | ||||||||
タイトル | 全文検索のための文字成分表方式の改良 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Enhancing full - text search performance using character bitmap tables | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
(株)リコー情報通信研究所 | ||||||||
著者所属 | ||||||||
(株)リコー情報通信研究所 | ||||||||
著者所属 | ||||||||
(株)リコー情報通信研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information & Communication R&D Center, RICHO Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information & Communication R&D Center, RICHO Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Information & Communication R&D Center, RICHO Co., Ltd. | ||||||||
著者名 |
小川, 泰嗣
× 小川, 泰嗣
|
|||||||
著者名(英) |
Yasushi, Ogawa
× Yasushi, Ogawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 全文検索法として文字成分表は有効であるが、つぎのような問題点がある:()検索文字列が長くなるに従い検索時間が遅くなる、()文字成分表ファイルのブロックサイズは登録/検索に反する影響を与えるため、登録/検索速度を両立させることができない。本稿では、これら問題点を解決法を提案する。前者に関しては、文字列から抽出されるエントリの重複を削除する、高頻度で出現する長さm以上の文字列もエントリとすることで検索文字列から抽出されるエントリ数を削減する、という二つの手法で文字列長の影響を小さくする。後者に関しては、二種類のブロックを導入し、メンテナンス時に小さいブロックを大きくまとめ上げることで、登録速度を維持しながら検索を高速化する。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Although a character bitmap table which maps documents to their contained characters is effective in full text search, there are two problems: 1) longer query strings lead to longer retrieval times. 2) bitmap file block size has opposing impacts on registration performance and retrieval performance. To solve these problems, 1) we reduce the number of entries extracted from the query by adding string entries, special entries in the character bitmap organization, as well as eliminate duplicate entries, to reduce the effect of query length on search response. 2) we introduce two sizes for blocks, using small ones during registration and large ones during retrieval. Thus, our method attains high performance in both cases. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 1994, 号 62(1994-DBS-099), p. 261-263, 発行日 1994-07-20 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |