WEKO3
アイテム
文字成分表を用いた大規模全文検索方式の開発 : ハッシュレス文字成分表の構成方式
https://ipsj.ixsq.nii.ac.jp/records/128721
https://ipsj.ixsq.nii.ac.jp/records/128721ecfe2df5-1892-434b-876e-3cb115faf714
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1995-09-20 | |||||
タイトル | ||||||
タイトル | 文字成分表を用いた大規模全文検索方式の開発 : ハッシュレス文字成分表の構成方式 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | Development of a Large Full-Text Retrieval System using Character Occurrence Bitmap : Structure of Hashless Character Occurrence Bitmap | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
(株)日立製作所情報通信開発本部 | ||||||
著者所属 | ||||||
(株)日立製作所情報通信開発本部 | ||||||
著者所属 | ||||||
(株)日立製作所情報通信開発本部 | ||||||
著者所属 | ||||||
(株)日立製作所情報通信開発本部 | ||||||
著者所属 | ||||||
(株)日立製作所情報通信開発本部 | ||||||
著者所属(英) | ||||||
en | ||||||
Information Systems R&D Division, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Information Systems R&D Division, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Information Systems R&D Division, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Information Systems R&D Division, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Information Systems R&D Division, Hitachi, Ltd. | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 近年,特許公報のCD-ROMによるテキストとイメージの配布に伴い,大規模な全文検索に対するニーズが高まっている。筆者等は,文字成分表を用いて検索対象とする文書を絞り込むことにより検索を等価的に高速化する階層プリサーチ方式を開発してきた。今回,文字成分表だけで検索結果を得ることのできる大規模文書DB用全文検索方式について検討した。その結果,1エントリに複数文字成分を割り当てていた従来の文字成分表を,1対1に対応させるハッシュレス文字成分表方式を開発することができた。本方式は,文字成分表の容量の増大を防ぐために,登録するデータ中に存在する連接文字だけを文字成分表に登録するハッシュレス文字成分表方式と,ビットリスト形式と文書IDリスト形式を併用する混在型格納方式で構成される。本稿では,その基本方式と実データを用いた評価結果について報告する。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第51回, 号 データベース, p. 241-242, 発行日 1995-09-20 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |