2024-03-28T23:41:06Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001287212023-11-17T02:17:36Z06504:08089:08097
文字成分表を用いた大規模全文検索方式の開発 : ハッシュレス文字成分表の構成方式Development of a Large Full-Text Retrieval System using Character Occurrence Bitmap : Structure of Hashless Character Occurrence Bitmapjpnhttp://id.nii.ac.jp/1001/00128906/Conference Paperhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=128721&item_no=1&attribute_id=1&file_no=1(株)日立製作所情報通信開発本部(株)日立製作所情報通信開発本部(株)日立製作所情報通信開発本部(株)日立製作所情報通信開発本部(株)日立製作所情報通信開発本部畠山, 敦多田, 勝己川口, 久光水谷, 奈津子加藤, 寛次近年,特許公報のCD-ROMによるテキストとイメージの配布に伴い,大規模な全文検索に対するニーズが高まっている。筆者等は,文字成分表を用いて検索対象とする文書を絞り込むことにより検索を等価的に高速化する階層プリサーチ方式を開発してきた。今回,文字成分表だけで検索結果を得ることのできる大規模文書DB用全文検索方式について検討した。その結果,1エントリに複数文字成分を割り当てていた従来の文字成分表を,1対1に対応させるハッシュレス文字成分表方式を開発することができた。本方式は,文字成分表の容量の増大を防ぐために,登録するデータ中に存在する連接文字だけを文字成分表に登録するハッシュレス文字成分表方式と,ビットリスト形式と文書IDリスト形式を併用する混在型格納方式で構成される。本稿では,その基本方式と実データを用いた評価結果について報告する。AN00349328全国大会講演論文集第51回データベース2412421995-09-202015-01-20