WEKO3
アイテム
n-gram型大規模全文検索方式の開発 : 文字種適応型n-gramインデクス方式
https://ipsj.ixsq.nii.ac.jp/records/130584
https://ipsj.ixsq.nii.ac.jp/records/1305842f07a018-a7f0-45e9-9b24-a27144bb9b07
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1996-09-04 | |||||
タイトル | ||||||
タイトル | n-gram型大規模全文検索方式の開発 : 文字種適応型n-gramインデクス方式 | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | A Full-Text Search System for Large JapanesText Bases using n-gram Indexing Method : Adaptive n-gram Indexing Method to Character String Type | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
(株)日立製作所 情報・通信開発本部 | ||||||
著者所属 | ||||||
(株)日立製作所 情報・通信開発本部 | ||||||
著者所属 | ||||||
(株)日立製作所 情報・通信開発本部 | ||||||
著者所属 | ||||||
(株)日立製作所 情報・通信開発本部 | ||||||
著者所属 | ||||||
(株)日立製作所 情報・通信開発本部 | ||||||
著者所属(英) | ||||||
en | ||||||
Information Systems R&D Division, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Information Systems R&D Division, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Information Systems R&D Division, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Information Systems R&D Division, Hitachi, Ltd. | ||||||
著者所属(英) | ||||||
en | ||||||
Information Systems R&D Division, Hitachi, Ltd. | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 電子化文書情報が急激な勢いで増加するに従い、大量の文書情報の中から所望の文書を迅速に探す検索システムへのニーズが高まってきている[1]。これに応えるため、登録文書のテキストからn文字の連続する文字列(以下,n-gramと呼ぶ)を抽出し、そのインデクスを参照して全文検索を行うn-gramインデクス方式の検討を行ってきた[2]。本稿では,n-gramインデクス方式において、総インデクス容量を削減するために開発した、抽出n-gramの種類を抑制する文字種適応型n-gram抽出方式と、インデクス情報としての文書識別子とn-gram出現位置を可変長形式で格納する可変長インデクス方式について報告する。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第53回, 号 データベースとメディア, p. 237-238, 発行日 1996-09-04 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |