WEKO3
アイテム
複数ハッシュふるい分け法の日本語情報システムへの応用
https://ipsj.ixsq.nii.ac.jp/records/39734
https://ipsj.ixsq.nii.ac.jp/records/39734b8ceadc0-0021-41ef-b3d6-d3cb4f7c044c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1994 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1994-03-15 | |||||||
タイトル | ||||||||
タイトル | 複数ハッシュふるい分け法の日本語情報システムへの応用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Screening by multiple open hashing for a Japanese information system | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
図書館情報大学 | ||||||||
著者所属 | ||||||||
図書館情報大学 | ||||||||
著者所属 | ||||||||
図書館情報大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Library and Information Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Library and Information Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
University of Library and Information Science | ||||||||
著者名 |
中本, 賢一
× 中本, 賢一
|
|||||||
著者名(英) |
Ken'Iti, Nakamoto
× Ken'Iti, Nakamoto
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 複数ハッシュふるい分けを用いた索引語切り出し機能及び検索質問の単語分解機能をWAIS (de Area Information Serv) に付加し、べた書き日本語テキストの自然語による検索を可能にした。複数ハッシュふるい分けでは、辞書から作成するハッシュ表を使い、あるキーがその辞書中に存在するかどうかを調べる。ハッシュ表にはキーの有無を示す1ビットのフラグだけが立っているので、もとの辞書より必要な記憶容量がはるかに小さい。これを利用し日本語テキストと質問文の両方から同じ辞書、同じ方法でキーを切り出すことができ、必要に応じた辞書を使用できる。また文章中の多くの単語の組合せがキーになるため、送り仮名等の表記のゆれにある程度対応できる。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A Japanese language retrieval capability is incorporated in WAIS (Wide Area Information Server) through the use of multiple-hash screening technique. Here, the hash table is constructed by hashing each dictionary entry with a number of mutually independent hash functions. Whether the search key fits with a dictionary entry is judged solely from the hash table, without accessing the original dictionary. As the hash table consists only of single-bit flags, it is much smaller than the original dictionary. Consequently, it is possible to process both the Japanese text data and the query string based on the same dictionary, which can be changed from database to database. As many combinations of possible words in the text may be indexed, some variations in kana/kanji expressions may be tolerated in the retrieval. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11253943 | |||||||
書誌情報 |
情報処理学会研究報告情報システムと社会環境(IS) 巻 1994, 号 25(1993-IS-048), p. 53-60, 発行日 1994-03-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |