WEKO3
アイテム
文字成分表による文字列検索の実現と評価
https://ipsj.ixsq.nii.ac.jp/records/20401
https://ipsj.ixsq.nii.ac.jp/records/204018d18065c-0cd9-4537-97b1-1289d4f5a7a8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1993 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1993-03-22 | |||||||
タイトル | ||||||||
タイトル | 文字成分表による文字列検索の実現と評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Implementation and evaluation for a text retrieval method using character bitmap tables | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
(株)リコー研究開発本部中央研究所 | ||||||||
著者所属 | ||||||||
(株)リコー研究開発本部中央研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research And Development Center, RICOH Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research And Development Center, RICOH Co., Ltd. | ||||||||
著者名 |
岩崎, 雅二郎
× 岩崎, 雅二郎
|
|||||||
著者名(英) |
Masajirou, Iwasaki
× Masajirou, Iwasaki
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 隣接する文字のペアがどのテキストに出現するかを示す隣接文字成分表を利用するテキスト検索方式を提案する。文字成分表は処理の重い日本語処理を必要としない点で有利であるが文字数の多い日本語には適さない。そこで、次のような改良を加えた。)隣接する文字コードの一部を連結して隣接文字成分とした。)隣接文字成分表を文字種ごとに分けた。)文字成分表を圧縮した。このような改良の結果、提案する方式では高い適合率と小型な文字成分表を実現することができた。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper we propose a new text retrieval method using adjacent character bitmap tables that shows which pair of adjacent characters exists in the text. For Japanese text retrieval, character bitmap table methods are preferable to natural language processing (NLP) based methods. However, the sheer number of Japanese characters prohibits the use of existing character bitmap table methods for Japanese. Thus, we have modified the adjacent character bitmap table method as follows: 1) Only certain bits are used to form an adjacent code. 2) The adjacent character bitmap table is divided into several parts based on character sets of Japanese. 3) Character bitmap tables are compressed. As a result, this method achieves high precision and compact bitmap tables. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 1993, 号 29(1992-DBS-092), p. 1-10, 発行日 1993-03-22 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |