WEKO3
アイテム
Unicodeを用いたN - gram索引の一実現方式とその評価
https://ipsj.ixsq.nii.ac.jp/records/48670
https://ipsj.ixsq.nii.ac.jp/records/48670c47511d2-8133-4edb-86bf-fd2c823080a2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-03-21 | |||||||
タイトル | ||||||||
タイトル | Unicodeを用いたN - gram索引の一実現方式とその評価 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | An N - gram indexing method for Unicode based search engine | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
NTT未来ねっと研究所 | ||||||||
著者所属 | ||||||||
NTT未来ねっと研究所 | ||||||||
著者所属 | ||||||||
NTT未来ねっと研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Network Innovation Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Network Innovation Laboratories | ||||||||
著者所属(英) | ||||||||
en | ||||||||
NTT Network Innovation Laboratories | ||||||||
著者名 |
原田, 昌紀
風間, 一洋
佐藤進也
× 原田, 昌紀 風間, 一洋 佐藤進也
|
|||||||
著者名(英) |
Masanori, Harada
Kazuhiro, Kazama
Shin-Ya, Sato
× Masanori, Harada Kazuhiro, Kazama Shin-Ya, Sato
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Unicodeベースの全文検索の実現方法について,索引づけ方式を中心に検討を行い,N-gramの長さを文字ブロックごとに可変とする索引づけ方式を提案する.提案した方式をWWWサーチエンジンに適用し,日本語テキストに適したパラメータを推定する.また,言語依存の処理を追加する方法について述べる. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | We investigate some indexing methods in order to implement an Unicode based full-text search engine and propose an N-gram indexing method that varies N-gram length per character block. With the proposed indexing method applied to our WWW search engine, we estimate parameters suitable for Japanese. We also describe some possible language dependent extensions. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2000, 号 29(1999-NL-136), p. 127-134, 発行日 2000-03-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |