WEKO3
アイテム
ベクトル空間圧縮モデルによるWWW検索処理の効率化
https://ipsj.ixsq.nii.ac.jp/records/19789
https://ipsj.ixsq.nii.ac.jp/records/19789afa5ec11-3882-46cc-b3f7-9f1cdb02abe9
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-07-21 | |||||||
タイトル | ||||||||
タイトル | ベクトル空間圧縮モデルによるWWW検索処理の効率化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | The efficient WWW retrieval process based on Vector Space Compression Model | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
立命館大学大学院理工学研究科 | ||||||||
著者所属 | ||||||||
立命館大学理工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Science and Engineering, Ritsumeikan Univ. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Science and Engineering, Ritsumeikan Univ. | ||||||||
著者名 |
原田, 晃史
× 原田, 晃史
|
|||||||
著者名(英) |
Koji, Harada
× Koji, Harada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | インターネットの普及により急激に増大したWWW集合から効率的に必要な情報を取り出す必要性が増している.そこで,膨大に生成・蓄積されたWWW集合から,必要なWWW情報を効率的に取り出すシステムが必要となってきている.この要求を満たすために,ベクトル空間モデルに次元数を減少するための改良を加えたモデルを提案する.このモデルを用いて関連性のあるWWW集合をクラスタとしてまとめ,更にその類似度によってページ割り当てを決定する格納構造により,検索処理の効率化を図る.本方法では,格納構造を階層化し,この木構造を検索時に辿ることで,必要な情報を格納しているページを容易に決定することができる.また,格納時のオーバーフロー処理についても動的に対応できる方法である.シミュレーションの結果,本方法は,問い合わせに含まれるキーワード数が多い場合の検索や,ベクトル全体の関連性の強度が高い情報集合に対する検索に適していることが得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The paper presents new index structure that modifies Vector Space Model, in order to reduce the size of vector space dimension and to improve the number of page access under compression. We intend to develop this model to realize an efficient WWW directory service as a physical structure in searching appropriate page given a set of keywords. The paper describes the basic structure and some algorithms for insertion and searching. In the model, each vector in the vector space is represented only by a list of the keyword number where the document contains the keyword, not-by the whole vector elements. The model is also evaluated in the three viewpoints: space efficiency, the number of page accesses for searching and the number of page accesses for insertion. It is shown from some evaluation that in the model the number of page accesses for searching is almost constant as the number of keywords given varies. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 1999, 号 61(1999-DBS-119), p. 91-96, 発行日 1999-07-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |