WEKO3
アイテム
ハッシュ技法によるデータ検索の数学的モデル化とその評価 : キーワードによる文献検索モデルに対して
https://ipsj.ixsq.nii.ac.jp/records/131962
https://ipsj.ixsq.nii.ac.jp/records/131962f30b1c3b-7dbe-49b0-b5de-5648b688b34c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | National Convention(1) | |||||
---|---|---|---|---|---|---|
公開日 | 1997-09-24 | |||||
タイトル | ||||||
タイトル | ハッシュ技法によるデータ検索の数学的モデル化とその評価 : キーワードによる文献検索モデルに対して | |||||
タイトル | ||||||
言語 | en | |||||
タイトル | Document retrieval models using keywords | |||||
言語 | ||||||
言語 | jpn | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||
資源タイプ | conference paper | |||||
著者所属 | ||||||
早稲田大学理工学部経営システム工学科 | ||||||
著者所属 | ||||||
早稲田大学理工学部経営システム工学科 | ||||||
著者所属 | ||||||
早稲田大学理工学部経営システム工学科 | ||||||
著者所属(英) | ||||||
en | ||||||
Department of Industrial and Management Systems Engineering, School of Science and Engineering, Waseda University | ||||||
著者所属(英) | ||||||
en | ||||||
Department of Industrial and Management Systems Engineering, School of Science and Engineering, Waseda University | ||||||
著者所属(英) | ||||||
en | ||||||
Department of Industrial and Management Systems Engineering, School of Science and Engineering, Waseda University | ||||||
論文抄録 | ||||||
内容記述タイプ | Other | |||||
内容記述 | キーワードを用いた文献検索では個々の文献をキーワードの集合によって特性づける。簡単なモデルではフォーマット化を行い個々の文献jに長さNの二次情報ベクトルx^^→_jを対応させる。個々のビット位置はキーワードの有無に対応じ, 1のあるビット位置のキーワードは文献に含まれるが, 0のビット位置のキーワードは文献に含まれないことを意味する。質問(query)x^^→としていくつかのキーワードを与えて, これらのキーワードをすべて含む文献の二次情報レコードx^^→_jを求める。これをx^^→⊆x^^→_jにより表す。次にこの二次情報レコードに対応する一次情報を二次記憶内から探し出すのが通常の文献検索である。上の簡単なモデルでは, 二次情報の大きさは文献数n_0と二次情報レコードの長さNの積になるがこれが主記憶(RAM)容量よりもかなり大きい場合には二次情報を縮小してRAMに格納せねばならない。これはRAMに格納する1レコードあたりの情報がキーワードの総数Nよりも小さいことを意味する。この場合にx^^→⊆x^^→_jを満足するx^^→_jをすべて求めようとすると, 必然的に不必要なx^^→ (x^^→⊆x^^→_jを満たさない)の一部分も含まれてしまう。この結果, 必要な文献の一次情報ばかりでなく不必要な文献の一次情報も二次記憶装置からRAMにロードすることになる。これは二次記憶装置へのアクセス回数が増大することを意味している。したがって, 不必要なx^^→の総数(extratransmission, 余剰伝送数と呼ぶ)をできるだけ低減することが重要である。余剰転送数を低減するためにRAMの情報を利用する考えは参考文献[1]で報告されている。参考文献[2]ではベクトルx^^→とのハミング距離がしきい値T以内にあるレコードx^^→_jを求めることを目的とする場合に, 余剰転送数の上界の評価が情報理論の視点から行われた。 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AN00349328 | |||||
書誌情報 |
全国大会講演論文集 巻 第55回, 号 ソフトウェア科学・工学, p. 257-258, 発行日 1997-09-24 |
|||||
出版者 | ||||||
言語 | ja | |||||
出版者 | 情報処理学会 |