WEKO3
-
RootNode
アイテム
文書の更新を考慮した高精度XML部分文書検索手法の提案
https://ipsj.ixsq.nii.ac.jp/records/95325
https://ipsj.ixsq.nii.ac.jp/records/9532585bb89b1-17f2-447d-a708-9b076ca229de
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-09-27 | |||||||
タイトル | ||||||||
タイトル | 文書の更新を考慮した高精度XML部分文書検索手法の提案 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Proposal of Accurate XML Element Retrieval Considering Document Updates | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [研究論文] XML部分文書検索,文書索引,差分更新,大域的重み,性能評価 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科/日本学術振興会 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
同志社大学文化情報学部 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology / Japan Society for the Promotion of Science | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Culture and Information Science, Doshisha University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者名 |
欅, 惇志
宮崎, 純
波多野, 賢治
山本, 豪志朗
武富, 貴史
加藤, 博一
× 欅, 惇志 宮崎, 純 波多野, 賢治 山本, 豪志朗 武富, 貴史 加藤, 博一
|
|||||||
著者名(英) |
Atsushi, Keyaki
Jun, Miyazaki
Kenji, Hatano
Goshiro, Yamamoto
Takafumi, Taketomi
Hirokazu, Kato
× Atsushi, Keyaki Jun, Miyazaki Kenji, Hatano Goshiro, Yamamoto Takafumi, Taketomi Hirokazu, Kato
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,文書の更新を考慮した高精度XML部分文書検索の実現を目指す.検索システムにおいて,文書の更新に対応しなかった場合,適切な検索結果を提示できず検索システムの利便性が低下するが,文書の更新発生時に検索索引を一から再構築した場合には索引構築時間が長時間に及ぶため,本論文では索引の差分更新を行う.しかし,索引の差分更新時に,システムに蓄積された文書数が十分ではない時点や,文書の更新にともなって語の統計量が変化した場合,文書集合全体から算出される統計量である大域的重みを正確に推定できない可能性がある.これらの問題を解決するため,既存のXML部分文書検索システムに索引の差分更新機能を付与し,さらに,高速な差分更新を行うために文書中の重要な箇所と索引語のみを索引へ追加するためのフィルタと,正確な大域的重み推定のためのpath式統合手法を用いた索引語の重み付け手法を提案する.評価実験の結果,統計量が変動しない文書集合に対して,提案手法は単純な差分更新と比較し,検索精度を4%向上させつつ,索引の更新速度を25%高速化した.また,統計量が変動した場合にも,速やかにその変化に追従して検索精度を向上させることが可能であることが判明した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose a method for accurately retrieving XML elements considering document updates. If document updates are not handled in a search system, users cannot obtain appropriate search results, which reduces the usefulness of the search system. We apply an incremental approach to update an index because a rebuild-from-scratch approach takes longer time. In addition, global weights, i.e., the statistics computed with all documents in the search system, may not be accurate when a few number of documents is indexed or when global weights change drastically. To solve these problems, we propose to extend a function of incremental updates of indices to general XML element retrieval systems, with filters to reduce the update cost by eliminating unimportant elements and terms. Moreover, we apply a method for integrating path expression which estimates accurate global weights in term calculation. Experimental results showed that our proposed method can be up to 25% faster to update indices than the simple incremental updates and can improve the search accuracy by 4% with document set of static statistics. The proposed method can also search accurately, even under continuous changes in the statistics of the documents. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11464847 | |||||||
書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 6, 号 4, p. 1-16, 発行日 2013-09-27 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7799 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |