WEKO3
アイテム
大規模XML文書の検索と格納技術の開発
https://ipsj.ixsq.nii.ac.jp/records/43182
https://ipsj.ixsq.nii.ac.jp/records/4318249c75d81-cf74-4191-805c-594065fda784
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-03-14 | |||||||
タイトル | ||||||||
タイトル | 大規模XML文書の検索と格納技術の開発 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Method of Indexing and Storing for Large Scale XML Document | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
富士通研究所 | ||||||||
著者所属 | ||||||||
富士通研究所 | ||||||||
著者所属 | ||||||||
富士通研究所 | ||||||||
著者所属 | ||||||||
富士通研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Laboratories Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Laboratories Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Laboratories Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Fujitsu Laboratories Ltd. | ||||||||
著者名 |
難波, 功
井形, 伸之
小櫻, 文彦
山根, 康男
× 難波, 功 井形, 伸之 小櫻, 文彦 山根, 康男
|
|||||||
著者名(英) |
Isao, Namba
Nobuyuki, Igata
Fumihiko, Kozakura
Yasuo, Yamane
× Isao, Namba Nobuyuki, Igata Fumihiko, Kozakura Yasuo, Yamane
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では、大量の構造化文書に対する検索要求を処理する方式として、構造検索に対応した全文検索機能並びに木構造の形で格納したXML文書の部分取得機能を用いる手法について提案する。本手法では、文書の構造とテキストに対する2種類のインデックス、並びにXMLを木構造で格納する格納部を用いる。本方式の処理速度は文書件数よりは対象文書の複雑さに依存する。最良の場合には従来の項目検索と同等の性能となるため通常の文書検索との親和性が高い。最悪の場合には検索項目1つが文書に含まれるパスの数だけ展開されるため、構造を指定した検索に対する性能は質問文次第となる。実験では、1文書が30程度のタグを含む複雑なXML文書200 MBに対して、文書のルート以下に単語が含まれるという性能上最悪となる検索式を投入しても秒間17質問文の処理が可能という実用的な性能が得られた。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we propose a high-speed query processing method for a large scale structured document set using a full text search index, and storage for XML document in tree structure. Our method uses two types of indexes for document structures and contents, and one storage for storing XML document in tree structure. The processing speed depends on the complexity of tree structure of target documents. In best case its performance is same as that of so-called field search. In worst case, the one term in hierarcical structure query is expanded into the terms of which number is the different path in target documents. In experiment we prepared XML documents which had 30 tags in average and whose volume was 200MB, and run the queries which were expected to be slowest in processing. The query processing performance was 17 query/second, and it is enough for practical use. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10539261 | |||||||
書誌情報 |
情報処理学会研究報告デジタルドキュメント(DD) 巻 2001, 号 26(2000-DD-027), p. 17-24, 発行日 2001-03-14 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |