@techreport{oai:ipsj.ixsq.nii.ac.jp:00043182, author = {難波, 功 and 井形, 伸之 and 小櫻, 文彦 and 山根, 康男 and Isao, Namba and Nobuyuki, Igata and Fumihiko, Kozakura and Yasuo, Yamane}, issue = {26(2000-DD-027)}, month = {Mar}, note = {本稿では、大量の構造化文書に対する検索要求を処理する方式として、構造検索に対応した全文検索機能並びに木構造の形で格納したXML文書の部分取得機能を用いる手法について提案する。本手法では、文書の構造とテキストに対する2種類のインデックス、並びにXMLを木構造で格納する格納部を用いる。本方式の処理速度は文書件数よりは対象文書の複雑さに依存する。最良の場合には従来の項目検索と同等の性能となるため通常の文書検索との親和性が高い。最悪の場合には検索項目1つが文書に含まれるパスの数だけ展開されるため、構造を指定した検索に対する性能は質問文次第となる。実験では、1文書が30程度のタグを含む複雑なXML文書200 MBに対して、文書のルート以下に単語が含まれるという性能上最悪となる検索式を投入しても秒間17質問文の処理が可能という実用的な性能が得られた。, In this paper, we propose a high-speed query processing method for a large scale structured document set using a full text search index, and storage for XML document in tree structure. Our method uses two types of indexes for document structures and contents, and one storage for storing XML document in tree structure. The processing speed depends on the complexity of tree structure of target documents. In best case its performance is same as that of so-called field search. In worst case, the one term in hierarcical structure query is expanded into the terms of which number is the different path in target documents. In experiment we prepared XML documents which had 30 tags in average and whose volume was 200MB, and run the queries which were expected to be slowest in processing. The query processing performance was 17 query/second, and it is enough for practical use.}, title = {大規模XML文書の検索と格納技術の開発}, year = {2001} }