WEKO3
アイテム
XML文書の文書構造と内容を用いた部分文書の抽出手法
https://ipsj.ixsq.nii.ac.jp/records/17655
https://ipsj.ixsq.nii.ac.jp/records/17655fdb21d1f-172c-4575-9e81-570f052b108d
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Trans(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2002-03-15 | |||||||
| タイトル | ||||||||
| タイトル | XML文書の文書構造と内容を用いた部分文書の抽出手法 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | A Retrieval Method for Partial XML Documents Using Their Structures and Contents | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 研究論文 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学情報科学研究科 | ||||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学情報科学研究科 | ||||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学情報科学研究科/国立情報学研究所ソフトウェア研究系 | ||||||||
| 著者所属 | ||||||||
| 奈良先端科学技術大学院大学情報科学研究科 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Information Science, Nara Institute of Science and Technology (NAIST) | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Information Science, Nara Institute of Science and Technology (NAIST) | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Information Science, Nara Institute of Science and Technology (NAIST)/Software Research Division, National Institute of Informatics (NII) | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Information Science, Nara Institute of Science and Technology (NAIST) | ||||||||
| 著者名 |
絹谷, 弘子
波多野, 賢治
吉川, 正俊
植村, 俊亮
× 絹谷, 弘子 波多野, 賢治 吉川, 正俊 植村, 俊亮
|
|||||||
| 著者名(英) |
Hiroko, Kinutani
Kenji, Hatano
Masatoshi, Yoshikawa
Shunsuke, Uemura
× Hiroko, Kinutani Kenji, Hatano Masatoshi, Yoshikawa Shunsuke, Uemura
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | XMLの出現によりネットワーク上に流通,公開されている構造化文書の検索はますます重要になっている.現在の構造化文書検索は,選択条件および出力文書構造をXML 問合せ言語を用いて宣言的に指定する方法,もしくはWeb サーチエンジンにみられる情報検索技術による全文検索がほとんどである.前者は利用者があらかじめ検索対象とする文書の論理構造についての知識を必要とし,後者の検索単位は物理構造上の単位であるファイルに固定されている.そのため利用者が文書の論理構造を意識せずに問合せとの関連性の高い文書部分を取り出すことができない.本論文では,利用者の問合せとの関連性が高く,しかも論理構造上の単位となる文書部分の検索を「文脈検索」と呼び,(1)論理構造上の単位となる文書部分の特定,(2)文書内容を用いた利用者の問合せとの関連性の高い文書部分の抽出,を実現し,その有効性を検証する. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | The advent ofXML makes retrieving techniques ofstructured documents on the network more and more important.However,current retrieval methods are the use ofquery language by specifying selection conditions and output structures or the use of keywords of traditional Information Retrieval methods.For the former methods are required by users to know the document structures beforehand.The latter methods are required to retrieve a whole documents.Therefore users are not able to retrieve partial documents highly related to users’query without considering document structures.In this paper,we propose a new method in order to retrieve appropriate partial XML documents without having the knowledge ofdocuments ’ structures beforehand.We call this method “Context Search ”.The process of our context search consists oftwo steps:(1)identi fication ofpartial XML documents which are coherent and meaningful unit;and (2)evaluation of the relevance of the identi fied partial documents against queries.We describe our developed algorithms to identify result partial documents as an instantiation for context search methods,and we report our evaluation experiment to verify the effectiveness of our method. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AA11464847 | |||||||
| 書誌情報 |
情報処理学会論文誌データベース(TOD) 巻 43, 号 SIG02(TOD13), p. 80-93, 発行日 2002-03-15 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7799 | |||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||