WEKO3
アイテム
半構造データ統合のための木構造の近似照合と結合手法
https://ipsj.ixsq.nii.ac.jp/records/40190
https://ipsj.ixsq.nii.ac.jp/records/40190180f85b1-1457-468e-8cbb-22d05c4f8f03
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2005 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2005-05-19 | |||||||
タイトル | ||||||||
タイトル | 半構造データ統合のための木構造の近似照合と結合手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Approximate Tree Matching and Merging for Integrating Semistructured Data | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学 国際・産学共同研究センター | ||||||||
著者所属 | ||||||||
東京大学 先端科学技術研究センター | ||||||||
著者所属 | ||||||||
東京大学 先端科学技術研究センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Collaborative Research The University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research Center for Advanced Science and Technology University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research Center for Advanced Science and Technology University of Tokyo | ||||||||
著者名 |
久保山, 哲二
× 久保山, 哲二
|
|||||||
著者名(英) |
Tetsuji, KUBOYAMA
× Tetsuji, KUBOYAMA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | インターネット上の XML や HTML 文書等の半構造データの増大にともない、膨大な半構造データを効率よく比較・照合するための手法や、複数の半構造データを統合するための手法が求められている。これまでに半構造データのための様々な照合・結合手法が提案されているものの、一般的なフレームワークが存在しないため同様の手法が独立に繰り返し提案されることも少なくない。本稿では、2 つの半構造データを結合するための一般的かつ理論的なフレームワークを提供する。本手法では、まず、木の編集距離の概念を用いて2つの木の近似照合を行い、2つの木の間で類似しているノードの対応をとる。次に、対応のとれたノード同士を重ね合わせ、その他の全てのノードが、もとの木における階層構造を保つように新しい木を生成する。このような数理的なフレームワークによって、様々な照合・統合手法に統一的な観点を提供し、効率的な実装のための基礎を与える。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | With the rapid growth of semistructured data such as XML and HTML documents on the Internet, we need efficient methods for comparing, matching and integrating semistructured data. Although there have been diversity of these methods recently, no comprehensive framework has been available. In this paper, we formulate and provide a new framework for merging semistructured data. In this framework, we firstly find a set of node-to-node correspondences between two trees by approximate matching based on tree edit distance. Then, we merge two trees by overlaying these corresponding nodes, and locating the other nodes so that each ancestor relation in two trees is preserved. This mathematical framework gives a unifying view of matching and merging semistructured data, and is beneficial to efficient implementations. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10114171 | |||||||
書誌情報 |
情報処理学会研究報告情報学基礎(FI) 巻 2005, 号 42(2005-FI-079), p. 47-54, 発行日 2005-05-19 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |