WEKO3
-
RootNode
アイテム
大規模なXML類似検索のためのMapReduceによる並列化手法の提案
https://ipsj.ixsq.nii.ac.jp/records/111097
https://ipsj.ixsq.nii.ac.jp/records/11109753262b44-b4fa-4e81-8993-c513dda293b1
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | National Convention(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2013-03-06 | |||||||||||
タイトル | ||||||||||||
タイトル | 大規模なXML類似検索のためのMapReduceによる並列化手法の提案 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | データベースとメディア | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||||
資源タイプ | conference paper | |||||||||||
著者所属 | ||||||||||||
東工大 | ||||||||||||
著者所属 | ||||||||||||
東工大 | ||||||||||||
著者所属 | ||||||||||||
東工大 | ||||||||||||
著者名 |
TuanDatVu
× TuanDatVu
× 渡辺陽介
× 横田治夫
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 最近、企業や組織においてOffice Open XML, XHTMLなどで記述されたXMLファイルが多く利用され、複数のXMLファイルの中から類似したXMLファイルを取り出すことが重要になっている。既存の高速の類似度計算アルゴリズムLAXがあるが、それでも膨大なデータに対して処理時間がかかる。そこで本稿では、大量のXMLファイルに対応するため、MapReduceフレームワークを用いてLAXを並列化する。LAXではXMLの部分木に含まれる同じ値を持つリーフノードのカウントによって文書の類似度を判定する。そのため、提案手法ではXMLのリーフノードのデータをkey、そのkeyを含む部分木をvalueとし、MapReduceによって部分木を集計し、並列化を行う。また、実際のXMLファイルを利用して提案手法を評価する。 | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN00349328 | |||||||||||
書誌情報 |
第75回全国大会講演論文集 巻 2013, 号 1, p. 553-554, 発行日 2013-03-06 |
|||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |
Share
Cite as
TuanDatVu, 渡辺陽介, 横田治夫, 2013, 大規模なXML類似検索のためのMapReduceによる並列化手法の提案: 情報処理学会, 553–554 p.
Loading...