@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00111097, author = {TuanDatVu and 渡辺陽介 and 横田治夫}, book = {第75回全国大会講演論文集}, issue = {1}, month = {Mar}, note = {最近、企業や組織においてOffice Open XML, XHTMLなどで記述されたXMLファイルが多く利用され、複数のXMLファイルの中から類似したXMLファイルを取り出すことが重要になっている。既存の高速の類似度計算アルゴリズムLAXがあるが、それでも膨大なデータに対して処理時間がかかる。そこで本稿では、大量のXMLファイルに対応するため、MapReduceフレームワークを用いてLAXを並列化する。LAXではXMLの部分木に含まれる同じ値を持つリーフノードのカウントによって文書の類似度を判定する。そのため、提案手法ではXMLのリーフノードのデータをkey、そのkeyを含む部分木をvalueとし、MapReduceによって部分木を集計し、並列化を行う。また、実際のXMLファイルを利用して提案手法を評価する。}, pages = {553--554}, publisher = {情報処理学会}, title = {大規模なXML類似検索のためのMapReduceによる並列化手法の提案}, volume = {2013}, year = {2013} }