2024-03-29T13:36:19Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000700122023-04-27T10:00:04Z01164:01165:06144:06145
MapReduceを用いた木構造データのための並列分析処理フレームワークParallel Data Analysis Framework for Tree-structured Data using MapReducejpn大規模データの効率的アクセスhttp://id.nii.ac.jp/1001/00070012/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=70012&item_no=1&attribute_id=1&file_no=1Copyright (c) 2010 by the Information Processing Society of Japan日立製作所中央研究所日立製作所中央研究所日立製作所中央研究所柳井, 孝介小林, 義行森本, 康嗣本稿では,木構造データを分析処理するためのフレームワークを提案する.提案するフレームワークでは,垂直分割データ格納方式により木構造データを管理する.即ち,木構造データを属性ごとに分割し,別々のファイルにデータを保存する.これにより属性の数が多い木構造データを扱うことが可能となる.また大規模のデータに対し分析処理を実行可能とするため,MapReduce アーキテクチャに基づく並列処理を行う.評価実験により,属性の追加や属性値の集計のような典型的な分析処理に対して,提案するフレームワークが有用であることを示す.We propose a parallel data analysis framework for tree-structured data. Our framework implements vertical partitioning, in which tree-structured data is stored in separated files corresponding to each attribute. Handling a large number of attributes becomes feasible by means of vertical partitioning. Additionally, our framework adopts MapReduce architecture for parallel computing in order to process large-scale data. We show our framework is efficient to process typical data analysis, such as appending new attributes and calculating statistics of attributes.AN10112482研究報告データベースシステム(DBS)2010-DBS-1509162010-07-282010-07-22