@techreport{oai:ipsj.ixsq.nii.ac.jp:00096579, author = {吉永, 一美 and 徳久, 淳師 and 大野, 善之 and 亀山, 豊久 and 堀, 敦史 and 城地, 保昌 and 初井, 宇記 and 石川, 裕 and Kazumi, Yoshinaga and Atsushi, Tokuhisa and Yoshiyuki, Ohno and Toyohisa, Kameyama and Atsushi, Hori and Yasumasa, Joti and Takaki, Hatsui and Yutaka, Ishikawa}, issue = {25}, month = {Dec}, note = {データ間の相関係数を求めるための相関計算処理は,データクラスタリングにおいて必要となる処理である.本論文では,大量データに対する相関計算処理を,京を用いて高速に並列化する手法を提案する.提案手法では,各プロセス間のロードバランスを均等に保つとともに,ストレージからのデータ読み込み量を最低限に抑えることで読み込み時間の短縮を図り,高速な並列相関計算処理を実現する.提案手法を適用して実装したアプリケーションを用いた評価の結果,読み込み量を抑えることで実行時間を短縮できることを確認した., The correlation calculation is used in data clustering to compute correlation coefficient between two data sets. In this paper, we introduce a new parallelization method for the correlation calculation on the K computer. In order to realize effective parallelization, our proposed method keeps load balance between processes and reduces file input time by minimizing total size of the input from storage. Evaluation results show our method can reduce execution time by eliminating unnecessary file input from storage.}, title = {京での大量データの並列相関計算を支援するソフトウェアの提案}, year = {2013} }