@techreport{oai:ipsj.ixsq.nii.ac.jp:00222654, author = {定方, 翼 and 沼波, 政倫 and 片桐, 孝洋 and 大島, 聡史 and 永井, 亨}, issue = {11}, month = {Nov}, note = {本稿では,クラスタリング手法の 1 つである x-means 法を MPI と OpenMP を利用してハイブリッド並列化し,その性能評価について報告する.x-means 法は,k-means 法をベイズ情報量規準に従って妥当な回数繰り返すことで,クラスタリング対象のデータセットに対して適切なクラスタ数を推定するアルゴリズムである.そのため,k-means 法を複数回計算する必要があり,データセットのサイズや次元数,収束までの分割数に応じて実行時間が増加する.そこで,本研究では x-means 法をハイブリッド並列化し,OpenMP ディレクティブの挿入箇所,通信方式,ノード数,プロセス数,スレッド数を変化させた時の実行時間や並列化効率について評価を行った.その結果,1 ノード,1 プロセス,48 スレッドのハイブリッド実行に対して,128 ノード,1 ノードあたり 24 プロセス,2 スレッドのハイブリッド実行は約 170 倍高速であった.また,32 ノード以下のときはピュア MPI 実行が高速であり,64 ノード以上ではハイブリッド MPI-OpenMP 実行が高速になることを確認した., In this paper, we propose a hybrid parallelization of the x-means, one of the clustering methods, using MPI and OpenMP. In addition, its performance evaluation is reported. x-means clustering is an algorithm that estimates the appropriate number of clusters for a dataset to be clustered by repeating the k-means clustering a suitable number of times according to Bayesian information criterion. Therefore, we evaluated the execution time and parallelization efficiency by changing the insertion point of OpenMP directives, communication method, number of nodes, number of processes, and number of threads, using a hybrid parallelization of the x-means clustering. As a result, the hybrid execution with 128 nodes, 24 processes and 2 threads per node was about 170 times faster than the hybrid execution with 1 node, 1 process and 48 threads per node. We also confirmed that pure MPI execution is faster when the number of nodes is 32 or less, and hybrid MPI-OpenMP execution is faster when the number of nodes is 64 or more.}, title = {x-means法のハイブリッドMPI-OpenMP並列による性能評価}, year = {2022} }