@article{oai:ipsj.ixsq.nii.ac.jp:00107507,
 author = {老川, 稔 and 野村, 昴太郎 and 泰岡, 顕治 and 成見, 哲 and Minoru, Oikawa and Kentaro, Nomura and Kenji, Yasuoka and Tetsu, Narumi},
 issue = {4},
 journal = {情報処理学会論文誌コンピューティングシステム(ACS)},
 month = {Dec},
 note = {CUDA C/C++言語で記述された,シングルノード向けレプリカ交換分子動力学シミュレーションのソースコードにGPU仮想化ソフトウェアを適用し,マルチノード上のGPUに対応した計算並列化を行った.レプリカ交換法は,分子/原子の最安定状態を効率的に求めるために用いられるシミュレーション手法の1つである.計算の粒度が大きく,計算ノード間の通信が少ないという特徴から,分散計算機環境での並列化に向く.本研究では,GPU仮想化ソフトウェアの機能を利用することで,シングルノード向けのソースコードを改変することなくマルチノード用に再利用した.最大1,024台のGPUを使用して計算速度の並列化効率を計測し,1,024並列時において効率87%の良好な結果を得た.また,効率を低下させる要因について定量的に解析し,特に多並列時においてノード間通信のレイテンシが支配的になることが分かった., We parallelized a molecular dynamics simulation software using single-node GPUs to support multi-node GPUs by applying GPU virtualization tool to CUDA C/C++ program. To obtain the global minimum state of molecules efficiently, we used replica-exchange method, which is suitable for parallel computation since it has large granularity and small communication between nodes. The GPU virtualization software enabled us to use a single-node program to support multi-node calculation without any modification. Parallel efficiency with up to 1,024 GPUs are measured and 87% of efficiency was obtained even with 1,024 GPUs. The main reason of losing efficiency for higher parallelism was quantitatively analyzed and we found it mostly the latency between nodes.},
 pages = {1--14},
 title = {1,024GPUを使用したレプリカ交換分子動力学シミュレーションの並列化},
 volume = {7},
 year = {2014}
}