WEKO3
-
RootNode
アイテム
フラグメント分子軌道法に現れるFock行列計算のGPGPU化
https://ipsj.ixsq.nii.ac.jp/records/95758
https://ipsj.ixsq.nii.ac.jp/records/957588de2ed76-60eb-48ff-99b5-505ec1e38351
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Trans(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-10-30 | |||||||
タイトル | ||||||||
タイトル | フラグメント分子軌道法に現れるFock行列計算のGPGPU化 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Fock Matrix Preparation in Fragment Molecular Orbital Method with GPGPU | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | [GPU応用] 分子軌道計算,フォック行列計算,GPGPU,CUDA,OpenFMO | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
筑波大学計算科学研究センター | ||||||||
著者所属 | ||||||||
筑波大学計算科学研究センター | ||||||||
著者所属 | ||||||||
筑波大学計算科学研究センター | ||||||||
著者所属 | ||||||||
筑波大学計算科学研究センター | ||||||||
著者所属 | ||||||||
九州大学大学院システム情報科学研究院 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Computational Sciences, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Computational Sciences, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Computational Sciences, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Computational Sciences, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Information Science and Electrical Engineering, Kyushu University | ||||||||
著者名 |
梅田, 宏明
塙, 敏博
庄司, 光男
朴, 泰祐
稲富, 雄一
× 梅田, 宏明 塙, 敏博 庄司, 光男 朴, 泰祐 稲富, 雄一
|
|||||||
著者名(英) |
Hiroaki, Umeda
Toshihiro, Hanawa
Mitsuo, Shoji
Taisuke, Boku
Yuichi, Inadomi
× Hiroaki, Umeda Toshihiro, Hanawa Mitsuo, Shoji Taisuke, Boku Yuichi, Inadomi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | OpenFMOプログラムのFock行列計算についてCUDAによるGPGPU化を行った.コストの高いアトミック加算についてはこれを回避するFock行列計算手法を提案し実装した.さらにスクリーニング過程の分離や動的負荷分散の実現,基底関数のソートなど多くの高速化の技法を実装することにより1CPUコアに対し13倍から22倍程度の性能を実現した.より高速なFock行列計算を目指し,MPIを利用した複数GPUによる並列化についての実装も行った.16台のGPUを利用した計算で4CPUコアに比べ40倍程度の性能が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | GPU acceralated Fock matrix preparation routine in OpenFMO program has been implemented with CUDA. Atomic operation less algorithm was proposed and implemented for the Fock matrix preparation. Applying several speedup techniques, such as screening, dynamic load-balancing, and sorting basis functions, our program showed 13 to 22 times faster timing results against a CPU core. And also, the program has been parallelized with MPI to utilize multiple GPU cards. Parallelization benchmark was examined and reveals that 16 GPUs execution was 40 times faster than 4 CPU core execution. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11833852 | |||||||
書誌情報 |
情報処理学会論文誌コンピューティングシステム(ACS) 巻 6, 号 4, p. 26-37, 発行日 2013-10-30 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7829 | |||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |