フラグメント分子軌道法に現れるFock行列計算のGPGPU化

梅田, 宏明; 塙, 敏博; 庄司, 光男; 朴, 泰祐; 稲富, 雄一; Hiroaki, Umeda; Toshihiro, Hanawa; Mitsuo, Shoji; Taisuke, Boku; Yuichi, Inadomi

WEKO3

インデックスツリー

RootNode

アイテム

フラグメント分子軌道法に現れるFock行列計算のGPGPU化

https://ipsj.ixsq.nii.ac.jp/records/95758

名前 / ファイル	ライセンス	アクション
IPSJ-TACS0604005.pdf (1.1 MB)	Copyright (c) 2013 by the Information Processing Society of Japan
オープンアクセス

Item type

Trans(1)

公開日

2013-10-30

タイトル

フラグメント分子軌道法に現れるFock行列計算のGPGPU化

タイトル

言語

タイトル

Fock Matrix Preparation in Fragment Molecular Orbital Method with GPGPU

言語

jpn

キーワード

主題Scheme

Other

主題

[GPU応用] 分子軌道計算，フォック行列計算，GPGPU，CUDA，OpenFMO

資源タイプ

資源タイプ識別子

http://purl.org/coar/resource_type/c_6501

資源タイプ

journal article

著者所属

筑波大学計算科学研究センター

著者所属

筑波大学計算科学研究センター

著者所属

筑波大学計算科学研究センター

著者所属

筑波大学計算科学研究センター

著者所属

九州大学大学院システム情報科学研究院

著者所属(英)

Center for Computational Sciences, University of Tsukuba

著者所属(英)

Center for Computational Sciences, University of Tsukuba

著者所属(英)

Center for Computational Sciences, University of Tsukuba

著者所属(英)

Center for Computational Sciences, University of Tsukuba

著者所属(英)

Faculty of Information Science and Electrical Engineering, Kyushu University

著者名

梅田, 宏明塙, 敏博庄司, 光男朴, 泰祐稲富, 雄一

著者名(英)

Hiroaki, Umeda Toshihiro, Hanawa Mitsuo, Shoji Taisuke, Boku Yuichi, Inadomi

論文抄録

内容記述タイプ

Other

内容記述

OpenFMOプログラムのFock行列計算についてCUDAによるGPGPU化を行った．コストの高いアトミック加算についてはこれを回避するFock行列計算手法を提案し実装した．さらにスクリーニング過程の分離や動的負荷分散の実現，基底関数のソートなど多くの高速化の技法を実装することにより1CPUコアに対し13倍から22倍程度の性能を実現した．より高速なFock行列計算を目指し，MPIを利用した複数GPUによる並列化についての実装も行った．16台のGPUを利用した計算で4CPUコアに比べ40倍程度の性能が得られた．

論文抄録(英)

内容記述タイプ

Other

内容記述

GPU acceralated Fock matrix preparation routine in OpenFMO program has been implemented with CUDA. Atomic operation less algorithm was proposed and implemented for the Fock matrix preparation. Applying several speedup techniques, such as screening, dynamic load-balancing, and sorting basis functions, our program showed 13 to 22 times faster timing results against a CPU core. And also, the program has been parallelized with MPI to utilize multiple GPU cards. Parallelization benchmark was examined and reveals that 16 GPUs execution was 40 times faster than 4 CPU core execution.

書誌レコードID

収録物識別子タイプ

NCID

収録物識別子

AA11833852

書誌情報

情報処理学会論文誌コンピューティングシステム（ACS）

巻 6, 号 4, p. 26-37, 発行日 2013-10-30

ISSN

収録物識別子タイプ

ISSN

収録物識別子

1882-7829

出版者

言語

出版者

情報処理学会

戻る

views

See details

	Views

Versions

Ver.1

2025-01-21 13:36:23.048846

Show All versions

Cite as

稲富, 雄一, 2013: 情報処理学会, 26–37 p.

エクスポート

OAI-PMH

JPCOAR
DublinCore
DDI

Other Formats

JSON
BIBTEX

インデックスリンク

インデックスツリー

アイテム

フラグメント分子軌道法に現れるFock行列計算のGPGPU化

× 梅田, 宏明塙, 敏博庄司, 光男朴, 泰祐稲富, 雄一

× Hiroaki, Umeda Toshihiro, Hanawa Mitsuo, Shoji Taisuke, Boku Yuichi, Inadomi

Versions

Share

Cite as

エクスポート

インデックスリンク

インデックスツリー

アイテム

フラグメント分子軌道法に現れるFock行列計算のGPGPU化

× 梅田, 宏明 塙, 敏博 庄司, 光男 朴, 泰祐 稲富, 雄一

× Hiroaki, Umeda Toshihiro, Hanawa Mitsuo, Shoji Taisuke, Boku Yuichi, Inadomi

Versions

Share

Cite as

エクスポート

× 梅田, 宏明塙, 敏博庄司, 光男朴, 泰祐稲富, 雄一