ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング


インデックスリンク

インデックスツリー

  • RootNode

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(トランザクション)
  2. コンピューティングシステム(ACS)
  3. Vol.6
  4. No.4

フラグメント分子軌道法に現れるFock行列計算のGPGPU化

https://ipsj.ixsq.nii.ac.jp/records/95758
https://ipsj.ixsq.nii.ac.jp/records/95758
8de2ed76-60eb-48ff-99b5-505ec1e38351
名前 / ファイル ライセンス アクション
IPSJ-TACS0604005.pdf IPSJ-TACS0604005.pdf (1.1 MB)
Copyright (c) 2013 by the Information Processing Society of Japan
オープンアクセス
Item type Trans(1)
公開日 2013-10-30
タイトル
タイトル フラグメント分子軌道法に現れるFock行列計算のGPGPU化
タイトル
言語 en
タイトル Fock Matrix Preparation in Fragment Molecular Orbital Method with GPGPU
言語
言語 jpn
キーワード
主題Scheme Other
主題 [GPU応用] 分子軌道計算,フォック行列計算,GPGPU,CUDA,OpenFMO
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
筑波大学計算科学研究センター
著者所属
筑波大学計算科学研究センター
著者所属
筑波大学計算科学研究センター
著者所属
筑波大学計算科学研究センター
著者所属
九州大学大学院システム情報科学研究院
著者所属(英)
en
Center for Computational Sciences, University of Tsukuba
著者所属(英)
en
Center for Computational Sciences, University of Tsukuba
著者所属(英)
en
Center for Computational Sciences, University of Tsukuba
著者所属(英)
en
Center for Computational Sciences, University of Tsukuba
著者所属(英)
en
Faculty of Information Science and Electrical Engineering, Kyushu University
著者名 梅田, 宏明 塙, 敏博 庄司, 光男 朴, 泰祐 稲富, 雄一

× 梅田, 宏明 塙, 敏博 庄司, 光男 朴, 泰祐 稲富, 雄一

梅田, 宏明
塙, 敏博
庄司, 光男
朴, 泰祐
稲富, 雄一

Search repository
著者名(英) Hiroaki, Umeda Toshihiro, Hanawa Mitsuo, Shoji Taisuke, Boku Yuichi, Inadomi

× Hiroaki, Umeda Toshihiro, Hanawa Mitsuo, Shoji Taisuke, Boku Yuichi, Inadomi

en Hiroaki, Umeda
Toshihiro, Hanawa
Mitsuo, Shoji
Taisuke, Boku
Yuichi, Inadomi

Search repository
論文抄録
内容記述タイプ Other
内容記述 OpenFMOプログラムのFock行列計算についてCUDAによるGPGPU化を行った.コストの高いアトミック加算についてはこれを回避するFock行列計算手法を提案し実装した.さらにスクリーニング過程の分離や動的負荷分散の実現,基底関数のソートなど多くの高速化の技法を実装することにより1CPUコアに対し13倍から22倍程度の性能を実現した.より高速なFock行列計算を目指し,MPIを利用した複数GPUによる並列化についての実装も行った.16台のGPUを利用した計算で4CPUコアに比べ40倍程度の性能が得られた.
論文抄録(英)
内容記述タイプ Other
内容記述 GPU acceralated Fock matrix preparation routine in OpenFMO program has been implemented with CUDA. Atomic operation less algorithm was proposed and implemented for the Fock matrix preparation. Applying several speedup techniques, such as screening, dynamic load-balancing, and sorting basis functions, our program showed 13 to 22 times faster timing results against a CPU core. And also, the program has been parallelized with MPI to utilize multiple GPU cards. Parallelization benchmark was examined and reveals that 16 GPUs execution was 40 times faster than 4 CPU core execution.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AA11833852
書誌情報 情報処理学会論文誌コンピューティングシステム(ACS)

巻 6, 号 4, p. 26-37, 発行日 2013-10-30
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7829
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 13:36:23.048846
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

稲富, 雄一, 2013: 情報処理学会, 26–37 p.

Loading...

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3