{"metadata":{"_oai":{"id":"oai:ipsj.ixsq.nii.ac.jp:00226907","sets":["1164:2735:11166:11308"]},"path":["11308"],"owner":"44499","recid":"226907","title":["スーパーコンピュータTSUBAME3.0におけるAlphaFoldのデータベースの保存方法の変更とHHblitsの最適化による性能向上"],"pubdate":{"attribute_name":"公開日","attribute_value":"2023-07-17"},"_buckets":{"deposit":"6b0af3ab-af81-47b6-af19-686271957e2b"},"_deposit":{"id":"226907","pid":{"type":"depid","value":"226907","revision_id":0},"owners":[44499],"status":"published","created_by":44499},"item_title":"スーパーコンピュータTSUBAME3.0におけるAlphaFoldのデータベースの保存方法の変更とHHblitsの最適化による性能向上","author_link":["603390","603391","603392","603389"],"item_titles":{"attribute_name":"タイトル","attribute_value_mlt":[{"subitem_title":"スーパーコンピュータTSUBAME3.0におけるAlphaFoldのデータベースの保存方法の変更とHHblitsの最適化による性能向上"}]},"item_type_id":"4","publish_date":"2023-07-17","item_4_text_3":{"attribute_name":"著者所属","attribute_value_mlt":[{"subitem_text_value":"東京工業大学情報理工学院"},{"subitem_text_value":"東京工業大学学術国際情報センター"},{"subitem_text_value":"東京工業大学学術国際情報センター/東京工業大学情報理工学院"},{"subitem_text_value":"東京工業大学情報理工学院"}]},"item_4_text_4":{"attribute_name":"著者所属(英)","attribute_value_mlt":[{"subitem_text_value":"School of Computing, Tokyo Institute of Technology","subitem_text_language":"en"},{"subitem_text_value":"Global Scientific Information and Computing Center, Tokyo Institute of Technology","subitem_text_language":"en"},{"subitem_text_value":"Global Scientific Information and Computing Center, Tokyo Institute of Technology / School of Computing, Tokyo Institute of Technology","subitem_text_language":"en"},{"subitem_text_value":"School of Computing, Tokyo Institute of Technology","subitem_text_language":"en"}]},"item_language":{"attribute_name":"言語","attribute_value_mlt":[{"subitem_language":"jpn"}]},"item_publisher":{"attribute_name":"出版者","attribute_value_mlt":[{"subitem_publisher":"情報処理学会","subitem_publisher_language":"ja"}]},"publish_status":"0","weko_shared_id":-1,"item_file_price":{"attribute_name":"Billing file","attribute_type":"file","attribute_value_mlt":[{"url":{"url":"https://ipsj.ixsq.nii.ac.jp/record/226907/files/IPSJ-MPS23144003.pdf","label":"IPSJ-MPS23144003.pdf"},"date":[{"dateType":"Available","dateValue":"2025-07-17"}],"format":"application/pdf","billing":["billing_file"],"filename":"IPSJ-MPS23144003.pdf","filesize":[{"value":"2.9 MB"}],"mimetype":"application/pdf","priceinfo":[{"tax":["include_tax"],"price":"660","billingrole":"5"},{"tax":["include_tax"],"price":"330","billingrole":"6"},{"tax":["include_tax"],"price":"0","billingrole":"17"},{"tax":["include_tax"],"price":"0","billingrole":"44"}],"accessrole":"open_date","version_id":"ce321342-ce0c-444a-a2d3-2bd5aa4a297d","displaytype":"detail","licensetype":"license_note","license_note":"Copyright (c) 2023 by the Information Processing Society of Japan"}]},"item_4_creator_5":{"attribute_name":"著者名","attribute_type":"creator","attribute_value_mlt":[{"creatorNames":[{"creatorName":"藤田, 隼斗"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"野村, 哲弘"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"遠藤, 敏夫"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"関嶋, 政和"}],"nameIdentifiers":[{}]}]},"item_4_source_id_9":{"attribute_name":"書誌レコードID","attribute_value_mlt":[{"subitem_source_identifier":"AN10505667","subitem_source_identifier_type":"NCID"}]},"item_4_textarea_12":{"attribute_name":"Notice","attribute_value_mlt":[{"subitem_textarea_value":"SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc."}]},"item_resource_type":{"attribute_name":"資源タイプ","attribute_value_mlt":[{"resourceuri":"http://purl.org/coar/resource_type/c_18gh","resourcetype":"technical report"}]},"item_4_source_id_11":{"attribute_name":"ISSN","attribute_value_mlt":[{"subitem_source_identifier":"2188-8833","subitem_source_identifier_type":"ISSN"}]},"item_4_description_7":{"attribute_name":"論文抄録","attribute_value_mlt":[{"subitem_description":"タンパク質は生命活動に不可欠な生体高分子である.私たちの体内における活動の多くはタンパク質によって担われており,タンパク質の立体構造はその役割に深く関係している.そのため,タンパク質の立体構造の理解はタンパク質の機能の理解に役立ち,人体の働きを理解する基礎となる.ただし既知のタンパク質のアミノ酸配列に対して,実験的に立体構造が決定されているタンパク質は多いとは言えない.これらのギャップを埋めるために計算機によるアプローチが必要であり,そのアプローチの 1 つとして開発されたのが AlphaFold である.AlphaFold は一定の相同性を持つ複数のアミノ酸配列をなるべく一致するように並べたマルチシーケンスアラインメント (MSA) を活用し,タンパク質の立体構造に関する知識を深層学習アルゴリズムの設計に取り入れた機械学習アプローチである.第 14 回タンパク質構造予測精密評価 (CASP14) にて他の手法を大きく上回る結果を残した.AlphaFold は hhblits 等の既存のツールを使い,BFD などの巨大な遺伝子データベースから MSA を取得している.しかし,そのうちの 1 つの hhblits の実行に多大な時間がかかるという問題がある.この実行時間の一番の要因は I/O にあり,遺伝子データベースをどういったストレージに保管するかによって実行時間が大きく異なってくる.実際に TSUBAME3.0 の高速ストレージ領域にデフォルトの設定で保管した場合と Stripe 設定をして保管した場合とで実行時間が大きく異なっている.そこで,本研究では TSUBAME3.0 上で選択できる遺伝子データベースの保管方法を何通りか試し,実行時間を計測した.さらに,ボトルネックとなっている hhblits に対してプロファイリングを行い,その結果から並列化数のチューニングやデータベースの保存方法の変更,ソートの最適化を行った.また,AlphaFold の MSA 取得ツール間のデータ依存関係からツール実行を非同期に行うようにした.その結果,TSUBAME3.0 上で単一のアミノ酸配列から立体構造を予測する際の実行時間を平均して 2 分の 1 に短縮することに成功した.","subitem_description_type":"Other"}]},"item_4_biblio_info_10":{"attribute_name":"書誌情報","attribute_value_mlt":[{"bibliographicPageEnd":"8","bibliographic_titles":[{"bibliographic_title":"研究報告数理モデル化と問題解決(MPS)"}],"bibliographicPageStart":"1","bibliographicIssueDates":{"bibliographicIssueDate":"2023-07-17","bibliographicIssueDateType":"Issued"},"bibliographicIssueNumber":"3","bibliographicVolumeNumber":"2023-MPS-144"}]},"relation_version_is_last":true,"weko_creator_id":"44499"},"id":226907,"updated":"2025-01-19T12:20:39.104669+00:00","links":{},"created":"2025-01-19T01:26:13.722729+00:00"}