Item type |
SIG Technical Reports(1) |
公開日 |
2024-11-27 |
タイトル |
|
|
タイトル |
High-Dimensional Neural Networkモデルによる汎用的な粗視化AI力場の構築 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Development of a Generalized Coarse-Grained AI Force Field using a High-Dimensional Neural Network |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
富士通株式会社 |
著者所属 |
|
|
|
国立研究開発法人理化学研究所 |
著者所属 |
|
|
|
国立研究開発法人理化学研究所 |
著者所属 |
|
|
|
京都大学/国立研究開発法人理化学研究所 |
著者所属(英) |
|
|
|
en |
|
|
Fujitsu Limited |
著者所属(英) |
|
|
|
en |
|
|
Fujitsu Limited |
著者所属(英) |
|
|
|
en |
|
|
Fujitsu Limited |
著者所属(英) |
|
|
|
en |
|
|
Fujitsu Limited |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Center for Computational Science |
著者所属(英) |
|
|
|
en |
|
|
RIKEN Center for Computational Science |
著者所属(英) |
|
|
|
en |
|
|
Kyoto University / RIKEN Center for Computational Science |
著者名 |
山田, 芙夕楓
大山, 洋介
長坂, 侑亮
奥野, 伸吾
金田, 亮
徳久, 淳師
奥野, 恭史
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
高精度なエネルギー予測はタンパク質ダイナミクスの解明に不可欠であり,機械学習を用いた AI 力場の開発が注目されている.しかしながら,既存の AI 力場ではタンパク質の種類ごとに個別の学習データとモデルが必要となり,汎化性能に関する課題が存在する.本研究では,新規タンパク質の全原子エネルギー予測可能な汎用的な粗視化 AI 力場を開発した.複数種のタンパク質の大規模構造データと単一の高次元ニューラルネットワークを用いて学習を行う手法を提案した.またメモリ容量制限を超えるデータセットに対応可能な新規データ読み出し方法を提案した.結果,AlphaFold ShortMD データセットにおいては相関係数(R値)0.82,Enhanced MD Sampling データセットにおいては R 値 0.74 という高い予測精度を実現した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Accurate energy prediction is crucial for understanding protein dynamics, leading to significant interest in the development of machine-learning based AI force fields. However, existing AI force fields require individual training data and models for each protein type, resulting in challenges regarding generalization performance. This study presents a generalized coarse-grained AI force field capable of predicting all-atom energies of novel proteins. We propose a training method using a large-scale structural dataset of multiple protein types and a single high-dimensional neural network. Furthermore, a novel data reading method is proposed to handle datasets exceeding memory capacity limitations. The resulting model achieved high prediction accuracy, with correlation coefficients (R-values) of 0.82 and 0.74 for the AlphaFold ShortMD and Enhanced MD Sampling datasets, respectively. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12055912 |
書誌情報 |
研究報告バイオ情報学(BIO)
巻 2024-BIO-80,
号 14,
p. 1-9,
発行日 2024-11-27
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8590 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |