Item type |
SIG Technical Reports(1) |
公開日 |
2018-06-06 |
タイトル |
|
|
タイトル |
深層学習を用いたタンパク質予測立体構造モデルの評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Model quality assessment for protein tertiary structure prediction model using deep learning |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
BIO一般セッション |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
東京工業大学情報理工学院情報工学系 |
著者所属 |
|
|
|
東京工業大学情報理工学院情報工学系 |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer Science, School of Computing, Tokyo Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer Science, School of Computing, Tokyo Institute of Technology |
著者名 |
佐藤, 倫
石田, 貴士
|
著者名(英) |
Rin, Sato
Takashi, Ishida
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
タンパク質の立体構造はタンパク質の機能に大きく関わり,創薬等の生命科学において重要な情報となる.実験的に立体構造を決定するのは時間的 ・ 金銭的にコストがかかるため,計算機を用いて立体構造を予測する手法が多く開発されてきた.一方で立体構造予測のためには予測立体構造の評価手法 (Model Quality Assessment Program,MQAP) が必要となる.MQAP の多くは単一,または複数の天然構造らしさを表す統計ポテンシャル関数や明示的に作られた特徴量を用いて機械学習を行うものである.統計ポテンシャル関数はこれまで数多く考案されてきた.既存の統計ポテンシャル関数の多くは原子対,残基対などでの相互作用を考慮したものであった.これらは二体間の相互作用であるため 3 次元構造を捉えることができていなかった.一方,3 次元畳み込みニューラルネットワーク (3D Convolutional Neural Network,3DCNN) は従来動作認識,物体認識に用いられてきたが,近年ではタンパク質立体構造データの解析に用いられ,成功を収めている.これらの点を踏まえ本研究では 3DCNN を用いて多体間での相互作用を考慮した MQAP を考案する.そのためにタンパク質の局所環境を定義し,その定義された環境の特徴量を 3DCNN の入力とし 2 値分類を行い,その学習済みモデルを用いてタンパク質全体の天然らしさのスコアを出力する.この手法を用いて天然構造とそれを模して作られた人工のモデルのプールであるデコイセットを評価した結果,既存手法と同等,もしくはそれ以上の数の天然構造を認識することに成功した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The three-dimensional structure of a protein is related to its function, and it is important information in life science application such as drug discovery. Determination of the three-dimensional structure is costly in terms of time and money, thus many methods for predicting three-dimensional structure using a computer have been developed but the accuracy is still insufficient. Thus, evaluation of predicted model quality is required and such methods are called model quality assessment program (MQAP). Most of MQAPs use machine learning and statistical potential functions expressing single or plural natural structure likelihoods and explicitly created feature quantities. Numerous statistical potential functions have been devised so far. Many of the existing statistical potential functions consider interactions in atom pairs, residue pairs, and the like. Since these are interactions between two bodies, it was not possible to capture whole three-dimensional structure information. 3D convolutional neural network (3DCNN) has been used for conventional motion recognition and object recognition, but in recent years it has been used successfully for analysis of protein three-dimensional structure data. Based on these points, in this research, we devise an MQAP that considers interaction among multiple bodies using 3DCNN. For that purpose, the local environment of the protein is defined, binary classification is performed with the feature amount of the defined environment as input of 3DCNN, and the score of the naturalness of the whole protein is output using the learned model. As a result of evaluating a decoy set which is a pool of native structures and artificial models, we succeeded in recognizing the same number of native structures as the existing method or more. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12055912 |
書誌情報 |
研究報告バイオ情報学(BIO)
巻 2018-BIO-54,
号 40,
p. 1-7,
発行日 2018-06-06
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8590 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |