ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 数理モデル化と問題解決(MPS)
  3. 2023
  4. 2023-MPS-143

データセット分割改良によるリガンド結合親和性予測のデータバイアスの削減

https://ipsj.ixsq.nii.ac.jp/records/226497
https://ipsj.ixsq.nii.ac.jp/records/226497
684bcaf8-4eee-40d8-b603-758140f5f003
名前 / ファイル ライセンス アクション
IPSJ-MPS23143029.pdf IPSJ-MPS23143029.pdf (3.0 MB)
Copyright (c) 2023 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2023-06-22
タイトル
タイトル データセット分割改良によるリガンド結合親和性予測のデータバイアスの削減
タイトル
言語 en
タイトル Reducing data bias in ligand binding affinity prediction by improving dataset partitioning
言語
言語 jpn
キーワード
主題Scheme Other
主題 バイオ情報学1
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
東京工業大学情報理工学院情報工学系
著者所属
東京工業大学情報理工学院情報工学系
著者所属(英)
en
Department of Computer Science, School of Computing, Tokyo Institute of Technology
著者所属(英)
en
Department of Computer Science, School of Computing, Tokyo Institute of Technology
著者名 山崎, 希

× 山崎, 希

山崎, 希

Search repository
石田, 貴士

× 石田, 貴士

石田, 貴士

Search repository
論文抄録
内容記述タイプ Other
内容記述 タンパク質リガンド複合体の結合親和性予測は創薬において重要な役割を果たす.近年では 3 次元畳み込みニューラルネットワークやグラフニューラルネットワークを利用した深層学習モデルが開発されており,その多くが既知の立体構造と結合親和性を学習に用いている.しかし,このようなデータセットでは類似したリガンドは類似した結合親和性を持つバイアスがあるため,単純なランダム分割により訓練セットとテストセットを分けるとリガンドの構造のみから結合親和性を予測することができてしまうという問題が存在している.これは,タンパク質の構造についても同じことが言える.そこで,本研究ではタンパク質の配列とリガンドの記述子を用いてクラスタリングを行い,このようなバイアスを削減するデータ分割手法を提案した.さらに,提案された分割手法を用いてモデルの学習・予測を行い,データ分割の評価を行った.その結果,提案された分割手法ではリガンド構造のみからの予測はランダムな分割に比べ予測精度が大きく低下し,既存の予測モデルの予測精度がリガンドのバイアスに大きく依存することが示唆された.
論文抄録(英)
内容記述タイプ Other
内容記述 Binding affinity prediction of protein-ligand complexes plays an important role in drug discovery. Recently, deep learning models using 3D convolutional neural networks and graph neural networks have been developed. Many of them use known 3D structures and their binding affinities for training their models. However, in such datasets, there is a bias that similar ligands tend to have similar binding affinities. Therefore, when a simple random data partitioning is used, the binding affinity can be predicted from the ligand structure alone. The same can be said for protein structures. In this study, we proposed a data partitioning method that reduces such bias by performing clustering using protein sequences and ligand descriptors. Furthermore, we evaluated the proposed data partitioning method by training and predicting models using the proposed data partitioning. The results show that the prediction accuracy of the proposed partitioning method based on ligand structure alone is much lower than that of random partitioning, suggesting that the prediction accuracy of existing prediction models is highly dependent on the ligand bias.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10505667
書誌情報 研究報告数理モデル化と問題解決(MPS)

巻 2023-MPS-143, 号 29, p. 1-7, 発行日 2023-06-22
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8833
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 12:27:29.580114
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3