2024-03-29T10:37:02Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:001984172023-04-27T10:00:04Z01164:02735:09724:09864
機械学習を用いたホモロジーモデリングのための配列アラインメント生成手法の高速化Acceleration of machine learning-based sequence alignment generation for homology modelingjpnhttp://id.nii.ac.jp/1001/00198327/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=198417&item_no=1&attribute_id=1&file_no=1Copyright (c) 2019 by the Information Processing Society of Japan東京工業大学情報理工学院東京工業大学情報理工学院東京工業大学情報理工学院成井, 政人牧垣, 秀一朗石田, 貴士ホモロジーモデリングは高精度な予測が可能なタンパク質立体構造予測手法であるが,その予測精度はテンプレート構造との配列アラインメントに大きく影響される.我々は教師あり機械学習の手法の一つである k 最近傍法をもちいることでこの配列アラインメントを改良する手法を提案し既存手法より質の高いアラインメントを生成することに成功した.しかし,その手法では典型的な長さのタンパク質 1対の配列アラインメントに対して数万回の予測が必要となっており,その結果配列生成には数分から数十分の時間が必要となり,大規模な予測やデータベースへの検索などには不適となっていた.そこで本研究では配列アラインメントアルゴリズムと,予測アルゴリズムの改良を行い,配列アラインメント生成の高速化を試みた.その結果全体として約 21倍の高速化を達成した.Homology modeling is a protein structure prediction method and practically useful because the accuracy of generated models is often high if we can find a good template structure. The method constructs a structure model based on a template structure and a sequence alignment between a query protein sequence and a protein sequence of the template protein. Thus, the quality of the sequence alignment is crucial for the prediction. Recently, a novel method to improve the sequence alignment using supervised machine learning technique was proposed. The method showed better accuracy compared with previous methods but required huge computation. Because almost millions of machine learning predictions are needed for a sequence alignment generation of a pair of protein sequences. Thus, in this study, we proposed a novel method to accelerate the sequence generation by optimizing the algorithm and parameters of machine learning predictions. As results, proposed method was approximately 21-times faster than the original one in exchange of trivial decrease in accuracy.AN10505667研究報告数理モデル化と問題解決(MPS)2019-MPS-1244142019-07-222188-88332019-07-18