@article{oai:ipsj.ixsq.nii.ac.jp:00176338, author = {高橋, 誉文 and 北上, 始 and 福本, 翔平 and 森, 康真 and 田村, 慶一 and Yoshifumi, Takahashi and Hajime, Kitakami and Syouhei, Fukumoto and Yasuma, Mori and Keiichi, Tamura}, issue = {3}, journal = {情報処理学会論文誌数理モデル化と応用(TOM)}, month = {Dec}, note = {アミノ酸配列データベースから類似部分配列を抽出することとして知られている従来のギブスサンプリング法の抽出精度を向上させるために,多重整列化に基づく新しい方法を提案する.従来のギブスサンプリング法の抽出精度は初期値に大きく左右される.この点に着目し,提案手法では,できるだけ良い初期値を計算するため,配列データセットに対して多重整列化を行い,ある幅のウインドウを多重整列上にスライドさせ,p値が最小となるウインドウ領域(類似部分配列)を初期値として選択する.多重整列化によって挿入されるギャップについては,ランダムに文字をあてはめる場合とすべての文字が等確率に現れる場合を比較する.また,ギブスサンプリングで利用される擬似度数に進化的な知識を導入し,抽出される類似部分配列としての配列モチーフ(進化的に保存される配列パターン)の抽出精度を向上させている., In order to improve the extraction accuracy of the existing, well-known Gibbs sampling method for extracting similar subsequences from amino acid sequence databases, we propose a new extraction method based on multiple sequence alignment in the sequence dataset. The extraction accuracy of the existing Gibbs sampling method is highly dependent on the initial solution selected randomly. In focusing on this point, the proposed method performs multiple sequence alignment for the sequence dataset to calculate the best possible initial solution. After that, we slide the aligned sequences on a window of a certain width and select the window region including the set of subsequences, where p-value is minimized, as the initial solution. In order to confirm the effectiveness of the proposed method, we carried out comparative experiments with random distribution and equal distribution. Moreover, we improve the accuracy of the existing Gibbs sampling method by using an amino acid substitution matrix as the knowledge of molecular evolution for pseudocount.}, pages = {32--43}, title = {ギブスサンプラに基づくアミノ酸配列モチーフの高精度抽出法}, volume = {9}, year = {2016} }