WEKO3
-
RootNode
アイテム
FM-indexを用いた高速な配列相同性検索ツールの開発
https://ipsj.ixsq.nii.ac.jp/records/71508
https://ipsj.ixsq.nii.ac.jp/records/71508bd0d445f-ccfd-4c49-86a6-0ebb41681d0e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2010-12-09 | |||||||
タイトル | ||||||||
タイトル | FM-indexを用いた高速な配列相同性検索ツールの開発 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Development of a fast homology search tool based on FM-index | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京工業大学大学院情報理工学研究科計算工学専攻 | ||||||||
著者所属 | ||||||||
東京工業大学大学院情報理工学研究科計算工学専攻 | ||||||||
著者所属 | ||||||||
東京工業大学大学院情報理工学研究科計算工学専攻 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Engineering, Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Engineering, Tokyo Institute of Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Engineering, Tokyo Institute of Technology | ||||||||
著者名 |
鈴木, 脩司
石田, 貴士
秋山, 泰
× 鈴木, 脩司 石田, 貴士 秋山, 泰
|
|||||||
著者名(英) |
Shuji, Suzuki
Takashi, Ishida
Yutaka, Akiyama
× Shuji, Suzuki Takashi, Ishida Yutaka, Akiyama
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年,DNA 配列等の配列決定技術の向上により高速に配列データを得ることが可能となった.これにより DNA 配列及びタンパク質配列のデータベースのデータ量が爆発的に増加している.このため大量の配列データに対して巨大な DB への相同性検索を行う機会が多くなってきてる.しかし,大規模なデータを用いた相同性検索では,BLAST など従来のツールでは解析が間に合わないという問題がある.本研究では Suffix Array を用いてクエリのインデックスを,FM-index を用いて DB のインデックスを構築し,これらのインデックスを用いてミスマッチをある程度許して短い領域で高いスコアとなる部分を見つけ,その部分の周辺をアラインメントするアルゴリズムを提案した.その結果,従来用いられてきた BLAST 以上の精度を保ったまま,約 10 倍の高速化を達成した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In recent years, a lot of biological sequence data can be determined easily and the size of DNA/protein sequence databases is increasing explosively because of the improvement of sequencing technologies. However, such a huge sequence data causes a problem that even general homology search analyses by using BLAST become difficult in terms of the computation cost. Therefore, we designed a new homology search algorithm that finds alignment candidates based on the suffix array of queries and the FM-index of a database. As results, the proposed method achieved about 10-fold speed up than BLAST. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10505667 | |||||||
書誌情報 |
研究報告数理モデル化と問題解決(MPS) 巻 2010-MPS-81, 号 20, p. 1-6, 発行日 2010-12-09 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |