@techreport{oai:ipsj.ixsq.nii.ac.jp:00092656, author = {鈴木, 脩司 and 石田, 貴士 and 秋山, 泰 and Shuji, Suzuki and Takashi, Ishida and Yutaka, Akiyama}, issue = {14}, month = {Jun}, note = {メタゲノム解析では DNA 配列をアミノ酸配列に変換して相同性検索を行うが、次世代シークエンサの登場によって得られるようになった大量の DNA 断片配列の処理に多くの時間がかかるようになっている。このため、我々はあらかじめデータベースを部分文字列に分割して、類似度が高い部分文字列をまとめておき、まずその代表点に対して検索を行うことで効率よく検索する手法を開発した。, In metagenome analysis, DNA sequences are transformed into amino acid sequences before homology search. However, next generation sequencers became to produce larger data than previous sequencers. And then it takes more time to analyze data from next generation sequencers. Thus, we have made clusters of subsequences from database before homology search and search queries from the representations in clusters to search efficiently.}, title = {データベースの部分文字列クラスタリングによるアミノ酸配列相同性検索の高速化}, year = {2013} }