Item type |
SIG Technical Reports(1) |
公開日 |
2018-03-02 |
タイトル |
|
|
タイトル |
Short <i>k</i>-merデータベースを用いた<i>k</i>-merカウント処理についての検討 |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
宇都宮大学 |
著者所属 |
|
|
|
宇都宮大学 |
著者所属 |
|
|
|
宇都宮大学 |
著者所属 |
|
|
|
宇都宮大学 |
著者所属(英) |
|
|
|
en |
|
|
Utsunomiya University |
著者所属(英) |
|
|
|
en |
|
|
Utsunomiya University |
著者所属(英) |
|
|
|
en |
|
|
Utsunomiya University |
著者所属(英) |
|
|
|
en |
|
|
Utsunomiya University |
著者名 |
加治原, 翔太
外山, 史
森, 博志
東海林, 健二
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
大規模ゲノムの解読は,生命システムの解明だけでなく,医療科学,薬学,農学などの多様な応用が考えられ,様々な種を対象にゲノム解読の研究が行われている.ゲノム解読はシーケンサから得られたデータを元に行われるが,近年,次世代シーケンサの登場によりシーケンシングのコストパフォーマンスは飛躍的に向上し,短時間で大量のデータを生成できるようになった.次世代シーケンサは対象の塩基配列の短い断片 (リード) を大量に出力するため,それを正しく並べ替えて元の塩基配列の決定するためのアルゴリズムが必要になる.そのようなアルゴリズムは de novo アセンブリアルゴリズムと呼ばれ,様々な手法が提案されている.特に Velvet は消費メモリや計算時間などについてパフォーマンスに優れており,コンティグの精度も比較的高いため,最も普及しているアセンブリ手法の一つとなっている.しかし,リードの総量が数十 Gbp (bp :塩基対) を越える大規模なデータのアセンブリを行う場合,Velvet を用いても実行時に要求されるメモリが非常に膨大になってしまいメモリ不足となってしまう.この問題を解決する手法として,遠藤らによる消費メモリの少ない de novo アセンブリアルゴリズムがある.遠藤らの手法は,1 つの k-mer に対するデータ量を小さくすることで最大メモリ使用量を大幅に削減した手法である.k-mer とは,リード内に含まれる k 文字の塩基配列を指す.一方,遠藤らの de novo アセンブリにおいて k-mer カウント処理が最もメモリを使用する.そこで,本研究では k-mer カウント処理に焦点を当てて遠藤らの手法を改良する.実験では,ヒト 14 番染色体から得られたリードに対して,本手法と遠藤らの手法及び DSK との比較を行った. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12055912 |
書誌情報 |
研究報告バイオ情報学(BIO)
巻 2018-BIO-53,
号 3,
p. 1-4,
発行日 2018-03-02
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8590 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |