| Item type |
SIG Technical Reports(1) |
| 公開日 |
2018-03-02 |
| タイトル |
|
|
タイトル |
<i>de novo</i>アセンブリアルゴリズムにおける<i>k</i>-merカウント処理に用いるハッシュ法の検討 |
| 言語 |
|
|
言語 |
jpn |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
宇都宮大学 |
| 著者所属 |
|
|
|
宇都宮大学 |
| 著者所属 |
|
|
|
宇都宮大学 |
| 著者所属 |
|
|
|
宇都宮大学 |
| 著者所属(英) |
|
|
|
en |
|
|
Utsunomiya University |
| 著者所属(英) |
|
|
|
en |
|
|
Utsunomiya University |
| 著者所属(英) |
|
|
|
en |
|
|
Utsunomiya University |
| 著者所属(英) |
|
|
|
en |
|
|
Utsunomiya University |
| 著者名 |
清川, 綾乃
外山, 史
森, 博志
東海林, 健二
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
生物の大規模ゲノム,遺伝情報全体を解読することは,生物科学の分野だけではなく,医学,薬学において重要とされている.ゲノムを解読するためには DNA の断片をシーケンサーと呼ばれる DNA 分子の構造を決める機械に読み込ませ,DNA の断片をつなぎ合わせて元の長い DNA の塩基配列を作る必要がある.その際に既存の DNA の塩基配列を使わずに未知の塩基配列として再構成する方法として de novo アセンブリアルゴリズムがある.de novo アセンブリアルゴリズムには SOAPdenovo,Velvet,ABySS などがあり,これらは読み込ませる DNA の断片が膨大な大規模ゲノムのアセンブリではメモリ不足になる可能性がある.膨大なメモリを必要とする問題を解決するために,遠藤らのメモリ効率の良いアセンブリアルゴリズムがある.de novo アセンブリアルゴリズムでは,DNA の断片を k-mer と呼ばれる k 文字のパターンに分解し,読み込んだファイル中にそれぞれの k-mer がどれくらい存在するか数え上げる処理がある.これを k-mer カウント処理と呼び,多大な計算時間とメモリが必要となる.本研究では,遠藤らのアセンブリアルゴリズムで使用するハッシュテーブルを Cuckoo Hashing から他のハッシュテーブルを適用し,消費メモリ量および,計算時間の改善を行った. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12055912 |
| 書誌情報 |
研究報告バイオ情報学(BIO)
巻 2018-BIO-53,
号 4,
p. 1-5,
発行日 2018-03-02
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8590 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |