WEKO3
アイテム
不規則型応用を加速するメモリアクセラレータ - Exa FLOPSマシンの文脈から
https://ipsj.ixsq.nii.ac.jp/records/79279
https://ipsj.ixsq.nii.ac.jp/records/79279a9e2e9c3-951b-432a-8176-53e13ee8e548
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2011 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2011-11-21 | |||||||
タイトル | ||||||||
タイトル | 不規則型応用を加速するメモリアクセラレータ - Exa FLOPSマシンの文脈から | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Memory Accelerator for Irregular Applications - From the Context of Exa FLOPS Machine | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | メモリシステムとタスク配置 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
株式会社東芝 | ||||||||
著者所属 | ||||||||
東京農工大学 | ||||||||
著者所属 | ||||||||
東京農工大学 | ||||||||
著者所属 | ||||||||
奈良女子大学 | ||||||||
著者所属 | ||||||||
奈良女子大学 | ||||||||
著者所属 | ||||||||
奈良女子大学 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Toshiba corporation | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo University of Agriculture and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo University of Agriculture and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nara women's university | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nara women's university | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nara women's university | ||||||||
著者名 |
田邊, 昇
× 田邊, 昇
|
|||||||
著者名(英) |
Noboru, Tanabe
× Noboru, Tanabe
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Byte/FLOP を現在より下げざるを得ない Exa FLOPS 級マシンにおいて,国内では階層キャッシュが重要視されている.一方,不規則型応用は必要な Byte/FLOP が大きく,かつ,文科省の重点指定アプリの中でも大きな比率をしめており,日本の Exa FLOPS 級マシンの文脈において対応が重要である.本報告では Gather 機能を有するメモリシステムについて上記の文脈上で考察する。その判断材料として現状の GPU のキャッシュヒット率と,キャッシュを前段に併用した Gather 機能を有するメモリシステムについて疎行列ベクトル積の性能評価を行なった.その結果,キャッシュによる性能向上は限定的で,その容量の 10 倍程度のベクトルサイズまでで頭打ちとなった.不規則型応用に対して再利用性に高速化原理をおくキャッシュに頼りきることは危険であり,Gather 機構が重要であることが確認された. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In Japan, hierarchical cache is currently given high priority for memory system of Exa FLOPS machine whose Byte/FLOP ratio must be smaller than current supercomputers. On the other hand, irregular applications require higher Byte/FLOP ratio. Since these occupy a large part of MEXT-selection of focused applications, supporting irregular applications is important in the context of Japanese Exa FLOPS machine. In this report, a memory system with gather functions is reconsidered in the context of Exa FLOPS machine. We explored hit ratio of a current GPU's cache and performance of memory system with gather function and its preliminary stage cache for sparse matrix vector multiplication. As a result, performance gain by the additional cache is limited and disappeared for vector with about 10times higher size than the cache capacity. It is confirmed that the importance of gather function for irregular applications is higher than that of cache whose acceleration principle is based on reusability. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10096105 | |||||||
書誌情報 |
研究報告計算機アーキテクチャ(ARC) 巻 2011-ARC-197, 号 14, p. 1-8, 発行日 2011-11-21 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |