Item type |
SIG Technical Reports(1) |
公開日 |
2017-10-31 |
タイトル |
|
|
タイトル |
階層アジャスタブルブロックを用いた自動マルチコア・ローカルメモリ管理とその性能評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Automatic Local Memory Management Using Hierarchical Adjustable Block for Multicores and Its Performance Evaluation |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
メモリ管理と並列化 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
早稲田大学理工学術院基幹理工学部情報理工学科 |
著者所属 |
|
|
|
早稲田大学理工学術院基幹理工学部情報理工学科 |
著者所属 |
|
|
|
早稲田大学理工学術院基幹理工学部情報理工学科 |
著者所属 |
|
|
|
早稲田大学理工学術院基幹理工学部情報理工学科/明治大学先端数理科学研究科 |
著者所属 |
|
|
|
早稲田大学理工学術院基幹理工学部情報理工学科 |
著者所属 |
|
|
|
早稲田大学理工学術院基幹理工学部情報理工学科 |
著者所属(英) |
|
|
|
en |
|
|
Waseda University Department of Computer Science and Engineering |
著者所属(英) |
|
|
|
en |
|
|
Waseda University Department of Computer Science and Engineering |
著者所属(英) |
|
|
|
en |
|
|
Waseda University Department of Computer Science and Engineering |
著者所属(英) |
|
|
|
en |
|
|
Waseda University Department of Computer Science and Engineering / Meiji University Graduate School of Advanced Mathematical Sciences |
著者所属(英) |
|
|
|
en |
|
|
Waseda University Department of Computer Science and Engineering |
著者所属(英) |
|
|
|
en |
|
|
Waseda University Department of Computer Science and Engineering |
著者名 |
白川, 智也
阿部, 佑人
大木, 吉健
吉田, 明正
木村, 啓二
笠原, 博徳
|
著者名(英) |
Tomoya, Shirakawa
Yuto, Abe
Yoshitake, Oki
Akimasa, Yoshida
Keiji, Kimura
Hironori, Kasahara
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
自動車におけるハードリアルタイム制御のようにデッドラインを確実に守らなければならないプログラムでは,キャッシュメモリの使用は困難であり,各コアがローカルメモリを持つマルチコアが利用されている.ローカルメモリは小容量であるため,その有効利用のためには配置するデータの選択,データ再利用のためのループ分割,ローカルメモリ上におけるデータの割り当て領域の決定,データ転送の挿入など複雑な管理が必要となり,これをプログラマが手動で管理することは極めて困難である.特に,ローカルメモリ管理対象となる配列はアプリケーションによってさまざまな次元やサイズを持つため,これらのデータをローカルメモリに割り当てる際には共有メモリとローカルメモリ間のデータ転送単位であるブロックサイズを適切に選び,ローカルメモリの効率的な利用が出来るようにする必要がある.そのため本稿ではコンパイラを用いた自動的なローカルメモリ管理,およびその中でもアプリケーションに応じてブロックサイズがソフトウェアコンパイル時に決定され,さらに各ブロックを整数分の 1 に分割して使用できる階層アジャスタブルブロックにローカルメモリを区切り割り当て領域を決定する手法を提案する.本手法の性能評価を 32 KB のローカルメモリを搭載した SH4A を 8 コア集積したマルチコアプロセッサ RP2 上で行ったところ,Nas Parallel Benchmarks のプログラム BT において共有メモリを用いた逐次実行に比べて 4PE 時に 5.76 倍の性能向上を得ることに成功した. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10096105 |
書誌情報 |
研究報告システム・アーキテクチャ(ARC)
巻 2017-ARC-228,
号 10,
p. 1-7,
発行日 2017-10-31
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8574 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |