@techreport{oai:ipsj.ixsq.nii.ac.jp:00113246,
 author = {竹本, 拓未 and 和田, 康孝 and 近藤, 正章 and 本多, 弘樹},
 issue = {16},
 month = {Feb},
 note = {CPU や GPU のような異なった種類の演算デバイスを混在させたヘテロジニアス構成のシステムにおいては,GPU のハードウェアアーキテクチャの特性,および実行させるプログラムの特性を把握する必要がある.その上で,GPU に割り当てる実行スレッド数や,GPU のマルチプロセッサあたりに割り当てる実行スレッド数といった様々なパラメータの値のチューニングを行わなければ,高い計算性能は得られない.さらに,異なる種類の GPU が搭載されている複数のコンピュータノードがネットワークなどを介して接続されたマルチノードなヘテロジニアス構成のシステムの場合には,それぞれの GPU に割り当てる処理の分割方法やネットワークの速度といった要素が新たに増えるため,チューニングコストが上昇してしまうと予想される.そこで本稿では,ヘテロジニアスコンピューティングのための標準フレームワークである OpenCL を対象に,GPU に割り当てるスレッド数などのワークサイズを決定する方法を提案し,評価した.},
 title = {ヘテロジニアスGPUコンピューティングのためのワークサイズ自動調整手法の提案},
 year = {2015}
}