| Item type |
SIG Technical Reports(1) |
| 公開日 |
2019-02-26 |
| タイトル |
|
|
タイトル |
凸多面体モデルを利用したループ分割機能の実装 |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
最適化 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
| 著者所属 |
|
|
|
株式会社富士通研究所 |
| 著者所属 |
|
|
|
株式会社富士通研究所 |
| 著者所属 |
|
|
|
株式会社富士通研究所 |
| 著者所属 |
|
|
|
株式会社富士通研究所 |
| 著者所属(英) |
|
|
|
en |
|
|
FUJITSU LABORATORIES LTD. |
| 著者所属(英) |
|
|
|
en |
|
|
FUJITSU LABORATORIES LTD. |
| 著者所属(英) |
|
|
|
en |
|
|
FUJITSU LABORATORIES LTD. |
| 著者所属(英) |
|
|
|
en |
|
|
FUJITSU LABORATORIES LTD. |
| 著者名 |
津金, 佳祐
一場, 利幸
新井, 正樹
田原, 司睦
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
計算機環境が多様化する中でアプリケーションの開発者は,環境に合わせたプログラムの最適化を求められる.最適化には様々な手法があるが,その多くはプログラムの変更を伴い,計算機環境の特性を理解した上での実装が求められるため,プログラムの変更コストは高いと言える.そこで,凸 多面体モデルによるプログラムの自動最適化を実行可能な Polly が注目されている.Polly はプログラム中のループを自動検出し最適化するが,計算機環境の特性に合わせた自動最適化には不十分な点が多い.我々は HPC166 にて,Polly の最適化機能の中でループ分割に着目し,任意のループ分割粒度を指定可能なコンパイルオプションの提案とその実装に関する報告を行った.本稿では,分割アルゴリズムの改善と計算機環境の情報を用いた自動的なループ分割粒度を設定する実装とその評価を行う.計算機環境の情報として,ハードウェアプリフェッチを実行するために用いられるメモリフェッチストリームの数を考慮する.実装した Polly を PolyBench と NAS Parallel Benchmarks (NPB) に適用して,ARM プロセッサ上で性能評価を行う.併せて,既存の GCC や Clang /LLVM と性能比較を行うことで,メモリフェッチストリーム数を考慮した自動的なループ分割粒度の設定による性能向上を調査した.既存コンパイラと比較して提案実装により,最大で 30% の性能向上を確認した. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN10463942 |
| 書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC)
巻 2019-HPC-168,
号 16,
p. 1-6,
発行日 2019-02-26
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8841 |
| Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |