WEKO3
アイテム
遺伝的アルゴリズムを用いた自動並列化トランスレータの提案
https://ipsj.ixsq.nii.ac.jp/records/71451
https://ipsj.ixsq.nii.ac.jp/records/714512d474801-d02b-4602-8a2c-25eb1a3f14bb
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2010 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2010-12-09 | |||||||
| タイトル | ||||||||
| タイトル | 遺伝的アルゴリズムを用いた自動並列化トランスレータの提案 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Proposal of the Automatic Parallelize Translator using Genetic Algorithm | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 並列化方式 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 同志社大学大学院工学研究科 | ||||||||
| 著者所属 | ||||||||
| 同志社大学理工学部 | ||||||||
| 著者所属 | ||||||||
| 同志社大学生命医科学部 | ||||||||
| 著者所属 | ||||||||
| 同志社大学理工学部 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Graduate School of Engineering, Doshisha University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Faculty of Science and Engineering, Doshisha University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Faculty of life and medical sciences, Doshisha University | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Faculty of Science and Engineering, Doshisha University | ||||||||
| 著者名 |
戸松, 祐太
吉見, 真聡
廣安, 知之
三木, 光範
× 戸松, 祐太 吉見, 真聡 廣安, 知之 三木, 光範
|
|||||||
| 著者名(英) |
Yuta, Tomatsu
Masato, Yoshimi
Tomoyuki, Hiroyasu
Mitsunori, Miki
× Yuta, Tomatsu Masato, Yoshimi Tomoyuki, Hiroyasu Mitsunori, Miki
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | ソフトウェア実装に際して,アルゴリズムから抜き出した高い並列性を持つ領域を,GPU などの専用ハードウェアで処理する方法がよく行われるようになってきている.本研究報告では,困難を伴う並列化領域の抽出と判断に対応し,GPU を用いたプログラム実行の高速化を図る手法を提案する.本手法では,プログラム中で GPU に割り当てる処理を遺伝的アルゴリズムに基づいて最適化し,実行時間の短縮を図る.本研究報告では,様々なループ文で構成した自作テストプログラムとベンチマークプログラムを対象とした評価から,実装したトランスレータの定量的な検討を行う. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | In developing software on GPU, it is important to find codes including parallelism, and execute these codes on GPU. We propose the translator which accelerates general C-code used GPU partially by ptimizing computing time circulating searching code regions which should be executed on GPU.We evaluated the translator by applying a test program which has variant loop-structures and a benchmark.From this result, This paper discusses tuning technique for the translator based on quantitative performance derived. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN10096105 | |||||||
| 書誌情報 |
研究報告計算機アーキテクチャ(ARC) 巻 2010-ARC-192, 号 9, p. 1-6, 発行日 2010-12-09 |
|||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||