@techreport{oai:ipsj.ixsq.nii.ac.jp:00080922, author = {中浜, 徹也 and 山田, 昌弘 and 吉見, 真聡 and 天野, 英晴 and Tetsuya, Nakahama and Masahiro, Yamada and Masato, Yoshimi and Hideharu, Amano}, issue = {30}, month = {Feb}, note = {近年,並列計算機環境におけるプログラマビリティに関する研究が注目されている.特に,アクセラレータを用いた中小規模の安価なクラスタにおいては,アクセラレータ固有のプログラミングやノード間のネットワークプログラミングなど複数の並列プログラミングが階層化され問題となっている。そこで,本論文では,中小規模のCell Broadband Engine(Cell/B.E.) クラスタをターゲットとして,単体の Cell/B.E. 上で動作するプログラムをネットワークプログラミングなしにクラスタ向けに自動で拡張するツールを提案する.このツールは Cell API に呼び出し手順が存在することに着目し,directive を自動的に挿入し,さらにノード間通信用 MPI 関数を追加する.ツールの評価結果として,ソースコード量の比較を行い,最大 26% のソースコードを自動的に生成できることを確認した.また,ツールが生成したソースコードと Hand-tuning によるソースコードとの性能比較も行い,結果として,モンテカルロシミュレーションにおいて,16 ノードの時に Hand-tuning の 76% の性能を得た.一方,ベクトル内積と Linear Regression においては,性能差 3% 以内でほぼ Hand-tuning と比較して遜色ない性能を得ることができた., The productivity of parallel programming has become a serious problem with the rapid advance of multi-core and many-core processors. Especially, for an economical small or middle scale clusters using accelerators, a programmer must describe accelerator specific APIs to manipulate an accelerator and network programming such as using MPI library. This often becomes an oppressive burden for programmers. Considering them, we propose a novel tool that extends a single node application on a heterogeneous accelerator Cell/B.E. to one for clustered environment with Cell/B.E.. This tool automatically inserts directives, and then converts input source code to one for cluster environment. In the evaluation about source code amount, at most 26% source code is generated by our tool. Besides, we evaluated the performance comparison between a source code generated of our tool and one generated by a programmer. As a result, our tool achieved 76% performance compared with hand-tuned code in Monte-Carlo simulation. On the other hand, in Vector multiplication and Linear Regression, our tool achieved the performance within 3% difference compared with hand-tuned code.}, title = {Cell/B.E.クラスタにおけるMPI自動拡張ツールの実装と評価}, year = {2012} }