@techreport{oai:ipsj.ixsq.nii.ac.jp:00062722, author = {小池邦昭 and 藤野健 and 福重俊幸 and 台坂博 and 菅原豊 and 稲葉真理 and 平木敬 and 牧野淳一郎}, issue = {26}, month = {Jul}, note = {超並列準汎用計算機 GRAPE-DR は 1 チップに 512 個の演算要素を搭載した SIMD アクセラレータを PC に接続し,これを並列に接続したクラスタシステムである.これは従来の重力多体問題専用計算機 GRAPE の発展形として使用できるように構想されたものであるが,アクセラレータ部分が専用ハードウェアパイプラインではなくプログラム可能な演算器を搭載することでより広い応用が可能であることが大きな特徴である.本論文ではアクセラレータ部で動作する重力相互作用計算と行列積計算ルーチンを実装し,1 ノードでの性能評価をおこなった.現在それぞれのライブラリについて最適化を行っている.現状では重力相互作用計算では 362.6 GFlops (N = 262144),行列積計算では 635.1GFlops (M = N = 32768,K = 2048) の演算性能となった.これを用いて High Performance LINPACK (HPL) の加速を行い,演算性能値は 284.3 GFlops (N = 34816,NB = 2048) となった., The multi purpose computer GRAPE-DR is a cluster of PCs computer with the custom-made SIMD accelerator. It was designed as a for the successor of the special purpose computers for N-body simulation, “GRAPE” systems. The GRAPE-DR chip consists of 512 simplified processor cores. It can be used for wider applications than the range of applications of previous GRAPE systems. We implemented libraries for gravitational N-body simulations and matrixmatrix multiplications(DGEMM) on the GRAPE-DR system, we report the performance of these libraries as of the end of June 2009. we evaluated performances of these libraries on a single PC with a GRAPE-DR accelerator card. The mesared performance was 362.6GFlops(N = 262144) for the gravitational N-body simulations. and it has achieved and 635.1GFlops for the matrix-matrix multiplications(M = N = 32768, K = 2048). The performance of LU-decompositions was 284.3GFlops on High Performance LINPACK (N = 34816, NB = 2048).}, title = {超並列準汎用計算機GRAPE-DRによる重力多体問題シミュレーションおよびLU分解}, year = {2009} }