@techreport{oai:ipsj.ixsq.nii.ac.jp:00144539, author = {枝元, 正寛 and Tran, Thi Hong and 高前田, 伸也 and 中島, 康彦 and Tadahiro, Edamoto and Thi, Hong Tran and Shinya, Takamaeda and Yasuhiko, Nakashima}, issue = {6}, month = {Jul}, note = {データ移動に起因する消費電力の削減とメモリ帯域の活用を目的に,メインメモリの近くで演算を行うニアメモリ処理アーキテクチャが注目されている本論文では,ニアメモリ処理プロセッサのハードウェア構成およびソフトウェアモデルの検討のために,FPGA を用いたプロトタイピングシステムを開発し評価する.まず,ニアメモリ処理プロセッサの設計検証を加速するために,バスインターフェースを抽象化し,少ない HDL 記述で IP コアを自動生成する新しいフレームワークを開発した.次に,ARM プロセッサを搭載する FPGA 上に,初期検討として,MIPS ISA を持つインオーダコアとメモリシステム及び制御機構をニアメモリ処理プロセッサとして実装した.その上に,ニアメモリ処理プロセッサと汎用コアの連携を可能にする C ベースのプログラミングモデルおよびライブラリを実装した.小規模なアプリケーションを用いた評価の結果,提案するプロトタイピングシステムが FPGA 実機上で正しく動作することを確認したしかし,実験に用いたインオーダコアではメモリ帯域の活用と遅延の隠蔽が十分でないため,性能向上を達成できなかった.このことから,メモリ帯域を活用するためのメモリ密結合型 SIMD 機構や,メモリアクセス遅延を隠蔽するための演算とメモリアクセスのオーバーラッピング手法などが必要であることが明らかになった., The main bottleneck of microprocessors is the amount of available power budget per chip. Additionally, energy consumption for data movements will become much larger than the one for computing, by the further transistor scaling. High performance and power consumption is achieved by using cache memory in conventional processer system. However, in graph processing that is gaining attention for broad applicability has much size of data and irregular memory access patterns. It is hard to achieve good performance due not to utilize cache memory can ' t enclose much amount of data. There is a concept that Near Data Processing could overcome this problem to reduce energy for transferring data from main memory to processer. In this paper, we propose a near data processing architecture as a prototype, its implimentation method and high level abstracted programming model for this architecture.}, title = {ニアメモリ処理アーキテクチャのFPGAヘの実装と評価}, year = {2015} }