<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-03-15T11:53:03Z</responseDate>
  <request metadataPrefix="oai_dc" verb="GetRecord" identifier="oai:ipsj.ixsq.nii.ac.jp:00178003">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00178003</identifier>
        <datestamp>2025-01-20T05:19:33Z</datestamp>
        <setSpec>1164:1579:9047:9118</setSpec>
      </header>
      <metadata>
        <oai_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
          <dc:title>ホールスラスタ・シミュレーションにおける割付処理のAltera SDK for OpenCLを用いた高速化</dc:title>
          <dc:creator>野田, 裕之</dc:creator>
          <dc:creator>酒井, 諒太郎</dc:creator>
          <dc:creator>宮島, 敬明</dc:creator>
          <dc:creator>藤田, 直行</dc:creator>
          <dc:creator>天野, 英晴</dc:creator>
          <dc:subject>ツール及びFPGA応用</dc:subject>
          <dc:description>Full Particle-In-Cell (Full-PIC) 法は，電気推進エンジンの一種であるホールスラスタの研究開発で用いられる数値シミュレーション手法である．Full-PIC 法は，イオン ・ 中性子 ・ 電子の全てを粒子として扱うため，粒子を流体モデルに近似させる他の手法と比べ高精度であるが，計算コストが高いことが知られている．宇宙航空研究開発機構 (JAXA) が研究開発を進めるホールスラスタ用シミュレーション ・ コード (NSRU-Full-PIC) は，Full-PIC 法を用いており，処理に膨大な時間を要することが問題である．NSRU-Full-PIC において，特に計算負荷の高い処理は割付処理である．割付処理は，粒子の情報をセル四隅へ割り付ける処理であり，Read After Write (RAW) ハザードを引き起こすために並列化を阻害する要因となる．本研究では，Altera 社のミッドレンジ SoC FPGA であるArria 10 SoC を複数用いたホールスラスタ ・ シミュレーション用マルチ FPGA クラスタ構築の第一段階として，Altera 社が提供する FPGA 向け Open CL ベース高位合成環境である Altera SDK for OpenCL を用いて，NSRU-Full-PICにおいて特に高負荷である割付処理を Arria 10 SoC にオフロードし高速化を検討する．本実装では，RAW ハザードを回避しつつ効率のよい処理を行うため，粒子がもつ情報をセル単位でリダクションの形でまとめてセル四隅へ割り付ける．オフロード結果を CPU での実行結果と比較したところ，ARM Cortex-A91.5GHz と比較して最大で約 11.4 倍の高速化を達成し，Xeon E5-2667 0 2.9GHz と比較して最大で約 2.1 倍の高速化を達成した．</dc:description>
          <dc:description>technical report</dc:description>
          <dc:publisher>情報処理学会</dc:publisher>
          <dc:date>2017-03-02</dc:date>
          <dc:format>application/pdf</dc:format>
          <dc:identifier>研究報告システム・アーキテクチャ（ARC）</dc:identifier>
          <dc:identifier>64</dc:identifier>
          <dc:identifier>2017-ARC-225</dc:identifier>
          <dc:identifier>1</dc:identifier>
          <dc:identifier>6</dc:identifier>
          <dc:identifier>2188-8574</dc:identifier>
          <dc:identifier>AN10096105</dc:identifier>
          <dc:identifier>https://ipsj.ixsq.nii.ac.jp/record/178003/files/IPSJ-ARC17225064.pdf</dc:identifier>
          <dc:language>jpn</dc:language>
        </oai_dc:dc>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
