<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-05-19T14:05:24Z</responseDate>
  <request verb="GetRecord" metadataPrefix="jpcoar_1.0" identifier="oai:ipsj.ixsq.nii.ac.jp:00227139">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00227139</identifier>
        <datestamp>2025-01-19T12:15:49Z</datestamp>
        <setSpec>1164:2240:11176:11310</setSpec>
      </header>
      <metadata>
        <jpcoar:jpcoar xmlns:datacite="https://schema.datacite.org/meta/kernel-4/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:dcndl="http://ndl.go.jp/dcndl/terms/" xmlns:dcterms="http://purl.org/dc/terms/" xmlns:jpcoar="https://github.com/JPCOAR/schema/blob/master/1.0/" xmlns:oaire="http://namespace.openaire.eu/schema/oaire/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rioxxterms="http://www.rioxx.net/schema/v2.0/rioxxterms/" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns="https://github.com/JPCOAR/schema/blob/master/1.0/" xsi:schemaLocation="https://github.com/JPCOAR/schema/blob/master/1.0/jpcoar_scm.xsd">
          <dc:title>NVIDIA H100 PCIeおよびAMD MI210における&lt;i&gt;N&lt;/i&gt;体計算コードの性能評価</dc:title>
          <jpcoar:creator>
            <jpcoar:creatorName>三木, 洋平</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:creator>
            <jpcoar:creatorName>塙, 敏博</jpcoar:creatorName>
          </jpcoar:creator>
          <jpcoar:subject subjectScheme="Other">アクセラレータ</jpcoar:subject>
          <datacite:description descriptionType="Other">GPU は CPU に比べて高い電力性能を実現できるため，GPU を搭載したスーパーコンピュータの導入事例が増えてきている．新しい世代の GPU が発表される度に演算性能・電力性能の向上および新機能の追加がなされており，実アプリケーションを用いての継続的かつ詳細な性能評価が重要である．本研究では NVIDIA H100 PCIe および AMD MI210 向けに直接法に基づく N 体計算コードを実装・最適化し，性能評価を行った．NVIDIA H100 PCIe 上での単位時間あたりの相互作用計算数は，NVIDIA A100 の 2.04 倍にあたる 1.37×1012s-1 であった．得られた性能向上率は両 GPU の単精度浮動小数点演算の理論ピーク性能比 2.63 よりも小さいが，Streaming Multiprocessor の構成変更が最大の要因であり，N 体計算においては理論ピーク比相当の高速化は実現不可能である．AMD MI210 においては，CDNA 2 において新たに導入された packed FP32 命令を用いた高速化によって，AMD MI100 の 1.42 倍にあたる 9.49×1011s-1 が得られた．Packed FP32 命令の利用による性能向上は 1.33 倍であり，サイクル数ベースの見積もりから期待される 5/3 倍には及ばず，供給電力不足による動作周波数低下だけでは説明できない．各 GPU の消費電力あたりの性能値は，NVIDIA H100 PCIe が NVIDIA A100 の 1.56 倍の 4.11×109W-1，AMD MI210 は AMD 100 の 1.47 倍の 3.46×109W-1 であった．</datacite:description>
          <dc:publisher xml:lang="ja">情報処理学会</dc:publisher>
          <datacite:date dateType="Issued">2023-07-27</datacite:date>
          <dc:language>jpn</dc:language>
          <dc:type rdf:resource="http://purl.org/coar/resource_type/c_18gh">technical report</dc:type>
          <jpcoar:identifier identifierType="URI">https://ipsj.ixsq.nii.ac.jp/records/227139</jpcoar:identifier>
          <jpcoar:sourceIdentifier identifierType="ISSN">2188-8841</jpcoar:sourceIdentifier>
          <jpcoar:sourceIdentifier identifierType="NCID">AN10463942</jpcoar:sourceIdentifier>
          <jpcoar:sourceTitle>研究報告ハイパフォーマンスコンピューティング（HPC）</jpcoar:sourceTitle>
          <jpcoar:volume>2023-HPC-190</jpcoar:volume>
          <jpcoar:issue>28</jpcoar:issue>
          <jpcoar:pageStart>1</jpcoar:pageStart>
          <jpcoar:pageEnd>13</jpcoar:pageEnd>
          <jpcoar:file>
            <jpcoar:URI label="IPSJ-HPC23190028.pdf">https://ipsj.ixsq.nii.ac.jp/record/227139/files/IPSJ-HPC23190028.pdf</jpcoar:URI>
            <jpcoar:mimeType>application/pdf</jpcoar:mimeType>
            <jpcoar:extent>5.4 MB</jpcoar:extent>
            <datacite:date dateType="Available">2025-07-27</datacite:date>
          </jpcoar:file>
        </jpcoar:jpcoar>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
