<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-03-17T09:50:43Z</responseDate>
  <request metadataPrefix="oai_dc" verb="GetRecord" identifier="oai:ipsj.ixsq.nii.ac.jp:00174142">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00174142</identifier>
        <datestamp>2025-01-20T07:01:27Z</datestamp>
        <setSpec>1164:2240:8543:8882</setSpec>
      </header>
      <metadata>
        <oai_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
          <dc:title>PGAS向け低水準通信レイヤーのマルチスレッド実装</dc:title>
          <dc:title>Multithreaded Implementation of Low-Level Communication Layer for PGAS Systems</dc:title>
          <dc:creator>遠藤, 亘</dc:creator>
          <dc:creator>田浦, 健次朗</dc:creator>
          <dc:creator>Wataru, Endo</dc:creator>
          <dc:creator>Kenjiro, Taura</dc:creator>
          <dc:subject>並列言語</dc:subject>
          <dc:description>低水準通信レイヤー (Low-Level Communication Layer) は，分散メモリ型計算機におけるインターコネクトの API を抽象化するレイヤーであり，PGAS やタスクスケジューラといった高水準システムを移植可能な形で開発するのに必要とされる．低水準通信レイヤーの実装は高水準システムの性能を大きく左右するため，そのチューニングはシステム全体の高速化に不可欠である．しかし，既存の低水準通信レイヤーには問題点が多く，最新のハードウェア機能に対応できておらず，マルチコア向けのチューニングも充分でないものが多い．本報告では，インターコネクトの API に近い形で低水準通信レイヤーの API を再定義してオーバーヘッド削減を図るとともに，それに基づいた実装として特に Tofu インターコネクト向け実装を例に説明する．具体的には，マルチスレッド対応やオーバーヘッド削減のための実装手法について紹介し，マイクロベンチマークによる評価結果を報告する．</dc:description>
          <dc:description>A low-level communication layer (LLCL) is an abstraction layer of interconnect APIs on distributed memory systems, which is required to develop portable high-level systems such as PGAS systemsand task schedulers. Because the implementation of an LLCL heavily affects the performance of high-levelsystems, optimizing the LLCL is important to speed up the whole system. However, existing LLCLs havesome issues including lacks of latest hardware features and optimization for multi-core environments. Thispaper tries to redefine a hardware-aware API for LLCLs to reduce the overhead and implement it especiallyfor the Tofu interconnect. In particular, we show the methods to optimize LLCLs for multi-threading andreduce its overhead, and we also report the microbenchmark results of our implementation.</dc:description>
          <dc:description>technical report</dc:description>
          <dc:publisher>情報処理学会</dc:publisher>
          <dc:date>2016-08-01</dc:date>
          <dc:format>application/pdf</dc:format>
          <dc:identifier>研究報告ハイパフォーマンスコンピューティング（HPC）</dc:identifier>
          <dc:identifier>28</dc:identifier>
          <dc:identifier>2016-HPC-155</dc:identifier>
          <dc:identifier>1</dc:identifier>
          <dc:identifier>11</dc:identifier>
          <dc:identifier>2188-8841</dc:identifier>
          <dc:identifier>AN10463942</dc:identifier>
          <dc:identifier>https://ipsj.ixsq.nii.ac.jp/record/174142/files/IPSJ-HPC16155028.pdf</dc:identifier>
          <dc:language>jpn</dc:language>
        </oai_dc:dc>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
