<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-04-16T18:36:39Z</responseDate>
  <request verb="GetRecord" metadataPrefix="oai_dc" identifier="oai:ipsj.ixsq.nii.ac.jp:00233495">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00233495</identifier>
        <datestamp>2025-01-19T10:04:40Z</datestamp>
        <setSpec>1164:2822:11469:11529</setSpec>
      </header>
      <metadata>
        <oai_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
          <dc:title>RISC-Vプロセッサのためのベクトル拡張と同時マルチスレッディングの融合</dc:title>
          <dc:title>Integration of Vector Extension and Simultaneous Multithreading for a RISC-V Processor</dc:title>
          <dc:creator>田中, 秀太朗</dc:creator>
          <dc:creator>高田, 勝悟</dc:creator>
          <dc:creator>中條, 拓伯</dc:creator>
          <dc:creator>Hidetaro, Tanaka</dc:creator>
          <dc:creator>Shogo, Takata</dc:creator>
          <dc:creator>Hironori, Nakajo</dc:creator>
          <dc:subject>プロセッサ・アーキテクチャ</dc:subject>
          <dc:description>ベクトルアーキテクチャでは命令列のチェイニングにより並列実行が可能だが，単一の命令流ではベクトル機能ユニットの使用率が低下する場合がある．ここに同時マルチスレッディング（SMT）を導入することにより，ベクトル機能ユニットの使用率を向上させ，近年需要が高まる AI アプリケーション等のデータレベル並列性の高いプログラムの高速化が見込まれる．本稿では，本研究室で 2022 年度に実装された RISC-V SMT プロセッサである B4SMT にベクトルアーキテクチャを追加することにより，ベクトル拡張と SMT を融合する B4SMT-V の実装および評価を行った．行列乗算プログラムによってクロックサイクル数で比較した結果として，シングルスレッド動作と比較し SMT では約 53.8% にクロックサイクル数を削減することができた．また，ベクトルレジスタファイルの合計サイズが共通のもので比較した場合，SMT を用いることにより約 73.7% に削減することができた．</dc:description>
          <dc:description>In vector architectures, the potential for parallel execution lies in the chaining of instruction sequences. However, a singular instruction ﬂow may lead to underutilization of vector functional units. The integration of Simultaneous Multithreading (SMT) presents an opportunity to enhance the eﬃciency of vector functional units, thereby expediting programs with high data-level parallelism, notably evident in AI applications, which have experienced higher demand recently. This study introduces B4SMT-V, a RISC-V Processor that integrates vector extension with SMT. Speciﬁcally, it extends the vector architecture onto B4SMT, a RISC-V SMT processor previously developed in 2022 in our laboratory. On matrix multiplication programs, SMT demonstrates a reduction in clock cycles approximately 53.8%, when compared with single thread execution. In addition, when compared with the same total size of vector register ﬁles, the use of SMT reduced the clock cycles to approximately 73.7%.</dc:description>
          <dc:description>technical report</dc:description>
          <dc:publisher>情報処理学会</dc:publisher>
          <dc:date>2024-03-14</dc:date>
          <dc:format>application/pdf</dc:format>
          <dc:identifier>研究報告組込みシステム（EMB）</dc:identifier>
          <dc:identifier>18</dc:identifier>
          <dc:identifier>2024-EMB-65</dc:identifier>
          <dc:identifier>1</dc:identifier>
          <dc:identifier>6</dc:identifier>
          <dc:identifier>2188-868X</dc:identifier>
          <dc:identifier>AA12149313</dc:identifier>
          <dc:identifier>https://ipsj.ixsq.nii.ac.jp/record/233495/files/IPSJ-EMB24065018.pdf</dc:identifier>
          <dc:language>jpn</dc:language>
        </oai_dc:dc>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
