<?xml version='1.0' encoding='UTF-8'?>
<OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-05-12T07:10:25Z</responseDate>
  <request metadataPrefix="oai_dc" verb="GetRecord" identifier="oai:ipsj.ixsq.nii.ac.jp:00061057">https://ipsj.ixsq.nii.ac.jp/oai</request>
  <GetRecord>
    <record>
      <header>
        <identifier>oai:ipsj.ixsq.nii.ac.jp:00061057</identifier>
        <datestamp>2025-01-21T22:16:51Z</datestamp>
        <setSpec>1164:1579:5607:5608</setSpec>
      </header>
      <metadata>
        <oai_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
          <dc:title>マルチコアのためのコンパイラにおけるローカルメモリ管理手法</dc:title>
          <dc:title>Local Memory Management Scheme by a Compiler for Multicore Processor</dc:title>
          <dc:creator>桃園, 拓</dc:creator>
          <dc:creator>中野, 啓史</dc:creator>
          <dc:creator>間瀬, 正啓</dc:creator>
          <dc:creator>木村, 啓二</dc:creator>
          <dc:creator>笠原, 博徳</dc:creator>
          <dc:creator>Taku, Momozono</dc:creator>
          <dc:creator>Hirofumi, Nakano</dc:creator>
          <dc:creator>Masayoshi, Mase</dc:creator>
          <dc:creator>Keiji, Kimura</dc:creator>
          <dc:creator>Hironori, Kasahara</dc:creator>
          <dc:description>従来容量制限のあるローカルメモリ利用の最適化はプログラマにより手動で行われており，これは長時間を要する非常に困難な作業であったそこで，本稿ではマルチコア上で，プロセッサに近接した高速小容量のローカルメモリを自動並列化コンパイラにより自動的に有効活用する手法を提案する．本手法では，データローカリティと並列性を考慮してループ整合分割とタスクスケジューリングを行った後，スケジューリング結果を利用してローカルメモリ上のデータを長時間に渡り再利用できるようにデータ配置， DMA コントローラを用いたリプレースを行う．本自動ローカルメモリ管理手法の性能評価を， 32KB のローカルデータメモリと 64KB の分散共有メモリを搭載した SH４A を 8 コア集積した情報家電用マルチコアである RP2上で行ったところ，逐次実行に比べ， 8PE 時に MPEG2 エンコーダで約 6.20 倍， AAC エンコーダで約 7.25倍 ， MiBench susan で約 7.64 倍の速度向上を自動で得ることに成功した．</dc:description>
          <dc:description>This paper proposes a local memory management scheme for an automatic parallelizing compiler to realize effective use of a limited size of local memory. After the loop aligned decomposition and task scheduling considering data locality and parallelism, the compiler allocates data to the local memory effectively using the task scheduling result. This paper evaluates the proposed scheme on RP2 multicore for consumer electronics which has 8 SH4A processor cores. Each core integrates 32KB of local data memory and 64KB of distributed shared memory. As the results, the proposed scheme using 8 processors gives us about 6.20 times speedup for MPEG2 encoding program, 7.25 times speedup for AAC encoding program and 7.64 times speedup for susan against the sequential execution.</dc:description>
          <dc:description>technical report</dc:description>
          <dc:publisher>情報処理学会</dc:publisher>
          <dc:date>2009-01-06</dc:date>
          <dc:format>application/pdf</dc:format>
          <dc:identifier>研究報告計算機アーキテクチャ（ARC）</dc:identifier>
          <dc:identifier>1(2009-ARC-181)</dc:identifier>
          <dc:identifier>2009</dc:identifier>
          <dc:identifier>69</dc:identifier>
          <dc:identifier>74</dc:identifier>
          <dc:identifier>AN10096105</dc:identifier>
          <dc:identifier>https://ipsj.ixsq.nii.ac.jp/record/61057/files/IPSJ-ARC09181013.pdf</dc:identifier>
          <dc:language>jpn</dc:language>
        </oai_dc:dc>
      </metadata>
    </record>
  </GetRecord>
</OAI-PMH>
