@techreport{oai:ipsj.ixsq.nii.ac.jp:00067393,
 author = {國武, 勇次 and 久村, 孝寛 and 安浦, 寛人 and Yuji, Kunitake and Takahiro, Kumura and Hiroto, Yasuura},
 issue = {21},
 month = {Jan},
 note = {ビデオやオーディオなどのメディア処理の効率化を図るために,SIMD や VLIW などのデータ並列性を利用するアーキテクチャがこれまで盛んに研究されてきた.その結果,データ並列性のある DCT や動き探索などの処理は非常に高速に処理できるようになった.その一方で,データ並列性のない逐次的な処理は高速化しにくいため,メディア処理における逐次処理にかかる実行時間の割合が大きくなっている.逐次的な処理の代表例として可変長符号処理がある.従来は,可変長符号処理を専用回路で実装することが多かったが,近年はソフトウェアによる柔軟性を重視して専用演算器をもったプロセッサによる実装例もある.本稿では,ソフトによる柔軟性を備えた後者の実装例に着目し,ツール生成環境を利用した可変長復号化に適したプロセッサの命令セット検討について述べる.ベースとなる組み込みプロセッサ V850E に対して,可変長復号化に適した命令を 2 つ追加することで,可変長復号化にかかる命令数を約 55% まで削減できることを確認した., In order to execute efficiently video and audio cording, many architectures using data parallelism like SIMD and VLIW have been studied so far. As a result, signal processing tasks having inherent data parallelism in their algorithms such as discrete cosine transform (DCT) and motion compensation (MC) have been handled efficiently on those architectures. On the other hand, serial tasks which have no data parallelism are difficult to speed up. It makes the portion of the processing time taken for serial tasks more significant compared with that of tasks having data parallelism. Variable length coding and decoding is one of such serial tasks and its implementation can be classified into two categories: dedicated circuits and application-specific processor with dedicated functional units. The latter method has been used recently to exploit the flexibility of its software implementation. In this paper, we present a case study on instruction set extension of a processor for variable length decoding (VLD). In this case study a tool generator which generates software toolchain is used to explore the instruction set enhancement. Through this case study, we show that the number of instructions required for VLD can be reduced to 55% by using dedicated instructions for VLD.},
 title = {メディア処理向けカスタムプロセッサにおける復号処理命令拡張の検討},
 year = {2010}
}