WEKO3
アイテム
ループパーティショニングを用いたショートベクトル化技法
https://ipsj.ixsq.nii.ac.jp/records/23587
https://ipsj.ixsq.nii.ac.jp/records/235879701aeb7-65f1-4d9a-99e7-4f58c17175ea
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2001 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2001-07-25 | |||||||
タイトル | ||||||||
タイトル | ループパーティショニングを用いたショートベクトル化技法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Short Vector Extracting Technique Using Loop Partitioning | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学理工学部 | ||||||||
著者所属 | ||||||||
日本IBM(株)東京基礎研究所 | ||||||||
著者所属 | ||||||||
日本IBM(株)東京基礎研究所 | ||||||||
著者所属 | ||||||||
早稲田大学理工学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Science and Engineering, Waseda Univ. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Research Laboratory, IBM Japan, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Tokyo Research Laboratory, IBM Japan, Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
School of Science and Engineering, Waseda Univ. | ||||||||
著者名 |
佐渡, 昭彦
× 佐渡, 昭彦
|
|||||||
著者名(英) |
Akihiko, Sado
× Akihiko, Sado
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本稿では,ループパーティショニングを用いたショートベクトル化技法を提案する.ショートベクトルプロセッサは,ベクトル長が短い為,依存の制限が緩く,ベクトル実行しやすいことに着目した.また,通常ではベクトル実行できない命令に対し,ループ交換やループスキューイングなどのユニモジュラ変換を施すことにより,ベクトル化率を高める.ユニモジュラ変換を施すとベクトル実行に必要なメモリ上でのアドレス連続性が失われるが,本手法では,プリフェッチ命令を用いてデータをアドレス連続な領域にコピーして,ベクトル実行を行う. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper addresses a short vectorization technique based on the loop partitioning. The restriction of dependence in short vector processors is relatively weak because the vector length is short, then vectorized execution can be easily realized. Our technique also includes instructions that cannot be vectorized in a naive manner. Unimodular loop transformations may breaches the memory contiguity of operations that is required for the vectorized execution. However we prefetch the data onto a contiguous the memory region so that we can proceed on vectorization. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10096105 | |||||||
書誌情報 |
情報処理学会研究報告計算機アーキテクチャ(ARC) 巻 2001, 号 76(2001-ARC-144), p. 93-98, 発行日 2001-07-25 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |