WEKO3
アイテム
Intel AMXを用いた行列積和演算の性能評価
https://ipsj.ixsq.nii.ac.jp/records/241677
https://ipsj.ixsq.nii.ac.jp/records/241677c93c9bb6-16c7-465a-97e1-b1dd8c80bf7a
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
2026年12月9日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
| 非会員:¥660, IPSJ:学会員:¥330, ARC:会員:¥0, DLIB:会員:¥0 | ||
| Item type | SIG Technical Reports(1) | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-12-09 | |||||||||||
| タイトル | ||||||||||||
| タイトル | Intel AMXを用いた行列積和演算の性能評価 | |||||||||||
| 言語 | ||||||||||||
| 言語 | jpn | |||||||||||
| キーワード | ||||||||||||
| 主題Scheme | Other | |||||||||||
| 主題 | 性能評価 | |||||||||||
| 資源タイプ | ||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
| 資源タイプ | technical report | |||||||||||
| 著者所属 | ||||||||||||
| 九州大学電気情報工学科 | ||||||||||||
| 著者所属 | ||||||||||||
| 九州大学情報基盤研究開発センター | ||||||||||||
| 著者所属 | ||||||||||||
| 九州大学情報基盤研究開発センター | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Department of Electrical Engineering and Computer Science, School of Engineering, Kyushu University | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Research Institute for Information Technology, Kyushu University | ||||||||||||
| 著者所属(英) | ||||||||||||
| en | ||||||||||||
| Research Institute for Information Technology, Kyushu University | ||||||||||||
| 著者名 |
遠藤, 悠介
× 遠藤, 悠介
× 大島, 聡史
× 南里, 豪志
|
|||||||||||
| 論文抄録 | ||||||||||||
| 内容記述タイプ | Other | |||||||||||
| 内容記述 | 近年,機械学習や深層学習が盛んになっている中,膨大な計算量を効率よく処理するために,bf16 といった低精度の演算が注目されている.Intel MKL や OpenBLAS といった数値線形代数ライブラリにも低精度の行列積ライブラリが実装されている.さらに計算を効率よく行うために,近年のハードウェアには CPU とは別に行列積計算ユニットが搭載され,これらの性能を最大限に引き出す研究が進められている.Intel Advanced Matrix Extension (AMX) もその 1 つであり,低精度の行列演算に特化したハードウェアアクセラレータである.本研究では,AMX を用いた行列積和演算について,ブロッキングとタイルの操作を最適化して実装し,既存のライブラリと比較して性能評価を行った.その結果,既存のライブラリの最大約 33.5% の計算時間の短縮を達成した. | |||||||||||
| 書誌レコードID | ||||||||||||
| 収録物識別子タイプ | NCID | |||||||||||
| 収録物識別子 | AN10096105 | |||||||||||
| 書誌情報 |
研究報告システム・アーキテクチャ(ARC) 巻 2024-ARC-259, 号 12, p. 1-15, 発行日 2024-12-09 |
|||||||||||
| ISSN | ||||||||||||
| 収録物識別子タイプ | ISSN | |||||||||||
| 収録物識別子 | 2188-8574 | |||||||||||
| Notice | ||||||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
| 出版者 | ||||||||||||
| 言語 | ja | |||||||||||
| 出版者 | 情報処理学会 | |||||||||||