WEKO3
アイテム
Volta GPUにおけるテンソルコアを用いた多倍長整数演算の高速化
https://ipsj.ixsq.nii.ac.jp/records/187451
https://ipsj.ixsq.nii.ac.jp/records/187451a1cfe38a-2d42-4b48-8cd7-b7cc7c7e7ba0
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2018 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2018-04-30 | |||||||
タイトル | ||||||||
タイトル | Volta GPUにおけるテンソルコアを用いた多倍長整数演算の高速化 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 数値計算 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日本アイ・ビー・エム株式会社東京基礎研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
IBM Research - Tokyo | ||||||||
著者名 |
土井, 淳
× 土井, 淳
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ディープラーニングや画像処理などのように高い精度を必要としない計算をより高速に行うために単精度よりもさらに半分の精度の浮動小数点数である,半精度浮動小数点数が注目されつつある.NVIDIA の Volta GPU にはテンソルコアと呼ばれる,半精度浮動小数点数の行列演算を高速に計算する演算器が搭載されており,これを利用することで,単精度浮動小数点演算の 8 倍の演算性能を得ることができる.また,テンソルコアは内部的には単精度で行列同士の乗算の結果の加算を処理できるようになっており,単純に半精度で計算する場合よりも高い精度で演算ができる利点がある.一方で,精密な CAD モデルの作成,金融計算,暗号化等,非常に高い精度あるいは大きな桁数を必要とするような処理では,多倍長整数演算が用いられる.正確に演算結果を保持するために演算を繰り返すごとにデータが大きくなり計算時間が増大する問題がある.本研究では多倍長整数演算について多倍長整数を 8 ビットずつ半精度浮動小数点数に変換し Volta GPU のテンソルコアを用いて高速に乗算を行う方法について述べる.テンソルコアの特性を用いることで桁あふれによる誤差を生じることなく高速化が可能となった. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2018-HPC-164, 号 4, p. 1-6, 発行日 2018-04-30 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 2188-8841 | |||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |