ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. ハイパフォーマンスコンピューティング(HPC)
  3. 2024
  4. 2024-HPC-197

融合積和演算命令を生かした三角関数実装の高精度化

https://ipsj.ixsq.nii.ac.jp/records/241713
https://ipsj.ixsq.nii.ac.jp/records/241713
6beefd4e-238d-40a4-8333-91ba03ff6c59
名前 / ファイル ライセンス アクション
IPSJ-HPC24197020.pdf IPSJ-HPC24197020.pdf (327.4 kB)
 2026年12月9日からダウンロード可能です。
Copyright (c) 2024 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, HPC:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-12-09
タイトル
タイトル 融合積和演算命令を生かした三角関数実装の高精度化
言語
言語 jpn
キーワード
主題Scheme Other
主題 高精度計算
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
名古屋工業大学情報工学科
著者所属
名古屋工業大学情報工学科
著者所属
名古屋工業大学情報工学科
著者名 水野, 将成

× 水野, 将成

水野, 将成

Search repository
小泉, 透

× 小泉, 透

小泉, 透

Search repository
津邑, 公暁

× 津邑, 公暁

津邑, 公暁

Search repository
論文抄録
内容記述タイプ Other
内容記述 三角関数は広範な分野で用いられる重要な数学的ツールである.しかし,その計算が命令セットに含まれることは少ないため,既存の命令を組み合わせてソフトウェア実装されるのが一般的であり,速度と精度を両立する実装の研究が行われている.その中でも,小泉らは融合積和演算(FMA)命令を前提としたアルゴリズムにより,既存のライブラリと比べ,高速かつ高精度を達成した.本稿ではこのアルゴリズムを,速度を落とさず,さらに高精度化できることを示す.本稿における高精度化は,次の 3 つを利用する.1 つ目は,省略されていた微小項を計算に組み込むための FMA 命令を,並列に挿入可能な点である.2 つ目は,事前計算テーブルの分割数を2倍にすることで,メモリフットプリントはやや増大するものの,多項式近似誤差を低減可能な点である.3 つ目は,三角関数の多項式近似において,係数を適切に調整することにより,多項式近似誤差を改善できる点である.これらの変更をすべて実装した結果,[0,220)の範囲の一様ランダムな倍精度浮動小数点数を 10 億回入力したとき,最近接丸めされないケース数が,小泉らの実装と比べ,sin 関数では約 90.57% 減少し,cos 関数では約 90.74% 減少した.また,提案実装の最大誤差は sin 関数では 0.50229 ULP(約 21.58% 減少),cos 関数では 0.50230 ULP(約 21.77% 減少)であった.そして,レイテンシやスループットのサイクル数悪化は,3.3% 未満にとどまった.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10463942
書誌情報 研究報告ハイパフォーマンスコンピューティング(HPC)

巻 2024-HPC-197, 号 20, p. 1-9, 発行日 2024-12-09
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8841
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 07:34:16.934556
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3