@techreport{oai:ipsj.ixsq.nii.ac.jp:00231099, author = {小泉, 透 and 津邑, 公暁 and 入江, 英嗣 and 坂井, 修一}, issue = {21}, month = {Nov}, note = {浮動小数点数を入力とする数学関数において,数学的な値を丸めた値を常に返すことを完全精度と呼ぶ.一般に精度と計算量はトレードオフであり,速度を重視し完全精度を犠牲にすることが行われる.しかしながら,完全精度でないライブラリは出力の異なる実装が無数に存在するため,移植性に欠ける.本研究では,倍精度指数関数について,最近接丸めに対する完全精度を達成する高速なソフトウェア実装を示すことで,移植性の問題を解決する.完全精度を達成する提案実装は,Skylake においてレイテンシが 50 サイクルと高速であり,テーブルサイズは 1.5KB と低フットプリントである.さらに,この実装とテーブルを共有し,カバー率が 99.75%,レイテンシが 31 サイクルの fast path 実装も合わせて提案する.これは最大誤差が 1.0ULP 未満の既存のいかなる実装よりも高速である.}, title = {倍精度指数関数の高速な完全精度実装}, year = {2023} }