WEKO3
-
RootNode
アイテム
AMD AI Engineによる数論変換のアクセラレーションの検討
https://ipsj.ixsq.nii.ac.jp/records/237622
https://ipsj.ixsq.nii.ac.jp/records/2376229a6f2705-8fb7-4bc9-ae5b-d2a499aecf28
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2026年8月1日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, ARC:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-08-01 | |||||||||||||
タイトル | ||||||||||||||
タイトル | AMD AI Engineによる数論変換のアクセラレーションの検討 | |||||||||||||
タイトル | ||||||||||||||
言語 | en | |||||||||||||
タイトル | Exploring AMD AI Engine for Accelerating Number Theoretic Transform | |||||||||||||
言語 | ||||||||||||||
言語 | jpn | |||||||||||||
キーワード | ||||||||||||||
主題Scheme | Other | |||||||||||||
主題 | アクセラレーション技術 | |||||||||||||
資源タイプ | ||||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||||
資源タイプ | technical report | |||||||||||||
著者所属 | ||||||||||||||
東京大学 | ||||||||||||||
著者所属 | ||||||||||||||
東京大学 | ||||||||||||||
著者所属 | ||||||||||||||
東京大学 | ||||||||||||||
著者所属 | ||||||||||||||
東京大学 | ||||||||||||||
著者所属(英) | ||||||||||||||
en | ||||||||||||||
The University of Tokyo | ||||||||||||||
著者所属(英) | ||||||||||||||
en | ||||||||||||||
The University of Tokyo | ||||||||||||||
著者所属(英) | ||||||||||||||
en | ||||||||||||||
The University of Tokyo | ||||||||||||||
著者所属(英) | ||||||||||||||
en | ||||||||||||||
The University of Tokyo | ||||||||||||||
著者名 |
野崎, 愛
× 野崎, 愛
× 小島, 拓也
× 中村, 宏
× 高瀬, 英希
|
|||||||||||||
論文抄録 | ||||||||||||||
内容記述タイプ | Other | |||||||||||||
内容記述 | 量子計算機時代にも安全に利用可能な暗号として耐量子暗号の研究が活発に行われている.公開鍵暗号として選定された CRYSTICALS-Kyber や準同型暗号を始めとする格子暗号の一種では,Number Theoretic Transform(NTT)の処理が実行時間の大きな割合を占める.NTT は離散フーリエ変換を剰余多項式上で行うアルゴリズムであり,バタフライ演算に伴い発生する,入力配列の全域にわたる不連続なメモリアクセスのコストが大きい.従来,NTT のアクセラレーションには階層的なメモリ構造を持つアーキテクチャが用いられてきたが,NTT の計算強度ではメモリバンド幅律速となることが多く,メモリアクセスの改善が求められている.近年,深層学習向けに,階層的なメモリ構造ではなく,2 次元配列上に並べられた Processing Element(PE)が分散してデータを保持し,隣接 PE 間でデータをやり取りするアーキテクチャが研究・開発されている.AMD AI Engine はその一例であり,このようなデータフロー型のアーキテクチャは NTT の不連続なメモリアクセスを高効率に処理できる可能性がある.本研究では,AI Engine によるアクセラレーションによって NTT 処理の高速化を目指す.一元的にアクセス可能なメモリを持たない AI Engine において,PE 間でどのようにデータを分割し,データ転送を行うか,データレイアウトを設計する.さらに,主要な演算器であるベクター演算器を活用すべく,PE に割り当てられた部分的な NTT の並列化を行う.これらの設計の有用性を確かめるため,実行時間を評価し,NVIDIA A100 との比較を行った. | |||||||||||||
書誌レコードID | ||||||||||||||
収録物識別子タイプ | NCID | |||||||||||||
収録物識別子 | AN10096105 | |||||||||||||
書誌情報 |
研究報告システム・アーキテクチャ(ARC) 巻 2024-ARC-258, 号 28, p. 1-7, 発行日 2024-08-01 |
|||||||||||||
ISSN | ||||||||||||||
収録物識別子タイプ | ISSN | |||||||||||||
収録物識別子 | 2188-8574 | |||||||||||||
Notice | ||||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||||
出版者 | ||||||||||||||
言語 | ja | |||||||||||||
出版者 | 情報処理学会 |