@techreport{oai:ipsj.ixsq.nii.ac.jp:02004229, author = {井爪,優輔 and 空閑,洋平 and 中村,遼}, issue = {2}, month = {Sep}, note = {プロセッサのマルチコア化で計算性能が向上し続ける一方、メモリ容量の増大は緩やかであり、大規模言語モデル(LLM)やインメモリデータベース等のメモリを大量消費するアプリケーションでは、更なるメモリ拡張が求められている。CXL (Compute Express Link)は、この課題を解決する技術として期待を集めている。しかし、CXLメモリはCPU直結のDDRメモリと比べてアクセス遅延や帯域で劣るものの、その特性がアプリケーション性能に与える具体的な影響や、性能を律する要因は明らかになっていない。本研究では、まず実機CXLメモリのアクセス粒度ごとの帯域とレイテンシをマイクロベンチマークで測定し、CPU直結のDDRメモリの特性と比較する。次に、CXLメモリを利用しうるアプリケーションの一例としてNumPyに着目し、その基本的な演算(和、標準偏差、シャッフル、ソート、行列積)をCXLメモリ上で実行した際の性能を計測し、メモリアクセスパターンとの関連性を分析する。マイクロベンチマークにより、CXLメモリのアクセス遅延はリモートNUMAノードのメモリと同程度であり、帯域幅はPCIeの物理層に律速されることを確認した。NumPyの基本演算をCXLメモリ上で実行した結果、例えば、帯域律速となる行列ベクトル積では最大12倍の性能低下が見られたのに対し、キャッシュ効率の良いソートアルゴリズム(mergesort)では性能低下はほとんど見られないことが分かった。}, title = {NUMAアクセスによるCXLメモリの初期性能測定}, year = {2025} }