@techreport{oai:ipsj.ixsq.nii.ac.jp:02007750, author = {門谷,拓能 and 坂井,優介 and 上垣外,英剛 and 渡辺,太郎}, issue = {24}, month = {Feb}, note = {大規模言語モデル(LLM)を用いることで、コンパイラによって最適化されたコードをさらに効率化できることが知られている。一方で、その最適化効果がどのアーキテクチャにおいてどの程度発現するのか、また性能劣化や数値誤差を引き起こす条件などについては、十分に明らかではない。本研究ではPolyBench/Cを対象とし、LLMにより最適化されたコードを、AVX2やAVX-512などSIMD機能の異なる複数のx86 CPUノード上で実行することで、実行時間、機械語命令列長、ならびに数値的一致性の評価を行う。本稿では、特にLLM生成コードが-O3最適化を上回る条件や、アーキテクチャの違いに依存した性能差、ならびに性能が悪化する典型的なパターンを示す。さらに、LLMが提示するループ展開、タイル化、手動ベクトル化といった最適化パターンが各アーキテクチャにおいてどのように振る舞うかを分析し、今後構築を目指す体系的なベンチマーク基盤の方向性についても議論する。}, title = {大規模言語モデルによるCPUアーキテクチャごとの特性を考慮したコンパイラ最適化}, year = {2026} }