WEKO3
アイテム
デバッグ情報を利用しメモリアクセスに着目したサイクル精度のプログラム実行プロファイラの開発
https://ipsj.ixsq.nii.ac.jp/records/225173
https://ipsj.ixsq.nii.ac.jp/records/225173892b1a06-a240-4f1c-a881-0d65c6e9baa2
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2025年3月9日からダウンロード可能です。
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, HPC:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2023-03-09 | |||||||||
タイトル | ||||||||||
タイトル | デバッグ情報を利用しメモリアクセスに着目したサイクル精度のプログラム実行プロファイラの開発 | |||||||||
タイトル | ||||||||||
言語 | en | |||||||||
タイトル | Development of a Cycle-Accurate Program Execution Profiler Using Debug Information and Focusing on Memory Access | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | 通信・HPC支援 | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||
資源タイプ | technical report | |||||||||
著者所属 | ||||||||||
明石工業高等専門学校 | ||||||||||
著者所属 | ||||||||||
明石工業高等専門学校 | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
National Institute of Technology, Akashi College | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
National Institute of Technology, Akashi College | ||||||||||
著者名 |
東郷, 凜太朗
× 東郷, 凜太朗
× 野村, 隼人
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | プロセッサアーキテクチャのパフォーマンス改善の研究において,プログラム実行の動作を観察することでボトルネックを発見するプロセスがある.このプロセスで利用されるサイクル精度のプロセッサシミュレータは,シミュレートする各命令実行が各サイクルでどのステージの処理をしていたかといった,パイプライン動作よりさらに低レイヤで詳細なプログラム実行の様子を出力することができる.しかし,サイクル精度のプロセッサシミュレータから得られる実行トレースにはソースコードと対応する情報が含まれておらず,プログラム実行時のストールやキャッシュミスの発生箇所を,ソースコードでの位置やそこで使用されるデータ構造と対応付けて調べることが困難である.本研究では,サイクル精度のプロセッサシミュレータである鬼斬弐による実行トレースに対して使用でき,ELF ファイルに埋め込んだデバッグ情報を利用することによりストールやキャッシュミス発生の傾向とソースコードの対応,さらに,それに対応する実行時のアドレス群ごとの統計を示せるようなプログラム実行プロファイラを開発する. | |||||||||
論文抄録(英) | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | In the study of performance improvement of processor architectures, there is a process of finding bottlenecks by observing program execution behavior. Cycle-accurate processor simulators used in this process can output a detailed view of program execution at a lower layer than pipelining, such as which stage the processor executed on each cycle for each instruction execution under simulation. However, execution traces generated by cycle-accurate processor simulators do not contain information corresponding to the source code, making it difficult to correlate the points where stalls and cache misses occur during program execution with their locations of the source code and the data structures used in them. In this study, we develop a program execution profiler that can be used for execution traces by Onikiri 2, a cycle-accurate processor simulator, and that can show the correspondence between the source code and the tendency of stalls and cache misses by using debug information embedded in ELF files, and show the statistics for each address group at execution time corresponding to them. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AN10463942 | |||||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2023-HPC-188, 号 29, p. 1-8, 発行日 2023-03-09 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 2188-8841 | |||||||||
Notice | ||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||
出版者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |