@article{oai:ipsj.ixsq.nii.ac.jp:02002803, author = {細川,颯介 and 椎名,峻平 and 田浦,健次朗 and Sosuke Hosokawa and Shumpei Shiina and Kenjiro Taura}, issue = {1}, journal = {情報処理学会論文誌コンピューティングシステム(ACS)}, month = {Jun}, note = {近年,マルチGPUシステムでCPUを介さずに非同期に通信・制御を行うことで様々なオーバーヘッドを削減した処理系が提案されている.特に不規則な並列性を持つ問題では実行時に生じる負荷の不均衡を解消する必要があるが,既存の処理系ではGPU間の負荷分散は自動的に行われず,処理系を利用するプログラマが明示的に実装する必要がある.そこで本研究では,CPUを介在しないGPU間ワークスティーリングによる動的負荷分散を自動で行い,プログラマの負担を軽減する非同期マルチGPU処理系を実装した.この処理系を用いた実験ではプログラマの高い生産性を維持したままGPU間の負荷分散を適切に行えることが確認できた., In recent years, runtime systems have been proposed for multi-GPU systems that reduce various overheads by performing asynchronous communication and control without going through the CPU@. Especially for problems with irregular parallelism, it is necessary to address load imbalances that arise during execution. However, existing systems do not automatically perform load balancing among GPUs, requiring programmers to implement it explicitly. To address this issue, we have developed an asynchronous multi-GPU runtime system that automatically performs dynamic load balancing via GPU-to-GPU work stealing without CPU intervention, thereby reducing the programmer's burden. Experiments using this system confirmed that it achieves appropriate load balancing among GPUs while maintaining high programmer productivity.}, pages = {1--12}, title = {非同期マルチGPU処理系におけるCPUを介在しないワークスティーリング}, volume = {18}, year = {2025} }