@techreport{oai:ipsj.ixsq.nii.ac.jp:00217756,
 author = {德植, 智之 and 石山, 智明},
 issue = {1},
 month = {May},
 note = {ソートは最も基本的なアルゴリズムの 1 つである.一方,スーパーコンピュータ「富岳」の 1 ノードは 48CPU コアで構成されており,高度に並列化されたソートプログラムが重要である.しかし,「富岳」上で高速かつ高い並列化性能をもつソートプログラムはあまり報告されていない.本研究ではサンプルソートをベースにした 2 種類のスレッド並列ソートアルゴリズムを実装し,「富岳」上で性能比較を行った.ひとつめは,入力列を複数のブロックに分けてそれぞれソートし,各ブロックから等間隔にサンプリングを行いピボットを選ぶ.ふたつめは,ピボットの選び方が異なり,全てのパーティションの要素数が等しくなるようなピボットを二分探索によって選ぶ.それぞれに対し,逐次ソートやマージのアルゴリズムを変えて性能を比較した.その結果,条件分岐を減らすことで高速化されたクイックソート(Block Quick sort)を逐次ソートに,selection tree をマージに用いたふたつめのサンプルソートが,さまざまな入力に対し安定して高い速度性能および並列化性能を示した.},
 title = {スレッド並列化されたソートの富岳上での性能評価},
 year = {2022}
}