@techreport{oai:ipsj.ixsq.nii.ac.jp:00177928, author = {高柳, 雅俊 and 鈴木, 智博 and Masatoshi, Takayanagi and Tomohiro, Suzuki}, issue = {23}, month = {Mar}, note = {行列分解のためのタイルアルゴリズムは高い並列性をもつため,近年のマルチコア,メニーコア環境向きの手法として注目を集めている.我々はクラスタシステム上に OpenMP / MPI ハイブリッド実装によるタイル QR 分解の並列実装を行っている.今回はクラスタシステムにおける通信削減型タイル QR 分解 (タイル CAQR) の実装と,京コンピュータにおける性能評価について報告する., The tile algorithm for a matrix decomposition has an ability to generate many fine-grained tasks, so it is suitable for modern multicore / manycore architectures. We implemented the tile QR decomposition algorithm in OpenMP / MPI hybrid fashion on the cluster system. In this report, we show the performance result of our communication-avoiding tile QR (tile CAQR) implementation for tall and skinny matrices on the K computer.}, title = {縦長行列におけるタイルCAQRアルゴリズムの性能評価}, year = {2017} }