{"id":227136,"updated":"2025-01-19T12:15:54.072580+00:00","links":{},"created":"2025-01-19T01:26:26.989556+00:00","metadata":{"_oai":{"id":"oai:ipsj.ixsq.nii.ac.jp:00227136","sets":["1164:2240:11176:11310"]},"path":["11310"],"owner":"44499","recid":"227136","title":["ロングベクトル環境におけるプロファイルを用いた自動ベクトル化技術"],"pubdate":{"attribute_name":"公開日","attribute_value":"2023-07-27"},"_buckets":{"deposit":"74521e28-3720-4d66-bc54-040011baa716"},"_deposit":{"id":"227136","pid":{"type":"depid","value":"227136","revision_id":0},"owners":[44499],"status":"published","created_by":44499},"item_title":"ロングベクトル環境におけるプロファイルを用いた自動ベクトル化技術","author_link":["604650","604652","604653","604651"],"item_titles":{"attribute_name":"タイトル","attribute_value_mlt":[{"subitem_title":"ロングベクトル環境におけるプロファイルを用いた自動ベクトル化技術"}]},"item_keyword":{"attribute_name":"キーワード","attribute_value_mlt":[{"subitem_subject":"性能最適化","subitem_subject_scheme":"Other"}]},"item_type_id":"4","publish_date":"2023-07-27","item_4_text_3":{"attribute_name":"著者所属","attribute_value_mlt":[{"subitem_text_value":"日本電気株式会社"},{"subitem_text_value":"日本電気株式会社/大阪大学サイバーメディアセンター"},{"subitem_text_value":"大阪大学サイバーメディアセンター"},{"subitem_text_value":"大阪大学サイバーメディアセンター"}]},"item_4_text_4":{"attribute_name":"著者所属(英)","attribute_value_mlt":[{"subitem_text_value":"NEC Corporation","subitem_text_language":"en"},{"subitem_text_value":"NEC Corporation / Cyber Media Center, Osaka University","subitem_text_language":"en"},{"subitem_text_value":"Cyber Media Center, Osaka University","subitem_text_language":"en"},{"subitem_text_value":"Cyber Media Center, Osaka University","subitem_text_language":"en"}]},"item_language":{"attribute_name":"言語","attribute_value_mlt":[{"subitem_language":"jpn"}]},"item_publisher":{"attribute_name":"出版者","attribute_value_mlt":[{"subitem_publisher":"情報処理学会","subitem_publisher_language":"ja"}]},"publish_status":"0","weko_shared_id":-1,"item_file_price":{"attribute_name":"Billing file","attribute_type":"file","attribute_value_mlt":[{"url":{"url":"https://ipsj.ixsq.nii.ac.jp/record/227136/files/IPSJ-HPC23190025.pdf","label":"IPSJ-HPC23190025.pdf"},"date":[{"dateType":"Available","dateValue":"2025-07-27"}],"format":"application/pdf","billing":["billing_file"],"filename":"IPSJ-HPC23190025.pdf","filesize":[{"value":"2.6 MB"}],"mimetype":"application/pdf","priceinfo":[{"tax":["include_tax"],"price":"660","billingrole":"5"},{"tax":["include_tax"],"price":"330","billingrole":"6"},{"tax":["include_tax"],"price":"0","billingrole":"14"},{"tax":["include_tax"],"price":"0","billingrole":"44"}],"accessrole":"open_date","version_id":"956942c0-6ff8-42f1-ab1f-218547b533a6","displaytype":"detail","licensetype":"license_note","license_note":"Copyright (c) 2023 by the Information Processing Society of Japan"}]},"item_4_creator_5":{"attribute_name":"著者名","attribute_type":"creator","attribute_value_mlt":[{"creatorNames":[{"creatorName":"石田, 祐二郎"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"細見, 岳生"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"山下, 晃弘"}],"nameIdentifiers":[{}]},{"creatorNames":[{"creatorName":"伊達, 進"}],"nameIdentifiers":[{}]}]},"item_4_source_id_9":{"attribute_name":"書誌レコードID","attribute_value_mlt":[{"subitem_source_identifier":"AN10463942","subitem_source_identifier_type":"NCID"}]},"item_4_textarea_12":{"attribute_name":"Notice","attribute_value_mlt":[{"subitem_textarea_value":"SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc."}]},"item_resource_type":{"attribute_name":"資源タイプ","attribute_value_mlt":[{"resourceuri":"http://purl.org/coar/resource_type/c_18gh","resourcetype":"technical report"}]},"item_4_source_id_11":{"attribute_name":"ISSN","attribute_value_mlt":[{"subitem_source_identifier":"2188-8841","subitem_source_identifier_type":"ISSN"}]},"item_4_description_7":{"attribute_name":"論文抄録","attribute_value_mlt":[{"subitem_description":"近年の HPC 環境で用いられるプロセッサは,高性能化のために一度に複数のデータを処理するベクトル命令 (SIMD 命令)を有している.ユーザは自動ベクトル化コンパイラを用いることで,複雑なハードウェアやベクトル命令についての知見がなくともその性能を享受している.自動ベクトル化コンパイラのベクトル最適化が不十分である場合,ユーザは実行プロファイル情報やコンパイラが出力するベクトル化に関する解析情報を利用して,手作業でベクトル最適化を実施する必要があった.しかしそれらの情報はソースコードの問題点を示すに留まっており,ベクトル最適化についての知見を有さないユーザには,どのようなベクトル最適化が有効かを判断することが困難であった.そこでこの問題を解決するために,ロングベクトル命令向けコード変換ツール PGSLV (Profile Guided Source to Source Transformations for Long Vector Optimizations)を提案する.PGSLV はコンパイラ最適化情報,実行プロファイル情報およびソースコードを入力とし,それら入力から得られるベクトル演算率あるいは平均ベクトル長の情報およびループの解析情報を利用することで,ベクトル最適化のために必要なソースコード変換を実施する.本報告では PGSLV のアプローチの有効性を検証するために,PGSLV の機能の一部を作成した.その機能においてベクトル最適化が不十分な関数を特定し,その関数に対してルールベースでベクトル最適化の方針を定め,関数内のどのループにどのようなベクトル化最適化技術を適用するべきかを判定する.SX-Aurora TSUBASA 上で,NPB および Polybench 合計 38 本のワークロードの内,ベクトル化が不十分であると PGSLV によって検出されたを 12 本を対象に,作成したルールが示す最適化方針およびベクトル最適化技術に従い手動でコード変換を行うことで,平均 10.3 倍性能が向上することを確認した.","subitem_description_type":"Other"}]},"item_4_biblio_info_10":{"attribute_name":"書誌情報","attribute_value_mlt":[{"bibliographicPageEnd":"8","bibliographic_titles":[{"bibliographic_title":"研究報告ハイパフォーマンスコンピューティング(HPC)"}],"bibliographicPageStart":"1","bibliographicIssueDates":{"bibliographicIssueDate":"2023-07-27","bibliographicIssueDateType":"Issued"},"bibliographicIssueNumber":"25","bibliographicVolumeNumber":"2023-HPC-190"}]},"relation_version_is_last":true,"weko_creator_id":"44499"}}