WEKO3
-
RootNode
アイテム
ポストペタスケール計算機環境に向けた高可用分散協調セルフスケジューリング機構の提案
https://ipsj.ixsq.nii.ac.jp/records/83973
https://ipsj.ixsq.nii.ac.jp/records/8397308c80083-dff8-4f5d-80f9-0a48869f40cb
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2012 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2012-09-26 | |||||||
タイトル | ||||||||
タイトル | ポストペタスケール計算機環境に向けた高可用分散協調セルフスケジューリング機構の提案 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | スケジューリング | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属 | ||||||||
産業技術総合研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者所属(英) | ||||||||
en | ||||||||
National Institute of Advanced Industrial Science and Technology (AIST) | ||||||||
著者名 |
竹房あつ子
× 竹房あつ子
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ポストペタスケール計算機環境では,階層型タスク並列が有望なプログラミングモデルの 1 つであると考えられている.タスク並列型アプリケーションでは,タスクの再実行や冗長実行により,耐障害性を備えるように設計することは比較的容易であるが,その実装は容易ではない.よって,我々はそのようなアプリケーションの開発を容易にする耐障害アプリケーションフレームワークの開発を目指している.アプリケーションフレームワークでは,故障箇所を避けながら適切な計算ノード上でタスクを実行する資源管理機構が必要となるが,ポストペタスケール計算機環境でのスケーラビリティや,資源管理機構そのものの耐障害性,資源管理情報の永続化が課題となる.本稿では,スケーラブルかつ可用性の高い分散協調セルフスケジューリング機構を提案・設計する.提案する資源管理機構では,複数資源管理プロセスを分散協調させてタスクキューを管理し,タスクキュー内のタスクを各計算ノード上の実行デーモンプロセスが自律的に取得して実行する.また,各計算ノードの死活監視を行い,実行中に故障が発生した場合は選択的に再実行または削除する仕組みを提供する.資源管理プロセスの耐障害性と資源管理情報の永続化の実現方法を検討するため, Apache ZooKeeper を用いてこれらの機能を試験実装し,提案資源管理機構の妥当性と課題の明確化を行う. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10463942 | |||||||
書誌情報 |
研究報告ハイパフォーマンスコンピューティング(HPC) 巻 2012-HPC-136, 号 24, p. 1-6, 発行日 2012-09-26 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |