@techreport{oai:ipsj.ixsq.nii.ac.jp:00029300, author = {岩崎, 聖 and 松岡, 聡 and 曽田, 哲之 and 平野, 基孝 and 建部修見 and 関口, 智嗣 and Satoru, Iwasaki and Satoshi, Matsuoka and Noriyuki, Soda and Motonori, Hirano and Osamu, Tatebe and Satoshi, Sekiguchi}, issue = {22(2001-HPC-089)}, month = {Mar}, note = {我々は Grid Data Farm(Gfarm)システム用のジョブ起動アーキテクチャの設計・実装を行っている.Gfarm システムは数千から数万ノード規模の PC クラスタで構成され,ノード間の通信・認証に GSI を用いている.このため,Gfarm システムでジョブを起動する際,ナイーブな実装を用いるとノード数に比例した GSI 認証コストが発生し,数千プロセスからなるジョブの起動に数千秒かかることが予想される.本稿で述べるアーキテクチャでは,あらかじめ確立済みのコネクションを用いることで起動要求伝達時の認証コストを回避する.実装中のシステムでジョブの起動に要する時間を計測した結果,15 ノードで 3.5 秒,63 ノードで 6 秒と想定したスケーラビリティは得られなかったが,これはジョブ起動プロトコルに問題があり,プロトコルを改善することでさらなるスケーラビリティが得られると考えている., In this paper we describe the design and implementation of the job launch architecture for Grid Data Farm(Gfarm) system. Gfarm system is composed of PC clusters with ten thousands of nodes on the Grid. Gfarm system uses GSI for communication and authentication between nodes. Because of this, if an ingenuous method is used to start a job on the Gfarm system, the GSI authentication cost which is in proportion to the number of nodes occurs, and expects that the start of the job which consists of thousands of processes takes several thousand seconds. We avoid the authentication cost by using the connection which has been established in advance. Our system shows that the job launching time is 3.5 second with 15 nodes and 6 second with 63 nodes. We think that we can achieve more scalability by improving job-launching protocol.}, title = {Grid環境における大規模クラスタ向けジョブマネージメントアーキテクチャの実装及び性能評価}, year = {2002} }