2024-03-28T23:57:46Zhttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_oaipmhoai:ipsj.ixsq.nii.ac.jp:000286412023-04-27T10:00:04Z01164:02240:02241:02243
高性能・耐故障マルチリンクEthernet結合システムのNFSへの適用と評価Evaluation of NFS on Ethernet Multilink Bonding System for High performance and Fault-tolerancejpnhttp://id.nii.ac.jp/1001/00028641/Technical Reporthttps://ipsj.ixsq.nii.ac.jp/ej/?action=repository_action_common_download&item_id=28641&item_no=1&attribute_id=1&file_no=1Copyright (c) 2008 by the Information Processing Society of Japan筑波大学計算科学研究センター筑波大学計算科学研究センター筑波大学計算科学研究センター/筑波大学大学院 システム情報工学研究科筑波大学計算科学研究センター/筑波大学大学院システム情報工学研究科三浦, 信一塙, 敏博朴, 泰祐佐藤三久コストパフォーマンスが高い Gigabit Ethernet は,比較的中規模な PC クラスタで多く用いられている.この Gigabit Ethernet を高性能化を実現するために IEEE 802.3ad や Linux Channel Bonding などの Ethernet Trunking 技術が多く用いられている.しかし,これらの技術は既存の TCP / IP を用いる場合,遅延時間やバンド幅などの性能が低い問題があった.また,これらの技術は耐故障機能も持っているが,それらは実用十分ではなかった.本問題を解決するためには,我々は Linux Channel Bonding と非常に近い実装で RI2N / DRV (Redundant Interconnection with Inexpensive Network with Driver) を開発している. RI2N / DRV は TCP / IP と親和性を高くし,遅延時間やバンド幅の性能を高めている. RI2N / DRV はその実装方法により高い汎用性を持ち,初期に想定した PC クラスタ向けの通信だけではなく,既存の UNIX のサービスにも適用することが可能である.本稿では既存の UNIX サービスに RI2N / DRV を適用する場合の問題点を整理し,実際に RI2N / DRV を UNIX サービスのネットワーク環境として構築した.この環境を用いて, UNIX のサービスの 1 つである NFS サービスを評価したところ,システムに一切の変更なしで,高いバンド幅と耐故障性を得ることが確認できた.Although recent high-end interconnection network devices and switches provide a high performance / cost ratio, most of the small to medium sized PC clusters are still built on the commodity network, Ethernet. To enhance performance on commonly used Gigabit Ethernet networks, link aggregation or binding technology is used. Currently, a Linux kernel is equipped with a software solution named Linux Channel Bonding, which is based on IEEE802.3ad Link Aggregation technology. However, standard LCB has the problem of mismatching with the commonly used TCP protocol, which consequently implies several problems of both large latency and instability on bandwidth improvement. The fault-tolerant feature is also supported, but the usability is not sufficient. We have developed a new implementation similar to LCB named RI2N / DRV (Redundant Interconnection with Inexpensive Network with Driver) for use on a Gigabit Ethernet with a complete software stack that is very compatible with the TCP protocol. Our algorithm suppresses unnecessary ACK packets and retransmission of packets even in imbalanced network traffic and link failures on multiple links. It provides both high-bandwidth and fault-tolerant communication on multi-link Gigabit Ethernet. We confirmed that this system improves the performance and reliability of the network, and our system can be applied to ordinary UNIX services such as NFS, without any modification of other modules.AN10463942情報処理学会研究報告ハイパフォーマンスコンピューティング(HPC)200899(2008-HPC-117)162008-10-082009-06-30