Item type |
Trans(1) |
公開日 |
2021-07-15 |
タイトル |
|
|
タイトル |
時系列障害原因分析による推論QoS規則導出手法 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Inference QoS Rule Derivation Based on Time Series Root Cause Analysis |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[特集号投稿論文] 障害分析, 自律的復旧, 監視システム, 時系列データベース, クラウドコンビューティング |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
ヤフー株式会社/北陸先端科学技術大学院大学 |
著者所属 |
|
|
|
東京工業大学 |
著者所属 |
|
|
|
北陸先端科学技術大学院大学 |
著者所属 |
|
|
|
北陸先端科学技術大学院大学 |
著者所属(英) |
|
|
|
en |
|
|
Yahoo Japan Corporation / Japan Advanced Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
Tokyo Institute of Technology |
著者所属(英) |
|
|
|
en |
|
|
Japan Advanced Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
Japan Advanced Institute of Science and Technology |
著者名 |
今野, 賢
デファゴ, クサヴィエ
冨田, 尭
井口, 寧
|
著者名(英) |
Satoshi, Konno
Xavier, Défago
Tomita, Takashi
Inoguchi, Yasushi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
クラウド環境におけるQoS(Quality of Service)保証はサービス利用者と提供者の両者に共通する重要な課題である.特に障害発生時の運用作業においては調査時間も限られ運用者の介在による遅延も発生し,即時の障害復旧には運用業務の自動化が不可欠である.本稿は,近年顕著である時系列監視データベースのインメモリへの移行動向に適した,実時間で動作可能な事例ベース推論と時系列形状ベースの障害原因分析に基づいたイベント駆動型の推論QoS監視規則生成手法を提案する.本提案手法の適用により,障害発生時の即時の暫定的復旧対応に加え,再発防止に向けた障害原因特定および恒久的対処の自動化を目的とする.本提案手法は評価実験にて,従来の時系列クラスタリング手法と比較して同等の高適合率を保ちつつ,実時間で高速に動作する障害原因分析性能を示した.また現実的障害環境下での即時の自律復旧対策による有用性も示した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Ensuring quality of service (QoS) is essential for cloud service providers and customers alike. In particular, automated recovery is essential to ensure long-term reliability and availability because human intervention is too slow, and not every situation can be anticipated. This paper proposes an event-driven inference QoS monitoring rule generation method based on case-based reasoning in real-time and shape-based time-series root cause analysis for recent in-memory time-series monitoring databases. This study aims to immediate provisional recovery response when a failure occurs, automation of root cause analysis, and permanent coping to prevent recurrence is realized. The results show that our approach maintains the same high precision as the conventional time-series clustering method, but at the same time, increases the root cause analysis performance that can operate in real-time. In addition, the results show a gradual characteristic and the usefulness of the immediate and permanent autonomous recovery measures in a realistic obstacle environment. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA12894091 |
書誌情報 |
情報処理学会論文誌デジタルプラクティス(TDP)
巻 2,
号 3,
p. 11-26,
発行日 2021-07-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2435-6484 |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |