Item type |
Journal(1) |
公開日 |
2022-08-15 |
タイトル |
|
|
タイトル |
相関ルール分析とランダムフォレストを組み合わせたfault-proneモジュール予測の追実験 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A Replicated Study of Hybrid Fault-prone Module Prediction with Association Rule Analysis and Random Forest |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文] ソフトウェア品質,fault-proneモジュール予測,メトリクス,機械学習,ルールベース予測 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
ID登録 |
|
|
ID登録 |
10.20729/00218983 |
|
ID登録タイプ |
JaLC |
著者所属 |
|
|
|
岡山大学大学院自然科学研究科 |
著者所属 |
|
|
|
岡山大学大学院自然科学研究科 |
著者所属 |
|
|
|
岡山大学大学院自然科学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Natural Science and Technology, Okayama University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Natural Science and Technology, Okayama University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Natural Science and Technology, Okayama University |
著者名 |
瀬戸, 俊輝
西浦, 生成
門田, 暁人
|
著者名(英) |
Toshiki, Seto
Kinari, Nishiura
Akito, Monden
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
従来,ソフトウェア開発および保守において,バグを含む可能性の高いfault-proneモジュールの予測を目的として,様々なモデリング手法を用いた研究が行われている.また,ルールベース手法によるfault-proneモジュール予測や,バグ要因の分析も行われている.さらには,モデリング手法とルールベース手法の組合せ手法として,ロジスティック回帰モデルと相関ルール分析を併用する手法が提案されており,Eclipseプロジェクトを対象とした実験において,ロジスティック回帰モデルのみによる予測よりも予測精度が高いことが示されている.ただし,他のプロジェクトにおける有効性は不明であり,また,より新しいモデリング手法や,相関ルールのより新しい選定手法の元での有効性も不明であった.本稿では,モデリング手法としてfault-proneモジュール予測に定評のあるランダムフォレストを使用し,相関ルールの選定手法として交差検証と回帰分析によるルール選定手法を採用する.そして,これらの組合せ手法を13件のデータセットを用いて実験的に評価する.実験の結果,ランダムフォレストのみによる予測と組合せ手法の予測精度は同程度であった.ただし,ランダムフォレストのみによる予測は適合率が高く,組合せ手法は再現率が高い傾向にあるため,目的に合わせて手法を選択することが望ましい. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Various modeling techniques have been used for fault-prone modules prediction, which is likely to contain bugs in software development and maintenance. In addition, rule-based methods have been used to predict fault-prone modules and to analyze bug factors. Furthermore, as a combination method of modeling and rule-based methods, a method combining logistic regression model and association rule analysis has been proposed. In an experiment on the Eclipse project, the combination method was shown to be more accurate than the logistic regression model alone. However, the effectiveness of the method on other projects is unknown, and the effectiveness under newer modeling methods and newer methods of selecting association rules is also unknown. In this paper, we use Random Forest, which is well known for predicting fault-prone modules, as a modeling method, and adopt a rule selection method based on cross-validation and regression analysis as an association rule selection method. The combination of these methods is experimentally evaluated using 13 data sets. The experimental results show that the prediction accuracy of the combination method is comparable to that of the random forest method. However, the random forest method tends to have a higher precision, and the combination method tends to have a higher recall. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 63,
号 8,
p. 1352-1360,
発行日 2022-08-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |