Item type |
Journal(1) |
公開日 |
2019-03-15 |
タイトル |
|
|
タイトル |
プログラムソースコードの分かりやすさの閾値に基づく評価基準とその導出手法群の評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Comparison of Methods to Derive Threshold-based Evaluation Criteria of The Understandability of Program Source Code |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[特集:若手研究者] 自動評価,保守性,理解性,発展性欠陥,機械学習 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
早稲田大学基幹理工学部情報理工学科 |
著者所属 |
|
|
|
早稲田大学基幹理工学部情報理工学科 |
著者所属 |
|
|
|
早稲田大学基幹理工学部情報理工学科 |
著者所属 |
|
|
|
株式会社小松製作所開発本部ICT開発センタ |
著者所属 |
|
|
|
株式会社小松製作所開発本部ICT開発センタ |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer Science and Engineering, Waseda University |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer Science and Engineering, Waseda University |
著者所属(英) |
|
|
|
en |
|
|
Department of Computer Science and Engineering, Waseda University |
著者所属(英) |
|
|
|
en |
|
|
ICT Development Center, Komatsu Ltd. |
著者所属(英) |
|
|
|
en |
|
|
ICT Development Center, Komatsu Ltd. |
著者名 |
津田, 直彦
鷲崎, 弘宜
深澤, 良彰
保田, 裕一朗
杉村, 俊輔
|
著者名(英) |
Naohiko, Tsuda
Hironori, Washizaki
Yoshiaki, Fukazawa
Yuichiro, Yasuda
Shunsuke, Sugimura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
プログラムソースコード(以下コードと略す)における機能的不具合をともなわない構造上の問題は,コードスメル,発展性欠陥,不可視の技術的負債等と呼ばれ,長期的なソフトウェア開発において保守コストを増加させる原因の1つとして知られている.そのため,コードの分かりやすさをコードメトリクスと閾値で自動評価する様々な手法がこれまでに提案されてきた.しかし,必ずしもメトリクス間のトレードオフや冗長性が考慮されていないために,問題個所の正解(教師データ)を用いても自動評価の精度が改善されにくい場合があるという問題をかかえていた.一方で,分類木学習と呼ばれる機械学習手法では複数のメトリクスの影響関係を考慮できるため,過学習しやすくなる可能性があるものの,評価精度のより大きな改善を期待できる.従来,コードの分かりやすさの評価の分野では,一般的な閾値ベースの手法と,閾値に加えて解釈の形式表現も導出可能な分類木学習との性能比較事例は報告されていない.本論文では評価実験として,建機制御用のC++組込みソフトウェア群を題材としてソースコードファイル単位の評価基準の導出における手法の性能を比較した.そして,分類木学習アルゴリズムC5.0では少量の教師データでも開発者の認識に反しない評価基準を導出でき,教師データの量を増加させた際には従来手法よりも自動評価の精度が改善され,実用的であることを確認した.自動評価の精度としてはエキスパートが実施したレビュー結果との一致度(F値)を用い,比較対象の従来手法にはパーセンタイル関数,Alves法,Bender法,ROC曲線法を用いた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The low maintainability of program source code is an issue studied as code smell, evolvability defect, or technical debt. Evaluation of such issues is usually automated by measuring code metrics and interpreting the measured values by thresholds. An important action to make automatic evaluation precise is customization of thresholds by machine learning with training-data. However, gathering training-data of non-functional-defective structural issues needs manual inspection. Moreover, conventional methods to derive thresholds do not always interpret redundancy and non-orthogonal relations (e.g., trade-off) among metrics. Consequently, you might not obtain precise evaluation criteria even if you gather training-data in exchange for time of busy experts. In this paper, we defined a practical framework to customize evaluation criteria of the understandability of source code. In particular, we gathered a small amount of training-data by experts' manual inspection, and derive interpretation models and thresholds considering non-orthogonal relations among metrics by a classification-tree learning. In the experiments with source code files of embedded C++ systems developed by a company, we measured the F-measure, which indicating the accordance of manual inspection and automatic evaluation, and then compared classification-tree learning algorithm C5.0 with conventional methods (the percentile, Alves' method, Bender's method, and the ROC curve-based method). |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 60,
号 3,
p. 804-820,
発行日 2019-03-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |