@techreport{oai:ipsj.ixsq.nii.ac.jp:00211812, author = {糀田, 利貴 and 丸山, 勝久}, issue = {12}, month = {Jul}, note = {不格好な実装や設計の欠陥を指すコードの不吉な臭いは,ソースコードの理解を妨げ,さらに変更容易性の低下を招く.リファクタリングは,このようなコードの不吉な臭いを取り除く有力な手段である.リファクタリングとは,既存のプログラムの外部的振る舞いを維持しつつ,その内部構造を改善させる作業を指す.近年,リファクタリング対象の特定を支援するために,機械学習によるコードの不吉な臭いの自動検出の研究が行われている.しかしながら,検出の正確さは十分ではない.我々は,訓練データに含まれる誤分類データが検出の正確さを低下させている原因であると考えた.そこで,12 個の Java プロジェクトに含まれる 7 種類の不吉な臭いに対して,意図的に誤分類データを混入させたり,それらを機械的に除去したりすることで,不吉な臭いの検出の正確さの変化を調査した.その結果,誤分類データが含まれることで,正確さが有意に低下することが分かった.さらに,誤分類データを機械的に除去することが,必ずしも検出の正確さを向上させるとは限らないことも分かった.}, title = {機械学習を用いた不吉な臭いの検出における誤分類データの影響}, year = {2021} }