@techreport{oai:ipsj.ixsq.nii.ac.jp:00219042, author = {山本, 大貴 and Gopi, Krishnan Rajbahadur and 近藤, 将成 and 亀井, 靖高 and 鵜林, 尚靖}, issue = {16}, month = {Jul}, note = {バグ予測モデルはソフトウェアプロジェクトに含まれるバグの発生率を予測できるため,デバッグ作業の支援の手法として活用されている.近年,バグ予測モデルを作成するためのデータが無い場合に,他人の持つデータを利用して学習したバグ予測モデルを用いてプロジェクトのバグを予測する Cross Project Defect Prediction(CPDP)への関心が高まっている.CPDP では他人のデータを利用することから,データのプライバシー保護が重要な課題の 1 つである.しかし,多くの CPDP の研究ではモデルの学習のためにプロジェクト間でのデータの共有が必要であり,プロジェクトの機密性を保護しながらプロジェクト間のバグを予測することを考慮していない.そこで本研究では,データ共有が不要な分散型の機械学習アプローチである連合学習(Federated Learning)を用いた CPDP モデルを提案し,CPDP に連合学習のモデルを利用した際の性能や特徴を明らかにする.連合学習の CPDP モデルと既存の CPDP モデルとの性能比較を AUC を用いて行った結果として,連合学習のモデルは実験に用いたデータセットの 68% で予測性能の順位グループの 2 位以上に割り当てられ,既存のモデルと比較しても一定の予測性能があることを明らかにした.また,本研究の実験環境における連合学習のモデルの予測性能に及ぼす影響が大きい特徴量を調査し,本質的複雑度やコード行数のようなコードに関する特徴量は性能に影響を及ぼすことを明らかにした.}, title = {連合学習によるプライバシー保護を考慮したプロジェクト間バグ予測}, year = {2022} }