@techreport{oai:ipsj.ixsq.nii.ac.jp:00209669, author = {福家, 範浩 and 藤原, 裕士 and 吉田, 則裕 and 崔, 恩瀞 and 井上, 克郎 and Norihiro, Fuke and Yuji, Fujiwara and Norihiro, Yoshida and Eunjong, Choi and Katsuro, Inoue}, issue = {12}, month = {Feb}, note = {ソフトウェア保守において問題となる要因の 1 つとしてコードクローンがある.字句の違いだけではなく構文的や意味的な違いも含むコードクローンを検出するために,近年,深層学習を用いた検出器が提案されている.深層学習を用いた研究では,検出器の学習と精度計測のために 1 つのデータセットの中から学習データと計測データを取得していることが多い.しかし,実開発環境でコードクローン検出器を用いる場合,学習データセットに含まれていないコードクローンを検出する可能性があるため,既存研究で報告されている精度より低い精度で検出器がコードクローンを検出する可能性がある.そのため,学習データと計測データに異なるデータセットを使った精度計測も必要だと考えられるが,既存研究ではその精度計測は行われていない.そこで,本研究では,コードクローン検出器の汎化性能を明らかにするために,学習データと計測データに異なるデータセットを使う場合のコードクローン検出器の精度を調査した.その結果,学習データと計測データが異なる場合,既存論文で報告されているより精度が低いことを確認した.}, title = {深層学習を用いたコードクローン検出器の汎化性能に関する調査}, year = {2021} }