Item type |
Symposium(1) |
公開日 |
2018-08-29 |
タイトル |
|
|
タイトル |
コード片のベクトル表現に基づく大規模コードクローン集合の特徴調査 |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
大阪大学 |
著者所属 |
|
|
|
奈良先端科学技術大学院大学 |
著者所属 |
|
|
|
名古屋大学 |
著者所属 |
|
|
|
大阪大学 |
著者名 |
横井, 一輝
崔, 恩瀞
吉田, 則裕
井上, 克郎
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
コードクローンを自動検出する手法の 1 つとして,コード片をベクトル空間に写像し,ベクトル空間上で距離が近いコード片をコードクローンとして検出する手法がある.既存研究において,TF - IDF を用いたコード片のベクトル表現に対し,コサイン類似度を用いてクローン検出を行う手法が提案されている.TF - IDF 以外に次元圧縮を行う LSI や機械学習を用いてベクトル生成を行う Doc 2 Vec などコード片をベクトル化する手法が多く存在する.また距離尺度としてコサイン類似度以外にも様々な尺度が存在するが,これらの手法がコードクローンの検出にどのように影響を与えるのかは明らかになっていない.そこで本研究では,コードクローン検出の再現率や検出時間を用いて異なるコード片のベクトル表現手法と距離尺度がコードクローン検出に与える影響について調査した.本調査では,コードクローン検出ツールの評価に使用される大規模ベンチマーク BigCloneBench に含まれるコードクローン集合を調査対象とする.本調査の結果,それぞれのベクトル空間上でコードクローンが持つ特徴が明らかになり,この調査結果に基づいて新たなコードクローン検出手法の考察を行う. |
書誌情報 |
ソフトウェアエンジニアリングシンポジウム2018論文集
巻 2018,
p. 192-199,
発行日 2018-08-29
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |