Item type |
Journal(1) |
公開日 |
2014-10-15 |
タイトル |
|
|
タイトル |
情報検索技術に基づく高速な関数クローン検出 |
タイトル |
|
|
言語 |
en |
|
タイトル |
A High Speed Function Clone Detection Based on Information Retrieval Techniques |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文(特選論文)] コードクローン,ソフトウェア保守,情報検索 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
著者所属 |
|
|
|
大阪大学 |
著者所属 |
|
|
|
大阪大学 |
著者所属 |
|
|
|
名古屋大学 |
著者所属 |
|
|
|
大阪大学 |
著者所属(英) |
|
|
|
en |
|
|
Osaka University |
著者所属(英) |
|
|
|
en |
|
|
Osaka University |
著者所属(英) |
|
|
|
en |
|
|
Nagoya University |
著者所属(英) |
|
|
|
en |
|
|
Osaka University |
著者名 |
山中, 裕樹
崔, 恩瀞
吉田, 則裕
井上, 克郎
|
著者名(英) |
Yuki, Yamanaka
Eunjong, Choi
Norihiro, Yoshida
Katsuro, Inoue
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
ソフトウェア保守における問題の1つとしてコードクローン(ソースコード中に存在する同一または類似した部分を持つコード片)が指摘されている.これまでの研究において様々なコードクローン検出手法が提案されてきたが,多くの手法がプログラムの構造的な類似性のみに着目している.また,プログラムの意味的な処理の類似性に着目した手法では,検出時間に膨大な時間がかかるという問題点がある.そこで本研究では,情報検索技術を利用した関数クローン(関数単位のコードクローン)の検出手法を提案する.関数単位のコードクローンは処理の内容がまとまっているため,コード片単位のコードクローンに比べてライブラリ化などの集約の対象になりやすいと考えられる.本手法では,ソースコード中の識別子や予約語に利用される単語に対して重み付けを行うことによって,関数を特徴ベクトルに変換する.そして,特徴ベクトル間の類似度を求めることによって関数クローンの検出を行う.評価実験では,既存のコードクローン検出手法と比較を行い,高速に高い精度で検出を行うことができた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
A code clone (i.e., code fragment that has identical or similar fragment to it in the source code) is one of the major problems for software maintenance. So far, a lot of approaches have been developed on the detection of code clones. Several of them focus on semantic similarities based on control and data flow analyses, however they lack the scalability for large-scale source code. In this study, we propose an approach to detect function clones using information retrieval techniques. The proposed approach generates a feature vector for each function based on the occurrence of identifiers and reserved keywords, and then performs clustering of generated vectors. Finally, a set of functions corresponding to vectors in each cluster is detected as a set of semantic clones. As a case study, we applied the proposed approach to open source software systems. The result shows that the proposed approach is able to perform faster and more precise detection of function clones compared to the existing approach based on the similarity between abstract memory states. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 55,
号 10,
p. 2245-2255,
発行日 2014-10-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |