WEKO3
アイテム
類義語の特定に基づく類似コード片検索法
https://ipsj.ixsq.nii.ac.jp/records/60513
https://ipsj.ixsq.nii.ac.jp/records/6051323c05640-61bd-4501-a8c1-23195c60b05d
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2009 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2009-05-15 | |||||||
タイトル | ||||||||
タイトル | 類義語の特定に基づく類似コード片検索法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Retrieving Similar Code Fragments Based on Synonymous Word Identification | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 一般論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
大阪大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
大阪大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
大阪大学大学院情報科学研究科 | ||||||||
著者所属 | ||||||||
大阪大学大学院情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Osaka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Osaka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Osaka University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science and Technology, Osaka University | ||||||||
著者名 |
吉田, 則裕
服部, 剛之
早瀬, 康裕
井上, 克郎
× 吉田, 則裕 服部, 剛之 早瀬, 康裕 井上, 克郎
|
|||||||
著者名(英) |
Norihiro, Yoshida
Takeshi, Hattori
Yasuhiro, Hayase
Katsuro, Inoue
× Norihiro, Yoshida Takeshi, Hattori Yasuhiro, Hayase Katsuro, Inoue
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ソースコード中に類似した部分(類似コード片)が散在していると,ソースコードの一部分を修正したときにその類似部分に対しても同様の修正をする必要が生じることがあるため,保守作業が困難になるという問題がある.一般に,ソフトウェア開発者は類似コード片を調査する際には,grepなどのキーワード検索ツールを用いる.しかし,類似コード片には様々な差異が存在するため,修正の必要がある類似コード片の多くを列挙できるキーワードを与えることは困難である.本研究では,入力したコード片の類似コード片を,コード片に含まれる識別子の類似性に基づいて検索する手法を提案する.本手法は,まず,共起関係に基づいて語(識別子を分割・正規化した後の文字列)をクラスタリングすることで類義語を求める.その後,入力コード片に含まれるすべての語について,同一もしくは類義語である語を含むコード片を検出し,類似コード片として提示する.適用実験として,提案手法を用いて類似した欠陥を含むコード片の検索を行ったところ,類似した欠陥の多くを提示できることを確認した.また,提案手法と既存ツール(grepおよびコードクローン検出ツールCCFinder)との比較実験を行い,それぞれの検索結果が持つ特徴を確認した. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A similar code fragment is a code fragment that has similar part to it in source code, and is generally considered as one of factors that make software maintenance more difficult. If developers modify a code fragment, they have to determine whether or not to modify similar code fragments in source code. For finding similar code fragments, developers can use keyword-based search (e.g. grep). However, it is difficult to determine appropriate search keywords since there are various code fragments to implement similar functions. In this paper, we propose a method to retrieve code fragments that are similar in their identifier names to an input code fragment. In our method, at first, to make clusters of synonymous words in source code, the clustering is performed based on co-occurrence of words that derived from identifier names. Then, code fragments that involve words in an identical cluster are presented as similar code fragments. We show the usefulness of our method through case studies to retrieve similar code fragments involving similar defects. In addition, we present a case study for comparing our proposed method with a code clone detection tool CCFinder and a keyword-based search tool grep. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 50, 号 5, p. 1506-1519, 発行日 2009-05-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |