Item type |
Journal(1) |
公開日 |
2022-04-15 |
タイトル |
|
|
タイトル |
木編集距離に着目した類似解答ソースコード検索器における深層学習モデルの性能評価 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Performance Evaluation of Deep Learning Models for Similar Source Code Search By Focusing on Tree Edit Distance |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[特集:ソフトウェア工学] コード検索,深層学習,木編集距離,自動プログラミング |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
ID登録 |
|
|
ID登録 |
10.20729/00217602 |
|
ID登録タイプ |
JaLC |
著者所属 |
|
|
|
九州大学 |
著者所属 |
|
|
|
九州大学 |
著者所属 |
|
|
|
九州大学 |
著者所属 |
|
|
|
九州大学 |
著者所属 |
|
|
|
九州大学 |
著者所属 |
|
|
|
九州大学 |
著者所属(英) |
|
|
|
en |
|
|
Kyushu University |
著者所属(英) |
|
|
|
en |
|
|
Kyushu University |
著者所属(英) |
|
|
|
en |
|
|
Kyushu University |
著者所属(英) |
|
|
|
en |
|
|
Kyushu University |
著者所属(英) |
|
|
|
en |
|
|
Kyushu University |
著者所属(英) |
|
|
|
en |
|
|
Kyushu University |
著者名 |
沖野, 健太郎
松尾, 春紀
山本, 大貴
近藤, 将成
亀井, 靖高
鵜林, 尚靖
|
著者名(英) |
Kentaro, Okino
Haruki, Matsuo
Hiroki, Yamamoto
Masanari, Kondo
Yasutaka, Kamei
Naoyasu, Ubayashi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年のIT社会の発展によってIT人材の不足が深刻になり,プログラム自動生成を含むソフトウェア開発の自動化が求められている.多くの研究が行われているなかで,プログラム自動生成をより実用的なものとするために,自動生成の過程でソースコード検索器を使用している研究がある.その研究では,求めるソースコードに木構造が近いと推測される類似解答ソースコードを検索し,自動生成の雛形としている.この手法を用いることで,プログラミングコンテストAtCoderの解答ソースコードの自動生成において,検索を行わない場合と比較して自動生成できた件数が増加したと報告されている.本研究では,木編集距離を学習に用いたソースコード検索器に着目した.ソースコード検索器の性能に影響を与える要因を実証的に調査することで,プログラム自動生成の精度向上への知見を得ることを目指す.調査では,検索精度に影響を与える要因として,深層学習モデルの構造,ソースコードの入力形式,問題の複雑度の3つを対象とし,AtCoderの問題を使用して検索精度の比較を行った.調査の結果,類似解答ソースコード検索においてTransformerのエンコーダ部分の使用は有効であることが期待できること,AtCoderの問題に対して抽象構文木のベクトル表現の使用は有効であるとはいえないこと,問題の複雑度は検索精度に影響を与えることを示した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Automatic program generation is an active research topic in software engineering. To make automatic program generation more practical, a prior study applies source code search to the method of automatic program generation. In that study, source codes whose tree structures may be close to the desired source code developers require are searched and used as a template for the method. They reported that the method with source code search increases the number of generated source codes compared to the method without source code search. In this study, we use source code search using the tree edit distance. By empirically investigating the factors that affect the performance of source code search, we aim to improve the accuracy of automatic program generation. We focused on three factors that affect the search accuracy: the structure of the deep learning model, the input format of the source code, and the complexity of the problem. We compared the search accuracy on the AtCoder problems. We found that the encoder part of Transformer is promising for source code search, the use of vectorized representation of abstract syntax trees is less effective for the AtCoder problems, and the complexity of the problem affects the search accuracy. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 63,
号 4,
p. 986-998,
発行日 2022-04-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |