| Item type |
Journal(1) |
| 公開日 |
2024-11-15 |
| タイトル |
|
|
タイトル |
大規模言語モデルを用いたデコンパイラ歪みの自動修正 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Automatic Fixation of Decompiler Quirks Using Large Language Model |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文] デコンパイラ,大規模言語モデル,ファインチューニング,歪み,文法誤り訂正 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
| ID登録 |
|
|
ID登録 |
10.20729/00240590 |
|
ID登録タイプ |
JaLC |
| 著者所属 |
|
|
|
大阪大学大学院情報科学研究科 |
| 著者所属 |
|
|
|
大阪大学大学院情報科学研究科 |
| 著者所属 |
|
|
|
大阪大学大学院情報科学研究科 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, Osaka University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, Osaka University |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Information Science and Technology, Osaka University |
| 著者名 |
開地, 竜之介
柗本, 真佑
楠本, 真二
|
| 著者名(英) |
Ryunosuke, Kaichi
Shinsuke, Matsumoto
Shinji, Kusumoto
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
バイトコードからソースコードを復元するための手法としてデコンパイラが数多く提案されている.デコンパイラの1つの課題として元のソースコードとの差異(歪み)の発生があげられる.歪みはソースコードの可読性の低下だけでなく,プログラムの振舞いの変化にもつながる可能性がある.本研究では,自然言語処理の分野で用いられる文法誤り訂正のアイデアを活用したデコンパイラの歪み修正手法を提案する.文法誤り訂正の中でも特に大規模言語モデルベースの手法を用いることで,プログラミング言語やデコンパイラの種類によらずソースコード復元における歪み修正が可能となる.実験では,識別子歪みと構造的歪みの2種類の歪みに関して,提案手法でそれぞれどの程度修正が可能かを検証した.その結果,識別子歪みでは約6割を,構造的歪みでは約9割を修正できることを確認した.一方で新たな歪みを生み出してしまうケースも確認した. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Decompiler is a system for recovering the original code from bytecode. A critical challenge in decompilers is that the decompiled code contains differences from the original code. These differences not only reduce the readability of the source code but may also change the program's behavior. In this study, we propose a large language model-based quirk fixation method that adopts grammatical error correction. One advantage of the proposed method is that it can be applied to any programming language and decompiler. In the experiment, we apply our proposed quirk fixation to two types of quirks; identifier qurks and structural qurks. The experimental results show that the proposed method removes about 60% of identifier quirks and about 90% of structural quirks. In some cases, however, the proposed method injected a small amount of new quirks. |
| 書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
| 書誌情報 |
情報処理学会論文誌
巻 65,
号 11,
p. 1576-1585,
発行日 2024-11-15
|
| ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |
| 公開者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |