Item type |
Symposium(1) |
公開日 |
2024-09-10 |
タイトル |
|
|
タイトル |
大規模言語モデルを用いた広範なソースコード理解とドキュメント生成手法の検証 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Evaluation of Methods for Comprehensive Source Code Understanding and Documentation Generation Using LLMs |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
大規模言語モデル |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
トヨタ自動車株式会社 |
著者所属 |
|
|
|
株式会社NTTデータ |
著者所属 |
|
|
|
株式会社NTTデータ |
著者所属 |
|
|
|
株式会社NTTデータ数理システム |
著者所属 |
|
|
|
株式会社NTTデータグループ |
著者所属(英) |
|
|
|
en |
|
|
Toyota Motor Corporation |
著者所属(英) |
|
|
|
en |
|
|
NTT DATA Japan Corporation |
著者所属(英) |
|
|
|
en |
|
|
NTT DATA Japan Corporation |
著者所属(英) |
|
|
|
en |
|
|
NTT DATA Mathematical Systems Inc. |
著者所属(英) |
|
|
|
en |
|
|
NTT DATA Group Corporate |
著者名 |
加藤, 整
原田, 智彦
下條, ひなた
杉浦, 健一
竹之内, 啓太
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
プログラミング言語で実装されたソースコードを自然言語で理解することや,自然言語で表現することはソフトウェア開発において基本的なタスクである.大規模言語モデル(LLM)の登場以後,コード理解・ドキュメント生成を支援する実用的なモデルが提案されている.これらモデルにおいては入力となるソースコードのトークン長が LLM のコンテキストサイズに収まる場合には正しい生成結果を期待できる一方,リポジトリ全体を入力とするケースでは入力ソースコードのトークン長が LLM のコンテキストサイズを上回るため,ソースコードから適切な情報を抽出しプロンプトに与える工夫が必要となる.本研究では,広範なソースコードを LLM に入力するための複数のアプローチを検討し,生成結果を評価した.結果,2 つの OSS リポジトリを対象としたケーススタディにおいて,手法を適用しない場合と比較して,生成内容の網羅性と正確性の向上を確認した. |
書誌情報 |
ソフトウェアエンジニアリングシンポジウム2024論文集
巻 2024,
p. 137-144,
発行日 2024-09-10
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |