Item type |
Symposium(1) |
公開日 |
2024-10-15 |
タイトル |
|
|
タイトル |
大規模言語モデルを用いたクロスサイトスクリプティング攻撃の検知手法の提案 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Detection Method for Cross-Site Scripting Attacks using Large Language Model |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
防衛大学校サイバー・情報工学科 |
著者所属 |
|
|
|
防衛大学校サイバー・情報工学科 |
著者所属(英) |
|
|
|
en |
|
|
National Defense Academy of Japan |
著者所属(英) |
|
|
|
en |
|
|
National Defense Academy of Japan |
著者名 |
田中, 優樹
三村, 守
|
著者名(英) |
Yuki, Tanaka
Mamoru, Mimura
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Cross-Site Scripting(XSS)攻撃は,Web アプリケーションの脆弱性を悪用する攻撃であり,多くの被害が報告されている.対策として,自然言語処理技術と機械学習モデルを組み合わせたXSS攻撃の検知手法が提案されているが,実環境においては多くの良性サンプルを評価する必要があるため,誤検知が増加する実用性の限界が指摘されている.本研究ではこの課題を解決するため,大規模言語モデルおよび転移学習を用いたXSSの検知手法を提案する.著者らが知り得る限り,Generative Pre-trained Transformerベースの大規模言語モデルを用いた言語的特徴に基づくXSS攻撃の検知手法は存在しない.本研究では,Meta社の大規模言語モデルであるLLaMA2を用いて提案手法を実装し,実際のプロキシサーバのログを用いて精度を評価した.その結果,既存手法では良性サンプルの増加に伴い誤検知が増加するのに対し,提案手法では誤検知の増加を緩和できることを確認した.このように,大規模言語モデルおよび転移学習を用いた提案手法では,実用性の限界を突破できる可能性がある. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Cross-Site Scripting (XSS) attacks exploit vulnerabilities in web applications, and many incidents have been reported. As a countermeasure, detection methods combining natural language processing techniques and machine learning models have been proposed. However, in real-world environments, a large number of benign samples need to be evaluated, leading to an increase in false positives and raising concerns about the practicality of these methods. To address this issue, this study proposes an XSS detection method using large language models and transfer learning. To the best of the authors' knowledge, no method based on linguistic features using a Generative Pre-trained Transformer-based large language model has been proposed for detecting XSS attacks. In this study, we implemented the proposed method using LLaMA2, a large language model developed by Meta, and evaluated its accuracy using actual proxy server logs. As a result, while existing methods showed an increase in false positives with the growth of benign samples, the proposed method was able to mitigate the increase in false positives. This suggests that the proposed method using large language models and transfer learning has the potential to overcome the limitations of practical applicability. |
書誌情報 |
コンピュータセキュリティシンポジウム2024論文集
p. 1545-1552,
発行日 2024-10-15
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |