WEKO3
アイテム
言語的特徴に基づくクロスサイトスクリプティング攻撃の検知手法の限界
https://doi.org/10.20729/00239245
https://doi.org/10.20729/00239245cea2e8b8-422e-430e-b0c5-51f1bd58a90e
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2026年9月15日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, 論文誌:会員:¥0, DLIB:会員:¥0 |
Item type | Journal(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-09-15 | |||||||||
タイトル | ||||||||||
タイトル | 言語的特徴に基づくクロスサイトスクリプティング攻撃の検知手法の限界 | |||||||||
タイトル | ||||||||||
言語 | en | |||||||||
タイトル | Limitations of Cross-site Scripting Attack Detection Methods Based on Linguistic Features | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | [特集:サプライチェーンを安全にするサイバーセキュリティ技術] XSS,LSTM,Attention機構,自然言語処理 | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||
資源タイプ | journal article | |||||||||
ID登録 | ||||||||||
ID登録 | 10.20729/00239245 | |||||||||
ID登録タイプ | JaLC | |||||||||
著者所属 | ||||||||||
防衛大学校情報工学科 | ||||||||||
著者所属 | ||||||||||
防衛大学校情報工学科 | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
National Defense Academy | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
National Defense Academy | ||||||||||
著者名 |
中川, 勇輝
× 中川, 勇輝
× 三村, 守
|
|||||||||
著者名(英) |
Yuki, Nakagawa
× Yuki, Nakagawa
× Mamoru, Mimura
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | クロスサイトスクリプティング(XSS)攻撃はWebアプリケーションの脆弱性を突いた攻撃であり,様々な被害が報告されている.これに対し,自然言語処理技術および機械学習モデルを組み合わせてXSS攻撃を検知する手法が提案されている.しかしながら,分類に寄与した特徴の分析や,良性サンプルが多い実環境における精度の評価は不十分である.そこで本研究では,Attention機構を用いて単語の重みを分析し,XSS攻撃の検知に寄与する言語的特徴を調査する.さらに,実際にXSS攻撃が発生する環境を模擬し,テストデータに大量の良性サンプルを追加した場合の精度の変化を分析する.機械学習モデルは,LSTM(Long Short Term Memory)およびAttention機構を組み合わせて構築した.検証実験では,2種類のデータセット(良性計:63,477件,悪性計:47,072件)に加え,実際のプロキシサーバのログから抽出した482,780件の良性サンプルも用いた.検証実験の結果,機械学習モデルは典型的なXSS攻撃の特徴であるスクリプトタグを構成する記号および文字列に着目しており,言語的特徴が攻撃の検知に寄与することを確認した.また,テストデータの良性サンプル数を約6倍に増加させると,F1スコアが0.45まで低下することを確認した.したがって,言語的特徴に基づくXSS攻撃の検知手法の有効性には限界があるものと考えられる. | |||||||||
論文抄録(英) | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | Cross-site scripting (XSS) attacks are attacks that exploit vulnerabilities in web applications, and various damages have been reported. In response, methods have been proposed to detect XSS attacks by combining natural language processing technology and machine learning models. However, analysis of the features that contribute to classification and evaluation of accuracy in real environments with many benign samples are insufficient. Therefore, in this study, we analyze the weight of words using an Attention mechanism and investigate linguistic features that contribute to the detection of XSS attacks. Furthermore, we simulate the environment in which XSS attacks actually occur and analyze changes in accuracy when a large number of benign samples are added to the test data. The machine learning model was constructed by combining LSTM (Long Short-Term Memory) and Attention mechanism. In the verification experiment, in addition to two types of data sets (benign: 63,477 and malicious: 47,072), we also used 482,780 benign samples extracted from actual proxy server logs. As a result of verification experiments, we confirmed that the machine learning model focuses on the symbols and character strings that make up script tags, which are the characteristics of typical XSS attacks, and that linguistic features contribute to attack detection. We also confirmed that when the number of benign samples in the test data was increased by six times, the f1 score decreased to 0.45. Therefore, there is a limit to the effectiveness of XSS attack detection methods based on linguistic features. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AN00116647 | |||||||||
書誌情報 |
情報処理学会論文誌 巻 65, 号 9, p. 1299-1308, 発行日 2024-09-15 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 1882-7764 | |||||||||
公開者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |