Item type |
Journal(1) |
公開日 |
2021-09-15 |
タイトル |
|
|
タイトル |
専門家の知見に基づいた特徴量設計によるIDPSシグネチャ重要度分類 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Classification of IDPS Signature Importance with Feature Engineering Based on Expert's Knowledge |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[一般論文] 機械学習,特徴量設計,Snort,IDPS,シグネチャ,tf-idf |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
ID登録 |
|
|
ID登録 |
10.20729/00212763 |
|
ID登録タイプ |
JaLC |
著者所属 |
|
|
|
NTTネットワークサービスシステム研究所/北陸先端科学技術大学院大学 |
著者所属 |
|
|
|
NTTネットワークサービスシステム研究所 |
著者所属 |
|
|
|
北陸先端科学技術大学院大学 |
著者所属(英) |
|
|
|
en |
|
|
Network Service Systems Laboratories, NTT / Japan Advanced Institute of Science and Technology |
著者所属(英) |
|
|
|
en |
|
|
Network Service Systems Laboratories, NTT |
著者所属(英) |
|
|
|
en |
|
|
Japan Advanced Institute of Science and Technology |
著者名 |
川口, 英俊
中谷, 裕一
岡田, 将吾
|
著者名(英) |
Hidetoshi, Kawaguchi
Yuichi, Nakatani
Shogo, Okada
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
IDPS(Intrusion Detection and Prevention Systems)を実現するうえで,悪性通信のパターンファイルであるシグネチャの管理コストが増加する.本研究はそのコスト軽減を目的としており,機械学習によるシグネチャの自動分類モデルを提案・評価する.自動分類の精度向上のため,専門家の知見を参考に,シンボル特徴量(SF),キーワード特徴量(KF),WEB-MSG特徴量(WMF)の3つを提案する.実験には,専門家が作成した (i) If/Thenルールに適合するデータセット,(ii) If/Thenルールで分類できないデータセットの2つを用いる.提案した特徴量が有効であることを,複数の機械学習分類モデルを用いた実験で示す.balanced-accuracyを計測した結果,SFとKFを用いた場合(i)では95.7%の性能を確認できたものの,(ii)では59.6%という結果だった.一方で,提案するSFとWMFも組み合わせることで,(ii)においても86.8%の精度を得ることができた.また,追加実験により分類に有効な特徴量を明らかにした. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In order to realize IDPS (Intrusion Detection and Prevention Systems), the management cost of signatures, which are pattern files of malicious communication, increases. In this study, we propose and evaluate an automatic classification model of signatures using machine learning to reduce the cost. In order to improve the accuracy of automatic classification, we propose three types of features: symbol features (SF), keyword features (KF), and WEB-MSG features (WMF) based on the experts' knowledge. We use two datasets in our experiments: (i) data sets that can be classified by the expert-created If/Then rule, and (ii) data sets that do not match the If/Then rule. The effectiveness of the proposed features is shown in experiments using several machine learning classification models. Using the dataset (i), the balanced accuracy was 95.7% for the combined features of SF and KF. In (ii), the accuracy of the model trained with SF and WMF was 59.6%. On the other hand, by combining the proposed SF and WMF as well, we obtained an accuracy of 86.8% in (ii). Additional experiments revealed features that are useful for classification. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 62,
号 9,
p. 1575-1585,
発行日 2021-09-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |