Item type |
Symposium(1) |
公開日 |
2019-10-14 |
タイトル |
|
|
タイトル |
CEMアルゴリズムを用いたマルウェアのクラスタリング |
タイトル |
|
|
言語 |
en |
|
タイトル |
Application of CEM Algorithm to Malware Clustering |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
マルウェア,クラスタリング,CEMアルゴリズム,EMアルゴリズム |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
埼玉大学大学院理工学研究科 |
著者所属 |
|
|
|
埼玉大学大学院理工学研究科 |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Engineering, Saitama University |
著者所属(英) |
|
|
|
en |
|
|
Graduate School of Science and Engineering, Saitama University |
著者名 |
レーナン, トゥアンアン
大久保, 潤
|
著者名(英) |
Tuan, Anh Le Nang
Jun, Ohkubo
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
クラスタリング手法のひとつに Expectation-Maximization (EM) アルゴリズムを用いたものがある.混合ガウス分布などを仮定したEMアルゴリズムがよく知られているが,同時期に収集できたデータ同士の類似度が高いという特徴を有するマルウェアデータに対して精度が悪くなる場合があること,年ごとに解析してしまうと全体のデータを有効活用できないこと,などの問題がある.これらの問題を解決するために,条件付き確率を利用した Conditional EM (CEM) アルゴリズムが提案されている.本研究では,時系列マルウェアデータに CEM アルゴリズムと EM アルゴリズムをそれぞれ適用し,クラスタリングの性能を比較する.その結果,特徴ベクトルの生成方法を表現力を高められるように工夫することにより,CEM アルゴリズムのほうが EM アルゴリズムよりも高い分類性能を示す可能性が示唆された. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Expectation-Maximization (EM) algorithm is one of the famous methods for clustering. It is possible to use various probabilistic models in the EM algorithm, and a Gaussian mixture model is widely used. However, some of malware data sets collected in a similar time sometimes show high similarity, and a naive application of the EM algorithm gives sometimes a low accuracy in clustering. In addition, separate analysis for each year cannot use the entire data effectively. In order to solve these problems, the conditional EM (CEM) algorithm has been proposed, in which conditional probabilities are employed. In the present paper, the EM and CEM algorithms are applied to time-series data set of malware, and comparisons of the performance are given. The numerical results indicate that the CEM algorithm show higher classification performance than the EM algorithm by using adequate feature vectors with high-power of expression. |
書誌レコードID |
|
|
|
識別子タイプ |
NCID |
|
|
関連識別子 |
ISSN 1882-0840 |
書誌情報 |
コンピュータセキュリティシンポジウム2019論文集
巻 2019,
p. 1052-1058,
発行日 2019-10-14
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |