Item type |
Symposium(1) |
公開日 |
2021-10-19 |
タイトル |
|
|
タイトル |
能動学習に基づいたマルウェア階層的クラスタリング |
タイトル |
|
|
言語 |
en |
|
タイトル |
Malware Hierarchical Clustering Applying Active Learning |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
能動学習,IoTマルウェア,クラスタリング,平均場アニーリング |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
九州大学 |
著者所属 |
|
|
|
国立研究開発法人情報通信研究機構 |
著者所属 |
|
|
|
国立研究開発法人情報通信研究機構 |
著者所属 |
|
|
|
九州大学 |
著者所属 |
|
|
|
九州大学 |
著者所属(英) |
|
|
|
en |
|
|
Kyushu University |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Information and Communications Technology |
著者所属(英) |
|
|
|
en |
|
|
National Institute of Information and Communications Technology |
著者所属(英) |
|
|
|
en |
|
|
Kyushu University |
著者所属(英) |
|
|
|
en |
|
|
Kyushu University |
著者名 |
何, 天祥
韓, 燦洙
高橋, 健志
来嶋, 秀治
竹内, 純一
|
著者名(英) |
Tianxiang, He
Chansu, Han
Takeshi, Takahashi
Shuji, Kijima
Jun'ichi, Takeuchi
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
IoT マルウェア検体の数は,近年急速に増加し,多様化している.大量なマルウェア検体を効率的に分析するために,我々はスケーラブルなクラスタリング手法を研究している.本研究では平均場アニーリング (MFA) を用いてクラスタリングを行い,能動学習によって距離行列の極一部のみを観察する手法を実験で 3,008 検体の IoT マルウェアを用いてアルゴリズムの評価を行った.また,オンライン処理する手法を提案し,評価した.能動学習クラスタリング (Active Clustering, AC) 手法を適用することにより,距離行列全体の 2.6% のみを計算するだけでクラスタリングを行った.その結果,86.9% のファミリ名正解率と 96.5% アーキテクチャ名正解率を達成した.また,我々の先行研究の手法では距離行列の 7.2% を観測する必要があったが,AC では同程度の精度を保ちながら,観測量を 64% 削減した. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In recent years, the number of IoT malware specimens has rapidly increased and diversified. In order to effectively analyze a large number of malware specimens, our goal is to cluster from the incomplete distance matrix of the specimens. To this end, we use Mean Field Annealing (MFA) for clustering and use active data selection to determine which distance to observe actively. We also proposed an online processing method for additional collected malware. We used 3,008 IoT malware specimens for experimental evaluation. By applying the active clustering algorithm, clustering is performed by only calculating 2.6% of the entire distance matrix. The family name accuracy was 86.9%, and the architecture name accuracy was 96.5%. In addition, in our previous research, 7.2% of observations of the distance matrix were required, but the active clustering algorithm reached the same level of accuracy, with much lesser observations. The observation reduction rate was 64%. |
書誌情報 |
コンピュータセキュリティシンポジウム2021論文集
p. 1167-1174,
発行日 2021-10-19
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |