WEKO3
アイテム
自己注意機構と可読文字列によるマルウェア検知モデルに対する分析
https://doi.org/10.20729/00239244
https://doi.org/10.20729/002392441113cee5-c3ea-450d-9aeb-b0d8b095be49
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2026年9月15日からダウンロード可能です。
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, 論文誌:会員:¥0, DLIB:会員:¥0 |
Item type | Journal(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-09-15 | |||||||||
タイトル | ||||||||||
タイトル | 自己注意機構と可読文字列によるマルウェア検知モデルに対する分析 | |||||||||
タイトル | ||||||||||
言語 | en | |||||||||
タイトル | Analysis of Malware Detection Model with Self-attention Mechanism and Strings | |||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題Scheme | Other | |||||||||
主題 | [特集:サプライチェーンを安全にするサイバーセキュリティ技術] 自己注意機構,マルウェア,自然言語処理,機械学習,Bag-of-Words | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||
資源タイプ | journal article | |||||||||
ID登録 | ||||||||||
ID登録 | 10.20729/00239244 | |||||||||
ID登録タイプ | JaLC | |||||||||
著者所属 | ||||||||||
防衛大学校情報工学科 | ||||||||||
著者所属 | ||||||||||
防衛大学校情報工学科 | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
National Defense Academy | ||||||||||
著者所属(英) | ||||||||||
en | ||||||||||
National Defense Academy | ||||||||||
著者名 |
菅野, 賢輝
× 菅野, 賢輝
× 三村, 守
|
|||||||||
著者名(英) |
Satoki, Kanno
× Satoki, Kanno
× Mamoru, Mimura
|
|||||||||
論文抄録 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 表層解析により実行ファイルから抽出可能な可読文字列は,マルウェアの検知に利用されている.近年の自然言語処理技術の進歩により,単語の順序を考慮した機械学習モデルによるが分類が可能となっている.先行研究では,可読文字列と自然言語処理技術を用いたモデルと出現頻度の低い単語を除外したコーパスを用いることで,未知のマルウェアを検知する手法が提案されている.しかしながら,可読文字列の順序は考慮されておらず,検知に寄与する単語も明らかにされていない.本研究では,単語の順序を保持したまま,自己注意機構を用いてマルウェアを検知する手法を提案し,さらに検知に寄与した単語を分析した.その結果,可読文字列の順序を考慮した場合の精度の最大値は,recallは0.881,F-measureは0.906であった.また,分析対象とする可読文字列の長さの最小値を変更することで,精度が向上することを確認し,順序を考慮する意義があることを示した.さらに,自己注意機構を用いて抽出した単語を分析し,マルウェアの検知に寄与する可能性がある特徴について考察した. | |||||||||
論文抄録(英) | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | Printable strings that can be extracted from executable files through surface analysis are used to detect malware. Recent advances in natural language processing technology have made it possible to classify words using machine learning models that take the order of words into account. A previous study has proposed a method to detect unknown malware by using a model that uses printable strings and natural language processing technology, and a corpus that excludes words that appear less frequently. However, the order of printable strings is not considered, and the words that contribute to detection are not clarified. In this study, we implemented a method to detect malware using a self-attention mechanism while preserving the order of words, and further analyzed the words that contributed to the detection. As a result, the maximum accuracy when considering the order of printable strings was 0.881 for recall and 0.906 for F-measure. We also confirmed that accuracy improved by changing the minimum length of printable strings to be analyzed, demonstrating that it is meaningful to consider the order. Furthermore, we analyzed the words extracted using the self-attention mechanism and considered the characteristics that may contribute to malware detection. | |||||||||
書誌レコードID | ||||||||||
収録物識別子タイプ | NCID | |||||||||
収録物識別子 | AN00116647 | |||||||||
書誌情報 |
情報処理学会論文誌 巻 65, 号 9, p. 1289-1298, 発行日 2024-09-15 |
|||||||||
ISSN | ||||||||||
収録物識別子タイプ | ISSN | |||||||||
収録物識別子 | 1882-7764 | |||||||||
公開者 | ||||||||||
言語 | ja | |||||||||
出版者 | 情報処理学会 |