@techreport{oai:ipsj.ixsq.nii.ac.jp:00224767, author = {梅田, 創 and 稲村, 勝樹 and 高野, 知佐 and 前田, 香織 and Hajime, Umeda and Masaki, Inamura and Chisa, Takano and Kaori, Maeda}, issue = {22}, month = {Feb}, note = {近年,既知のマルウェアはシグネチャを用いて検知可能である一方,未知のマルウェア検知ではシグネチャを用いることが困難であるといった課題がある.この課題に対して,機械学習を用いて検知を行う方法があるが,学習における大規模なデータを処理するためその処理負荷が高く,処理マシンの性能によっては,学習に膨大な時間を要する,あるいは,機械学習を活用できないという問題が発生する.これに対し,マルウェアデータセットからいくつかの特徴量を選択し,限定的なデータセットのみを学習に用いることで,処理負荷を低減する手法がある.このとき,マルウェア検知の精度が下がらないことが求められる.本研究では,機械学習に用いる特徴量を限定するための既存の評価手法をマルウェア検知の精度を重要視するよう改良を行い,既存評価手法との比較によりその効果について確認した., Recently, known malware can be detected using signatures, while it is difficult to detect unknown malware using signatures. To solve this problem, machine learning is used for detection, but it requires high machine performance to process large amounts of data in the learning process. If the performance is not high enough, it may take a large amount of time to learn, or the machine learning itself cannot be utilized. For this problem, there is a method to reduce learning processing load by selecting features and using limited datasets for learning. Here, high detection accuracy is required even if limiting datasets. In this paper, we modified an existing evaluation method for limiting the number of features used in machine learning to emphasize the accuracy of malware detection, and confirmed its effectiveness by comparing it with the existing evaluation method.}, title = {マルウェアデータセットに対する検知精度と学習負荷との関係評価手法の改良}, year = {2023} }