@techreport{oai:ipsj.ixsq.nii.ac.jp:00209555, author = {何, 天祥 and 韓, 燦洙 and 伊沢, 亮一 and 高橋, 健志 and 来嶋, 秀治 and 竹内, 純一 and Tianxiang, He and Chansu, Han and Ryoichi, Isawa and Takeshi, Takahashi and Shuji, Kijima and Jun’ichi, Takeuchi}, issue = {18}, month = {Feb}, note = {IoT デバイスの発展に伴い,様々な IoT マルウェアの亜種や新種が急増し社会的問題を引き起こしている.先行研究で我々は,マルウェア解析者の負担を減らすことを目的として,高速なマルウェアクラスタリングアルゴリズムを提案した.正規化圧縮距離を用いて全データ間の類似度を表す距離行列の極一部のみを計算し,効率的に系統樹を作成し,階層的クラスタリングを行うものである.しかし,先行研究のクラスタリングアルゴリズムは大規模な系統樹に対して精度が落ちる問題がある.本稿では,先行研究におけるクラスタリングアルゴリズムを最小記述長原理によるクラスタリングへ改良を行い,大規模なマルウェア検体セットを用いてスケーラブルなクラスタリングの精 度評価を行う.65,494 件の IoT マルウェア検体を用いた結果,従来手法である近隣結合法より 97.52% の計算量を削減でき,先行研究よりクラスタリング精度を約 5% 向上させ,95.5% の正解率を達成した.}, title = {高速な系統樹構成アルゴリズムにおけるスケーラブルなクラスタリング評価}, year = {2021} }