@techreport{oai:ipsj.ixsq.nii.ac.jp:00233287, author = {松林, 勝 and 芝原, 俊樹 and 小山, 卓麻 and 田中, 政志}, issue = {3}, month = {Mar}, note = {莫大な数の Internet of Things (IoT) 機器に対して同様のサイバー攻撃を行う大規模攻撃が脅威となっている.大規模攻撃が発生した場合,IoT 機器を監視している Security Operation Center の分析官は,莫大な数の IoT 機器のアラートを分析し,類似したレポートを大量に作成する必要がある.このとき,最初に作成したレポートが,他の IoT 機器のレポートとしても再利用可能か自動的に判定(再利用判定)できれば,アラート分析とレポート作成の大部分を効率化できる.しかし,レポートの再利用判定に既存手法を応用するには,教師データの不足や精度の低さといった課題がある.そこで本稿では,大規模言語モデルと集合間類似度を組み合わせた手法を提案し,教師データが少量でも高精度なレポートの再利用判定を実現する.提案手法では,少量の教師データで fine-tuningしたSentence ALBERT を活用して,レポートとの関連度合いに基づいた重みをアラートに付与する.そして,レポートの根拠となったアラートの集合と判定対象のアラートの集合の重み付き Jaccard 係数が閾値以上であれば,レポートを再利用可能と判定する.本稿では,IoT 機器を模擬した環境で攻撃を実行しながら収集したアラートと人手で作成したレポートを用いて提案手法を評価した.その結果,教師データが少量でも提案手法の True Positive Rate (TPR) と False Positive Rate (FPR) が 80.79% と 3.00% となることを示した.また,FPR ≈ 3.0% のカットオフでは,提案手法の TPR が既存手法よりも 19% 以上高くなることを示した.}, title = {IoT向けのSecurity Operation Centerにおける大規模言語モデルと集合間類似度を用いたレポートの再利用}, year = {2024} }