| Item type |
Symposium(1) |
| 公開日 |
2023-10-23 |
| タイトル |
|
|
タイトル |
バリアンス低減連合学習手法によるネットワーク異常検知 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Variance-reduced Federated Learning on Network Anomaly Detection |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
連合学習,異常検知,悪性通信,バリアンス低減 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
NTT社会情報研究所 |
| 著者所属 |
|
|
|
NTT社会情報研究所 |
| 著者所属 |
|
|
|
NTT社会情報研究所 |
| 著者所属 |
|
|
|
NTT社会情報研究所 |
| 著者所属 |
|
|
|
NTTセキュリティ・ジャパン株式会社 |
| 著者所属 |
|
|
|
NTTセキュリティ・ジャパン株式会社 |
| 著者所属 |
|
|
|
NTTセキュリティホールディングス株式会社 |
| 著者所属(英) |
|
|
|
en |
|
|
NTT Social Informatics Laboratory |
| 著者所属(英) |
|
|
|
en |
|
|
NTT Social Informatics Laboratory |
| 著者所属(英) |
|
|
|
en |
|
|
NTT Social Informatics Laboratory |
| 著者所属(英) |
|
|
|
en |
|
|
NTT Social Informatics Laboratory |
| 著者所属(英) |
|
|
|
en |
|
|
NTT Security Japan |
| 著者所属(英) |
|
|
|
en |
|
|
NTT Security Japan |
| 著者所属(英) |
|
|
|
en |
|
|
NTT Security Holdings |
| 著者名 |
山﨑, 雄輔
深見, 匠
張, 一凡
諸橋, 玄武
西山, 泰史
神谷, 和憲
高橋, 健司
|
| 著者名(英) |
Yusuke, Yamasaki
Takumi, Fukami
Iifan, Tyou
Gembu, Morohashi
Taishi, Nishiyama
Kazunori, Kamiya
Kenji, Takahashi
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
機械学習を用いて通信ログを分析し,悪性通信の検知を行う手法が注目されている.悪性通信は希少であり,事業者間の連携により大量なデータを学習に活用することで高精度な検知モデルの学習が期待できる.しかし,通信ログの機微性を理由に,複数事業者間で連携し通信ログを一箇所に集約して機械学習モデルを訓練することは困難であった.連合学習(Federated Learning; FL)は機微性の高い分散保持されるデータを機械学習に活用可能な技術として注目を集めており,マルウェア検知など通信ドメインにも適用事例がある.しかし,FLの一般的な手法Federated Averaging(FedAvg)は,学習データの統計的性質が不均一である際に精度劣化を引き起こすことが知られている.実際,事業者の国や地域,個人や法人などの主客層などに応じて,異なる事業者の持つ通信ログデータの量や質に差が生じことが考えられ,それらの統計的性質は異なると予想される.そのため,統計的不均一性による学習精度劣化を抑制するFL手法の適用が悪性通信検知モデルの学習に有効と期待される.本稿では,統計的不均一性による学習精度劣化を抑制するFLのバリアンス低減手法を悪性通信の検知モデルの学習に適用する.大規模ISPで取得した実通信ログを用いた評価により,バリアンス低減手法が学習損失の低減に有効であることを明らかにした. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Using machine learning to detect malicious communications through network logs is a promising approach. Due to the scarcity of malicious communication, training a model using a large amount of network logs collected from multiple carriers will result in a high accuracy model. However, carriers are often reluctant to share their network logs due to confidentiality concerns, making it difficult to train a machine learning model using data collected across carriers. Federated learning is a technology that allows for the distributed data to be used to train a model without exposing the raw data. The prevalent FL algorithm, namely Federated Averaging, can face severe performance degradation when statistical heterogeneity exists among participants' data. As the amount and quality of network logs differ among carriers depending on their customers and regions, we expect that a FL algorithm that can mitigate performance degradation due to statistical heterogeneity will be effective in training a model to detect malicious communication. In this paper, we apply the variance-reduced FL algorithm to train a malicious communication detection model. We evaluate the variance-reduced algorithm using the real network logs collected from a large ISP and show that the variance-reduced algorithm effectively optimizes the objective loss. |
| 書誌情報 |
コンピュータセキュリティシンポジウム2023論文集
p. 399-406,
発行日 2023-10-23
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |