| Item type |
Symposium(1) |
| 公開日 |
2021-10-19 |
| タイトル |
|
|
タイトル |
機械学習を用いたCyber Threat Intelligenceの構造化と横断的分析 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Machine Learning-Based Cyber Threat Intelligence Construction and Crossover Analysis |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
CTI,情報抽出,固有表現抽出,関係抽出,STIX |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
株式会社日立製作所/岡山大学大学院自然科学研究科 |
| 著者所属 |
|
|
|
株式会社日立製作所 |
| 著者所属 |
|
|
|
株式会社日立製作所 |
| 著者所属 |
|
|
|
岡山大学 学術研究院自然科学学域 |
| 著者所属(英) |
|
|
|
en |
|
|
Hitachi, Ltd.. / Graduate School of Natural Science and Technology,Okayama University |
| 著者所属(英) |
|
|
|
en |
|
|
Hitachi, Ltd. |
| 著者所属(英) |
|
|
|
en |
|
|
Hitachi, Ltd. |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Natural Science and Technology, Okayama University |
| 著者名 |
藤井, 翔太
川口, 信隆
重本, 倫宏
山内, 利宏
|
| 著者名(英) |
Shota, Fujii
Nobutaka, Kawaguchi
Tomohiro, Shigemoto
Toshihiro, Yamauchi
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
サイバー攻撃の増加・巧妙化に伴い,CTI(Cyber Threat Intelligence)を収集・分析し,最新の脅威情報へ追従することがより重要となっている.一方で多くの CTI は自然言語で記述されており,分析には多くのコストを要する.加えて,様々な組織が別々に情報を発行しており,横断的な分析が困難である.そこで,我々は CTI を自動的に共通フォーマットで構造化することにより,分析を支援する CyNER の研究を進めている [7].これにより,効率化や横断的な分析の実現が期待される.本稿では,CTI の構造化における固有表現抽出の精度向上手法について述べる.評価では,サイバーセキュリティドメインのコーパスを用いて学習したモデルにより,固有表現抽出のF値を最大 2.6 ポイント向上できることを示した.また,CTI を横断的に分析し,既存のレピュテーションサイトには含まれない IOC を抽出可能なこと,97% 以上の IOC が単一の情報源にのみ含まれること,および長期的かつ複数の攻撃グループにまたがって悪用されている IOC を自動で抽出できることを示し,CyNER が CTI 分析の効率化に寄与する見込みを得た. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Cybersecurity threats have been increasing and sophisticated. In such circumstances, to keep up with the latest threat information with CTI is important. However, most of the CTI is written in natural language, which makes the analysis costly. To solve this problem, we have been studying CyNER, the method of supporting analysis by automatically structuring CTI. In this paper, we describe a method for improving the accuracy of named entity recognition in CTI structuring. Specifically, we construct a domain-specific language model to improve the recognition accuracy. In the evaluation, we showed the F-measure of named entity recognition can be improved by up to 2.6 points. We also showed CyNER can extract IOCs that are not included in the existing reputation services. We also found that more than 97% of IOCs are contained in a single source, and that some IOCs have been utilized for a long time by multiple attack groups. |
| 書誌情報 |
コンピュータセキュリティシンポジウム2021論文集
p. 906-913,
発行日 2021-10-19
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |