| Item type |
Symposium(1) |
| 公開日 |
2024-10-15 |
| タイトル |
|
|
言語 |
ja |
|
タイトル |
LLMを利用したDiscord上のサイバー犯罪関連の隠語の調査 |
| タイトル |
|
|
言語 |
en |
|
タイトル |
Investigation of Cybercrime-Related Slang on Discord Using Large Language Models |
| 言語 |
|
|
言語 |
jpn |
| キーワード |
|
|
主題Scheme |
Other |
|
主題 |
Discord,サイバー犯罪,LLM, 隠語 |
| 資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
| 著者所属 |
|
|
|
横浜国立大学大学院環境情報学府 |
| 著者所属 |
|
|
|
横浜国立大学先端科学高等研究院 |
| 著者所属 |
|
|
|
横浜国立大学大学院環境情報研究院/先端科学高等研究院 |
| 著者所属(英) |
|
|
|
en |
|
|
Graduate School of Environment and Information Sciences, Yokohama National University |
| 著者所属(英) |
|
|
|
en |
|
|
Institute of Advanced Sciences, Yokohama National University |
| 著者所属(英) |
|
|
|
en |
|
|
Faculty of Environment and Information Sciences, Yokohama National University / Institute of Advanced Sciences, Yokohama National University |
| 著者名 |
川口, 大翔
Yin, Minn Pa Pa
吉岡, 克成
|
| 著者名(英) |
Yamato, Kawaguchi
Yin, Minn Pa Pa
Katsunari, Yoshioka
|
| 論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,DiscordやTelegramなどのソーシャルメディアプラットフォームにおいて,ハッキングコミュニティの活動が活発化している.これらのコミュニティでは,隠語が重要な情報の隠蔽に使用されることが多い.隠語の特定は,コミュニケーションの文脈理解,新たなコミュニティの発見,および攻撃者の性質理解に重要である.しかし,隠語は時間とともに変化するため,柔軟な検出手法が求められる.本研究では,近年精度が向上している大規模言語モデル(LLM)を用いた隠語抽出手法の有効性を検証した.LLMによる隠語抽出の先行研究は存在するが,SNSプラットフォーム上のサイバー犯罪関連データに特化した研究は限られている.そこで,Discordから収集したサイバー犯罪関連の会話データを用いて,複数のLLMモデルの性能を評価した.その結果,本タスクに適したLLMモデルを特定した.さらに,収集したデータの分析により,Discord内で使用されているサイバー犯罪関連の隠語の一部を明らかにした. |
| 論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In recent years, hacking communities have become increasingly active on social media platforms such as Discord and Telegram. In these communities, slang is often used to conceal important information. Identifying slang is crucial for understanding communication context, discovering new communities, and comprehending the nature of attackers. However, as slang evolves over time, flexible detection methods are required. This study examines the effectiveness of slang extraction methods using large language models (LLMs), which have shown improved accuracy in recent years. While previous research on slang extraction using LLMs exists, studies focused specifically on cybercrime-related data from social networking platforms are limited. Therefore, we evaluated the performance of multiple LLM models using cybercrime-related conversation data collected from Discord. As a result, we identified the LLM model best suited for this task. Furthermore, through analysis of the collected data, we revealed some of the cybercrime-related slang used within Discord. |
| 書誌情報 |
コンピュータセキュリティシンポジウム2024論文集
p. 222-229,
発行日 2024-10-15
|
| 出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |