Item type |
Journal(1) |
公開日 |
2024-12-15 |
タイトル |
|
|
タイトル |
単語の関連性に着目した複合語型隠語の検出 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Detection of Compound-Type Dark Jargons Using Similar Words |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[特集:社会的・倫理的なオンライン活動を支援するセキュリティとトラスト] 隠語,複合語,マイクロブログ,Twitter,Word Embedding,Word2vec |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
ID登録 |
|
|
ID登録 |
10.20729/00241632 |
|
ID登録タイプ |
JaLC |
著者所属 |
|
|
|
電気通信大学大学院情報理工学研究科/警察庁刑事局組織犯罪対策部組織犯罪対策第一課 |
著者所属 |
|
|
|
電気通信大学大学院情報理工学研究科 |
著者所属 |
|
|
|
電気通信大学大学院情報理工学研究科 |
著者所属 |
|
|
|
電気通信大学大学院情報理工学研究科 |
著者所属(英) |
|
|
|
en |
|
|
UEC / First Organized Crime Countermeasures Division, Organized Crime Department, Criminal Investigation Bureau, National Police Agency |
著者所属(英) |
|
|
|
en |
|
|
UEC |
著者所属(英) |
|
|
|
en |
|
|
UEC |
著者所属(英) |
|
|
|
en |
|
|
UEC |
著者名 |
羽田, 拓朗
清, 雄一
田原, 康之
大須賀, 昭彦
|
著者名(英) |
Takuro, Hada
Yuichi, Sei
Yasuyuki, Tahara
Akihiko, Ohsuga
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
近年,マイクロブログにおける違法薬物取引などの犯罪行為の勧誘が増加の一途をたどっており,社会的な問題となっている.こういった犯罪を取り締まるためにサイバーパトロールが行われている一方,犯罪へと誘導する投稿を行う者たちは,監視される対象となるキーワード(「援助交際」,「大麻」など)を避けるため,犯罪の意図をカモフラージュした用語,いわゆる「隠語」を駆使して,監視の目をかいくぐりながら巧妙にやり取りを続けている.これらの隠語は,監視側が一度把握したとしても,一般的に広まれば陳腐化し,新たな隠語が使われ始めるため,つねに最新の隠語を把握する労力が必要となる.これまでに,犯罪の意図で用いられる隠語を検出することを目的とし,投稿内の単語の用途の差異から隠語を検出する手法を提案し,一定の成果を上げてきた.本稿では,既存研究ではこれまで検出できなかった2つ以上の単語を結合させた複合語型の隠語を,単語の関連性を活用することで検出する手法を提案する.そして,提案手法の効果を確認するため,複合語検出実験および隠語検出実験を行った.その結果,既存手法より7パーセントポイント高い精度で複合語型隠語を含めた隠語を検出できた.効果を確認するため,7名の現役警察官へヒアリングをしたところ,検出した複合語型隠語のうち93.2%が過半数の警察官にとって未知のものであることが確認できた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
Recently, drug trafficking on microblogs has increased and become a social problem. While cyber patrols are being conducted to combat such crimes, those who post messages that lead to crimes continue to communicate skillfully using so-called “dark jargon,” a term that conceals their criminal intentions, to avoid using keywords (“drug,” “marijuana,” etc.) of the target of monitoring. Evading detection by the eyes of monitoring, they continue to communicate with each other skillfully. Even if the monitors learn these dark jargons, they become obsolete over time as they become more common, and new dark jargons emerge. We have proposed a method for detecting dark jargons with criminal intent based on differences in the usage of words in posts and have achieved a certain level of success. In this study, by using similar words, we propose a method for detecting compound-type dark jargons that combines two or more words, which have been difficult to detect using existing methods. To confirm the effectiveness of the proposed method, we conducted a detection experiment with compound words and a detection experiment with dark jargons. The experimental results showed that not only the proposed method was able to detect codewords with an accuracy of 7 persentages points higher than existing methods, but also 10 compound-type dark jargons that could not be detected by the existing method were detected. Furthermore, interviews with seven police officers confirmed that 93.2% of the dark jargons detected in the experiment were unknown to the majority of the police officers. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 65,
号 12,
p. 1735-1748,
発行日 2024-12-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |
公開者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |