@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00214499, author = {石田, 港 and 金子, 直史 and 鷲見, 和彦 and Minato, Ishida and Naoshi, Kaneko and Kazuhiko, Sumi}, book = {コンピュータセキュリティシンポジウム2021論文集}, month = {Oct}, note = {近年,Web ページのスクリプトの自由度を悪用してウイルスに感染させるなどの攻撃方法が増加している.Web ブラウザは通常,攻撃を行う悪性サイトに対して悪意を検知しアクセス前にブロックするが,それに対して攻撃者は,悪性検知を回避するための処理を施すことがあり,悪性 JavaScript に対してはスクリプトが悪意のあるものであると分からないようにスクリプトに難読化処理を施すことがある.本研究では,JavaScript に対してテキスト分類を行い,難読化の有無にかかわらず悪意のあるスクリプトを見つけることを目的とする.悪性 JavaScript を難読化の有無にかかわらず検知するために,文字レベル畳み込みニューラルネットワークを使用し,JavaScript のソースコードの特徴抽出を行い,悪性/良性の 2 クラスに分類することで,悪性 JavaScript の検知を行う.その結果,文字レベル CNN によって悪性検知のための特別な前処理を必要としない高精度な検知を行うことを可能にした., In recent years, attacks that infect users with viruses by exploiting the freedom of scripting in web pages have increased. Web browsers usually detect malicious sites and block them before accessing them, but attackers sometimes apply processing to avoid malicious detection. For malicious JavaScript, obfuscation is sometimes applied not to be recognized as malicious. In this study, we perform text classification on JavaScript with the aim of finding malicious scripts regardless of whether they are obfuscated or not. In order to detect malicious JavaScript with or without obfuscation, we use a character-level convolutional neural network to extract features of the JavaScript source code and classify them into two classes: malicious and benign. The results show that character-level CNN can provide highly accurate detection without the need for special preprocessing for malignancy detection.}, pages = {733--739}, publisher = {情報処理学会}, title = {文字レベルCNNによる悪性JavaScript検知}, year = {2021} }