@techreport{oai:ipsj.ixsq.nii.ac.jp:00210117, author = {飯野, 和真 and 宇田, 隆哉}, issue = {20}, month = {Mar}, note = {機械学習を用いて XSS 攻撃を検出する研究が行われているが,実際の攻撃データセットを使用していると主張しながら実質無害なコードを使用していたり,コードの内容が不鮮明であったり,機械学習の前処理が不適切であったりするものがある.このようなデータセットや処理方法を使用して機械学習の検出精度を論じても,実際の攻撃を同等の精度で検出することはできない.本論文では,これらの研究がなぜ不適切であるのか明らかにする.一方で,評価に使用する攻撃データをどのように用意し,どのように前処理を行えば適切となるのかについて論じる.さらに,不適切なデータセットまたは前処理と,我々が用意した適切なデータセットを適切に前処理した場合とで,精度にどれだけの差が出るのか評価した.結果として,機械学習のアルゴリズムによっては,F 値に 0.9 以上の差が出るものがあることが判明した.本研究は,機械学習を用いて XSS 攻撃検知を行う研究者が注意すべき点について論じ,また数値で評価しており,有用である.}, title = {不適切なデータセットや処理方法を用いた機械学習によるXSS攻撃検出研究の解説と精度の比較}, year = {2021} }