@techreport{oai:ipsj.ixsq.nii.ac.jp:00210117,
 author = {飯野, 和真 and 宇田, 隆哉},
 issue = {20},
 month = {Mar},
 note = {機械学習を用いて XSS 攻撃を検出する研究が行われているが，実際の攻撃データセットを使用していると主張しながら実質無害なコードを使用していたり，コードの内容が不鮮明であったり，機械学習の前処理が不適切であったりするものがある．このようなデータセットや処理方法を使用して機械学習の検出精度を論じても，実際の攻撃を同等の精度で検出することはできない．本論文では，これらの研究がなぜ不適切であるのか明らかにする．一方で，評価に使用する攻撃データをどのように用意し，どのように前処理を行えば適切となるのかについて論じる．さらに，不適切なデータセットまたは前処理と，我々が用意した適切なデータセットを適切に前処理した場合とで，精度にどれだけの差が出るのか評価した．結果として，機械学習のアルゴリズムによっては，F 値に 0.9 以上の差が出るものがあることが判明した．本研究は，機械学習を用いて XSS 攻撃検知を行う研究者が注意すべき点について論じ，また数値で評価しており，有用である．},
 title = {不適切なデータセットや処理方法を用いた機械学習によるXSS攻撃検出研究の解説と精度の比較},
 year = {2021}
}