 note = {Webブラウザを攻撃対象とする悪性サイトが増加している.この脅威に対し,Webサイトを巡回し,悪性サイトを発見するクライアント型ハニーポット技術が研究開発され,攻撃情報が収集されている.しかし,ハニーポットで網羅的に巡回するには多大なリソースを必要とするため,より効率的にWebサイトを巡回するべきである.そこで本研究では,悪性サイトのIPアドレス,WHOIS,FQDN文字列の情報から統計的特徴ベクトルを作成し,教師あり機械学習を適用することで,最適な巡回リストを生成する技術を提案する.実データを用いた評価の結果,提案手法はより多くの悪性サイトを含む巡回リストを生成可能であることがわかった., Malicious websites that attack web browsers have become one of the most serious threats. To collect attack information for protective use, client honeypots have been developed. However, the attack information that can be collected by a honeypot is limited. This paper proposes a new method for collecting attacks more effectively. Our method makes use of IP addresses, domain names, and FQDN strings and it constructs a statistical feature vector. We apply a supervised machine learning to generate a URL list with crawling priority. We validate that our new method can generate an effective URL list for client honeypots.},
