@techreport{oai:ipsj.ixsq.nii.ac.jp:00235303, author = {楠見, 玲於 and 毛利, 公美 and 白石, 善明 and Reo, Kusumi and Masami, Mohri and Yoshiaki, Shiraishi}, issue = {2}, month = {Jul}, note = {インターネットのサービスアクセスに欠かすことのできないドメイン名は,攻撃者によってフィッシングサイトやマルウェア感染サイトへの誘導にも利用されることから,ドメイン名が悪性か否かを判定することはセキュリティ対策において重要である.本論文では,ドメインの文字列の統計的特徴と WHOIS などから得られる公開情報が含まれるある公開データセットを用いて悪性ドメイン検知を行った結果,ランダムフォレスト分類器で 0.940 の Recall と 0.968 の F1 score,統計的特徴のみを用いたランダムフォレスト分類器と XGBoost 分類器で 0.946 の Recall と 0.968 の F1 score が得られている., Domain names, which are indispensable for accessing Internet services, are also exploited by attackers to direct users to phishing sites or malware-infected sites. Therefore, determining whether a domain name is malicious or not is crucial for security measures. In this paper, we performed malicious domain detection using a publicly available dataset that includes statistical features of domain strings and publicly available information from sources such as WHOIS. As a result, we achieved a recall of 0.940 and an F1 score of 0.968 with a Random Forest classifier, and a recall of 0.946 and an F1 score of 0.968 with both Random Forest and XGBoost classifiers using only statistical features.}, title = {文字列の統計的特徴と公開情報を用いた悪性ドメイン検知}, year = {2024} }