@techreport{oai:ipsj.ixsq.nii.ac.jp:00211716, author = {田川, 聖治 and Kiyoharu, Tagawa}, issue = {13}, month = {Jun}, note = {教師あり学習に基づく分類器の性能は,教師データ(特徴量とラベル)の内容に大きく左右される.本稿では,2 クラス問題を対象とした分類器の学習において,大規模不均衡データから教師データを生成するために 2 段階無作為抽出法を提案する.まず,大規模不均衡データでは,正常なデータに対する異常なデータの比率が極端に低いものとする.そこで,提案する 2 段階無作為抽出法では,特徴量が含まれる領域の選択と,特徴量(標本)の選択を分けることで,データの密度が疎な領域から教師データが選ばれる確率を高くする.また,分類器にサポートベクトルマシン(SVM)を用いた数値実験により,SVM の性能は一般的な無作為抽出法と比較し,提案法による教師データの方が高くなることを確認する.}, title = {大規模不均衡データに対する2段階無作為抽出法の提案}, year = {2021} }