@techreport{oai:ipsj.ixsq.nii.ac.jp:00211322, author = {吉川, 寛樹 and 内山, 彰 and 東野, 輝夫}, issue = {8}, month = {May}, note = {機械学習において連続値を推定する回帰問題は広く用いられており,科学やヘルスケアなど様々な分野において応用が盛んである.しかしながら実環境において収集した訓練データの分布には,しばしば偏りが発生し,特に異常時のデータは平常時のデータと比較してサンプル数が少なくなる.このような正解ラベルの分布の偏りは,機械学習における推定器の性能の低下を招く.本研究では正解ラベルの分布が偏った不均衡なデータセットに対し,機械学習を行う際の推定値の偏りを軽減するための損失関数を提案する.提案手法では正解ラベルの連続的な分布をカーネル密度推定により推定することで,データの希少性を表す関数を算出し,その関数を用いて推定誤差に重みを付けた損失関数を用いる.性能評価では,連続値を正解ラベルとし た 8 種の公開不均衡データセットに対し提案手法を適用することによる推定モデルの性能の向上を確認した.}, title = {不均衡データセットを用いた回帰問題における損失関数の検討}, year = {2021} }