WEKO3
アイテム
不均衡データセットを用いた回帰問題における損失関数の検討
https://ipsj.ixsq.nii.ac.jp/records/211322
https://ipsj.ixsq.nii.ac.jp/records/211322b559943b-7392-4749-8a2a-9a50776a4570
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2021 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2021-05-20 | |||||||||||
タイトル | ||||||||||||
タイトル | 不均衡データセットを用いた回帰問題における損失関数の検討 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
大阪大学大学院情報科学研究科 | ||||||||||||
著者所属 | ||||||||||||
大阪大学大学院情報科学研究科 | ||||||||||||
著者所属 | ||||||||||||
大阪大学大学院情報科学研究科 | ||||||||||||
著者名 |
吉川, 寛樹
× 吉川, 寛樹
× 内山, 彰
× 東野, 輝夫
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 機械学習において連続値を推定する回帰問題は広く用いられており,科学やヘルスケアなど様々な分野において応用が盛んである.しかしながら実環境において収集した訓練データの分布には,しばしば偏りが発生し,特に異常時のデータは平常時のデータと比較してサンプル数が少なくなる.このような正解ラベルの分布の偏りは,機械学習における推定器の性能の低下を招く.本研究では正解ラベルの分布が偏った不均衡なデータセットに対し,機械学習を行う際の推定値の偏りを軽減するための損失関数を提案する.提案手法では正解ラベルの連続的な分布をカーネル密度推定により推定することで,データの希少性を表す関数を算出し,その関数を用いて推定誤差に重みを付けた損失関数を用いる.性能評価では,連続値を正解ラベルとし た 8 種の公開不均衡データセットに対し提案手法を適用することによる推定モデルの性能の向上を確認した. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AA11515904 | |||||||||||
書誌情報 |
研究報告高度交通システムとスマートコミュニティ(ITS) 巻 2021-ITS-85, 号 8, p. 1-7, 発行日 2021-05-20 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8965 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |