WEKO3
アイテム
強化学習に基づく自動交渉戦略のための事前学習モデル
https://ipsj.ixsq.nii.ac.jp/records/235980
https://ipsj.ixsq.nii.ac.jp/records/235980c89a1fc2-06ad-43a4-8f85-318f2d05f062
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2024 by the Information Processing Society of Japan
|
| Item type | National Convention(1) | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2024-03-01 | |||||||||
| タイトル | ||||||||||
| タイトル | 強化学習に基づく自動交渉戦略のための事前学習モデル | |||||||||
| 言語 | ||||||||||
| 言語 | jpn | |||||||||
| キーワード | ||||||||||
| 主題Scheme | Other | |||||||||
| 主題 | 人工知能と認知科学 | |||||||||
| 資源タイプ | ||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||||
| 資源タイプ | conference paper | |||||||||
| 著者所属 | ||||||||||
| 農工大 | ||||||||||
| 著者所属 | ||||||||||
| 農工大 | ||||||||||
| 著者名 |
小林, 裕二
× 小林, 裕二
× 藤田, 桂英
|
|||||||||
| 論文抄録 | ||||||||||
| 内容記述タイプ | Other | |||||||||
| 内容記述 | 自動交渉は,AI同士が異なる利害関係や目的を持ちながら自動で交渉を行う技術である.近年,二者間複数論点交渉問題における交渉戦略の獲得のために強化学習が適用されており,その汎用性から注目を集めている.先行研究において,自動交渉戦略を獲得する汎用的なEnd-to-Endの強化学習フレームワークが提案された.しかし,適切な交渉戦略を学習するためには膨大な訓練を対戦相手や交渉ドメインごとに行う必要がある.そこで,本稿では,より短時間かつ効率的な訓練を実現するため,事前学習モデルの構築とファインチューニングのアプローチを提案する.さらに,提案したアプローチの効果を検証するための評価実験結果を報告する. | |||||||||
| 書誌レコードID | ||||||||||
| 収録物識別子タイプ | NCID | |||||||||
| 収録物識別子 | AN00349328 | |||||||||
| 書誌情報 |
第86回全国大会講演論文集 巻 2024, 号 1, p. 273-274, 発行日 2024-03-01 |
|||||||||
| 出版者 | ||||||||||
| 言語 | ja | |||||||||
| 出版者 | 情報処理学会 | |||||||||