@techreport{oai:ipsj.ixsq.nii.ac.jp:02000784, author = {林,辰宜 and 池田,心 and シュエ,ジュウシュエン}, issue = {12}, month = {Feb}, note = {ゲームAIは,プレイヤ間の協力を含むゲームにおいても,人間に匹敵,超越する強さを獲得しつつある.Population-based Training(PBT)では,人間のプレイデータを用いない強化学習により,様々な特性を有する訓練相手AIのプールを作成し,それらとプレイした際にゲームの主目的(スコア等)が高くなるような本番用AIを訓練する.この本番用AIは,様々な相手の癖を学習しているため,初対面の相手とプレイした際にも,相手の動きに対応して高いスコアを達成することが可能である.一方,既存手法では,主目的を追求することのみを目的とし,人間に見られるような主目的とは関係の薄い副目的は考慮されていない.本研究ではまず,主目的ではなく相手の副目的を叶えることを目指す「接待HSP」を提案する.さらに,人間同士の協力では,お互いの目的にすれ違いがあった場合に,ゲームの内外の行動でそれを伝達しようとする場合があることを踏まえ,そのような伝達行動を示すような訓練相手AIを用いることで相手の効用を識別し,より適切にAIを協調させる「不満忖度HSP」を提案する.}, title = {人間の副目的や不満を尊重する協力型ゲームAIの提案}, year = {2025} }