@techreport{oai:ipsj.ixsq.nii.ac.jp:02000783,
 author = {徳永,遼太 and シュエ,ジュウシュエン and 池田,心},
 issue = {11},
 month = {Feb},
 note = {近年のノンプレイヤキャラクタ（NPC）のゲームAI研究においては，従来の「強さ」や「上手さ」の追求だけでなく，「人間らしさ」や「キャラクタらしさ」の向上にも注目が集まっている．本研究では，大規模言語モデル（LLM）を強化学習の報酬関数として利用することで，文章で表現されたキャラクタの背景設定に基づき「人間らしさ」および「キャラクタらしさ」を備えたNPCを自動的に構築する手法を開発することを目指す．「ゲーム内の場面やキャラクタの背景設定」「各キャラクタの状態」「各キャラクタの行動ログ」などを説明した文章をLLMに入力し，「その場面・キャラクタとしての，行動ログのふさわしさ」を表したスコアをLLMに出力させることによって，報酬関数として利用する．簡易的なロールプレイングゲーム風の環境において実験を行った結果，キャラクタに設定した異なる背景設定に応じた振る舞いが学習されることを確認した．},
 title = {大規模言語モデルを報酬計算に用いたキャラクタらしいNPCの強化学習},
 year = {2025}
}