@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00235824,
 author = {洪, 惠珍 and 木村, 優介 and 波多野, 賢治},
 book = {第86回全国大会講演論文集},
 issue = {1},
 month = {Mar},
 note = {近年の推薦システムでは,ユーザの次の行動を予測する系列推薦に強化学習を利用することで推薦性能が向上することが知られている.系列推薦システムにおける強化学習は,ユーザの嗜好の変化を把握することが重要であリ,その行動パターンを効率的に学習できるSoft Actor-Critic (SAC) が注目されている.しかし,SAC を系列推薦に適用すると,推薦項目の選択に対応する価値が過大評価される可能性がある.そこで,本研究ではSAC を系列推薦に適用するために,推薦項目を選択する環境とその選択に対応する価値を共有する系列推薦フレームワークを提案する.},
 pages = {437--438},
 publisher = {情報処理学会},
 title = {Soft Actor-Critic 強化学習を用いた系列推薦フレームワーク},
 volume = {2024},
 year = {2024}
}