@techreport{oai:ipsj.ixsq.nii.ac.jp:00218594, author = {藤永, 淳太 and 本多, 淳也 and 土屋, 平 and Junta, Fujinaga and Junya, Honda and Taira, Tsuchiya}, issue = {24}, month = {Jun}, note = {多腕バンディット問題では,選択肢集合の中から一つの要素を選択してその確率的な報酬を得るというプロセスを繰り返し,報酬和を最大化することを目指す.この問題の方策の一つである Information Directed Sampling (IDS) は,各選択肢の報酬の期待値だけでなく,最適な選択肢の情報量に着目するので,複雑な設定に適している.しかし,各時刻で最適化問題を解くので,選択肢が組合せ的な形で表される組合せバンディットに適用すると計算量が爆発的に増大してしまう.そこで,最適化問題を DC 計画問題に連続緩和する方法を提案し,緩和による計算量削減の効果と報酬和最大化に対する影響について比較する.}, title = {組合せバンディット問題におけるInformation Directed SamplingのDC緩和について}, year = {2022} }