@techreport{oai:ipsj.ixsq.nii.ac.jp:00213777, author = {大浦, 稜平 and 潮, 俊光 and Ryohei, Oura and Toshimitsu, Ushio}, issue = {16}, month = {Nov}, note = {線形時相論理(LTL)は定性的かつ複雑な仕様を表現できる論理体系であり,複雑な制御タスクの仕様記述において近年注目されている.筆者らは,有界設計法を用いることで,確率的離散事象システムに対して LTL 仕様を満たしつつ最大許容的な制御パターンを提示するスーパバイザの強化学習法を提案している.本報告では,提案法とベイズ推定を移動ロボットの監視問題に適用し,与えた LTL 仕様を最大確率で満たしつつ,経路コストに対するリスク指標を最小化する制御方策の設計法を提案する.また,計算機シミュレーションによって本提案法に基づき正しい方策が学習されることを示す., Linear temporal logic (LTL) is suitable for describing a complex control specification. In our previous study, for stochastic discrete event systems, we developed a bounded synthesis and reinforcement learning-based method for synthesis of supervisors that achieve maximal satisfaction probability and maximal permissiveness in the winning region. In this report, we apply the proposed method with Bayesian inference to a surveillance problem described by an LTL specification, synthesizing an optimal path that minimizes a risk factor for the cost of the transitions under the maximization of the satisfaction probability. By computer simulation, we show the effectiveness of the proposed method on the surveillance problem.}, title = {線形時相論理仕様を満たす監視ロボットの最適経路の有界設計法に基づく強化学習}, year = {2021} }