@techreport{weko_232918_1, author = "新木,優典 and 大久保,誠也 and 若月,光夫 and 西野,哲朗", title = "コンピュータUNOにおけるモンテカルロ法のREINFORCEアルゴリズムによる方策学習", year = "2024", institution = "電気通信大学大学院情報理工学研究科, 静岡県立大学経営情報学部, 電気通信大学大学院情報理工学研究科, 電気通信大学大学院情報理工学研究科", number = "30", month = "mar" }