@techreport{oai:ipsj.ixsq.nii.ac.jp:00186005, author = {田谷, 昭仁 and 西尾, 理志 and 守倉, 正博 and 山本, 高至 and Akihito, Taya and Takayuki, Nishio and Masahiro, Morikura and Koji, Yamamoto}, issue = {44}, month = {Feb}, note = {コネクテッドカーにおける高速通信を実現するため,広帯域を利用可能なミリ波帯が注目されているが,ミリ波帯の電波はマイクロ波帯に比べて距離減衰が大きいためカバレッジが狭くなる問題がある.少ない路上基地局 (RSU : Road Side Unit) だけでカバレッジを確保する手法として,マルチホップ通信が検討されているが,ミリ波通信でマルチホップ通信を利用するためには,遮蔽による通信品質の劣化への対処が課題となる.本稿では,自動運転が可能なコネクテッドカーを想定し,RSU までミリ波マルチホップで接続可能な範囲を拡大するため,LOS / NLOS (Non Line of Sight) を考慮しながら車両自身が移動して長いマルチホップリレーを構成する手法を提案する.自走ロボットによる無線センサネットワークでは移動制御に VFA (Virtual Fbrce Algorithm) がよく使用されるが,VFA は通信品質が距離に対して単調減少する単純なモデルを前提とするため,遮蔽による電力減衰が大きいミリ波通信では VFA の前提が成立せず,カバレッジ拡大は困難である.提案手法は強化学習を用いることで,複雑なミリ波通信品質のモデル化が困難であっても,車両自らが試行錯誤することで, カバレッジを拡大する移動方策を学習することが可能である.また,強化学習の状態定義として, リレー長の情報を含めることで性能を向上する.シミュレーション評価により,提案手法は一部の車両のみが移動制御対象の場合でもカバレッジを拡大でき,VFA による移動制御よりもカバレッジを拡大できることを示す., The small coverage of road side units (RSUs) is one of the challenges in millimeter wave (mmWave) communications for autonomous vehicles. A key concept of this paper is leveraging vehicles' position controllability to increase the coverages of RSUs by creating long multi-hop relays. Vehicles should be positioned where they can communicate with each other in line-of-sight (LOS) paths because the blockages of LOS paths is a crucial problem in mmWave communications. In this paper, a vehicle position control method based on reinforcement learning (RL) is proposed to avoid blockage and create long relays in order to increase coverage. RL enables vehicles to predict the future coverages achieved by their subsequent actions and therefore, its performance exceeds that of a conventional strategy which is used for moving control of wireless sensor networks. This paper also proposes state designs with information of relay length to improve the performance of increasing coverages. Simulation results confirm that the proposed method increase coverages even when not all the vehicles' positions are controllable. In addition, it is shown that a RL-based strategy achieves higher performances than gradient-based strategies.}, title = {ミリ波路車間通信のカバレッジ拡大のための深層強化学習による車両移動制御}, year = {2018} }