@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00230026, author = {荒川, 亮太 and 藤田, 桂英}, book = {第85回全国大会講演論文集}, issue = {1}, month = {Feb}, note = {自動交渉の分野では,強化学習を利用して交渉戦略を獲得する研究が進められている.このような研究では,主に1対1の交渉を扱っている.自動交渉をサプライチェーンマネジメントに応用する場合,供給側と需要側の2方向に対して同時に交渉する入れ子型並列交渉を行う必要がある.このような交渉問題では,2方向の交渉を同時に考慮しながら行動選択を行う必要がある.本研究では,入れ子型並列交渉を適切に行う戦略をDeep Deterministic Policy Gradientによって獲得する.並列に行われる交渉の学習器の一部を共有することにより,効果的に学習可能なフレームワークを提案する.}, pages = {463--464}, publisher = {情報処理学会}, title = {入れ子型並列交渉問題のためのDeep Deterministic Policy Gradient}, volume = {2023}, year = {2023} }