@techreport{oai:ipsj.ixsq.nii.ac.jp:00195359, author = {中山, 義人 and 森, 雅広 and 斎藤, 忍 and 成末, 義哲 and 森川, 博之 and Yoshihito, Nakayama and Masahiro, Mori and Shinobu, Saito and Yoshiaki, Naruse and Hiroyuki, Morikawa}, issue = {7}, month = {Mar}, note = {営業活動における意思決定から,営業担当者個人の経験や直感といった属人的要素を取り除くことにより,営業活動を大幅に効率化するための手段が求められている.筆者らはこの課題に対し,機械学習モデルを用いた業務意思決定支援システムの構築を試みている.これまで,営業活動の意思決定プロセスに強化学習を適用することで,受注確率の高い営業プロセスの規則性を抽出することができた.その際,営業をエージェント,顧客を環境と位置づけ,その間のやり取りをシミュレータで自動実行する案件シミュレータを開発することで,学習に必要となる十分な案件データ量を確保することができた.しかしこの案件シミュレータのモデリングでは,シミュレータのパラメータ設定範囲が固定化されており,さらには営業エージェントが環境に依存して自由度が制限されるという課題がある.そこで本稿では,案件の背景,要件,顧客のパーソナリティといった環境自体を,シミュレータで作成された案件データを利用して深層学習し,最適な価値関数や方策をプランニングするための環境モデルを構築する.さらにこの構築された環境モデルを利用して,営業エージェントとの間のシミュレーションをセルフプレイで行うことで営業エージェントの学習モデルを強化する.これにより,営業活動場面でより現実に近い理想的なリコメンドが可能となることが想定される., In the decision-making process of sales activities, the result depends greatly on the judgment of sales personnel. Therefore, the means for establishing the efficiency of sales activities throughout the organization are required by eliminating individuals' factors such as experience and intuition from the decision-making process. In order to solve this problem, we are developing the business decision support system using a machine learning model. Previous studies of applying reinforcement learning to the decision making process of sales activities have produced the extraction of regularity in sales processes with high order acceptance probability. In these studies, it was possible to secure sufficient amount of data to be required for learning by developing a simulator that positions sales as agents and customers as environment and automatically executing exchange between them. However, in modeling of the simulator, there are issues that the parameter setting range of the simulator is fixed and furthermore, the agent depends on the environment. In this paper, we construct an environmental model for planning optimal value functions and policies by deep learning of customer's environment such as background, requirements and customer's personalities. Furthermore, learning model is strengthened by performing self-play simulation with agent using this constructed environmental model. As a result, it is assumed that an ideal recommendation that is closer to reality is possible in the sales activity.}, title = {営業活動の意思決定プロセス強化における環境モデルに基づくアプローチ}, year = {2019} }