@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00097660, author = {北川, 竜平 and 三輪, 誠 and 近山, 隆 and Kitagawa, Ryouhei and Miwa, Makoto and Chikayama, Takashi}, book = {ゲームプログラミングワークショップ2007論文集}, issue = {12}, month = {Nov}, note = {本研究では不完全情報ゲームである麻雀においてコンピュータプレイヤの教師あり学習による評価関数のパラメータの調整を行った.評価関数としては 3 層ニューラルネットワークを用いた.麻雀のゲームの記録である牌譜を用いた学習のために,コンピュータ麻雀プレイヤが最善手と判断した手と牌譜の中で実際に打たれた手との一致度を測る目的関数を最適制御理論に基づき定義した.目的関数によって求められる値を小さくすることを目的としバックプロパゲーションによって評価関数の調整を行った.結果として,コンピュータ麻雀プレイヤが最善手と判断した手と牌譜内で打たれた手との一致率はツモ局面において約 56%,鳴き局面において約 89%であった.インターネット麻雀サーバである東風荘でのレーティングは 1318 となった., In this study, evaluation functions of a computer mahjong player were tuned by supervised learning. The three layer neural networks were used as evaluation functions. For learning by game records, object function based on an optimal control theory was dened for measuring concordance of the best move for computer game player and the selected move in game records. The evaluation functions were tuned by backpropagation for minimization of the value calculated the object function. As a result, a agreement rate of the best move for computer game player and the selected move in game records was about 56% in positions of tsumo, about 89% in positions of naki. The rating of Tonpusou that was internet mahjong server was 1318.}, pages = {76--83}, publisher = {情報処理学会}, title = {麻雀の牌譜からの打ち手評価関数の学習}, volume = {2007}, year = {2007} }