WEKO3
アイテム
二重ジレンマ状態での協調行動の誘発に関する意思決定手法の検討
https://ipsj.ixsq.nii.ac.jp/records/50145
https://ipsj.ixsq.nii.ac.jp/records/50145c43641ca-ce84-4b5c-b06e-007748d6ced8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-03-15 | |||||||
タイトル | ||||||||
タイトル | 二重ジレンマ状態での協調行動の誘発に関する意思決定手法の検討 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Anexaminationofemergingcooparationunderdouble-binddilemma | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
公立はこだて未来大学大学院システム情報科学研究科 | ||||||||
著者所属 | ||||||||
公立はこだて未来大学システム情報科学部 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
GraduateSchoolofFutureUniversity-Hakodate,SystemInformationScience | ||||||||
著者所属(英) | ||||||||
en | ||||||||
FutureUniversity-Hakodate,DepartmemtofSystemInformationScience | ||||||||
著者名 |
和田, 志保美
× 和田, 志保美
|
|||||||
著者名(英) |
Shihomi, WADA
× Shihomi, WADA
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 囚人のジレンマでは、パレート効率的な結果を導き出す協調行動ではなく、ナッシュ均衡をもたらす裏切り行動が確認されることが良く知られている。本論文では、囚人のジレンマをプレーするかしないかという問題自体が囚人のジレンマとしての要素を持つ「二重囚人のジレンマ・ゲーム」を用いてヒトと強化学習エージェントの実験結果を比較する。実験結果から、最終的に協調を選択する場合はヒトも強化学習エージェントもどのようなゲームをプレーするかに関する選好を示さなかった。一方、最終的に裏切りを選択する場合は、どのようなゲームをプレーするかに関する選好を強化学習エージェントが示さなかったのに対し、ヒトでは通常の囚人のジレンマをプレーすることを好んだ。このことから、適切な設計を行うことによってマシンエージェントが協調を選択し、パレート効率的な結果に到達しやすくなることが示唆される。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we compare the experimental results of human agent with that of programmed agent using double-bind prisoner’s dilemma game, which ordinary prisoner’s dilemma game is nested into another dilemma, that is, a player has to decide firstly if s / he will play prisoner’s dilemma or not. We find that when cooperation is chosen in the second stage, both human and programmed agents show any preference in what kind of 2 × 2 game they play. On the other hand, human agents are willing to play ordinary prisoner’s dilemma game when they choose defection in the second stage, though programmed agents show any preference in the first stage. This suggests that programmed agents may be cooperators and get close to the Pareto optimal equilibrium in an appropriate setting. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA11135936 | |||||||
書誌情報 |
情報処理学会研究報告知能と複雑系(ICS) 巻 2007, 号 26(2007-ICS-147), p. 89-96, 発行日 2007-03-15 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |