[[Research topics]] * Learning in Game-theoretic Situations [#v3287507] ** 学習のある繰り返し囚人のジレンマの解析 [#k39e1e3c] ** 学習するエージェントによる繰り返し囚人のジレンマの解析 [#k39e1e3c] -【キーワード】囚人のジレンマ,強化学習,マルコフ過程 従来、社会的ジレンマのモデルとしてゲーム理論を用い、協調行動の発生が議論されてきた。本研究では、各プレイヤーが報酬により行動を変える強化学習の枠組みを仮定し、代表的なゲームの一つである繰り返し囚人のジレンマを検討した。すべてのプレイヤーの行動履歴を状態遷移行列で表現し、そのダイナミクスを分析した。その結果、より長い行動履歴に基づき学習するほど、協調行動が安定して発生することが明らかになった。 **Related papers (See also [[other publications>Publications]]/ 関連する発表論文 ([[その他の論文など>Publications]]) [#cd693d64] #todo('',%LearningInGames%)