「こちらが裏切らない限りいい人だけど、こっちが裏切ると裏切る」

<ナッシュ均衡>

「繰り返し囚人のジレンマ」と呼ばれるゲームを紹介します。このゲームではプレイヤーはそれぞれ「協調」と「裏切り」のカードを持っていて、合図と共に同時に相手にカードを見せ合います。もし二人とも裏切る場合、二人も1万円の賞金を得る。もし二人とも協調すれば二人とも3万円の賞金を得る。もし一方が裏切り、他方が協調すれば裏切った側に5万円の賞金が与えられ、協調した側には何も与えられません。さて問題です。最も高い賞金を得るためには、どのような選択を行うべきなのでしょうか?
一試合につき200回の「囚人のジレンマ」ゲームを行い、それを計5試合行って平均獲得点を比較するというルールの大会で優勝したのが、応募されたプログラムの中でもっともシンプルな、たった三行のものでした。具体的には、初回は「協調」を出し、二回目は前回の相手と同じものを出し、以下それをひたすら繰り返す、という極めてシンプルなものだったのです。このプログラムは、相手側からすると「こちらが裏切らない限りいい人だけど、こっちが裏切ると裏切る」ことが明白で、非常に単純でわかりやすく、予測しやすいという特徴があります。まず協調し、相手から裏切られない限り協調し続けるというプログラムが、「繰り返し囚人のジレンマ」ゲームにおいては最強の戦略となる、ということはいろいろと我々に考えさせるものがあります。また、「この協調戦略は長い付き合いが想定されるケースでは有効だけれども、そうでない場合はその限りではない」という示唆もあります。(武器になる哲学)

【1冊 無料】Amazonオーディオブックに登録すると、この本が無料で読めます。通勤・通学中でも耳だけで読めるので便利です。

スポンサーリンク
ichiwakaをフォローする
スポンサーリンク
ichiwaka blog
タイトルとURLをコピーしました