Prisoner’s Dilemma

William Poundstone in his 1993 book Prisoner’s Dilemma as:

Two members of a criminal gang are arrested and imprisoned. Each prisoner is in solitary confinement with no means of speaking to or exchanging messages with the other. The police admit they don’t have enough evidence to convict the pair on the principal charge. They plan to sentence both to a year in prison on a lesser charge. Simultaneously, the police offer each prisoner a Faustian bargain.

The possible outcomes are:

  • If A and B each betray the other, each of them serves two years in prison
  • If A betrays B but B remains silent, A will be set free and B will serve three years in prison
  • If A remains silent but B betrays A, A will serve three years in prison and B will be set free
  • If A and B both remain silent, both of them will serve one year in prison (on the lesser charge).

It is implied that the prisoners will have no opportunity to reward or punish their partner other than the prison sentences they get and that their decision by itself will not affect their reputation in the future. As betraying a partner offers a greater reward than cooperating with them, all purely rational self-interested prisoners will betray the other, meaning the only possible outcome for two purely rational prisoners is for them to betray each other, even though mutual cooperation would yield greater reward.
In this case, “to betray” is the dominant strategy for both players, meaning it is the player’s best response in all circumstances, and it is aligned with the Sure-thing principle. The prisoner’s dilemma also illustrates that the decisions made under collective rationality may not necessarily be the same as that made under individual rationality, and this conflict can also be witnessed in a situation called “Tragedy of the Commons”. This case indicates the fact that public goods are always prone to over-use.

2 thoughts on “Prisoner’s Dilemma

  1. shinichi Post author

    囚人のジレンマ
    ウィキペディア
    https://ja.wikipedia.org/wiki/囚人のジレンマ

    ウィリアム・パウンドストーンは、1993年に書いた「囚人のジレンマ : フォン・ノイマンとゲームの理論」のなかで、次のような例を挙げている(年数は異なる)。

    共同で犯罪を行ったと思われる2人の囚人A・Bを自白させるため、検事は囚人A・Bに次のような司法取引をもちかけた。

    • 本来ならお前たちは懲役5年なんだが、もし2人とも黙秘したら、証拠不十分として減刑し、2人とも懲役2年だ。
    • もし片方だけが自白したら、そいつはその場で釈放してやろう(つまり懲役0年)。この場合黙秘してた方は懲役10年だ。
    • ただし、2人とも自白したら、判決どおり2人とも懲役5年だ。

    このとき、「2人の囚人A・Bはそれぞれ黙秘すべきかそれとも自白すべきか」というのが問題である。なお2人の囚人A・Bは別室に隔離されており、相談することはできない状況に置かれているものとする。

    2人の囚人A・Bにとって、「互いに自白」して互いに5年の刑を受けるよりは「互いに黙秘」して互いに2年、合計で4年の刑を受ける方が得である。しかし、2人の囚人が「互いに黙秘」が全体の利益で得であると認識した上で2人の囚人A・Bがそれぞれ自分の利益のみを追求している限り、「互いに黙秘」という結果ではなく「互いに自白」という結果となってしまう。これがジレンマと言われる所以である。このようなジレンマが起こるのは以下の理由による。

    まず囚人Aの立場で考えると、囚人Aは次のように考えるだろう。

    囚人Bが「黙秘」を選んだ場合、自分 (=囚人A) の懲役は2年(「黙秘」を選んだ場合)か0年(「自白」を選んだ場合)だ。だから「自白」を選んで0年の懲役になる方が得だ。
    囚人Bが「自白」を選んだ場合、自分 (=囚人A) の懲役は10年(「黙秘」を選んだ場合)か5年(「自白」を選んだ場合)だ。だからやはり「自白」を選んで5年の懲役になる方が得だ。
    したがって、囚人Aにとっては,囚人Bがどのように行動するかにかかわらず自白することが最適な選択ということになる。これは囚人Bにとっても同じであるため、囚人Bも囚人Aと同じ考えによって自白することが最適な選択である。このような理由で2人の囚人A・Bは結果的に「互いに自白」という行動をとることとなる。

    重要なのは、「囚人Bが自白してしまうのではないか」という懸念や恐怖から囚人Aは自白するわけではなく、囚人Bが黙秘しようが自白しようが囚人Aは合理的に自白する、という点である。

    2人の囚人A・Bにとって「互いに黙秘」することがパレート最適であるにもかかわらず,2人の囚人A・Bがそれぞれ合理的に自白するという「互いに自白」という結果はナッシュ均衡ではあってもパレート最適ではない。

    2人の囚人A・Bが「互いに黙秘」することを「協調」と言い換え,「どちらかが黙秘しているとして自分だけが自白して釈放してもらおう」とすることを「裏切り」と言い換えたとき,結果的に両者は「裏切り」を選択することとなる。

    Reply

Leave a Reply

Your email address will not be published.