人人都想好,为何结果都不好——囚徒困境
这既是一个耐人寻味的小故事,又是一个经典的经济学悖论。
警察抓获了两个重要的嫌疑犯,却只掌握了很少的证据,如果就此量刑,嫌疑犯将只受到很轻的惩罚。所以,警察就动用了这样一个办法,将两人隔离,然后分别对每个人说:
1.如果你认罪,而你的同伙沉默,那么他将被判10年监禁,而你将马上获得自由;
2.反过来,如果你的同伙认罪,而你保持沉默,那你将被判1O年,他将自由;
3.如果你们两个人都认罪,每人都将被判5年监禁;
4.如果你们两个人都沉默,你们每个人只会坐1年牢(因为警察证据不足)。
稍加分析,我们会发现,每个嫌疑犯可能面临的监禁分别是10年、5年、1年和0年。从他们的角度来说,当然希望避开10年的漫漫铁窗生涯,从而马上自由。但是,问题的关键就在这里:每个人最终的刑期并不是由他自己决定的,而是两个人一起作出选择后的结果,即需要两人共同来达成。读者如果有兴趣的话,可以设身处地,将自己置于嫌疑犯的角度去考虑,就会发现其中有许多奥妙,甚至还能体会到有关人性的问题。
当然,经济学家更关心的是其中蕴藏的博弈论原理。一般的经济学理论认为,市场中的每一个个体都希望自己的利益最大化。不过,做生意的人都不是傻子,你希望利益最大化,我也肯定如此。假设我是其中的A嫌疑犯,当然希望自己坦白从宽,而B抗拒从严,可是多年的社会经验告诉我,B肯定也会这么想。退而求其次,只坐1年监禁也不错,前提是两个人都得沉默,但是那样做我将冒极大的风险(因为B可能会招供)。思来想去,决定自己还是招供,这样避开了10年牢狱,最多也就是坐5年,而对双方都有利的1年刑期就不作指望了。
两人共坐五年牢的结果,在博弈论中被称为纳什均衡。它的定义如下:
假设N个局中人参与博弈,在给定其他人策略的条件下,每个人都会选择自己的最优策略,从而使自己效用最大化,这样所有人的策略就构成一个策略组合。纳什均衡由所有参与人的最优策略组成,并且在给定其他人策略的情况下,没有人有足够的理由来打破这种均衡。在囚徒困境中,两名嫌疑犯都希望自己的利益最大化,并且都知道对方将要采取的策略(其他人策略已经给定),结果产生了一种纳什均衡,而任何一名嫌疑犯都无力将其打破。需
这既是一个耐人寻味的小故事,又是一个经典的经济学悖论。
警察抓获了两个重要的嫌疑犯,却只掌握了很少的证据,如果就此量刑,嫌疑犯将只受到很轻的惩罚。所以,警察就动用了这样一个办法,将两人隔离,然后分别对每个人说:
1.如果你认罪,而你的同伙沉默,那么他将被判10年监禁,而你将马上获得自由;
2.反过来,如果你的同伙认罪,而你保持沉默,那你将被判1O年,他将自由;
3.如果你们两个人都认罪,每人都将被判5年监禁;
4.如果你们两个人都沉默,你们每个人只会坐1年牢(因为警察证据不足)。
稍加分析,我们会发现,每个嫌疑犯可能面临的监禁分别是10年、5年、1年和0年。从他们的角度来说,当然希望避开10年的漫漫铁窗生涯,从而马上自由。但是,问题的关键就在这里:每个人最终的刑期并不是由他自己决定的,而是两个人一起作出选择后的结果,即需要两人共同来达成。读者如果有兴趣的话,可以设身处地,将自己置于嫌疑犯的角度去考虑,就会发现其中有许多奥妙,甚至还能体会到有关人性的问题。
当然,经济学家更关心的是其中蕴藏的博弈论原理。一般的经济学理论认为,市场中的每一个个体都希望自己的利益最大化。不过,做生意的人都不是傻子,你希望利益最大化,我也肯定如此。假设我是其中的A嫌疑犯,当然希望自己坦白从宽,而B抗拒从严,可是多年的社会经验告诉我,B肯定也会这么想。退而求其次,只坐1年监禁也不错,前提是两个人都得沉默,但是那样做我将冒极大的风险(因为B可能会招供)。思来想去,决定自己还是招供,这样避开了10年牢狱,最多也就是坐5年,而对双方都有利的1年刑期就不作指望了。
两人共坐五年牢的结果,在博弈论中被称为纳什均衡。它的定义如下:
假设N个局中人参与博弈,在给定其他人策略的条件下,每个人都会选择自己的最优策略,从而使自己效用最大化,这样所有人的策略就构成一个策略组合。纳什均衡由所有参与人的最优策略组成,并且在给定其他人策略的情况下,没有人有足够的理由来打破这种均衡。在囚徒困境中,两名嫌疑犯都希望自己的利益最大化,并且都知道对方将要采取的策略(其他人策略已经给定),结果产生了一种纳什均衡,而任何一名嫌疑犯都无力将其打破。需