哥尼斯堡,这个德国小镇以拥有 7 座令人晕头转向的小桥而著名(直到瑞士人欧拉发明图论治好了晕头症)。一个被当地人用来对时的超级宅男诞生于此,他的名字叫康德。若干年后,康德仙逝,康德的母校迎来了一位新同学,他的名字叫希尔伯特。勤奋好学的希尔伯特迅速成长为数学界的带头大哥。在风起云涌的 1920 年代,这位带头大哥为江湖侠士们编织了一个值得赴汤蹈火、万死不辞的伟大梦想:构造一个完美的(一致且完备的)形式证明系统,用以证明任何数学命题的真假。(这令人想起他的德国前辈莱布尼茨)。直到 1930 年退休时,希尔伯特仍然对此心怀壮志,他掷地有声的放言:我们必须知道,我们必将知道(Wir müssen wissen, wir werden wissen)。不到 1 年,横空出世的奥地利剑客哥德尔(Gödel)就无情的粉碎了希尔伯特的美梦。他以无可辩驳的数学严密性证明了,在任何一致的可以表达初等算术的形式系统中,总有一些真的数学命题是不可证明的;换言之,一致性和(足够的)完备性不可能同时达到,完美的的形式系统不存在。这就像当各路人马怀揣藏宝图四处寻找那个传闻中的巨大宝藏时,有个初涉江湖的无名少侠跳出来说,藏宝图是假的,宝藏根本不存在。
20 年后,一度为找工作发愁的美国人阿罗(Kenneth Arrow)撕碎了人们心中的另一张藏宝图。从柏拉图开始,人们就一直向往着一种理想社会,在这个理想社会中,贤人当政,好人当道。然而,好坏这样的价值判断因人而异,如果没有一种机制能调和众人的口味,将其整合成整个社会的统一价值,那么贤人政治就只能是痴人说梦。一种完美的整合个人偏好的投票制度,一直是各路人马竞相探寻的宝藏。
阿罗也是寻宝大军中的一员。在美国经济大萧条时代,阿罗的最高理想是当一名中学数学老师,这个很快破灭的理想成就了日后 6 个诺贝尔奖得主(除阿罗外,他的 5 个学生也陆续获得诺奖)。1940 年大学毕业后,走头无路的阿罗选择了读研,边读书边打零工,并曾一度想放弃学术,到保险公司谋个赚钱的精算师职位了却余生。苍天有眼,阿罗最终放弃了这个糟糕的念头。本科毕业 11 年后,阿罗终于拿到博士学位,其姗姗来迟的博士论文让整个学界为之震惊。
在写博士论文期间,阿罗重新发现了 18 世纪法国数学家、政治学家孔多塞(Marquis de Condorcet)发现的投票悖论:少数服从多数原则可能导致投票结果出现循环,而循环排序被认为是不可接受的。这个投票悖论经常以水果大战的面目出现。我更喜欢用西游记里的人物举例。假设如来、观音和唐僧对孙悟空、猪八戒、沙和尚 3 个人进行人事考核,考核意见如下:
如来:沙和尚 > 猪八戒 > 孙悟空
观音:孙悟空 > 沙和尚 > 猪八戒
唐僧:猪八戒 > 孙悟空 > 沙和尚
由于多数人(如来、唐僧)认为猪八戒比孙悟空好,故根据少数服从多数原则,最终考核结果为:猪八戒 > 孙悟空;同样的,多数人(观音、唐僧)认为孙悟空比沙和尚好,故最终考核结果为:孙悟空 > 沙和尚;另一方面,多数人(如来,观音)又认为沙和尚比猪八戒好,于是最终结果出现“猪八戒 > 孙悟空 > 沙和尚 > 猪八戒”这样的循环。
这个悖论一直困扰着阿罗,他没有将其看作发现阿罗不可能性定理的契机,而是认为它“十分讨厌”,无缘无故招来麻烦。不久,阿罗发现,如果人们的偏好能够在一条直线上分布,例如在政治立场中,每个人的偏好要么趋左,要么居中,要么偏右,一个偏右的人不会同时趋左,同样,一个居中偏左的人也不会同时偏右,在这种情况下,像“剪刀-石头-布”这样的投票循环就不可能出现。阿罗认为这是一个值得发表的全新发现。他兴致勃勃在一次午餐向客人介绍了自己的发现。之后他随手拿起一本《政治经济学杂志》,令他大失所望的是,其中一篇文章讲的正好就是自己的发现。一计不成,又生一计,1948 年秋天,阿罗终于发现了令世人震惊的“阿罗不可能性定理”。
阿罗认为,一个完美的投票制度至少要同时满足下面 3 个条件:
条件 1(一致同意性):如果所有人一致认为貂婵比西施好看,那么投票选出的美人榜中,貂婵也要排在西施前面。
条件 2(独立无关性):投票制度在比较貂婵和西施谁更美时,只需要知道每个人对貂婵和西施的看法(谁更美)即可,不需要知道投票者对其他无关人等(比如说杨玉环或李宇春)的看法,即使这些人也是榜单中的候选项。
条件 3(非独裁性):投票制度选出的结果不能由一个人说了算。
这 3 个条件看起来都相当自然,尽管离完美标准似乎还有相当的距离。然而,石破天惊的是,阿罗用初中生都能看懂的证明表明,即使只满足这 3 个条件也不可能办到。与之等价的结论是:任何同时满足条件 1 和条件 2 的投票制度只能是独裁制。这个结果实在太悲观,以至于阿罗根据建议在博士论文中改用了一个不那么悲观的名字:一般可能性定理(general possibility theorem)。令阿罗哭笑不得的是,在麦卡锡主义恰好大行其道的年代,这个藏头露尾的可能性定理仍然让他背上了“共产主义分子”的恶名。
需要立刻提醒的是,就像哥德尔不完备性定理被广为误解一样,阿罗不可能性定理也有严格的应用范围,不可无限推广。首先,该定理有两个隐含的前提:1、投票人数是有穷的;2、候选项至少有 3 项,这两个前提中的任何一个不满足,阿罗不可能性定理即不再成立。例如,如果候选项只有 2 项,则少数服从多数原则就能够同时满足上述 3 个条件(这也是为什么该原则被广泛使用,为什么很多国家都是两党制而不是多党制);其次,阿罗考虑的投票制度只限于对线性排序进行整合的制度,阿罗称之为社会福利函数(social welfare function)。该函数的输入是一组线序,输出是一个线序,因而不包括像记分制这样的投票制度。所谓完美的投票制度不可能,只是说完美的社会福利函数不可能。
阿罗并非没有考虑到记分制这样的投票制度,只是他固执的认为,个体偏好具有主观性,不可公度。记分制的前提是可以统一度量不同个体的偏好,而阿罗认为,对不同个体的偏好进行运算,就像 10 个苹果 + 20 个香蕉一样没有意义。虽然我和你都对貂婵打了满分 5 分,可是这能说明我俩喜欢貂婵的程度一样吗?很可能不一样,我可能超级粉貂婵,如果满分是 100 分的话,我可能会打 100 分,而你可能只会打 95 分。另外,每个人的区分能力不一样,对我来说,99 分和 98 分是不同的,而对你来说,98 分和 95 分没有分别。这好比我手里拿着游标卡尺,而你手里只有米尺,而最后却要统一按照其中一种尺子的精度将我俩度量的值汇总,这在一个严格的数学家看来形同儿戏(实际上,一个物理学家已经不允许这样做了)。相反,采用排序制尽管在实际上忽略了很多信息(如偏好程度),但在数学上却经得起严格推敲。这就是阿罗拒绝考虑记分制的理由。
阿罗将其不可能性定理扩展成了 100 多页的博士论文,但单就定理证明而言,一页 A4 纸的篇幅足以胜任。这个深刻定理导致了其后一系列不可能性定理的发现,从此江湖上出现了一个叫“社会选择理论”(social choice theory)的新门派。在 1972 年的诺贝尔华山论剑中,开山掌门阿罗获得了经济学武学分支的最高奖赏。