中国热-第1部分

小说：中国热字数：每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

政治博弈（1）
密歇根大学政治学教授罗伯特·阿克塞尔罗德于20世纪70年代末举行的一次电脑程序比赛，已成为成功的社会研究的一个经典故事。它激起了人们深刻的思索，被公认为20世纪最重要的实验之一。阿克塞尔罗德当时是对国际政治形势，尤其是对核战争的危险感到担心，因而研究博弈论以及重复进行的“囚徒困境”游戏。他研究了人工智能，再研究电脑棋赛，然后想到邀请专家们以电脑程序的形式提出他们各自所主张的战略，通过多次重复的“囚徒困境”进行较量，可以有效地对这些战略作出评估。
　　在第一轮比赛中，他邀请的14位专家各自以电脑程序的形式提出自己的战略。这些专家包括政治学、数学、心理学、电脑科学和经济学的教授。阿克塞尔罗德自己又添加了“随机程序”，即以50％的概率选取“合作”或“背叛”。14种战略加上“随机战略”均一对一进行重复的“囚徒困境”比赛，即15×15共225场比赛，每一配对对弈200次。每次按照以下四种情况给每一程序打分：
　　a。“彼此合作”：各得3分；
　　b。一种情况是甲方“背叛”乙方“合作”，另一种情况是甲方“合作”乙方“背叛”：“背叛”一方得5分，“合作”一方得0分（作为易受骗者的代价）；
　　c。“彼此背叛”：各得1分。
　　“囚徒困境”是一种非合作性、非零和博弈的游戏，并不是每次都一胜一负，不是一方之所得即另一方之所失。“一方背叛”得分最高，“彼此合作”次之，“彼此背叛”再次之，“一方合作”而一方受骗则垫底，但“一方背叛”与“一方受骗”二者相加除以2的平均分低于“彼此合作”的得分：（5＋0）÷2＜3，这一点成为合作的刺激因素。“困境”在于，你不知道对方打的是什么牌，所以从利己着想，选择“背叛”最合适：你“背叛”对方“合作”，你可得5分；若对方也选择“背叛”，你仍可得1分。如此看来，理性的博弈者似乎都只会选择“背叛”，但双方都各得1分，并非最佳结果，不如“彼此合作”的各得3分。
　　在比赛中，一种战略可能达到的最高分为15000分（15×200×5），最低则是0分。但能指望得到的最高分，即200次均得3分，共600分。每次都指望对方受骗而自己总得5分是不可能的，因为对方也会以“背叛”进行报复，结果只有各得1分。
　　在全部比赛结束后，得分最高的是多伦多大学心理学和博弈论教授阿纳托尔·拉波波特所提交的“一报还一报”战略，它简便易行，即头一回选择“合作”，然后，对方选择什么，自己下一回也选择什么。
　　具有讽刺意味的是，除了“随机程序”以外，得分最差的一个程序恰恰是设计得最复杂的一种程序。15种战略中，有8种是首先选择“合作”，被列为“善战略”，另外7种战略是首先选择“背叛”，而且总想诱使对方受骗，被列为“恶”战略。最后，“善战略”总分均高于“恶战略”。书　包　网　txt小说上传分享

政治博弈（2）
“一报还一报”不仅善良，而且不刻意追求高分，又能宽容（一开始虽然报复对方，但对方态度变好了，就不再记仇）。宽容心差，就容易陷入双方老是“彼此背叛”的状态。“一报还一报”是15种战略中最简易又最善良的一种，它最后得分最高，是许多人所未想到的。“一报还一报”的特点：一是“善良”，决不首先“背叛”。二是“反应快”，对方若“背叛”，马上就以“背叛”还击，决不犹豫。三是“宽容”，对方若是态度变为“合作”，就不记前仇，立即回应以“合作”。四是“无忌妒之心”，不因对方玩弄心计一时得分高而自己也玩弄心计。五是“简便易行”，始终坚持“一报还一报”，易于坚持到底，态度明朗，对方明白了也会照样做。
　　阿克塞尔罗德总结了第一轮比赛的结果，宣布举行第二轮比赛。这次参赛的程序有63个，其中包括那个“随机程序”，还有约翰·史密斯提出的一种更宽厚的“一报还两报”，即遭到对方两次“背叛”后才予以还击。这一轮的场次不加限制，阿克塞尔罗德在他于1984年出版的《合作的进化》一书中指出这样做是因为对未来的关注可以促进合作。有些人读了阿克塞尔罗德对第一轮比赛的分析以后，研究了怎样利用那些“善战略”和“宽容战略”的方案，提出了一些新的“恶战略”，但最后还是输了。拉波波特的“一报还一报”再次获胜。得分最高的前15名中，有14名都是“善”的，而得分最少的15名当中，则有14名都是“恶”的。“一报还两报”的战略未能获胜，因为许多“恶战略”都费尽了心机来利用对方的宽容。
　　这一事实导致一个重要的发现：一种战略的成功取决于它与之较量的那些战略的性质。理查德·道金斯在他那本深受读者欢迎的《自私的基因》（1974年初版，1990年、2006年再版）一书中指出，阿克塞尔罗德举办的比赛是像橄榄球联赛一样采用了循环赛制。参赛的每一战略都需要跟别的战略交锋，全赢者才胜出。“一报还两报”若在第一轮推出，可能胜出，但是它在第二轮推出就不行了，因为第二轮“善”者比例低于第一轮。“一报还一报”能胜出，是因为“善”者在第二轮毕竟也还多于“恶”者，否则它也会败。循环制不同于道金斯所说的“进化上的稳定策略”（ESS），道金斯说，凡是种群的大部分成员采用某种策略，而这种策略的好处为其他策略所比不上的，这种策略便是进化上的稳定策略。
　　阿克塞尔罗德仍然用第二轮参赛的63种战略进行了第三轮比赛，以寻找一种能反映达尔文学说“自然选择”原则的“进化稳定策略”。在这新的一轮比赛中，63种电脑程序被列为“第一代”。“第一代”比赛结束时，记录下每一种电脑程序及其“后裔”的百分比。几代之后，有些程序比例减少，到了“第200代”，多数“恶战略”已遭淘汰，别的战略继续比赛。到了“第1000代”左右时，每一战略在总数中所占百分比停止变化，终于达到了稳定状态。在6场比赛中，“一报还一报”胜了5场。另5种类似的战略成绩也不错，其中一种在第六场获胜。有一种叫做“哈林顿”的“恶战略”熬过了“第200代”，但随后一些“善”的和“宽容”的战略败出了比赛以后，这一“恶战略”找不到它易于击败的靶子，终于在接近“第1000代”时败亡。

政治博弈（3）
阿克塞尔罗德把“一报还一报”称做“集体稳定战略”，因为当“恶战略”全部消失以后，剩下的全是“善战略”，只会彼此合作和共存。换句话说，“一报还一报”不是真正的“进化稳定策略”（ESS），尽管“恶战略”甚至是最恶的“永远背叛”（一种真正不受侵犯的ESS）都侵犯不了“一报还一报”，但“永远合作”（又称做“一味相信别人的傻子”）之类的“善战略”却能够侵犯它。罗伯特·博伊德和杰弗里·洛伯鲍姆遵循阿克塞尔罗德的研究，考察了“一报还两报”与“有疑心的一报还一报”（与“一报还一报”相同，但第一步不是“合作”而是“背叛”）二者的混合。“有疑心的一报还一报”一开始出“恶”招，引来双方“彼此背叛”，因此在“一报还一报”占绝大多数时情况不妙，但更有宽容心的“一报还两报”却让它有胜出的机会。这意味着“一报还两报”与“有疑心的一报还一报”的混合能使“一报还一报”受渗透。因此，博伊德和洛伯鲍姆认为类似的“善/宽容”与“微恶”战略的组合能有侵犯力（渗透力），在人类生活中可能亦是如此。
　　阿克塞尔罗德还通过第一次世界大战期间西线停火这一著名事例，谈到“自己活也让别人活”战略。这一事例表示“一报还一报”甚至能渗透到战争期间彼此“永远背叛”的人群之间，合作能出现在彼此毫无友谊的人群之间。在《自私的基因》一书中，道金斯进一步探讨了“永远背叛”和“一报还一报”组成的“双稳定系统”。他发现这取决于“一报还一报”的最初数量及其优于“永远背叛”的效果如何。
　　若“永远背叛”占统治地位，“一报还一报”就可能通过“亲密度”和“粘连度”而“串在一起”（这听起来颇像是中国人的关系文化，是吧？），表现为“人们倾向于继续生活在故乡及其附近”。①相形之下，“永远背叛”却做不到这一点。因此，“一报还一报”享有较高的稳定性，几千年之后可能最终在数量上超过“永远背叛”。
　　那么，以上这些想法对于理解中国的文化，尤其是理解中国的政治文化，有什么意义呢？以下几点应有助于我们理解中国政治文化的现实、中国公民文化的改善，以及未来的不同文化（包括中美两国文化）之间的合作方向。
　　一、阿克塞尔罗德研究的主题是在一个没有中央权威的利己主义者世界上出现合作的条件。在他看来，合作是有持续力的，而最大的问题是怎样让合作开一个头。促进合作的原则是“使未来比现在更加重要，改变博弈者每走一步的4种可能结果的得益；让参赛者懂得促进合作的价值、事实和技巧”。②就中国的政治社会风气而言，这几条原则似乎都不足以起作用（如交通秩序，公交秩序，以及下文分析的中国历史上代际和代中的“虎斗”和所谓海外###中的“内斗”），所以最重要的是需要核心权威的推动，这就是使合作得以开始的“第一推动力”。在无法树立权威的地方，中国人（包括海外华人）的社会就真像是“一盘散沙”。许多华人社会就因此而缺乏像样的自我组织，美国的华人社会亦是如此。
　　二、尽管“一报还一报”是“集体稳定策略”，但“一报还两报”和“有疑心的一报还一报”的混合仍可成功渗透，这说明“一报还一报”的优势有赖于每一种战略的起始比例。即使“一报还一报”一开始就占主导地位，轻微恶战略仍可存在。
　　三、作为一种真正不可渗透的“进化稳定策略”的“永远背叛”，与具有“局部集结”能力的“一报还一报”，这二者构成的“双稳定系统”，最适于用来说明中国人的“关系文化”和中国人的“有小忠而无大忠”。然而，阿克塞尔罗德的“齿轮效应”（Ratchet　effect，即认为合作使成效递增）和道金斯的“高阶稳定性”这两种观点都是意味着直线式进步的自然选择过程，其进化方向是走向日益增进的合作③，但这种看法是成问题的（不妨想想以色列—阿拉伯对抗，以及美国的反恐怖战争）。正如本章所述，中国的历史表明，在这种“进步论的进化”之内并不存在任何机制或进化基础来推动一直不停的进步，而是只有这样一个过程，它产生局部的适应，而不是全面的前进。不少人持有全球民主化的直线思维，即使“道义进步”能有明确定义，他们也需要认真琢磨上述情形，这对他们来说是极其重要的。
　　四、博弈论以及重复的“囚徒困境”实验具有令人鼓舞的启发价值。然而，“模式世界”与“现实世界”之间毕竟存在着差距，对于“现实世界”中的角色，还必须看到他们和他们的战略背后起作用的因素。

第1部分

中国热-第1部分

你可能喜欢的