博弈论方法实用13篇

首页 > 精选范文 > 博弈论方法

博弈论方法实用13篇

时间：2024-02-17 11:23:52

博弈论方法篇1

一、博弈实验的历史发展

博弈论是研究理性人互动的理论，或者说是交互决策的理论。其最初的思想产生于20世纪初，而真正获得发展是在50年代以后。从1928年冯·诺依曼证明博弈论的基本原理，宣告其正式诞生至今，博弈论已发展成为一门具有较完善的理论体系的具有工具性质的演绎性学科，对社会、经济等诸多现象都具有强大的解释力。正是由于博弈论这种“解析性的”强大解释力，往往又被普通大众神圣化为万能药方，似乎它应该也可以解决所有的理论映射到的决策问题。然而现实中它的预测结果和现实情况有很大的差别，这使人对博弈论产生了质疑。博弈论学者们为了解释和解决这个问题，做了一系列的研究，其中实验是最重要的研究方法。

最早的博弈实验产生于经济学实验。而最早的真正意义上的博弈实验则产生于20世纪50年代。1950年，约翰·纳什（John Nash）利用不动点定理证明了均衡点的存在，并将博弈论引进议价行为模型，进行了纯议价博弈实验。1951年，莫斯特勒（Mosteller）和挪杰（Nogee）用实验研究了在不确定条件下的个人偏好（选择）问题。1952年，美尔文·爵烁和莫莱尔·弗莱尔（Melvin Dresher and Merrill Flood）进行了著名的“囚徒困境”实验。1957年，托马斯·谢林（Thomas Schelling）进行了信息对称下的博弈实验，发现暗示可能产生明显的在协商中起重要作用的因素。

20世纪60年代，Suppes and Arkigson（1960）进行了一系列的实验。他们的实验不是直接去检验博弈论假定，而是进行关于策略环境的研究，以验证在博弈情形下简单学习理论的预期力量。其中，比较有代表性的是1962年拉弗（Lave）、1965年拉伯帕特（Rapuport）和查姆（Chammab）进行的实验。拉弗等人的实验研究发现，在“囚徒困境”的一次性实验（非重复性实验）中，存在一定程度合作的稳定性，而且这种合作稳定性的概率在大于0与小于100%之间。事实上，很多实验是被用来解析对合作稳定性产生影响的因素的。

20世纪70年代，博弈论本身继续发展。而进入20世纪80年代之后，实验博弈论自身开始慢慢得到更多研究者的重视。这一时期，考尔曼（A·Coleman）则对一次性“囚徒困境”博弈的实验提出质疑，认为许多被人们当作一次性博弈进行分析的实验，实际上都是各种类型的重复性博弈（非一次性博弈），但在具体分析时却被人们用一次性博弈的规则来解释有关问题。因此，考尔曼曾于1983年列举了多达1500项实验工作，结果是多数情况下证实了纳什均衡策略行为的存在，尤其是单一纳什均衡在单阶段标准型博弈中的解释力量。

20世纪90年代，对公共地悲剧博弈的实验研究得到实质发展。1990年，Gardner等人为讨论公共地悲剧问题设计了一种共享机制进行多时段（20～30时段）的实验。其间，道斯（R·Dawes）则对公共地悲剧和公共利益捐助问题进行了N个人的囚徒难题的实验室模拟，也得到了与考尔曼类似的结果。

在博弈论实验中，真正对理性人假定提出挑战的是最后通牒博弈及其实验。最早的实验始于德国柏林洪堡大学，1982年，德国经济学家Gth、Schmittberger和Schwarz等人设计了最后通牒博弈实验。1988年，为了进一步区分提议者慷慨方案背后的动机是担心被拒绝还是纯粹的利他主义，Forsythe等人也进行了实验，只是对最后通牒博弈的分配规则做了一个变化。随后在1994年，Forsythe等人在他们原有实验基础上又进一步做了独裁者博弈实验。同年，Hoffman等人进行了双向蒙蔽实验，证明了独裁者在蒙蔽的条件下分出的钱更少。此后，许多学者对此都相继做了实验研究，在这方面的实验研究成果相当丰富，但是无一例外的是，实验的结果都不完全符合于理论解。最后通牒博弈实验显示参与者并不是追求利益最大化的绝对理性者。

另一个较有代表性的博弈实验是选美博弈实验。尽管此类博弈实验的研究出现较晚，但也在实验博弈论中占有重要的位置。其思想来源于1936年凯恩斯（Keynes）对股票市场所做的一种类比。后来，Nagel（1995）、Ho、Camerer、Weigelt（1998）将其设计成一个简单的选美比赛博弈：“N个参与者同时在〔0，100〕中选择一个数字Xi，计算所有数字的平均数再乘以一个小于1的系数p（比如说p=0.7），将得到的数值（即平均数的70%）与每个参与者的选择相比，最接近的参与者就获得一笔支付”，并对其做了实验研究。之后，豪、凯莫勒与维格尔特（Ho、Camerer and Weigelt，1998）也做了类似的实验。他们的实验结果显示，大多数参与者估计的平均数是50，因而会选择35，又或者估计其他人也会考虑到这一步而选择245。他们的实验结果与Nagel等人的实验结果一致，均偏离了博弈论的预测解。选美博弈的实验结果从另一个层面质疑了绝对理性假定，说明参与者并不具备无限的推理能力，而且博弈结构及参与者的理性也并不是参与者之间的公共知识。

可以说博弈实验从产生至今，已取得了丰富的成果，对博弈论的研究起了很重要的作用。它的产生对博弈论来讲，具有重要的方法论意义。

二、博弈实验产生的原因分析

博弈实验的产生既是博弈论研究发展的需要，也是因为博弈实验自身的方法论价值。

首先，博弈实验的产生源于博弈论自身存在的问题。博弈论的魅力在于它的普适性和数理精确性，在于它能够演绎推出所有参与者均衡的推荐解，得知参与者如何行动才是合理的。只要其他参与者都按照均衡解行动，那么参与者的任何背离都不会产生额外的支付。但是实际上这种预测几乎不可能达到。博弈论的逻辑无矛盾性使得问题的矛头直接指向了其理论假定，直接涉及博弈论的基础。因此，博弈论研究者们显示出极大的热情要去使理论至少与一些现象相衔接。但是当他们投入极大的精力去发现这种衔接性时，却发现传统理论分析方法并不能提供多少帮助，这种冲突始终存在。这就迫切需要一种超出传统的理论分析方法的方法、用证据辅佐理论的方法。而这种既可验证理论又可分析改进理论的方法就是实验方法。通过实验可以给博弈论的理论研究提供大量的信息、数据证据。而这些正是构筑博弈论的肥沃土壤。

其次，从科学方法论的角度来看，任何一个理论都会遵循一个历史发展的规律，从不完善到完善，从理论到验证，最终服务于实践。其中，实验是验证理论、寻找问题、改善理论或者证伪一个理论的重要手段。博弈实验亦是如此。这一规律是任何科学，甚至于数学这样的基础学科都必须遵循的历史规律，从科学发展的初期就被认识到了。“例如在《关于两门新科学的对话》中，萨尔维亚蒂推演出落体定律后，辛普利西奥要求用实验验证这种关系。伽利略通过萨尔维亚蒂回答说，‘作为一个科学家，你提出的要求是十分合理的；因为这是把数学证明应用于自然现象的那些科学的习惯，并且这样做也是正当的。’”[1]（P54）像物理学在亚里士多德前后，大多都是理论分析推演得出的，但是随着理论发展的需要，开始大量地引入实验，并且最终从实验室中发展到付诸实践，进而又推动了技术的发展一样。博弈论也会经历这样一个理论发展的历史过程。利用实验方法研究博弈问题其实早在博弈论发展初期就已经有了。只是初期研究者的实验具有科学确证的感觉，希望用实验验证理论。但是实验结果却对博弈论提出了质疑。因此后来的实验不仅用于验证博弈理论，也用于发现新的理论内容和影响因素。

再者，实验自身具有其他任何方法都无法取代的优势。根据实验的定义，一个实验是对一个现象的仔细计划和完全可复制的观察。实验的目的是作为理论的试验台。根据此定义，博弈实验就是相对于特定的性能、为学习策略行为的一般原则的实验。这种实验往往是通过精心设计的用货币诱发真人被试的可控实验室实验。其尽可能复制真实的现场环境，从而直接检验受试者如何进行有效决策。在实验中，博弈通常以最纯化、简化的抽象形式给出。实验对象（参与者）做一个简单的决定，并且知道他们的决定和其他实验对象的决定如何共同决定货币支付。在实际实验中，实验对象会根据他们的表现获得货币或筹码奖励。这就使得研究者可以通过人为的方式控制待检验的因素，直接的检测最核心的影响因子。

最后，博弈论家们自身的渴望和需求也是产生博弈实验的重要原因。任何学者，面对外界的质疑，都不可能无动于衷。对一个理论的认可，是对这个理论研究者的最大褒奖。如果一个理论被怀疑，那么无疑是理论研究者所面对的最大的问题和否定。学者可以对这种质疑无动于衷，但是他的理论势必要接受历史和实践的检验，一旦被证伪，终究被淘汰。因此，任何学者提出理论，不仅是要推出自己的研究成果，要大众分享这个成果，更希望其能被实践支持，服务于现实世界的需要。所以，不管是为了验证理论、改进理论，还是为了面对现实的偏见，以摆脱这种遭受现实偏见的痛苦，都需要实验，毕竟实验例证得出的结论能给人一种可信的感觉。在证据面前，理论才更具有说服力和解释力。所以说博弈实验的产生亦是博弈论研究者主观上的强烈诉求。

三、博弈实验的特征

博弈实验的主要特征有三个：“人”的主体性、可控制性和可复制性。“人”的主体性是博弈实验特有的显著特征，决定了博弈实验在方法论中的基础地位，而可控制性和可复制性则是实验的共有特征。

“人”的主体性是指博弈实验的研究主体是真实的“人”。正如引用Sugden对实验经济学的定义一样，博弈论也是“有人在其中的理论”。在博弈实验中，研究者将具有自身背景、情绪状态等等的真人放入实验室，让他们在里面面对真实的决策，通常又以真实的货币或筹码作为奖励，使得研究者的焦点从均衡直接转移到参与者本身的决策行为上。尽管真实的“人”更难以把握，受到的干扰更多，但是对于博弈论的本质和研究主体来看，博弈实验的这种性质使得它在方法论意义上具有独特的作用。研究真实的“人”的实验对观察人在博弈中的真实反应和选择以及均衡的收敛有很重要的作用。这是任何计算机模拟和理论解析方法所不具备的优势。同时，“人”涉及所有与人相关的内容，使得博弈实验的研究内容比其他实验更具有广泛性。其研究对象尽管是真实的“人”的策略均衡问题，但是实际上涉及的内容可以涵盖行为、心理等诸多内容。博弈实验研究的博弈模型可以应用于任何“人”的策略问题，不仅可以用于经济学，也可以用于其他社会科学。而且博弈实验在研究均衡的过程中，不仅涉及人的理性问题，也涉及人的偏好、心理、文化等诸多因素问题。因此比其他实验研究的内容更为广泛，实用性更强。

可控制性是指对实验条件的操纵，是对复杂的博弈模型的高度简化。研究者在简化了的实验室环境中，可以有意识地投入某些刺激变量或改变其间的组合，使得对参与者的行为特征及其结果的精确测量成为可能，进而能对相关的博弈理论或背景做出有效验证和评估。博弈论基于严格的假定，往往又是简化的博弈模型，那么问题的关键就在于这个假定可靠么？如何检验这个假定和博弈模型的预测结果？当例证与理论不一致时，就一定是理论有误么？答案肯定不是靠演绎分析就能回答是与否的。而主要的问题在于不清楚到底有哪些因素，这些因素之间的关系及究竟是哪些因素在实际发挥影响。由于博弈论研究的主体是“人”，博弈预测敏感地依赖于参与者的选择。这些问题的回答必须将其中所有的影响因素抽象为变量，进而控制这些变量，建立实验模型，从而通过实验结果验证回答上述所有的问题。实验的可控制性是实验能否成功的关键。博弈实验主要是“实验室实验”（laboratory experiment），而并非“现场实验”（spot experiment）。“实验室实验”比“现场实验”更容易控制，成本低廉且可靠性高。尽管实验环境比“现场实验”中的环境简单得多，但是更具有定向性和针对性，是对最核心、最基础的理论部分的验证。正如著名经济学家普洛特（CRPlott）所回答的那样，“一个理论若经受不住简单实验，则更无理由相信它能与更为复杂的自然环境相吻合。”[2]

可复制性是指其他研究者是否能够重新进行同样一个实验，并由此证实某个单独发现。实验设计和实验数据都是公开的，往往都具有相对固定的模式和程序，任何人都可以重复类似的实验。同时可以根据需要改进某些实验细节或变量，在原来的实验基础上寻求新的发现。这些实验所得数据都是高度可比较的。这样一来，就可以展开一种理论与证据的对话，这种对话可以促成一连串的证据链条或者理论思想，产生发展理论所需的累积性的证据资料库。如果某种结果或者结论可以在各个独立的实验中反复得到，那么这种结论相对就是可靠的，在这种结论之上的理论会让我们更有信心，同时，这些数据是高度可比较的，所以说，实验正是由于这种可复制性，使得博弈论体系内的实验不是零散无关联的。相反，是互相联系、互相推动的。博弈实验的证据可以形成一个强大的网络，无地域性地供所有的研究者使用。这种证据链的比较性可以使其更容易发现博弈问题和核心影响因子，找出核心的问题症结，以促进新的理论发展。可重复性还可以给参与者学习的机会，使得实验者研究参与者的学习问题。此外，或许只有可重复性才能研究博弈均衡的收敛条件和实际可能情况。

四、博弈实验的方法论意义

博弈实验对研究博弈论具有不可替代的方法论意义。一是因为博弈实验自身的优势。二是因为博弈论自身的局限。

简单地说，运用博弈实验具有三大显著优势：一是可以以最简单的博弈形式，检验最核心的理论问题。这种简化、纯化看似简单，往往只需假定规则就可以做出预测。但是，正是这种抽象简化，提取的假定、变量都是明确的。一旦预测有误，就可立马知道哪些假定不符，而结果通常会提示给研究者一个能使预测更准确的替代性变量或假定。二是实验为博弈论提供了一个检验场所，是检验理论预言是否有效及其有效性范围的工具。为检验理论和发展新理论提供了有用的信息资料和数据。三是运用实验的方法不仅可以回答“是什么”的问题，还能回答“为什么”的问题。一般说，无论是观测法还是调查法，都只能回答“是什么”的问题，而实验方法则在此之上还具有可以回答“为什么”的优势。因为博弈实验是可以设计的，我们可以根据要探讨的现象，设计适当的博弈模型，进行相应的模型实验。可以通过变量控制，来分析影响博弈的因素及其相互关系。

而博弈论自身的缺陷及其传统研究方法的不足，使得博弈论研究方法必须有所改进和发展。从科学的意义上讲，博弈实验正是这样一种通过有目的地调整变量、动因及其组合，以研究博弈论的研究方法，对博弈论具有方法论上的意义。这种方法论上的意义主要体现在其特有的实验优势上。而这些优势主要来源于其自身的实验特征，这些特征是其他任何研究方法所不具备的。正是博弈实验的三个特征，使得其具有重要的方法论意义。其研究内容可以为几乎所有涉及“人”的问题提供参考。博弈研究者可以通过对博弈模型的简化和纯化处理，用可以控制的实验室环境来模仿真正的博弈环境，研究人们的决策行为。通过博弈实验，可以进行理论检验。检测观察值与理论预期值的符合情况，同时保证这种符合不是随机造成的。寻找博弈论预测失败的原因及其影响因素和解决的办法，建立检验性的规律作为博弈论新理论的基础。同时，可以进行环境比较，通过改变实验的环境，观察改变前后的结果，比较不同环境对结果的影响。使研究者在相当广泛的范围内取得对个体决策行为特征的精确把握，获得诸多假定的有效检验，在多种变量间寻求经验规律。在博弈理论与现实之间的鸿沟上架起一座新的也是较为可靠的桥梁。因此，博弈实验对博弈论来讲，具有其他的研究方法无法比拟和超越的方法论意义。

博弈论自身的缺陷需要博弈实验来进行分析研究。博弈实验的结果不仅对博弈理论提出了挑战，实验自身也为博弈理论提供了检验和完善的平台。博弈实验不仅为检验博弈理论及发展新理论提供有用的数据，也是检验博弈论预测结果是否有效及其有效性范围的工具。作为一种科学研究方法，博弈实验具有其他任何研究方法都无法取代的方法论地位。在世界、理论和实验之间，理论总是渴望能够正确描述世界，世界也渴望能够通过理论来推动人类的认识。但是，两者之间的鸿沟使得人们必须寻求一种途径或者桥梁。而实验正是联结两者的这个途径和桥梁。尽管实验不是真实的世界，也不可能做到完全的复制，但是实验结果却能帮助研究者逼近世界的最真实状态。这些博弈实验的贡献和作用已经从取得的成果中得到肯定。

博弈论不仅需要实验，更需要由实验提供的完整的方法论体系。实验是一个累积的过程。开始时是由研究者针对某个特定的问题进行的独立实验，之后是效仿者进行的一系列类似的实验。以此会出现针对各种问题的实验系列。这些实验类型和实验系列之间错综交叉，彼此联系。各个实验的证据彼此辅证。作为博弈论研究者，要想深入地探讨博弈论问题，实验是必需的研究方法和手段。同时，对实验的研究，最终的目的是实现对博弈理论的完美解释。而达到这个目标的必经之路必定是理论与实验的完美结合。因此，对博弈研究者来说，不管是夯实某些理论或放弃某些理论，抑或是最终承认其局限性，博弈实验都是必需的方法和手段，而能够形成这些博弈实验所组成的方法论体系更是博弈论成熟的表现和标志，在博弈论研究道路上具有极其重要的方法论意义。

[参考文献][1]约翰·洛西.科学哲学历史导论[M].邱仁宗，金吾伦，林夏水等译.武汉：华中工学院出版社，1982.

[2]Plott，C.R. An Updated Review of Industrial Organization： Applications of Experimental Methods， in R. Scmalensee and R.D.Willig， eds， Handbook of Industrial Organization， Vol，2. Amsterdam： North-Holland， 1989， pp.1109-1176.

[3]Plott，C.R. Will Economics Becaome an Experimental Science？ Southern Economic Journal， 1991（57）：901-919

[4]Annamaria Fiore （2009） Experimental Economics： Some Methodological Notes， MPRA Paper No. 12498， posted 04. January 2009/22：49

[5]Colin Camerer. Behavioral Game Theory： Experiments on Strategic Interaction， Princeton University Press， Princeton， NJ， 2001.

[6]Binmore K.Why Experiment in Economics.The Economics Journal， February 1999.

[7]Binmore K. Just Playing： Game The Social Contract [C].MIT press，1998.

[8]Binmore K. （1987）. Modeling rational players， Iand II. Economics and Philosophy， vols. 3 and 4， 1987， pp. 179-214 and 9-55.

[9]Coleman， A. Game Theory and Experimental Work， Pergamon Press， London， 1983.

[10]Rubinstein A. A theorist’ s view of experiments [J].European Economic Review， 2001，（4）：615-628.

[11]Daniel Friedman， Shyam Sunder. Experimental Methods—A Primer for Economists [C].Cambridge University Press， 1994.

[12]John Hey. Experimental Economics and Deception：A Comment [J].Journal of Economic Psychology， 1998，（19）： 397-401.

[13]Harrison， C. R. John A.List Field Experiments [J]. Journal of Economic Literature， 2004， 42（4）： 1009-1055

[14]J.Kagel， A. E. Roth. Handbook of experimental Economics [C].Princeton University Press，1995.

[15]Schotter， Andrew， Yale.M.Bramimsteon. Economic Search： An Experimental Study [J].Economic Inquiry， 1981，（1）： 1-25.

[16]Roth， A. E. On the Early History of Experimental Economics， Journal of the History of Economic Thought， 15， Fall， 1993.

[17]Alvin A. E. Roth. Laboratory Experimention in Economics， A Methodological Overview， Economic Journal， 98（393）， December， 1988.

[18]Smith， V. L. Theory， Experiments and Economics， Journal of Persoectives （winter）， 151-161， 1989.

[19]高鸿桢.博弈论为什么需要实验[J].中国经济问题，2008，（5）.

[20]蔡志明.经济学中的实验方法与技术[J].华东师范大学学报（哲学社会科学版），1997，（3）.

[21]CF巴斯特尔布.经济学中的试验方法Ⅰ[A].新帕尔格雷夫经济学大辞典（中文版）[M].北京：经济科学出版社，1996.

[22]弗农·史密斯.经济学中的试验方法Ⅱ[A].新帕尔格雷夫经济学大辞典（中文版）[M].北京：经济科学出版社，1996.

[23]科林·凯莫勒，乔治·罗文斯坦，马修·拉宾.行为经济学新进展[M].贺京同，等译.北京：中国人民大学出版社，2010.

[24]科林·凯莫勒.行为博弈[M].北京：中国人民大学出版社，2006.

[25]约翰·海.微观经济学前沿问题[M].北京：中国税务出版社，2000.

博弈论方法篇2

新闻传播学比之其他社会人文学科，方法论的研究尚未深入，本文所要论及的新闻传播学研究中的博弈论方法，就表现得比较典型。

将博弈论与新闻传播学相交叉的思路，在上个世纪80 年代社会科学方法论讨论最热烈的时候，新闻理论界尚无人提到。后来新闻学与文化学、新闻学与心理学、新闻学与美学、新闻学与社会学等的研究，开始陆续出现。但新闻理论界在新闻交叉边缘学科研究过程中，一直没有很好地重视新闻传播博弈学的研究。作者在1997 年复旦大学新闻学院做访问学者一段时间，涉猎了一些有关博弈论的论著，产生了新闻学、传播学与博弈论之间关系的简单联想。这种联想主要是对新闻文化学建构来讲的，从新闻文化的外延角度来看，新闻传播的竞争生态研究，不能缺少博弈论的思想。

上个世纪90 年代之后，有关博弈论的书籍开始增多，后来出现了普及性的博弈论读物，这些书籍大都将社会生活、经济领域、历史经验等方面内容，与各种博弈类型相类比，说明博弈论的道理，但也带来某些副作用，即博弈论的庸俗化。在这样一种背景下，“博弈” 一词在新闻报刊、文章论著中出现的频率比较高。新闻传播与博弈的关系，真正被新闻传播理论界重视，是在2004 年第八次传播学研讨会上，会上提出“传播即博弈”的观点，并存在争议。2008 年10 月，孙光海、陈立生的《传媒博弈论》由三联书店出版，有论者认为这是我国第一部把博弈论引入传媒领域的成功力作。

从新闻传播理论界涉及新闻传播与博弈论关系的话题，或在文章论著中有意识地使用“博弈”概念来看，可以分为以下三种情况：

一是狭义基础上的理解。仅仅从传媒市场竞争的角度，来研究新闻传播的博弈。如《传媒博弈论》一书，“将四大主流门户网站、两家中央重点新闻网站、四大城市的13 家都市报作为研究对象，对各大媒体平时新闻报道及当时的社会背景和特定环境进行分析，从新闻到版面到受众再到发行，通过大量案例剖析与实战推演，总结出各大媒体在不同环境下，针对不同的竞争对手以及竞争对手采取的策略，从而制定最佳策略。内容包括网络媒体博弈、都市报博弈、网络媒体与传统媒体博弈、热点新闻与冷门新闻、大新闻与小新闻博弈等”。当然，从最严格意义上来看，该书许多内容还停留在下文所提及的第三种认识上。但就分析比较到位的有关传媒博弈的内容来看，完全是从社会主义市场经济的媒体之间竞争策略着眼，探求媒体的生存之道。

二是广义基础上的理解。从博弈论的广义思想出发，来探讨新闻传播领域中，如何把握新闻活动的规律，有学者称之为“大博弈的思维观”。实事求是地说，新闻传播理论界在这方面的论述还较少。人们由于对博弈论的跨学科性质意义尚不十分了解，所以对这种广义理解还持较为消极的态度。传播与博弈是两个概念，但并不意味着传播不能用博弈观点去研究。小约翰将博弈论研究归入人际传播理论，说明他已经把博弈论纳入到传播学视野了，不存在谨慎与否的问题。小约翰在《人类传播理论》的前面部分特别提到传播学的学科边界问题，即所有社会科学理论都存在传播的问题，传播学强调传播的双向性，恰好说明了与博弈论的紧密联系。另一位讨论者强调：“用博弈论解释一般传播现象的做法不可取。”这是基于“传播即博弈”这一命题而得出的观点。应该说“传播即博弈”是不对的，但“传播之中有博弈”，“博弈之中有传播”，在一般的传播现象中存在部分博弈现象，也是不争的事实。而且，我们注意到，在正常的新闻传播过程中，传受双方理性的情况还是较为普遍的。那种强调博弈论研究对象必须是理性的，从而认定传播学一般现象无法以博弈论进行解释，不尽妥当。我们知道，传播模式研究的前提，也要求理性的状态。[论文网 Www.LunWenData.Com]

三是日常通俗语义基础上的理解。一般是指事物之间相互影响、制约，或传统哲学所说的作用与反作用意义层面，来使用“博弈”概念。诚然，博弈论研究确实离不开这些因素，但所有事物间的这些因素，不一定都是博弈论所讲的博弈。也有在互动反馈意义层面，来理解博弈的，比起前者进了一层，然而也不十分确切。如诸多文章中的“不同文化与黄色新闻的博弈”、“媒体道德与新闻价值的博弈”、“新闻规律与媒体利益的博弈”、“隐私权与新闻自由的博弈”、“政府与新闻界的博弈”、“博弈海量信息”等。其中有些文章也道出了某些新闻传播博弈行为，但存在将博弈论泛化的情况。如有论者把主观上的意识与客观上的行为看做一组博弈现象，把社会上普遍存在的观念或做法与某一具体的观念或行为看做一组博弈现象，这都是与博弈论不相契合的。我们只能说是直觉地使用了博弈这一名词，而没有从博弈论的理论角度去进行规范的研究。

本文的重点不在于专门提倡新闻传播学研究的博弈论方法，而是力图客观地思考博弈论方法在新闻传播学研究中，究竟能否作为一种研究视角，起到对新闻传播学研究的建构作用，甚至形成新闻传播博弈论这一新闻传播学的分支学科。

博弈论在新闻传播学研究中的可能性德国著名数学家哥德尔1931 年提出不完备性定理：第一不完备性定理———任意一个包含算术系统在内的形式系统中，都存在一个命题，它在这个系统中既不能被证明也不能被否定。第二不完备性定理———任意一个包含算术系统的形式系统自身不能证明它本身的无矛盾性。这个定律虽然是针对数学来说的，但是其革命意义远远涉及科学哲学、逻辑学，而这种情况也注定要影响社会科学研究领域。诚然，新闻传播研究中，也不能将博弈论看做是无所不能的理论。我们研究博弈论在新闻传播研究领域的运用可能性，目的主要是运用其基本思想，扩展研究视域，在新闻传播领域内最合适的地方，找到双方的契合点，从新的角度描述新闻传播现象与活动的规律，调整我们的传播行为，使社会信息资源得到有效的配置。

博弈论最基本的思想，其一，在同一活动中，某事物的行为效果如何，有赖于它事物的行为。其二，是均衡概念。其三，假设人是理性的。理性的人，指行动者具有一定的逻辑推理能力，进行决策选择策略的目的就是自身利益的最大化。现实生活中，人们在作决策时可能往往是有限理性。其四，博弈论是竞争与合作的游戏，一般有协议契约。根据以上的简单概括，随之需要思考的问题就是，新闻传播现象与活动过程中，有没有相类似的情况？其一，在同一新闻传播活动中，双方各自的行为要视对方的行为而定？其二，均衡概念在新闻传播过程中能否实现？其三，新闻传播活动的行为主体是不是理性的？情况允许的话，自己的利益最大化是否是追求的目标？其四，竞争与合作的契约关系，在新闻传播过程中能否建立？答案是倾向积极的。

有了上述基本思考，我们再从更大一些的方面来探讨运用博弈论的可能性：

哲学意义。马克思主义强调经济基础决定上层建筑、意识形态，即经济的因素在社会生活、交往关系中的普遍性、基础性。虽然，马克思主义承认社会历史的发展有着诸多的因素，正如恩格斯所说的“平行四边形”合力作用，但归根结底的因素是生产力与生产关系的矛盾对立统一。

博弈论之所以在经济领域呈现出活跃的情况，人们之所以在各类社会活动、人际关系中发现博弈的因素，是因为人们在生产劳动过程中结成的各种交往关系所决定的。新闻传播现象与活动，归根结底是由交往关系决定的。因此，博弈论在新闻传播研究领域的运用也具有一定的广泛性。

我国社会主义市场经济建立之后，包括新闻传播业在内的文化产业，亟须建立一套新型的适应这一体制状况的文化产业伦理。目前可以定义为在保证社会效益的前提下，力求社会效益与经济效益的双赢，这就和博弈论中核心理论之一的“均衡”概念相暗合。每一次新闻传播策划、新闻报道活动或具体的新闻传播行为，都存在博弈论的问题，因为在某一次传播活动中的传播者之间、传受之间等，都有一个行为对策选择的问题，在现实环境中不可能不追求利益的最大化。如果不追求个体局部利益的最大化，可能追求的就是整体国家民族利益的最大化，如我国文化产业的双赢策略，即博弈论的“均衡”。公益与私利、赢利的矛盾，在社会主义初级阶段会一直存在，博弈的均衡可达到社会发展的和谐。

社会科学理论范式也有一个工具理性与价值理性的统一问题。

方法论意义。我们知道，博弈论最初作为应用数学的一个分支，是运筹学下面的对策论。后来应用于经济领域。在西方发达国家，作为西方经济学前沿领域的博弈论，已逐渐变为一种占主流地位的基本分析工具，人们十分重视其方法论意义。

从中国的传统文化来说，经史子集中博弈的思想无处不在。过去曾有学者提出这样的观点，自然科学最基础的学科是数学，而社会科学的基础可以是博弈论。我们不能说它完全正确，但是至少应该承认有其一定的合理性。

从广义的角度看，传播应用学派的传播模式研究，实际上相当于博弈模型。在我国较为流行的英国人丹尼斯·麦奎尔、瑞典人斯文·温德尔合著的《大众传播模式论》中，许多传播模型十分典型地体现出这种情况。该书第一版介绍了35 个传播模式，第二版介绍了66个传播模式。除了个别早期线性模式外，在控制论的反馈概念出现之后，传播模式越往后越具有博弈的性质，甚至可以这样说，研究当代传播模式离开了博弈的思维，其研究是存在欠缺的，虽然其模式可能并不能完完全全解决实际中的所有问题。

理论建构意义。新闻学、传播学以及中国化的新闻传播学，从它们的发生与发展的历史来看，是建立在众多人文社会科学基础上产生发展起来的。在自然科学、社会科学日益融合的时代，在需要破除自然与社会科学鸿沟的时代，谁也不能断然否定新闻传播学领域可以不要博弈论的参与。作为与社会实践互动频繁、联系紧密的社会科学之一的新闻传播学，从来不存在其他学科的不可逾越的障碍。

由于受经济学的影响，人们思考博弈论在新闻传播研究领域的运用时，可能认为仅仅反映在传媒的经营管理上。这种狭义的理解，导致产生了博弈论不适合一般新闻传播理论研究的观点。作者认为，新闻传播研究中重视运用博弈论，并不是要求新闻传播理论“范式”像经济学那样转向博弈论，并把它作为核心的理论分析工具，而是在理论体系建构中，对博弈论方法给予足够的重视，将其中合理的内容，吸纳到基础理论中来。更重要的是，将博弈思维作为指导理论研究的一个窗口，扩展新闻传播理论空间。当然，也可以建立新闻传播学下面的二级学科“新闻传播博弈理论”，进行专门的新闻传播学新领域探索。

结语

新闻传播研究对博弈论产生兴趣已有多年，但是博弈论在新闻传播研究领域被吸纳与运用的情况并不尽如人意，原因是新闻传播理论界对博弈论尚不太熟悉，对博弈论的理解也参差不齐，甚至还存在部分抵触心理，致使研究成果的质与量不甚理想。新闻传播研究需要理论创新，对理论与实践中出现的新情况、新问题提出新的解决路径。研究新闻传播博弈论，对理论研究者提出了知识更新的更高要求。

自然科学与人文社会科学、人文科学与社会科学、社会科学内部之间没有不可逾越的鸿沟。博弈论无论在广义、狭义还是方法应用上，在新闻传播研究领域都有用武之地，关键在于我们的观念。

参考文献：

1.肯尼斯·赫文［美］、托德·多纳著：《社会科学研究的思维要素》，重庆大学出版社，2008年版。

博弈论方法篇3

[4]吴红胤，张晖，秦晋.新形势下高职体育课程教学课程改革的研究[J].浙江：浙江体育科学，2010，32（1）：60-61.

[5]郭森.高职体育教学改革探析[J].体育世界（学术版）.2008（03）.

博弈论方法篇4

1.1 老鹰（Hawk）与鸽子(Dove)博弈

1.2 系统选择博弈

二、进化博弈理论的产生及其发展

2.1 理性的由来及其缺陷

2.2 心理学研究成果及有限理性概念的提出

2.3 进化博弈理论的产生及其发展

三、进化博弈理论的基本内容

3.1 进化博弈理论基本模型分类

3.2 进化博弈理论基本均衡概念-----进化稳定策略

3.3 进化博弈理论基本动态概念----模仿者动态

四、进化博弈理论的应用

五、传统方法的缺陷及进化博弈理论研究方法的现实性

5.1 新古典经济学均衡分析法的缺陷

5.2 经典博弈理论的策略互动分析法及其缺陷

5.3 进化博弈理论局部动态分析方法的现实性

5.3.1 局部动态分析法的均衡观

5.3.2 局部动态法的时间观

5.3.3 局部动态法的均衡选择观

5.3.4 局部动态法的特殊性

六、结论

参考文献

摘要

本文从两个简单的博弈例子出发，以通俗的语言全面介绍了进化博弈理论的理性基础及其形成、发展、基本内容和部分应用，在此基础上文章进一步比较了新古典经济学、经典博弈理论 ①及进化博弈理论在研究方法上的不同之处，并特别强调了进化博弈理论局部动态法的均衡观、时间观、均衡选择观及方法上的特殊性。进化博弈理论的局部动态分析方法既是经济学研究方法的一次创新又是经济学直面现实的有力武器。

关键词：沉默互动；社会互动；进化稳定策略；模仿者动态；均衡分析法；局部动态法

引言

为什么同样一项经济制度在某个地方对经济发展有积极的推动作用而在另一个地方对经济发展却起着消极的阻碍作用？为什么能够有效降低交易费用的中介在一些地方会出现而在另一些地方却不能出现？为什么同样的管理方法在一个地方显示出高效率而在另一地方却不具有效率？诸如此类的问题，新古典经济学利用均衡分析法都无法给出令人满意的答案。均衡分析法的最大缺陷是把经济系统中参与人看作是互不联系的单个人（仅研究单个生产者或消费者的行为），不能把其所考察的问题放在一定的环境中去，该方法完全忽略了制度环境、社会环境及人文环境等对参与人行为的影响，单纯考察某个条件与结果之间的一一对应关系。因而，无法对现实中出现的诸多现象给予合理的解释。博弈理论尽管把参与人之间行为互动关系纳入到了模型之中，但依然没能跳出新古典均衡分析法的基本框架，并且由于其对理性赋予更强的假定，使得该理论更加脱离现实。进化博弈理论则一反常规，从一种全新的视角来考察经济及社会问题，它所提供的局部动态研究方法是从更现实的社会人出发，把其所考察的问题都置于一定的环境中进行更全面的分析，因而，其结论更接近于现实且具有较强的说服力。进化博弈理论属于经济学的前沿理论，该理论从其理论框架建立到现在仅仅只有近三十年的历史，但其在经济学、社会学、生态学等领域却得到了广泛的应用，近年来已经成为主流经济的研究方法之一。在我国由于历史原因，对经济学的研究起步较晚，特别对进化博弈这样的前沿理论更是知者甚少，本文的主要目的是以通俗的语言介绍进化博弈理论的相关内容及其应用，让读者对该理论有一个全面的了解。

本文的结构如下：第一部分给出进化博弈理论的两个典型的例子；第二部分对进化博弈理论的产生及其发展进行阐述；第三部分对进化博弈理论的基本内容进行简要的介绍；第四部分概述进化博弈理论的有关应用；第五部分论述传统的经济学研究方法的缺陷及进化博弈理论研究方法的现实性；第六部分对进化博弈理论的发展及理论前景进行简要的说明。

一、两个简单的例子

为了下文说明的方便，本文先给出进化博弈理论中两个具有代表性的例子，在此基础上再进一步给出该理论的基本内容及其研究方法的基本特点。

1.1 老鹰（Hawk）与鸽子(Dove)博弈

假定一个生态环境中有老鹰与鸽子两种动物，它们为了生存需要争夺有限的资源（如食物或生存空间等）而竞争。老鹰一般比较凶悍，必要时在斗争中直到重伤。鸽子一般比较温驯，竞争时在强敌面前常常退缩。竞争中获胜者得到了生存资源就可以更好地繁衍后代，重伤者则不利于其后代生长，即会减少其后代的数量。如果群体中老鹰与鸽子相遇并竞争资源，那么老鹰就会轻而易举地获得全部资源，而鸽子由于害怕强敌退出争夺，从而不能获得任何资源（当然不会受伤）；如果群体中两个鸽子相遇并竞争生存资源，由于它们均胆小怕事不愿意战斗，结果平分资源；如果群体中两个老鹰相遇并竞争有限的生存资源，由于它们都非常勇猛而相互残杀，直到双方受到重伤而精疲力竭，结果虽然双方都获得部分生存资源但损失惨重，入不敷出。假定竞争中得到全部资源为50个单位（该数字也可以表示为生物的适应度、繁殖成活率或后代数量）；得不到资源则表示其适应度为零；双方重伤则用来表示。于是老鹰、鸽子两种动物进行的资源竞争可以用一个对称博弈来描述，博弈的支付矩阵如下：

操作依赖于该群体的初始状态。如果初始时，该宿舍有多于4人使用操作系统，那么该宿舍所有学生最终都会使用该操作系统；否则所有学生最终会使用操作系统。

二、进化博弈理论的产生及其发展

进化博弈理论是经济学研究方法的一次创新，该理论从否定传统理论赖以成立的基础----理性人假定出发而建立起来一个新的分析框架，它结合了生态学、社会学、心理学及经济学的最新发展成果，从有限理性的社会人出发来分析参与人的资源配置行为。

2.1 理性的由来及其缺陷

经济学自从古希腊哲学中分离出来并成为一门系统的学问，是在亚当•斯密1776年发表《国富论》之后。以斯密为代表的古典经济学关注的核心是资源的稀缺程度如何能被人类经济活动所减少，他们关注的重点不是资源配置问题而是国民财富的增长及国别差异的原因。1890年马歇尔《经济学原理》的出版，标志着新古典经济学的成形，马歇尔之后，新古典经济学关注的核心逐渐转向在给定稀缺程度下资源的最优配置问题。稀缺资源的配置是需要人的参与，也就是说经济学研究的问题演变为关于经济中参与人如何把稀缺的资源配置到效率最高地方去的问题，强调个体行为在资源配置中的作用。经济中参与人的决策行为是通过高度复杂的思维活动作出的，为了更好地从微观个体行为来解释资源配置问题，新古典经济学借用了哲学中“理性”概念对复杂的人类行为过程进行了抽象的假定。然而，理性一词用于经济学时却对其含义的理解与哲学中对其含义的理解已经有了明显的区别。哲学中的理性是指人类所特有的用以探索自然和社会奥秘的认知能力，当代伟大的哲学家康德在其著作《纯理性批判》一书中指出，人类理性即认知能力并不是万能的，而是有限的。经济学中的理性则是指一种行为方式，具体地说即是经济中参与人对其所处世界的各种状态及不同状态对自己支付的意义都具有完全信息，并且在既定的条件下每个参与人都具有选择使自己获得最大效用或最大利润的能力。

经济学家认为理性是至高无上的，人们凭借理性就可以完全地认识自然与社会。经济学中对理性的含义经过这样的处理以后，就使得经济学能够充分运用数学理论发展的成果来进行分析。为了应用数学工具并更好地处理经济问题，传统经济学家们从偏好，信念及理性三个方面来界定经济主体的特征，其中信念就是个体认为不同结果将会出现的基于个体所获信息之上的条件概率。偏好则是基于不同结果的信念之上的序。理性是根据上述偏好及信念，个体获得最优决策的程度以及个体根据已经获得的信息来修正其信念的能力。这三个特征使得经济学研究的对象由现实人转向了理想化的对象，经济学越来越偏离了现实。

由理性概念而引致的缺陷首先表现在理性人具有无限的信息收集及处理能力的均衡观，认为经济系统常常处于均衡状态，非均衡只是一种暂时的现象，当受到外生因素扰动而使系统偏离均衡状态时，系统会以线性的方式回归均衡，这种机械式线性反应的均衡观来源于牛顿力学，由此而得出的比较静态分析法完全忽视了系统受到非线性扰动及连续因素的影响。其次表现在由全知全能的理性人而引致的均衡跳跃观，认为经济系统达到均衡或者从一个均衡到另一个均衡是不需要时间的，认为时间是可逆的，即经济变量与物理学的变量一样，只要条件相同系统的均衡也就相同，市场和经济对于过去的记忆是短暂的或者是没有的。这种应用经典牛顿力学分析方法来分析高度复杂的参与人经济行为使得其预测效果大打折扣。最后表现在其比较静态分析方法上，传统经济学的最基本分析方法----比较静态分析法赖以成立的基础是假定经济系统只受到外界一个个相互独立、互不重叠的冲击的影响，或者当一个因素的影响消除之后，下一因素才开始对经济系统产生影响。我们知道现实世界是普遍联系的，各种因素之间不可能相互独立，系统中任何一个因素的变动都会引起其他因素的变动，这些因素之间相互作用的时间可能很短也可能很长，各因素对最终目标会产生不同程度的影响。比较静态法却只见局部不见整体，企图通过比较不同均衡来找出系统达到均衡的条件，因此得不出符合现实的结论，其研究方法上的局限性大大降低了其理论的现实意义。

2.2 心理学研究成果及有限理性概念的提出

随着经济学家对理论研究的深入，特别近来实验经济学的迅速发展，主流经济学赖以成立的基础“理性人”假定及其基本的比较静态均衡分析法越来越受到了人们的质疑。相继出现了许多其他的研究方法，其中在经济学中影响最大的就是心理学的研究方法。心理学应用于经济分析有着非常曲折的历史。事实上，斯密、马歇尔、庇古、费雪尔和凯恩斯等一批古典经济学家都仔细地分析了偏好和信念的心理学基础。但从1940’s开始，一方面受到萨缪尔森及希克斯等新一派基于理性假定经济学家的影响，心理分析在经济学中的地位慢慢地被降低了；另一方面理性模型也遇到了许多如Allais(1952)悖论等难以给出合理解释的经济现象。于是1960’s开始，许多微观经济学家再次运用心理学研究方法来解释现实中的异常现象，宏观经济学也把经验法则和适应性预期纳入到其模型之中，正是在这一时期心理学家Simon(1957)提出了其著名的“有限理性”概念。然而，1970’s初随着Robert Lucas等人提出的理性预期理论、Selten、Kreps等倡导的强调正确信念及贝叶斯修正的博弈理论及Stiglitz、Spence等研究的信息经济学理论相继成为主流经济学的一部分，经济学界再一次掀起了排除渗透在经济学领域中心理学研究方法的热潮，心理的研究方法在经济学界几乎无立足之地，严格理性假定席卷整个经济学界。行为经济学的发起者Amos Tversky在经济学界根本找不到志趣相投者。1970’s末期，随着心理学家Amos Tversky与Kahneman合作发表了一系列应用心理分析方法来研究经济学问题的原创性文章，如1974年他们在Science发表的Judgment under uncertainty: Heuristics and biases，1979年他们合作在Econometrica发表Prospect theory: An analysis of decision under risk，慢慢消除了经济学界中存在的对心理学分析方法的偏见，此后应用心理分析方法来解释经济现象的文献见诸于各种经济学期刊之中，心理分析方法也渐渐地成为了主流经济学的研究方法之一。

进入1980’s，随着经典博弈理论、生态理论及心理学理论研究的深入发展，特别是心理学家西蒙把其在心理学领域研究的成果直接应用经济分析并因此获得了诺贝尔经济学奖，极大地激励着经济及社会学家从现实人行为出发来解释经济及社会现象。心理学研究表明人类认知过程首先表现为人们通过一种“感知秩序”进行学习活动，并形成分散的非同质的知识，其中“感知秩序”是指人的理解力、知识和人类行动之间的关系；其次表现为个体通过学习所达到的理性程度的有限性，组织学习个体学习行为的整合而形成的多层次“理性结构”，个体理性便会在一个累积性的组织或制度环境中得到塑造和提高并发挥作用，在这个过程中，个体学习行为总会受到组织、习惯和文化等制度性的限制和影响。西蒙认为人类并不是完全理性而是有限理性的，因为人类认知能力有着心理的临界极限，人类进行推理活动需要消耗大量的能量，推理也是一种相对稀缺的资源，另外决策者决策时需要大量的信息，而这些信息是不可能免费获得的，获得决策所需要的信息是需要大量成本的。考虑到参与人有限的知识水平、有限的推理能力、有限的信息收集及处理能力，经济主体的决策行为并非总是最大化的结果，其决策受到参与人所处的社会环境、过去的经验、日常惯例及其他人相似情形下的行为选择等因素的影响。在有限理性条件下，由于参与人无法免费获得决策所需要的全部信息，并且参与人即使获得了决策所需要的全部信息也可能由于有限的计算能力而无法得出最优决策。因此，参与人只能采取模仿、学习等简单的直观决策方法或一些固定的常规来进行决策。人类的决策结果受到复杂的认知过程的影响，不同的人或者同一个人在不同时间即使给出相同的条件也可能会得出不同的决策结果，即决策结果受到认知过程的路径影响。

2002年诺贝尔经济学奖得主之一心理学家丹尼尔·卡内曼(Daniel Kahneman)将源于心理学的综合洞察力应用于研究在不确定条件下参与人的决策过程及行为结果并展示了人为决策是如何异于标准经济理论预测的结果。在1979年，他与有着深厚数学及哲学背景的心理学家特韦尔斯基（Tversky）提出了震撼经济学界的“前景理论”(Prospect theory)。他们的发现激励了新一代经济学研究人员运用认知心理学来研究经济学，使经济学的理论更加丰富。一个理论获得诺贝尔经济学奖不仅是对获奖者过去成就的肯定，更主要说明了获奖理论将会成为主流经济学未来的发展方向。2002年诺贝尔经济学奖授予给丹尼尔·卡内曼标志着经济学的研究对象从传统的“经济人”转向现实的“社会人”，经济学直面现实。如何从有限理性出发来研究参与人的行为，许多经济学家对之进行了广泛而深入的研究并提出了许多理论，在这些理论之中影响最大且受到了经济学界普遍接受的理论即进化博弈理论。

2.3 进化博弈理论的产生及其发展

进化博弈理论源于对生态现象的解释，1960年代生态学家Lewontin就开始运用进化博弈理论的思想来研究生态问题。生态学家从动植物进化的研究中发现，动植物进化结果在多数情况下都可以用博弈论的纳什均衡概念来解释。然而，博弈论是研究完全理性的人类互动行为时提出来的，为什么能够解释根本无理性可言的动植物的进化现象呢？我们知道动植物的进化遵循达尔文“优胜劣汰”生物进化理论，生态演化的结果却能够利用博弈理论来给予合理的解释，这种巧合意味着我们可以去掉经典博弈理论中理性人假定的要求。另外，1960年代生态学理论研究取得突破性的进展，非合作博弈理论研究成果也不断涌现并日趋成熟，进化博弈理论具备了产生的现实及理论基础。

进化博弈理论应用于研究经济学问题在学术界曾经引起极大的争议，争论的焦点在于理性假定。当时由于理性概念在经济学界已经根深蒂固。多数人认为利用研究生态演化的进化博弈理论来研究参与人的行为是不合适的。因为动植物行为是完全由其基因所决定的，而经济问题则涉及到具有逻辑思维及学习、模仿能力的理性参与人的行为，因此，借助于进化博弈理论来研究远比动植物复杂的人类行为显然是行不通的。但随着心理学研究的发展及有限理性概念的提出，越来越多的经济学家应用进化博弈理论来解释经济现象并获得了巨大的成功，利用进化博弈理论来研究并解释经济现象的文献大量出现于各种经济学期刊了。尽管如此，利用进化博弈理论来解释经济现象还是需要对该理论的基本分析框架作出相应的调整。如果去掉参与人偏好、信念及理性假定等条件，那么参与人是如何作出决策的呢？进化博弈理论在处理有限理性参与人决策问题时，常常假定参与人遵循某种比贝叶斯法则更简单的行为规则，这种行为规则应该告诉如何采取行动及如何根据经验来改变行为选择，这样参与人只要知道什么会发生，而不必知道为什么会发生。

1970年代，生态学家Maynard Smith and Price（1973）结合生物进化论与经典博弈理论在研究生态演化现象的基础上而提出了进化博弈理论的基本均衡概念----进化稳定策略（Evolutionarily stable stragegy ESS），目前学术界普遍认为进化稳定策略概念的提出标志着进化博弈理论的诞生。此后，生态学家Taylor and Jonker（1978）在考察生态演化现象时首次提出了进化博弈理论的基本动态概念----模仿者动态（Replicator Dynamics）。至此，进化博弈理论有了明确的研究目标。

1980年代以后，随着新古典经济学及博弈论固有的缺陷逐渐被人们所认识，有限理性概念得到了学术界的普遍认可，加之进化博弈理论在解释生态现象时获得的巨大成功，特别是经济学界于1992年在康奈尔大学召开的进化博弈理论学术会议，正式确立了该理论的学术地位。一大批如Larry Sameulson、Ken Binmore、Peyton Young等经济学家从不同的角度对传统的进化博弈理论分析框架进行拓展，并使之逐渐转化为描述经济行为的理论。目前，进化博弈理论的基本理论体系虽然已经形成但还是相当粗糙。因此，它仍然处于不断发展和完善的阶段，但该理论提供了比传统理论更具现实性且能够更准确地解释并预测参与人行为的研究方法，从而得到了越来越多的经济学家、社会学家、生态学家的重视，我们有理由相信该理论成为主流经济学的一部分已经为时不远。

三、进化博弈理论的基本内容

进化博弈理论结合经典博弈理论及生态理论研究成果，并以有限理性的参与人群体为研究对象，利用动态分析方法把影响参与人行为的各种因素纳入其模型之中，并以系统论的观点来考察群体行为的演化趋势。

进化生态学与博弈论的结合至少已有三十几年的历史，初看起来使人觉得奇怪，因为博弈论常常假定参与人是完全理性的，而基因和其他的演化载体常常被假定是以一种完全机械的方式运动。然而一旦用参与人群体来代替博弈论中的参与者个人，用群体中选择不同纯策略的个体占群体中个体总数的百分比来代替博弈论中的混合策略，那么这两种理论就达到了形式上的统一。尽管这两种理论在形式上达到了统一，但进化博弈理论与经典博弈理论还是存在本质区别。在进化博弈理论中每个参与人都是随机地从群体中抽取并进行重复、匿名博弈，他们没有特定的博弈对手 ④。在这种情况下，参与人既可以通过自己的经验直接获得决策信息，也可以通过观察在相似环境中其他参与人的决策并模仿而间接地获得决策信息，还可以通过观察博弈的历史而从群体分布中获得决策信息。对参与人来说，观察群体行为的历史即估算群体分布是非常重要的，首先，群体分布包含了对手如何选择策略的信息。其次，通过观察群体分布也有助于参与人知道什么是好的策略什么是不好的策略。参与人常常会模仿好的策略⑤ 而不好的策略则会在进化过程中淘汰，模仿是学习过程中的一个重要组成部分，成功的行为不仅以说教的形式传递下来，而且也容易被模仿。参与人由于受到理性的约束而其行为是幼稚的（Naive），其决策不是通过迅速的最优化计算得到，而是需要经历一个适应性的调整过程，在此过程中参与人会受到其所处环境中各种确定性或随机性因素影响。因此，系统均衡是达到均衡过程的函数，要更准确地描述参与人行为就必须考察经济系统的动态调整过程，动态均衡概念及动态模型在进化博弈理论中占有相当重要的地位。

3.1 进化博弈理论基本模型分类

进化博弈理论的基本模型按其所考察的群体数目可分为单群体模型(Monomorphic Population Model)与多群体模型(Polymorphic Populations Model)。单群体模型直接来源生态学的研究，在研究生态现象时，生态学家常常把同一个生态环境中所有种群看作一个大群体，由于生物的行为是由其基因唯一确定的，因而可以把生态环境中每一个种群都程式化为一个特定的纯策略。经过这样处理以后，整个群体就相当于一个选择不同纯策略（纯策略集的数目就相当于群体中的种群数）的个体。群体中随机抽取的个体两两进行的都是对称博弈，有些文献中称这类模型为对称模型（Symmetry model）。严格地说，单群体时个体进行的并不是真正意义上的博弈，博弈是在个体与群体分布所代表的虚拟参与人之间进行。如第一部分的老鹰----鸽子博弈，该生态环境中有两个种群老鹰与鸽子，它们代表两个不同的纯策略，用进化方法进行处理时认为该生态群体中每个个体都有两种可供选择策略即老鹰策略与鸽子策略，此时的博弈并不是在随机抽取的两个个体之间进行，而是每个个体都观察群体状态（选择老鹰策略与鸽子策略个体数在群体中所占的比例），给定此状态它就可以计算自己选择不同策略所得的期望支付（严格地说这并不是期望支付，但为了说明的方便本文仍然借用该概念）进而确定选择哪一个策略不选择哪一个策略，对物种而言这就意味着种群数量的增加或减少。

多群体模型是由Selten (1980)首次提出并进行研究的，他在传统单群体生态进化模型中通过引入角色限制行为（Role Conditioned Behavior）而把对称模型变为了非对称模型。在非对称博弈个体之间有角色区分，此时可以从大群体中区分出不同的小群体，群体中随机抽取的个体之间进行真正意义上的两两配对重复、匿名非对称博弈，有时又称之为非对称模型（Asymmetry model）。如果我们把系统选择博弈中的宿舍变成学校（整个学校相当于一个大群体）而把十个人变成十个班（每一个班看成是一个小群体，且同一班的同学无角色区分即与单群体情形一样），每个班的学生都有多种选择，此时该校学生所进行的计算机系统选择博弈就是非对称博弈。非对称博弈模型并不是对单群体博弈模型的简单改进，由单群体到多群体涉及到一系列的如均衡及稳定性等问题的变化。Selten(1980)证明了“在多群体博弈中进化稳定均衡都是严格纳什均衡⑥ ”的结论，这就说明在多群体博弈中，传统的进化稳定均衡概念就显示出其局限性了。同时，在模仿者动态下，同一博弈在单群体与多群体时也会有不同的进化稳定均衡。

按照群体在演化过程中所受到的影响因素是确定性的还是随机性的，进化博弈模型可分为确定性动态模型和随机性动态模型。确定性模型一般比较简单并且能够较好地描述系统的演化趋势，因而，理论界对之进行较多的研究。随机性模型需要考虑许多随机因素对动态系统的影响，一般比较复杂，但该类模型却能够更准确地描述系统的行为，近年来理论界对之也进行广泛的探讨[对随机动态的详细讨论可以参阅这方面的经典文献Foster, D., and P. Young.(1990), Fudenberg, D. and C. Harris (1992), Kandori, M. G. Mailath, and R. Rob(1993)]。

3.2 进化博弈理论基本均衡概念-----进化稳定策略

进化博弈理论的基本均衡概念---进化稳定策略⑦ [文献2、5有详细介绍]是由Maynard Smith and Price（1973）及Maynard Smith(1974)在研究生态演化问题时提出来的，其直观思想是：如果一个群体（原群体）的行为模式能够消除任何小的突变群体，那么这种行为模式一定能够获得比突变群体高的支付，随着时间的演化突变者群体最后会从原群体中消失，原群体所选择的策略就是进化稳定策略。系统选择进化稳定策略时所处的状态即是进化稳定状态，此时的均衡就是进化稳定均衡。下面给出Maynard Smith and Price（1973）对进化稳定策略的定义（此后本文称之为原初定义），用符号表示如下：

说是进化稳定策略，如果，存在一个<，不等式对任意都成立。其中A是群体中个体博弈时的支付矩阵；y表示突变策略；是一个与突变策略y有关的常数，称之为侵入边界（Invasion Barriers）；表示选择进化稳定策略群体与选择突变策略群体所组成的混合群体。实际上相当于该吸引子对应吸引域的半径，也就说进化稳定策略考察的是系统落于该均衡的吸引域范围之内的动态性质，而落于吸引域范围之外是不考虑的，所以说它只能够描述系统的局部动态性质。至于系统是如何进入吸引域的原初的进化稳定策略定义所没有给予足够的重视。

要准确地理解进化稳定策略概念就必须正确理解突变者和侵入边界的含义。我们可借助于前面的两个例子来理解。在老鹰、鸽子博弈中，当该生态环境中只有老鹰（或只有鸽子）时，这时系统已经处于均衡状态，但它们都是不稳定的均衡，因为这两个均衡都可以被突变者侵入。开始时，假定该生态环境处于老鹰均衡，如果由于某种原因而进入鸽子时，那么随着时间的演化，整个生态系统最终就会稳定于一半为老鹰一半为鸽子的状态，即混合策略纳什均衡是进化稳定的。这说明该博弈中两个纯策略纳什均衡是不稳定的。因为，当系统处于纯策略所表示的状态时，只要存在突变者系统就会离开这种状态，所以它们都不是进化稳定的。相反混合策略纳什均衡却不一样，即当系统处于一半是老鹰一半是鸽子时，如果由于某种因素使得系统偏离该状态，那么系统会自动恢复到原来状态。另外，在系统选择博弈中突变者、侵入边界就更为明显，所谓突变者即是指选择进化稳定策略以外的策略者，且侵入边界与不同的均衡有关。该博弈有两个纯策略纳什均衡和一个混合策略纳什均衡（），前一个均衡所对应的侵入边界就是，也就是说如果选择操作系统的学生数占群体总数的比例大于（即学生数大于4），那么选择操作系统的突变者就不可能侵入到该群体中，如果选择操作系统的学生数占群体总的比例小于（即学生数小于4），那么选择操作系统的突变者就会侵入到该群体中而原来选择操作系统的学生会转而学习操作系统。

最初进化稳定策略定义有比较苛刻的条件限制，如单群体、群体中个体数目无限大、系统只受到不连续且互不重叠冲击的影响等。这些条件大大地限制该定义的应用，随着学术界对进化博弈理论研究的深入，许多理论家们从不同的角度对最初定义进行了拓展，如Selten 1980首次给出了适应于描述多群体均衡的定义；Schaffer 1988首次给出了适应于描述有限规模群体的均衡定义；Foster and Young（1990）首次给出了适应于描述连续随机系统的均衡定义等等（有关对进化稳定策略进行拓展的讨论见文献[5]）。最初定义是在解释生态现象时提出来的，如果进行经济分析，时需要进行相应的改变。在分析生态现象时，把每一个种群的行为都程式化为一个策略，因此进化的结果将会是突变种群的消失（消失的原因在于生物的行为是由其遗传基因唯一确定的）。如果用于经济分析，那么进化的结果将是那些选择突变策略的个体最终会改变策略而选择进化稳定策略（因为人类可以通过学习、模仿等来改变自己所选择的策略）。

经典博弈理论中的核心概念纳什均衡即是指一种策略组合，在该策略组合下任何个人单独偏离都不会变得比不偏离好。纳什均衡是一个静态概念，不能描述系统的动态性质，用数学语言来说它是动态系统的不动点，纳什的成功就是在于他应用拓扑学的不动点定理证明了纳什均衡的存在性。进化稳定策略必定是纳什均衡策略，它是纳什均衡的精练，文献[3]对此有详细的介绍。在进化稳定策略的定义中引入突变者及侵入边界使之能够更好地描述系统的局部动态性质。第一部分的两个例子中，按照纳什均衡的概念是无法得知两个系统最终会选择哪一个均衡，但利用进化稳定策略却可以说明系统最终会稳定哪一个均衡并可以分析系统达到不同均衡的条件，在某种程度上，较好地解决了多重均衡选择问题。

3.3 进化博弈理论基本动态概念----模仿者动态

进化博弈理论来源于生态学的研究，该理论基本上从“优胜劣汰”的进化论观点来看待群体行为的调整过程。一般的进化过程都包括两个可能的行为演化机制：选择机制(Selection Mechanism)和突变机制（Mutation mechanism）。选择机制是指本期中能够获得较高支付的策略，在下期被更多参与者选择；突变是指参与者以随机（无目的性）的方式选择策略，因此突变策略可能获得较高支付也可能获得较低支付，突变一般很少发生。新的突变也必须经过选择，并且只有获得较高支付的策略才能生存（Survive）下来。进化博弈理论需要解决的关键问题就是如何描述群体行为的这种选择机制和突变机制。博弈理论家对群体行为调整过程进行了广泛而深入的研究，由于他们考虑问题的角度不同，对群体行为调整过程的研究重点也就不同，因而提出了不同的动态模型，如Weibull(1995) 提出的模仿动态（Imitation Dynamics）模型，认为人们常常模仿其他人的行为尤其是能够产生较高支付的行为；Börgers and Sarin(1995，1997)等提出并应用强化动态（Reinforcement Dynamics）来研究现实中参与人的学习过程；Skyrms (1986) 引入了意向动态（Deliberational Dynamics）模型对哲学中的理性问题进行了讨论；Swinkels(1993)提出了近似调整动态（Myopic Adjustment Dynamics）；Borgers and Sarin(1995)提出了刺激—反应动态（Stimulus-Response Dynamics）等等。到目前为止，在进化博弈理论中应用得最多的还是由Taylor and Jonker(1978)在对生态现象进行解释时首次提出描述单群体动态调整过程的模仿者动态（Replicator Dynamics）。所谓模仿者动态是指使用某一策略人数的增长率等于使用该策略时所得的支付与平均支付之差。下面就给出Taylor and Jonker（1978）提出的模仿者动态的微分形式：

化的而且因素之间的互动作用也是需要时间的。因此，均衡只是一种暂时现象或者在多数情况下，系统根本不可能达到的现象，要更准确地考察参与人的行为就必须运用系统论的观点，把行为互动性、因素互动性及时间因素纳入到其模型之中。

5.2 经典博弈理论的策略互动分析法及其缺陷

考虑到新古典经济学没有把参与人行为之间的互动关系纳入到其模型之中，经典博弈理论则在理性人假定的基础上把参与人行为的互动关系纳入到其模型之中进一步考察了参与人的决策问题。在我国，对人类互动行为的研究至少可以追溯到三国时期田赛马的故事，但作为一种正式理论提出来，一般认为是始于冯·诺意曼和摩根斯藤（Von Neumann and O. Morgenstern, 1944）出版的《博弈论与经济行为》一书，直到纳什（Nash 1950）在研究非合作博弈的基础上提出著名的纳什均衡（Nash Equilibrium）概念才使得博弈论成为一门完整的理论。经过近五十年的发展，终于在1994年，三位杰出的博弈论大师：纳什（John F. Nash）、泽尔藤（Rechard Selten）和海萨尼(John C. Harsanyi)获得了经济学的最高荣誉——诺贝尔经济学奖，在全球经济学界再次掀起了对博弈论的研究热潮。经典博弈论为社会科学提供了一个新的研究视角，使我们能够以全新的方法来处理各种冲突与合作的问题。博弈论作为一种理论工具，其应用相当广泛。在信息经济学中得到了充分的应用，1996年诺奖得主Mirrlees等、2001年诺奖得主Akerlof等都对信息经济学研究作出了卓越的贡献。这充分说明了博弈论在经济学的地位可见一斑。

经典博弈理论的核心概念----纳什均衡就是由普林斯顿大学数学家纳什在研究非合作博弈时提出来的。纳什均衡即是指给定其他参与人选择的情况下，每一个人单独偏离均衡都不会变得比不偏离好，显然纳什均衡是一个静态均衡概念。经典博弈理论尽管把参与人的互动行为引入到其模型之中，并认为现实中参与人不是孤立地作出自己的决策，每一个参与人的决策不仅依赖于其自身所面临的条件及其所拥有的信息，而且也依赖于其他参与人的决策选择。但该理论却面临着其自身无法克服的缺点。首先，博弈论中的互动是一种“沉默互动⑨ ”，这种互动不允许参与人之间存在任何形式的交流，即假定参与人都是一个个只会理性计算的孤立经济人而非社会人，一旦引入社会互动，许多博弈都无法进行分析，也就是说经典博弈理论中的互动并不“社会互动”而是孤立的“沉默互动”。其次，博弈论的基本均衡概念纳什均衡要求博弈各方都是理性的，并且理性是共同知识，博弈时如果某一方选择了非理，那么博弈就无法进行下去。特别地该理论在利用后向归纳法（Backward Induction）对纳什均衡进行精练时，不但要求参与人完全理性，而且还要求参与人的行为满足序贯理性（Sequential Rationality）要求。这一比理性更强的要求使得博弈论更加远离现实人。再次，在处理参与人所面临的不确定性时，不仅要求各参与人知道世界的各种状态，而且要求参与人知道每一种状态所出现的概率，并且给定一个先念信念，当出现任何新信息时，每个参与人都能够应用贝叶斯法则修正自己的先念信念，也就是说参与人不但具有很强的计算、推理能力，而且能够在一个大的状态空间上应用贝叶斯法则解决相当复杂的问题。现实中多数情况下，参与人并不都具有这种计算、推理能力。最后，博弈论碰到了其最棘手的问题就是多重均衡的处理，当博弈出现多重均衡特别是多重严格纳什均衡时，尽管许多理论家提出了一些方法（Selten（1965）提出的子博弈精炼纳什均衡概念，Selten（1975）提出的颤抖手精练纳什均衡，Kerps—wilson(1982)提出的序贯均衡，Schelling（1960）提出的聚点均衡等）来处理多重均衡问题，但始终没能获得一致认可的结论。

与新古典经济学相比，经典博弈理论虽然在其模型中纳入了行为的“沉默互动”关系，但该理论给出的研究方法仍然没能跳出新古典经济学的均衡分析框架，这种只注重结果而忽略达到结果的过程的分析方法依然把对经济系统的影响因素都看作为一个个孤立因素，依然认为影响因素与决策结果是一一对应的关系，依然没能把参与人所处社会环境等因素纳入到其模型之中，因而不能准确地描述现实中人的决策行为，其结论也仅仅具有理论意义而缺乏政策含义。

5.3 进化博弈理论局部动态分析方法的现实性

进化博弈理论利用达尔文“优胜劣汰”的生物进化论、经典博弈理论并结合心理学的研究成果，从西蒙提出有限理性（Bounded Rationality）的参与人群体出发，通过对群体行为的研究进一步得出参与人个体的行为。进化博弈理论跨越了完全理性的“经济人”与有限理性的“社会人”的鸿沟，实现了经济学研究方法革命性的突破。与传统均衡分析法相比，进化博弈理论的局部动态分析方法在以下几个方面独具特色。

5.3.1 局部动态分析法的均衡观

传统的均衡分析方法认为完全理性参与人能够对环境的任何变化作出迅速的最优反应，因而，经济系统是常常处于均衡状态的，分析参与人的行为只需要研究均衡结果，并以此来预测经济人的行为，通过比较不同均衡结果来寻找系统达到均衡的条件。这种处理方法为了数学上处理的方便而撇开现实中“因素互动”而分别考察单个因素对均衡的影响，使得理论更加缺乏现实基础。进化博弈理论则完全摒弃传统理论中非现实的“理性人”假定，直接从有限理性参与人群体出发而提出的一种全新的研究方法----局部动态法。局部动态法把经济系统达到均衡结果的过程纳入到其模型之中，认为经济系统达到均衡需要一个长期的渐进过程，均衡结果依赖于达到均衡的过程，也就是说任何一个结果都是路径依赖的，它与混沌经济学完全动态的研究方法具有某种程度的相似之处。

5.3.2 局部动态法的时间观

传统的均衡分析法并没有纳入因素互动关系并且理性计算是不需要时间的，所以得出经济系统常常是均衡的结论。进化博弈理论的局部动态法一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中，强调系统达到均衡的过程，并认为经济系统由于受到各种互动行为及互动因素的影响，有些系统达到均衡可能只需要很短的时间，有些系统达到均衡可能需要很长的时间，有些系统可能无法达到均衡。时间因素对经济学研究有着非常重要的意义，如均衡分析法无法考虑宏观经济政策中“时滞”使得许多实施时有效的政策在发生作用时却出现了与原意相反的结果。时间是度量政策效率的一个很重要的因素，如果不考虑时间因素有些政策可能很有效率，但纳入时间因素，一些需要太长时间才能使系统达到意愿均衡的政策可能根本就没有效率。进化博弈理论把时间纳入到模型分析中并充分应用数学中的相图来描述经济系统达到均衡的路径，这样有利于决策者控制经济系统使之朝向既定的目标前进，也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素，使系统尽快达到有效率的均衡。

5.3.3 局部动态法的均衡选择观

新古典经济学研究的逻辑有理性就有均衡，然后在既定均衡下通过对不同均衡的比较来寻找系统达到不同均衡的条件，即比较静态法，最后结合条件找出希望达到的均衡，因此，该理论不存在真正意义的均衡选择问题。经典博弈理论提供的分析方法在多数情况下都存在其自身所无法处理的多重均衡问题。如老鹰与鸽子博弈及系统选择博弈中多重均衡问题。进化博弈理论的局部动态法引入突变因素就能够较好地解决了多重均衡的选择问题，在老鹰与鸽子博弈中，尽管全是老鹰（全是鸽子）都是均衡的，但这两个均衡都极不稳定即都不是进化稳定均衡，一旦有鸽子（老鹰）突变者进入该系统就会使系统偏离，随着时间的推移而使得系统趋向于混合策略进化稳定均衡即一半鸽子一半老鹰（该均衡是一个全局吸引子）；在系统选择博弈中经典博弈理论无法解释系统最终会趋于哪一个均衡，局部动态法引入了突变因素就能够很好地解决了均衡选择问题，即系统最终会趋于哪一个均衡依赖于系统的初始状态即路径依赖。进化博弈理论的基本均衡概念----进化稳定均衡描述的是当经济系统一旦进入到某一均衡的吸引域内时，系统就会对其他的突变策略具有一定程度（即在突变边界内）的抵抗力。

5.3.4 局部动态法的特殊性

新古典经济学与经典博弈理论均衡分析法都是以单个消费者、单个生产者、单个市场为研究对象来考察参与人的最优决策行为，并由此研究整个社会的资源配置问题。然而它们却碰到了如何由个体行为转化到群体行为的困难，因为这种转化过程涉及到各种互动因素的影响。一个明显的例子是经典博弈理论中囚徒困境博弈，在该博弈中两个囚徒都从个体理性出发，但得到了集体非理性均衡的结论。也就是说，均衡分析法根本无法实现从个体行为向集体行为的过渡，在此框架内寻找宏观经济的微观基础的困难是非常大的。进化博弈理论的局部动态法则从人的社会性出发，利用系统论的处理方法来看待参与人的决策行为。该理论直接以参与人的群体为其研究的逻辑起点，在考虑到影响参与人行为的社会因素、文化因素、民族习俗及个体生活习惯等因素的基础上进一步考察群体中有限理性个体的行为互动关系，很巧妙地避开由个体行为向集体行为转化问题，因而能够更加真实地反应现实人的决策过程及其决策结果。

六、结论

进化博弈理论是经济学领域的前沿理论，它来源于对生态现象的研究，虽然该理论应用于经济分析的时间不长，但它为经济学研究提供了一个全新的分析方法，较好地克服了新古典经济学及经典博弈理论中理性假定及多重均衡的困难。并且，应用进化博弈理论来研究经济系统能够获得比传统理论更准确的结果，能够更加现实地解释经济现象，因而在短期内为多数经济学家所接受。从某种意义上说引入进化博弈理论局部动态法来分析经济中参与人的行为是经济学研究方法的一次创新。

注释： ①本文把源于冯·诺意曼和摩根斯藤经纳什发展而成的博弈理论称之为经典博弈理论。 ②即无性生殖，这样假定的意思就是说后代继承其母体的策略，并且永远不改变，当然用于研究人类的行为时，需要作相应的调整。 ③所谓近视调整即是指参与人不管未来怎么样，只知道使当前的支付最大化 ④ 经典博弈理论中每一个参与人都有特定的博弈对象，并且，在重复动态博弈中，后行动者通过观察先行动者的理而利用贝叶斯法则来修正自己的先念信念，然后，在此信念下选择使自己获得最大支付的策略。 ⑤好的策略即是指能够获得较高支付的策略。 ⑥所谓严格纳什均衡即是严格占优纳什均衡。给定对手选择的情况下，每个人都通过选择严占优的策略而组成的纳什均衡。 ⑦事实上，这与Selten提出的颤抖手均衡概念具有相似性，所谓颤抖手均衡是指一个战略组合，只有当它在允许所有参与人都可能犯错误时仍是每一个参与人的最优战略的组合时才是一个均衡，其严格定义可以参阅张维迎的《博弈论与信息经济学》。其中的颤抖或者犯错误与进化稳定策略中的突变因素有差不多的含义，但它们之间存在本质上的不同。 ⑧由模仿者动态方程进行支付变换，可得。 ⑨这一点我们可以从博弈论一个著名的捐款----回赠实验中看出，募捐者要求每一个人都自愿捐款，最终募捐者以3倍于捐款总额的钱平均分派给每个捐款者，为了使得博弈能够分析下去，募捐者要求自愿捐款时每个人都不得与其他人讨论，否则该博弈就无法进行下去，因此，本文称博弈论中的互动是一种沉默互动而非社会互动。这个实验充分体现了古典经济学及博弈论研究对象上的一致性，即它们都是研究单个个体的行为而排除了人的一个重要特征----社会性。参考文献

[1] 王则柯（1999）：《博弈论平话》，中国经济出版社。

[2] 张维迎（1999）：《博弈论与信息经济学》，上海三联出版社。

[3] 张良桥，冯从文（2001）：《进化稳定均衡与纳什均衡：兼谈进化博弈理论的发展》，《经济科学》，3，103-111。

[4] 张良桥（2001）：《理性与有限理性：论经典博弈理论与进化博弈理论之关系》，《世界经济》，8，74-78。

[5] 张良桥（2003）：《论进化稳定策略》，《经济评论》，2，70-74。

[6] 张良桥，郭立国（2003）：《论模仿者动态》，《中山大学学报自然科学版》，3。

[7] 杨小凯（2000）：《新兴古典经济学和超边际分析》，中国人民大学出版社。

[8] 青木昌彦, 奥野正宽(1999):《经济体制的比较制度分析》, 魏加宁等译, 北京: 中国发展出版社.

[9] Allais, M., (1952): The foundations of a positive theory of choice involving risk and a criticism of the postulates and axioms of the American school, in expected utility hypotheses and the Allais Paradox, edited by M. Allais and O. Hagen, Dordrecht: Teidel.

[10] Börgers, T. and R. Sarin (1997): Learning Through Reinforcement and Replicator Dynamics, Journal of Economic Theory, 77, 1-14.

[11] Börgers, T. and R. Sarin, (1995): “Learning through Reinforcement and Replicator dynamics”, Mimeo University College London.

[12] Conlisk, J.(1980): Costly Optimizers Versus Cheap Imitators, Journal of Economic Behavior and Organization, 1980, (1): 275-293.

[13] Cowen , Tyler, and Randall Kroszner, The Development of the New Monetary Economics, Journal of Political Economy , 1987, (95): 567-590.

[14] Crawford, Vincent, P. (1989): “An Evolutionary explanation of Van Huyck. Battalio, and Beil’s Experimental Results on Coordination,”Manuscript, Department of Economics, University of California, San Diego.

[15] Daniel Kahneman and Amos Tversky (1979):Prospect theory: An analysis of decision under risk, Econometrica, 1979, (47), 263-291.

[16] Foster, D., and P. Young.(1990) Stochastic Evolutionary Game Dynamics, Theoretical Population biology, (38): 219-232.

[17] Fudenberg, D. and C. Harris (1992): Evolutionary Dynamics with Aggregate Shocks, Journal of Economic Theory, 1992, (57): 420-441.

[18] Jones, R.. The Origin and Development of Media of Exchange, Journal of Political Economy, 1976, (84): 757-775.

[19] Kahneman, D. and A. Tversky(1974) : judgment under uncertainty: heuristics and biases, Science, 185, 1124-1131.

[20] Kahneman, D. and A. Tversky(1979) : Prospect theory: An analysis of decision under risk, Econometrica, 47, 263-291.

[21] Kandori, M. G. Mailath, and R. Rob (1993): Learning, Mutation, and Long-run Equilibria in Games, Econometrica, 61, 29-56.

[22] Kreps. D., and Wilson,(1982): Signaling Games and Stable equilibrium, Econometrica, 50, 863-894.

[23] Lewontin, R. C. (1960): Evolution and the Theory of Games. Journal of Theoretical. Biology. 1, 382-403.

[24] Maynard Smith, J. and G. R. Price.(1973): “The Logic of Animal Conflicts”, Nature, , (246): 15-18.

[25] Nash, Jr. John F.(1950), The Bargaining Problem. Econometrica.

[26] Nash, Jr. John F.(1951), Noncooperative games, Annals Mathematics 54.

[27] Schelling, T. (1960): The Strategy of Conflict, Harvard University Press, Cambridge, MA.

[28] Schelling, Thomas(1960), Strategy of Conflict, Harvard U. Press.

[29] Selten, P. (1978): The chain store paradox,Theory and decision 9, 127-159.

[30] Selten, R. (1980): A Note on Evolutionarily Stable Strategies in Asymmetric Games Conflicts, Journal of Theoretical. Biology. 84, 93-101.

[31] Selten, R.(1975), Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games, International Journal of Game Theory, 4, 25-55.

[32] Selten, R., (1965): Spieltheoretische Behandlung Eines Pligopolmodells mit Nachfagetragheit, Zeitschrift fur die gesamte Staatswissenschaft, 12, 301-324.

[33] Simon, H. A., (1955): A behavioral model of rational choice, Quarterly Journal of Economics, 69,99-118.

[34] Skyrms, Brian (1986): Deliberational Equilibria, Topoi, 5, 59-67.

[35] Smith, V. L. (1979): Indirect revelation of the demand for public goods: An overview and critique, Scottish Journal of political economy, 25, 183-189.

[36] Swinkels, J. (1993): Adjustment Dynamics and rational Play in Games, Games and Economic Behavior, .5, 455-484.

[37] Taylor, P. D. and L. B. Jonker.(1973): Evolutionarily Stable Strategy and Game Dynamics, Mathematical Social. Science (40): 145-156.

[38] Tversky, A. and D. kahneman(1992): Advances in prospect theory: cumulative representation under uncertainty, Journal of risk and uncertainty, 5, 297-323.

[39] Von Neumann, John and Oskar Morgenstern(1944), Theory of Games and Economic Behavior, Princeton U Press.

博弈论方法篇5

博弈论可以划分为合作博弈(cooperative game)和非合作博弈(non-cooperative game)。二者的区别主要在于参与人能否在行为时达成有约束力的协议，达成则是合作博弈；反之，不能强制他方遵守协议，各参与人只能选择自己的最优战略，则是非合作博弈。合作博弈强调团体理性、效率、公平和公正；非合作博弈则强调个人理性、个人最优决策。我们谈到的博弈多指非合作博弈。

博弈有两种划分：从参与人出场的先后顺序来看，博弈分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈指博弈参与人同时选择行动或非同时行动但对前者行动一无所知；动态博弈指参与人行动有先后顺序，且后行动者能够观察到先行动者的选择。从参与人对其他参与人的知识来分析，博弈分为完全信息博弈和不完全信息博弈，前者指每一个参与人对其他参与人的特征、战略和支付函数有确切的了解；后者则恰好相反。将两种分析结合起来，我们就有四种类型的博弈：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。

1.完全信息静态博弈：纳什均衡

完全信息静态博弈讲的是，假设博弈中所有参与人事先达成一项协议，规定每个人的行为规则，那么，在没有外在强制性约束时，参与人是否会自觉遵守协议。如果参与人自觉遵守该协议，则构成一个纳什均衡：给定其他参与人遵守协议的情况下，没有人积极偏离协议规则。换言之，如果一个协议不构成纳什均衡，它就不可能自动实施，因为至少有一个参与人会违背这个协议，不满足纳什均衡要求的协议是没有意义的。“囚徒困境”(Prisoner's Dilemma)和“性别战”(Battle of theSexes)是任何一本博弈论著作都会提到的纳什均衡特例。

2.完全信息动态博弈：子博弈精炼纳什均衡

动态是世间万物的基本特征。完全信息静态博弈只是一种独特的理想状态。在现实中，当后一个参与人行动时，自然会根据前者的选择而调整自己的选择，而前者也会理性地预期到这一点，所以不可能不考虑自己的选择对他人的影响。1965年，泽尔腾通过对动态博弈的分析，提出了“子博弈精炼纳什均衡”的概念，它要求任何参与人在任何时间、地点的决策都是最优的，决策者应该随机应变，而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时，则形成“子博弈精炼纳什均衡”。也就是说，组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。

3.不完全信息静态博弈：贝叶斯纳什均衡

不完全信息静态博弈指的是，参与人共同行动，没有机会观察他人的选择。每个参与人的最优战略只能是在给定自己的类型和他人类型依从战略的情况下，最大化自己的期望效用。在项目投标中各承包者的标价高低之争就是一个应用例证。

4.不完全信息动态博弈：精炼贝叶斯纳什均衡

在不完全信息动态博弈中，后行动者观察前者的选择并获得其偏好、战略空间等信息，修正自己的判断；而先行为者也知道自己行为的效用，会有意识地选择某种行动掩盖或揭示自己的真实目的。“黔驴技穷”就是一个不完全信息动态博弈的例证。

国际机制理论的理性主义流派概述

当前，国际机制的研究在理论与实践层面都对国际关系理论学者形成冲击，引起他们持续的浓厚兴趣，并表现出非凡的整合能力，对国际机制研究的不同思路和方法加以整理和批评已经成为学者们重视的工作。德国著名国际机制理论家沃科尔·利特伯格认为，国际机制理论有两种理性主义流派：新现实主义国际机制理论和新自由主义国际机制理论。（注：Andreas Hasenclever，Peter Mayer and Volker Rittberger，Theories of International

Regimes(London:Cambridge UniversityPress，1997)，pp.1-2.）

新现实主义国际机制理论的基本出发点是行为体之间的权力资源分配极大地影响着机制的出现、某问题领域机制的存在及其性质，特别是合作中的利益分配；国家会考虑无政府状态下的相对权力，对国际机制的效率形成制约。这些观点都体现在霸权稳定理论中。利特伯格认为，霸权稳定理论是“基于权力的国际机制理论的经典理论模式”，（注：Andreas Hasenclever，Peter Mayer and Volker Rittberger，Theoriesof International

Regimes(London:Cambridge University Press，1997)，pp.86.）而克劳福德认为，霸权稳定理论是新现实主义对机制产生最权威、最普遍认同的解释。（注：Robert Crawford，Regime Theory inthe Post-Cold War World:Rethingking Neoliberal Approaches toInternational Relations(Dartmouth:Darmouth Publishing Company，1996)，p.57.）霸权稳定理论的基本机制理论主张是：霸权国家建立了自己的霸权体系，并制定该体系的基本原则、规则、规范和决策程序，霸权国的实力与威望是其他国家接受这些国际机制的重要前提；霸权国利用这些机制维持霸权体系，最大限度地获得自己的利益；同时，为了维持该体系，它愿意向体系内的其他国家提供“公共商品”(Public Goods)，容忍“搭便车行为”(Free-rider)；霸权国的衰落或急剧变化，则该体系的国际机制发生相应变化。

新自由主义机制理论在过去10多年影响巨大，成为分析国际机制的主流理论。其基本机制理论主张是：国家是追求绝对收益的理性自我主义者，只关心自己的得失；承认权力在国际机制中的作用，但认为国际机制是国际关系中的独立变量(independent variable)，强调国际机制在帮助国家实现共同利益中的重大作用；活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益；不确定性是国际机制形成理论的核心，世界政治存在广泛的不确定性。国际机制帮助达成政府之间意愿的契合。行为体相信这种安排会帮助达成互利的安排。换言之，没有国际机制，则协议无法达成。国际机制正是通过降低不确定性来促进国际合作的。新自由主义机制理论是国际机制理论的主流学派，其影响也最大。该派理论用相互依赖的概念将现实主义和自由主义结合起来，具有重要的理论整合意义。

博弈论与国际机制理论

在过去十多年里，国际机制理论在国际合作的分析中独占翘楚，而博弈论在分析社会、经济和政治现象中应用最为广泛。两种理论都以探讨无政府状态下的竞争与合作问题为核心命题。这种平行并非巧合，因为机制理论从博弈论中借取了许多知识能量。理解促进合作的战略逻辑是解释无政府状态下国际机制起作用的关键。在讨论霸权、问题联系、相对收益和相互依赖时，博弈论的解释力有目共睹。这些恰恰是国际机制理论讨论的重心问题。（注：Andrew Kydd and Duncan Snidal，"Progress in Game-Theoritical Analysis of International Regimes"，in Regime Theory and International

Relations，ed.Volker Rittberger(Oxford:Clarendon Press，1993)，pp.112.）

博弈论方法篇6

1 国内外电力项目管理方法概述

（1）我国传统的电力项目管理方法。受技术和成本的限制，我国电力项目管理大致上经过了三个发展阶段，首先是建国初期的统包统管和外商包建模式，电力项目管理的重要性没有得到充分的认识，建设单位往往投入较大的成本，项目管理的专业化太低，电力项目管理的整体水平不高。其次是三方体制和指挥部模式，这一模式还是具有协调难度较大和管理水平较低的问题。自1988年以来我国开始学习工程项目管理模式，对电力建设市场进行了相应的改革，资本金制、法人责任制、工程监理制、招标投标制以及经济合同制逐渐应用到电力项目的建设过程中，电力项目的管理方式有了一定的进步和创新。

（2）国外电力项目管理方法。国外比较传统的电力项目管理模式是业主方进行项目管理。近年来，快速轨道方式以及阶段发包模式得到了快速的应用，该种管理模式可以最大限度的缩短工期，节省工程项目成本。BOT建造、运营以及移交管理模式是一种依靠私人资本进行基础设施建设的项目管理方式，代建制模式是依靠政府招标来选择合适的项目管理单位。电力项目管理模式不一而足，建设单位要根据工期、成本以及质量的问题，综合各种因素进行选择。

2 我国传统电力项目管理方法中存在的不足

随着改革开放的深入和电力市场的繁荣和发展，工程项目监理制度和招标承包制度逐渐引入了电力项目的建设市场，电力建设可以优先选择信誉较好的施工单位，这对提高电力项目工程的施工质量、提高投资效益以及进行科学决策都是有利的。但是，该种电力项目管理方式中，电力项目承包商和业主之间是对抗关系，承包商中标的价格较低，承包商以及业主在履行合约的过程中经常会遇到索赔问题。

（1）合同订立的问题。由于业主和承包商之间的对抗关系，只有规范化和精细化电力项目承包合同，一些模棱两可的问题才能有效的避免。由于电力项目的建设涉及到气候、地质和水文等很多不可控因素，在这种情况下，电力项目承包建设合同的条款越来越细，但是在电力项目的建设过程中，还是存在一些问题。业主和承包商均将合同作为争夺利益的方式，在一些问题不能及时解决的情况下，很容易引发问题甚至是诉讼。

（2）项目转包现象普遍。电力项目建设涉及的地区范围较广，很多电力项目建设的工期较长，电力项目建设过程中分包和转包的现象普遍。这也直接导致了不重视合同、体制和观念落后、法律法规不健全以及管理角色定位错误的问题，电力项目的施工质量、施工进度以及成本都很难控制。电力项目建设的损失较大。目前，我国虽然引进了工程招标投标制度，但是工程承包模式以及工程建设监理的模式还没有得到真正的解决，电力项目管理还存在众多的问题，现有的电力项目管理方法不能满足电力项目建设国家化的要求。

3 基于博弈论的电力项目管理方法新模式的提出

（1）博弈论概述。对于博弈论的研究始于19世纪，经济学家对金融寡头问题进行了深入的研究，1944年《博弈论与经济学》一书系统的阐述了博弈论理论体系，博弈论不仅在数学领域、经济学领域得到了快速的发展，还在经济、政治、生物进化等领域得到了重要的应用。博弈论在项目管理中的应用则是指通过承诺、协议和制裁而具有约束力。博弈是利益的分配，博弈论在电力项目管理中应用可以创新管理模式和管理方法。近年来，相关专家都对博弈论在电力项目管理中的应用进行了深入的研究，对质量、成本和工期项目管理对象进行了分析，并对施工行为和监理行为进行了分析。目前，博弈论在电力项目管理中的应用虽然是还没有系统的论证体系，但是博弈论可以改变电力项目管理中业主和承包商的对抗关系，促进双方之间信息的充分交流，实现双方利益的共赢。博弈论在电力项目管理中的应用不仅可以改善项目管理参与方信息不对称的问题，还可以降低信息交易成本，实现利益的共赢。

（2）基于博弈论的电力项目管理方法的提出。电力工程项目的建设也需要实现利益的最大化，参与方利益的共赢已经成为各方的共识。电力项目施工人员如果一天的工作结束之后拿到当天的工资，那么施工人员的工作积极性会大大的提升，项目管理人员还需要对项目进行定期的评价，针对项目管理中存在的诸多问题进行及时的调整，选择合适的解决方法，实现项目动态的管理与参与方信息的共享，进而实现项目参与各方利益的共赢。目前，基于博弈论的电力项目管理方法已经在一些电力工程项目建设中得到应用，项目管理方式也在不断的创新和进步。

4 基于博弈论的电力项目管理方法创新与实践

（1）团队的建设。随着社会用电量的增大，电力项目的建设已经得到了快速的发展，电力工程建设市场逐渐繁荣。但是，目前无论是电力项目管理人员还是施工人员都存在稳定性差、施工人员素质差以及投入与产出严重失衡的问题，这不利于电力项目管理方法的创新和进步。因此，电力工程建设单位要塑造良好的形象，只有提高了电力建设项目的效益，电力项目参与各方才能都获得收益。电力建设项目管理人员还要深入学习博弈论的内涵和意义，对质量、成本以及工期进行之间的影响与被影响关系进行深入的研究，提高管理的水平，提高管理的能力，减少成本的支出，拓展管理信息与专业技术的共享范围。

（2）信息传递方式的改变。参与方只有加强信息交流，缩短信息交流的时间，电力项目的建设和发展才能得到新的进步。基于博弈论的电力项目管理方法更有利于信息的交流和传递，避免施工过程中的信息不对称问题。目前基于博弈论的电力项目管理新方法已经逐渐应用到电力项目的建设和管理中，电子信息技术的应用加快了信息交流的速度，项目参与方可以实现方便和灵活的信息交流，降低信息传递成本，有利于参与方针对项目建设中出现的问题进行及时的协商，降低成本支出。

（3）合作机制的构建。基于博弈论的电力项目管理方法需要利益各方的信息交流和合作，合作的水平和程度取决于电力项目合作机制的运行状况。博弈论在电力项目管理中的应用需要管理人员对质量、成本以及工期进行综合的考量，对传统的项目管理方式进行创新和优化，实现更加主动性、组织性、计划性以及结构性的合作机制的建设，强化项目建设各方的协作和合作，对项目的投入和产出进行更加深入的研究，发挥项目管理人员在资源效用、技能以及经验方面的能力。此外，参与各方还要进行协商机制的建设，对出现的问题进行及时有效的解决，实现信息一体化、透明化以及讨论的实时化，实现电力项目管理人员在职业经验和技术技能经验的共享。

（4）激励机制的构建。项目管理的目的就是实现利益的最大化，施工人员是电力项目管理中的重要因素。电力项目管理的过程中可以引入激励机制，逐步创建内部激励和外部激励机制，可以对施工人员进行物质上和精神上的奖励，在充分考虑电力项目管理影响因素的基础上实现各种激励机制的结合，在各方利益的博弈中实现投资效益的最大化。

5 结语

随着经济的发展和人们生活水平的提高，社会的总体用电量呈连年上升趋势，电力建设项目逐渐增多。质量、工期和成本一直是工程项目管理的三大控制目标之一，电力项目的质量、成本和工期也是各方利益综合博弈的结果。很多情况下，电力企业为了保障电力项目质量，就要加大成本的投入，或是为了赶工期而忽视质量，这样不利于电力项目的建设。博弈论在电力项目管理中的应用不仅可以有效的解决这一难题，还会实现电力项目管理方法的创新。

参考文献：

博弈论方法篇7

随着移动通信、光纤通信、云计算、多媒体等技术的快速发展，有效促进了社交网络平台的普及和应用，已经诞生了QQ、微信、微博、BBS、Twitter、Facebook等社交网络平台，这些社交服务采用了SNS模式，可以为人们提供交友、购物、学习等多种服务，扩大了人们生活交际的渠道和平台，进一步改善人们的生活质量和水平[1]。社交网络发展过程中，访问控制一直是人们研究的重点，论文基于笔者多年的研究，详细地分析了社交网络应用发展过程，探讨了基于博弈论的社交网络访问控制应用设计功能，构建完善的用户信任机制、损益机制和病毒防御机制，能够提高社交网络访问控制能力和成效。

2、社交网络应用分析

随着Web2.0的诞生，人们社交服务采用的SNS平台已经得到了广泛应用，其以人为本，具有真实化、个性化、互动性等多种特征，目前已经诞生了多种SNS网站，比如LinkedIn、微博、BBS等[2]。具体的社交网络应用发展包括以下几个方面：

（1）高校型SNS平台。高校SNS平台发展起步较早，一直走在社交网络的前言，目前常用的高校社交网络平台为人人网、BBS、Facebook等，扩展了高校学生交友、学习、就业渠道，丰富高校学生的精神文化生活，

（2）商务型SNS平台。商务交往是企业发展的重要途径，商务活动是企业推广产品、市场营销的重要任务，构建商务型SNS平台，可以为企业构建商务圈，为企业发展提供合作交流、洽谈渠道，目前最为常用的商务SNS平台为LinkedIn，该平台拥有将近7500万家企业入住，涉及电商、旅游、工业、农业等多个领域。

目前，随着SNS服务平台引入更加先进的推广技术，社交网络在各个领域如雨后春笋，诞生了饭否、美团、占座等多个平台，覆盖了人们工作、生活和学习的各个领域，促进了人们生活信息化、便捷化，具有重要的作用和意义。

3、博弈论在社交网络访问控制中的应用设计

3.1构建完善的用户信任机制

目前，许多网络构建信任机制常用的方法是根据网络节点操作记录，判定使用主体可信度[3]。社交网络用户信任可以利用博弈论的网络节点信任数值计算方法，确定用户的信任度，计算过程中利用的数据包括用户注册时间、发帖数量和朋友圈人数等，具体的计算方法如下：

（1）用户驱动方法。用户驱动方法可以根据自己的社会关系、朋友圈确定用户信任度，比如用户和朋友圈的许多人都拥有一个共同好友，则该好友的可信度就判定为较高，比较符合用户的实际情况，具有较高的灵活性。

（2）机器驱动方法。机器驱动方法可以通过SNS平台的发现机制、推荐机制进行执行，平台可以搜集用户的详细信息，利用用户的浏览记录、消费记录等行为，统计计算用户的信任值，可以迅速、客观、简单地分类用户，具有自动推荐等特点。

（3）混合驱动方法。混合驱动方法在集成用户驱动、机器驱动等方法的优点，自动计算和确定用户信任度，为用户推荐朋友圈，并且通过用户判定之后方可建立信任机制，提高了信任可识别性，具有重要的作用。

3.2构建用户损益机制

社交网络用户损益是通过朋友圈人数进行确定的，朋友圈人数越多，收益越大，朋友圈人数越少，损失就越大。但是，用户朋友越多，个人信息和隐私泄露的概率就变大，为用户信息带来了较大的风险。构建用户损益机制，可以防止网络欺骗，鼓励用户之间真诚交流。基于博弈论的用户损益机制包括欺骗与非欺骗服务、诚实与拒绝服务等博弈策略。如果用户认为来访人员带来的损失超过收益，存在欺骗访问行为，可以通过网络将举报信息发送至服务器或管理员处，通过监管对访问人员进行惩罚；当系统认为收益超过损失，判定为诚实访问，将其列入到用户的朋友圈，扩展用户的朋友圈人数，提升用户收益。基于博弈论的用户损益机制可以较为准确地识别欺骗访问、诚实访问，强化欺骗访问的处罚力度，促使用户不能使用社交网络实施欺骗行为，减少欺骗用户数量，提高诚实访问用户数量，促进社交网络能够健康运行和发展。

3.3构建网络病毒防御机制

随着社交网络服务平台的普及，其在为人们带来高质量、信息化生活的同时，也为人们带来了潜在的安全威胁，造成人们的信息丢失，进而钱财、生命安全受到侵害，严重的损害了社交网络正常运行和发展。基于博弈论的网络病毒防御机制可以将用户进行分类，分别是合法用户、攻击威胁用户，这两种用户属于非合作性质的博弈，一方的损失必然伴随一方的获利，是一种非零和的博弈，两者之间的损失和收益是不对等的，并且博弈策略偏向维护合法用户，也就是收益时对合法用户影响较大，损失时对攻击威胁用户影响较大，这种策略可以阻止网络攻击，降低病毒对社交网络合法用户的侵害，具有重要的作用和意义。

4、结束语

随着社交网络平台的快速诞生，社交网络保存了海量的用户信息，因此亟需提高访问控制管理水平，以便保证用户信息的安全性。论文基于博弈论设计了一种访问控制方法，可以构建用户信任机制、损益机制和病毒防御机制，更加符合人们参与社交网络的应用背景，提高人们社交服务的信息化水平，具有重要的作用。

参考文献

[1]孟宪佳，马建峰，王一川，等.面向社交网络中多背景的信任评估模型[J].西安交通大学学报，2015，49（4）：73-77.

[2]陈庆丽，张志勇，向菲，等.面向多媒体社交网络的访问控制模型[J].西安电子科技大学学报：自然科学版，2014（6）：181-187.

[3]刘娜，叶春晓.线上社交网络访问控制模型综述[J].计算机系统应用，2014（5）：1-7.

作者简介

博弈论方法篇8

群体决策的研究涉及多个学科，不同学科对群体决策的研究所采取的方法和着重点不一样。在经济学、政治学、管理学领域对群体决策的研究侧重于偏好的集结，较少考虑影响偏好形成的潜在背景信息。其中社会选择理论与公共选择理论利用数学分析的方法和福利经济学的一些基本原理，研究如何“公平合理地”将群体成员的偏好集结为群体的偏好并据以作出群体的选择，这方面的研究源于Condorcet投票悖论的提出，从20世纪50年代开始经过Arrow、Sen、Gibbard和Satterthwaite等人的进一步发展，已形成完整的理论体系，通过对理性社会选择本质的剖析，促进了人们对选举、立法以及政治机构运作等问题的理解。

在管理科学领域，对群体决策的研究主要强调如何通过对群体成员以不同形式表达的偏好的集结，使得群体成员就最终决策达成某种程度上的一致，而一致性则意味着“正确性”，这方面最具代表性的是社会决策图式理论。

在社会心理学领域对群体决策的研究主要采用实验性方法，通过对群体成员之间交互过程的分析研究群体决策的信息集结有效性，一般假定群体成员具有共同的目标，很少考虑决策过程中的策略，心理学研究的主要成果是对群体思维和群体极化现象的分析。

近年来国外出现了不少用博弈论作为理论工具研究群体决策信息集结问题的文献，这些文献主要发表于经济学、政治学与政治经济学期刊，通过对群体决策过程中群体成员的动机和理的分析，给出了一些与人们的直觉完全相反的结论。笔者将对此领域的研究进展从决策信息的获取、审议过程中信息的披露、透明性的影响与最优决策规则四个方面进行评述。需要说明的是，这四个方面紧密关联，特别是决策群体成员的信息披露动机直接受到决策过程对公众是否透明以及最终的投票表决规则的影响，而群体成员的信息获取动机则部分地取决于信息披露动机，但由于利用博弈论分析群体决策问题的复杂性，现有的文献主要还是相对集中于其中的一两个方面。

文［1］是注意到此领域较早的综述性文章，该文发表于1999年，讨论了当时出现不久的研究政治机构信息集结作用的文献，其中对最先考虑策略性投票表决行为的文［2-5］等进行了简要介绍。同年9月份，《美国国家科学院院刊》发文评述了研究选举的信息集结作用及因投票者私有信息的不准确而导致的策略性投票表决行为的成果［6］，其中提及的部分研究工作尚处于未发表状态。文［7］对研究货币政策委员会决策过程中的动机问题的文献进行了系统讨论。文［8］总结了货币政策委员会决策机制设计应该考虑的各种因素，对与群体决策相关的经济学与社会心理学理论与实验分析文献进行了评述，其中讨论了信息集结问题。应该说文［9］是目前评述基于博弈论的群体决策信息集结研究文献较为全面和细致的文章，该文从策略性投票、信息获取、利益冲突和交流四个方面进行了详细评述，并讨论了此领域的研究成果对货币政策委员会决策机制设计的参考价值。

本研究与文［9］的差别在于：第一，文［9］的讨论基本上局限于基于博弈论的群体决策信息集结研究本身，而笔者从研究方法、研究对象与研究成果等方面将基于博弈论的群体决策信息集结研究与经济学、政治学、管理学以及社会心理学领域对群体决策的传统主流研究进行了对比，分析了博弈论作为理论工具研究群体决策信息集结问题的优缺点，并深入探讨了现有研究工作存在的不足之处，也即指出了此领域可能的研究方向，因此，笔者的深度与广度有所超越。第二，文［9］对此领域研究成果的评述思路稍显混乱，文献分类较不合理。第三，笔者特别关注了研究决策过程的透明性对群体成员信息获取与信息披露动机以及投票表决行为的影响的文献，而文［9］对此几乎没有涉及。第四，文［9］发表后此领域出现了不少具有重要参考价值的文献，笔者对这些最新的文献给予了较为详细的评述。

二、决策信息的获取

（一） Condorcet陪审团定理与搭便车问题

与决策问题相关的各类信息一般以分散的、局部的形式存在于社会系统，群体决策的意义之一，是可能更充分地利用这些信息，因而更有可能作出正确的决策。不考虑其他因素，仅从信息集结的角度看，让更多拥有信息的个体参与决策可以改善决策质量，这种观点符合人们的直觉，其形式化证明出自18世纪Condorcet给出的陪审团定理。该定理认为：群体决策可以有效集结信息，在多数决定规则下，增加群体成员数量可以增加作出正确决策的概率，并且随着成员数量趋于无穷，作出正确决策的概率趋于1。

Condorcet陪审团定理及其后来的很多拓展往往都有个潜在的假设：群体决策者所掌握的与决策问题相关的信息是事前外部给定的，或是以零成本获得的［9］。但对于许多现实决策情形，信息并不是不需要投入成本和努力就能轻易得到的，如审稿专家需要付出一定的时间和精力才能决定稿件是否符合录用标准，因此决策者必须决定是否付出以及付出多少代价以获取信息。而在群体决策中，与决策问题相关的信息是公共物品，因而存在典型的所谓社会惰化（social loafing）现象或搭便车问题（freerider problem）。

文［10］对陪审团决策中的信息获取问题进行了研究，认为陪审员的信息准确程度取决于陪审团的大小，更大的陪审团的陪审员具有更少的动机认真听取审判过程，所以更大的陪审团作出正确判决的概率可能更小，从而导致陪审团定理不再成立。文［11-17］进一步研究了群体决策中的理性无知（rational ignorance）问题，对仍能有效集结信息时信息获取成本或成本函数需要满足的条件进行了分析，这些文献针对多数决定规则，假定所有群体成员具有完全相同的决策偏好。其中文［11,13-15］证明，当全体或部分群体成员的信息获取成本函数在获取零信息处的二阶导数为零，则Condorcet陪审团定理仍然有效。

另外，文［18］通过一个仅有两个成员的群体决策模型，指出群体成员间的交流可能会恶化信息获取中的搭便车问题。在该文中，决策成员首先收集关于一项工程实施后果的信息，然后相互交流，再投票表决是否实施该项工程。文章指出，如果交流的作用仅限于信息集结，则交流可能会减少作出正确决策的概率，特别是当高质量的信息很容易获得时，交流会减少决策成员收集信息的动机，加剧信息收集中的搭便车问题，但当信息收集需要付出高昂的代价时，更多的交流通常会增加作出正确决策的概率。

（二）搭便车问题避免措施

因为信息获取活动一般是不可观测的，搭便车者可以通过提供一个虚假的信息假装已经给予了足够的投入，所以无法通过有效的惩罚措施以阻止搭便车问题，只能够从决策群体的成员组成和决策规则等方面考虑避免该问题的发生。

文［19-20］的研究结论从决策群体人员组成方面为避免信息获取中的搭便车问题提供了理论参考，指出具有极端偏好的成员相对来说更具有收集高成本信息的动机，但这两篇文献的研究内容不属于严格意义上的群体决策，因为其中的委员会成员仅负责收集与报告信息，自身并没有决策权。在文［19］中，委员会成员在信息收集之前相互间没有偏好差异，在投入不可观测的努力收集信息后形成各自不同的政策偏好，该文证明最优的委员会规模和总的社会剩余有时会随委员会成员偏好差异期望值的增大而增大，因为预期的偏好差异为成员提供了收集信息的动机。文［20］指出，如果信息收集的成本较低，委员会成员的偏好应该与决策者的偏好类似，这是因为一方面与决策者偏好类似的成员会收集决策者想要的信息，另一方面由于偏好类似所以在报告时不会产生信息的扭曲问题；如果信息收集的成本较高，则委员会应该由具有极端偏好的成员组成，只有这些成员才具有足够强烈的动机付出代价收集信息，但因为信任问题，他们往往只会收集硬信息，即客观上可验证的信息。对于在投票表决前需要对决策选项进行审议的群体决策来说，文［20］的研究结论尤其具有参考价值。

从群体决策机制设计的角度看，如果存在信息获取问题，则机制设计者必须既要考虑如何提供充分的激励促使群体成员获取信息，又要考虑如何有效集结成员所获得的信息，以最大化群体决策的期望效用。

文［21］证明，采用适当保守的决策规则可以促进群体成员收集证据，从而改善决策质量。文［22-23］对存在信息获取时的群体决策最优规则与最优群体成员数量进行了研究。文［22］指出，尽管一致性规则使每个群体成员的投票选择对最终结果都具有决定性影响力，但一致性规则并不能为获取信息提供适当的激励，而且一致性规则特别不适合于信息较不准确的情形，也即更需要群体决策的情形，在只考虑单调纯策略均衡的条件下，除非群体成员的信息足够准确，否则一致性规则或接近于一致性规则的规则不可能最优。文［23］认为，为了提供足够的信息获取激励，对于相当普遍的决策情形，事前最优的决策机制事后可能是非最优的，即不必然利用了所有群体成员获取的信息导致从统计学角度有最优的信息集结，该事前最优的决策机制是在激励成员获取信息与最大程度提取成员信息之间折中的产物。需要指出的是，文［21-23］均假定决策群体成员具有相同的偏好。

三、审议过程中信息的披露

决策群体，尤其是规模较小的群体，一般会在投票表决前对决策选项进行审议，交流各自的私有信息。信息的共享能引起成员信念的收敛。但群体成员通常代表着不同的利益集体，具有不同的利益追求或偏好，因而具有操纵或隐藏私有信息的动机，从而限制了信息共享的可能性，成员间策略性的信息操纵与反操纵甚至导致比纯粹偏好冲突更大程度上的意见不一致。

绝大多数群体决策文献对审议（deliberation）、交流（communication）、辩论（debate）、廉价磋商（cheap talk）等类似表述用语没有进行明确的区分，虽然这些用语在不同场合有一些微妙甚至较大的差异，如文［24］认为审议是辩论的子集。

研究审议对群体决策的影响的文献一般将决策过程建模为两阶段博弈：先审议后正式投票表决，通过对贝叶斯Nash均衡策略和均衡存在条件的分析，研究审议是否以及如何对群体决策发生作用。这类文献一般假定无论是以公共利益还是以私人利益作为评判标准，好的决策选择总是部分取决于世界的真实状态，而世界的真实状态对决策群体成员来说无法确切知道，他们仅不对称地掌握了有关世界真实状态的部分信息。在正式投票表决之前的审议过程可以使群体成员有机会告诉其他成员他们所掌握的私有信息，然后，根据各自已掌握的关于世界真实状态的部分信息，群体成员形成自己对世界真实状态的判断，进而根据自己的评判标准形成各自的决策选择偏好，如果他们的决策选择偏好不一致，就有可能在审议的过程中不披露自己的真实信息，或提供虚假的信息以诱导其他成员作出对自己有利的决策选择。因此，此类文献注重从信息集结角度对完全信息披露均衡和完全信息集结均衡的分析。

Coughlan在文［25］中认为，当所有群体成员的决策偏好完全相同或足够接近，在审议过程中每个成员都具有真实披露私有信息的动机。文［26］则进一步证明，只要群体成员主观上认为多数成员与他拥有共同偏好具有较大的可能性，客观上的偏好差异不会影响信息的真实共享。然而，该文同时指出，审议并不总是能有效集结信息，特别是当群体成员没有较强的先验信念认为自己的价值取向就是群体主流的价值取向时，可能出现有意的相互欺骗。需要说明的是，在文［26］给出的模型中，所有群体成员的偏好或者完全相同，或者完全相反，与此相符的现实群体决策情形很少，甚至几乎没有。文［24,27-28］证明一致性规则在很多情况下为群体成员在审议过程中策略性地隐藏信息提供了动机，多数决定规则比一致性规则能引导出更多的信息共享。文［28］还证明，在相当一般的条件下，审议使得除一致性规则以外的所有其他规则具有相同的序贯均衡集合，也即审议使得所有的无否决权规则在序贯均衡方面等价，从而说明如果群体成员在投票表决前有向所有成员公开宣布各自私有信息的机会，那么采用除一致性规则以外的其他任何决策规则，都会产生相同的决策结果。文［29］对陪审团在审议阶段信息的披露进行了实验研究，以无约束力的意向性投票形式实现信息的交流，实验结果与理论分析基本近似。

另外，文［30］给出了一个两成员的交流与决策模型，两个成员投票表决是否组成具有不确定回报的合伙关系，他们的偏好不一致且为私有信息。文章分析了均衡的特征，发现在均衡时仅有部分信息被传递，交流对于双方的福利是有益的。

对于很多现实决策问题，决策者可能拥有客观上可验证的信息，即所谓硬信息（hard information）。文［31］对硬信息在具有偏好冲突的委员会中的交流进行了研究，证明完全信息集结均衡在偏好为私有信息的情况下比在偏好为常识情况下更有可能存在，即允许更大程度上的偏好差异；另外该文证明，如果信息可验证，完全信息集结均衡的存在条件等同于完全信息披露均衡的存在条件。文［32］指出，在审议阶段群体成员共享私有信息的动机一定程度上取决于其私有信息的可验证性，如果决策成员能够为自己的信息提供验证材料，则一致性规则比其他规则提供了更强的信息共享激励，更有可能实现完全信息共享。文章给出了在一致性规则下审议阶段存在完全信息披露均衡的充分必要条件。

文［33］指出，尽管偏好与信息的差异可能使得部分成员在审议过程中具有错误表达私有信息的动机，但给予群体成员适当的外部激励能消除此类动机，促进信息与偏好的完全集结，而且随着群体规模的扩大，外部激励的强度可以很小，外部激励的具体措施包括对成员决策能力的肯定等。

四、透明性的影响

随着社会的进步，公众对涉及自身利益的重要决策过程的透明性提出了越来越高的要求。透明的决策过程意味着公众可以评价决策群体成员的偏好、能力与贡献，从而引起决策者对自身声誉的关注，而对声誉的关注既可能促进信息的获取和真实信息的披露，但也有可能导致信息传递与投票表决行为的扭曲。

在文［34］中，委员会成员在前一时期表现出的决策能力影响了他在后一时期能否获得连任，而作为委员会成员可为其带来一定的效用。该文证明公开个人投票记录可以促进委员会成员努力获取信息。文［35］认为，仅公布最终决策结果，不公开个人投票记录，会诱导委员会成员按照现有偏见作出投票选择，因此，委员会的决策倾向于保守化，向公众公开成员的投票记录则能够减少现有偏见对决策的影响。该文同时认为，群体决策机制的设计应该不仅考虑决策过程的透明性，也要考虑决策规则的适当性，如果决策规则选择合适，则不透明的决策过程可能比透明的决策过程得到更好的决策结果。在文［34-35］所给出的模型中，都没有考虑委员会成员在投票表决前可能会相互交流各自的私有信息。

在文［36］中，委员会代表公众对一项新工程的实施与否进行表决，委员会成员既关心工程的实际价值，又关心委员会在公众中的声誉，如果维持现状，不实施新工程，则暴露出委员会成员意见的不一致，从而给委员会的声誉带来负面影响，而公众仅能注意到委员会的决策结果，事后不能观测到工程的实际价值。该文证明，在审议阶段，部分成员对声誉的过分关注可能使他们不愿真实披露私有信息，而是夸大工程的价值，导致更容易采取实施新工程的决策。文［37］认为，公开委员会的具体审议记录可能会降低决策质量。由于委员会成员关心公众对其决策能力的判断，使得他们在正式会议交流过程中可能隐藏内部存在的意见分歧，公众对于决策过程透明性的要求，可能导致委员会在正式会议之前组织秘密的非正式预备会议，将真正实质性的讨论从公开的正式会议阶段转移到秘密的预备会议阶段，从而对公众消除委员会内部意见的不一致，而非正式的会议更具有不稳定性，因此，透明性要求并不一定能增加社会福利。

在文［38-40］中，外部利益关联者可以观察到公开委员会每个成员的具体投票记录和决策结果，但对于秘密委员会则只能看到最终决策结果，而委员会成员既关心决策结果又关心外部利益关联者所给予的回报。文［38］和［39］认为，不公布委员会成员的个人投票记录可以减少外部利益关联者对决策的影响，在某些情况下秘密委员会优于公开委员会。文［39］还特别指出，由于随着群体成员数量的增加，单个成员的投票对最终决策具有决定性影响的概率减小，对单个成员而言不诚实投票的代价随之减小，所以对于公开委员会来说，其成员更容易因外部利益关联者承诺给予的回报而不诚实投票，因此Condorcet陪审团定理可能不再成立。在文［40］中，对于秘密委员会，外部利益关联者可以根据投票表决规则的阈值和最终决策结果对委员会成员的投票作出推断。文章分析了秘密委员会的最优决策规则，指出决策规则中增加选择某一选项需要的投票比例可能会导致该选项更容易成为最终决策结果，传统看法认为降低决策规则的阈值可以防止委员会过于保守的看法未必正确，但对于公开委员会则不存在此问题。文［41］虽然不是直接研究透明性，但其研究结论与此处内容相关，该文通过一个博弈模型，说明在特定情况下，外部利益集团可以不用付出任何代价就能操纵委员会的决策。

另外，不少文献从理论与实证两方面研究了决策过程的透明性对货币政策委员会决策的影响。文［7,42］对这方面的文献进行了综述。文［42］区分了三种类型的透明性：决策目标透明性；知识透明性，这里的知识指决策所依据的经济数据或经济模型等；操作透明性，包括委员会会议记录与投票记录的透明性以及决策结果的透明性等。该文评述的文献有部分运用了博弈理论作为分析工具。文［7］专门讨论了货币政策委员会决策过程中的动机问题，指出货币政策委员会的最优规模与透明性等仍有待进一步研究。

类似于文［34］，研究透明性对货币政策委员会决策信息集结有效性的影响的文献，一般认为委员会成员希望得到社会公众对其决策能力或决策偏好的正面评价，从而获得连任的机会，如文［43］假设委员会成员希望公众认为他是通货膨胀的强硬抵制者，而最近的文献如文［44-46］等，则假设委员会成员希望公众认为他是具有较强决策能力者。文［44］认为，公开审议过程的详细记录会使得货币政策委员会成员不愿意表达不同的意见，该文通过对美联储联邦公开市场委员会在被要求公开会议记录之前和之后的会议记录的分析说明了理论结果的有效性。文［45-46］分析了投票记录的公开对委员会成员投票表决行为的影响，认为投票记录对公众的透明带来的负面效应占主导地位，透明性不能增加社会福利。

五、最优决策规则

显而易见，不同的决策规则极大地影响了群体决策的信息集结效率，尤其是决策群体成员的偏好或能力不完全一致时，决策规则更是直接影响了群体成员的投票选择行为，进而影响了决策结果的正确性。前述文献大多不同程度地讨论了决策规则的比较和选择，除此以外，另有部分文献对各种情况下的最优决策规则进行了研究。

文［47-48］从最大化期望效用的角度对固定规模的委员会形式集体决策的最优决策规则进行了分析，文［49-50］研究了在特定约束条件下的最优决策规则。然而，这些早期的文献都有个潜在的假设：决策成员仅按照自身获得的信息作出投票选择。文［2,51］等指出，即使决策群体成员的偏好完全一致，也不能保证一定能够如Condorcet陪审团定理所预测的那样有效集结各成员的信息，因为群体成员仅根据自身信息作出非策略性的选择不符合理性要求，当且仅当所使用的决策规则为集结群体成员私有信息的最优规则时，所有群体成员仅按自身信息投票才是Nash均衡，而最优决策规则则取决于特定的决策情形。

文［52］证明，当采用文［48］所定义的最优决策规则时，所有成员仅按照自身获得的信息投票表决形成Nash均衡，但仅按自身信息投票可能不是有效的，因为部分成员联合决定策略性投票可以增加期望效用。文［53］讨论了投票者对不同决策选项具有可用基数表示的效用时的诚实投票问题，试图给出当决策机制允许多种消息类型时诚实投票的准确定义。为使投票者具有诚实投票的动机，文［54］提出了一种在随机选择的投票表决集合上运用多数决定规则得到最终决策的方法，在对所有投票者的表决结果运用多数决定规则和仅对投票表决结果的随机抽样子集运用多数决定规则之间进行随机选择，可以激励投票者诚实投票，从而得到Condorcet陪审团定理的有效性收敛结果。

文［55］基于陪审员的私有信息和策略性表决行为构建了一个陪审团决策模型，证明一致同意规则可能会导致无辜被告得到有罪判决和有罪被告得到无罪判决这两种错误的概率都增加。文［56］分析了决策群体所投票表决的决策选项不独立于投票表决规则的情形：给定决策群体的投票表决规则，提案者向决策群体提出一个要么完全接受要么完全拒绝的议案，群体投票表决是接受还是拒绝该议案。该文证明由于一致同意规则能促使提案者提出更有吸引力的议案，所以增加了决策群体的期望效用，在某些情况下，一致同意规则甚至是Pareto最优的表决规则，因为它也增加了提案者的期望效用，即使提案者与决策群体的利益追求可能完全相反。总结考虑一致性规则的文献［22,24,27,28,32,55,56］，可见博弈分析得到的结论往往与人们直观上的认识截然相反，一致性规则是不是合适的决策规则完全取决于特定的决策情形。

既然投票表决规则直接影响了投票者的投票选择行为，那么，对于群体决策机制的设计者来说，他在选择投票表决规则时是否需要考虑投票者在各种表决规则下的投票行为，换言之，机制设计者关于投票者在各种规则下的博弈行为的信念是否会影响到最优决策规则的选择。文［57-58］对此问题进行了研究，其中假设群体成员的决策偏好完全一致。文［57］分析了决策成员的能力存在差异且这种差异是常识的情况下的投票表决规则，指出最优的匿名单调投票规则并不取决于成员是否按照自身信息投票或策略性投票。类似于文［57］的结论，文［58］认为，决策机制设计者对最优投票表决规则的选择与机制设计者关于投票者在不同表决规则下的投票行为的信念无关，在该文中，机制设计者为决策群体选择投票表决规则，其目的是为了最大化决策群体的期望福利，文章证明，仅从信息集结的角度看，关于投票者在各种表决规则下的投票行为的不同假设对于最优决策规则的选择来说，结论是一样的，不同的行为假设导致相同的结论。对于具有相同偏好的决策群体来说，文［57-58］的研究结论大大简化了决策规则的选择。

现实中的决策群体往往存在具有极端偏好的成员，这些成员的存在为信息的有效集结带来较大的困难。文［59］对存在极端偏好者和中立者的群体面对二分决策问题时的最优决策规则进行了研究，考虑了决策成员之间存在转移支付的情况，指出最优投票表决规则相对于转移支付可能性的大小来说是非单调的。文［60］对由两类具有完全相反的偏好的成员所组成的委员会决策进行了分析，对比了一致性规则与非一致性规则的信息集结效率。文［61］给出了一个现实中较难接受的非单调性决策规则――超多数惩罚（supermajority penalty）规则，当选择某一选项的投票过多时，将该选项作为群体决策最终结果的概率反而会下降，该文证明，当对于每个选项都存在极端偏好者时，超多数惩罚规则是最优匿名激励相容规则。

前述文献都假定群体成员的偏好相互独立，而文［62］对群体成员具有相互关联但不完全相同的偏好的情况进行了分析，其中的决策选择空间是连续的，该文分别讨论了采用平均规则与中值规则时所对应博弈的对称贝叶斯Nash均衡的存在性问题，并比较了这两种规则在不同偏好关联程度下的性能。

由于从众心理，群体成员经常会根据对其他成员行为的观察相应调整自己的行为。文［63-64］对从众心理对群体决策的影响进行了研究，其中假定群体成员一方面希望选出好的决策选项，另一方面又希望自己成为胜出的一方。文［63］分析了群体规模较大时同时投票机制与顺序投票机制的均衡特征和信息集结质量，文［64］指出这种从众心理导致同时存在多个均衡，而且对于这些均衡中的多数，信息不能被有效集结。文［64］从某种程度上说明了最优决策规则设计的困难。

六、现有研究工作的不足之处

其一，社会选择理论与公共选择理论以及管理学领域对群体决策的研究，主要考虑偏好集结的有效性，而其中的偏好则是指对决策选项的偏好，这种偏好取决于决策者对最终结果的更根本意义上的偏好和对世界真实状态的信念。在现实社会中，纯粹以偏好的有效集结为终极目标的重要群体决策问题几乎不存在，例如社会选择理论与公共选择理论最重要的应用领域――选举，既是偏好集结（这里指更根本意义上的偏好），更是信息集结。仅考虑偏好的集结问题，不考虑偏好的形成过程以及信息在偏好形成过程中的潜在作用，无法分析群体内外部交流与互动等对决策的影响，无法解释现实中的很多现象，因而对相关决策机制设计的指导作用较为有限。

其二，社会心理学从认知的角度研究群体决策，其结论出自于对实验和经验数据的统计学分析，易于为人们接受。但由于从实验或经验数据中利用统计学方法推导出群体的偏好分布参数极为困难，所以无法深入研究群体决策过程中因偏好不一致而导致的隐藏与扭曲私有信息等策略。

其三，与社会选择理论和公共选择理论一样，用博弈论研究群体决策信息集结问题的文献也是以理性选择假设作为判断与决策的微观基础。尽管所有群体成员严格按照贝叶斯规则更新自己的信念等完全理性假设对于心理学家和普通人来说都是难以接受的，但博弈论文献还是以其数学分析的简洁与严谨颠覆了很多直觉上的认识，通过对群体决策者动机的分析，有助于我们理解决策机制的哪些方面可能会引起不利于决策目标实现的策略，进而有助于决策机制的改进。随着群体成员偏好差异程度和决策问题重要程度的增加，审议方式和决策规则趋向于书面化和正规化，群体思维与群体极化现象将很少出现，决策结果也将更接近于博弈分析的预测。

目前对群体决策信息集结问题的研究尚处于起步阶段，还有很多不完善之处，在某些方面甚至存在根本性的缺陷。

第一，可能是受到信息经济学研究的误导，本领域的很多理论与实验分析文献，包括一些奠基性的文献，混淆了信息与在信息基础上形成的判断。真实信息的披露不会引起其他群体成员以及公众对自己决策能力的负面评价，更不会如判断的披露那样引起认知上的从众，如果决策者掌握了确凿可靠的信息，则其不会因为其他人基于其他信息产生的不同看法而轻易改变自己的信念。

除个别文献外，现有研究群体决策信息集结问题的文献几乎都是将审议完全等同于信息经济学领域的廉价磋商，将交流限制为每个群体成员同时向所有其他成员发送一轮公开的消息。在现实群体决策过程中，审议至少包括对各方面提供的信息的真实性的审议，以及对信息与世界真实状态之间的逻辑关联（即潜在的决策模型）的审议。因此，将审议建模为完全的廉价磋商的现实意义极为有限，对于偏好差异较大的群体更是如此。

第二，客观上难以验证的信息的可接受性，取决于接收者对于信息发送者的偏好的信念，例如，人们有充分的理由怀疑垄断企业单方面提供的企业运营成本数据的真实性。另一方面，在很多情况下，信息的软硬程度（可验证程度）与信息获取者和信息接收者的成本投入相关。因此，群体成员获取可验证信息与不可验证信息的动机，以及群体成员对信息软硬程度的投入，既取决于是否有审议阶段以及审议方式和决策规则，也取决于群体成员的偏好和群体成员关于群体偏好差异程度的先验信念。诸如此类问题现有文献几乎没有涉及。

群体决策在现代社会无处不在，如政府部门对重大战略性问题的决策、公司董事会对重要项目投资与实施问题的决策、审判委员会对犯罪嫌疑人的判决、专家对科学基金项目申请书的评审等。从组织或社会的目标出发，针对特定的决策问题，为了尽可能作出正确的决策，应该如何组成决策群体，选择何种决策规则？此类群体决策的科学化与民主化问题很久以来一直是管理、政治、法律和经济等领域讨论的中心，其研究结果对于各类政治、社会、经济组织的运行机制设计具有重要的意义。

中国学者对群体决策的理论与方法进行了大量的研究，提出了不少新的概念和方法，作出了很多重要贡献，国家自然科学基金委员会对群体决策理论与方法研究也较为重视，曾将其列为优先资助领域。但根据现有的各类文献和历年的基金项目研究摘要，总体感觉国内对决策群体成员的动机和理考虑较少，到目前为止还没有发现国内其他学者利用博弈论研究群体决策信息集结问题。

笔者试图利用不完全信息博弈论和机制设计理论，研究决策群体成员的策略性信息获取、信息传递和投票表决行为，揭示决策群体人员组成、审议方式、决策规则、透明性等决策机制的各个方面对群体决策的信息集结有效性的具体影响。并试图从信息集结角度，为一些典型公共决策情形优化决策机制。

参考文献：

［1］ PIKETTY T. The informationaggregation approach to political institutions［J］. European Economic Review, 1999, 43(4-6):791-800.

［2］ AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem［J］. American Political Science Review, 1996, 90(1):34-45.

［3］ FEDDERSEN T, PESENDORFER W. The swing voter’s curse［J］. American Economic Review, 1996, 86(3):408-424.

［4］ FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information［J］. Econometrica, 1997, 65(9):1029-1058.

［5］ MYERSON R. Extended Poisson games and the Condorcet jury theorem［J］. Games and Economic Behavior, 1998, 25(1):111-131.

［6］ FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting［J］. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.

［7］ FUJIKI H. The monetary policy committee and the incentive problem: A selective survey［J］. Monetary and Economic Studies, 2005, 23(S1):37-82.

［8］ VANDENBUSSCHE J. Elements of optimal monetary policy committee design［EB/OL］. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.

［9］ GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey［J］. European Journal of Political Economy, 2005, 21(3):563-597.

［10］ Mukhopadhaya K. Jury Size and the Free Rider Problem［J］. The Journal of Law, Economics, and Organization, 2003, 19:24-44.

［11］ MARTINELLI C. Would rational voters acquire costly information?［J］. Journal of Economic Theory, 2006, 129(1):225-251.

［12］ MARTINELLI C. Rational ignorance and voting behavior［J］. International Journal of Game Theory, 2007, 35(3):315-335.

［13］ KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition［EB/OL］. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.

［14］ KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions［J］. Economics Bulletin, 2006, 4(25):1-8.

［15］ KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance［J］. Journal of Public Economic Theory, 2008, 10(2):281-300.

［16］ BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem［J］. Economics Bulletin, 2006, 4(3):1-12.

［17］ TRIOSSI M. Costly information acquisition. Better to toss a coin?［EB/OL］. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.

［18］ SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making［EB/OL］. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.

［19］ CAI H. Costly participation and heterogeneous preferences in informational committees［J］. The RAND Journal of Economics. 2009, 40(1):173-189.

［20］ BENIERS K, SWANK O. On the composition of committees［J］. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.

［21］ LI H. A theory of conservatism［J］. Journal of Political Economy, 2001, 109(3):617-636.

［22］ NICOLA P. Committee design with endogenous information［J］. Review of Economic Studies, 2004, 71(1):165-191.

［23］ GERARDI D, YARIV L. Information acquisition in committees［J］. Games and Economic Behavior, 2008, 62(2):436-459.

［24］ AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules［M］//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.

［25］ COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting［J］. American Political Science Review, 2000, 94(2): 375-393.

［26］ MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values［J］. Journal of Theoretical Politics, 2007, 19(3): 301-327.

［27］ AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules［J］. American Political Science Review, 2006, 100: 209-217.

［28］ GERARDI D, YARIV L. Deliberative voting［J］. Journal of Economic Theory, 2007, 134(1): 317-338.

［29］ GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules［J］. American Political Science Review, 2000, 94: 407-423.

［30］ DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information［J］. Contributions to Theoretical Economics, 2003, 3(1), Article 6.

［31］ SCHULTE E. Information aggregation and preference heterogeneity in committees［J］. Theory and Decision, 2010, 69(1):97118.

［32］ MATHIS J. Deliberation with partially verifiable information［EB/OL］. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.

［33］ MEIROWITZ A. Designing institutions to aggregate preferences and information［J］. Quarterly Journal of Political Science, 2006, 1(4): 373-392.

［34］ GERSBACH H, HAHN V. Information acquisition and transparency in committees［EB/OL］. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.

［35］ LEVY G. Decision making in committees: Transparency, reputation and voting rules［J］. American Economic Review, 2007, 97(1):150-168.

［36］ VISSER B, SWANK O. On committees of experts［J］. The Quarterly Journal of Economics. 2007, 122(1):337-372.

［37］ SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals［EB/OL］. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.

［38］ SEIDMANN D. A Theory of voting patterns and performance in private and public committees［EB/OL］. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.

［39］ FELGENHAUER M, GRUNER H. Committees and special interests［J］. Journal of Public Economic Theory, 2008, 10(2): 219-243.

［40］ SEIDMANN D. Optimal quotas in private committees［J］. The Economic Journal, 2008, 118(525):16-36.

［41］ DAL B E. Bribing voters［J］. American Journal of Political Science, 2007, 51(4):789-803.

［42］ HAHN V. Transparency in monetary policy: A survey［J］. IFO Studien, 2002, 48(3):429-455.

［43］ SIBERT A. Monetary policy committees: Individual and collective reputations［J］. The Review of Economic Studies, 2003, 70(3):649-665.

［44］ MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve［J］. The Economic Journal, 2008, 118(528):695-717.

［45］ HAHN V. Committees, sequential voting and transparency［J］. Mathematical Social Sciences, 2008, 56(3):366-385.

［46］ HANS G, HAHN V. Should the individual voting records of central bankers be published?［J］. Social Choice and Welfare, 2008, 30(4):655-683.

［47］ NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation［J］. International Economic Review, 1982, 23:289-297.

［48］ BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result［J］. International Economic Review, 1997, 38:175-186.

［49］ BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints［J］. Mathematical Social Science, 2001, 41:349-364.

［50］ KRAUS S. Optimal collective dichotomous choice under quota constraints［J］. Economic Theory, 2002, 19:839-852.

［51］ MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents［J］. American Political Science Review, 1998, 92:413-418.

［52］ BENYASHAR R. Information is important to Condorcet jurors［J］. Public Choice, 2006, 127(3):305-319.

［53］ BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms［J］. Social Choice and Welfare, 2009, 33(3):477-494.

［54］ LASLIER J, WEIBULL J. Providing incentives for informative voting［EB/OL］. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.

［55］ FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting［J］. The American Political Science Review, 1998, 92(1):23-35.

［56］ BOND P, ERASLAN H. Strategic voting over strategic proposals［J］. Review of Economic Studies, 2009, 77(2):459-490.

［57］ BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees［J］. Social Choice and Welfare, 2007, 29(3):453486.

［58］ COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences［EB/OL］. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.

［59］ MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers［J］. Theory and Decision, 2002, 52(3):267286.

［60］ JAEHOON K. A model of adversarial committees［EB/OL］. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.

［61］ CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality［J］. Quarterly Journal of Political Science, 2010, 5(1):4570.

博弈论方法篇9

博弈论，英文名称为Game theory是研究各方策略相互影响的条件下，理性决策人的决策行为的一种理论。博弈论刚被介绍至我国时，曾有过多种译法。有的学者根据其英文名称，直译为游戏理论；有的学者则从该理论本身的研究对象出发，转译为对策论或对策运筹论。近年来，学术界越来越多地接受了博弈论这一名称。这除了由于博弈这个带有文言味的词本身的学究气浓郁而给人的第一印象较为深刻外，更重要的是博弈一词能更准确、全面地体现策略选择、依策而动以及最终结果三者的统一。

（二）博弈的要素

一个完整的博弈应包含如下四项要素：1，博弈的参加者（player）。也称局中人或博弈方。是指博弈中能独立决策、独立行动并承担决策结果的个人或组织。小到一个人，大到一个跨国公司乃至一个国家，只要能独立决策和行动，都可视作一个博弈方。比如柯达与富士公司的竞争，就可看作一个有二个博弈方的博弈。一般说来，博弈的参加者越多，情况就越复杂，结果越难预料。2，策略空间（strategy space）。是指各博弈方可选择策略的集合。strategy直译应为战略，不过战略一词对大多数博弈来讲显然过于抽象和宽泛了。每一个策略都对应一个相应的结果。因此每个博弈方可选的策略数量越多，博弈就越复杂。3，进行博弈的次序（the order of play）。博弈中各博弈方行动的顺序对于博弈的结果是非常重要的。同样的博弈方、同样的策略空间，先后决策并行动和同时决策行动，其结果是大相径庭的。 4，博弈的信息（information）。知己知彼、百战不殆。可见信息对博弈的重要性古人早已知之。博弈中最重要的信息是有关对手策略以及各博弈方得益的信息。例如，在各博弈方同时决策的博弈中，必须保证不能让对手知道自己采取何种策略，否则自己将永远是博弈的输家。得益（play off），也称支付，是指博弈方策略实施后的结果。有关得益的信息是促使某博弈方选择某种策略的关键参考值。理性的博弈方总是选择能使自己获得最大得益的策略。一旦确定了以上四要素，一个博弈也就随之确定了。值得注意的是，博弈论特别强调“理性人”的前提假定，即参加博弈的各博弈方始终以自身利益最大化为惟一目标。除非为了实现自身最大利益的需要，否则不会考虑其他博弈方或社会利益。

（三）博弈论的结构

由于一个完整的博弈需具备上述四要素，因此博弈可以从不同的角度划分成不同类别：1，按博弈方划分，可分为单人博弈和多人博弈。单人博弈因为只有一个博弈方，所以它已退化为一般的最优化问题。经济学中常见的求最优问题，实际上是博弈的特例。多个博弈方的博弈较单人博弈复杂，而且两人以上的博弈会出现合作博弈问题。这样，多方博弈又将分为合作博弈与非合作博弈。因为在社会与经济关系中，竞争与不合作是基本方面。所以当前的博弈论主要研究的是非合作博弈。1994年诺贝尔经济学奖三位得主的主要贡献，即在非合作博弈方面。2，按策略空间划分，可分为有限策略博弈和无限策略博弈。因为每一种策略都相应地对应一个得益结果，所以从理论上讲，有限策略博弈的结果必然是有限的，而无限策略博弈的结果则有无穷多种可能。3，按进行博弈的次序划分，可分为静态博弈和动态博弈。各博弈方可同时决策并行动的博弈称为静态博弈。当然，严格讲各博弈方在非常精确的同一时点同时决策是不可能的。因此，同时决策是指可近似地看作同时作决定的过程，如乒乓球团体赛的出场顺序，虽双方决策可能有早有晚，但一旦敲定便谁也不许变更，因而可看作同时决策。各博弈方不是同时决策，而是先后、依次决策、行动的博弈叫动态博弈。弈棋就是一种典型的动态博弈，双方的每一步都将取决于前面的情势。4，按信息划分，如按得益信息分类，可分为完全信息博弈与不完全信息博弈。完全（complete）信息，是指各方对自己每种策略的得益情况完全清楚，否则是不完全信息；在动态博弈中，如按博弈进程信息分类，可分为完美信息动态博弈与不完美信息动态博弈。完美（perfect）信息，是指博弈方在决策前对其他博弈方的行为完全了解，否则是不完美信息。5，按得益情况划分，可分为零和博弈、常和博弈和变和博弈。一方收益必来自另一方的损失，这样的博弈叫零和博弈，零和博弈的博弈方始终是对立关系；各方都会有收益，但收益总和是一固定常数，这样的博弈为常和博弈；各方不同的策略组合会有不同的收益，这样的博弈称变和博弈。显然，零和博弈是常和博弈的特例，常和博弈是变和博弈的特例。6，综合分类。综合分类是将博弈次序与博弈信息结合起来的一种分类方法。按这两个标准，可将博弈分为：完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、不完全但完美信息动态博弈、完全不完美信息动态博弈以及不完全不完美信息动态博弈。这种分类方式有助于针对不同特性的博弈进行研究和求解。

博弈论（Game Theory），是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。因此，博弈论又称为“对策论”，也就是说当一个主体，比如一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他的人、其他企业的决策问题和均衡问题。正是在这个意义上，博弈理论又译为“决策理论”。博弈论创立于20世纪40年代，到50年代博弈论的研究达到了顶峰。博弈论研究的决策不仅包括经济学领域，而妾包括政治学、军事、外交、国际关系、公共选择等各个领域，因而博弈论又被称之为方法论。本文拟将这种方法引入到反垄断法领域，具体分析反垄断法规则的制定过程。

二、反垄断法的博弈分析

博弈论方法篇10

中国的检验检疫工作在新中国发展中有着相当长的历史。伴随着我国进出口贸易的壮大，外向经济的发展，检验检疫事业也蓬勃发展起来，在我国国民经济的发展中起着不可替代的作用。现已形成了比较完整的检验检疫相关法律制度，其中包括《中华人民共和国进出口商品检验法》、《中华人民共和国进出境动植物检疫法》、《中华人民共和国国境卫生检疫法》、《中华人民共和国食品卫生法》及其他法规、条例等。检验检疫相关法律有着目的性极强的立法宗旨，内容是：“为了保护人类健康和安全，保护动物或者植物的生命和健康，保护环境，防止欺诈行为，维护国家安全”。在检验检疫工作实施过程中，将涉及到国与国之间、贸易关系人之间、检验方和被检验方之间等各方面的关系，具体体现在以下几个方面。

其一，检验检疫是以国与国之间（包括与港澳台地区）的商品交换为前提，有国与国之间的商品交换才有检验检疫工作的存在；其二，在国与国之间的商品交换表现为货物贸易关系时，检验检疫工作是体现国家利益的管理行为；其三，检验检疫工作是涉及国际经济贸易的活动，需要遵循国家参加的国际条例、协定中确定的规则，就是说无论立法还是执法都是有章可循的；其四，检验检疫工作必须制度化、规范化，在完整的法律体系下，将检验检疫的对象、体制、标准程序、方法确定下来，作为检验检疫工作的依据。正因为有这些关系各方的存在、规则的存在、应对策略的存在、贸易结果的存在，使博弈理论在检验检疫工作中有着极大的施展空间；也正因为检验检疫工作在国家安全，尤其在国家经济安全中的重要地位，从而凸现出研究其中博弈问题的重要性。

二、博弈论的定义与分类

博弈有一个非技术性的定义，就是：博弈即一些个人、队组或其他组织，面对一定的环境条件，在一定的规则，同时或先后一次或多次，从各自允许选择的行为或策略中进行选择，并加以实施，各自取得相应结果的过程。博弈必须具有以下特征。

1、规则。规定游戏的参加者（可以是个人，也可以是组织）可以做什么，不可以做什么，应该按怎样的次序做，什么时候结束游戏和一旦参加者犯规将受怎样的处罚等。

2、结果。如一方赢，一方输，平局或参加者各有所得等，而且结果常能用正或负的数值来表示，或能按照一定的规则折算成数值。

3、策略。策略至关重要，游戏者不同的策略选择常会带来不同的游戏结果。

4、利益。策略和利益有相互依存性，即每个游戏者所得结果的好坏，不仅取决自身的策略选择，也取决于其它参加者的策略选择。

博弈的定义有以下内容：博弈的参加者（Players），通常被称为博弈方；各博弈方各自可选择的全部策略（Strategies）或行为（Actions）的集合；博弈的次序（Orders），次序不同一般就是不同的博弈，即使博弈的其他方面都相同；博弈方的得益（Payoffs）。博弈中的哪些可能结果的量化数值，称为各博弈方在相应情况下的“得益”。规定一个博弈必须对得益作出规定，得益可以是正值，也可以是负值，它们是分析博弈模型的标准和基础。

以上四个方面是定义一个博弈时必须首先设定的，确立了上述四个方面就确定了一个博弈。

博弈的结构和分类是多方面的。其实博弈结构每个方面的特征都可以作为博弈分类的依据。如根据博弈方的数量，可分为单人博弈、两人博弈和多人博弈；根据博弈方策略的数量，可分为有限博弈和无限博弈；根据得益情况，可分为零和博弈、常和博弈及变和博弈；根据博弈过程，可分为静态博弈、动态博弈和重复博弈；根据信息结构，可分为完全信息博弈和不完全信息博弈，以及完美信息动态博弈和不完美信息动态博弈；最后，还可以根据博弈方的理性和行为逻辑差别，分为完全理性博弈和有限理性博弈，非合作博弈和合作博弈。当然上述各种博弈分类相互之间都是交叉的，并不存在严格的层次关系。最值得一提的有两方面博弈：一是完全信息博弈和不完全信息博弈。我们将各博弈方完全了解所有博弈方各种情况下得益的博弈称为“完全信息（Complete Information）博弈”，而将至少部分博弈方不完全了解其他博弈方得益情况的博弈称为“不完全信息（Incomplete Information）博弈”；二是动态博弈中在轮到行为时对博弈的进程完全了解的博弈方，称为具有“完美信息”（Perfect information）的博弈方，如果动态博弈的所有博弈方都有完美信息，则自然是“完美信息的动态博弈”。动态博弈中轮到行为的博弈方不完全了解此前全部博弈进程时，称为具有“不完美信息”（Imperfect information）的博弈方，有这种博弈方的动态博弈则称为“不完美信息的动态博弈”。

三、博弈论与部分检验检疫工作的关联性研究

博弈论可以揭示众多经济问题的内在规律和根源，帮助人们分析经济关系，认识经济现象，评判经济效益，指导人们进行科学的经济决策活动。无论对企业等实际经济部门的经营，还是对政府的管理和政策制定，博弈论都有重要的指导意义。在中国的检验检疫工作中的博弈问题无处不在，不胜数举。在我们日常的行为上，也经常不经意地运用了部分博弈论的理论和方法。现我们仅仅想通过检验检疫工作中目前比较常见的三种行为和问题分别与博弈论的关联性进行研究，揭示出其内在的博弈论知识，用其理论来分析它，更好地指导我们今后的工作。

1、进出口商品的检验工作――不对称信息下的不完全但完美信息的静态博弈。所谓不对称信息，就是检验方和被检验方对商品质量的好坏，双方拥有的信息量是不同的。检验检疫部门作为检验方，在没有抽检之前，对该批货物的总体质量并不知道；而作为货物拥有人的被检验方有时是心中有数的，出口商或进口商对自己货物的有利声明信息是无法有效传递给检验方的。也就是说，货物拥有人对自己商品质量是好的承诺，检验方不是完全相信的。一旦商品通过检验后，合格与否，作为检验方对货物拥有人的得益并不了解。无论是检验方还是被检验方，对检验标准、抽样方法和结果判断的依据等公共信息都是了解的，也就是说双方对整个博弈的进程是完全了解的，双方都是拥有“完美信息”的博弈方。值得注意的是双方的策略看似是有先后次序，但实际上是同时做出的，产品一旦交付检验，商品的品质是不容改变的，而且检验方法和标准也是同时做出的。相对于不同的商品批次，方法和标准是相对稳定的，如水产品、农产品、机电产品等都有各自的标准和方法。双方的得益矩阵如下图：

从得益矩阵中可以看出，检验方的得益变化范围比被检验方的得益变化范围要大，尤其是在检验方用不正确的标准和方法对不合格的进出口商品进行检验时，所得到的判定结果对检验方造成的潜在风险最大，因此得益最小。同时可以看出，检验方只要采用了正确的标准和方法，无论商品的质量好坏，对检验方都不可能造成伤害，因此得益最大。另外，被检验方一旦提供的商品质量不合格，无论检验方的方法正确与否，他的得益都是最小的，风险一直会伴随着他们。

从上可以对我们有以下两点启发：

（1）检验过程中，检验方采用检验方法和标准的正确与否，直接关系到检验方的利益。因此，提高检测水平，制定正确的方法对检验检疫部门是极其重要的。

（2）进出口商品的拥有者，应力把产品质量关，检验方技术的好坏并不能提高他们的得益，即使未能用正确的方法检验出质量问题，产品潜在的质量风险，仍然没有得到释放。

2、出口产品的电子监管――对称信息下的完全且完美信息的重复博弈。随着检验检疫工作的电子化过程不断向前推进，电子监管的实施对老的检验模式的改革提供了新课题，其很大程度上规范了检验检疫行为，提高了检验检疫效率，加快了通关速度，服务了外贸事业。

检验检疫机构通过电子监管系统下达生产批相关产品的数据和信息采集指令，出口企业通过企业端软件“前置”的电子化抽样，抽样规则和局端规则库有针对性地指向政府所关心的数据。也就是说，企业相关产品的生产是与政府规划匹配的，因此企业可以大大降低企业产品的不合格率。对于不合格的相关产品，企业可以有的放矢地纠偏、纠错，从而提高生产效率。

电子监管系统的实施，进一步促进了检验检疫工作的“前推后移”，加强了政府对相关企业生产过程数据的监管，把政府对企业成品检验检疫作为合格评定和判定的旧模式转变为对源头和生产过程中相关质量数据的把关的新模式。

从博弈论的观点来看，电子监管解决了代表政府职能的检验方和被检验方的信息不对称问题，使博弈从不完美信息状态下走向完美信息。我们刚研究的完美信息与否是对博弈进程的了解与否，在电子监管过程中、生产中的重要环节和重要数据信息，博弈双方是实时得到了，并且电子监管是一个不停地对产品生产和产品质量进行判断的过程。如果把每一次对获取的信息进行的判断过程看作一个子博弈的话，长期的电子监管是一个典型的重复博弈。被检验方可以根据每个判断（Yes or No）来调整他们下一个子博弈的策略。由于博弈方能够意识到博弈会重复进行，因此必须考虑到长期利益关系，所以博弈方的行为就可能表现出来一次性博弈不同的特点。博弈方会牺牲短期利益来追求长期利益。从弗里德曼1971年提出的无限次重复博弈的民间定理的表述上可以看出这一点：

设G是一个完全信息的静态博弈，用（e1，．．．，en）记G的纳什均衡的得益，用（x1，．．．，xn）表示G的任意可实现得益，如果xi＞ei，对任意博弈方i都成立，而δ足够接近1，那么无限次重复博弈G（∞，δ）中一定存在一个子博弈完美的纳什均衡，各博弈方的平均得益就是（x1，．．．，xn）。

通过这一定理我们可以看出，在一次性博弈和有限次重复中，都无法实现的囚徒的困境型博弈中的潜在合作利益，在无限次重复博弈的情况下是可能实现的。换句话说，通过电子监管的监管模式，可以实现在检验检疫过程当中各博弈方的得益均衡。

由上可见，政府如何采集企业的质量数据是电子监管的关键所在，企业建立、健全电子化实时采集关键质量数据的机制是电子监管有效性的保障，也是每个子博弈可以有效运行的关键。

3、绿色贸易壁垒――国与国之间完全但不完美信息的多人重复博弈。绿色贸易壁垒是指以保护有限的自然资源，保护环境和人类健康为由，通过蓄意制定苛刻的环保标准，对来自国外的产品所采取的一系列贸易限制手段和措施。绿色贸易壁垒不是一种简单偶然的现象，它的出现有其复杂的社会、政治、经济背景。产生绿色贸易壁垒的根本原因来自各国维护本国的经济利益，保护本国国内市场的动机。环境问题的全球化、社会化是绿色贸易壁垒产生的重要条件。

绿色贸易壁垒从表面来看是国与国之间在非贸易技术性措施之间的博弈，而实质上是各国通过各自的检验检疫部门利用各种法规和技术手段作为策略而进行的一种博弈。从检验检疫部门的职能和相关法律的立法宗旨不难看出这点。检验检疫部门既是自身绿色贸易壁垒的制定者，又是国外绿色壁垒的应对者。

绿色贸易壁垒有着其独特的内容和表现形式。有时可以看作博弈本身，有时也可能以“策略”的方式表现出来。具体表现形式如下：

（1）绿色关税和市场组成。例如，美国食品与药品管理局（FDA）规定，所有在美国出售的鱼类都须来自经美方确认的未受污染的水域。

（2）绿色技术标准。经济发达国家的科技水平较高，处于技术垄断地位，它们在保护环境的名义下，通过立法手段，制定严格的强制性环保技术标准来限制国外商品的进入。

（3）绿色环境标志。如德国的“蓝色天使”、日本的“生态标志”、欧盟的“欧洲环保标志”、加拿大的“环境选择”标志等。

（4）绿色包装制度。

（5）绿色卫生检疫制度。检验和检疫措施包括：检疫和检验的法律法规、法令、规定及要求。

（6）绿色补贴。

从上不难看出其表现形式绝大部分与检验检疫工作有关，甚至就是检验检疫工作本身。

用博弈论来分析，这些法律、法规及其强制性技术标准就是国与国博弈中的策略，在检验检疫的具体工作中主要体现在以下几个方面：食品中的农药残留量；陶瓷产品的含铅量；皮革中的PCP残留量；烟草中的有机氯含量；机电产品玩具的安全性指标；汽油的含铅量指标；汽车排放标准；包装材料的可回收性指标；纺织品染料指标；保护臭氧层的受控制物质，如冰箱、空调、泡沫及发胶等。现在又出现了日本肯定列表，欧盟WEEE、Rohs指令，化学品分类等。

由于绿色贸易壁垒保护措施具有不确定性和可塑性，在短期之间，虽然很多专家学者研究应对措施，我们仍然对其知之不深；并且过渡期短，应视作不完美信息，即对“进程”和“过程”的不完全了解。但一旦采取了此技术措施，对我国外贸的影响是可以推算出来的。即对博弈的得益是了解的，所以是完全信息博弈。例如有关国家的环境标准制度，这一项将使中国减少40亿美元的创汇；国际保护臭氧公约，将使中国近50亿美元的产品出口受影响。

国与国之间由于经济发展与技术水平的不同，提出了不同绿色壁垒的策略，使我国在与不同的国家进行贸易活动中出现了多个博弈方。由于策略的层出不穷，我们针对不同的子博弈采取不同的应对措施，因此是重复博弈。要想根本性解决这个问题，实质上就是想方设法使双方得益达到均衡。从中看出我们的很多工作在理论上得到了解释，并能指导我们今后在绿色贸易壁垒博弈中的策略。

研究绿色壁垒的博弈问题，我们得到了以下几个观点：

一是应深入研究国外技术标准，把不完美信息变成完美信息，因为过程信息的完美程序直接影响得益的结果；

二是提出适合我国国情的技术标准，把对方拖入一个新的博弈，来影响相关联的子博弈，让得益达到新的均衡；

三是在对方策略出现之前，有计划地分析信息，使已分策略的出现更合理化，更有预见性，使信息的完美性具有前瞻性。

总之，博弈论作为一种理论，离不开实践的土壤。检验检疫工作中有如此多的博弈问题，深入研究其理论，将对我们今后的工作有着不可替代的指导作用。

【参考文献】

[1] 谢识予：经济博弈论，上海复旦大学出版社，2002，1。

[2] 张维迎：博弈论与信息经济学，上海人民出版社，1996，8。

博弈论方法篇11

2、博弈论发展的不同阶段。一般认为博弈论萌芽于20世纪20年代初。博弈论创立的标志是冯・诺伊曼和奥・摩根斯坦（Morgenstern）在1944年的《博弈论与经济行为》这部著作，他们的贡献现在看来主要是创立了博弈论研究的基本概念、二人零和博弈的完全解决和对合作博弈的贡献。现在应用更为普遍的非合作博弈理论的创立，则是以纳什（John Nash）1950年的博士论文《非合作博弈》为标志，该文的主要贡献是提出了纳什均衡的概念。此后(20世纪70年代)，美国海萨尼（Harsanyi）和德国塞尔顿（Selten）的不完全信息博弈理论工作进一步完善了非合作博弈理论。当20世纪70年代经济学家开始将注意力由价格制度转向非价格制度时，博弈论逐渐成为经济学的基石。

1944年，冯・诺伊曼（Von Neumann）和奥・摩根斯坦（Morgenstern）合著的《博弈论与经济行为》被认为是博弈理论初步形成的标志。该书在总结以往关于博弈的研究成果的基础上，提出了博弈论的概念术语、一般框架和表述方法，提出了较系统的博弈理论。而且，在该书以前，博弈论主要是数学家们研究的课题，主要是一种数学理论而不是经济学理论。《博弈论与经济行为》极大地促进了博弈论和经济学研究的联系。从此，博弈论开始被经济学家们所接受，对博弈论的发展起了巨大的推动作用。虽然《博弈论与经济行为》的出版标志着博弈论的初步形成，但是这个时候的博弈论还是比较幼稚的，研究的范围也较小，总体影响也很小。研究的主要对象是少数类型的合作博弈和零和博弈。

20世纪的40年代末到50年代初，是博弈论的发展史上一个重要阶段。越来越多的学者进行了博弈理论的研究。1950年，纳什（John Nash）在他的博士论文《非合作博弈》中，将博弈论扩展到了非零和博弈，最终形成了非合作博弈理论的思想源泉，纳什均衡概念的提出以及纳什均衡存在性的纳什定理的证明，发展了以纳什均衡概念为核心的非合作博弈理论。纳什均衡是对古诺模型和伯特兰德模型中均衡概念的一般化，纳什均衡的概念是有关均衡概念的最基本的概念，后来的子博弈精炼纳什均衡，贝叶斯纳什均衡、精炼贝叶斯纳什均衡等概念的提出都是以纳什均衡为研究出发点的。

20世纪50年代中后期一直到70年代也是博弈论发展历史上较为重要的一个时期。“微分均衡”、“强均衡”、“重复博弈”以及在此基础上的完全信息动态博弈等概念就是在这一时期提出来的，而且在60年代初开始了博弈论在进化生物学中的应用的研究。这个时期产生的里程碑式的成果是海萨尼（Harsanyi）关于不完全信息博弈理论，他在1967-1968年的三篇关于不完全信息博弈理论的论文中，提出了关于不完全信息静态博弈的“贝叶斯纳什均衡”的概念，此外还在1973年提出了关于“混合策略”的不完全信息解释，以及关于不完全信息动态博弈的严格“纳什均衡”概念。同时这个时期也是进化博弈论发展的重要阶段，提出了“进化稳定策略”等概念。当然，这个时期产生的博弈论成果还有很多，博弈论更多地应用到经济学理论的研究当中，为80-90年代博弈论的成熟以及经济学理论的博弈论革命起了很大的推动作用。

20世纪80-90年代到现在是博弈论走向成熟的时期，期间产生了大量的研究成果和文献,表明博弈论已经作为一种一般的分析方法逐渐走进了政治学、军事学、生物学、统计学等多门学科中。尤其是在经济学中，博弈论占据了核心地位。这个时期，是对非合作博弈理论的进一步深化，产生了博弈论基础上的经济学分支，如信息经济学，以及一些关于特殊问题的理论，如拍卖理论、激励理论。早在1983年，因一般均衡理论而得到诺贝尔经济学奖的德布鲁(J・Debreu)表明，如果没有博弈论中纳什均衡的重要概念，也就没有他对一般均衡的存在性的证明。到了90年代，克莱普斯(D・Kreps)、克鲁格曼(P・Krugman)和格罗斯曼(S・Grossman)都是因为在博弈论上的贡献而获得了美国的克拉克奖(Clark Prize)，这是美国对40岁以下经济学家的最高奖。之后，博弈论两度夺得诺贝尔经济学奖，1994年颁给纳什(Nash)、海萨尼(John Harsanyi)和塞尔顿(Reinhard Selten)三位博弈论专家；2005年颁给罗伯特・奥曼(Robert J・Aumann)和托马斯・谢林(Thomas C・Schelling )。

二、博弈的类型及其均衡概念

博弈理论有合作博弈和非合作博弈之分。合作博弈强调团体理性，强调效率、公平和公正，非合作博弈更强调个体理性、个体的最优决策。按照参与人行动的先后顺序，博弈可以分为静态博弈和动态博弈。完全信息博弈是指每个参与者对所有其他参与者的特征、策略空间和支付函数有准确的知识；否则，就是不完全信息博弈。下图是基于上述分类方法的博弈类型以及各自的均衡概念。

三、博弈论的研究趋势及未来

博弈论方法篇12

博弈论，英文名称为Game theory是研究各方策略相互影响的条件下，理性决策人的决策行为的一种理论。博弈论刚被介绍至我国时，曾有过多种译法。有的学者根据其英文名称，直译为游戏理论；有的学者则从该理论本身的研究对象出发，转译为对策论或对策运筹论。近年来，学术界越来越多地接受了博弈论这一名称。这除了由于博弈这个带有文言味的词本身的学究气浓郁而给人的第一印象较为深刻外，更重要的是博弈一词能更准确、全面地体现策略选择、依策而动以及最终结果三者的统一。

（二）博弈的要素

一个完整的博弈应包含如下四项要素：1，博弈的参加者（player）。也称局中人或博弈方。是指博弈中能独立决策、独立行动并承担决策结果的个人或组织。小到一个人，大到一个跨国公司乃至一个国家，只要能独立决策和行动，都可视作一个博弈方。比如柯达与富士公司的竞争，就可看作一个有二个博弈方的博弈。一般说来，博弈的参加者越多，情况就越复杂，结果越难预料。2，策略空间（strategy space）。是指各博弈方可选择策略的集合。strategy直译应为战略，不过战略一词对大多数博弈来讲显然过于抽象和宽泛了。每一个策略都对应一个相应的结果。因此每个博弈方可选的策略数量越多，博弈就越复杂。3，进行博弈的次序（the order of play）。博弈中各博弈方行动的顺序对于博弈的结果是非常重要的。同样的博弈方、同样的策略空间，先后决策并行动和同时决策行动，其结果是大相径庭的。 4，博弈的信息（information）。知己知彼、百战不殆。可见信息对博弈的重要性古人早已知之。博弈中最重要的信息是有关对手策略以及各博弈方得益的信息。例如，在各博弈方同时决策的博弈中，必须保证不能让对手知道自己采取何种策略，否则自己将永远是博弈的输家。得益（play off），也称支付，是指博弈方策略实施后的结果。有关得益的信息是促使某博弈方选择某种策略的关键参考值。理性的博弈方总是选择能使自己获得最大得益的策略。一旦确定了以上四要素，一个博弈也就随之确定了。值得注意的是，博弈论特别强调“理性人”的前提假定，即参加博弈的各博弈方始终以自身利益最大化为惟一目标。除非为了实现自身最大利益的需要，否则不会考虑其他博弈方或社会利益。

（三）博弈论的结构

由于一个完整的博弈需具备上述四要素，因此博弈可以从不同的角度划分成不同类别：1，按博弈方划分，可分为单人博弈和多人博弈。单人博弈因为只有一个博弈方，所以它已退化为一般的最优化问题。经济学中常见的求最优问题，实际上是博弈的特例。多个博弈方的博弈较单人博弈复杂，而且两人以上的博弈会出现合作博弈问题。这样，多方博弈又将分为合作博弈与非合作博弈。因为在社会与经济关系中，竞争与不合作是基本方面。所以当前的博弈论主要研究的是非合作博弈。1994年诺贝尔经济学奖三位得主的主要贡献，即在非合作博弈方面。2，按策略空间划分，可分为有限策略博弈和无限策略博弈。因为每一种策略都相应地对应一个得益结果，所以从理论上讲，有限策略博弈的结果必然是有限的，而无限策略博弈的结果则有无穷多种可能。3，按进行博弈的次序划分，可分为静态博弈和动态博弈。各博弈方可同时决策并行动的博弈称为静态博弈。当然，严格讲各博弈方在非常精确的同一时点同时决策是不可能的。因此，同时决策是指可近似地看作同时作决定的过程，如乒乓球团体赛的出场顺序，虽双方决策可能有早有晚，但一旦敲定便谁也不许变更，因而可看作同时决策。各博弈方不是同时决策，而是先后、依次决策、行动的博弈叫动态博弈。弈棋就是一种典型的动态博弈，双方的每一步都将取决于前面的情势。4，按信息划分，如按得益信息分类，可分为完全信息博弈与不完全信息博弈。完全（complete）信息，是指各方对自己每种策略的得益情况完全清楚，否则是不完全信息；在动态博弈中，如按博弈进程信息分类，可分为完美信息动态博弈与不完美信息动态博弈。完美（perfect）信息，是指博弈方在决策前对其他博弈方的行为完全了解，否则是不完美信息。5，按得益情况划分，可分为零和博弈、常和博弈和变和博弈。一方收益必来自另一方的损失，这样的博弈叫零和博弈，零和博弈的博弈方始终是对立关系；各方都会有收益，但收益总和是一固定常数，这样的博弈为常和博弈；各方不同的策略组合会有不同的收益，这样的博弈称变和博弈。显然，零和博弈是常和博弈的特例，常和博弈是变和博弈的特例。6，综合分类。综合分类是将博弈次序与博弈信息结合起来的一种分类方法。按这两个标准，可将博弈分为：完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、不完全但完美信息动态博弈、完全不完美信息动态博弈以及不完全不完美信息动态博弈。这种分类方式有助于针对不同特性的博弈进行研究和求解。

博弈论（Game Theory），是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。因此，博弈论又称为“对策论”，也就是说当一个主体，比如一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他的人、其他企业的决策问题和均衡问题。正是在这个意义上，博弈理论又译为“决策理论”。博弈论创立于20世纪40年代，到50年代博弈论的研究达到了顶峰。博弈论研究的决策不仅包括经济学领域，而妾包括政治学、军事、外交、国际关系、公共选择等各个领域，因而博弈论又被称之为方法论。本文拟将这种方法引入到反垄断法领域，具体分析反垄断法规则的制定过程。

二、反垄断法的博弈分析

（一）政府和企业之间的博弈分析

1，政府和企业博弈的根源

企业，作为市场运行主体，在市场经济中具有强烈的追求利润的理性意识；企业的理性就是实现利润的最大化。企业一切经济活动的出发点和归宿都要以这个目标为指导。在利润最大化目标的指导下，企业必须研究市场上其他主体的战略并确定自己的战略，从而市场上各个经济主体都是企业博弈的对象。企业决策往往具有局部性、个体性和短期性的特点。与之相对，政府作为市场运行的监管主体，是社会理性的当然代表，其决策往往带有全局性、整体性和长远性。由于政府制定的各种市场运行规则客观上限制了企业理性的发挥；尤其是当社会理性和企业理性发生冲突时，作为被管理者的企业只能寻求“次优方案”。当然，企业也并非只是一味地妥协，也可以与政府进行博弈从而影响相应的法律、法规的制定。由政府所代表的社会理性和企业理性的冲突及其在现实经济生活中的具体表现——政府所代表的社会利益与企业追求自身利润最大化的矛盾，决定了二者都将对方视作自己的博弈对象，从而使具体的法律、法规，尤其是反垄断法的制定过程，表现为政府和企业的博弈过程。

2，政府和企业参与博弈的目的

企业，作为盈利性的经济组织，是以实现利润最大化为其根本宗旨的；并且在这一根本宗旨的指

导下组织各种经济活动。只要能够降低企业的生产成本，提高企业的利润，企业都不惜一试，包括采取垄断的方式。但是，垄断的存在，不仅侵害了广大的消费者的利益（具体表现是通过垄断价格，将相当大的一部分消费者剩余转化为超额利润。），而且凭借其“市场势力”阻碍了有效的竞争，打破了市场竞争的均衡状态。政府，作为社会利益的代表，具有保护消费者的合法权益和维护市场有效的竞争秩序的当然职能；其可通过制定法律影响着企业决策的“可选择集”，即企业只能在法律许可的范围内进行选择。显然，“可选择集”越大，对企业越有利；而决定企业“可选择集”大小的恰恰就是政府。因为政府通过确定其产业政策和竞争政策的具体内容和相互关系，影响认定垄断的界限，并通过反垄断立法决定了企业可选择范围的大小，从而间接地决定了企业的盈利空间。企业参与博弈的目的就是通过影响政府的反垄断法规，实现对企业行为的有效规制，进而最大限度地保护社会公众的利益。

3，反垄断法的博弈分析

反垄断法指的是国家为了保护竞争，针对一些限制竞争行为所规定的法律规范的总称。其目的就是政府通过法律的手段限制企业有碍于竞争的经济行为。政府在决定是否将一种企业的经济行为列入受限制之列前，政府要作如下的博弈分析：保持企业退出

政府面对一种限制竞争行为有两种选择：干预，即将其限制于合理的范围之内；或者放任自流。政府要进行干预需要支出相应的费用，设费用为5，占总收益10的一半，那么经政府干预给社会带来的净收益是5（总收益10减去干预费用5）。此时，企业针对政府的干预政策有两种策略：其一是保持原有的状态不变，继续从事具有垄断性质的经济活动。但是，由于法律的强制性，如果企业采取此策略无异于自取灭亡。此时，企业不但不会盈利，相反还会被强制清除出场。其二是企业选择退出。此时，企业只需要付出沉淀成本，设其为收益的一半为5；在这种情况下，企业的收益为-5.政府还有另外一种选择，就是放任自流。这样，如果企业保持原来的垄断状态，就将获得全部的利润所得，社会公共利益为0；如果企业选择退出，那么全部利润将自动流向政府所代表的社会公众，此时，企业还要支付相应的沉淀成本。由于政府干预经济的目的就是为了将“垄断利润”返还给广大的消费者，（0，10）所代表的状态正是政府介入的原因，并且是政府所要竭力改善的初始状态。（10，-5）所代表的是企业自动放弃高额的垄断利润，并且还要为此承担相应的前期投入，即沉淀成本。这是不符合企业追求利润最大化的理性目标的，因而是不现实的。由此，政府只能选择干预策略。企业根据其对政府选择的分析判断政府介入的可能性，然后在（5，-10）、（5，-5）和（0，10）三种状态中进行选择。由于（5，-10）的高成本和（0，10）的不现实性及由此决定的高风险性，迫使理性的厂商选择（5，-5）所代表策略。这样，可以将损失降低到最低。政府经过上述博弈分析，最终决定将该经济行为纳入禁止之列；而企业也会选择放弃该垄断行为。至此，反垄断法的目的得以实现。

4 对反垄断法进行经济分析的意义。

对反垄断法进行博弈分析的意义在于揭示反垄断法的制定过程从某种意义上讲就是政府和企业的博弈的过程，反垄断法律规范的具体规范则是政府和企业的博弈结果在法律上的认定。所以，在反垄断法的制定过程中，应该站在企业的立场上考虑企业可能做出的策略选择，然后再确定法律是否对该行为进行规制及如何规制。这样，才能保证制定出的法律能有效地规制企业的行为，有效地保证竞争。

（二）企业间通过价格等垄断协议的博弈分析

在寡头市场上，当寡头数量很少时，从理论上说，他们很容易通过谈判实行勾结定价，即像一个垄断者那样用高价格来宰消费者。这样做，交易费用（寡头进行价格勾结谈判达成协议所需要的费用）并不高，而勾结定价可以为参与者带来共同的利益。但为什么这种勾结定价在现实中成功的很少呢？尽管许多国家“反垄断法”中有禁止勾结定价的条款，但实际上这个条款的作用极为有限，因为寡头之间可以采用不易被发现的隐蔽性勾结——默契。我们可以用博弈论的分析来说明现实中的勾结定价难以成功的原因。

我们假设某地牛奶市场由两家寡头瓜分，这是寡头中最简单的寡头——双头，也是最容易达成价格勾结协议的寡头市场。如果这两家寡头（A与B）之间没有任何勾结，各自按成本最低时产量进行生产，各生产3000磅牛奶，成本为每磅6元。这时，市场总供给量为6000磅牛奶，价格为6元。各家都没有经济利润（经济利润为零）。

现在这两家寡头达成价格勾结。要实现高价必须减少产量。现实中寡头之间的价格勾结总是以限产为前提的（以后要谈到的欧佩克就是这样）。如果这两家寡头把产量确定为 2000磅牛奶，这时成本为每磅8元。市场总供给量减少为4000磅牛奶，需求并没有变，价格上升至每磅9元。在这种价格时，每家寡头可获得经济利润 2000元。当然，勾结起来对双方都是有利好的。

如果达成协议方有一方违约会有什么结果呢？如果一方违约，生产3000磅牛奶，它的每磅牛奶成本约为6元，另一方守约生产2000磅牛，每磅牛奶成本为8元。这时市场总供给量为5000磅牛奶，价格为7.5元。市场价格只有一个，是整个市场的供求总量决定的。违约的一方，成本仅6元，价格为7.5元，每磅牛奶的利润为 1.5元，总计经济利润为4500元。守约的一方，成本为8元，价格也是7.5元，每磅牛奶亏损0.5元，2000磅牛奶共亏损1000元。

这两个寡头的价格勾结协议的实施并没有法律保障，因为这种协议是非法的。守约的一方无法对违约的一方提出诉讼，即缺乏有效的惩罚。是否守约完全取决于各自的意愿。他们是否会守约呢？一方守约与否的结果还取决于对方是否守约，协议并没有保证对方守约的硬约束，因此，各方都有守约与违约两种选择，而对方到底会选择什么，无法确定，这时就可以用博弈论来分析各自的决策了。

我们来看A的决策过程。A要分析在B不同的选择下，自己的选择会有什么结果。A先假设B是守约的，这时A选择守约可以赚2000元，如果选择不守约可以赚4500元。两者相比，A守约时，B的占优战略是不守约。A再假设B不守约，这时A选择守约要亏损1000元，如果选择不守约可以不赔不赚（经济利润为零）。两者相比，A不守约时，B的占优越略也是不守约。A的结论是，无论B守约还是违约，对自己最有利的还是不守约。B的分析方法和结论与A完全一样。结果A、B都选择了不守约，价格协议成了一张废纸。

在这种情况下，A、B如何才能实现勾结呢？研究者发现，如果就是这两个寡头，同样的博弈会多次进行。双方最终会发现，达成勾结的条件是采用一报还一报的策略，即对方这次守约，我下次也守约，如果对方这次不守约，我下次也不守约。这种情况下，双方会发现，从多次博弈的结果看，违约是不利的，从而自觉守约。这种一报还一报就成为有效的惩罚。但在现实中这种情况极为罕见——只有两个寡头，而且多次重复同样的博弈。在常见的多头博弈，而且同样的博弈很少反复进行的情况下，价格勾结就难以成功了。

这种分析与现实一致吗？一个最常用的例子就是欧佩克（石油输出国组织）的价格勾结。欧佩克是一个限制产量并提高石油价格的寡头价格联盟（又称“卡特尔”）。他们在70 年代的成功更多的是共同的政治动机。但经济利益在长期中是高于政治的。随着时间流逝，博弈论分析的情况就出现了。各成员国都想，无论其他国家是否守约，我违约对自己是有利的，于是纷纷打破限产规定，增加生产，

结果到80年代，石油价格就大幅度下跌了。以后的石油价格上升不是价格协议起作用，而是供求关系变动的结果

在任何一种市场上，决定价格的最基本因素还是供求关系。在供大于求的情况下，任何价格勾结都不能长远地提高价格。在供小于求的情况下，无需价格勾结，价格也会上升。在价格决定中，价格勾结是无用的。过去我国出现过的汽车行业自律价和民航的禁折令等形式的价格勾结，哪一个实现了？人为的价格勾结当然阻挡不了供求决定价格的客观规律。博弈论分析的结论与现实是一致的。企业还是不要玩这种小权术，老老实实提高自己的市场竞争。

三、小结

本文通过对反垄断法的制定过程进行简要的博弈分析，旨在说明法律的制定不仅是立法机构的单方行为，还是一个规制者与被规制者——政府和企业相互博弈的互动的过程。如果在法律的制定过程中忽略了这一点，就很容易导致法律对于现实生活的无效和“无能为力”，从而不能有效地实现其价值。

参考文献

博弈论方法篇13

博弈论，英文名称为Game theory是研究各方策略相互影响的条件下，理性决策人的决策行为的一种理论。博弈论刚被介绍至我国时，曾有过多种译法。有的学者根据其英文名称，直译为游戏理论；有的学者则从该理论本身的研究对象出发，转译为对策论或对策运筹论。近年来，学术界越来越多地接受了博弈论这一名称。这除了由于博弈这个带有文言味的词本身的学究气浓郁而给人的第一印象较为深刻外，更重要的是博弈一词能更准确、全面地体现策略选择、依策而动以及最终结果三者的统一。

（二）博弈的要素

一个完整的博弈应包含如下四项要素：1，博弈的参加者（player）。也称局中人或博弈方。是指博弈中能独立决策、独立行动并承担决策结果的个人或组织。小到一个人，大到一个跨国公司乃至一个国家，只要能独立决策和行动，都可视作一个博弈方。比如柯达与富士公司的竞争，就可看作一个有二个博弈方的博弈。一般说来，博弈的参加者越多，情况就越复杂，结果越难预料。2，策略空间（strategy space）。是指各博弈方可选择策略的集合。strategy直译应为战略，不过战略一词对大多数博弈来讲显然过于抽象和宽泛了。每一个策略都对应一个相应的结果。因此每个博弈方可选的策略数量越多，博弈就越复杂。3，进行博弈的次序（the order of play）。博弈中各博弈方行动的顺序对于博弈的结果是非常重要的。同样的博弈方、同样的策略空间，先后决策并行动和同时决策行动，其结果是大相径庭的。 4，博弈的信息（information）。知己知彼、百战不殆。可见信息对博弈的重要性古人早已知之。博弈中最重要的信息是有关对手策略以及各博弈方得益的信息。例如，在各博弈方同时决策的博弈中，必须保证不能让对手知道自己采取何种策略，否则自己将永远是博弈的输家。得益（play off），也称支付，是指博弈方策略实施后的结果。有关得益的信息是促使某博弈方选择某种策略的关键参考值。理性的博弈方总是选择能使自己获得最大得益的策略。一旦确定了以上四要素，一个博弈也就随之确定了。值得注意的是，博弈论特别强调“理性人”的前提假定，即参加博弈的各博弈方始终以自身利益最大化为惟一目标。除非为了实现自身最大利益的需要，否则不会考虑其他博弈方或社会利益。

（三）博弈论的结构

由于一个完整的博弈需具备上述四要素，因此博弈可以从不同的角度划分成不同类别：1，按博弈方划分，可分为单人博弈和多人博弈。单人博弈因为只有一个博弈方，所以它已退化为一般的最优化问题。经济学中常见的求最优问题，实际上是博弈的特例。多个博弈方的博弈较单人博弈复杂，而且两人以上的博弈会出现合作博弈问题。这样，多方博弈又将分为合作博弈与非合作博弈。因为在社会与经济关系中，竞争与不合作是基本方面。所以当前的博弈论主要研究的是非合作博弈。1994年诺贝尔经济学奖三位得主的主要贡献，即在非合作博弈方面。2，按策略空间划分，可分为有限策略博弈和无限策略博弈。因为每一种策略都相应地对应一个得益结果，所以从理论上讲，有限策略博弈的结果必然是有限的，而无限策略博弈的结果则有无穷多种可能。3，按进行博弈的次序划分，可分为静态博弈和动态博弈。各博弈方可同时决策并行动的博弈称为静态博弈。当然，严格讲各博弈方在非常精确的同一时点同时决策是不可能的。因此，同时决策是指可近似地看作同时作决定的过程，如乒乓球团体赛的出场顺序，虽双方决策可能有早有晚，但一旦敲定便谁也不许变更，因而可看作同时决策。各博弈方不是同时决策，而是先后、依次决策、行动的博弈叫动态博弈。弈棋就是一种典型的动态博弈，双方的每一步都将取决于前面的情势。4，按信息划分，如按得益信息分类，可分为完全信息博弈与不完全信息博弈。完全（complete）信息，是指各方对自己每种策略的得益情况完全清楚，否则是不完全信息；在动态博弈中，如按博弈进程信息分类，可分为完美信息动态博弈与不完美信息动态博弈。完美（perfect）信息，是指博弈方在决策前对其他博弈方的行为完全了解，否则是不完美信息。5，按得益情况划分，可分为零和博弈、常和博弈和变和博弈。一方收益必来自另一方的损失，这样的博弈叫零和博弈，零和博弈的博弈方始终是对立关系；各方都会有收益，但收益总和是一固定常数，这样的博弈为常和博弈；各方不同的策略组合会有不同的收益，这样的博弈称变和博弈。显然，零和博弈是常和博弈的特例，常和博弈是变和博弈的特例。6，综合分类。综合分类是将博弈次序与博弈信息结合起来的一种分类方法。按这两个标准，可将博弈分为：完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、不完全但完美信息动态博弈、完全不完美信息动态博弈以及不完全不完美信息动态博弈。这种分类方式有助于针对不同特性的博弈进行研究和求解。

博弈论（Game Theory），是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。因此，博弈论又称为“对策论”，也就是说当一个主体，比如一个人或一个企业的选择受到其他人、其他企业选择的影响，而且反过来影响到其他的人、其他企业的决策问题和均衡问题。正是在这个意义上，博弈理论又译为“决策理论”。博弈论创立于20世纪40年代，到50年代博弈论的研究达到了顶峰。博弈论研究的决策不仅包括经济学领域，而妾包括政治学、军事、外交、国际关系、公共选择等各个领域，因而博弈论又被称之为方法论。本文拟将这种方法引入到反垄断法领域，具体分析反垄断法规则的制定过程。

二、反垄断法的博弈分析

（一）政府和企业之间的博弈分析

1，政府和企业博弈的根源

企业，作为市场运行主体，在市场经济中具有强烈的追求利润的理性意识；企业的理性就是实现利润的最大化。企业一切经济活动的出发点和归宿都要以这个目标为指导。在利润最大化目标的指导下，企业必须研究市场上其他主体的战略并确定自己的战略，从而市场上各个经济主体都是企业博弈的对象。企业决策往往具有局部性、个体性和短期性的特点。与之相对，政府作为市场运行的监管主体，是社会理性的当然代表，其决策往往带有全局性、整体性和长远性。由于政府制定的各种市场运行规则客观上限制了企业理性的发挥；尤其是当社会理性和企业理性发生冲突时，作为被管理者的企业只能寻求“次优方案”。当然，企业也并非只是一味地妥协，也可以与政府进行博弈从而影响相应的法律、法规的制定。由政府所代表的社会理性和企业理性的冲突及其在现实经济生活中的具体表现——政府所代表的社会利益与企业追求自身利润最大化的矛盾，决定了二者都将对方视作自己的博弈对象，从而使具体的法律、法规，尤其是反垄断法的制定过程，表现为政府和企业的博弈过程。

2，政府

和企业参与博弈的目的

企业，作为盈利性的经济组织，是以实现利润最大化为其根本宗旨的；并且在这一根本宗旨的指导下组织各种经济活动。只要能够降低企业的生产成本，提高企业的利润，企业都不惜一试，包括采取垄断的方式。但是，垄断的存在，不仅侵害了广大的消费者的利益（具体表现是通过垄断价格，将相当大的一部分消费者剩余转化为超额利润。），而且凭借其“市场势力”阻碍了有效的竞争，打破了市场竞争的均衡状态。政府，作为社会利益的代表，具有保护消费者的合法权益和维护市场有效的竞争秩序的当然职能；其可通过制定法律影响着企业决策的“可选择集”，即企业只能在法律许可的范围内进行选择。显然，“可选择集”越大，对企业越有利；而决定企业“可选择集”大小的恰恰就是政府。因为政府通过确定其产业政策和竞争政策的具体内容和相互关系，影响认定垄断的界限，并通过反垄断立法决定了企业可选择范围的大小，从而间接地决定了企业的盈利空间。企业参与博弈的目的就是通过影响政府的反垄断法规，实现对企业行为的有效规制，进而最大限度地保护社会公众的利益。

3，反垄断法的博弈分析

反垄断法指的是国家为了保护竞争，针对一些限制竞争行为所规定的法律规范的总称。其目的就是政府通过法律的手段限制企业有碍于竞争的经济行为。政府在决定是否将一种企业的经济行为列入受限制之列前，政府要作如下的博弈分析：保持企业退出

政府面对一种限制竞争行为有两种选择：干预，即将其限制于合理的范围之内；或者放任自流。政府要进行干预需要支出相应的费用，设费用为5，占总收益10的一半，那么经政府干预给社会带来的净收益是5（总收益10减去干预费用5）。此时，企业针对政府的干预政策有两种策略：其一是保持原有的状态不变，继续从事具有垄断性质的经济活动。但是，由于法律的强制性，如果企业采取此策略无异于自取灭亡。此时，企业不但不会盈利，相反还会被强制清除出场。其二是企业选择退出。此时，企业只需要付出沉淀成本，设其为收益的一半为5；在这种情况下，企业的收益为-5.政府还有另外一种选择，就是放任自流。这样，如果企业保持原来的垄断状态，就将获得全部的利润所得，社会公共利益为0；如果企业选择退出，那么全部利润将自动流向政府所代表的社会公众，此时，企业还要支付相应的沉淀成本。由于政府干预经济的目的就是为了将“垄断利润”返还给广大的消费者，（0，10）所代表的状态正是政府介入的原因，并且是政府所要竭力改善的初始状态。（10，-5）所代表的是企业自动放弃高额的垄断利润，并且还要为此承担相应的前期投入，即沉淀成本。这是不符合企业追求利润最大化的理性目标的，因而是不现实的。由此，政府只能选择干预策略。企业根据其对政府选择的分析判断政府介入的可能性，然后在（5，-10）、（5，-5）和（0，10）三种状态中进行选择。由于（5，-10）的高成本和（0，10）的不现实性及由此决定的高风险性，迫使理性的厂商选择（5，-5）所代表策略。这样，可以将损失降低到最低。政府经过上述博弈分析，最终决定将该经济行为纳入禁止之列；而企业也会选择放弃该垄断行为。至此，反垄断法的目的得以实现。

4 对反垄断法进行经济分析的意义。

对反垄断法进行博弈分析的意义在于揭示反垄断法的制定过程从某种意义上讲就是政府和企业的博弈的过程，反垄断法律规范的具体规范则是政府和企业的博弈结果在法律上的认定。所以，在反垄断法的制定过程中，应该站在企业的立场上考虑企业可能做出的策略选择，然后再确定法律是否对该行为进行规制及如何规制。这样，才能保证制定出的法律能有效地规制企业的行为，有效地保证竞争。

（二）企业间通过价格等垄断协议的博弈分析

在寡头市场上，当寡头数量很少时，从理论上说，他们很容易通过谈判实行勾结定价，即像一个垄断者那样用高价格来宰消费者。这样做，交易费用（寡头进行价格勾结谈判达成协议所需要的费用）并不高，而勾结定价可以为参与者带来共同的利益。但为什么这种勾结定价在现实中成功的很少呢？尽管许多国家“反垄断法”中有禁止勾结定价的条款，但实际上这个条款的作用极为有限，因为寡头之间可以采用不易被发现的隐蔽性勾结——默契。我们可以用博弈论的分析来说明现实中的勾结定价难以成功的原因。

我们假设某地牛奶市场由两家寡头瓜分，这是寡头中最简单的寡头——双头，也是最容易达成价格勾结协议的寡头市场。如果这两家寡头（A与B）之间没有任何勾结，各自按成本最低时产量进行生产，各生产3000磅牛奶，成本为每磅6元。这时，市场总供给量为6000磅牛奶，价格为6元。各家都没有经济利润（经济利润为零）。

现在这两家寡头达成价格勾结。要实现高价必须减少产量。现实中寡头之间的价格勾结总是以限产为前提的（以后要谈到的欧佩克就是这样）。如果这两家寡头把产量确定为 2000磅牛奶，这时成本为每磅8元。市场总供给量减少为4000磅牛奶，需求并没有变，价格上升至每磅9元。在这种价格时，每家寡头可获得经济利润 2000元。当然，勾结起来对双方都是有利好的。

如果达成协议方有一方违约会有什么结果呢？如果一方违约，生产3000磅牛奶，它的每磅牛奶成本约为6元，另一方守约生产2000磅牛，每磅牛奶成本为8元。这时市场总供给量为5000磅牛奶，价格为7.5元。市场价格只有一个，是整个市场的供求总量决定的。违约的一方，成本仅6元，价格为7.5元，每磅牛奶的利润为 1.5元，总计经济利润为4500元。守约的一方，成本为8元，价格也是7.5元，每磅牛奶亏损0.5元，2000磅牛奶共亏损1000元。

这两个寡头的价格勾结协议的实施并没有法律保障，因为这种协议是非法的。守约的一方无法对违约的一方提出诉讼，即缺乏有效的惩罚。是否守约完全取决于各自的意愿。他们是否会守约呢？一方守约与否的结果还取决于对方是否守约，协议并没有保证对方守约的硬约束，因此，各方都有守约与违约两种选择，而对方到底会选择什么，无法确定，这时就可以用博弈论来分析各自的决策了。

我们来看A的决策过程。A要分析在B不同的选择下，自己的选择会有什么结果。A先假设B是守约的，这时A选择守约可以赚2000元，如果选择不守约可以赚4500元。两者相比，A守约时，B的占优战略是不守约。A再假设B不守约，这时A选择守约要亏损1000元，如果选择不守约可以不赔不赚（经济利润为零）。两者相比，A不守约时，B的占优越略也是不守约。A的结论是，无论B守约还是违约，对自己最有利的还是不守约。B的分析方法和结论与A完全一样。结果A、B都选择了不守约，价格协议成了一张废纸。

在这种情况下，A、B如何才能实现勾结呢？研究者发现，如果就是这两个寡头，同样的博弈会多次进行。双方最终会发现，达成勾结的条件是采用一报还一报的策略，即对方这次守约，我下次也守约，如果对方这次不守约，我下次也不守约。这种情况下，双方会发现，从多次博弈的结果看，违约是不利的，从而自觉守约。这种一报还一报就成为有效的惩罚。但在现实中这种情况极为罕见——只有两个寡头，而且多次重复同样的博弈。在常见的多头博弈，而且同样的博弈很少反复进行的情况下，价格勾结就难以成功了。

这种分析与现实一致吗？一个最常用的例子就是欧佩克（石油输出国组织）的价格勾结。欧佩克是一个限制产量并提高石油价格的寡头价格联盟（又称“卡特尔”）。他们在70 年代的成功更多的是共同的政治动机。但经济利益在长期中是高于政治的。随着时间流逝，博弈论分析的情况就出现了。各成员国都想，无论其他国家是否守约，我违约对自己是有利的，于是纷纷打破限产规定，增加生产，结果到80年代，石油价格就大幅度下跌了。以后的石油价格上升不是价格协议起作用，而是供求关系变动的结果

在任何一种市场上，决定价格的最基本因素还是供求关系。在供大于求的情况下，任何价格勾结都不能长远地提高价格。在供小于求的情况下，无需价格勾结，价格也会上升。在价格决定中，价格勾结是无用的。过去我国出现过的汽车行业自律价和民航的禁折令等形式的价格勾结，哪一个实现了？人为的价格勾结当然阻挡不了供求决定价格的客观规律。博弈论分析的结论与现实是一致的。企业还是不要玩这种小权术，老老实实提高自己的市场竞争。

三

、小结

本文通过对反垄断法的制定过程进行简要的博弈分析，旨在说明法律的制定不仅是立法机构的单方行为，还是一个规制者与被规制者——政府和企业相互博弈的互动的过程。如果在法律的制定过程中忽略了这一点，就很容易导致法律对于现实生活的无效和“无能为力”，从而不能有效地实现其价值。

参考文献

[1]张维迎。博弈论与信息经济学[M].上海人民出版社，1996。

友情链接