48
[收稿日期]2002-02-25
[作者简介]
胡希宁(1952-),男,安徽芜湖人,中共中央党校经济学教研部教授;贾小立(1970-),男,山西洪洞人,中共
中央党校研究生院硕士研究生。
博弈论的理论精华及其现实意义
胡希宁1贾小立
2
(1.中共中央党校经济学教研部,北京100091;2.中共中央党校研究生院,北京100091)
[摘要]经济博弈论以贴近现实的方式,揭示了现代经济活动的内在规律。
它的发展过程是纳什均衡从提出到改进的过程。
无论在理论上还是在实践上,博弈论都具有重要的现实意义。
[关键词]
博弈论;纳什均衡;信息经济学
[中图分类号]
F 062.5
[文献标识码]A [文章编号]1007-5801(2002)02-0048-06
第6卷第2期2002年5月
中共中央党校学报
Journal of the Part y School of the Central Committee of the C .P .C .
Vol .6,No .2M ay .,2002
博弈论(Game T heor y )研究的是,各个理性决策个体在其行为发生直接相互作用时的决策及决策均衡问题。
冯·诺伊曼(John V on Neumann )与摩根斯坦恩(Oskar M orgenstern )合作出版的《博弈论与经济行为》(1944)一书第一次系统地将博弈论引入经济学中。
到20世纪50年代,合作博弈发展到鼎盛期,非合作博弈也开始产生。
纳什(N ash ,J .F .)的《N 人博弈的均衡点》(1950)、《非合作博弈》(1951)明确提出了“纳什均衡”(Nash Equilibrium ),图克(Tucker )则定义了“囚徒困境”(Prisoners 'Dilemma ,1950)。
两人的著作奠定了现代非合作博弈论的基石。
泽尔滕(R .Seleten ,1965)首次将动态分析引入博弈论,提出了纳什均衡的第一个重要改进概念———“子博弈精炼纳什均衡”(Subgame Perfect Nash Equilibrium )和相应的求解方法———“逆向归纳法”(Bakew ard I nduction )。
豪尔绍尼(J .C .Harsanyi ,1967)首次把信息不完全性引入博弈分析,定义了“不完全信息静态博弈”(S tatic Games of Incomplete information )的基本均衡概念———“贝叶斯-纳什均衡”(Bayesian -Nash
Equilibrium ),构建了不
完全信息博弈的基本理论。
之后,不完全信息动态博弈(dynamic games of incomplete information )得到迅速发展,弗得伯格和泰勒尔(Furdenber g
and Tirole ,1991)定义了它的基本均衡概念———“精炼贝叶斯—纳什均衡”(Perfect Bayesian -N ash Epuilibrium )。
70年代以后,博弈论形成了一个完整的体系;大体从80年代开始,博弈论逐渐成为主流经济学的一部分,甚至可以说成为微观经济学的基础。
1994年诺贝尔经济学奖被授予纳什、豪尔绍尼和泽尔滕三人,以表彰他们在博弈论的发展及应用中所作出的开创性贡献。
一经济博弈论的基本理论———
基本博弈结构、纳什均衡及其改进
这里,我们以完全信息静态、完全信息动态、不完全信息静态、不完全信息动态四种博弈结构为主线,对纳什均衡及其改进进行概括,以阐明经济博弈论的主要思想内涵。
(一)完全信息静态博弈———纳什均衡纳什均衡是完全信息静态博弈的基本均衡概念。
完全信息静态博弈(S tatic Games of Com p lete Information )是指,博弈的每个局中人(参与竞争的具有不同利益的行为主体或决策者)对所有其他局中人的特征(策略空间、支付函数等,前者指可供局中人选择的策略组合,后者指决定局中人损益得失的函数)有完全的了解;所有局中人同时选择行
DOI :10.14119/j .cn ki .zgxb .2002.02.009
动且只选择一次(这里的“同时”强调的是,每个局中人选择行动时并不知道其他局中人的选择)。
作为其基本均衡概念的纳什均衡是指,在其他局中人的策略选择既定的前提下,每个局中人都会选择自己的最优策略(每个局中人的个人选择均依赖于其他局中人的选择,不依赖的情况只是例外),所有局中人的最优策略组合就是纳什均衡。
它意味着,在给定别人策略的情况下,任何一个局中人都不能通过改变自己的策略得到更大的效用或收益,从而没有任何人有积极性打破这个均衡。
如果一个策略组合不是纳什均衡,则至少有一个局中人认为,在其他局中人都遵守这一组合的规定下,他可以比现在做得更好。
纳什均衡被认为是局中人个人理性选择达成一致的结果。
博弈过程也是局中人个人理性选择的过程,当且仅当所有局中人预测一个特定的纳什均衡会出现时,有且仅有这个纳什均衡构成博弈均衡,即:个人理性选择达成了对均衡的一致性预测。
进一步,纳什均衡深刻地揭示了个人理性与集体理性之间存在的内在矛盾。
纳什均衡是理性局中人之间利益冲突与妥协达到的一种相对稳定的状态,而这种状态没有一个行为主体可以单方面地加以改变。
但是,个人理性选择的结果在总体上可能并不是帕雷托最优的结果。
在此基础上,人们后来又提出了加以改进的其它均衡概念。
(二)完全信息动态博弈———子博弈精炼纳什均衡
纳什均衡求解中,假定别人的策略选择是既定的,分析局中人如何选择自己的最优策略。
这时,局中人并不考虑自己的选择对别人的影响,这样,纳什均衡就允许了不可置信策略威胁的存在,而含有不可置信威胁的策略是不会实际发生的。
针对纳什均衡的这一缺陷,泽尔滕在引入动态分析并提出完全信息动态博弈的同时,提出了子博弈精炼纳什均衡的概念,第一次对纳什均衡进行了改进。
博弈树是动态博弈分析常用的树状分析图(它由结、枝和信息集组成。
结可分为起始结、决策结和终点结。
起始结是博弈树的起点,决策结是局中人的决策变量,终点结是博弈树的终点。
枝是结的连线,对应于局中人的行动。
处于博弈同一阶段的决策结被分为不同的信息集,在每一个信息集上,局中人仅知道博弈进入了其中的某一个决策结,但却不知道自己具体处于哪一个决策结上)。
子博弈是指从某一个决策结起始的后续博弈,包含该后续博弈的决策结的信息集不包含不属于这个后续博亦的决策结,这个后续博亦的所有决策结都包含在这些集息集中。
完全信息动态博弈(D y namic Games of Com p lete I nformation)是指,博弈中的每个局中人对所有其他局中人的特征有完全的了解,局中人的行动有先后顺序。
子博弈精炼纳什均衡是完全信息动态博弈的基本均衡概念,其核心思想是:剔除纳什均衡中包含不可置信威胁的均衡策略;当且仅当局中人的策略在每一个子博弈中都构成纳什均衡时,亦即当且仅当均衡策略在每一个子博弈中都是最优时,纳什均衡就构成了子博弈精炼纳什均衡。
构成子博弈精炼纳什均衡的策略不仅在均衡路径(均衡路径是均衡策略组合在博弈树上对应的枝和结的连线)的决策结上是最优的,而且在非均衡路径的决策结上也是最优的。
任何有限(局中人的个数有限,策略空间有限)完全信息动态博弈都存在子博弈精炼纳什均衡。
理性人假定是达成子博弈精炼纳什均衡的一个重要保证。
由于局中人是理性的,根据对先行动者行动的观察,后行动者能够并且必然对先行动者的策略选择做出合乎理性的反应;先行动者也知道这一点;这就保证了将包含不可置信威胁的不合理均衡策略剔除出去,将合理纳什均衡和不合理纳什均衡分离开来。
(三)不完全信息静态博弈———贝叶斯—纳什均衡
纳什均衡是完全信息条件下的均衡概念,从而适用性受到限制。
为此,豪尔绍尼构建了不完全信息博弈的基本理论,提出了不完全信息静态博弈的基本均衡概念———贝叶斯—纳什均衡。
不完全信息(静态和动态)博弈的分析是在豪尔绍尼转换的基础上进行的。
不完全信息静态博弈是指,至少有一个局中人不知道其他局中人的支付函数,所有局中人同时行动。
豪尔绍尼转换是不完全信息(静态和动态)博弈分析的基本概念。
通过该转换,豪尔绍尼在不完全信息静态博弈上附加了一定的分析前提,将不完全信息静态博弈转化为“包含同时行动的完全但不完
49
美信息动态博弈”,使得不完全信息静态博弈的分析可以在已经讨论过的完全信息动态博弈的分析框架下进行,而在豪尔绍尼转换提出之前,人们是无法对不完全信息博弈进行分析的。
豪尔绍尼转换借助于三个新增的概念展开,它们是:局中人的类型(局中人个人特征的完备描述,简化起见,一般将其等同于局中人的支付函数)、自然(局中人的类型是由先天因素或博弈之外的客观因素决定的,为便于分析,豪尔绍尼将这些因素归结为一个虚拟的局中人“自然”,由于是虚拟的,因而他不获得支付并且对于所有博弈结果具有同等偏好,其作用仅在于决定局中人的类型,具体作用过程见下面对豪尔绍尼转换具体做法的分析的第一点)和局中人的信念(局中人根据其他局中人各种可能类型的概率分布对其类型所作出的判断,即条件概率)。
转换的具体做法是:(1)自然选择局中人的类型,并将局中人的真实类型告知他自己,而不告知其他局中人,同时并不对每个局中人的各种可能类型及其概率分布保密;这样,每个局中人知道自己的类型,不知道别人的真实类型,仅知道其各种可能类型的概率分布,被选择的局中人也知道其他局中人心目中的这个分布函数;(2)自然之外的每个局中人根据其他局中人可能类型的概率分布对其类型作出先验判断,并各自同时选择行动,博弈终了,除自然以外,各个局中人得到对各自的支付。
通过豪尔绍尼转换,不完全信息静态博弈转化为包含同时行动的完全但不完美信息动态博弈(把对支付函数的不了解转化为对局中人类型的不了解)。
其动态性在于,整个博弈被转化为两阶段动态博弈,即自然选择的阶段和其他局中人同时行动的阶段,前者实际上是为了使原博弈能够进行分析而虚构的,集中体现了豪尔绍尼转换对原博弈附加的分析前提,后者是一个静态博弈,它实际上等同于原来的不完全信息静态博弈;其信息的完全性在于,每个局中人都知道其他局中人的各种可能类型,而每个局中人的支付和策略都依赖于其类型,这样,每个局中人都知道其他局中人的各种可能类型的支付函数和策略空间;其信息的不完美性表现在,局中人对自然的选择没有完全的了解,亦即局中人对每个局中人的可能类型及其概率分布具有完全的了解,而对他们的真实类型并没有完全的了解。
贝叶斯—纳什均衡是不完全信息静态博弈的基本均衡概念。
在自然选择之后,各个局中人同时行动,没有机会观察到别人的选择。
如果给定别人的策略选择,每个局中人的最优策略依赖于自己的类型(以下简称类型依赖策略)。
由于每个局中人仅知道其他局中人的类型的概率分布而不知道其真实类型,他就不可能准确地知道其他局中人实际上会选择什么策略;但他能正确地预测到其他局中人的选择是如何依赖于其各自类型的;这样,他决策的目标就是,在局中人类型的概率分布是完全信息的前提下,给定自己的类型依赖策略和别人的类型依赖策略,最大化自己的期望效用。
贝叶斯—纳什均衡就是这样一种类型依赖策略组合:在给定自己的类型和别人类型的概率分布的情况下,每个局中人的期望效用达到了最大化,没有人有选择其他策略的积极性。
(四)不完全信息动态博弈———精炼贝叶斯—纳什均衡
贝叶斯—纳什均衡仅仅局限于静态分析,从而其适用性也受到了限制。
为此,弗得伯格和泰勒尔对它进行了改进,定义了不完全信息动态博弈的基本均衡概念———精炼贝叶斯—纳什均衡。
不完全信息动态博弈是指,在博弈中至少有一个局中人不知道其他局中人的支付函数;局中人的行动有先后之分,后行动者能观察到先行动者的行动。
不完全信息动态博弈分析也是在豪尔绍尼转换的框架下进行的。
具体讲,自然首先选择局中人的类型,局中人自己知道自己的真实类型,其他局中人不知道被选择的局中人的真实类型,仅知道其各种可能类型的概率分布;之后,局中人开始行动,局中人的行动有先后顺序,后行动者能观察到先行动者的行动,但不能观察到先行动者的类型。
但是,由于局中人的行动依赖于其类型,每个局中人的行动都传递着有关自己类型的某种信息,所以后行动者便可以通过观察先行动者的行动来推断其类型或修正对其类型的信念(按“贝叶司法则”将先验概率转化为后验概率),然后选择自己的最优行动。
先行动者预测到自己的行动将被后行动者所利用,也就会设法选择传递有利信息,避免传递不利信息。
因此,博弈过程不仅是局中人选择行动的过程,而且是局中人不断修正信念的学习过程。
精炼贝叶斯-纳什均衡是不完全信息动态博弈的基本均衡概念,
50
它要求,给定有关其他局中人类型的信念,局中人的策略在每一个信息集开始的“后续博弈”上构成贝叶斯-纳什均衡;并且,在所有可能的情况下,局中人要根据所观察到的其他局中人的行为,按照贝叶斯法则来修正自己有关后者类型的信念,进而据此选择并最优化自己的行动。
精炼贝叶斯—纳什均衡是所有局中人策略和信念的一种结合,它满足如下条件:(1)在给定每个局中人有关其他局中人类型的信念的情况下,他的策略选择是最优的;(2)每个人有关他人类型的信念都是使用贝叶斯法则从所观察到的行动中获得的。
精炼贝叶斯-纳什均衡不仅定义在策略组合上,还强调了局中人的信念,因为最优策略是相对于信念而言的。
在不完全信息范围内,还有一些均衡概念,如:泽尔腾的“颤抖手均衡”(T remblin g Hand Equilibrium,1975),梅耶森(M yerson)的“恰当均衡”(Proper Equilibrium,1978)、克瑞普斯和威尔逊(Kreps,D.and W illson.C)的“序贯均衡”(sequential equilibrium,1982)、考尔伯格和默顿(Kohlberg and M erten)的“稳定均衡”(Stable Equilibrium,1986),等等。
综上所述,经济博弈论的一系列均衡概念都是在纳什均衡的基础上发展起来的,其基本思路都是通过逐步剔除不合理均衡而得到更为精确和合理的均衡概念。
根据约束条件的强弱,均衡概念由弱到强依次是:纳什均衡,子博弈精炼纳什均衡,贝叶斯—纳什均衡,精炼贝叶斯—纳什均衡,序贯均衡,颤抖手均衡,恰当均衡,稳定均衡。
每一个较强均衡概念都是在较弱均衡概念基础上发展而来,因此,强概念自然也适用于弱概念的分析环境。
二博弈论的现实意义与应用
博弈论使经济学产生了革命性的变革。
它在继承的同时又突破和发展了传统经济学的基本假定前提和分析范式;它的应用使得一些经济领域的分析产生了质的飞跃,一些新的分支学科飞速发展;由于更加贴近现实,博弈论对我国经济改革也具有重要意义。
(一)经济博弈论对传统经济学基本假定前提及其分析范式的继承、突破和发展
经济博弈论对基本假定前提和分析范式的继承和突破,使传统经济学发生了革命性的变革。
1.传统经济学的基本假定前提与分析范式
一般地讲,传统经济学的假定前提包括理性人、完全竞争、完全信息和市场出清等。
理性人是传统经济学最基本的假定。
理性人假定和完全竞争假定共同推导出完全信息假定。
完全信息假定以价格的自由波动为前提,即经济决策所需要的一切信息几乎惟一地通过价格显示出来并进行传导,而在市场中价格的信息又是完全的,由此,价格的自由波动就传递了经济活动的全部信息。
在此基础上,市场价格机制的作用得以实现,即决策个体之间的冲突与合作都包含在价格之中,通过价格机制,决策个体间接地对其他个体发生影响,最终实现自己的利益最大化;也产生了客观为他人的社会效果,从而也使个人理性和社会理性达到一致。
“看不见的手”思想由此被发展为一个精致的“定理”:给定价格等限制条件,决策个体的最大化行为将导致市场均衡状态。
在分析中又主要采用的是静态局部均衡分析方法。
这就是传统经济学尤其是微观经济学的分析脉络。
围绕上述假定条件,尤其是完全竞争假定和市场出清假定,经济学家们发生了激烈的争论,但是即使是主张竞争不完全和市场非出清的经济学家和经济学流派,他们的应对方法也主要局限于政府通过宏观经济政策进行干预,如凯恩斯主义经济学。
传统经济学的分析范式是:给定约束条件,决策个体追求其自身效用的最大化,并在这一过程中,整个社会达到帕雷托最优。
进一步讲,传统微观经济学的个人决策问题是在给定价格参数和收入条件下的最优选择问题,个人的决策就是在给定价格参数和收入的限制条件下,使其效用最大化;个人效用函数只依赖于他自己的选择,而不依赖于其他人的选择;个人的最优选择只是价格和收入的函数而不是其他人选择的函数。
作为一个整体,不同决策个体之间的选择是相互作用(通过供求及价格)的,但对个体而言,所有个体的行为都体现在一个信息参数———价格里,一个人面对的似乎是一个非人格化的东西,而不是面对着另外的个体作出决策,他既不考虑自己的选择对别人选择的影响,也不考虑别人的选择对自己选择的影响,不同决策个
51
体之间的相互作用是通过市场价格机制间接完成的。
在个体效用最大化过程中,社会效用也达到最优,即通过价格机制个人理性和集体理性得以统一。
2.经济博弈论对传统经济学的继承、突破和发展
经济博弈论则更加突出了理性人假定。
以个人理性为基础,均衡概念越精炼,理性的要求也就越强。
通过对理性行为的深刻剖析,经济博弈论揭示了理性人的心理作用过程。
由此出发,博弈论对个人理性和集体理性的矛盾进行研究,探讨在决策个体内在个人理性基础上如何达到集体理性。
它强调的是设计一种激励兼容的机制,这种机制对个体理性具有自我实现的机能,即在这种机制中,个人理性自我实现并自发地达到集体理性。
通过对理性的深度剖析和挖掘,博弈论将理性背后的文化内涵融入到了经济活动的分析之中。
虽然现实中的理性和非理性相互交织难分彼此,个人理性的强化不应该排斥非理性的影响;理性人假定的强化程度限制了博弈论的适用范围;博弈论不可能解决一切个人理性和集体理性之间的矛盾,但是,它毕竟为我们提供了一种极有意义的解决个人理性和集体理性之间矛盾的方法和思路。
经济博弈论突破了完全信息假定,将理性人放在不确定性和存在信息不完全或不对称的经济环境中进行分析,增强了人们对经济现实的解释能力和预测能力。
经济博弈论还打破了完全竞争假定的桎梏。
尽管传统的微观经济分析吸纳了不完全竞争的成分,但在其整个体系上却极其有限;其分析基础和主要对象仍然是完全竞争经济环境。
直到泽尔滕把博弈论引入垄断经济分析以及豪尔绍尼提出不完全信息博弈后,才使得不完全竞争分析逐步完善化。
静态局部均衡分析一直是传统经济学的分析基础,而市场价格机制则是其核心。
经济博弈论则将经济分析的重点转向决策个体之间的相互作用和影响,并且将经济分析动态化。
此外,经济博弈论分析的是博弈均衡,它的核心在于决策个体之间的相互作用和影响,其落脚点在于决策个体相互之间的行动和策略选择达到一种相对稳定的状态。
经济博弈论还有助于形成宏观经济分析的微观基础。
例如,它将宏观经济政策的作用过程看作是一个政府和个体的博弈过程,从而拓宽了宏观经济学的视野,加深了宏观经济分析的力度,从而有助于我们更加深刻和合理地揭示宏观经济机制的作用机理。
经济博弈论的研究范式是:给定约束条件,决策个体追求其自身效用的最大化。
在这一意义上,经济博弈论与传统经济学是一致的。
但具体到它们的构成,经济博弈论对传统经济学既有继承又有突破。
在博弈论中,给定局中人的策略空间、效用函数、信息结构,理性的局中人通过其最优选择追求个人效用最大化,最终达到博弈均衡。
局中人的个人效用函数不仅依赖于他自己的选择而且依赖于他人的选择;个人的最优选择是其他人选择的函数;这种选择是在存在着外部相互作用经济条件下的个人选择。
局中人所获得的效用不仅与他自己选择何种策略有关,而且还是其他局中人所选策略的函数,局中人之间的利益是相互牵连和相互制约的。
经济的博弈均衡并不一定是帕雷托最优的,个人理性和集体理性可能存在着矛盾和冲突,对于这种矛盾和冲突,不在于否定个人理性,关键是通过设计一种制度的创新,建立起一种新的使得在满足个人理性的基础上能够达到集体理性的机制。
(二)经济博弈论的应用推动了一些经济学分支学科的发展
博弈论的引入使得传统经济学中一些难以展开的领域得以深入,并由此演绎出一些相对独立、体系完整的经济学分支学科。
其中,最引人瞩目的是寡头垄断理论和信息经济学,尤其是后者,被誉为20世纪80年代以来微观经济理论中最活跃的领域。
1.重新构建了寡头垄断理论
传统微观经济学研究的是在价格和收入给定条件下的个人决策问题,其价格包含了个人决策所需的全部信息,因而忽略了决策个体之间的相互作用,即外部性问题。
古诺(A.A.Cournot)和贝特朗(J.P.Betrand)对寡头垄断市场竞争的研究结果被搁置了很长时间,使得微观经济的研究未能取得突破性进展。