编辑: LinDa_学友 | 2019-09-22 |
然而,在现实社会中,个人基 本上无法孤立於群体之外进行选择与决 策.例如:您可能愿意且能够请学校里的 校花 「沈佳宜」 一起去看电影,但是沈校花 未必会同意跟您去看电影,又或者其他男 同学也可能同时在约她去看电影,她的父 母也可能会建议她不要在高中时期就单独 跟男生出去看电影.所以最后决定您 「是 否能够如愿以偿地跟沈同学去看电影?」 , 或是 「一共看几场电影?」 ,并非可以用您 「个人的效用极大化」 所能单独决定的,而 会受到同时其他人的行为与彼此间的互动 所影响. 走入赛局论的 美丽境界 国立交通大学经营管理研究所所长 胡均立教授 ? ??????? ????? ??????? ????? ?????? ?о??????? ????? 全华数学专刊-2012-第5期.indd
1 2014/2/27 下午 01:49:22 CHWA CHWA 而就是因为个人并非单独地活在这个世界上,我们现在所见到的世界现况是由全球
70 亿人每分、每秒不断地互动所造成的均衡 (equilibrium) 结果.换言之,每一个人的效用都 会同时受到自己与他人行为的影响.例如:您每天早上坐公车去学校所花费的时间,除了 您自己抵达公车站牌的时间以外,还会受到公车司机的开车速度、其他驾驶或行人出门的 时间及路线选择等决策所影响.如果许多其他驾驶人也选择了您所搭乘公车的行驶路线, 并在同时间使用相同路段,则大家的用路时间都会拉长.由於其他人的选择会影响自己的 效用,所以个人在选择自己策略的同时,势必得将其他人可能选择的策略也纳入考量.反之,其他人在进行策略选择时,也会将自己以外的相关人士的策略选择纳入考量. 在这个多决策者进行互动的世界中,我们如何准确地预测互动的均衡结果?这是一个 科学上的大哉问.而赛局论 (game theory) 就是一门分析多决策者间互动过程及均衡结果的 学问.赛局论目前的应用围已包含经济学、管理学、资讯科学、军事学、政治科学、生 物学等.对个人的日常生活、公司企业的经营管理、市场竞争实务、法律制度设计、政党 政治运作、军事战略布局、国际经贸谈判等大小议题,皆具有协助决策者正确猜测对手反 应、选取最佳有效策略的实际助益. 什麽是一个赛局 (game) 呢? 一个赛局至少包含五个要素: 参赛者 (players) 、策略 (strategies) 、报酬 (payoffs) 、 资讯结构 (information structure) 、游戏规则 (rules of the game) . 参赛者是指谁在进行决策,例如:个人、厂商、国家等;
策略是指参赛者可以采取的行 动,例如:努力、订价、开战等;
报酬是指个别参赛者所得到的奖惩,例如:奖状、损失、 油田等;
资讯结构描述个别参赛者知道或不知道的事实,例如:学生的用功程度、竞争对手 的单位成本、他国的飞弹部署等;
游戏规则则是规参赛者的行为,例如:说谎者一旦被查 获要接受惩罚、做不实广告的厂商要被罚款、违反环保公约的国家要被贸易制裁等. 清楚地定义了一个赛局以后,要如何知道什麽才是这个赛局的 「均衡」 结 果呢?这就涉及到我们如何定义什麽是 「均衡」 ?均衡的定义很 多,例如:市场均衡是指价格调整到供给量等於需求量的状 态,而目前在赛局论中常用的均衡定义是纳许均衡, 由1994 年诺贝尔经济学奖得主约翰?纳许 (John Forbes Nash, Jr.) 所提出.纳许的想法是: 互相给定对手的策略下,每一个参赛者 都没有偏离目前所采策略的诱因,则这样的 一个策略组合是一个均衡状态. 全华数学专刊-2012-第5期.indd
2 2014/2/27 下午 01:49:29 TOP Line TOP Line TOP MATHEMATICS TOP 数学【专刊 】 反过来说,给定其他参赛者的策略下,只要有任一个参赛者觉得可藉由改变策略提高自 己的报酬,则这样的策略组合就不是一个纳许均衡.例如:产油国家一起约定了减少产量以 提高油价的策略 (即 「给定的其他参赛者策略」 ) ,然而各国发现 「在较高油价下偷偷多卖石 油将使得自己获利更多」 (改变策略可以提高自己的报酬) .於是在给定其他国家遵守减产约 定下,各产油国皆具有偏离约定偷多卖油的诱因,如此一来, 「各国皆遵守协定一起来减产 石油」 便不是一个纳许均衡结果,而通常这样偏离纳许均衡结果的策略,都不会成功. 纳许均衡的概念常用来说明个体的理性行为经常无法达成整体的最大利益.例如:在 全球气候变迁政策执行的层面上,给定其他国家努力节能减碳下,个别国家也可以享有其 他国家节能减碳的好处,自己更严格地节能减碳的诱因当然大打折扣.而若是其他国家不 节能减碳,个别国家也不想自己多多努力节能减碳,然后让其他国家坐享自己节能减碳的 成果.所以最后虽然各个国家都知道全球共同努力节能减碳的整体利益较大,却总是希望 别人多多努力,自己则可以多搭便车.因此,全球的节能减碳努力长期处於不足的水准, 导致气候与环境走向极端变化. 另外,再如纳许的博士论文指导教授塔克 (Albert W. Tucker)所发明的囚犯两难 (Prisoner' s Dilemma) 赛局,也常被用来说明个体理性行为反而导致整体报酬总和下降的例 子.如下表所示,囚犯两难赛局中有两个被隔离侦讯的囚犯甲和乙,他们各有两个策略可 供自己选择:沉默、认罪.而此赛局的报酬架构符合 「坦白从宽、抗拒从严」 的原则.报酬 组合中的前一个元素是甲的报酬,后一个元素是乙的报酬;
类似的表示方式:策略组合中 的前一个元素是甲的策略,后一个元素是乙的策略.假定刑期的单位是年,由於刑期对两 人带来负的报酬,所以报酬组合中负值表示两人的刑期长度所带来的负效用. 给定甲选择沉默下,乙若沉默要被求刑半年,乙若认罪则可立即获得释放.因为 - 0.5 < 0,在给定甲选择沉默下,乙的最佳反应是认罪以获得立即释放,所以很明显的, 乙有选择偏离沉默的诱因.因此, (沉默,沉默) 并非一个纳许均衡.类似的推理过程告诉 我们,一方沉默而另一方认罪也绝非一个纳许均衡,因为给定一方认罪下,另一方可藉由 改选认罪来降低自己的求刑,故而另一方具有也认罪的诱因.在囚犯两难赛局中,唯一的 纳许均衡是 (认罪,认罪) ,亦即双 方都有认罪的诱因,而互相给定对方 认罪下,双方都没有偏离认罪策略的 诱因.於是最后结果是囚犯乖乖认 罪,警方顺利破案. 囚犯乙 沉默 认罪 囚犯甲沉默 - 0.5, - 0.5 - 10,
0 认罪 0, -
10 - 5, -
5 全华数学专刊-2012-第5期.indd
3 2014/2/27 下午 01:49:34 总公司 北区高中营业处 地址:新北市土城区忠义路
21 号
电话: (02)2262-5666 传真: (02)2262-0565 中区高中营业处 地址:台中市南区树义一巷
26 号2楼
电话: (04)2261-8485 传真: (04)3601-8600 南区高中营业处 地址:高雄市三民区应安街
12 号
电话: (07)381-1377 传真: (07)960-2868 诚挚邀请老师分享您精辟的见解及投稿,投稿请寄:[email protected] 您的稿件企划部将视情况删修,修改后会寄给您过目,您同意后才会刊登. 投稿作品,视同授权本刊书面及电子版刊载.作品一经刊登将依字数致赠 稿酬. 来稿请勿侵害他人著作权,如有引文,请注明参考资料来源. 来稿请附作者资料:姓名、任教学校、联络电话 地址、电子邮件信箱. 如有任何疑问,欢迎您 E-mail 或来电询问:02-2262-5666#213 杨先生. 本公司已尽力处理刊物中图文的著作权事宜,倘有疏漏,惠请著作权人能与 本公司联系,仅此致谢. ? ? ? ? TOP Line TOP Line TOP MATHEMATICS TOP 数学【专刊 】 纳许均衡的概念是源自於 「非合作赛局」 (non-cooperative game) 的基础.除了解释非 合作行为外,合作行为也是出自於非合作的动机,即个体间的合作是出於对自己有利的动 机,合作或不合作都是为了提高自己的报酬.例如:厂商之间进行合作研发,不是为了要 图利其他厂商或造福全人类,而是因为预期合作研发比不合作研发给自己带来更高的报 酬.换言之,纳许均衡的基本概念与经济学之父亚当史密斯 (Adam Smith) 所提出的自利心 (self interest) 是一致的,理性的个体基於自利心进行生产与交换,在市场中反而造成对彼 此有利的结果. 纳许是在
1928 年出生,1950 年於普林斯顿大学取得数学博 士学位,1951 年正式发表了 〈非合作赛局〉 的大作,但从
1959 年起,却因为精神分裂症到医院就医,而於
1994 年获得诺贝尔经 济学奖.就是因为这样独特的人生起伏经历,他的故事被拍摄成 电影 《美丽境界》 ,英文片名为 《A Beautiful Mind》 ,於2001 年上 映.电影的主轴著墨於纳许精神分裂后,游走於真实与幻觉两个 世界中的经过,不过所幸最后纳许终能与他的幻觉和平共处,正 常的在真实世界中生活. 纳许均衡的概念提醒我们,任何的制度设计都要考量到个体 的诱因,亦即个体是否可藉由遵守制度规而获益,或是预期不 遵守制度规将受到处罚. 《孟子?离娄上》 说: 「徒法不足以自行」 .一项制度的设计,即 使立意再良善,若是不能提供理性个体遵守的诱因,那麽制度设计的目标便无法成为均衡 结果.如果制度设计反而奖励违反游戏规则的个体,惩罚遵守游戏规则的个体,这是制度 鼓励人们违法.虽然我们鼓励好事发生,但好事未必是纳许均衡结果.我们应参考赛局论 的智慧,考量个体的诱因与反应,慎选策略并有效率地利用资源,设计在市场经济中可运 行的制度,让更多的好事得以实现成为均衡结果. 全华数学专刊-2012-第5期.indd
4 2014/2/27 下午 01:49:56