博弈论的经典案例 - 博弈及综合 我爱数学网-数学爱好者的家园-中国专业化的数学论坛之一

我爱数学网-数学爱好者的家园-中国专业化的数学论坛之一

查看: 1101|回复: 2

[博弈论] 博弈论的经典案例

[复制链接]

264

主题

506

帖子

1万

积分

版主

Rank: 7Rank: 7Rank: 7

积分
15509

精华达人

QQ
发表于 2014-10-25 22:34:25 | 显示全部楼层 |阅读模式
博弈论:亦名对策论赛局理论,属应用数学的一个分支, 博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。  纳什均衡是美国经济学家约翰·纳什创立的一种博弈的经济理论也称为非合作博弈均衡. 给定你的策略,我的策略是我最好的策略,给定我的策略,你的策略也是你最好的策略,这是纳什均衡概念在两人博弈情况下最通俗直观的表达方式,这句简单的话描述了具有策略和利益相互依存和制约关系的人们之间常常出现的一种具有形式对称的局面。
1. “智猪博弈”(Pigs’payoffs)。
这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。
那么,两只猪各会采取什么策略?答案是:小猪将选择搭便车策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。
原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。
小猪躺着大猪跑的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。
如果改变一下核心指标,猪圈里还会出现同样的小猪躺着大猪跑的景象吗?试试看。
改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。
如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。
改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的共产主义社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
原版的智猪博弈故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝搭便车现象,就要看游戏规则的核心指标设置是否合适了。
比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于智猪博弈
增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的小猪也有),一度十分努力的大猪也不会有动力了----就象智猪博弈减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了搭便车现象,能实现有效的激励。
许多人并未读过智猪博弈的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙智猪博弈指标改变的个中道理。
2.“囚徒困境”

  囚徒困境是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
  在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。
  囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个"攻守同盟",但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。
3.斗鸡博弈

   两只斗鸡在决斗的时候,无论选择进或退都是一个难题,继续斗下去,两败俱伤,一方退却便意味着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。
    这类博弈也不胜枚举。如两人反向过同一独木桥,一般来说,必有一人选择后退。在该种博弈中,非理性、非理智的形象塑造往往是一种可选择的策略运用。如那种看上去不把自己的生命当回事的人,或者看上去有点醉醺醺、傻乎乎的人,往往能逼退独木桥上的另一人。还有夫妻争吵也常常是一个斗鸡博弈,吵到最后,一般地,总有一方对于对方的唠叨、责骂装聋作哑,或者干脆妻子回娘家去冷却怒火。冷战期间,美苏两大军事集团的争斗也是一种斗鸡博弈。在企业经营方面,在市场容量有限的条件下,一家企业投资了某一项目,另一家企业便会放弃对该项目的觊觎。

4. 田忌赛马

田忌和齐王赛马,他们的马都分为上中下三等,但是田忌的每一等的马都和齐王的马实力上有所差距,所以他就想了个办法,用他的上等马对齐王的中等马,用自己的中等马对齐王的下等马,用自己的下等马对齐王的上等马,这样,田忌就32胜,获得和齐王赛马的胜利。
田忌赛马的故事,几乎路人皆知,从中得到提示如下:
一是劣势中找到优势。世上不是没有好马,只是缺少伯乐;相信自己总有自己独到的优势所在。
二是学会取舍。什么都想得到,往往什么都得不到,舍掉小我成就大我是上策。
三是以己之长攻敌之短。
四是先谋后战。谋略在先事半功倍,焉有不胜之理。
五是在局部,从没有以弱胜强,实力永远是取胜的基础;
六是了解对手,隐藏自己。过多过早的暴露自己已失先机,只能被动挨打,知己知彼,隐藏自己,才能百战不殆!

回复

使用道具 举报

50

主题

1955

帖子

3568

积分

高中二年级

Rank: 5Rank: 5Rank: 5

积分
3568

活跃会员灌水之王最佳新人

发表于 2015-3-17 17:44:16 | 显示全部楼层
学习。
回复

使用道具 举报

0

主题

71

帖子

270

积分

小学二年级

Rank: 2Rank: 2

积分
270
发表于 2015-11-18 16:49:27 | 显示全部楼层
z;'[
]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 会员注册

本版积分规则

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc

关于我们 | 网站地图 | 我爱数学网 ( 沪ICP备16005585号-3  

GMT+8, 2019-9-23 12:47 征信网

快速回复 返回顶部 返回列表