您当前的位置:首页 > 教育百科 > 百科

什么是博弈论和纳什均衡?

时间:2022-05-17 13:11:09  来源:  作者:陈熔

纳什均衡(Nash Equilibrium):在非合作类博弈中,存在一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。

上面那段话值得仿佛阅读体会,在看完例子后可以再多读几遍上面这段话。

具体例子如下:囚徒困境、智猪博弈、范式博弈、饿狮博弈、硬币正反博弈。

囚犯的困境

假设有两个小偷A和B联手闯入民宅盗窃被抓,警方将两人置于不同的房间进行审讯,并给出如下政策:如果一个犯罪嫌疑人坦白并交出了赃物,两人都会被判有罪。如果另一个犯罪嫌疑人也坦白,则两人各被判刑8年;如果另一个犯罪嫌人抵赖,再加刑2年,而坦白者有功,会被立即释放。如果两人都抵赖,偷窃罪证据不足,但会因私入民宅而各判入狱1年。即:

什么是博弈论和纳什均衡?

 

表中的数字表示A,B各自的判刑结果。博弈论分析中一般都用这样的表来表示。

此时有人会觉得双方都抵赖就好了,但问题是双方被隔离,都会怀疑对方会出卖自己以求自保。

两个人都会怎么想?

假如对方坦白,此时如果我抵赖得坐10年监狱,如果我坦白才坐8年监狱;假如对方抵赖,此时如果我也抵赖会被判1年,如果我坦白可以被释放。综合以上考虑,不管对方坦白与否,对我而言都是坦白比较划算。此时最后的“纳什均衡”只能是两个人都坦白,共同被判8年刑期。

智猪博弈

猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。但当小猪踩踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;大猪踩动了踏板,则有机会在小猪吃完落下的食物之前跑到食槽,争取吃到另一半食物。

那么,两只猪各会采取什么策略?

当然是小猪等在食槽边,而大猪不知疲倦地奔忙于踏板和食槽之间。因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪不会去踩动踏板,自己亲自去踩踏板还有点吃的,总比不踩强,所以只好去踩踏板。

范式博弈

GOO公司和SAM公司存在利益关系,二者的收益会随着博弈的变化而不断更替。如下图:

什么是博弈论和纳什均衡?

 

双方各有两个可选策略“合作”与“背叛”,格中的四组数据表示四个博弈结局的各自收益,。每组数据的第一个数字表示GOO公司的收益,后一个数字表示SAM公司的收益。

现在我们站在GOO公司的角度来思考整个博弈策略。假如SAM选择合作,那么我方合作的收益是3,而我方背叛的收益是5,我方应该选择背叛;假如SAM选择背叛,那么我方合作的收益是 -3,而我方背叛的收益是-1,我方还是应该选择背叛。

同理,SAM公司也会做出相同的选择。最后我们发现,本次博弈的双方都采取了背叛策略,各自的收益都为-1,这是一个比较糟糕的结局,尽管对任何一方来说都不是最糟糕的那种。

但博弈的次数往往不止一次,当二家公司经历了多次背叛策略的博弈之后,发现公式上还有一个(3,3)收益的双赢局面,这个结果显然要好很多,因此二家公司在之后的博弈过程中必然会尝试互建信任,从而驱使双方都选择合作策略。

但假使双方都知道博弈次数是有限的,也许下一次博弈就是最后一次,那么为了避免对方在最后一轮博弈中选择背叛而使我方遭受-3的损失,于是双方都会采取了背叛策略,最后的博弈结果又回到了(-1,-1)。

由此可见,随着次数的变化,博弈的性质也会发生变化,纳什均衡点会发生变化。

饿狮博弈

假设有A、B、C、D、E、F六只狮子(强弱从左到右依次排序)和一只绵羊。假设A吃掉绵羊后就会打盹,这时比A稍弱的B就会趁机吃掉A,接着B也会打盹,然后比B稍弱的C就会吃掉B,以此类推。问:狮子A敢不敢吃绵羊?

该题须采用逆向分析法,从最弱的F开始分析,依次前推。假设E睡着了,F肯定会吃掉E,因为在F的后面已没有其它狮子了,不用担心自己被吃掉。继续前推,既然E知道自己睡着会被F吃掉,那么E必然不敢吃睡着了的D。既然E不敢吃掉D,那么D则可以放心去吃睡着的C。依次前推,得出C不吃,B吃,A不吃。所以答案是狮子A不敢吃掉绵羊。

什么是博弈论和纳什均衡?

 

但是,如果我们在狮子F的后面增加了一只狮子G,总数变成7只,用逆向分析法按照上题步骤再推一次,如下图。这次的答案变成了狮子A敢吃掉绵羊。

什么是博弈论和纳什均衡?

 

对比两次博弈我们发现,狮子A敢不敢吃绵羊取决于狮子总数的奇偶性:当总数为奇数时,A敢吃;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果形成了两个稳定的纳什均衡点。

硬币正反博弈

假如你和一个美女一起玩个数学游戏。美女提议:让我们各自亮出硬币的一面,如果我们都是正面,那么我给你3元;如果我们都是反面,我给你1元;剩下的情况你给我2元。那么你该不该和这位美女玩这个游戏呢?

这里需要讲一下纳什均衡的分类:

(1)纯战略纳什均衡,也就是说玩家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少。

(2)混合战略纳什均衡,是对每个纯战略分配一个机率而形成的战略。混合战略允许玩家随机选择一个纯战略。混合战略纳什均衡中要用概率计算,达到某一概率时,可以实现支付最优。因为概率是连续的,所以即使战略集合是有限的,也会有无限多个混合战略。

在这个游戏中,应该采用混合策略纳什均衡。

假设我们出正面的概率是x,出反面的概率是1-x,美女出正面的概率是y,出反面的概率是1-y。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,即:

3x + (-2)(1-x) = (-2) * x + 1*(1-x )

解方程得x=3/8;

同样,美女的收益:-3y + 2(1-y) = 2y+ (-1) * (1-y),

解方程同样得y等于3/8。

于是,我们就可以算美女每次的期望收益是:(1-y) * (2x-(1-x)) + y(-3x+2(1-x)) = 1/8元,即双方都采取最优策略的情况下,美女平均每次赢1/8元。

所以当然不能和她玩这个游戏。其实只要美女采取了(3/8, 5/8)这个方案,不论你采用什么方案,都是不能改变局面的。

但是当你也采用最佳策略时,至少可以保证自己输得最少。否则,你会赔掉更多。



Tags:博弈论   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
算法提高:博弈论 | 最小最大问题
博弈论是二人或多人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜目标的理论。博弈论是研究互动决策的理论。博弈可以分析自己与对手的利弊关系,从而确立自...【详细内容】
2023-08-18  Search: 博弈论  点击:(187)  评论:(0)  加入收藏
什么是博弈论和纳什均衡?
纳什均衡(Nash Equilibrium):在非合作类博弈中,存在一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何...【详细内容】
2022-05-17  Search: 博弈论  点击:(442)  评论:(0)  加入收藏
▌简易百科推荐
锻炼记忆力的最佳方法你知道吗?
每一位家长都期盼着自己的孩子能拥有超凡的记忆力,因为那如同坚实的基石,为学习之路铺设坦途,更是未来取得辉煌成就的重要密钥。然而,锻炼记忆力的最佳方法有哪些呢?今天,就让我...【详细内容】
2024-03-19  莎莎de笔记    Tags:记忆力   点击:(17)  评论:(0)  加入收藏
“不懂编程就是文盲”?别用焦虑论调裹挟家长
据3月17日中新网报道,随着科技的发展和社会的进步,科创教育逐渐走入千家万户,少儿编程作为代表,近年来更是备受瞩目。然而,“未来的文盲,就是不懂编程的人”的论调也甚嚣尘上。必...【详细内容】
2024-03-19    工人日报  Tags:编程   点击:(13)  评论:(0)  加入收藏
什么样的孩子才能成为大科学家?全国政协委员倪闽景解答
今天(3月10日)上午,全国政协十四届二次会议第三场“委员通道”在人民大会堂举行,全国政协委员、上海科技馆馆长倪闽景接受了记者采访。倪闽景介绍,拔尖创新人才有三个共同的特质,...【详细内容】
2024-03-13    中国日报  Tags:科学家   点击:(16)  评论:(0)  加入收藏
孩子教育,中国父母到底花了多少钱
2018-2019学年各学段家庭生均教育支出水平。受访者供图2018-2019学年各年级段家庭教育支出水平。受访者供图一个家庭把孩子从小培养到大学毕业要花多少钱?这恐怕是很多人一时...【详细内容】
2024-02-28    中国青年网  Tags:教育   点击:(35)  评论:(0)  加入收藏
利用压岁钱帮助孩子培养正确的金钱观
过完年,孩子的压岁钱该如何处理成了热门话题。媒体发起的一个关于“孩子压岁钱该如何处理”的问卷调查显示,近半数孩子的压岁钱完全由父母保管,而家长处理压岁钱的方式各不相同...【详细内容】
2024-02-27    北青网  Tags:金钱观   点击:(24)  评论:(0)  加入收藏
公务员考试有哪些科目和考试内容
公务员考试主要分为笔试和面试两个环节,其中笔试包括行测和申论,面试环节则主要考察仪表仪态和口头表达能力。笔试科目和内容如下: 行测:主要考察的是考生的言语理解、数量关系...【详细内容】
2024-02-26    简易百科  Tags:公务员   点击:(42)  评论:(0)  加入收藏
备战公务员考试:你需要准备什么?
首先,你需要看下自己是否能够参加考试。具体的说就是假如你考过了,能不能通过政审。如了解下亲属是否有犯罪记录、或是其他影响考试的情况,再一个就是看一下自己的档案里面是不...【详细内容】
2024-02-26  高考招考我来说    Tags:公务员考试   点击:(22)  评论:(0)  加入收藏
博士后是什么?
博士后是指获得博士学位后,在高等院校或研究机构从事科学研究工作的特殊职位。博士后通常是在完成博士学位后,继续在某个领域进行深入研究,同时接受导师的指导和帮助。博士后是...【详细内容】
2024-02-26  朗玛星座屋    Tags:博士后   点击:(49)  评论:(0)  加入收藏
考研英语要求:必须过几级才能顺利应试?详解考研英语等级要求
随着越来越多的学子选择考研作为深造的途径,考研英语作为研究生入学考试的重要组成部分,其难度和重要性不言而喻。不少考生在备考初期都会有一个疑问:“考研的话英语需要过几级...【详细内容】
2024-02-26  兰志强    Tags:考研英语   点击:(25)  评论:(0)  加入收藏
“博士”与“博士后”,到底谁是最高?
学历的重要性如今,随着我国高等教育的普及,大学生的数量逐渐增多,而学历在就业市场上的竞争力也越来越受到重视。学历越高,就越能让人高看一眼。因此,许多家长都希望子女能拥有更...【详细内容】
2024-02-26  炸毛的小狗豆豆    Tags:博士   点击:(28)  评论:(0)  加入收藏
相关文章
    无相关信息
站内最新
站内热门
站内头条