善战者不争 用纳什均衡打破内卷困境,给竞争者提供博弈心法。

मूल वीडियो सामग्रीवीडियो बड़ा करें
  • 内卷的起源与博弈论的关联
  • 万元现金博弈的实验与分析
  • 合作与竞争的辩证关系
  • 内卷对社会现象的影响
  • 最优策略与纳什均衡的启示

内卷究竟是怎么来的?
玩个游戏您就明白了。明白请玩游戏如下:

我现在拿出一万块拍在桌子上,并宣布我要当众拍卖这一万元现金,起拍价100元,价高者得。但有个附加条件,那就是出价第二高的人也要向我实际支付他所出的价格。

现在问您两个问题:

  1. 这个游戏能不能参与?
  2. 如果能,您的最佳策略是什么?

这是一个全市非合作的“东太博弈”的扎新游戏,也是高校经济学课程的经典课堂实验。这个游戏的名字叫“万元现金博弈”。今天咱们就从这个游戏开始聊聊内卷、算计、合作、猜疑、黑暗森林、沉默成本以及纳什均衡。

本期视频涉及经济学、逻辑学以及博弈论的相关知识,内容略有难度,适合理性能力足够的人观看,请想听鸡血和鸡汤的客观自行回避。

回到开头那个游戏,先说答案:游戏可以玩且有最优解,这个咱们后面会揭晓。我盲猜肯定会有人说不玩,我害怕我出了100,有人出200,我就成冤大头了。那我再追问一句:如果别人都不玩,你玩不玩?

如果真是这样,拿100换1万,只有傻子才不玩。
但问题是,游戏中并没有禁止号称不玩的人出价,而人心又是彼此隔绝的。我甚至都不会去问“玩不玩”,这个问题直接开始交价。

假设每次出价的最小坚格为100元,不许交零头。那么只要有一个人出了100,肯定会有人愿意出200,因为他想赚9800的收益。紧接着就会有人愿意出300,因为他想赚9700,逐步如此往复,价格最终会来到9900元,因为10000减9900等于100,100也是白赚的。但此时会出现一个问题,再往上加就只能叫1万了,这意味着继续加价就没有收益了。

你猜,还会不会有人加价?如果你从一开始就没有参与交价,或者叫了几手就停了,那你肯定就不会交价了。但那个出9800的人可不这么想,此时他如果不出手,根据规则就要白白损失9800。如果交1万,虽然不赚钱,但也不赔钱。

各位请记住这个节点,这是个分水岭。事情由此开始失控。刚才那个叫9900的人,听到有人叫1万,不干了,心想这不是诚心捣乱吗。此时他面临两个选择:要么认灾,白白扔掉9900;要么继续加100,让游戏继续,以损失100为代价换取拿到1万的可能性。

虽然他知道对方仍然有可能继续加价,但是他已经停不下来了。高额的沉默成本让他退无可退,于是他咬着后槽牙喊出了那个让旁观者认为是疯了的数字1万零100。

然后,由于和上面相同的道理,这个游戏由大家参与的良性竞争,变成了两个人的恶性竞争。数字还会不断上涨,直到有一个人实在承受不住,甚至破产,才能算完。

聪明的你看到这,也就会说:如果从一开始就设立一个公守同盟,以最低的起拍价得到这1万元,不就行了吗?哪怕赚完9900再和所有参与的人去评分也行啊,那样不就大家共赢,谁也不吃亏了吗?

你不往上叫了,我怕还乱了。可是事情哪有你想的那么简单?刚才怎么说了,这个游戏经常被用作课堂实验,用于给经济学专业的学生解释沉默成本的意义。

当然,出于教学目的,标的往往不会设1万这么高,能说明道理就好了。但在统计了几百次实验结果后发现,最终绝大多数的拍卖收益普遍都会在标的实际价值的3-5倍这个区间波动。

而更万恶的收主意出自普林斯顿大学的经济学教授迪克希特,他让学生们用鼓掌的时间去竞价来赢得他手里的20美元。结果那个可怜的获胜者,为了区区20美元,足足鼓了4个半小时的掌,想必第二名也不慌,多半班的人当天手都肿了。

这个目标修改的游戏规则是:这个游戏由只收割前两名,变成了对于所有参与者沉默成本的通杀。

那么如果将这个博弈模型放到整个社会中去,会怎样呢?各位还记得咱们一开始在讨论什么吗?内卷,对,这就是内卷的远动力。它源于人心,源于自力、好胜、背叛冲动、不甘心和损失厌恶,这些直根在每个人身上的出厂设置。

大刘在三体里写过,宇宙是一座黑暗森林,美国文明都是戴枪的猎人。而这恰恰是这个游戏中难以破解的关键因素,由人心、格局的猜疑料,将所有人都变成了猎人和猎物的叠加态,贪婪和恐惧的叠加态。在猎杀对方的同时,也在被对方猎杀。

所以当这个博弈模型面向社会中不特定人群展开时,攻守同盟极难达成。首先,沟通成本巨大。在一个开放的竞争环境中,你不知道竞价者都有谁,更无法将攻守同盟的意愿有效传递给每一个参与者,并征得其同意。

其次,在不合作就能独揽竞价的诱惑面前,总会有人破坏计划。只要有一个人动了歪心思,想投机捞火中取利,也必然遭到其他参与者的恶性回击。于是这种类似于化学反应的反应必将迅速在所有参与者中蔓延开来,将场面倒向失控。内卷开始,每个参与者即使是内卷的受害者,同时也是推波助澜的帮凶。

而现实商业环境比课堂上的实验,往往更加残酷。不只收割出价第二的人,而是收割所有竞价者。直播间大场子们为争夺流量美元,越开越大,动作越扭,越过火。你穿余家裤,我玩大匹,差发福袋,打PK,回忆乐乎,看客们为博美人放心,不许刷出各种天价礼物,争当绑一大哥。

外面的培训机构卷失资,家长卷腰包,学生卷分数,最终双减一生命下,整个行业如同红燃倒塌。职场中,牛马们的福报成了996的遮羞布,企业用狼性文化让员工卷,业绩卷,工作时长卷。而当行业下行时,牛马们却纷纷都卷了,铺盖下沉到网约车和送外卖的战场,继续卷。

无处不在的内卷,让这个世界看起来像极了一个巨大的真人版网游。如果所有人都不课金,那么你也可以安心地做个免费玩家。但只要游戏中出现了课金玩家,平衡就会被打破。

此时你只有两个选择:要么付费跟进,保持自己在游戏中不处于劣势;要么变成付费玩家眼里的垫脚石,被别人玩,最后暗然退场。

经济学告诉我们,竞争有力发展人类社会,就是在竞争策动中不断繁荣的。但是竞争并不是没有底线的,此刻更不是杀敌八百自损一千的双输。

博弈论把这些东西进一步细化,为经济学提供了坚实的理论基础。那么,什么样的竞争是良性的,什么又是恶性的呢?分水岭在哪里?

各位回看上面的游戏,拆解一下就会发现里面有两个关键的节点。第一个是5000元。达到这个节点时,出现了整体收益的临界点。若有人不甘心,则只能出价5100元。那么总成本就变成了10100,总收益1万,净收益由此开始变为负数。也就是说,那个出价5100的人在这场竞争中获得的收益小于那个出5000的第二名的损失。从总体上来看,参与者的总付出大于总收益。

如果把所有竞价者看成一个整体,两个字总结:赔了。
但是整体虽然赔了,那个赢得竞价的个体此时还有收益。第二个节点则出现在一万元。此时如果想继续,就只能喊大于一万的数字。那样在这场游戏中,不但整体收益为负,而且没有任何一个竞价者获利,结果就是妥妥的双输。

所以我们把这个游戏分为三个阶段:
较价低于5000时叫可协商阶段。这个阶段内,损人利己理论上就有寻求合作解达成共赢的可能。
较价高于5000但低于一万时叫赢家通知阶段。这个阶段损人大于利己,没有合作解。
较价高于一万时叫恶性竞争阶段。这个最后产生损人不利己,属于双输的局面,也就是咱们通常语境下的内卷。

各位想过没有,这意味着什么呢?

首先我要说句违背大多数人常识的扎心的话:在所有非合作博弈中,损人利己是竞争的常态。只要较价,就会造成前一个较价人的损失。但是只要总体收益为正,就存在寻求合作解的空间。

什么意思呢?咱们用这个游戏说明一下。
在游戏的第一阶段,任何时候停止都可以,通过协商让所有参与者都没有损失。

比如,你看到对方叫了900,你去跟他说:哥们儿,一会我喊1000,你别继续加了。这样我赚了9000,你已经付出的那900我替你出,只要你按我说的做,我在额外给你加1000,这样咱俩就都有得赚。当然,对方也可能会说,那你干脆别叫了,我赢了给你2000。

到这里出现了一个神奇的现象,你俩争执的焦点已经悄然发生了变化:由怎么抢蛋糕,变成了怎么分蛋糕。万元陷阱博弈,此时在你俩之间就转换成了另一种博弈模型,叫“列举博弈”。由于篇幅关系,列举博弈的内容咱们在这就不展开了。各位只要记住一个结论就好:

列举博弈属于合作博弈的一种,而外援陷阱博弈则属于非合作博弈。这两种博弈有本质区别,但在某种情况下可以互相转化。当然,这种能够达成合作解的情况也有条件限制:人多了不行,因为你必须说服所有的参与者,而所有参与者又必须要彼此信任,避免有人背后开黑枪抢夺胜利果实。

成本会随着竞争人数成几何级数地增加。也就是说,参与者多了,团结补偿黄雀在后的猜疑,将导致信息不对称,使得合作解所需的交易费用过高,最终导致合作失去可能性。关于交易费用的含义以及寻求合作解的内容,感兴趣的朋友可以去看我主页中“柯斯定律”系列视频。

总之,人越多,心也就越散;被截胡的可能性越大,提防攻守同盟也越难形成。所以这种合作只会在竞争者数量很少、实力基本相当的时候,才可能发生。一般都是行业内两三个巨头,为了避免出现恶性竞争而采取的权益之计。

大家都还记得十年前的一桩事情吗?2015年,滴滴和优步为了抢占国内市场,竞争给出高额补贴,一度杀红了眼。根据彭博社测算,当时这场补贴大战如果进行下去,每年会让双方损失数十亿美元,无休止的死磕对双方都是灾难性的,最终理性让双方回到了谈判桌上。经过多轮秘密谈判,2016年滴滴收购了优步中国的业务,优步全球获得滴滴5.89%的股权,而滴滴创始人成为和优步时任CEO卡兰尼克还分别进入了对方公司的董事会。

所以各位,人类社会的确有一些竞争,要么赢家通吃,要么认输退场,但更多的竞争,其实还是有协调空间的。有些事,只要有理性和博弈,就没有必要真走到两败俱伤的那一步。

看懂上面内容的朋友,也许这时候会发问了:如果我无法和所有竞争者达成一致,又该怎么办呢?在各怀鬼胎、彼此算计的万元陷阱博弈中,有没有最优策略呢?

这个还真有,但要满足两个条件:一是你不能贪,二是你能抢占先机。在这里给大家普及一个博弈论中的重要概念——先动优势。在各种动态博弈模型中,由于大家是轮流出招的,在某些博弈类型中,先出招的一方具有天然优势,我们管这种情况叫“具有先动优势”。

比如围棋或者象棋中,先行棋的一方都会占有一定的优势。围棋靠天母去平衡,而象棋则靠双方轮流打红棋,尽量缩小先动优势造成的不公平。而万元陷阱博弈,就是一种典型的具有先动优势的博弈模型。

所以你的最佳策略就是第一个交加,叫多少呢?还记得我刚才说的要点吗?不要贪,更不能侥幸,直接叫9900。

这时候你会惊喜地发现,你成了那个全场最亮的瞄准手。你用你的行为向全场传达了你必得的决心和气势,同时也打消了所有人继续交加的动机。因为如果继续加价,只能加到1万了,那意味着无利可图,损人不利己,并且要承担被你报复的可能。而你作为第一个交加的人,你的行为没有造成任何人的损失,其他竞价者也就不存在报复性竞价的心理动因。

所以只要有先机,不贪,你就能稳稳锁定100块的收益。而这时第一个人直接交到9900,其他人放弃竞价,这个最优解的博弈论中有个名词叫“达到纳什均衡”。

什么意思呢?纳什均衡是指在一个非合作博弈中,所有参与者在已知其他参与者的策略前提下,自身策略为最优选择的状态,没有任何一方可以通过单方面改变策略来获得更高的收益。在这方面达到纳什均衡,作为一个结论来说,万元博弈陷阱有且只有一个纳什均衡点,这是博弈论告诉我们的冰冷事实。

然而这个直接出价9900的策略,又给了我们什么启示呢?我在给学生们讲这个模型时问过这个问题,得到了五花八门的答案。最多的回答是:不要贪,要懂得适可而止。

除此之外,那些十八九岁的年轻人还贡献了如下脑洞:
一、要善待对手,不要去做无畏的伤害行为;
二、要懂得正确的威慑,走对手的路,让对手无路可走;
三、生意就是生意,目的是逐利,而不是志气斗气,耽误挣钱;
四、沉默成本不应该成为未来决策的包袱;
五、可以损人利己,但要保证自己的收益大于对方的损失,并想办法给对方适当补偿;
六、要么不做,要么做绝;
七、内卷都是从温水煮青蛙开始的;
八、可以吃饭,但不能砸锅。

而印象最深的答案出自一个瘦小文弱的男生,他用带着江南口音的普通话说:“先动优势意味着机遇,而拿到机遇后能够正确操作是能力。”所以当机会出现时,你得好好把握,吃相要优雅,但态度要坚决。那样其他竞争者就会知难而退。

然后他顿了一下,又补了一句:“我就是这么追到我女朋友的。”全场轰堂大笑,还有人吹起了口哨。

对于上面这些回答,我没有评价,因为这本身就是个开放性的问题。每个人都基于自己的价值取向,有自己的理解,思考的过程有时比教条的标准答案更有价值。

而此刻,看视频的各位,本期内容又给了您什么不一样的思考呢?