当前位置:首页 > 知识

萬維鋼《高手賽局》:混合策略是不怕被識破的陽謀,說到底,大家都是納許均衡的奴隸

文:萬維鋼

真正的萬維「詭道」是隨機性

首章論述過《三十六計》不可靠的原因,那《孫子兵法》如何呢?

《孫子兵法》確實是鋼高本實實在在的用兵戰略總結。但《孫子兵法》並不神祕,手賽識破它的局混思想,比如「知己知彼」、合策衡「國之大事」、怕被「多算勝,陽到底大家都納少算不勝」、謀說「君命有所不受」等,許均在今天看來都已經是奴隸常識性的認知。《孫子兵法》確實也包含了一些樸素的萬維賽局思想,比如「圍師必闕」,鋼高就是手賽識破在〈其身不正,雖令不從〉一文中提過的局混增加敵人的選項。

之所以說《孫子兵法》樸素,合策衡是因為現代賽局理論比它要高級得多。

比如《孫子兵法》中有這樣一段:「兵者,詭道也。故能而示之不能,用而示之不用……」它的意思很簡單,就是不能讓敵人知道你的戰術意圖,你要迷惑對手。

這個道理固然沒錯,但是「迷惑對手」這件事,得像這段敘述中所說的那樣,一直說反話嗎?

詭道的悖論

我上中學的時候喜歡踢足球,是一名守門員。雖然我的技術不怎麼樣,但是我知道一些理論:罰踢點球(在罰球點將球往前踢出)的時候,球到達球門只需要不到○.三秒,守門員不可能在這麼短的時間內反應過來,所以只能事先賭一個方向。

點球,是守門員和球員之間的賽局。我還聽說,守門員可以透過球員的眼神判斷他射門的方向。

有一次踢球,我們隊被判了點球。罰球的那名球員是什麼長相、這顆球最後被踢向了哪裡、有沒有罰進,我都忘了,但我清楚記得他的眼神。他的眼睛不停地瞄我右側的方向。按理說他是想朝右邊踢,可是我突然多想了一步。

我知道守門員應該看眼神來判斷方向,那他是不是也知道?他會不會是故意往右邊看,實際上是想往左邊踢呢?又或者說,他會不會也料我能想到他的詭計,然後將計就計,還是會往右邊踢呢?

我參加了一次真正的賽局。罰踢點球是一個可以欺騙對手的遊戲。這種賽局也是賽局理論的鼻祖,馮紐曼當年研究的東西,不過他研究的是打撲克牌。

在德州撲克中,最基本的操作是如果手裡的牌好,就應該加注;如果牌不好,就應該蓋牌退出。但打牌這麼老實可不行。當對手一看你加注,就知道你手裡拿著好牌,他就不會跟了,這樣你怎麼能贏很多錢呢?所以,必須迷惑對手才行。

打牌,一定要善於虛張聲勢。中文大概叫「詐」,英文術語叫「Bluff」。有時候你手中的牌明明不好,也要假裝牌好,選擇加注。可能對手被你嚇住,就不跟了,這樣你就贏了。但更重要的是,要讓對手知道你在牌不好的情況下也會加注,他才會不知道你加注是代表牌好還是牌不好,他也才可能在你因為牌好加注的時候跟著加注。所以即使你的牌特別好,有時候也要假裝牌一般,謹慎地加個小注。

想往左邊踢,就故意往右邊看;明明不能,但是讓對手以為你能——這不就是「能而示之不能」的《孫子兵法》嗎?

但是馮紐曼比《孫子兵法》多了一個洞見。馮紐曼說,你既不能有好牌就加注,也不能有壞牌就加注。你既不能往左邊踢就往左邊看,也不能往左邊踢就往右邊看。只說謊話就等於只說實話,對手只要反著聽就行了。

馮紐曼說,想要真的迷惑對手,必須把謊話和實話混合起來。

混合策略

先前提到的各種賽局,好比納許均衡,你最終只能選擇確定的一招,這種情況叫作「純策略」(Pure Strategies)。

但思考一下點球賽局。當球員往守門員的左側踢,守門員也往左側撲,這個局面是納許均衡嗎?顯然不是。在這種情況下,球員會想改變策略而往右側踢。同樣的道理,如果球員往左側踢,守門員往右側撲,球員又會想要改變策略。無論是哪一種組合,攻守雙方總有一個人想要單方面改變自己的策略,所以點球賽局中沒有納許均衡。嚴格地說,是「沒有純策略的納許均衡」。

因為沒有純策略的納許均衡,所以賽局理論不能告訴球員應該怎麼踢才能踢進。但是,如果球員要罰踢很多次點球,賽局理論可以提供他一個指導,讓他用一個系統取勝。這個系統是「混合策略」(Mixed Strategies)。

所謂混合策略,就是不能老往同一個方向踢,應該按照一定的機率,有時候往左踢,有時候往右踢。

你可能會認為,這不是顯然如此嗎?還用得著賽局理論?注意了,這裡面有個大學問——應該以多少機率往左踢,以多少機率往右踢呢?

假設球員向守門員的左側踢,有時候容易踢偏,導致他更喜歡往右踢。那他能不能以一半的機率往右踢,一半的機率往左踢呢?不行。如果他這麼踢,守門員就會堅決撲向右側,因為左邊更值得交給運氣。按照這樣的踢法,雖然球員的每一腳都不可預測,但是他有個非常明顯的統計趨勢可以被對手利用。

正確的策略應該是:球員首先要知道自己向左踢和向右踢進球的機率分別是多少,然後合理搭配向左踢和向右踢的機率,以至於讓守門員不管是撲向左邊還是右邊,進球的機率都一樣。

也就是說,球員的混合機率選擇,應該把對手能得到的最大報償最小化。在這種情況下,因為守門員向左撲或向右撲都一樣,他就沒有什麼確定的好辦法。馮紐曼證明,這是對球員最有利的混合策略。這個結論,叫作「最小最大值定理」(Minimax Theorem)。

這是賽局理論的一個基本定理,它涉及非常複雜的數學,在此就不細說了,但是這個精神是容易理解的。

第一,要按照一定的機率,混合自己的打法。


分享到:

京ICP备19007577号-5