“草雞博弈”是供魯莽的青少年玩的游戲。兩輛賽車朝懸崖邊奔去;后摔出來的司機是贏家?!矮C鹿”是一群獵手面對的難題,他們必須合作才能把鹿殺死,如果沒有人合作的話,那么開小差各自去攆兔子會更好些。他們是在賭合作(高回報)還是背叛(低,但是肯定有回報)嗎?“僵局”是挺無聊的游戲,彼此背叛收益最高。最后一個“囚徒困境”最有啟發(fā)性,在1960年代末成為兩百多例社會心理學實驗的測試模型。
“囚徒困境”是由蘭德公司的梅里爾?弗勒德[1]于1950年設計出來的。游戲中,兩個分別關押的囚犯必須獨立決定否認還是坦白罪行。如果兩人都認罪,那么兩人都會受到懲罰。如果兩人都否認的話,則都會被無罪釋放。但假如只有一人認罪,那么他就會得到獎勵,而另一個則受到懲罰。合作有回報,但如果策略奏效的話,背叛也有回報。你該怎么辦呢?
如果只玩一次,背叛對手是最合理的選擇。但當兩個“囚徒”一次又一次地玩,從中相互學習——也即“重復的囚徒困境”——游戲的推演就發(fā)生了變化。你不能無視對手玩家的存在;不論是作為強制的敵手還是同伙,他都必須受到重視。這種緊密相連的共同命運與政敵之間、生意對手之間或者生態(tài)共生體之間的共同進化關系非常類似。隨著對這個簡單游戲的研究的進一步深入,問題變成了:要想在長期內取得高分,面對“重復的囚徒困境”應該采取什么樣的策略?還有,同無情或友善的各類玩家對壘時,該采取什么樣的策略更容易取得成功呢?
1980年,密歇根大學政治學教授羅伯特?阿克塞爾羅德[2]組織了一次錦標賽,征集了14條不同的用于“囚徒困境”的對策,以循環(huán)賽的形式看哪個對策最后勝出。最后獲勝的是一個最簡單的對策,叫做“一報還一報”,由心理學家阿納托爾?拉普伯特[3]設計。“一報還一報”是往復型策略,它以合作回報合作,以背叛回報背叛,往往產生一輪輪合作的周期。阿克塞爾羅德發(fā)現(xiàn),重復游戲能產生一次性游戲所不具備的“未來陰影”之效果,這種效果鼓勵合作,因為對玩家來說,用現(xiàn)在對他人予以的合作來換取今后他人給予的合作是一個合理的選擇。合作的閃現(xiàn)使阿克塞爾羅德陷入沉思:“沒有中央集權的自我主義世界需要具備什么條件才能涌現(xiàn)出合作的行為?”
1651年,托馬斯?霍布斯[4]宣稱:只有在善意的中央集權幫助下才能產生合作。這一傳統(tǒng)政治推論曾經在幾個世紀里一直被奉為圭臬?;舨妓箶嘌?,沒有自上而下的管理,就只會有群體自私。不管經濟體制如何,必須有強大的勢力來推行政治利他主義。然而,在美國獨立和法國革命后逐步建立起來的西方民主制度表明,民意通達的社會可以在沒有中央集權強力干預的情況下發(fā)展合作機制。個人利益也能孕育出合作。在后工業(yè)化經濟里,自發(fā)合作是常有的事情。被廣泛采用的工業(yè)標準(既有質量方面的,也有協(xié)議方面的,如 110伏電壓,還有ASCII碼),以及因特網這個世界上最大的無政府形態(tài)的興起,都使得人們更加關注孕育共同進化合作所需的必要條件。
這種合作不是新時代的精神至上主義。相反,如阿克塞爾羅德所說,這是一種“不講交情、無需遠見的合作”——是大自然的冷規(guī)則,適用于許多層面,并催生了自組織結構。不管你愿不愿意,多少都得合作。
“囚徒困境”這類游戲,不單只人類,任何自適應個體都可以玩。細菌,犰狳,或是計算機里的半導體器件,都可以根據(jù)各種回報機制,在眼前的穩(wěn)妥收獲與未來的高風險高回報之間做出權衡。當長時間與相同的伙伴一起玩這個游戲時,雙方既是在博弈,又是在進行某種類型的共同進化。
· [1] 梅里爾?弗勒德(Merrill Flood,1912~):1935年在內布拉斯加大學獲數(shù)論碩士學位,同年獲普林斯頓大學哲學博士學位。曾在普林斯頓大學、美國陸軍部、蘭德公司、哥倫比亞大學、密歇根大學、加利福尼亞大學等處任職,曾任美國管理科學學會會長、美國運籌學學會會長,以及工業(yè)管理工程師協(xié)會副會長?!g自“維基百科”
· [2] 羅伯特?阿克塞爾羅德(Robert Axelrod):密歇根大學政治學與公共政策教授,美國科學院院士,著名的行為分析及博弈論專家。
· [3] 阿納托爾?拉普伯特(Anatol Rapoport,1911.05.22~2007.01.20):出生在俄羅斯的美籍猶太裔數(shù)學家和心理學家。主要貢獻有統(tǒng)攝系統(tǒng)理論、數(shù)學生物學、社會相互影響的數(shù)學模式,以及隨機感應模型。
· [4] 托馬斯?霍布斯(Thomas Hobbes,1588~1697):英國政治學家、哲學家。英國理性主義傳統(tǒng)的奠基人。