憑什么,好人要有好報(bào)?
“要做一個(gè)好人”,這是我的一個(gè)信念。所謂信念,是指導(dǎo)生活的最高準(zhǔn)則。
這個(gè)信念是怎么來(lái)的呢?閉上眼睛往回追溯的話,應(yīng)該是父母教給我的吧?!耙獙?duì)別人好,要大方,不要傷害別人?!边@些縈繞耳邊的話語(yǔ),傳達(dá)的是父母的生存之道。
高中階段,接觸到達(dá)爾文的生物進(jìn)化論,思維開(kāi)始有一點(diǎn)混亂:如果生物為了有限的食物和生存空間不斷斗爭(zhēng),適者生存下來(lái)并繁殖后代,不適應(yīng)環(huán)境的則被淘汰,那生存下來(lái)的生命應(yīng)該是極端自私的,對(duì)苦難無(wú)情的冷漠,殘忍的損人利己。
任何具有利他動(dòng)機(jī),為了幫助別人而犧牲自己的人,應(yīng)該不會(huì)在這個(gè)世界存在太久。在生物一代代繁衍的過(guò)程中,無(wú)私的好人數(shù)量會(huì)越來(lái)越少,自私的壞人數(shù)量會(huì)越來(lái)越多。
那為什么,父母希望我做一個(gè)好人?或者說(shuō),自詡是好人的父母是怎么生存下來(lái)的?
如果一個(gè)公司告訴我,要做一個(gè)好人,我可能會(huì)懷疑這個(gè)公司的動(dòng)機(jī)。我怕這公司的壞人,憋著勁教我學(xué)好,是方便他們使壞??晌覜](méi)法用這樣的理由去懷疑我的父母,畢竟他們的基因還要靠我這個(gè)獨(dú)生子傳遞下去。
所以,一定有什么原因,讓好人還活在世上。
我想知道的這個(gè)答案,33年前,美國(guó)政治學(xué)教授阿克塞爾羅德也想知道。他從解決經(jīng)典的博弈論難題“囚徒困境”入手,利用計(jì)算機(jī)程序,模擬出了代表好人的策略和代表壞人的策略。
在好人和壞人共存的時(shí)期,好人得分獲得了領(lǐng)先;即使在一個(gè)都是壞人組成的社會(huì),一旦壞人嘗到合作的好處,壞人會(huì)轉(zhuǎn)變成好人并迅速擴(kuò)大好人群體。
羅教授的研究成果,寫(xiě)在了《合作的進(jìn)化》這本書(shū)里。首先,讓我們從介紹“囚徒困境”開(kāi)始。
“囚徒困境”是1950年美國(guó)蘭德公司擬定的理論。兩個(gè)同案犯被關(guān)進(jìn)監(jiān)獄,不能互相溝通情況。如果兩個(gè)人都不揭發(fā)對(duì)方,則由于證據(jù)不確定,每個(gè)人都坐牢一年;若一人揭發(fā),而另一人沉默,則揭發(fā)者因?yàn)榱⒐Χ⒓传@釋?zhuān)聊咭虿缓献鞫氇z十年;若互相揭發(fā),則因證據(jù)確實(shí),二者都判刑八年。
這種情況下,怎么做才是對(duì)自己最有利的呢?現(xiàn)在我和你處在這樣的局面下,你有兩種選擇,揭發(fā)或沉默;我也有兩種選擇,揭發(fā)或沉默。我們互相不知道對(duì)方選擇什么,只能把兩種情況都考慮進(jìn)去:假設(shè)你選擇揭發(fā),臥槽你簡(jiǎn)直不是人,說(shuō)好的兄弟情深呢?我沉默幫你擔(dān)責(zé)我是傻子,老子也揭發(fā);假設(shè)你選擇沉默,臥槽沒(méi)見(jiàn)過(guò)你這么傻的人,老子果斷選擇揭發(fā)賣(mài)隊(duì)友享受免罪。
可見(jiàn),無(wú)論你選擇什么,我最好的選擇都將是揭發(fā)。這也是槍?xiě)?zhàn)片中壞人活得長(zhǎng)好人死的快的重要原因。
如果只進(jìn)行一次”囚徒困境“的博弈,理智的雙方只會(huì)互相傷害,這樣的社會(huì)根本不會(huì)有好人存活的機(jī)會(huì)。幸運(yùn)的是,現(xiàn)實(shí)社會(huì)可以看成”囚徒困境“的重復(fù)博弈版本,一重復(fù),就像給好人開(kāi)了外掛。
為方便講訴,重新設(shè)置一種”囚徒困境“的情形:我和你是兩位玩家,手上各有”背叛“和”合作“兩張牌,我們互相不知道對(duì)方的出牌。銀行家充當(dāng)裁判,每一輪都根據(jù)我們的出牌結(jié)果給予我們金錢(qián),在無(wú)限次的輪數(shù)里,我們應(yīng)該從銀行家手里拿到盡可能多的錢(qián)。
結(jié)果1:
我們都選擇合作,銀行家給我們每人3分錢(qián)。
結(jié)果2:
我們都選擇背叛,銀行家給我們每人1分錢(qián)。
結(jié)果3:
你選擇合作,我選擇背叛,銀行家給我5分錢(qián),不給你錢(qián)。
結(jié)果4:
我選擇合作,你選擇背叛,銀行家給你5分錢(qián),不給我錢(qián)。
無(wú)限次的輪數(shù),有無(wú)數(shù)種背叛和合作的選擇。如果我們把背叛和合作的選擇稱(chēng)為策略,則有無(wú)數(shù)種策略。面對(duì)這種情況,我們自然會(huì)問(wèn)一個(gè)問(wèn)題,哪種策略最厲害,能贏得最多的錢(qián)?
實(shí)驗(yàn)開(kāi)始前,羅教授心里很怕,要是最壞最沒(méi)有人性的策略贏得最多的錢(qián),預(yù)示著我們這個(gè)世界會(huì)越來(lái)越像哥譚市,犯罪橫行,貪污腐敗,民不聊生,只能依靠一兩個(gè)超級(jí)英雄,比如蝙蝠俠給人們帶來(lái)一點(diǎn)微弱的希望。
為了回答這個(gè)問(wèn)題,羅教授設(shè)計(jì)了一場(chǎng)競(jìng)賽。他請(qǐng)世界各地的博弈論專(zhuān)家來(lái)提交策略,也就是設(shè)計(jì)一種出牌的規(guī)則,他把這些策略轉(zhuǎn)換成計(jì)算機(jī)語(yǔ)言,在電腦里進(jìn)行模擬演算。當(dāng)然不可能進(jìn)行無(wú)限次的演算,先算個(gè)兩百次吧,看看到底誰(shuí)厲害。
他一共收到了十四條精心設(shè)計(jì)的策略,再加上一條隨機(jī)策略,意思是每一步出背叛還是合作看心情,隨便出。任何一個(gè)策略,都和包括自己在內(nèi)的十五條策略一起比賽,看誰(shuí)贏得多。
理論上,200個(gè)回合,每個(gè)回合5分都拿全了,一場(chǎng)比賽最多贏1000分。和15個(gè)對(duì)手比下來(lái),最多拿到15000分。事實(shí)上,這是不可能的,沒(méi)有哪個(gè)策略會(huì)傻到每輪都信任你,讓你白白占便宜。現(xiàn)實(shí)一點(diǎn)的最好情況是,每輪兩個(gè)人都合作拿到3分,200輪一共拿到600分。
把每個(gè)策略經(jīng)歷的15場(chǎng)比賽得分統(tǒng)計(jì)下來(lái),名字為”一報(bào)還一報(bào)“的策略拿到了最高的平均分504分。這個(gè)策略最簡(jiǎn)單,看起來(lái)最不聰明,事前也并不被看好,它最終獲得了冠軍,跌破了羅教授眼鏡。
這個(gè)策略這樣出牌:在第一回合采取合作行動(dòng),然后在接下來(lái)的每一個(gè)步驟里,重復(fù)對(duì)手上一步的行動(dòng)。為了加深理解,我們來(lái)看看兩個(gè)”一報(bào)還一報(bào)“策略相遇競(jìng)賽的情形。
第一步,雙方都合作,都拿到3分,然后互相重復(fù)對(duì)手上一步的合作行動(dòng),每一輪雙方都拿到3分。200輪過(guò)去,雙方都獲得600分的最高分?jǐn)?shù)。
現(xiàn)在換一個(gè)對(duì)手,”老實(shí)人探測(cè)器“。這個(gè)策略會(huì)在每十步中任意選擇一步,打出惡意的”背叛“牌,拿到5分,”一報(bào)還一報(bào)“還是傻傻的打出”合作“牌,拿到0分。但在下一步,”一報(bào)還一報(bào)“馬上開(kāi)始報(bào)復(fù),打出”背叛“牌,而”老實(shí)人探測(cè)器“打出”合作“牌,拿到0分,兩輪雙方打平,各拿到2.5分。200輪結(jié)束后,雙方各得到590分。
如果遇到”總是背叛“呢?第一輪”總是背叛“拿到5分,之后”一報(bào)還一報(bào)“開(kāi)始報(bào)復(fù),雙方互相打出”背叛“,得到1分,一直持續(xù)到結(jié)束?!笨偸潜撑选澳玫?04分,”一報(bào)還一報(bào)“199分。
”一報(bào)還一報(bào)“在”總是背叛“身上損失的5分,在和其他策略競(jìng)賽的過(guò)程中輕易贏了回來(lái)。我們看到它可以拿到600分滿分,而”總是背叛“死的很慘。教授把所有這些得分加起來(lái),算出了一個(gè)結(jié)果。
分析結(jié)果可知:
這次競(jìng)賽中的15個(gè)策略,有8個(gè)屬于”善良“策略。這里的”善良“指的是那些從不首先背叛的策略。令人吃驚的是, 善良策略霸占了前八名的位置。最差的善良策略得到472分,而最高的惡意策略得到401分,與善良策略有很大的差距。
在善良策略里,決定名次高低的關(guān)鍵在于”寬容“。一個(gè)寬容的策略只有短期記憶,雖然它也采取報(bào)復(fù)行動(dòng),但它會(huì)很快遺忘對(duì)手的背叛,報(bào)復(fù)過(guò)后就到此為止,不再繼續(xù)記仇。
排名第7的善良策略Friedman,它絕不寬恕,即使對(duì)手悔改,它不愿意打破相互背叛的惡性循環(huán),因此無(wú)法取得較高的分?jǐn)?shù)。
這場(chǎng)競(jìng)賽表明,贏家策略具有兩個(gè)顯著特點(diǎn),善良與寬容。這很烏托邦,善良與寬容能得到好報(bào)。這讓我看到了一些好人有好報(bào)的希望。
且慢。會(huì)不會(huì)是因?yàn)檫@場(chǎng)競(jìng)賽只有15個(gè)策略,對(duì)手太少,善良策略領(lǐng)先只是因?yàn)檫\(yùn)氣好?羅教授有這樣的疑惑。
于是,他把這次競(jìng)賽的過(guò)程及結(jié)果還有分析原原本本公開(kāi),并請(qǐng)更多的專(zhuān)家來(lái)制定策略。這一次,有人專(zhuān)門(mén)制定了欺騙善良策略的惡意策略,期望靠偽裝得到高分。也有人試圖變得更加善良,制定了”兩報(bào)還一報(bào)“甚至”三報(bào)還一報(bào)“策略。
結(jié)果如何?還是”一報(bào)還一報(bào)“成為贏家,得到435分,更重要的是,善意的策略又一次贏了惡意的策略,前15名中只有一個(gè)惡意策略,而倒數(shù)15名中只有一個(gè)善意策略。
到這里,我們可以肯定的說(shuō),好人有好報(bào),并不是寄希望于上帝或者來(lái)世的一廂情愿,而是在這個(gè)自私自利的現(xiàn)實(shí)世界,理性人為了得到最大利益采取的必然步驟。
那么,得到好報(bào)的好人,能夠繁衍生存下去嗎?在這個(gè)壞人好人共存的世界,隨著世代更迭,是好人越來(lái)越多,還是壞人越來(lái)越多呢?羅教授帶著這個(gè)問(wèn)題進(jìn)行了第三次競(jìng)賽。
這次競(jìng)賽,稱(chēng)為生存之戰(zhàn)。
還是第二輪的63個(gè)策略,組成進(jìn)化演替的第一代。贏的人不再得到分?jǐn)?shù),而是得到與其完全相同的后代。世世代代如此傳遞,一些策略逐漸變得數(shù)目稀少,甚至完全絕跡,另一些策略則漸次增多。
最終在1000代以后,種群不再變化,穩(wěn)定的狀態(tài)形成。在這之前,各種策略的命運(yùn)起伏不定,”騙子“、”傻瓜“、”斤斤計(jì)較者“在200代之后徹底滅絕,剩下的策略都類(lèi)似于”一報(bào)還一報(bào)“,既善良又容易被煽動(dòng)報(bào)復(fù)。
答案揭曉:這個(gè)世界,好人”穩(wěn)定的“多于壞人。這并不是因?yàn)樾叛錾衩骰蜃駨哪撤N主義的結(jié)果,而是理性人出于自我利益最大化的必然選擇。
這里所說(shuō)的好人,不是傻好人,而是不首先背叛,及時(shí)反擊,寬容大度、行為清晰的綜合體。羅教授對(duì)此做了總結(jié):
這一場(chǎng)33年前的計(jì)算機(jī)策略競(jìng)賽,以及羅教授的分析,在今天看來(lái),我仍然感到深深的震撼。他堅(jiān)定了我們做好人的信心,也告訴了我們應(yīng)該做一個(gè)怎樣的好人。
不首先背叛,及時(shí)反擊,寬容大度、行為清晰這四大原則,是好人立身成圣的擎天之柱。第一條容易,后面三條我自覺(jué)差距還很大。但這不妨礙我們把這些簡(jiǎn)單的原則記錄下來(lái),奉為以后行動(dòng)的圭臬。
及時(shí)反擊是好人生存的基礎(chǔ),一個(gè)忍氣吞聲的爛好人沒(méi)人記得他的好,只記得他的軟弱。憤怒和生氣是我們維護(hù)邊界的有力武器。如何在反擊中掌握度,既表達(dá)憤怒又適時(shí)收手,讓位于寬容大度,那是下一篇文章的故事了。
聲明:本站內(nèi)容與配圖轉(zhuǎn)載于網(wǎng)絡(luò),我們不做任何商業(yè)用途,由于部分內(nèi)容無(wú)法與權(quán)利人取得聯(lián)系,稿費(fèi)領(lǐng)取與侵權(quán)刪除請(qǐng)聯(lián)系我們,聯(lián)系方式請(qǐng)點(diǎn)擊【侵權(quán)與稿費(fèi)】。
微信群
最新測(cè)試
1111 測(cè)試
立即測(cè)試
667 測(cè)試
立即測(cè)試
213 測(cè)試
立即測(cè)試
588 測(cè)試
免費(fèi)測(cè)試
323 測(cè)試
立即測(cè)試