美麗心靈
-從非合作均衡到合作均衡-

悲慘的命運
我好幾年前不知道什麽因緣,去看了美麗心靈A Beautiful Mind 這部電影.我記得很清楚,在看電影的時候,被劇情的悲傷所感染,而甚爲感動.這是一部真實的電影故事,John Forbes Nash Jr( 13. Juni 1928 in Bluefield, West Virginia)二十多歲就到普林斯頓大學寫博士論文,一開始他的數學天才並沒有得到教授們的認同,但他還是我行我素,沒有寄望別人對他的認可.他的朋友把他的理論觀點整理出來,後來Nash的非合作均衡理論成爲博弈理論的經典.當他得了教職,他卻陷入了一生最大的悲劇,他得了精神分裂症.他幻想情報人員跟蹤他,有人要謀殺他,於是他只能離開教職,進入精神醫院.在那裏他接受殘酷的電擊,過著悲慘,沒有未來的日子,他的妻子無微不至的照顧他,他卻也懷疑他的妻子,因爲Nash在精神分裂病症中.三十年後,Reinhard SeltenJohn Harsanyi兩位經濟學家,以John Nash的理論爲基礎,發展經濟理論,他們於1994 年共同得了諾貝爾獎.這個光榮的時刻,Nash擁抱著他的妻子Alicia Lardι,他們眼眶閃爍著這三十年來悲慘命運的淚水,一個美麗的心靈.現在我們來說Nash的非合作均衡理論,我們從他有名的兩嫌犯的兩難例子說起,而不解說他一般人難於理解的數學定義與公式.

嫌疑犯的兩難
有一天,一位富翁在家中被殺,財物被盜.警方在此案的偵破過程中,抓到兩個犯罪嫌疑人,並從他們的住處搜出被害人家中丟失的財物.但是,他們矢口否認曾殺過人,辯稱是先發現富翁被殺,然後只是順手牽羊偷了點兒東西.於是警方將兩人隔離,分別關在不同的房間進行審訊.由地方檢察官分別和每個人單獨談話.檢察官說,“由於你們的偷盜罪已有確鑿的證據,所以可以判你們一年刑期.但是,我可以和你做個交易.如果你單獨坦白殺人的罪行,我只判你三個月的監禁,但你的同夥要被判十年刑.如果你拒不坦白,而被同夥檢舉,那麽你就將被判十年刑,他只判三個月的監禁.但是,如果你們兩人都坦白交代,那麽,你們都要被判5年刑.嫌疑犯該怎麽辦呢?他們面臨著兩難的選擇——坦白或抵賴.顯然最好的策略是雙方都抵賴,結果是大家都只被判一年.但是由於兩人處於隔離的情況下無法串供.所以每一個人都是從利己的目的出發,他們選擇坦白交代是最佳策略.因爲坦白交代可以期望得到很短的監禁—3個月,但前提是同夥抵賴,顯然要比自己抵賴要坐10年牢好.這種策略是損人利己的策略.不僅如此,坦白還有更多的好處.如果對方坦白了而自己抵賴了,那自己就得坐10年牢.太不划算了!因此,在這種情況下還是應該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結局(被判1年刑)就不會出現.這樣兩人都選擇坦白的策略以及因此被判5年的結局被稱爲“納什均衡”,也叫非合作均衡.我們把這個故事的四種情況列成一個表,1表示爲了利己而承認,0表示不爲利己而否認,這個故事的本質是利己,還是不利己;不是承認,還是不承認.



狀況

我結果F(x)

我己利(1)或他利(0)

己利(1)或他利(0)

他結果H(x)

解釋

1

3個月

1

0

10

我承認就是我己利的算計,不與他人合作。他否認就是他利,他要與我合作的打算。結果我得利,他吃虧,是爲非合作的不均衡。

2

5

1

1

5

我承認就是我己利的算計,不與他人合作。他承認就是他的自利,他不要與我合作的打算。結果兩者都得利與不得利,是爲非合作的均衡亦稱sash不均衡

3

1

0

0

1

我否認就是我他利的算計,要與他人合作。他否認就是他的他利,他要與我合作的打算。結果兩者都得利,是爲合作的均衡

4

10

0

1

3個月

我否認就是我他利的算計,要與他人合作。他承認就是他的自利,他不要與我合作的打算。結果他得利,是爲我合作的不均衡。

納什均衡
不合作均衡,主要的意思是說,當人彼此沒有溝通的時候(比如兩個嫌疑犯沒有串供的機會),由於人是自私的,他們只會選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益,沒有溝通,只考慮自己的利益,這叫非合作.不合作的選擇,有可能只有我得到好處,而對手吃虧,這叫非合作的不均衡,比如上例的第一種狀況.但非合作的條件,最後將導致我與對手都沒有得到最好的好處,這叫非合作均衡.這是納什非合作均衡的精髓:當兩者不合作,只考慮自己的利益,到頭來兩者都一樣沒有得到好處.
如果兩者事先有溝通,而我首先替對方著想時,或者相互合謀(串供)時,我的這種選擇稱爲合作的選擇,而我採取這種合作的選擇,當對方不採取合作的選擇,我將變成最大的吃虧者,這叫合作的不平衡,如上面的的第四種狀況.如果我採取合作的選擇,而對方也採取合作的選擇,那兩者都將獲最大好處,這叫合作的均衡,這是納什均衡的精髓.納什均衡理論的結論是:當兩者不合作,只考慮自己的利益,到頭來兩者都一樣沒有得到好處.當兩者溝通合作,兩者都將獲最大好處.
這個數學的結論,最早被用在經濟學的競爭上面,後來也被推廣到政治上的運用,它也可以用在個人的處世爲人態度上面.我們舉一些例子來說面它,利害與得失,然後我們由利害關係,再延伸到真假與美感的價值.

歐洲共同體
歐洲共同體是納什理論,合作均衡的很好例子,是上面第三種情況的好例子.歐洲共同體的國家,爲著自己的利益,也想到別人利益,彼此溝通,然後大家都得到好處.歐洲共同體是怎麽做到的?首先所有共同體的成員,大家都是自願不強迫的.大家都是平等對等的.彼此的意見互相尊重.大家想到自己的利益,也想到別國家的利益.

西藏與中國
西藏與中國的關係是上面第四種情況的關係.是合作不平衡的關係.達賴想到中國的利益而放棄西藏獨立,達賴想合作而達到文化與宗教的高度自治.但中國無須考慮西藏的要求,結果只能西藏吃虧,兩者只是合作不平衡的關係.上面第四種情況的合作不平衡關係,站在中國的立場,就是第一種的不合作不平衡的關係.結果一樣,只是立場合作或不合作而已.爲何會有立場的不一樣,因爲西藏已被統治了,如果西藏沒有被實質的統治,就不會完全吃虧,中國或許也會考慮西藏的自治,或一國兩制.


臺灣與中國
臺灣與中國現在兩邊首先想到的,只有自己本身的利益.目前他們的關係不是第三種的關係,就是他們不是合作的關係.或許那一天臺灣領導人放棄自己的利益,放棄臺灣主權而與中國合作.那兩邊的關係,便會由目前的關係變爲如西藏一樣的第四種關係,而中國對臺灣也就會變成第一種關係.現在中國坐下來談的首要條件是要求臺灣首先放棄主權國格不是無條件的對等對談失去臺灣主權是臺灣願意的嗎?這是中國人努力的方向.
或許那一天中國領導人放棄自己的利益,而與臺灣合作.那兩邊的關係,就會變爲像歐洲共同體的關係,兩個獨立的國家,但又是共同的合作關係,爲何歐洲共同體能,而中國與臺灣不能?爲何不能像歐盟一樣,己所欲而施予人尊重對方有對等的人格,尊重對方的看法?因爲中國與臺灣的文化與思維,都還未經過成熟的啓蒙(在日本稱爲維新)與民主,不習慣尊重別人的看法,強加自己的欲願於別人.
現在中國與臺灣是處在上面的第二種情況的關係,即當兩者不合作,只考慮自己的利益,到頭來兩者都一樣沒有得到好處.

家庭的合作均衡
我爲自己的利益,也爲妻子與子女的利益著想,家庭有溝通,是爲合作的均衡關係,大家都有好處.我只爲自己著想,妻也只爲自己著想,是爲不合作的均衡,大家都沒得到好處.我只爲自己著想,不爲妻著想,妻爲自己也爲我著想,是爲不合作的不均衡,我得利,妻吃虧.相反的,是爲合作的不均衡,妻得利,我吃虧.最理想的情況爲:有溝通的合作均衡關係.家庭的合作均衡關係,也可用在朋友,與周圍的人群之間.

道德真實與美感
上面談的納什均衡理論,主要是以利害考量爲重心,兩嫌疑犯選擇的只是利害,不是良心,更不是真實與真理.利害與良心存在著矛盾與互補的關係,這在康得的實踐理性批判裏有精闢的論述,這裏不再贅述.除了道德的選擇,還存在著真實與真理的問題,而且還有連接道德與真實真理的美感問題,我們在陰陽學的其他文章多有論述,這裏不重復.我們只是點出利害的選擇,在人類的思維裏是站在什麽位置.
(2007-10-30)