納什均衡能理解為博弈論左上角的方塊嗎

2023-01-08 17:50:37 字數 5899 閱讀 6284

1樓:

2023年和2023年納什的兩篇關於非合作博弈論的重要**,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,並證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經濟均衡的內在聯絡。

納什的研究奠定了現代非合作博弈論的基石,後來的博弈論研究基本上都沿著這條主線的。然而,納什天才的發現卻遭到馮·諾依曼的斷然否定,在此之前他還受到愛因斯坦的冷遇。但是骨子裡挑戰權威、藐視權威的本性,使納什堅持了自己的觀點,終成一代大師。

要不是30多年的嚴重精神病折磨,恐怕他早已 站在諾貝爾獎的領獎臺上了,而且也絕不會與其他人分享這一殊榮。

納什是一個非常天才的數學家,他的主要貢獻是1950至2023年在普林斯頓讀博士學位時做出的。然而,他的天才發現———非合作博弈的均衡,即「納什均衡」並不是一帆風順的。   2023年納什到普林斯頓大學讀數學系的博士。

那一年他還不到20歲。當時普林斯頓可謂人傑地靈,大師如雲。愛因斯坦、馮·諾依曼、列夫謝茨(數學系主任)、阿爾伯特·塔克、阿倫佐·切奇、哈羅德·庫恩、諾爾曼·斯蒂恩羅德、埃爾夫·福克斯……等全都在這裡。

博弈論主要是由馮·諾依曼(1903—1957)創所立的。他是一位出生於匈牙利的天才的數學家。他不僅創立了經濟博弈論,而且發明了計算機。

早在20世紀初,塞梅魯(zermelo)、鮑羅(borel)和馮·諾伊曼已經開始研究博弈的準確的數學表達,直到2023年,馮·諾依曼遇到經濟學家奧斯卡·摩根斯特恩(oskar morgenstern),並與其合作才使博弈論進入經濟學的廣闊領域。   1

944年他與奧斯卡·摩根斯特恩合著的鉅作《博弈論與經濟行為》出版,標誌著現代系統博弈理論的的初步形成。儘管對具有博弈性質的問題的研究可以追溯到19世紀甚至更早。例如,2023年古諾(cournot)簡單雙寡頭壟斷博弈;2023年伯特蘭和2023年艾奇沃奇思研究了兩個寡頭的產量與**壟斷;2000多年前中國著名軍事家孫武的後代孫臏利用博弈論方法幫助田忌賽馬取勝等等都屬於早期博弈論的萌芽,其特點是零星的,片斷的研究,帶有很大的偶然性,很不繫統。

馮·諾依曼和摩根斯特恩的《博弈論與經濟行為》一書中提出的標準型、擴充套件型和合作型博弈模型解的概念和分析方法,奠定了這門學科的理論基礎。合作型博弈在20世紀50年代達到了巔峰期。然而,諾依曼的博弈論的侷限性也日益暴露出來,由於它過於抽象,使應用範圍受到很大限制,在很長時間裡,人們對博弈論的研究知之甚少,只是少數數學家的專利,所以,影響力很有限。

正是在這個時候,非合作博弈———「納什均衡」應運而生了,它標誌著博弈論的新時代的開始!納什不是一個按部就班的學生,他經常曠課。據他的同學們回憶,他們根本想不起來曾經什麼時候和納什一起完完整整地上過一門必修課,但納什爭辯說,至少上過斯蒂恩羅德的代數拓撲學。

斯蒂恩羅德恰恰是這門學科的創立者,可是,沒上幾次課,納什就認定這門課不符合他的口味。於是,又走人了。然而,納什畢竟是一位英才天縱的非凡人物,他廣泛涉獵數學王國的每一個分支,如拓撲學、代數幾何學、邏輯學、博弈論等等,深深地為之著迷。

納什經常顯示出他與眾不同的自信和自負,充滿咄咄逼人的學術野心。2023年整個夏天納什都忙於應付緊張的考試,他的博弈論研究工作被迫中斷,他感到這是莫大的浪費。殊不知這種暫時的「放棄」,使原來模糊、雜亂和無緒的若干念頭,在潛意識的持續思考下,逐步形成一條清晰的脈絡,突然來了靈感!

這一年的10月,他驟感才思潮湧,夢筆生花。其中一個最耀眼的亮點就是日後被稱之為「納什均衡」的非合作博弈均衡的概念。納什的主要學術貢獻體現在2023年和2023年的兩篇**之中(包括一篇博士**)。

2023年他才把自己的研究成果寫成題為「非合作博弈」的長篇博士**,2023年11月刊登在美國全國科學院每月公報上,立即引起轟動。說起來這全靠師兄戴維·蓋爾之功,就在遭到馮·諾依曼貶低幾天之後,他遇到蓋爾,告訴他自己已經將馮·諾依曼的「最小最大原理」(minimax solution)推到非合作博弈領域,找到了普遍化的方法和均衡點。蓋爾聽得很認真,他終於意識到納什的思路比馮·諾伊曼的合作博弈的理論更能反映現實的情況,而對其嚴密優美的數學證明極為讚歎。

蓋爾建議他馬上整理出來發表,以免被別人捷足先登。納什這個初出茅廬的小子,根本不知道競爭的險惡,從未想過要這麼做。結果還是蓋爾充當了他的「經紀人」,代為起草致科學院的簡訊,系主任列夫謝茨則親自將文稿遞交給科學院。

納什寫的文章不多,就那麼幾篇,但已經足夠了,因為都是精品中的精品。這一點也是值得我們深思的。國內提一個教授,要求在「核心的刊物」上發表多少篇文章。

按照這個標準可能納什還不一定夠資格。   2023年諾貝爾經濟學獎得主莫爾里斯當牛津大學艾奇沃思經濟學講座教授時也沒有發表過什麼文章,特殊

的人才,必須有特殊的選拔辦法。

納什在上大學時就開始從事純數學的博弈論研究,2023年進入普林斯頓大學後更是如魚得水。20歲出頭已成為聞名世界的數學家。特別是在經濟博弈論領域,他做出了劃時代的貢獻,是繼馮·諾依曼之後最偉大的博弈論大師之一。

他提出的著名的納什均衡的概念在非合作博弈理論中起著核心的作用。後續的研究者對博弈論的貢獻,都是建立在這一概念之上的。由於納什均衡的提出和不斷完善為博弈論廣泛應用於經濟學、管理學、社會學、政治學、軍事科學等領域奠定了堅實的理論基礎。

囚犯的兩難處境   大理論中的小故事

要了解納什的貢獻,首先要知道什麼是非合作博弈問題。現在幾乎所有的博弈論教科書上都會講「囚犯的兩難處境」的例子,每本書上的例子都大同小異。

博弈論畢竟是數學,更確切地說是運籌學的一個分支,談經論道自然少不了數學語言,外行人看來只是一大堆數學公式。好在博弈論關心的是日常經濟生活問題,所以不能不食人間煙火。其實這一理論是從棋弈、撲克和戰爭等帶有競賽、對抗和決策性質的問題中借用的術語,聽上去有點玄奧,實際上卻具有重要現實意義。

博弈論大師看經濟社會問題猶如棋局,常常寓深刻道理於遊戲之中。所以,多從我們的日常生活中的凡人小事入手,以我們身邊的故事做例子,娓娓道來,並不乏味。話說有一天,一位富翁在家中被殺,財物被盜。

**在此案的偵破過程中,抓到兩個犯罪嫌疑人,斯卡爾菲絲和那庫爾斯,並從他們的住處搜出被害人家中丟失的財物。但是,他們矢口否認曾殺過人,辯稱是先發現富翁被殺,然後只是順手牽羊偷了點兒東西。於是**將兩人隔離,分別關在不同的房間進行審訊。

由地方檢察官分別和每個人單獨談話。檢察官說,「由於你們的偷盜罪已有確鑿的證據,所以可以判你們一年刑期。但是,我可以和你做個交易。

如果你單獨坦白殺人的罪行,我只判你三個月的監禁,但你的同夥要被判十年刑。如果你拒不坦白,而被同夥檢舉,那麼你就將被判十年刑,他只判三個月的監禁。但是,如果你們兩人都坦白交代,那麼,你們都要被判5年刑。

」斯卡爾菲絲和那庫爾斯該怎麼辦呢?他們面臨著兩難的選擇——坦白或抵賴。顯然最好的策略是雙方都抵賴,結果是大家都只被判一年。

但是由於兩人處於隔離的情況下無法串供。所以,按照亞當·斯密的理論,每一個人都是從利己的目的出發,他們選擇坦白交代是最佳策略。因為坦白交代可以期望得到很短的監禁———3個月,但前提是同夥抵賴,顯然要比自己抵賴要坐10年牢好。

這種策略是損人利己的策略。不僅如此,坦白還有更多的好處。如果對方坦白了而自己抵賴了,那自己就得坐10年牢。

太不划算了!因此,在這種情況下還是應該選擇坦白交代,即使兩人同時坦白,至多也只判5年,總比被判10年好吧。所以,兩人合理的選擇是坦白,原本對雙方都有利的策略(抵賴)和結局(被判1年刑)就不會出現。

這樣兩人都選擇坦白的策略以及因此被判5年的結局被稱為「納什均衡」,也叫非合作均衡。因為,每一方在選擇策略時都沒有「共謀」(串供),他們只是選擇對自己最有利的策略,而不考慮社會福利或任何其他對手的利益。也就是說,這種策略組合由所有局中人(也稱當事人、參與者)的最佳策略組合構成。

沒有人會主動改變自己的策略以便使自己獲得更大利益。「囚徒的兩難選擇」有著廣泛而深刻的意義。個人理性與集體理性的衝突,各人追求利己行為而導致的最終結局是一個「納什均衡」,也是對所有人都不利的結局。

他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監禁的結果。「納什均衡」首先對亞當·斯密的「看不見的手」的原理提出挑戰。

按照斯密的理論,在市場經濟中,每一個人都從利己的目的出發,而最終全社會達到利他的效果。不妨讓我們重溫一下這位經濟學聖人在《國富論》中的名言:「通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益。

」從「納什均衡」我們引出了「看不見的手」的原理的一個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。

從這個意義上說,「納什均衡」提出的悖論實際上動搖了西方經濟學的基石。因此,從「納什均衡」中我們還可以悟出一條真理:合作是有利的「利己策略」。

但它必須符合以下**律:按照你願意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的「己所不欲勿施於人」。

但前提是人所不欲勿施於我。其次,「納什均衡」是一種非合作博弈均衡,在現實中非合作的情況要比合作情況普遍。所以「納什均衡」是對馮·諾依曼和摩根斯特恩的合作博弈理論的重大發展,甚至可以說是一場革命。

從「納什均衡」的普遍意義中我們可以深刻領悟司空見慣的經濟、社會、政治、國防、管理和日常生活中的博弈現象。我們將例舉出許多類似於「囚徒的兩難處境」這樣的例子。如**戰、軍奮競賽、汙染等等。

一般的博弈問題由三個要素所構成:即局中人(players)又稱當事人、參與者、策略等等的集合,策略(strategies)集合以及每一對局中人所做的選擇和贏得(payoffs)集合。其中所謂贏得是指如果一個特定的策略關係被選擇,每一局中人所得到的效用。

所有的博弈問題都會遇到這三個要素。

**戰博弈:   現在我們經常會遇到各種各樣的家電**大戰,彩電大戰、冰箱大戰、空調大戰、微波爐大戰……這些大戰的受益者首先是消費者。每當看到一種家電產品的**大戰,百姓都會「沒事兒偷著樂」。

在這裡,我們可以解釋廠家**大戰的結局也是一個「納什均衡」,而且**戰的結果是誰都沒錢賺。因為博弈雙方的利潤正好是零。競爭的結果是穩定的,即是一個「納什均衡」。

這個結果可能對消費者是有利的,但對廠商而言是災難性的。所以,**戰對廠商而言意味著自殺。從這個案例中我們可以引伸出兩個問題,一是競爭削價的結果或「納什均衡」可能導致一個有效率的零利潤結局。

二是如果不採取**戰,作為一種敵對博弈論(vivalry game)其結果會如何呢?每一個企業,都會考慮採取正常**策略,還是採取**格策略形成壟斷**,並盡力獲取壟斷利潤。如果壟斷可以形成,則博弈雙方的共同利潤最大。

這種情況就是壟斷經營所做的,通常會抬**格。另一個極端的情況是廠商用正常的**,雙方都可以獲得利潤。從這一點,我們又引出一條基本準則:

「把你自己的戰略建立在假定對手會按其最佳利益行動的基礎上」。事實上,完全競爭的均衡就是「納什均衡」或「非合作博弈均衡」。在這種狀態下,每一個廠商或消費者都是按照所有的別人已定的**來進行決策。

在這種均衡中,每一企業要使利潤最大化,消費者要使效用最大化,結果導致了零利潤,也就是說**等於邊際成本。在完全競爭的情況下,非合作行為導致了社會所期望的經濟效率狀態。如果廠商採取合作行動並決定轉向壟斷**,那麼社會的經濟效率就會遭到破壞。

這就是為什麼wto和各國**要加強反壟斷的意義所在。

汙染博弈:

假如市場經濟中存在著汙染,但**並沒有管制的環境,企業為了追求利潤的最大化,寧願以犧牲環境為代價,也絕不會主動增加環保裝置投資。按照看不見的手的原理,所有企業都會從利己的目的出發,採取不顧環境的策略,從而進入「納什均衡」狀態。如果一個企業從利他的目的出發,投資治理汙染,而其他企業仍然不顧環境汙染,那麼這個企業的生產成本就會增加,**就要提高,它的產品就沒有競爭力,甚至企業還要破產。

這是一個「看不見的手的有效的完全競爭機制」失敗的例證。直到20世紀90年代中期,中國鄉鎮企業的盲目發展造成嚴重汙染的情況就是如此。只有在**加強汙染管制時,企業才會採取低汙染的策略組合。

企業在這種情況下,獲得與高汙染同樣的利潤,但環境將更好。

**自由與壁壘:

這個問題對於剛剛加入wto的中國而言尤為重要。任何一個國家在國際**中都面臨著保持**自由與實行**保護主義的兩難選擇。**自由與壁壘問題,也是一個「納什均衡」,這個均衡是**雙方採取不合作博弈的策略,結果使雙方因**戰受到損害。

x國試圖對y國進行進口**限制,比如提高關稅,則y國必然會進行反擊,也提高關稅,結果誰也沒有撈到好處。反之,如x和y能達成合作性均衡,即從互惠互利的原則出發,雙方都減少關稅限制,結果大家都從**自由中獲得了最大利益,而且全球**的總收益也增加了。

什麼是納什均衡,他的原理是什麼,什麼是納什均衡理論?

納什均衡,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰 納什命名。納什均衡是一種策略組合,使得每個參與人的策略是對其他參與人策略的最優反應。假設有n個局中人蔘與博弈,如果某情況下無一參與者可以獨自行動而增加收益 即為了自身利益的最大化,沒有任何單獨的一方願意改變其策略的 則此策略組合被稱為納...

貨幣均衡與社會總供求均衡的關係如何理解貨幣均衡與社會總供求平衡之間的關係

貨幣均衡是貨幣供求作用的一種狀態,使社會上貨幣供給與貨幣需求的大體一致,而非貨幣供給與貨幣需求在價值上的完全相等。貨幣均衡是一個動態過程,在短期內貨幣供求可能不一致,但在長期內是大體一致的。貨幣均衡不是貨幣供給量和實際貨幣需求量一致,而是貨幣供給量與適度貨幣需要量基本一致。貨幣均衡的標誌體現在以下幾...

「納什均衡」它會是什麼?它像UFO一樣詭異和令人百思不解

納什均衡是一種策略組合,使得同一時間內每個參與人的策略是對其他參與人策略的最優反應。假設有兩個小偷a和b聯合犯事 私入民宅被警察抓住。將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,給出的政策是 如果一個犯罪嫌疑人坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人...