博弈論是什麼

2021-03-28 02:57:47 字數 5731 閱讀 4015

1樓:匿名使用者

博弈論的概念

博弈論又被稱為對策論(games theory),是研究具有鬥爭或競爭性 質現象的理論和方法,它既是現代數學的一個新分支,也是運籌學的一個重要學科。

博弈論的發展

博弈論思想古已有之,我國古代的《孫子兵法》就不僅是一部軍事著作,而且算是最早的一部博弈論專著。博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展,正式發展成一門學科則是在20世紀初。2023年馮·諾意曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。

2023年,馮·諾意曼和摩根斯坦共著的劃時代鉅著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構並將博弈論系統的應用於經濟領域,從而奠定了這一學科的基礎和理論體系。談到博弈論就不能忽略博弈論天才納什,納什的開創性**《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。 此外,塞爾頓、哈桑尼的研究也對博弈論發展起到推動作用。

今天博弈論已發展成一門較完善的的學科。

博弈論的基本概念

博弈要素

(1)局中人:在一場競賽或博弈中,每一個有決策權的參與者成為一個局中人。只有兩個局中人的博弈現象稱為「兩人博弈」,而多於兩個局中人的博弈稱為 「多人博弈」。

(2)策略:一局博弈中,每個局中人都有選擇實際可行的完整的行動方案,即方案不是某階段的行動方案,而是指導整個行動的一個方案,一個局中人的一個可行的自始至終全域性籌劃的一個行動方案,稱為這個局中人的一個策略。如果在一個博弈中局中人都總共有有限個策略,則稱為「有限博弈」,否則稱為「無限博弈」。

(3)得失:一局博弈結局時的結果稱為得失。每個局中人在一局博弈結束時的得失,不僅與該局中人自身所選擇的策略有關,而且與全域性中人所取定的一組策略有關。

所以,一局博弈結束時每個局中人的「得失」是全體局中人所取定的一組策略的函式,通常稱為支付(payoff)函式。

(4)對於博弈參與者來說,存在著一博弈結果

(5)博弈涉及到均衡:均衡是平衡的意思,在經濟學中,均衡意即相關量處於穩定值。在供求關係中,某一商品市場如果在某一**下,想以此**買此商品的人均能買到,而想賣的人均能賣出,此時我們就說,該商品的供求達到了均衡。

所謂納什均衡,它是一穩定的博弈結果。

納什均衡(nash equilibrium):在一策略組合中,所有的參與者面臨這樣一種情況,當其他人不改變策略時,他此時的策略是最好的。也就是說,此時如果他改變策略他的支付將會降低。

在納什均衡點上,每一個理性的參與者都不會有單獨改變策略的衝動。納什均衡點存在性證明的前提是「博弈均衡偶」概念的提出。所謂「均衡偶」是在二人零和博弈中,當局中人a採取其最優策略a*,局中人b也採取其最優策略b*,如果局中人仍採取b*,而局中人a卻採取另一種策略a,那麼局中人a的支付不會超過他採取原來的策略a*的支付。

這一結果對局中人b亦是如此。

這樣,「均衡偶」的明確定義為:一對策略a*(屬於策略集a)和策略b*(屬於策略集b)稱之為均衡偶,對任一策略a(屬於策略集a)和策略b(屬於策略集b),總有:偶對(a, b*)≤偶對(a*,b*)≤偶對(a*,b)。

對於非零和博弈也有如下定義:一對策略a*(屬於策略集a)和策略b*(屬於策略集b)稱為非零和博弈的均衡偶,對任一策略a(屬於策略集a)和策略b(屬於策略集b),總有:對局中人a的偶對(a, b*) ≤偶對(a*,b*);對局中人b的偶對(a*,b)≤偶對(a*,b*)。

有了上述定義,就立即得到納什定理:

任何具有有限純策略的二人博弈至少有一個均衡偶。這一均衡偶就稱為納什均衡點。

納什定理的嚴格證明要用到不動點理論,不動點理論是經濟均衡研究的主要工具。通俗地說,尋找均衡點的存在性等價於找到博弈的不動點。

納什均衡點概念提供了一種非常重要的分析手段,使博弈論研究可以在一個博弈結構裡尋找比較有意義的結果。

但納什均衡點定義只侷限於任何局中人不想單方面變換策略,而忽視了其他局中人改變策略的可能性,因此,在很多情況下,納什均衡點的結論缺乏說服力,研究者們形象地稱之為「天真可愛的納什均衡點」。

塞爾頓(r·selten)在多個均衡中剔除一些按照一定規則不合理的均衡點,從而形成了兩個均衡的精煉概念:子博弈完全均衡和顫抖的手完美均衡。

博弈的型別

(1)合作博弈——研究人們達成合作時如何分配合作得到的收益,即收益分配問題。

(2)非合作博弈——研究人們在利益相互影響的局勢中如何選決策使自己的收益最大,即策略選擇問題。

(3)完全資訊不完全資訊博弈:參與者對所有參與者的策略空間及策略組合下的支付有充瞭解稱為完全資訊;反之,則稱為不完全資訊。

(4)靜態博弈和動態博弈

靜態博弈:指參與者同時採取行動,或者儘管有先後順序,但後行動者不知道先行動者的策略。

動態博弈:指雙方的的行動有先後順序並且後行動者可以知道先行動者的策略。

財產分配問題和夏普里值(shapley value)

考慮這樣一個合作博弈:a、b、c、投票決定如何分配100萬,他們分別擁有50%、40%、10%的權力,規則規定,當超過50%的票認可了某種方案時才能通過。那麼如何分配才是合理的呢?

按票力分配,a50萬、b40萬、c10萬c向a提出:a70萬、b0、c30萬b向a提出:a80萬、b20萬、c0……

權力指數:每個決策者在決策時的權力體現在他在形成的獲勝聯盟中的「關鍵加入者」的個數,這個「關鍵加入者」的個數就被稱為權利指數。

夏普里值:在各種可能的聯盟次序下,參與者對聯盟的邊際貢獻之和除以各種可能的聯盟組合。

次序 abc acb bac bca cab cba

關鍵加入者 a c a c a b

由此計算出a,b,c的夏普里值分別為4/6,1/6,1/6

所以a,b,c應分別獲得100萬的2/3,1/6,1/6。

博弈論的意義

弈論的研究方法和其他許多利用數學工具研究社會經濟現象的學科一樣,都是從複雜的現象中抽象出基本的元素,對這些元素構成的數學模型進行分析,而後逐步引入對其形勢產影響的其他因素,從而分析其結果。

基於不同抽象水平,形成三種博弈表述方式,標準型、擴充套件型和特徵函式型利用這三種表述形式,可以研究形形色色的問題。因此,它被稱為「社會科學的數學」從理論上講,博弈論是研究理性的行動者相互作用的形式理論,而實際上正深入到經濟學、政治學、社會學等等,被各門社會科學所應用。

博弈論是指某個個人或是組織,面對一定的環境條件,在一定的規則約束下,依靠所掌握的資訊,從各自選擇的行為或是策略進行選擇並加以實施,並從各自取得相應結果或收益的過程,在經濟學上博弈論是個非常重要的理論概念。

什麼是博弈論?古語有云,世事如棋。生活中每個人如同棋手,其每一個行為如同在一張看不見的棋盤上佈一個子,精明慎重的棋手們相互揣摩、相互牽制,人人爭贏,下出諸多精彩紛呈、變化多端的棋局。

博弈論是研究棋手們 「出棋」 著數中理性化、邏輯化的部分,並將其系統化為一門科學。換句話說,就是研究個體如何在錯綜複雜的相互影響中得出最合理的策略。事實上,博弈論正是衍生於古老的遊戲或曰博弈如象棋、撲克等。

數學家們將具體的問題抽象化,通過建立自完備的邏輯框架、體系研究其規律及變化。這可不是件容易的事情,以最簡單的二人對弈為例,稍想一下便知此中大有玄妙:若假設雙方都精確地記得自己和對手的每一步棋且都是最「理性」 的棋手,甲出子的時候,為了贏棋,得仔細考慮乙的想法,而乙出子時也得考慮甲的想法,所以甲還得想到乙在想他的想法,乙當然也知道甲想到了他在想甲的想法…

面對如許重重迷霧,博弈論怎樣著手分析解決問題,怎樣對作為現實歸納的抽象數學問題求出最優解、從而為在理論上指導實踐提供可能性呢?現代博弈理論由匈牙利大數學家馮·諾伊曼於20世紀20年代開始創立,2023年他與經濟學家奧斯卡·摩根斯特恩合作出版的鉅著《博弈論與經濟行為》,標誌著現代系統博弈理論的初步形成。對於非合作、純競爭型博弈,諾伊曼所解決的只有二人零和博弈--好比兩個人下棋、或是打乒乓球,一個人贏一著則另一個人必輸一著,淨獲利為零。

在這裡抽象化後的博弈問題是,已知參與者集合(兩方) ,策略集合(所有棋著) ,和盈利集合(贏子輸子) ,能否且如何找到一個理論上的「解」 或「平衡」 ,也就是對參與雙方來說都最「合理」 、最優的具體策略?怎樣才是「合理」 ?應用傳統決定論中的「最小最大」 準則,即博弈的每一方都假設對方的所有功略的根本目的是使自己最大程度地失利,並據此最優化自己的對策,諾伊曼從數學上證明,通過一定的線性運算,對於每一個二人零和博弈,都能夠找到一個「最小最大解」 。

通過一定的線性運算,競爭雙方以概率分佈的形式隨機使用某套最優策略中的各個步驟,就可以最終達到彼此盈利最大且相當。當然,其隱含的意義在於,這套最優策略並不依賴於對手在博弈中的操作。用通俗的話說,這個著名的最小最大定理所體現的基本「理性」 思想是「抱最好的希望,做最壞的打算」 。

2樓:匿名使用者

3樓:匿名使用者

很不錯得學科,值得大家多研究,

尤其在這江湖險惡的世代

博弈論是什麼?

4樓:靠名真tm難起

博弈論主要研究公式化了的激勵結構間的相互作用,是研究具有鬥爭或競爭性質現象的數學理論和方法。 博弈論考慮遊戲中的個體的**行為和實際行為,並研究它們的優化策略。生物學家使用博弈理論來理解和**進化論的某些結果。

博弈論已經成為經濟學的標準分析工具之一。在金融學、**學、生物學、經濟學、國際關係、電腦科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。

5樓:暴走少女

博弈論又被稱為對策論(game theory),既是現代數學的一個新分支,也是運籌學的一個重要學科。

博弈論主要研究公式化了的激勵結構間的相互作用,是研究具有鬥爭或競爭性質現象的數學理論和方法。 博弈論考慮遊戲中的個體的**行為和實際行為,並研究它們的優化策略。生物學家使用博弈理論來理解和**進化論的某些結果。

博弈論已經成為經濟學的標準分析工具之一。在金融學、**學、生物學、經濟學、國際關係、電腦科學、政治學、軍事戰略和其他很多學科都有廣泛的應用。

擴充套件資料:

一、發展過程

博弈論是二人在平等的對局中各自利用對方的策略變換自己的對抗策略,達到取勝的目的。博弈論思想古已有之,中國古代的《孫子兵法》等著作就不僅是一部軍事著作,而且算是最早的一部博弈論著作。

博弈論最初主要研究象棋、橋牌、賭博中的勝負問題,人們對博弈局勢的把握只停留在經驗上,沒有向理論化發展。

博弈論考慮遊戲中的個體的**行為和實際行為,並研究它們的優化策略。近代對於博弈論的研究,開始於策梅洛(zermelo),波萊爾(borel)及馮·諾依曼(von neumann)。

2023年,馮·諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。2023年,馮·諾依曼和摩根斯坦共著的劃時代鉅著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構並將博弈論系統地應用於經濟領域,從而奠定了這一學科的基礎和理論體系。

二、博弈型別

一般認為,博弈主要可以分為合作博弈和非合作博弈。合作博弈和非合作博弈的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議,如果有,就是合作博弈,如果沒有,就是非合作博弈。

從行為的時間序列性,博弈論進一步分為靜態博弈、動態博弈兩類:靜態博弈是指在博弈中,參與人同時選擇或雖非同時選擇但後行動者並不知道先行動者採取了什麼具體行動;動態博弈是指在博弈中,參與人的行動有先後順序,且後行動者能夠觀察到先行動者所選擇的行動。

通俗的理解:"囚徒困境"就是同時決策的,屬於靜態博弈;而棋牌類遊戲等決策或行動有先後次序的,屬於動態博弈。

按照參與人對其他參與人的瞭解程度分為完全資訊博弈和不完全資訊博弈。完全博弈是指在博弈過程中,每一位參與人對其他參與人的特徵、策略空間及收益函式有準確的資訊。

不完全資訊博弈是指如果參與人對其他參與人的特徵、策略空間及收益函式資訊瞭解的不夠準確、或者不是對所有參與人的特徵、策略空間及收益函式都有準確的資訊,在這種情況下進行的博弈就是不完全資訊博弈。

博弈論有什麼用博弈論是什麼博弈論研究什麼問題有什麼作用

簡單來說,精通博弈論會讓你更善於分析解決複雜的問題。博弈論又被稱為對策論 game theory 既是現代數學的一個新分支,也是運籌學的一個重要學科。博弈論主要研究公式化了的激勵結構間的相互作用。是研究具有鬥爭或競爭性質現象的數學理論和方法。博弈論考慮遊戲中的個體的 行為和實際行為,並研究它們的優化...

動態博弈論模型如何建立,博弈論模型

請仔細檢視歷年,清華大學的,或者北京大學,人民大學博士研究生招考經濟類的專業課試題,裡邊都有這方面建立博弈模型的題目。經典的廣告博弈 兩家公司共同佔據某產品的市場,他們都有 做廣專告 和 不做廣告 兩種選擇。屬 若兩家都不做,則平分市場,雙方得益各為8 若兩家都做,仍然平分市場,但因廣告費用而降低了...

博弈論中有關囚徒困境的問題關於博弈論中囚徒困境的問題

囚徒的困境並沒說囚徒只合夥犯罪一次,而且,即使準備合作30次,如果在第一次沒有商量好 後的供詞,任然會出現囚徒困境 這個問題取決於 他們打算出獄後一起再次犯罪的渴望程度 以下用a 與 開始的犯罪活動中被逮捕後受到懲罰的害怕程度 以下用b 之間的博弈。如果a大於b,這兩個罪犯不管是誰出賣誰,最終都不能...