博弈論中有關囚徒困境的問題關於博弈論中囚徒困境的問題

2021-03-05 14:55:10 字數 5076 閱讀 6710

1樓:匿名使用者

囚徒的困境並沒說囚徒只合夥犯罪一次,而且,即使準備合作30次,如果在第一次沒有商量好**後的供詞,任然會出現囚徒困境

2樓:

這個問題取決於「他們打算出獄後一起再次犯罪的渴望程度」(以下用a)與「開始的犯罪活動中被逮捕後受到懲罰的害怕程度」(以下用b)之間的博弈。如果a大於b,這兩個罪犯不管是誰出賣誰,最終都不能達到一起犯罪的目的,那麼兩個罪犯一定從開始到最後都打死不承認,就能實現共贏。如果b大於a,還是會出現囚徒困境。

3樓:匿名使用者

不會,兩人並沒有出現資訊不對稱的情況。既然兩人已經決定合夥犯罪n次,目前暫假定n=30,其實這個30只是個假設的數,是任何其他數都沒影響,也就是說兩人在**之前有約定,絕對不會相互背叛,所以無論在審訊時出現任何情況,他們都沒有任何顧慮,因此不會相互背叛,即不會出現囚徒困境。

囚徒困境出現的條件是:相互猜忌,互有顧慮,相互資訊不對稱。

4樓:匿名使用者

囚徒困境是在以自我為中心的價值狀況下才能出現的,表現強烈的是西文價值觀造成的一種理論基礎。從中國傳統文化中,這種情況出現應另作具體分析。二人能直到一起犯罪必有情感基礎,出賣同伴不管是心理還是實際社會上是要付出代價的,這不僅只考慮幾年牢獄這苦,大部分在中國社會中不會出現囚徒困境,而只會出現二種人,一是是否要出賣同伴,一是死扛作出自我犧牲,而不會考慮對方會怎麼想。

關於博弈論中囚徒困境的問題

5樓:匿名使用者

前提是雙方分別審問,不知道對方的策略,只能從自身的角度考慮。

6樓:找著

兩個嫌疑犯是被隔離開同時審訊的,即是在雙方都不知道對方選擇的情況下所作出的選擇。想一想,如果是你,你會選擇招還是不招?絕大多數人都會選擇招任。

博弈論裡的囚徒困境怎麼理解?

7樓:匿名使用者

「囚徒困境」。一位富翁在家中被殺,財物被盜。**抓到兩個犯罪嫌疑人a和b,並從他們身上搜到了被害人家中丟失的財物。

但是,他們矢口否認曾殺過人,辯稱是先發現富翁被殺,然後只是順手牽羊偷了點兒東西。於是**將兩人隔離,檢察官分別和每個人單獨談話,「由於你們的偷盜罪已有確鑿的證據,所以可以判你們一年刑期。我可以和你做個交易,如果你單獨坦白殺人的罪行,我只判你三個月的監禁,但你的同夥要被判十年刑。

如果你拒不坦白,而被同夥檢舉,那麼你就將被判十年刑,他只判三個月的監禁。但是,如果你們兩人都坦白交代,那麼,你們都要被判5年刑」。此時a和b面臨著兩難的選擇——坦白或抵賴。

顯然最好的策略是雙方都抵賴,結果是大家都只被判一年。然而由於兩人處於隔離的情況下無法串供,每一個人都只能從對自己最有利的前提出發,選擇了坦白。這樣,原本對雙方都有利的策略(抵賴)和結局(被判1年刑)就不會出現。

這種兩人都選擇坦白的策略以及因此被判5年的結局被稱為「納什均衡」,也叫非合作均衡。在「納什均衡」中,每一方在選擇策略時都沒有「共謀」,他們只是選擇對自己最有利的策略,而不考慮共同合作或任何其他對手的利益。也就是說,這種策略組合由所有局中人(也稱當事人、參與者)的最佳策略組合構成,但實施這樣的策略的結局也是對所有人都不利的結局。

中國檢驗檢疫reach解決中心 「囚徒困境」有著廣泛而深刻的意義,在經濟、社會、政治、國防、管理和日常生活發揮著無法抗拒的作用,也是企業在面對reach註冊中遇到的難題之一。如前所述,聯合應對reach是對所有企業最有利的結局,然而卻不是每一個企業的最有利的策略,因為每一個企業都要面臨其它企業搞小動作導致自己更大損失的風險(具體在另文中分析)。為了避免這種風險,所有企業還是選擇了單獨應對reach這樣一種對所有企業最不利的策略。

博弈論裡的囚徒困境怎麼解決

8樓:小俊七七

當兩個參與者player同時有對對方的最佳反饋時(即達到納什均衡,也就是同時認罪),就可以得到囚徒困境的最佳結果。

其實兩個囚犯如果都否認犯罪,那麼便能獲得最少的判刑。但是兩個囚犯都在關在不同的地方,雙方也無法碰面,所以無法確信對方是否會背叛自己。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低,所以二人的理性思考都會得出相同的結論——選擇背叛。

因此,這場博弈中只有一種可能能達到的納什均衡,就是雙方參與者都背叛對方,結果二人同樣服刑8年。

擴充套件資料

囚徒困境經典例子

2023年,由就職於蘭德公司的梅里爾·弗勒德(merrillflood)和梅爾文·德雷希爾(melvindresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(alberttucker)以囚徒方式闡述,並命名為「囚徒困境」。經典的囚徒困境如下:

**逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是**分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監1年。

若二人都互相檢舉(相關術語稱互相「背叛」),則二人同樣判監8年。

9樓:匿名使用者

20190903 數學05

10樓:一零啞劇

1、利用無限次重複博弈(例如,經典的針鋒相對策略、冷酷策略等)2、利用資訊不完全(例如,聲譽效用、個體型別等)3、利用心智模型,放鬆主體假定(例如帶有同情的博弈)4、本方可以採取一些措施(如降低本方的收益,籤協議)讓對方有理由相信你沒有動機產生偏離,從而有動機產生合作

歷史上曾經有人在真實環境中做過囚徒困境的實驗,發現重複博弈後的結果就是趨於合作。

其實經典博弈論中的「個體絕對理性」假設實在是太強了,因此後來有人就提出了「有限理性」的假設,即人們的計算能力是有限的,不可能用數學去計算分析完博弈的所有結果後再做出選擇(因為很多情況下人們並不知道該怎麼分析),而只是依據經驗做出選擇,然後再對結果進行學習(舉例來說,如果你沒學過博弈論,你可能就不知道該如何「理性」地分析囚徒困境,你所做的只是依據經驗做出選擇)。這個思想其實和生物進化論的思想差不多(或者機器學習也類似),其中的一個概念就是evolutionarily stable strategy。因此博弈論在某些方面還不夠完善,它還不太適合來進行「**」

11樓:匿名使用者

打破前提,就可以破解囚徒困境了!

很簡單,不斷重複!不斷重複!一提到囚徒困境,很多人只知道,兩個囚犯都會坦白,因為這樣對個人收益最大!

並且這種選擇只有一次!兩個人進行這次試驗後,不會再相遇!就算我出賣你,那我也沒什麼後顧之憂!

是吧?ok,那我們增加一個條件,進行100次這樣的實驗,而且在同樣的兩個人身上!哈哈,經典來了!

隨著實驗次數的增加,他們就會發現,合作對於他們而言,才是最好的選擇!你出賣我,那麼我以後就都出賣你!這是一種懲罰機制!

同時,因為他們還要被繼續試驗下去,實驗者會一直選擇合作!而不是單方面的坦白!

12樓:千里揮戈闖天涯

囚徒困境:

**逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是**分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢舉對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監半年。

若二人都互相檢舉(互相「背叛」),則二人同樣判監2年。

因此,甲乙二人的支付矩陣為:

從支付矩陣中可以看到,甲乙的納什均衡為同時認罪;但其實甲乙二人同時沉默才能使得判刑時間最短。因此想要跳出囚徒困境,甲乙二人必須充分地信任對方,才能同時保持沉默,使得各自的支付最大。

13樓:

prisoner's

dilemma 囚徒困境是game theory中經典的問題。

當兩個參與者player同時有對對方的最佳反饋best response formula時,(即達到納什均衡nash equillibrium),我們就可以得到囚徒困境的最佳結果out***e.

下文的br指的是best response(最佳方案)

從圖中我們可以看出,br1(player2合作)=背叛(5)br1(player2背叛)=背叛(1)

同理                             br2(player1合作)=背叛(5)br2(player1背叛)=背叛(1)、

從上面可得,這個例子中唯一的納什均衡是(背叛,背叛)=(1,1) 在當前遊戲是simoutanious game的前提條件下,無論對方用什麼方案,我都想背叛,因為我不能保證其他的player在我合作的時候背叛我以獲得更高的payoff(收益)。

=,=手打的,自己寫的東西。

14樓:上官

最佳確定性策略被認為是"以牙還牙"。

這是阿納托爾·拉波波特(anatol rapoport)開發並運用到錦標賽中的方法。它是所有參賽程式中最簡單的,只包含了四行basic語言,並且贏得了比賽。

「以牙還牙」策略是:

第一次與對方合作,從第二次開始,每一次都用對方前一次對待自己的方式來對待它,

也就是:如果前一次對方背叛自己,那麼這一次自己就背叛對方;如果前一次對方與自己合作,那麼這次自己就與對方合作。

更好些的策略是"寬恕地以牙還牙"。當你的對手背叛,在下一回閤中你無論如何要以小概率(大約是1%~5%)時而合作一下。

這是考慮到偶爾要從迴圈背叛的受騙中復原。當錯誤傳達被引入博弈時,"寬恕地以牙還牙"是最佳的。這意味著有時你的動作被錯誤地傳達給你的對手:你合作但是你的對手聽說你背叛了。

拓展資料:

靜態博弈,又叫囚徒困境,它**於一個非常有趣的例子:

有一對兄弟因為涉嫌犯罪被警察抓了起來,兩人被關在不同的審訊室,他們有兩個選擇,坦白或者沉默,如果兩人都選擇坦白,那麼兩人都會獲刑8年,如果兩人都選擇沉默,那麼兩人都會獲刑1年,如果一人選擇坦白一人選擇沉默,坦白者會獲得自由,沉默者會獲刑20年。請問兩人應該採取什麼樣的策略呢?

15樓:請叫丶我海哥

分情況討論,首先對甲或者已來說 背叛都是最優策略。所以都會選背叛。然而也並非都是背叛,可以通過一些制約達成合作,從而使雙方過得最大利益,例如合法的方式制定合同,或者暴力威脅等。

博弈論在日常生活的應用博弈論在日常生活的應用

博弈 一詞聽起來玄而又玄,說白了就是 遊戲 的意思。如果需要更準確點的說法,就是有輸有贏的遊戲。可以說,博弈論是通過 玩遊戲 而獲得的人生競爭知識的理論。博弈就是遊戲,那麼遊戲又是什麼呢?從某種意義上來說,遊戲是對生活的抽象與概括,是一種簡化的人生模型。比如象棋,有這樣幾種角色 老將 相 士 車 馬...

請教高人幫忙解決及道博弈論的基礎題目

研已經結束一個星期了,本不打算來發貼,但心裡實在是有些話不吐不快。今年的題目總體來說不難,英語和政治上七十分不難。數學有些靈活只要沉著應戰,120應該不是問題。這裡我只想談談專業課。全卷金融學部分75分,微觀經濟75分,共十道大題每題15分。今年的第四題是mba期末考題上的原題,第五題和金融學第四次...

博弈論的應用體現在生活中的哪些方面

還有再舉個例子,在一個炎熱的夏天,一個大學教室裡,高數老師正在給同學們講課,外面還有一群施工隊正在外面修水管,機器發出轟隆隆的聲音,非常影響老師的課堂效率,當時教室裡的窗戶是開著的,因為敞開著窗戶可以吹進來一陣陣的涼風,給同學們解解熱。但這時候就有矛盾了,外面的施工隊太吵了,老師覺得影響他的上課效率...