《囚徒困境》說明了什麼

2021-03-22 06:43:15 字數 2145 閱讀 9850

1樓:南詩文化

說明了,當所有局中人選擇其最優策略時的策略組合可能對整體來說並不是好的策略,納什均衡可能對整體而言不是好的策略組合。

《囚徒困境》,是2023年美國蘭德公司的梅里爾·弗勒德(merrill flood)和梅爾文·德雷希爾(melvin dresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(albert tucker)以囚徒方式闡述,並命名為《囚徒困境》。

《博弈論》裡有個著名的「囚徒困境」怎樣簡單易懂地理解,如何應用在現實的例子中?

2樓:

囚徒困境:

假設在某城市有如下規矩

承認犯罪者,判刑10年

檢舉他人者,直接釋放

拒不承認但被人檢舉者,判刑20年

而假設甲乙兩人被抓,若無人檢舉,則將因證據不足而僅判刑1年,故有如下博弈矩陣

\ 甲 承認 不承認

乙\承認 10,10 20,0

不承認 0,20 1,1

另假設甲乙二人均為 理智 的人且無交流,下面來看博弈結果

從甲方考慮,假設乙不承認,那麼甲承認只要判 0 年,不承認卻要1年

假設乙承認,那麼甲承認要判 10 年,不承認卻要20年

意即,無論如何,甲會選擇承認,而乙通過類似的分析,講得出一樣的結論,故可得博弈結果:甲乙兩人同時認罪,且一起判10年

而顯然,從總體上來說,這不是最優解(一起不承認),此謂之囚徒困境

納什均衡不懂,只知道有個納什均衡點,指的是博弈中的平衡點(或穩定點,記不清了,反正就是最有可能出現的點,如上例中的(10,10)點)

例子很簡單,比如廣告效應

假設有兩家同樣的公司,實力完全相當,故兩者收益為10,10

此時有一家公司開始做廣告了,提高了它的市場份額8,廣告費4,故兩者收益變為14,2

顯然另一家公司不會坐視,於是也做廣告,份額再次平均,但兩者收益卻變為

6,6造成資源浪費

博弈矩陣如下:

\ 甲 不打廣告 打廣告

乙\不打廣告 10,10 14,2

打廣告 2,14 6,6

以上為基本模型(2人,2選擇),還可以進行擴充套件:

1、增加人數

由於博弈方增加將導致維數增加,我就不列表了

想象一下,只有兩家公司,他們都知道以上結論,那他們就有可能達成某種協議,從而提高雙方收益。但如果有1000家呢?誰先打廣告誰就能賺錢,你能保證100個人都忍得住?

2、增加博弈選擇,

比如打廣告有3種量 2 賺 4 ,4 賺 8 ,6 賺 9,則新博弈矩陣如下:

\ 甲 廣告0 廣告1 廣告2 廣告3

乙\廣告0 10,10 12,6 14,4 13,1

廣告1 6,12 8,8 10,4 9,3

廣告2 4,14 4,10 6,6 5,5

廣告3 1,13 3,9 5,5 4,4

任取一個起點,比如10,10,觀察第一橫條知甲會選擇廣告2,再觀察第三列知乙會對應選擇廣告2來作出迴應,此時任一方作出新舉動都不會導致更高收益,進入平衡狀態。

貌似有時不同的起點有可能導致不同的平衡點,則這些點都叫納什平衡點

3樓:匿名使用者

**逮捕甲、乙兩名嫌疑犯,但沒有足夠證據指控二人入罪。於是**分開囚禁嫌疑犯,分別和二人見面,並向雙方提供以下相同的選擇:

若一人認罪並作證檢控對方(相關術語稱「背叛」對方),而對方保持沉默,此人將即時獲釋,沉默者將判監10年。

若二人都保持沉默(相關術語稱互相「合作」),則二人同樣判監1年。

若二人都互相檢舉(相關術語稱互相「背叛」),則二人同樣判監8年。

囚徒到底應該選擇哪一項策略,才能將自己個人的刑期縮至最短?兩名囚徒由於隔絕監禁,並不知道對方選擇;而即使他們能交談,還是未必能夠盡信對方不會反口。就個人的理性選擇而言,檢舉背叛對方所得刑期,總比沉默要來得低。

說明為什麼甚至在合作對雙方都有利時,保持合作也是困難的 。

對囚徒困境的理解,囚徒困境說明什麼 啟示是什麼

1 囚徒困境是博弈論的非零和博弈中具代表性的例子,反映個人最佳選擇並非團體最佳選擇 2 困境本身只屬模型性質,但現實中的 競爭 環境保護等方面,會頻繁出現類似情況 3 單次發生的囚徒困境,和多次重複的囚徒困境結果不一樣,在重複的囚徒困境中,博弈被反覆進行,每個參與者都有機會去懲罰另一個參與者前一回合...

什麼是囚徒困境呢?囚徒困境是什麼意思???

囚徒困境是指兩個 的囚徒之間的一種特殊博弈,反映個人最佳選擇並非團體最佳選擇。囚徒困境是博弈論中非零和博弈的代表性的例子,反映個人最佳選擇並非是團體最佳選擇。囚徒困境 prisoner s dilemma 是指兩個 的囚徒之間的一種特殊博弈,說明為什麼甚至在合作對雙方都有利時,保持合作也是困難的。囚...

囚徒困境是靜態博弈還是動態博弈呢

是靜態bai博弈 動態博弈 dynamic game 是指參與人的行du動有zhi先後順序,而且行動在後者dao可以觀察到行動在先專者的選屬擇,並據此作出相應的選擇。靜態博弈指參與者同時採取行動,或者儘管參與者行動的採取有先後順序,但後行動的人不知道先採取行動的人採取的是什麼行動。具體的問題具體比較...