《囚徒困境》說明了什麼

1樓：南詩文化

說明了，當所有局中人選擇其最優策略時的策略組合可能對整體來說並不是好的策略，納什均衡可能對整體而言不是好的策略組合。

《囚徒困境》，是2023年美國蘭德公司的梅里爾·弗勒德（merrill flood）和梅爾文·德雷希爾（melvin dresher）擬定出相關困境的理論，後來由顧問艾伯特·塔克（albert tucker）以囚徒方式闡述，並命名為《囚徒困境》。

《博弈論》裡有個著名的「囚徒困境」怎樣簡單易懂地理解，如何應用在現實的例子中？

2樓：

囚徒困境:

假設在某城市有如下規矩

承認犯罪者，判刑10年

檢舉他人者，直接釋放

拒不承認但被人檢舉者，判刑20年

而假設甲乙兩人被抓，若無人檢舉，則將因證據不足而僅判刑1年，故有如下博弈矩陣

\ 甲承認不承認

乙\承認 10,10 20,0

不承認 0,20 1,1

另假設甲乙二人均為理智的人且無交流，下面來看博弈結果

從甲方考慮，假設乙不承認，那麼甲承認只要判 0 年，不承認卻要1年

假設乙承認，那麼甲承認要判 10 年，不承認卻要20年

意即，無論如何，甲會選擇承認，而乙通過類似的分析，講得出一樣的結論，故可得博弈結果:甲乙兩人同時認罪，且一起判10年

而顯然，從總體上來說，這不是最優解（一起不承認），此謂之囚徒困境

納什均衡不懂，只知道有個納什均衡點，指的是博弈中的平衡點（或穩定點，記不清了，反正就是最有可能出現的點，如上例中的（10,10）點）

例子很簡單，比如廣告效應

假設有兩家同樣的公司，實力完全相當，故兩者收益為10,10

此時有一家公司開始做廣告了，提高了它的市場份額8,廣告費4，故兩者收益變為14,2

顯然另一家公司不會坐視，於是也做廣告，份額再次平均，但兩者收益卻變為

6,6造成資源浪費

博弈矩陣如下:

\ 甲不打廣告打廣告

乙\不打廣告 10,10 14,2

打廣告 2,14 6,6

以上為基本模型（2人，2選擇），還可以進行擴充套件:

1、增加人數

由於博弈方增加將導致維數增加，我就不列表了

想象一下，只有兩家公司，他們都知道以上結論，那他們就有可能達成某種協議，從而提高雙方收益。但如果有1000家呢？誰先打廣告誰就能賺錢，你能保證100個人都忍得住？

2、增加博弈選擇，

比如打廣告有3種量 2 賺 4 ，4 賺 8 ，6 賺 9,則新博弈矩陣如下:

\ 甲廣告0 廣告1 廣告2 廣告3

乙\廣告0 10,10 12,6 14,4 13,1

廣告1 6,12 8,8 10,4 9,3

廣告2 4,14 4,10 6,6 5,5

廣告3 1,13 3,9 5,5 4,4

任取一個起點，比如10,10,觀察第一橫條知甲會選擇廣告2，再觀察第三列知乙會對應選擇廣告2來作出迴應，此時任一方作出新舉動都不會導致更高收益，進入平衡狀態。

貌似有時不同的起點有可能導致不同的平衡點，則這些點都叫納什平衡點

3樓：匿名使用者

**逮捕甲、乙兩名嫌疑犯，但沒有足夠證據指控二人入罪。於是**分開囚禁嫌疑犯，分別和二人見面，並向雙方提供以下相同的選擇：

若一人認罪並作證檢控對方（相關術語稱「背叛」對方），而對方保持沉默，此人將即時獲釋，沉默者將判監10年。

若二人都保持沉默（相關術語稱互相「合作」），則二人同樣判監1年。

若二人都互相檢舉（相關術語稱互相「背叛」），則二人同樣判監8年。

囚徒到底應該選擇哪一項策略，才能將自己個人的刑期縮至最短？兩名囚徒由於隔絕監禁，並不知道對方選擇；而即使他們能交談，還是未必能夠盡信對方不會反口。就個人的理性選擇而言，檢舉背叛對方所得刑期，總比沉默要來得低。

說明為什麼甚至在合作對雙方都有利時，保持合作也是困難的。

《囚徒困境》說明了什麼

對囚徒困境的理解，囚徒困境說明什麼啟示是什麼

什麼是囚徒困境呢？囚徒困境是什麼意思？？？

囚徒困境是靜態博弈還是動態博弈呢

《囚徒困境》說明了什麼

對囚徒困境的理解，囚徒困境說明什麼 啟示是什麼

什麼是囚徒困境呢？囚徒困境是什麼意思？？？

囚徒困境是靜態博弈還是動態博弈呢

相關推薦

對囚徒困境的理解，囚徒困境說明什麼啟示是什麼