囚徒困境是1950年美國蘭德公司的梅裏爾·弗勒德(merrillflood)和梅爾文·德雷希爾(melvindresher)擬定出相關困境的理論,後來由顧問艾伯特·塔克(alberttucker)以囚徒方式闡述,並命名為“囚徒困境”。兩個共謀犯罪的人被關入監獄,不能互相溝通情況。
如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發,則因證據確鑿,二者都判刑八年。由於囚徒無法信任對方,因此傾向於互相揭發,而不是同守沉默。最終導致納什均衡僅落在非合作點上的博弈模型。
囚徒困境的故事講的是,兩個嫌疑犯作案後被警察抓住,分別關在不同的屋子裏接受審訊。
警察知道兩人有罪,但缺乏足夠的證據。
警察告訴每個人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個坦白而另一個抵賴,坦白的放出去,抵賴的判十年。
於是,每個囚徒都麵臨兩種選擇:坦白或抵賴。
然而,不管同夥選擇什麽,每個囚徒的最優選擇是坦白:如果同夥抵賴、自己坦白的話放出去,抵賴的話判十年,坦白比不坦白好;如果同夥坦白、自己坦白的話判八年,比起抵賴的判十年,坦白還是比抵賴的好。
結果,兩個嫌疑犯都選擇坦白,各判刑八年。
如果兩人都抵賴,各判一年,顯然這個結果好。囚徒困境所反映出的深刻問題是,人類的個人理性有時能導致集體的非理性-聰明的人類會因自己的聰明而作繭自縛,或者損害集體的利益。
如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄十年;若互相揭發,則因證據確鑿,二者都判刑八年。由於囚徒無法信任對方,因此傾向於互相揭發,而不是同守沉默。最終導致納什均衡僅落在非合作點上的博弈模型。
囚徒困境的故事講的是,兩個嫌疑犯作案後被警察抓住,分別關在不同的屋子裏接受審訊。
警察知道兩人有罪,但缺乏足夠的證據。
警察告訴每個人:如果兩人都抵賴,各判刑一年;如果兩人都坦白,各判八年;如果兩人中一個坦白而另一個抵賴,坦白的放出去,抵賴的判十年。
於是,每個囚徒都麵臨兩種選擇:坦白或抵賴。
然而,不管同夥選擇什麽,每個囚徒的最優選擇是坦白:如果同夥抵賴、自己坦白的話放出去,抵賴的話判十年,坦白比不坦白好;如果同夥坦白、自己坦白的話判八年,比起抵賴的判十年,坦白還是比抵賴的好。
結果,兩個嫌疑犯都選擇坦白,各判刑八年。
如果兩人都抵賴,各判一年,顯然這個結果好。囚徒困境所反映出的深刻問題是,人類的個人理性有時能導致集體的非理性-聰明的人類會因自己的聰明而作繭自縛,或者損害集體的利益。