180 likes | 543 Views
賽局理論 與應用 潘敏政 2003/12/31. 賽局的架構可依「靜態/動態」和「完全訊息/不完全訊息」二種分類標準 : 完全訊息中的靜態賽局:均衡觀念是納許提出,簡寫為 NE; 完全訊息的動態賽局:塞爾登提出子賽局完美均衡,簡寫為 SPNE; 不完全訊息的靜態賽局:哈珊伊的貝氏--納許均衡,簡寫為 BNE 他們三人在一九九四年共同得到諾貝爾獎. 囚犯困境. 前提:坦白從寬,抗拒從嚴。 乙罪犯 否 認 承 認 甲罪犯 否 認 (-1,-1) (-9, 0 )
E N D
賽局理論與應用 潘敏政 2003/12/31
賽局的架構可依「靜態/動態」和「完全訊息/不完全訊息」二種分類標準 : 完全訊息中的靜態賽局:均衡觀念是納許提出,簡寫為NE; 完全訊息的動態賽局:塞爾登提出子賽局完美均衡,簡寫為SPNE; 不完全訊息的靜態賽局:哈珊伊的貝氏--納許均衡,簡寫為BNE 他們三人在一九九四年共同得到諾貝爾獎
囚犯困境 • 前提:坦白從寬,抗拒從嚴。 乙罪犯 否 認 承 認 甲罪犯 否 認 (-1,-1) (-9,0) 承 認 (0,-9) (-6,-6)
公園賣冰糖葫蘆的納許均衡 • 兩家店都向中間靠攏,直到0.5 點才會停止,這樣達到的狀態,雖未必對遊客最有利,但是相當穩定,任一家店都不想再移動,這就是商店競爭的「納許均衡」。納許均衡是約翰-納許在他博士論文中提出來的均衡觀念,到達均衡後「任一參賽者均無誘因單方面偏離此均衡」,以此作為檢驗納許均衡的標準。另外一個方法是定義納許均衡為「一組互為最適反應的策略組合」,因為已是最適反應,所以任何一方均無誘因單方面偏離,這二個定義是等值的 • 大家都往中間靠產生群聚效應,這就是賽局分析中一個有趣的現象。
價值報酬結構的設計 由前面可以知道,由於不同的價值報酬,經由分析,會產生不同的納許平衡,因此這牽涉到最後決策的兩面。 第一:參賽者的價值觀不同或評估的方式不同產生不同的決策; 第二:如何科學化合理的設計價值報酬結構。 第一個方面牽涉到參賽者主觀特性,意即在管理上的藝術性;而第二方面稱為客觀的評估,
在賽局中找尋最適策略 1. 在靜態賽局中,如果找得到自己的「優勢策略」,就應該使用;同時如果知道對手有「優勢策略」,也必須相信對手會使用優勢策略。如果任何一方有劣勢策略,也可將之排除,再作之後的推論。如果找得到純粹策略納許均衡,就應該使用均衡策略。如果找不到純粹納許均衡,就應該考慮使用納許均衡的混合策略。
2. 在完全訊息動態賽局中,一定要考慮對手的反應,瞭解對手怎麼反應後再決定自己的最適策略,這是求取「子賽局完美均衡(SPNE)」---使用逆向歸納法。
3. 在不完全訊息動態賽局中,優勢策略--最大的極小策略報酬--策略性行動是為可採行的步驟;在過程中邊緣運用策略的利用亦為可行。其中「觸發報復策略」--懸崖邊緣運用,固然會造成彼此冤冤相報,永難達到雙贏的結果,即使採取「跟隨策略」--緩坡邊緣運用,也常陷於困境,不得解救。
簡言之,「跟隨策略」,就是「以牙還牙,以眼還眼」,只要對手有一期不小心犯錯,你這一期立刻予以懲罰,而對手看這一期你背離合作,他下一期也背離合作,反覆報復下去,就永遠達不到雙贏的結果。因為對手不知自己採取的是「觸發報復策略」或「跟隨策略」。所以應採取「期限型的報復策略」,這樣的動態策略具備「會被觸怒」、「能寬恕」,對手只要回頭合作,自己下期也願意與之合作一等特性,能帶領雙方脫離囚犯困境,但在不完全訊息動態賽局中,一定要明確揭露自己有個「會被觸怒」策略。
以上情況皆應符合「最大的極小策略報酬」;此外,合作與不合作在靜態賽局中常是薄弱的條件,雖如此,但基於商業的聲譽或個人的信用應從更廣的角度去思考。
結 論 1. 賽局理論是個有趣的模型,不僅在經濟、在心理、商業、政治、談判等皆有相關的應用。或許上帝與納許的賽局,其納許均衡發生在(心智喪失,得獎)之間,世間的巧合就如同賽局中的納許均衡吧!
2. 在實際環境中,並不會看到有個明顯的賽局放在桌上等你來出招,你也不一定非要接受某個給定的賽局。參賽者可經由自己的創意,設法適時創造一個賽局,或訂定賽局的遊戲規則,或影響出招的先後與策略的多寡,這才是人生的真實賽局,永遠充滿著不確定性與漂浮不定的驚奇。