賽局理論與應用潘敏政 2003/12/31

賽局理論與應用 潘敏政 2003/12/31

賽局的架構可依「靜態/動態」和「完全訊息/不完全訊息」二種分類標準 : 完全訊息中的靜態賽局:均衡觀念是納許提出，簡寫為NE; 完全訊息的動態賽局:塞爾登提出子賽局完美均衡，簡寫為SPNE；不完全訊息的靜態賽局:哈珊伊的貝氏--納許均衡，簡寫為BNE 他們三人在一九九四年共同得到諾貝爾獎

囚犯困境 • 前提：坦白從寬，抗拒從嚴。乙罪犯否認承認甲罪犯否認（-1，-1）（-9，0）承認（0，-9）（-6，-6）

公園賣冰糖葫蘆的納許均衡 • 兩家店都向中間靠攏，直到0.5 點才會停止，這樣達到的狀態，雖未必對遊客最有利，但是相當穩定，任一家店都不想再移動，這就是商店競爭的「納許均衡」。納許均衡是約翰-納許在他博士論文中提出來的均衡觀念，到達均衡後「任一參賽者均無誘因單方面偏離此均衡」，以此作為檢驗納許均衡的標準。另外一個方法是定義納許均衡為「一組互為最適反應的策略組合」，因為已是最適反應，所以任何一方均無誘因單方面偏離，這二個定義是等值的 • 大家都往中間靠產生群聚效應，這就是賽局分析中一個有趣的現象。

價值報酬結構的設計 由前面可以知道，由於不同的價值報酬，經由分析，會產生不同的納許平衡，因此這牽涉到最後決策的兩面。第一：參賽者的價值觀不同或評估的方式不同產生不同的決策；第二：如何科學化合理的設計價值報酬結構。第一個方面牽涉到參賽者主觀特性，意即在管理上的藝術性；而第二方面稱為客觀的評估，

在賽局中找尋最適策略 1. 在靜態賽局中，如果找得到自己的「優勢策略」，就應該使用；同時如果知道對手有「優勢策略」，也必須相信對手會使用優勢策略。如果任何一方有劣勢策略，也可將之排除，再作之後的推論。如果找得到純粹策略納許均衡，就應該使用均衡策略。如果找不到純粹納許均衡，就應該考慮使用納許均衡的混合策略。

2. 在完全訊息動態賽局中，一定要考慮對手的反應，瞭解對手怎麼反應後再決定自己的最適策略，這是求取「子賽局完美均衡(SPNE)」---使用逆向歸納法。

3. 在不完全訊息動態賽局中，優勢策略--最大的極小策略報酬--策略性行動是為可採行的步驟；在過程中邊緣運用策略的利用亦為可行。其中「觸發報復策略」--懸崖邊緣運用，固然會造成彼此冤冤相報，永難達到雙贏的結果，即使採取「跟隨策略」--緩坡邊緣運用，也常陷於困境，不得解救。

簡言之，「跟隨策略」，就是「以牙還牙，以眼還眼」，只要對手有一期不小心犯錯，你這一期立刻予以懲罰，而對手看這一期你背離合作，他下一期也背離合作，反覆報復下去，就永遠達不到雙贏的結果。因為對手不知自己採取的是「觸發報復策略」或「跟隨策略」。所以應採取「期限型的報復策略」，這樣的動態策略具備「會被觸怒」、「能寬恕」，對手只要回頭合作，自己下期也願意與之合作一等特性，能帶領雙方脫離囚犯困境，但在不完全訊息動態賽局中，一定要明確揭露自己有個「會被觸怒」策略。

以上情況皆應符合「最大的極小策略報酬」；此外，合作與不合作在靜態賽局中常是薄弱的條件，雖如此，但基於商業的聲譽或個人的信用應從更廣的角度去思考。

結論 1. 賽局理論是個有趣的模型，不僅在經濟、在心理、商業、政治、談判等皆有相關的應用。或許上帝與納許的賽局，其納許均衡發生在（心智喪失，得獎）之間，世間的巧合就如同賽局中的納許均衡吧！

2. 在實際環境中，並不會看到有個明顯的賽局放在桌上等你來出招，你也不一定非要接受某個給定的賽局。參賽者可經由自己的創意，設法適時創造一個賽局，或訂定賽局的遊戲規則，或影響出招的先後與策略的多寡，這才是人生的真實賽局，永遠充滿著不確定性與漂浮不定的驚奇。

賽局理論與應用潘敏政 2003/12/31