1 / 12

賽局理論 與應用 潘敏政 2003/12/31

賽局理論 與應用 潘敏政 2003/12/31. 賽局的架構可依「靜態/動態」和「完全訊息/不完全訊息」二種分類標準 : 完全訊息中的靜態賽局:均衡觀念是納許提出,簡寫為 NE; 完全訊息的動態賽局:塞爾登提出子賽局完美均衡,簡寫為 SPNE; 不完全訊息的靜態賽局:哈珊伊的貝氏--納許均衡,簡寫為 BNE 他們三人在一九九四年共同得到諾貝爾獎. 囚犯困境. 前提:坦白從寬,抗拒從嚴。 乙罪犯 否 認 承 認 甲罪犯 否 認 (-1,-1) (-9, 0 )

adora
Download Presentation

賽局理論 與應用 潘敏政 2003/12/31

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 賽局理論與應用 潘敏政 2003/12/31

  2. 賽局的架構可依「靜態/動態」和「完全訊息/不完全訊息」二種分類標準 : 完全訊息中的靜態賽局:均衡觀念是納許提出,簡寫為NE; 完全訊息的動態賽局:塞爾登提出子賽局完美均衡,簡寫為SPNE; 不完全訊息的靜態賽局:哈珊伊的貝氏--納許均衡,簡寫為BNE 他們三人在一九九四年共同得到諾貝爾獎

  3. 囚犯困境 • 前提:坦白從寬,抗拒從嚴。 乙罪犯 否 認 承 認 甲罪犯 否 認 (-1,-1) (-9,0) 承 認 (0,-9) (-6,-6)

  4. 公園賣冰糖葫蘆的納許均衡 • 兩家店都向中間靠攏,直到0.5 點才會停止,這樣達到的狀態,雖未必對遊客最有利,但是相當穩定,任一家店都不想再移動,這就是商店競爭的「納許均衡」。納許均衡是約翰-納許在他博士論文中提出來的均衡觀念,到達均衡後「任一參賽者均無誘因單方面偏離此均衡」,以此作為檢驗納許均衡的標準。另外一個方法是定義納許均衡為「一組互為最適反應的策略組合」,因為已是最適反應,所以任何一方均無誘因單方面偏離,這二個定義是等值的 • 大家都往中間靠產生群聚效應,這就是賽局分析中一個有趣的現象。

  5. 價值報酬結構的設計 由前面可以知道,由於不同的價值報酬,經由分析,會產生不同的納許平衡,因此這牽涉到最後決策的兩面。 第一:參賽者的價值觀不同或評估的方式不同產生不同的決策; 第二:如何科學化合理的設計價值報酬結構。 第一個方面牽涉到參賽者主觀特性,意即在管理上的藝術性;而第二方面稱為客觀的評估,

  6. 在賽局中找尋最適策略 1. 在靜態賽局中,如果找得到自己的「優勢策略」,就應該使用;同時如果知道對手有「優勢策略」,也必須相信對手會使用優勢策略。如果任何一方有劣勢策略,也可將之排除,再作之後的推論。如果找得到純粹策略納許均衡,就應該使用均衡策略。如果找不到純粹納許均衡,就應該考慮使用納許均衡的混合策略。

  7. 2. 在完全訊息動態賽局中,一定要考慮對手的反應,瞭解對手怎麼反應後再決定自己的最適策略,這是求取「子賽局完美均衡(SPNE)」---使用逆向歸納法。

  8. 3. 在不完全訊息動態賽局中,優勢策略--最大的極小策略報酬--策略性行動是為可採行的步驟;在過程中邊緣運用策略的利用亦為可行。其中「觸發報復策略」--懸崖邊緣運用,固然會造成彼此冤冤相報,永難達到雙贏的結果,即使採取「跟隨策略」--緩坡邊緣運用,也常陷於困境,不得解救。

  9. 簡言之,「跟隨策略」,就是「以牙還牙,以眼還眼」,只要對手有一期不小心犯錯,你這一期立刻予以懲罰,而對手看這一期你背離合作,他下一期也背離合作,反覆報復下去,就永遠達不到雙贏的結果。因為對手不知自己採取的是「觸發報復策略」或「跟隨策略」。所以應採取「期限型的報復策略」,這樣的動態策略具備「會被觸怒」、「能寬恕」,對手只要回頭合作,自己下期也願意與之合作一等特性,能帶領雙方脫離囚犯困境,但在不完全訊息動態賽局中,一定要明確揭露自己有個「會被觸怒」策略。

  10. 以上情況皆應符合「最大的極小策略報酬」;此外,合作與不合作在靜態賽局中常是薄弱的條件,雖如此,但基於商業的聲譽或個人的信用應從更廣的角度去思考。

  11. 結 論 1. 賽局理論是個有趣的模型,不僅在經濟、在心理、商業、政治、談判等皆有相關的應用。或許上帝與納許的賽局,其納許均衡發生在(心智喪失,得獎)之間,世間的巧合就如同賽局中的納許均衡吧!

  12. 2. 在實際環境中,並不會看到有個明顯的賽局放在桌上等你來出招,你也不一定非要接受某個給定的賽局。參賽者可經由自己的創意,設法適時創造一個賽局,或訂定賽局的遊戲規則,或影響出招的先後與策略的多寡,這才是人生的真實賽局,永遠充滿著不確定性與漂浮不定的驚奇。

More Related