Algorithmic Game Theory, Chapter 2 The Complexity of Finding Nash Equilibria

2010/10/22, 今井研究室輪読冬学期 Algorithmic Game Theory, Chapter 2The Complexity of FindingNash Equilibria 秋葉拓哉 (B4)

内容 (1/2) • Introduction • 計算量を考える意味，組合せ的側面 • Is the Nash Equilibrium Problem NP-Complete? • NP 完全ではないこと • The Lemke-HowsonAlgorithm★ • ナッシュ均衡を求めるアルゴリズム • The Class PPAD • 問題 Nash が属する計算量クラス

内容 (2/2) • Succinct Representations of Games • ゲームを入力とする際の入力長に関する考察 • The Reduction • PPAD 完全，問題 Brower から Nash への帰着 • Correlated Equilibria★ • 第三者による recommendation と均衡 ★ が付いているものは他に比べて多く話す項目

計算量を考える意味，組合せ的側面 2.1 Introduction

計算量を考える意味 全ての有限ゲームは mixed Nash equibriumを持つでは，それは簡単に計算できるのか？（先週 LP で解けたのは two-player zero-sum game のみ） • 経済との関連 • “If your laptop cannot find it, neither can the market” (Kamal Jain) • 効率的に計算できない ≒ あまり自然な帰結ではないかもしれない

Best responses & Supports 例 • 用語 • pure strategy: 1 つの決定的な戦略 • mixed strategy: 確率分布に従って戦略を決定する • (pure strategy ⊂ mixed strategy) • best response: payoff の期待値が最良となる strategy(相手の strategy は given) • support: ある mixed strategy で確率が正となっている pure strategy 相手の戦略相手の mixed strategy が (0, 1/3, 2/3) 自分の best response も (0, 1/3, 2/3) Support は strategy 2, 3 の 2 つ自分の戦略数字は payoff

組合せ的問題であること (1/2) 以降，問題 Nash について考えてゆく． Best response と support に関わる定理略証背理法による．best response でない strategy が含まれていたら，それを取り除いた方がより良くなるので矛盾．定義 Nash (問題) ゲームが strategic form で与えられた時，ナッシュ均衡を1 つ求めよ．定理 2.1 ある mixed strategy が best response ⇔ その strategy の support が全て best response これは pure strategy

組合せ的問題であること (2/2) support が得られれば，連立方程式が立つ • 特に 2-player の場合は線形組合せ的であると言えるナッシュ均衡を探すこと ≒ 正しい support を探すこと

NP 完全ではないこと 2.2 Is the Nash Equilibrium Problem NP-Complete?

問題 Nash は NP 完全ではない • 問題 Nash は，全てのゲームはナッシュ均衡を持つという点で特殊 • Nash が NP 完全であることを仮定すると，NP=coNPとなってしまう（証明略） • よって，Nash は NP 完全ではないと考えられる

Brower’s fixpoint theorem • ナッシュ均衡の存在証明はこの定理への帰着 • Brower’s fixpointを探すことは，やはり難しい問題として知られている • 実はさらに，Brower’s fixpointを探すことを Nash へ帰着できる！（後述） Brower’s fixpoint theorem 任意の連続関数 f : Un→ Un(Un : n次元単位球) は不動点を持つ（不動点：f(x) = x なる点）

ナッシュ均衡を求めるアルゴリズム 2.3 The Lemke-Howson Algorithm

Lemke-Howson Algorithm • 2-player game のNash 均衡を求める最良の組合せ的アルゴリズムの 1 つ • support の組合せ的構造を用いる • simplex pivoting を繰り返す

Symmetric Game への帰着 (1/2) • 用語 • symmetric game: 行列 A, B で表される bimatrix game で A = BT • （つまり，相手と自分は全くおなじ状況） • symmetric Nash equilibrium: 2 人がおなじ mixed strategy での Nash equilibrium 定義 Symmetric Nash (問題) Symmetric game が与えられたとき，symmetric Nash equilibrium を 1 つ求めよ

Symmetric Game への帰着 (2/2) 略証行列 A, B で表される2-player game について，で表される symmetric game を考え，その symmetric Nash equilibrium を (x, y) とおく．（A の行数を mとしたとき，xは最初の m要素とする）このとき，xは yへのbest response，yは xへのbest response．定理 2.4 Nash から Symmetric Nash へのpolynomial reduction が存在よって，以下では Symmetric Nash を考える

凸多面体 (1/3) n × n 行列 Aで表現される symmetric2-player game • WLOG. Aの要素はすべて非負，全て 0 の行なし以下の凸多面体 Pを考える性質: 空でない，有界以下，非退化 (nondegenerate) を仮定 Az≦ 1，z≧ 0 (2n個の不等式)

凸多面体 (2/3) Az≦ 1，z≧ 0 • 用語 • represented: 以下の1 つ以上が満たされるとき，戦略 iは represented • zi= 0 • Aiz = 1 • representedtwice: 両方が満たされている時

凸多面体 (3/3) Az≦ 1，z≧ 0 頂点 z (≠ 0) において全ての戦略が represented のとき，なる xは symmetric Nash equilibrium である．略証Aiz= 1 の戦略 i は best strategy，全ての support は best strategy （和が 1 になるように正規化）よって，全ての戦略が represented となる (0 以外の) 頂点を探したい！

Pivoting(1/5) • degenerate の仮定より，各頂点はn個の隣接点を持つ • 隣接点への移動は，以下と同じ • 1 つのtight な不等式を relaxし (tight ではなくし)， • 別のある 1 つのtight でない不等式を tight にする • 戦略 1 以外の全ての戦略が representedとなっている頂点集合 Vを考える • 0 は全ての戦略が represented，0 ∈ Vのため空でない • Vの中でのパス <v0, v1, v2, …> を考える

Pivoting (2/5) アルゴリズムLemke-Howson • 初期化 • 頂点 0からスタート，v0 = 0 • v0 から，第 1 要素のみ非ゼロの隣接頂点 v1 に移動 • ここでは，戦略 1 以外の戦略は全て represented • よって，v1∈ V （次スライドへ続く）

Pivoting (3/5) アルゴリズムLemke-Howson (前スライドの続き) • i = 1, 2, … で繰り返す • 全ての戦略が represented ⇒ 完了！ • そうでないなら，ある戦略 j (j > 1)が represented twiceのはず • n個の tight な不等式，n-1個の represented な戦略，鳩の巣原理 • vij = 0 かつ Ajvi = 1 • jに関する 2 つの不等式の片方を relax して vi+1とする • 2 つの可能性のうち片方は vi-1なので，そうでない方を選ぶ

Pivoting (4/5) 例 • 頂点に書いてあるのは represented な戦略の集合 • 肩に 2 と書いてあるものは represented twice 細かいことこの図の例では，戦略 1 の代わりに戦略 2 がrepresented でないことを許している．

Pivoting (5/5) Lemke-Howsonが終了すること： • ループは有り得ない • V の点で Vに含まれる隣接点は 2 つ以下 • 0 にも戻らない • 0 の Vに含まれる隣接点は 1 つこれは，two-player, nondegenerate game に mixed Nash equilibrium が存在することの証明でもある残念ながら，Lemke-Howsonは効率的とは言えない • 頂点の個数が指数的に増加有り得ない状況

問題 Nash が属する計算量クラス 2.4 The Class PPAD

クラス PPAD • Lemke-Howsonはpath のようなグラフの上を辿る • 各頂点，入次数・出次数 1 以下 • 1 つのsource が既知 (standard source) • 頂点数が指数的に増加 • 別の source あるいは sink が解 • （他にも条件…） • 同様の状況となる問題が知られている • Approximate Brouwerfixpoint • Ham Sandwitch • n次元上の 2n個の点が与えられ，半分に分割する超平面を求める • これらの問題の計算量クラスを PPADと呼ぶ • Polynomial Parity Arguments on Directed graphs

クラス PPAD-Complete • PPAD-Complete となる問題が存在する • 全ての PPAD の問題を帰着可能 • Brower, Nash は PPAD-Complete • Section 2.6 で示されること

ゲームを入力とする際の入力長に関する考察 2.5 Succinct Representations of Games

問題 Nash の入力長 問題 Nash ではゲームが入力だが，ゲームの記述の長さはどうなるのか？全ての組み合わせに関する payoff を与える方法 • 2-player の場合 • 戦略の個数が mと n なら，2mn個の数 • n-player の場合 • 戦略の個数が s なら，nsn個の数（とても大きい！） • 自明なアルゴリズムが nに関して多項式になる… • 全ての support の組み合わせを試せばよい，(2s)n通り大きい人数の問題を考える際，これは好ましくない

Succinctly Representableなゲーム 入力としてより簡潔に表現できるゲーム • Graphical Games • プレーヤの関係のグラフが存在 • 隣接するプレーヤの戦略のみが自分の payoff に影響 • その他 • Sparse Games:nsn個の paoyffの一部だけが非ゼロ • Symmetric Games: プレーヤは全て同じ • Anonymous Games: 他のプレーヤは全て同じ • それ以外にもいっぱいあります以降は Succinctly Representableなゲームを扱う

PPAD 完全，問題 Brower から Nash への帰着 2.6 The Reduction

証明されること • 問題 Brower が PPAD-Complete であることは既知 • Brower は Brower’s fixpointを探す問題を離散化した物 • 問題 Brower を問題 Nash に帰着する • Nash が PPAD-Complete であると分かる • ここで Brower は unit cube 上とする

概要 Brower のインスタンスから Graphical Game を作る • 全てのプレーヤは 0, 1 の 2 つの戦略のみ • mixed strategy は [0, 1] の 1 つの実数で表せる • 3 人のプレーヤが cube 上の座標を表す • 残りのプレーヤが Brower の関数をシミュレートし，不動点でないと均衡が起こらないようにする証明の詳細は省略

第三者による recommendation と均衡 2.7 Correlated Equilibria

ゲーム Chicken (1/3) 下の行列で表される symmetric game （交差点で，止まるか・進むか）相手止まる進む止まる自分進む

ゲーム Chicken (2/3) Nash equilibrium における戦略の確率分布：3 通り確率分布が下のようになるのは自然 • 半分の確率でどちらかが進むしかし，これは Nash equibriumでは得られない

ゲーム Chicken (3/3) この確率分布を得るためには，第三者が必要 • 交差点の例では，信号のようなもの第三者が各プレーヤの戦略を recommendationとして指定することを考える

Correlated Equilibrium (1/3) • 用語 • self-enforcing: 他のプレーヤが従うならば自分も従うのが最良であるような recommendation (の分布)の状況定義correlated equilibrium recommendation の確率分布であって，全プレーヤについて self-enforcing なもの • 各プレーヤが受け取るのは自分についての recommendation のみ • 全体への recommendation ではない • 各プレーヤは全体への recommendation の分布は知っている • 期待値的に self-enforcing であればよい

Correlated Equilibrium (2/3) 式で表現（この式を以降 CEと呼ぶ）プレーヤ iが戦略 jをrecommend された状況での条件 • S-i : プレーヤ iを除いた全プレーヤの戦略の組合せ • sj, sj’ : プレーヤ i 以外の戦略を s, プレーヤ i の戦略を j, j’ • us: payoff • ps: recommendation の確率分布

Correlated Equilibrium (3/3) ゲーム Chicken での CE の例 CE 不等式は psに関して線形なので， Correlated Nash equilibrium は LP で求まる！

Correlated vs Nash 普通の mixed Nash equilibrium は，Correlated equilibrium の特殊なケース • Nash equilibrium ⊂ Correlated equilibrium • Mixed Nash equilibrium: 計算困難 • Correlated equilibrium: 多項式時間で計算可能（3 人以上の場合はその限りではない）定理 2.5nondegenerate 2-player game において Nash equilibriaは CE 不等式で作られる多面体の頂点

Algorithmic Game Theory, Chapter 2 The Complexity of Finding Nash Equilibria

Algorithmic Game Theory, Chapter 2 The Complexity of Finding Nash Equilibria

Presentation Transcript

Complexity Results about Nash Equilibria

Algorithmic Complexity 2

The Complexity of Pure Nash Equilibria

Minimax strategies, Nash equilibria, correlated equilibria

Game Theory: Mixed Strategy Nash Equilibrium

Nash Equilibria

Approximation in Algorithmic Game Theory Robust Approximation Bounds for Equilibria and Auctions

Algorithmic Complexity

Algorithmic Game Theory and Internet Computing

Nash Implementation of Lindahl Equilibria

Algorithmic Complexity

The Computational Complexity of Finding a Nash Equilibrium

The Computational Complexity of Finding Nash Equilibria

The complexity of Finding Nash Equilibria Ásbjörn H Kristbjörnsson

Complexity Results about Nash Equilibria

Game Theory and the Nash Equilibrium Part 2

Algorithmic Game Theory and Scheduling

Algorithmic Complexity

COMP108 Algorithmic Foundations Computational Complexity Theory

6.853: Topics in Algorithmic Game Theory

Algorithmic Complexity 2

Minimax strategies, Nash equilibria, correlated equilibria