algorithmic game theory chapter 2 the complexity of finding nash equilibria n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Algorithmic Game Theory, Chapter 2 The Complexity of Finding Nash Equilibria PowerPoint Presentation
Download Presentation
Algorithmic Game Theory, Chapter 2 The Complexity of Finding Nash Equilibria

Loading in 2 Seconds...

play fullscreen
1 / 40

Algorithmic Game Theory, Chapter 2 The Complexity of Finding Nash Equilibria - PowerPoint PPT Presentation


  • 109 Views
  • Uploaded on

2010/10/22, 今井研究室 輪読 冬学期. Algorithmic Game Theory, Chapter 2 The Complexity of Finding Nash Equilibria. 秋葉 拓哉 (B4). 内容 (1/2). Introduction 計算量を考える意味 ,組合せ的側面 Is the Nash Equilibrium Problem NP-Complete? NP 完全ではないこと The Lemke- Howson Algorithm ★ ナッシュ均衡を求めるアルゴリズム The Class PPAD

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Algorithmic Game Theory, Chapter 2 The Complexity of Finding Nash Equilibria' - amos-dunn


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide2
内容 (1/2)
  • Introduction
    • 計算量を考える意味,組合せ的側面
  • Is the Nash Equilibrium Problem NP-Complete?
    • NP 完全ではないこと
  • The Lemke-HowsonAlgorithm★
    • ナッシュ均衡を求めるアルゴリズム
  • The Class PPAD
    • 問題 Nash が属する計算量クラス
slide3
内容 (2/2)
  • Succinct Representations of Games
    • ゲームを入力とする際の入力長に関する考察
  • The Reduction
    • PPAD 完全,問題 Brower から Nash への帰着
  • Correlated Equilibria★
    • 第三者による recommendation と均衡

★ が付いているものは他に比べて多く話す項目

slide5
計算量を考える意味

全ての有限ゲームは mixed Nash equibriumを持つ

では,それは簡単に計算できるのか?

(先週 LP で解けたのは two-player zero-sum game のみ)

  • 経済との関連
    • “If your laptop cannot find it, neither can the market” (Kamal Jain)
    • 効率的に計算できない ≒ あまり自然な帰結ではないかもしれない
best responses supports
Best responses & Supports

  • 用語
  • pure strategy: 1 つの決定的な戦略
  • mixed strategy: 確率分布に従って戦略を決定する
    • (pure strategy ⊂ mixed strategy)
  • best response: payoff の期待値が最良となる strategy(相手の strategy は given)
  • support: ある mixed strategy で確率が正となっている pure strategy

相手の戦略

相手の mixed strategy が (0, 1/3, 2/3)

自分の best response も (0, 1/3, 2/3)

Support は strategy 2, 3 の 2 つ

自分

戦略

数字は payoff

slide7
組合せ的問題であること (1/2)

以降,問題 Nash について考えてゆく.

Best response と support に関わる定理

略証

背理法による.best response でない strategy が含まれていたら,それを取り除いた方がより良くなるので矛盾.

定義 Nash (問題)

ゲームが strategic form で与えられた時,ナッシュ均衡を1 つ求めよ.

定理 2.1 ある mixed strategy が best response

⇔ その strategy の support が全て best response

これは pure strategy

slide8
組合せ的問題であること (2/2)

support が得られれば,連立方程式が立つ

  • 特に 2-player の場合は 線形

組合せ的であると言える

ナッシュ均衡を探すこと

正しい support を探すこと

nash np
問題 Nash は NP 完全ではない
  • 問題 Nash は,全てのゲームはナッシュ均衡を持つという点で特殊
  • Nash が NP 完全であることを仮定すると,NP=coNPとなってしまう(証明略)
  • よって,Nash は NP 完全ではないと考えられる
brower s fixpoint theorem
Brower’s fixpoint theorem
  • ナッシュ均衡の存在証明はこの定理への帰着
  • Brower’s fixpointを探すことは,やはり難しい問題として知られている
  • 実はさらに,Brower’s fixpointを探すことを Nash へ帰着できる!(後述)

Brower’s fixpoint theorem

任意の連続関数 f : Un→ Un(Un : n次元単位球) は不動点を持つ

(不動点:f(x) = x なる点)

lemke howson algorithm
Lemke-Howson Algorithm
  • 2-player game のNash 均衡を求める最良の組合せ的アルゴリズムの 1 つ
  • support の組合せ的構造を用いる
  • simplex pivoting を繰り返す
symmetric game 1 2
Symmetric Game への帰着 (1/2)
  • 用語
  • symmetric game: 行列 A, B で表される bimatrix game で A = BT
    • (つまり,相手と自分は全くおなじ状況)
  • symmetric Nash equilibrium: 2 人がおなじ mixed strategy での Nash equilibrium

定義 Symmetric Nash (問題)

Symmetric game が与えられたとき,symmetric Nash equilibrium を 1 つ求めよ

symmetric game 2 2
Symmetric Game への帰着 (2/2)

略証

行列 A, B で表される2-player game について,

で表される symmetric game を考え,その symmetric Nash equilibrium を

(x, y) とおく.(A の行数を mとしたとき,xは最初の m要素とする)

このとき,xは yへのbest response,yは xへのbest response.

定理 2.4 Nash から Symmetric Nash へのpolynomial reduction が存在

よって,以下では Symmetric Nash を考える

slide16
凸多面体 (1/3)

n × n 行列 Aで表現される symmetric2-player game

  • WLOG. Aの要素はすべて非負,全て 0 の行なし

以下の凸多面体 Pを考える

性質:

空でない ,有界

以下,非退化 (nondegenerate) を仮定

Az≦ 1,z≧ 0

(2n個の不等式)

slide17
凸多面体 (2/3)

Az≦ 1,z≧ 0

  • 用語
  • represented: 以下の1 つ以上が満たされるとき,戦略 iは represented
    • zi= 0
    • Aiz = 1
  • representedtwice: 両方が満たされている時
slide18
凸多面体 (3/3)

Az≦ 1,z≧ 0

頂点 z (≠ 0) において全ての戦略が represented のとき,

なる xは symmetric Nash equilibrium である.

略証Aiz= 1 の戦略 i は best strategy,全ての support は best strategy

(和が 1 になるように正規化)

よって,全ての戦略が represented となる

(0 以外の) 頂点を探したい!

pivoting 1 5
Pivoting(1/5)
  • degenerate の仮定より,各頂点はn個の隣接点を持つ
  • 隣接点への移動は,以下と同じ
    • 1 つのtight な不等式を relaxし (tight ではなくし),
    • 別のある 1 つのtight でない 不等式を tight にする
  • 戦略 1 以外の全ての戦略が representedとなっている頂点集合 Vを考える
    • 0 は全ての戦略が represented,0 ∈ Vのため空でない
  • Vの中でのパス <v0, v1, v2, …> を考える
pivoting 2 5
Pivoting (2/5)

アルゴリズムLemke-Howson

  • 初期化
    • 頂点 0からスタート,v0 = 0
    • v0 から,第 1 要素のみ非ゼロの隣接頂点 v1 に移動
      • ここでは,戦略 1 以外の戦略は全て represented
      • よって,v1∈ V

(次スライドへ続く)

pivoting 3 5
Pivoting (3/5)

アルゴリズムLemke-Howson

(前スライドの続き)

  • i = 1, 2, … で繰り返す
    • 全ての戦略が represented ⇒ 完了!
    • そうでないなら,ある戦略 j (j > 1)が represented twiceのはず
      • n個の tight な不等式,n-1個の represented な戦略,鳩の巣原理
      • vij = 0 かつ Ajvi = 1
    • jに関する 2 つの不等式の片方を relax して vi+1とする
      • 2 つの可能性のうち片方は vi-1なので,そうでない方を選ぶ
pivoting 4 5
Pivoting (4/5)

  • 頂点に書いてあるのは represented な戦略の集合
  • 肩に 2 と書いてあるものは represented twice

細かいこと

この図の例では,戦略 1 の代わりに戦略 2 がrepresented でないことを許している.

pivoting 5 5
Pivoting (5/5)

Lemke-Howsonが終了すること:

  • ループは有り得ない
    • V の点で Vに含まれる隣接点は 2 つ以下
  • 0 にも戻らない
    • 0 の Vに含まれる隣接点は 1 つ

これは,two-player, nondegenerate game に mixed Nash equilibrium が存在することの証明でもある

残念ながら,Lemke-Howsonは効率的とは言えない

  • 頂点の個数が指数的に増加

有り得ない状況

slide25
クラス PPAD
  • Lemke-Howsonはpath のようなグラフの上を辿る
    • 各頂点,入次数・出次数 1 以下
    • 1 つのsource が既知 (standard source)
    • 頂点数が指数的に増加
    • 別の source あるいは sink が解
    • (他にも条件…)
  • 同様の状況となる問題が知られている
    • Approximate Brouwerfixpoint
    • Ham Sandwitch
      • n次元上の 2n個の点が与えられ,半分に分割する超平面を求める
  • これらの問題の計算量クラスを PPADと呼ぶ
    • Polynomial Parity Arguments on Directed graphs
ppad complete
クラス PPAD-Complete
  • PPAD-Complete となる問題が存在する
    • 全ての PPAD の問題を帰着可能
  • Brower, Nash は PPAD-Complete
    • Section 2.6 で示されること
slide28
問題 Nash の入力長

問題 Nash ではゲームが入力だが,ゲームの記述の長さはどうなるのか?

全ての組み合わせに関する payoff を与える方法

  • 2-player の場合
    • 戦略の個数が mと n なら,2mn個の数
  • n-player の場合
    • 戦略の個数が s なら,nsn個の数 (とても大きい!)
    • 自明なアルゴリズムが nに関して多項式になる…
      • 全ての support の組み合わせを試せばよい,(2s)n通り

大きい人数の問題を考える際,これは好ましくない

succinctly representable
Succinctly Representableなゲーム

入力としてより簡潔に表現できるゲーム

  • Graphical Games
    • プレーヤの関係のグラフが存在
    • 隣接するプレーヤの戦略のみが自分の payoff に影響
  • その他
    • Sparse Games:nsn個の paoyffの一部だけが非ゼロ
    • Symmetric Games: プレーヤは全て同じ
    • Anonymous Games: 他のプレーヤは全て同じ
  • それ以外にもいっぱいあります

以降は Succinctly Representableなゲームを扱う

slide31
証明されること
  • 問題 Brower が PPAD-Complete であることは既知
    • Brower は Brower’s fixpointを探す問題を離散化した物
  • 問題 Brower を問題 Nash に帰着する
    • Nash が PPAD-Complete であると分かる
    • ここで Brower は unit cube 上とする
slide32
概要

Brower のインスタンスから Graphical Game を作る

  • 全てのプレーヤは 0, 1 の 2 つの戦略 のみ
    • mixed strategy は [0, 1] の 1 つの実数で表せる
  • 3 人のプレーヤが cube 上の座標を表す
  • 残りのプレーヤが Brower の関数をシミュレートし,不動点でないと均衡が起こらないようにする

証明の詳細は省略

chicken 1 3
ゲーム Chicken (1/3)

下の行列で表される symmetric game

(交差点で,止まるか・進むか)

相手

止まる

進む

止まる

自分

進む

chicken 2 3
ゲーム Chicken (2/3)

Nash equilibrium における戦略の確率分布:3 通り

確率分布が下のようになるのは自然

  • 半分の確率でどちらかが進む

しかし,これは Nash equibriumでは得られない

chicken 3 3
ゲーム Chicken (3/3)

この確率分布を得るためには,第三者が必要

  • 交差点の例では,信号のようなもの

第三者が各プレーヤの戦略を recommendationとして指定することを考える

correlated equilibrium 1 3
Correlated Equilibrium (1/3)
  • 用語
  • self-enforcing: 他のプレーヤが従うならば自分も従うのが最良であるような recommendation (の分布)の状況

定義correlated equilibrium

recommendation の確率分布であって,全プレーヤについて self-enforcing なもの

  • 各プレーヤが受け取るのは自分についての recommendation のみ
    • 全体への recommendation ではない
  • 各プレーヤは全体への recommendation の分布は知っている
    • 期待値的に self-enforcing であればよい
correlated equilibrium 2 3
Correlated Equilibrium (2/3)

式で表現(この式を以降 CEと呼ぶ)

プレーヤ iが戦略 jをrecommend された状況での条件

  • S-i : プレーヤ iを除いた全プレーヤの戦略の組合せ
  • sj, sj’ : プレーヤ i 以外の戦略を s, プレーヤ i の戦略を j, j’
  • us: payoff
  • ps: recommendation の確率分布
correlated equilibrium 3 3
Correlated Equilibrium (3/3)

ゲーム Chicken での CE の例

CE 不等式は psに関して線形なので,

Correlated Nash equilibrium は LP で求まる!

correlated vs nash
Correlated vs Nash

普通の mixed Nash equilibrium は,Correlated equilibrium の特殊なケース

    • Nash equilibrium ⊂ Correlated equilibrium
  • Mixed Nash equilibrium: 計算困難
  • Correlated equilibrium: 多項式時間で計算可能

(3 人以上の場合はその限りではない)

定理 2.5nondegenerate 2-player game において Nash equilibriaは CE 不等式で作られる多面体の頂点