480 likes | 654 Views
メカニズムデザインと最適化:ゲーム理論的制度設計への最適化技術の応用. 岩崎敦 九州大学 e-mail: iwasaki@inf.kyushu-u.ac.jp URL: https://sites.google.com/site/a2ciwasaki Twitter: @a2c_iwasaki. オークションメカニズム. 第一価格入札 自分が入札 した $250 を 支払う. 第一価格入札 $201 を入札 すれば利益が 増える. 第二価格入札 $250 を入札し, 支払いは $200 になる. 正直に入札 することで 一番得する. 第一価格入札.
E N D
メカニズムデザインと最適化:ゲーム理論的制度設計への最適化技術の応用メカニズムデザインと最適化:ゲーム理論的制度設計への最適化技術の応用 岩崎敦 九州大学 e-mail: iwasaki@inf.kyushu-u.ac.jp URL: https://sites.google.com/site/a2ciwasaki Twitter: @a2c_iwasaki
オークションメカニズム 第一価格入札 自分が入札 した$250を 支払う 第一価格入札 $201を入札 すれば利益が 増える 第二価格入札 $250を入札し, 支払いは$200になる 正直に入札 することで 一番得する 第一価格入札 最高額の入札者が 最高額で落札 第二価格入札 (Vickrey 入札) 最高額の入札者が 2番目に高い額で落札 正直が最良の策 2
どんな最適化? • 誘因制約付き組合せ最適化 (Combinatorial optimization with incentive constraint) • 何を最適化する? • 商品(財)やサービスを一番欲しい(≒お金を払う気がある)人達に割当 • 人々の選好/評価値/費用が正確に把握できるなら,a weighted set packing problemと等価 • 誘因制約とは? • 人々は自分の利益のために,割当や支払額を操作するために戦略的に嘘をつくかもしれない(利己的エージェント/戦略的エージェント). • 人々が正直に振る舞う誘因をもつように割当を決定する必要がある.
ゲーム理論的制度設計(メカニズムデザイン)ゲーム理論的制度設計(メカニズムデザイン) • 複数の戦略的エージェンに対して,望ましい結果をもたらすメカニズム/ルール/アルゴリズムの設計 • あるメカニズムが戦略的操作不可能 (strategy-proof) とは,各エージェントにとって正直に振る舞うことで,各エージェントの利益が最大化される.
代表的な実践例 • オークション • 周波数オークション • 国債の販売 • キーワード広告 • マッチング • 研修医マッチング • 学校選択制 • 臓器移植ネットワーク
要約 • 架空名義入札/操作の影響を受けない組合わせオークションメカニズムを自動的に設計する手法を紹介 • 架空名義入札/操作 • 1人が複数の名義を用いて入札することで不正に利益を増加させる行為 • メカニズムの自動設計(自動メカニズムデザイン) • メカニズム設計の問題を最適化問題として表現
アウトライン • 組合せオークションと架空名義操作 • Vickrey-Clarke-Groves メカニズム (VCG) • 既存の架空名義操作不可能なメカニズム • 適応的留保価格 (Adaptive reserve price, ARP) メカニズム • 自動メカニズムデザインによるARPメカニズムの発見
組合せオークション(複数種類の財のオークション)組合せオークション(複数種類の財のオークション) • 複数種類の財を同時に販売 • 財の価値の間に依存関係が存在 • 補完的: パソコンとメモリ • 代替的: VAIOとThinkPad • 財の組合せに対する入札を許すことにより,社会的余剰/売手の収入が増加 • 社会的余剰:売り手も含めた参加者の利益の総和 • FCC周波数帯域オークション • Googleなどのキーワード広告オークション • Combinatorial auctions, Cramton et al., 2006
架空名義操作 • 1人が複数の名義から入札をすること • ネットワーク環境では検出することは事実上不可能 • 架空名義操作不可能性 (false-name-proofness) • 架空の名義を用いて申告しても効用が増加しない • 戦略的操作不可能性 (strategy-proofness) の一般化 架空名義操作 入札
本研究の動機 • Vickrey-Clarke-Groves メカニズムはパレート効率性と戦略的操作不可能性を同時に満たす優れたメカニズムだが,架空名義入札により操作可能 • 戦略的操作不可能性と架空名義操作不可能性を同時に満たしつつパレート効率的な割当を実現するメカニズムは存在しない (Yokoo et al., GEB,2004) • 架空名義操作不可能性を実現するためには,効率性を犠牲にする必要がある. • 競合比(competitive ratio): パレート効率的な割当てとの比の最悪値 • できるだけ競合比が高いメカニズムのヒントを得るために自動メカニズムデザインを利用
各バンドル/財に対する最大入札額 bidder 0 bidder 1 bidder 2 • 3人の入札者がAとBの2財のオークションに参加 • 全ての入札者はは単一バンドル指向とする. • 各入札者は{A,B}, {A}のみ,{B}のみのいずれかに入札 • 各バンドル/財に対する最大入札額をv{A,B}, v{A}, v{B}とし,それぞれは入札者0, 1, 2が入札する. • W.l.o.g. v{A} ≧ v{B}. v{A,B} v{A} v{B}
Vickrey-Clarke-Groves メカニズム (VCG) • Grovesメカニズムのあるインスタンス,一般化ヴィックレーとも呼ばれる. • VCGでは,財を社会的余剰が最大化されるよう割り当てる. • 支払額には,勝者のクリティカル値 (critical value) を計算する. • (他者の入札を固定して)勝者が勝てる入札額の下限 • VCGは戦略的操作不可能,パレート効率的,かつ個人合理的であるが,架空名義操作不可能ではない.
$3 $1 VCGの例(その1) bidder 0 bidder 1 bidder 2 • 入札者1と2に{A} と{B}をそれぞれ割り当てるのがパレート効率的 • 入札者0と2の入札を固定した時,入札者1は勝てる入札額の下限である$3を支払う. • $3が入札者1のクリティカル値 • 入札者2は,そのクリティカル値である$1を支払う. $5 $4 $3 $2 $1 v{A,B} v{A} v{B}
$5 VCGの例(その2) $6 bidder 0 bidder 1 • AとBの2財のオークション • 入札者1に{A,B}を割り当てるのがパレート効率的. • 入札者0の入札を固定した時,入札者1が勝者となる入札の下限である$5を入札者1は支払う. • もし,入札者1が2つの名義を使って入札を {A}に$4, {B}に$2のように分割すると何が起こるか? $5 v{A,B} v{A,B}
$4 $1 $3 $5 VCGの脆弱性 $6 bidder 0 bidder 1 bidder 2 • 例(その1)となる. • 入札者1が入札を分割すると,{A,B} が割り当てられ, $3+$1=$4を支払う. • 分割しなくても, {A,B} が割り当てられるが,$5 を支払わなければならない. • VCGにおいて,入札者1は入札を分割することで利得が増加する. • このような操作を「架空名義入札/操作」と呼ぶ. $5 $4 ≧ $2 v{A,B} v{A} v{B}
アウトライン • 組合せオークションと架空名義操作 • Vickrey-Clarke-Groves メカニズム (VCG) • 既存の架空名義操作不可能なメカニズム • 適応的留保価格 (Adaptive reserve price, ARP) メカニズム • 自動メカニズムデザインによるARPメカニズムの発見
VCGの何が問題か? • VCGでは,財{A} への支払いと財{B} への支払いの合計がバンドル{A,B}への支払いより小さくなることがある. • では,支払額を調整するだけで,架空名義入札による不正な利益の増加を防ぐことができるか? • それはパレート効率性を犠牲にしない限り不可能. • そこで,いくつかの場合において,効率的でない割り当てを選ぶメカニズムを考えなければならない.
$4 効率的でない割り当て bidder 0 bidder 1 bidder 2 • 全ての財をまとめて販売するセットメカニズムを考える: • 入札者1が入札を分割すると,入札者0に{A,B}を割り当てて,$4を支払わせる. $5 $4 $2 v{A,B} v{A} v{B}
$5 効率的でない割り当て $6 bidder 0 bidder 1 • 全ての財をまとめて販売するセットメカニズムを考える: • 入札者1が入札を分割すると,入札者0に{A,B}を割り当てて,$4を支払わせる. • 分割しなければ,入札者1に{A,B}を割り当てて,$5を支払わせる. • 明らかに入札者1は入札を分割する誘因をもたない. • 組合せオークションの問題を単一財のオークションにすることで回避する. $5 v{A,B} v{A,B}
$5 セットメカニズム(単純な架空名義操作不可能なメカニズム) bidder 0 bidder 1 bidder 2 • セットは常に全ての財を単一のバンドルにして販売するため,架空名義操作不可能となるが,無駄が多い. • この場合,セットは全ての財を入札者0に割り当てるが,その余剰は$5となる. • 一方で,パレート効率的な余剰は$4.9+$4.9=$9.8. • 効率性の比は ½. • 勝者は常にただ一人であるため,最悪の効率性の比はm財の組合せオークションの場合,1/m となる. $5 $4.9 $4.9 v{A,B} v{A} v{B}
$3 $4 $3 留保価格メカニズム $6 bidder 0 bidder 1 bidder 2 • 留保価格rのもと,もしv{A,B} ≧ 2r ならば, このメカニズムは {A,B} を入札者0に割り当てる. • さもなければ,財を個別に販売しようとするが,このとき,それぞれの支払額は少なくともrでなければならない. • もしr=$2 ならば, {A,B} を入札者0に割り当てる(v{A}≧ 2 かつv{B}≧ 2 だったとしても). • もし r=$3 ならば, {A} と {B} を入札者1と2に個別に割り当てる. $5 $4 $4 $3 $3 $2 v{A,B} v{A} v{B}
留保価格メカニズム $6 bidder 0 bidder 1 bidder 2 • {A}, {B} それぞれの支払額の合計は{A,B}への支払額と少なくとも等しいため,架空名義操作不可能になる. $5 $4 $3 $3 v{A,B} v{A} v{B}
$0 留保価格メカニズム $6 bidder 0 bidder 1 bidder 2 • {A}, {B} それぞれの支払額の合計は{A,B}への支払額と少なくとも等しいため,架空名義操作不可能になる. • しかし,どの入札も留保価格以下であった時,どの財も販売されることはない. • したがって,効率性の比は最悪の場合0となる. $5 $3 $2 $2 v{A,B} v{A} v{B}
アウトライン • 組合せオークションと架空名義操作 • Vickrey-Clarke-Groves メカニズム (VCG) • 既存の架空名義操作不可能なメカニズム • 適応的留保価格 (Adaptive reserve price, ARP) メカニズム • 自動メカニズムデザインによるARPメカニズムの発見
$4 適応的留保価格 (adaptive reserve price, ARP) bidder 0 bidder 1 bidder 2 • 今度は留保価格を入札に応じて決定する. • もし v{A,B} ≧ 2v{B} ならば,入札者0が{A,B}を獲得し,$4を支払う. • そうでなければ,財を個別に販売しようとするが,このとき,それぞれの支払額は少なくともv{A,B}/2 = $2.5でなければならない. • 後者の場合,v{A,B} < 2*v{B}が成立するため,ARPがAとBの両方を販売できることが保証される. $5 2v{B} $4 v{A,B}/2 $2 v{A,B} v{A} v{B}
$2.5 $2.5 適応的留保価格 (adaptive reserve price, ARP) 2v{B} bidder 0 bidder 1 bidder 2 • 次に,入札者1と2がそれぞれ$4と$3を入札した場合, {A} と {B}が個別に割り当てられ,$2.5 を支払う. $5 $4 $3 v{A,B}/2 v{A,B} v{A} v{B}
$5 適応的留保価格 (adaptive reserve price, ARP) $7 bidder 0 bidder 1 • 次に,入札者1と2がそれぞれ$4と$3を入札した場合,彼には {A} と {B} が個別に割り当てられ,$2.5 を支払う. • このとき,入札者1が入札を分割しなければ,$5を支払うことになる. • したがって, {A}, {B} それぞれの支払額の合計は{A,B}への支払額と少なくとも等しいため,架空名義操作不可能になる. $5 v{A,B} v{A,B}
ARPの効率性の比の最悪値 bidder 0 bidder 1 bidder 2 • ARPメカニズムは入札者0に全てを割り当てるため,その余剰は$5となる. • 一方で,パレート効率的な割当てにおける余剰は $7.3 となる. • 効率性の比の最悪値は2/3. • この結果はm財の組合せオークションに一般化でき,その場合の比は2/(m+1)となる. 2v{B} $5 $4.9 v{A,B}/2 $2.4 v{A,B} v{A} v{B}
ARPを思いつくには? • セットメカニズム • 常にセットを優先して割り当てる • 留保価格メカニズム • 基本はセットを優先して割り当てる • 名義を分割しても支払額が減らない場合に限り,個別に割り当てる. • ARPメカニズム • v{A,B} ≧ 2v{B} のときにセットを割り当てる • v{A,B} < 2v{B} のときに個別に割り当てる • キーパラメータとなる2v{B}にどうやって気づくか? →自動メカニズムデザイン
アウトライン • 組合せオークションと架空名義操作 • Vickrey-Clarke-Groves メカニズム (VCG) • 既存の架空名義操作不可能なメカニズム • 適応的留保価格 (Adaptive reserve price, ARP) メカニズム • 自動メカニズムデザインによるARPメカニズムの発見
メカニズムデザイン 入力 (参加者の表明したタイプ) メカニズム (オークション方式) 結果 (勝者と支払額) • メカニズムとは,入力と結果の関係を示す関数 • 戦略的操作不可能性などの制約を課す • 制約を満す範囲で,望ましい性質を達成するメカニズムを求める • 社会的余剰の最大化 • 従来は一般的な状況における入力に対して手作業で設計
自動メカニズムデザイン(Automated mechanism design, Conitzer & Sandholm 2002) • メカニズム設計を最適化問題(混合整数計画法問題)として表現 • 入力に対して結果を表す変数を定義 • 目的関数:社会的余剰や主催者収入の最大 • 制約条件:戦略的操作不可能性,架空名義操作不可能性 • 可能な入力の範囲に特化してきめ細かい制御を行うことで,手作業で設計される一般的なメカニズムと比較して,社会的余剰の改善に期待 • メカニズム設計に必要な労力を人間から機械へ移行することが可能
モデル (1/2) • 参加者の集合:N={1,…,n},財の集合M={1,…,m} • 入札者iの評価値v(qi, B) • B⊆M: 財の組合せ(バンドル) • qi∈Q: 評価値を決定するパラメータ(タイプ) • 目的関数: g(o) + S pi • 割当てo∈O: o = (o1,...,on), oi⊆M, ∀i≠j, oi∩oj=f • 支払額pi∈R+: p = (p1,..., pn) • メカニズムM(o, p): Qn → <O, Rn> • 各入札者が申告した(q1,...,qn)∈Qnに対して • 割当て規則: o(q1,...,qn)=(o1,...,on) • 支払い規則: p(q1,...,qn)=(p1,..., pn) • 各入札者は真のqiを申告するとは限らない • 従来はQを連続空間で定義する一方で,本論文では離散空間で定義
モデル (2/2) • Maximize S(q1,...,qn)gn{g(o) + S pi } • g: qiの生起確率 • g(o)=0: 主催者収入の最大化 • g(o)= S(vi(qi,oi)-pi): 社会的余剰(参加者の効用の総和)の最大化 • 制約も目的関数も線形の式で表現可能 • 各種制約を満たすよう,目的関数を最適化する割当ておよび支払額の変数を決定
2人1財オークションへの適用 • 入札者1と2が1つの財をオークションで競り合う • 財への評価値: \100 or\50 • 財の割当て: winorlose • ありうる入札: (q1, q2) = (100, 100), (100, 50), (50, 100) or (50, 50) • ありうる割当て: (o1, o2) = (win, lose), (lose, win) or (lose, lose) • 支払額(正の実数): (p1, p2) • ありうる入札に対応する割当てと支払額を決定 • (q1, q2) → (o1, o2) , (p1, p2)
混合整数計画法における変数 • 全ての入札および割当ての組合せが生起する確率:prob_(q1, q2)_(o1, o2) • (q1, q2)の入札に対して割当て(o1, o2)となる確率 • prob_(100, 50)_(win, lose): (100, 50) の入札に対して割当てが (win, lose) となる確率 • 各確率が0もしくは1のどちらをとるか決定 • 全ての入札の組合せに対する支払額: pi_(q1, q2) • (q1, q2)の入札に対するi(1 or 2)の支払額 • pi_(100, 50): 入札(100, 50)に対する入札者1の支払額 • 正の実数の範囲で決定
混合整数計画法における制約式(割当て可能性)混合整数計画法における制約式(割当て可能性) • 1組の入札に対する割当ては一意に定まる • (win, lose), (lose, win), (lose, lose)のそれぞれの割当てが生起する確率の合計は常に1となる • 例えば,(100, 50) という入札に対して • prob_(100,50)_(win,lose) + prob_(100,50)_(lose,win) + prob_(100,50)_(lose,lose) = 1
混合整数計画法における制約式(戦略的操作不可能性)混合整数計画法における制約式(戦略的操作不可能性) • 入札において嘘をついても効用が増加しない • 入札が (100, 50) のときの入札者1の期待効用 • 100*prob_(100, 50)_(win, lose) + 0*prob_(100, 50)_(lose, win) + 0*prob_(100, 50)_(lose, lose) – p1_(100, 50) • 嘘をついて\50を入札したときの期待効用 • 100*prob_(50, 50)_(win, lose) + 0*prob_(50, 50)_(lose, win) + 0*prob_(50, 50)_(lose, lose) – p1_(50, 50)
自動メカニズムデザインの結果 • 目的関数を変数 prob あるいはpを用いて,線形の式で表現 • 制約条件を満たすよう,目的関数を最適化する変数を決定 第二価格入札と同じ 留保価格を用いた場合と同じ
自動メカニズムデザインの利点 • 制約はどう選んでも良い: 戦略的操作不可能性,ベイジアン誘因両立性,budget balance/non-negative, 個人合理性(ex post, interim, ex ante), ... • 目的関数もどう選んでも良い: 社会的余剰,売手の収入,競合比, ... • メカニズムの種類も選択可能: 決定的/確率的 • 与えられたタイプの範囲に特化して最適化された,カスタムメイドのメカニズムが設計可能
自動メカニズムデザインの問題点 • 組合せ最適化なので,タイプは離散化する必要がある • e.g., 0から100の実数値→0から100の整数値 • 混合整数計画法の問題のサイズがすぐに爆発 • 参加者数がn, 可能なタイプの数をtとすると,タイププロファイルの総数はtn • 組合せ入札で,財の数をmとすると,可能な割り当て方法は(n+1)m • 割当てに関する変数の数はtn・ nm • 4人,3財,9タイプで82万以上 • PCがいくら速くなっても,この規模だとちょっと無理
自動メカニズムデザインの(現実的な)使い方自動メカニズムデザインの(現実的な)使い方 • 一般的なメカニズム/ルールの設計のヒントとしてなら使える • 入力に関して,離散化された代表的な値を選択(high, middle, low等) • 少ない参加者数で自動メカニズムデザインを実行 • 結果の表から,特徴的な部分を選び出す(例えば,既存のメカニズムと異なる出力をしている部分) • 人間がひたすら眺めて割当て/支払額の決定ルールを抽出 • 抽出したルールを検証 • うまくルールが抽出できなければ,入力値を変更して再実行 • 論文では言及しないが,ARPメカニズムはこのプロセスを通じて発見!
適用事例:架空名義入札の影響を受けないメカニズムの設計適用事例:架空名義入札の影響を受けないメカニズムの設計 Known Results: • 架空名義入札が可能な場合,戦略的操作不可能で,均衡においてパレート効率的な割当てを実現するメカニズムは存在しない (Yokoo, et al. GEB-2004) • かつ,財の数が2の場合,戦略的操作不可能なメカニズムが達成する社会的余剰の競合比は2/3以下 Question: 競合比が2/3のメカニズムはある?
自動メカニズムデザインの適用結果 • A,Bの2財 • タイプ/評価値: • ABセットに120, 80, 0, • A,B単独に119, 79, 59, 0 • ABセットへの入札の勝敗に着目(右の表) • セットへの入札が勝つのは,単独の二番目の入札額の二倍以上の時? • キーパラメータとなる2v{B}を発見→ARPメカニズム
自動メカニズムデザインの課題 • タイプを離散化するのがボトルネック--- 一次元等の単純な場合なら,離散化しなくても扱えないか? • 戦略的操作不可能なメカニズムが必ず満たす性質がいくつか知られている • 例えば,タイプが一次元なら,あるクリティカル値未満なら必ず負け,クリティカル値を超えれば必ず勝つ • 実は求めるべきパラメータは一つだけ (クリティカル値) • このような問題を離散化して,非常に多くの決定変数を導入するのは,あまり筋が良くない? • 異なる最適化手法が使えないか? • 限量記号消去法(穴井先生@富士通/九大) • 半無限計画問題?
計算機科学と経済学/ゲーム理論のcollaboration計算機科学と経済学/ゲーム理論のcollaboration • 境界領域での応用分野/研究テーマが広がっている → 今がチャンス?ネタの宝庫? • 経済学/ゲーム理論屋さんは計算量や実行可能性を考慮しない • 経済学/ゲーム理論で得られたメカニズムを実証する,計算量等の実現可能性を考慮した新しいメカニズムや均衡を設計/探索する等の場面で,collaborationが有効 • 自分は何でも屋,新しい領域を苦にしない→ 経済学/ゲーム理論と,計算機科学の橋渡し? → 横尾基盤Sにセミナーにいらしてください!
参考文献 • Vincent Conitzer & TuomasSandholm. Complexity of Mechanism Design, In Proceedings of the 18th Annual Conference on Uncertainty in Artificial Intelligence (UAI-02), pp. 103-110, 2002. • Atsushi Iwasaki, Vincent Conitzer, Yoshifusa Omori, Yuko Sakurai, TaikiTodo, MingyuGuo, & Makoto Yokoo, Worst-case efficiency ratio in false-name-proof combinatorial auction mechanisms, Ninth International Joint Conference on Autonomous Agents and Multi-Agent System (AAMAS-2010), 2010. • Makoto Yokoo, Yuko Sakurai, & Shigeo Matsubara, The Effect of False-name Bids in Combinatorial Auctions: New Fraud in Internet Auctions, Games and Economic Behavior, Volume 46, Issue 1, Pages 174-188, 2004.