130 likes | 288 Views
3.2.1. 協力性の進化. 社会心理学特殊講義(高木) 2000.07.06. Axelrod(1984) の分析. 一種の進化ゲーム状況 戦略間のトーナメント tit-for-tat 戦略( TFT) の優越 解析 TFT を取り合う(→ CC) ことが Nash 均衡解になる。 Collective Stable Starategy ≒ESS) TFT の頑健性 限界 どの戦略が勝つかは戦略分布による。 ノイズを考えない。 多数の戦略が競い合う状況ではない。. Axelrod(1984) 以後の展開(1) :ノイズのある状況.
E N D
3.2.1. 協力性の進化 社会心理学特殊講義(高木) 2000.07.06
Axelrod(1984) の分析 • 一種の進化ゲーム状況 • 戦略間のトーナメント • tit-for-tat戦略(TFT)の優越 • 解析 • TFT を取り合う(→CC)ことが Nash 均衡解になる。 • Collective Stable Starategy ≒ESS) • TFT の頑健性 • 限界 • どの戦略が勝つかは戦略分布による。 • ノイズを考えない。 • 多数の戦略が競い合う状況ではない。
Axelrod(1984) 以後の展開(1):ノイズのある状況 • ノイズがある状況では TFT より「寛容な」戦略が有利である可能性 • 右図の p : C 返礼確率 • 右図の q : D に C を返す確率 • 厳密な TFT :協力の優越への触媒作用
Axelrod(1984) 以後の展開(2) • パブロフ戦略(Win-stay Lose-change):TFT より成績が良い、という結果(Nowak, M. & Sigmund, K., 1993) • 非寛容な Gradual が強いという説( Beaufils, Delahaye & Mathieu, 1996):相手が裏切った全回数を、相手が裏切るたびに裏切り返す。 • Open end な進化(Lindgren, 1991) • ノイズの存在+遺伝子操作によって戦略の次元が増加できる • 何らかのESSに到達 - 9割 • open end な進化 - 1割 ESSの1種 Pavlov TFT
セルオートマトンの適用例(Hegselmann, 1996a,b) • エージェントをセルで表現 • エージェントはリスクを抱える。 • サポート関係の成立のシミュレーション • 結果 • サポートのネットワークが出現 • 近隣間でサポート関係が生じる。 • リスク水準が似通ったエージェント間でサポート関係が生じやすい。
参考文献 • Axelrod, R., 1984, The Evolution of Cooperation. NY: Basic Books. アクセルロッド 松田裕之(訳) 『つきあい方の科学』、1987、HBJ出版局. • Beaufils, B., Delahaye, J-P., Mathieu, P. (1996) Our meeting with Gradual. Artificial-Life-V, MIT Press, Pp.202-209. • Hegselmann, R., 1996a, Understanding social dynamics. See Troitzsch et al. (1996), Pp.282-306. • Hegselmann, R., 1996b, Cellular automata in the social sciences. In R. Hegselmann, U. Mueller & K.G. Troitzsch (Eds.), Modelling and Simulation in the Social Sciences from the Philosophy of Science Point of View. Dordrecht: Kluwer Academic Publishers, Pp.209-233. • Lindgren, K. (1991) Evolutionary phenomena in simple dynamics. Artificial Life-II. Addison-Wesley, Pp.295-312. • Nowak, M. & May, R.M., 1992, Evolutionary games and spatial chaos. Nature, 359, 29, 826-9. • Nowak, M., May, R.M. & Sigmund, K., 1995, The arithmetics of mutual help. Scientific American, June, 50-55. • Nowak, M. & Sigmund, K., 1992, Tit for tat in heterogeneous populations. Nature, 355, 16, 250-3. • Nowak, M. & Sigmund, K., 1993, A strategy of win-stay, lose-shift that outperforms tit-for-tat in the Prisoner's Dilemma game. Nature, 364, 1, 568-3. • Suleiman, R., 1996, Simulating cooperation and competition: Present state and future objectives. See Troitzsch et al. (1996), Pp.264-281.
余談:社会的交換ゲーム • ゲーム(シミュレーション)のルール • 100人のプレイヤー • ゲームの1ラウンド = 試行の繰返し • プレイヤーは各試行で資源を保有する。 • 資源を自由に分割し、他者ないし自分に与える。 • 各試行でのプレイヤーの利得=その試行で受け取った資源量の和 • 他者から得た資源は自分の資源より価値がある。 • 囚人のジレンマ • ラウンドでのプレイヤーの利得は試行ごとの利得和。ただし後の試行の利得は割引かれる。 • ラウンドごとに、利得の下位者の戦略は上位者の戦略と入代わる(進化)。 • 囚人のジレンマのシミュレーションとの違い • 予算制約:協力の範囲を無制限に拡張することはできない。 • 与える量を自由に調節できる。
限定交換戦略 • NonCoop:孤立主義者 • 決して他者に与えない。 • Saint:聖人 • すべてを無条件に他者に与える。 • Recp:お返し戦略 ~ 返報規範 • 最初のうちは自発的に他者に資源を与える。 • 自分と相手との差し引き勘定を計算、負債の2倍返しをする。 → 交換の永続 • TFT:仲間作り戦略 ~ tit for tat • 最初のうちは自発的に他者に資源を与える。 • 資源をくれる相手を「仲間」と認定する。仲間には常に与える。 • 2度裏切った(資源をくれない)相手は2度と仲間とは認めない。 →同類を識別 • 情報構造 - 自分の交換履歴の情報だけを利用
返報戦略(Recp) 仲間作り戦略(TFT)
分析:4戦略の比較 • 相手が NonCoop だけなら、Recp、TFT は勝利できる。 • Recp 8 vs NonCoop 92 → Recp 100 • TFT 7 vs NonCoop 93 → TFT 100 • TFT が4戦略中最強。 • Recp は Saint に弱い。 • 同類識別能力の欠如
分析:改良返報戦略 • Recp2:改良型返報戦略 • 同類を識別できる 。 • 得点能力は TFT にせまる(図3)。 • 保有資源の不確実性 • TFT は不確実なほど得点が低下 • Recp2 は不確実性の影響を受けない(図3-1)。 • シミュレーション • 条件 • 確実:毎試行資源 10 • 低不確実: 15/5 • 高不確実: 20/0 • 確実条件 → TFT が勝利 • 低/高不確実条件 → Recp2 が勝利