html5-img
1 / 13

3.2.1. 協力性の進化

3.2.1. 協力性の進化. 社会心理学特殊講義(高木) 2000.07.06. Axelrod(1984) の分析. 一種の進化ゲーム状況 戦略間のトーナメント tit-for-tat 戦略( TFT) の優越 解析 TFT を取り合う(→ CC) ことが Nash 均衡解になる。 Collective Stable Starategy ≒ESS) TFT の頑健性 限界 どの戦略が勝つかは戦略分布による。 ノイズを考えない。 多数の戦略が競い合う状況ではない。. Axelrod(1984) 以後の展開(1) :ノイズのある状況.

aquarius
Download Presentation

3.2.1. 協力性の進化

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 3.2.1. 協力性の進化 社会心理学特殊講義(高木) 2000.07.06

  2. Axelrod(1984) の分析 • 一種の進化ゲーム状況 • 戦略間のトーナメント • tit-for-tat戦略(TFT)の優越 • 解析 • TFT を取り合う(→CC)ことが Nash 均衡解になる。 • Collective Stable Starategy ≒ESS) • TFT の頑健性 • 限界 • どの戦略が勝つかは戦略分布による。 • ノイズを考えない。 • 多数の戦略が競い合う状況ではない。

  3. Axelrod(1984) 以後の展開(1):ノイズのある状況 • ノイズがある状況では TFT より「寛容な」戦略が有利である可能性 • 右図の p : C 返礼確率 • 右図の q : D に C を返す確率 • 厳密な TFT :協力の優越への触媒作用

  4. Axelrod(1984) 以後の展開(2) • パブロフ戦略(Win-stay Lose-change):TFT より成績が良い、という結果(Nowak, M. & Sigmund, K., 1993) • 非寛容な Gradual が強いという説( Beaufils, Delahaye & Mathieu, 1996):相手が裏切った全回数を、相手が裏切るたびに裏切り返す。 • Open end な進化(Lindgren, 1991) • ノイズの存在+遺伝子操作によって戦略の次元が増加できる • 何らかのESSに到達 - 9割 • open end な進化    - 1割 ESSの1種 Pavlov TFT

  5. セルオートマトンの適用例(Hegselmann, 1996a,b) • エージェントをセルで表現 • エージェントはリスクを抱える。 • サポート関係の成立のシミュレーション • 結果 • サポートのネットワークが出現 • 近隣間でサポート関係が生じる。 • リスク水準が似通ったエージェント間でサポート関係が生じやすい。

  6. 参考文献 • Axelrod, R., 1984, The Evolution of Cooperation. NY: Basic Books. アクセルロッド 松田裕之(訳) 『つきあい方の科学』、1987、HBJ出版局. • Beaufils, B., Delahaye, J-P., Mathieu, P. (1996) Our meeting with Gradual. Artificial-Life-V, MIT Press, Pp.202-209. • Hegselmann, R., 1996a, Understanding social dynamics. See Troitzsch et al. (1996), Pp.282-306. • Hegselmann, R., 1996b, Cellular automata in the social sciences. In R. Hegselmann, U. Mueller & K.G. Troitzsch (Eds.), Modelling and Simulation in the Social Sciences from the Philosophy of Science Point of View. Dordrecht: Kluwer Academic Publishers, Pp.209-233. • Lindgren, K. (1991) Evolutionary phenomena in simple dynamics. Artificial Life-II. Addison-Wesley, Pp.295-312. • Nowak, M. & May, R.M., 1992, Evolutionary games and spatial chaos. Nature, 359, 29, 826-9. • Nowak, M., May, R.M. & Sigmund, K., 1995, The arithmetics of mutual help. Scientific American, June, 50-55. • Nowak, M. & Sigmund, K., 1992, Tit for tat in heterogeneous populations. Nature, 355, 16, 250-3. • Nowak, M. & Sigmund, K., 1993, A strategy of win-stay, lose-shift that outperforms tit-for-tat in the Prisoner's Dilemma game. Nature, 364, 1, 568-3. • Suleiman, R., 1996, Simulating cooperation and competition: Present state and future objectives. See Troitzsch et al. (1996), Pp.264-281.

  7. 余談:社会的交換ゲーム • ゲーム(シミュレーション)のルール • 100人のプレイヤー • ゲームの1ラウンド = 試行の繰返し • プレイヤーは各試行で資源を保有する。 • 資源を自由に分割し、他者ないし自分に与える。 • 各試行でのプレイヤーの利得=その試行で受け取った資源量の和 • 他者から得た資源は自分の資源より価値がある。 • 囚人のジレンマ • ラウンドでのプレイヤーの利得は試行ごとの利得和。ただし後の試行の利得は割引かれる。 • ラウンドごとに、利得の下位者の戦略は上位者の戦略と入代わる(進化)。 • 囚人のジレンマのシミュレーションとの違い • 予算制約:協力の範囲を無制限に拡張することはできない。 • 与える量を自由に調節できる。

  8. 限定交換戦略 • NonCoop:孤立主義者 • 決して他者に与えない。 • Saint:聖人 • すべてを無条件に他者に与える。 • Recp:お返し戦略 ~ 返報規範 • 最初のうちは自発的に他者に資源を与える。 • 自分と相手との差し引き勘定を計算、負債の2倍返しをする。 → 交換の永続 • TFT:仲間作り戦略 ~ tit for tat • 最初のうちは自発的に他者に資源を与える。 • 資源をくれる相手を「仲間」と認定する。仲間には常に与える。 • 2度裏切った(資源をくれない)相手は2度と仲間とは認めない。 →同類を識別 • 情報構造 - 自分の交換履歴の情報だけを利用

  9. 返報戦略(Recp) 仲間作り戦略(TFT)

  10. 分析:4戦略の比較 • 相手が NonCoop だけなら、Recp、TFT は勝利できる。 • Recp 8 vs NonCoop 92 → Recp 100 • TFT 7 vs NonCoop 93 → TFT 100 • TFT が4戦略中最強。 • Recp は Saint に弱い。 • 同類識別能力の欠如

  11. 分析:改良返報戦略 • Recp2:改良型返報戦略 • 同類を識別できる 。 • 得点能力は TFT にせまる(図3)。 • 保有資源の不確実性 • TFT は不確実なほど得点が低下 • Recp2 は不確実性の影響を受けない(図3-1)。 • シミュレーション • 条件 • 確実:毎試行資源 10 • 低不確実: 15/5 • 高不確実: 20/0 • 確実条件 → TFT が勝利 • 低/高不確実条件 → Recp2 が勝利

More Related