3 2 1
This presentation is the property of its rightful owner.
Sponsored Links
1 / 13

3.2.1. 協力性の進化 PowerPoint PPT Presentation


  • 86 Views
  • Uploaded on
  • Presentation posted in: General

3.2.1. 協力性の進化. 社会心理学特殊講義(高木) 2000.07.06. Axelrod(1984) の分析. 一種の進化ゲーム状況 戦略間のトーナメント tit-for-tat 戦略( TFT) の優越 解析 TFT を取り合う(→ CC) ことが Nash 均衡解になる。 Collective Stable Starategy ≒ESS) TFT の頑健性 限界 どの戦略が勝つかは戦略分布による。 ノイズを考えない。 多数の戦略が競い合う状況ではない。. Axelrod(1984) 以後の展開(1) :ノイズのある状況.

Download Presentation

3.2.1. 協力性の進化

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


3 2 1

3.2.1. 協力性の進化

社会心理学特殊講義(高木)

2000.07.06


Axelrod 1984

Axelrod(1984) の分析

  • 一種の進化ゲーム状況

  • 戦略間のトーナメント

    • tit-for-tat戦略(TFT)の優越

  • 解析

    • TFT を取り合う(→CC)ことが Nash 均衡解になる。

    • Collective Stable Starategy ≒ESS)

  • TFT の頑健性

  • 限界

    • どの戦略が勝つかは戦略分布による。

    • ノイズを考えない。

    • 多数の戦略が競い合う状況ではない。


Axelrod 1984 1

Axelrod(1984) 以後の展開(1):ノイズのある状況

  • ノイズがある状況では TFT より「寛容な」戦略が有利である可能性

    • 右図の p : C 返礼確率

    • 右図の q : D に C を返す確率

  • 厳密な TFT :協力の優越への触媒作用


Axelrod 1984 2

Axelrod(1984) 以後の展開(2)

  • パブロフ戦略(Win-stay Lose-change):TFT より成績が良い、という結果(Nowak, M. & Sigmund, K., 1993)

  • 非寛容な Gradual が強いという説( Beaufils, Delahaye & Mathieu, 1996):相手が裏切った全回数を、相手が裏切るたびに裏切り返す。

  • Open end な進化(Lindgren, 1991)

    • ノイズの存在+遺伝子操作によって戦略の次元が増加できる

    • 何らかのESSに到達 - 9割

    • open end な進化    - 1割

ESSの1種

Pavlov

TFT


Hegselmann 1996a b

セルオートマトンの適用例(Hegselmann, 1996a,b)

  • エージェントをセルで表現

    • エージェントはリスクを抱える。

    • サポート関係の成立のシミュレーション

  • 結果

    • サポートのネットワークが出現

    • 近隣間でサポート関係が生じる。

    • リスク水準が似通ったエージェント間でサポート関係が生じやすい。


3 2 1

参考文献

  • Axelrod, R., 1984, The Evolution of Cooperation. NY: Basic Books. アクセルロッド 松田裕之(訳) 『つきあい方の科学』、1987、HBJ出版局.

  • Beaufils, B., Delahaye, J-P., Mathieu, P. (1996) Our meeting with Gradual. Artificial-Life-V, MIT Press, Pp.202-209.

  • Hegselmann, R., 1996a, Understanding social dynamics. See Troitzsch et al. (1996), Pp.282-306.

  • Hegselmann, R., 1996b, Cellular automata in the social sciences. In R. Hegselmann, U. Mueller & K.G. Troitzsch (Eds.), Modelling and Simulation in the Social Sciences from the Philosophy of Science Point of View. Dordrecht: Kluwer Academic Publishers, Pp.209-233.

  • Lindgren, K. (1991) Evolutionary phenomena in simple dynamics. Artificial Life-II. Addison-Wesley, Pp.295-312.

  • Nowak, M. & May, R.M., 1992, Evolutionary games and spatial chaos. Nature, 359, 29, 826-9.

  • Nowak, M., May, R.M. & Sigmund, K., 1995, The arithmetics of mutual help. Scientific American, June, 50-55.

  • Nowak, M. & Sigmund, K., 1992, Tit for tat in heterogeneous populations. Nature, 355, 16, 250-3.

  • Nowak, M. & Sigmund, K., 1993, A strategy of win-stay, lose-shift that outperforms tit-for-tat in the Prisoner's Dilemma game. Nature, 364, 1, 568-3.

  • Suleiman, R., 1996, Simulating cooperation and competition: Present state and future objectives. See Troitzsch et al. (1996), Pp.264-281.


3 2 1

余談:社会的交換ゲーム

  • ゲーム(シミュレーション)のルール

    • 100人のプレイヤー

    • ゲームの1ラウンド = 試行の繰返し

    • プレイヤーは各試行で資源を保有する。

    • 資源を自由に分割し、他者ないし自分に与える。

    • 各試行でのプレイヤーの利得=その試行で受け取った資源量の和

    • 他者から得た資源は自分の資源より価値がある。

      • 囚人のジレンマ

    • ラウンドでのプレイヤーの利得は試行ごとの利得和。ただし後の試行の利得は割引かれる。

    • ラウンドごとに、利得の下位者の戦略は上位者の戦略と入代わる(進化)。

  • 囚人のジレンマのシミュレーションとの違い

    • 予算制約:協力の範囲を無制限に拡張することはできない。

    • 与える量を自由に調節できる。


3 2 1

限定交換戦略

  • NonCoop:孤立主義者

    • 決して他者に与えない。

  • Saint:聖人

    • すべてを無条件に他者に与える。

  • Recp:お返し戦略 ~ 返報規範

    • 最初のうちは自発的に他者に資源を与える。

    • 自分と相手との差し引き勘定を計算、負債の2倍返しをする。 → 交換の永続

  • TFT:仲間作り戦略 ~ tit for tat

    • 最初のうちは自発的に他者に資源を与える。

    • 資源をくれる相手を「仲間」と認定する。仲間には常に与える。

    • 2度裏切った(資源をくれない)相手は2度と仲間とは認めない。 →同類を識別

  • 情報構造 - 自分の交換履歴の情報だけを利用


3 2 1

返報戦略(Recp)

仲間作り戦略(TFT)


3 2 1

分析:4戦略の比較

  • 相手が NonCoop だけなら、Recp、TFT は勝利できる。

    • Recp 8 vs NonCoop 92 → Recp 100

    • TFT 7 vs NonCoop 93 → TFT 100

  • TFT が4戦略中最強。

  • Recp は Saint に弱い。

    • 同類識別能力の欠如


3 2 1

分析:改良返報戦略

  • Recp2:改良型返報戦略

    • 同類を識別できる 。

    • 得点能力は TFT にせまる(図3)。

  • 保有資源の不確実性

    • TFT は不確実なほど得点が低下

    • Recp2 は不確実性の影響を受けない(図3-1)。

  • シミュレーション

    • 条件

      • 確実:毎試行資源 10

      • 低不確実: 15/5

      • 高不確実: 20/0

    • 確実条件 → TFT が勝利

    • 低/高不確実条件 → Recp2 が勝利


  • Login