slide1 l.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawsk PowerPoint Presentation
Download Presentation
Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawsk

Loading in 2 Seconds...

play fullscreen
1 / 34

Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawsk - PowerPoint PPT Presentation


  • 178 Views
  • Uploaded on

Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski . Princeton meeting 1949. John von Neumann 1903-1957. John Forbes Nash 1928-. Jak grać?. Równowaga Nasha. Przypisanie graczom strategii, tak iż żadnemu z graczy,

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about 'Stochastyczne modele gier ewolucyjnych Jacek Miękisz Instytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawsk' - hiroshi


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1

Stochastyczne modele gier ewolucyjnychJacek MiękiszInstytut Matematyki Stosowanej i Mechaniki Uniwersytet Warszawski

princeton meeting 1949
Princeton meeting 1949

John von Neumann 1903-1957

John Forbes Nash 1928-

jak gra
Jak grać?

Równowaga Nasha

Przypisanie graczom strategii, tak iż żadnemu z graczy,

przy ustalonych strategiach wszystkich innych graczy,

nie opłaca się zmienić swojej strategii

slide4

Formalnie

gra w jelenia i zająca

(St,St) równowaga efektywna

(H,H) równowaga bezpieczna

średnia St - 5/2

Średnia H - 3

problem wyboru równowagi

slide5

Dynamika populacji

czas

A i B - dwa możliwe zachowania,

fenotypy, strategie osobników

slide6

Prosty model ewolucji

Selekcja

osobnicy oddziałują w parach – grają w gry

uzyskują wypłaty = liczba potomstwa

Fenotypy są dziedziczone

Potomstwo może mutować

dob r osobnik w do gry
Dobór osobników do gry

każdy gra z każdym

losowe spotkania graczy

gry na grafach,

populacje ze strukturą przestrzenną

slide8

Stochastyczna dynamika skończonych populacji

n - liczba osobników

zt - liczba osobników grających A w czasie t

Ω ={0,…,n} - przestrzeń stanów

selekcja

zt+1 > zt jeśli „średnia” z A > „średnia z B

mutacje

Każdy osobnik może zmienić swoją strategię

z prawdopodobieństwem ε

slide10

Klasyczne wyniki

Każdy gra z każdym, Kandori-Mailath-Rob 1993

a>c i d>b, (A,A) i (B,B) – równowagi Nasha

A B

A a b

B c d

A jest stategią efektywną, a>d

B jest strategią dominującą ze względu na ryzyko

c+d>a+b

slide13

Lemat drzewny (Freidlin and Wentzell)

ergodyczny łańcuch Markowa ze skończona przestrzenią Ω,

macierzą przejścia Pε, i jedyną miarą stacjonarną με

z2

z1

z3

Pε (z4|z1)

z4

z5

x

slide15

Dynamika deterministyczna

reguła najlepszej odpowiedzi

i

Br(St,St)=St

Br(H,H)=H

Br(H,St)=Br(St,H)=H

slide16

Dynamika stochastyczna

a) zaburzona najlepsza odpowiedź

z prawdopodobieństwem 1-ε gracz wybiera najlepszą odpowiedź

z prawdopodobieństwem ε gracz myli się

,

b) reguła log-linear

slide17

Jeleń i zając na Z, z oddziaływaniem najbliższych

sąsiadów i zaburzoną najlepszą odpowiedzią

liczenie błędów

slide18

Otwarty problem

konstrukcja gry przestrzennej

z jedyną miarą stacjonarną μεΛ

która ma następujące własności

slide19

Dylemat Więźnia na grafach losowych

wspólna praca z Bartoszem Sułkowskim

C D

C 3 0

D 5 1

(D,D) jest jedyną równowagą Nasha

slide20

Grafy Poissona

Każdą parę wierzchołków łączymy krawędzią z prawdopodobieństwem p

Rozkład stopni wierzchołków jest rozkładem Poissona

Bezskalowe grafy typu Barabasi-Alberty

Reguła preferencyjnego linkowania

Rozkład stopni wierzchołków ~ k-λ

slide22

dynamika imitacji

C

C D

C

C D

C 3 0

D 5 1

C D

C 2 -1

D 4 0

gracze z lewej dostają 3

środkowy gracz 6

prawy gracz dostaje 5

gracze z lewej dostają 2

środkowy gracz 3

prawy gracz dostaje 4

D zmienia się w C

środkowe C zmienia się w D

slide23

C D

C 1 0

D T 0

C D

C 1-γ -γ

D T-γ -γ

γ - koszt połączenia

dynamika imitacji najlepszej strategii z otoczenia

średni poziom współpracy w stanie stacjonarnym

slide26

Co dalej?

gry na grafach losowych

koewolucja sieci powiązań i strategii

slide27

Deterministyczna dynamika replikatorowa

A B

A a b

U =

B c d

pA(t) – liczba osobników grających A w czasie t

pB(t) – liczba osobników grających B w czasie t

Proponujemy

UA = ax + b(1-x)

UB = cx + d(1-x)

Uav = xUA +(1-x)UB

pA(t+ε)=(1-ε)pA(t) + εpA(t)UA(t)

slide28

pA(t+ε) = (1-ε)pA(t) + εpA(t)UA(t)

pB(t+ε) = (1-ε)pB(t) + εpB(t)UB(t)

p(t+ε) = (1-ε)p(t) + εp(t)Uav(t)

slide29

dx/dt = x(1-x)(UA – UB)

Jeleń - Zając

J Z

J 5 0

Z 3 3

∙←←←←←∙→→→∙

0 3/ 5 1

mieszana równowaga jest niestabilna

Jastrząb - Gołąb

J G

J -1 2

G 0 1

∙→→→→∙←←←←∙

0 1/2 1

mieszana równowaga jest stabilna

slide30

Opóźnienia ( dla Jastrzębia i Gołębia)

→→→→x*←←←←

opóźnienie społeczne

Zakładamy, że osobnicy w czasie t naśladują strategie,

które miały większe wypłaty w czasie t-τ.

Proponujemy

slide31

odpowiednie równanie replikatorowe w czasie ciągłym ma postać

Twierdzenie (Jan Alboszta i JM, J. Theor. Biol. 231: 175-179, 2004)

x* jest asymptotycznie stabilny jeśli τ jest odpowiednio małe

x* jest niestabilny dla odpowiednio dużego τ

slide32

Biologiczne opóźnienie

Zakładamy,że osobnicy rodzą się τ czasu po tym jak ich rodzice grali i uzyskali wypłaty.

Proponujemy

Twierdzenie (JA i JM, JTB 2004)

x* jest asymptotycznie stabilny dla każdego opóźnienia τ

slide33

Stochastyczna dynamika z opóźnieniem

na grafach

a) zaburzona najlepsza odpowiedź na stan w t-τ

,

z prawdopodobieństwem 1-ε gracz wybiera najlepszą odpowiedź

z prawdopodobieństwem ε gracz myli się

b) zaburzona imitacja stanu w t-τ

z prawdopodobieństwem 1-ε gracz imituje najlepszego gracza

z prawdopodobieństwem ε gracz myli się

slide34

Dziękuję za uwagę

www.mimuw.edu.pl/~miekisz