slide1
Download
Skip this Video
Download Presentation
Topics in Algorithmic Game Theory נושאים אלגוריתמיים בתורת המשחקים

Loading in 2 Seconds...

play fullscreen
1 / 62

Topics in Algorithmic Game Theory נושאים אלגוריתמיים בתורת המשחקים - PowerPoint PPT Presentation


  • 182 Views
  • Uploaded on

Topics in Algorithmic Game Theory נושאים אלגוריתמיים בתורת המשחקים. תזכורת: משחקי פוטנציאל. “R” ‏. “E” ‏. 0 ‏. 1 ‏. “R” ‏. 4 , 4 ‏. -1 , 5 ‏. 1 ‏. 2 ‏. “E” ‏. 5 , -1 ‏. 0 , 0 ‏. הגדרה : נאמר שמשחק הוא משחק פוטנציאל אם קיימת פונקציה Φ : A 1 x A 2 x A 3 ··· x A n  R

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Topics in Algorithmic Game Theory נושאים אלגוריתמיים בתורת המשחקים' - ezra


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1

Topics in Algorithmic Game Theory

נושאים אלגוריתמיים בתורת המשחקים

slide3

“R”‏

“E”‏

0‏

1‏

“R”‏

4 , 4‏

-1 , 5‏

1‏

2‏

“E”‏

5 , -1‏

0 , 0‏

slide4

הגדרה:

  • נאמר שמשחקהוא משחק פוטנציאל אם קיימת פונקציה
  • Φ:A1 x A2x A3 ···x An R
  • כך שלכל מתקיים:
  • Φ(ai, a-i) – Φ(a’i, a-i) = ui(ai, a-i) – ui(a’i, a-i)
  • cvb
slide5
פונקצית פוטנציאל

טענה: למשחק פוטנציאל סופי יש שיווי משקל טהור.

“R”‏

“E”‏

0‏

1‏

“R”‏

4 , 4‏

-1 , 5‏

1‏

2‏

“E”‏

5 , -1‏

0 , 0‏

slide6

לא כל משחק הוא משחק פוטנציאל

  • למשל, במשחק זוג או פרט אין שיווי משקל נאש באסטרטגיות טהורות, ובפרט זה אינו משחק פוטנציאל
  • 10
  • 8K 2+K
  • 2-K ? ?
p rice of s tability pos
מחיר היציבות Priceof Stability (PoS)

מחיר האנרכיהPriceof Anarchy (PoA)

slide9
מוטיבציה

מחיר היציבות ומחיר האנרכיה הם מדדים שימושיים להערכה אופטימיתופסימיתשל חוסר יעילות של מערכת במקרה הגרוע (למשל, במקרים של ריבוי שיוויי משקל)

slide10

“R”‏

“E”‏

“R”‏

4, 4‏

-1, 5‏

“E”‏

5, -1‏

0, 0‏

slide11

“R”‏

“R”‏

“E”‏

“E”‏

“R”‏

90, 90‏

-1, 99‏

“R”‏

4, 4‏

-1, 5‏

“E”‏

99, -1‏

0, 0‏

“E”‏

5, -1‏

0, 0‏

slide12
מוטיבציה

נתעניין במחלקות של משחקים בהם הרווחה החברתית המתקבלת היא "סבירה" בהשוואה לזו המתקבלת במצבים בהם השחקנים אינם פועלים באופן אסטרטגי.

slide13

NE

PNE

slide14

NE

PNE

slide15
מוטיבציה

נתעניין במחלקות של משחקים בהם הרווחה החברתית המתקבלת היא "סבירה" בהשוואה לזו המתקבלת במצבים בהם השחקנים אינם פועלים באופן אסטרטגי.

וכנ"ל עבור העלות החברתית

slide17
משחק בניית רשת
  • נתון גרף מכוון G(V, E)
  • בניית קשת e בגרף Gעולה c(e)
  • יש k> 2 שחקנים
  • לכל שחקן i יש קודקוד התחלה siוקודקוד מטרה ti
  • כל שחקן צריך לבחור מסלול piמקודקוד si אל tiבגרף G
  • כל שחקן ישלם עבור המסלול שהוא בחר באופן הבא:

ci (pi, p-i) = ∑ c(e)/ l(e, p)

l(e, p) הוא מספר השחקנים שהקשת eשייכת למסלול שלהם באוסף המסלולים (pi, p-i) = p

epi

slide18
עלות חברתית
  • העלות החברתית של אוסף מסלולים p1, p2, …, pk היא העלות הכוללת של כל השחקנים:

∑ ici (pi, p-i) = p1, p2, …, pk)cost (

slide19
דוגמא
  • עלויות הקשתות הן 0, k, 1+ε
  • יש k> 2 שחקנים
  • לכל שחקן i יש

קודקוד התחלה si וקודקוד מטרה ti

slide20
דוגמא
  • עלויות הקשתות הן 0, k, 1+ε
  • יש k> 2 שחקנים
  • לכל שחקן i יש

קודקוד התחלה si וקודקוד מטרה ti

  • אם כל השחקנים ישתמשו בקשת השמאלית לבניית המסלול,

אז כל שחקן iישלם 1 = = ci

העלות החברתית היא k

slide21
דוגמא
  • עלויות הקשתות הן 0, k, 1+ε
  • יש k> 2 שחקנים
  • לכל שחקן i יש

קודקוד התחלה si וקודקוד מטרה ti

  • אם שחקן 1 ישתמש בקשת הימנית לבניית המסלול שלו, אז הוא ישלם וכל השאר ישלמו כל אחד

העלות החברתית הכוללת היא

slide22
דוגמא עם שיווימשקל יחיד
  • שחקן iמעוניין במסלול מ-si אל t
  • עלות חברתית אופטימליתהיא 1+ε
  • אבל, זהו לא שיווי משקל כי לשחקן k כדאי לסטות
  • ובאופן אינדוקטיבי: גם לשחקן k-1 כדאי לסטות וכו\'
  • עלות חברתית של שיווי המשקל היא:

Θ(log k) = =

slide23

משפט: משחק בניית רשת הוא משחק פוטנציאל (ולכן תמיד קיים שיווי משקל טהור).

הוכחה:

בהמשך

slide26
הגדרה

הגדרה: מחיר האנרכיה Price of Anarchy (PoA) יוגדר להיות היחס הבא:

העלות של שיווי משקל טהור עם העלות החברתית המכסימלית

העלות החברתית המינימלית

הערות:

  • ככל שהיחס קטן יותר כך מחיר האנרכיה נמוך יותר.
  • עבור רווחה חברתית נתעניין ברווחה האופטימלית חלקי הרווחה של שיווי המשקל עם העלות המינימלית.
slide27

משפט: מחיר האנרכיה של משחק בניית רשת <k, כאשר k הוא מספר השחקנים, וקיים משחק בניית רשת שעבורו = PoAk.

(כלומר הוא k חסם הדוק)

הוכחה:

יהי P*1, P*2, …, P*k)( שיווי משקל נאש טהור, ויהי Q1, Q2, …, Qk) (

הפתרון שעלותו החברתית מינימלית. נסמן

OPT= Q1, Q2, …, Qk)cost (

בשיווי משקל מתקיים: cost (Pi)costi(P*i, P*-i) < לכל Pi.

אחרת, שחקן i היה בונה לבד את המסלול Pi , ולכן:

OPT<min cost (Pi)costi (P*i, P*-i) <

כי OPT מכסה עלות של מסלול כלשהו מ-siל- ti

slide28

משפט: מחיר האנרכיה של משחק בניית רשת <k, כאשר k הוא מספר השחקנים, וקיים משחק בניית רשת שעבורו = PoAk.

הוכחה:

יהי q1, q2, …, qk)( שיווי משקל נאש טהור.

יהי p*1, p*2, …, p*k) (הפתרון שעלותו החברתית מינימלית.

נסמן: OPT= p*1, p*2, …, p*k)cost (.

בשיווי משקל מתקיים: cost (pi)costi(qi, q-i) <costi (pi, q-i) < לכל pi.

אחרת, שחקן i היה בונה לבד את המסלול pi.

בפרט: cost (pi)mincosti (qi, q-i) <

בנוסף: OPT<min cost (pi)

כי OPT מכסה עלות של מסלול כלשהו מ-siל- ti.

נקבל:k · OPT<costi (qi, q-i) ∑.

slide29
מחיר האנרכיה = k

נסתכל על המשחק שבדוגמא

  • שיווי משקל עם עלות חברתית k:

כל השחקנים בונים את הקשת השמאלית

  • פתרון עם עלות מינימלית:

כל השחקנים בונים את הקשת הימנית

  • הערה:זהו גם שיווי משקל
  • כאשר אפסילון שואף לאפס:PoA = = k
  • הערה: לא ייתכן שיווי משקל עם עלות חברתית > k ע"פ מה שהוכח קודם
slide32
הגדרות

הגדרה: מחיר האנרכיה Price of Anarchy (PoA) יוגדר להיות היחס הבא:

העלות של שיווי משקל טהור עם העלות החברתית המכסימלית

העלות המינימלית

הגדרה: מחיר היציבות Price of Stability (PoS) יוגדר להיות היחס הבא:

העלות של שיווי משקל טהור עם העלות החברתית המינימלית

העלות המינימלית

slide34
דוגמא, מחיר היציבות

נסתכל על המשחק שבדוגמא.

  • שיווי משקל:

כל השחקנים בונים את הקשת השמאלית

  • פתרון עם עלות מינימלית:

כל השחקנים בונים את הקשת הימנית

  • הערה:זהו גם שיווי משקל
  • כאשר אפסילון שואף לאפס:PoS = = 1
slide36

משפט: משחק בניית רשת הוא משחק פוטנציאל (ולכן תמיד קיים שיווי משקל טהור).

הוכחה:

  • נגדיר תחילה את פונקצית הפוטנציאל המתאימה למשחק.
slide42

משפט: מחיר היציבות של משחק בניית רשת <, כאשר k הוא מספר השחקנים, וקיים משחק בניית רשת שעבורו = PoS.

הוכחה:

slide43

משפט: מחיר היציבות של משחק בניית רשת <, כאשר k הוא מספר השחקנים, וקיים משחק בניית רשת שעבורו = PoS.

הוכחה:

slide44

משפט: מחיר היציבות של משחק בניית רשת <, כאשר k הוא מספר השחקנים, וקיים משחק בניית רשת שעבורו = PoS.

הוכחה:

slide45

משפט: מחיר היציבות של משחק בניית רשת <, כאשר k הוא מספר השחקנים, וקיים משחק בניית רשת שעבורו = PoS.

הוכחה:

slide46

משפט: מחיר היציבות של משחק בניית רשת <, כאשר k הוא מספר השחקנים, וקיים משחק בניית רשת שעבורו = PoS.

הוכחה:

slide47
דוגמא שעבורה:PoS
  • שחקן iמעוניין במסלול מ-si אל t
  • עלות חברתית אופטימליתהיא 1+ε
  • אבל, זהו לא שיווי משקל כי לשחקן k כדאי לסטות
  • ובאופן אינדוקטיבי: גם לשחקן k-1 כדאי לסטות וכו\'
  • עלות חברתית של שיווי המשקל היא:

Θ(log k) = =

slide48
לסיכום, עבור משחק בניית רשת:מחיר האנרכיה = kמחיר היציבות =
slide51

מחיר היציבות ומחיר האנרכיה הם מדדים שימושיים להערכהאופטימית ופסימיתשל ביצועי מערכת במקרה הגרוע (למשל, במקרים של ריבוי שיוויי משקל)

הערה: המצב הרצוי ביותר הוא כשמחיר האנרכיה קרוב ל-1, אז אין צורך "להתערב"במערכת

slide52

ניתן להגדיר את מחיר האנרכיה גם עבור שיווי משקל כללי (לא בהכרח טהור)

  • ניתן באופן דומה להגדיר מחיר אנרכיה לרווחה חברתית
  • (רווחה חברתית מכסימלית חלקי הרווחה החברתית של שיווי המשקל עם הרווחה המינימלית).
slide55
אלגוריתמים לבעית התרמיל
  • בעיה:לא ידוע אלגוריתם יעיל לפתרון בעית התרמיל.
  • בשבוע שעבר ראינו 2-קירוב בזמן פולינומי לבעיה.
  • היום נראה אלגוריתם בסיבוכיות O(nC)

("פסאודו-פולינומי")

slide56
אלגוריתמים תכנון דינמי

// A[i, k]will be the maximum value that can be attained with total size less than or equal to k using items 1, 2, …, i

For c = 0, 1, 2, …, C

do A[0, c] := 0

Fori= 1, 2, …, n

For k = 0, 1, …, C

if k > si

A[i, k] := max(A[i-1, k], A[i-1, k- si] + vi)

else A[i, k] := A[i-1, k]

slide57
אלגוריתמים תכנון דינמי

A[i, k]will be the maximum value that can be attained with total size less than or equal to k using items 1, 2, …, i

For k = 0, 1, 2, …, C

do A[0, k] := 0

Fori= 1, 2, …, n

For k = 0, 1, …, C

if k > si

A[i, k] := max (A[i-1, k], A[i-1, k- si] + vi)

else A[i, k] := A[i-1, k]

slide58
אלגוריתמים תכנון דינמי

A[i, k]will be the maximum value that can be attained with total size less than or equal to k using items 1, 2, …, i

For k = 0, 1, 2, …, C

do A[0, k] := 0

Fori= 1, 2, …, n

For k = 0, 1, …, C

if k > si

A[i, k] := max (A[i-1, k], A[i-1, k- si] + vi)

else A[i, k] := A[i-1, k]

bibliography
Bibliography

Chandra Chekuri, CS 573: Algorithmic Game Theory, 2008Lecture Notes,

Noam Nisan, Tim Roughgarden, Eva Tardos, and Vijay Vazirani, Algorithmic Game Theory, Cambridge University Press, 2007.

David Easley and Jon Kleinberg, Networks, Crowds, and Markets, Cambridge University Press, 2010

Wikipedia

ad