1 / 8

Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση. Το δίλημμα του φυλακισμένου. Δύο παίκτες, καθένας παίζει C ή D Σκοπός κάθε παίκτη είναι να μεγιστοποιήσει το κέρδος του. C D. C. D. Στο Prisoner’s Dilemma κάθε παίκτης έχει συμφέρον να παίξει D Δε δικαιολογείται η συνεργασία

twyla
Download Presentation

Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Το δίλημμα του φυλακισμένου – Πειραματική προσέγγιση

  2. Το δίλημμα του φυλακισμένου • Δύο παίκτες, καθένας παίζει C ή D • Σκοπός κάθε παίκτη είναι να μεγιστοποιήσει το κέρδος του C D C D

  3. Στο Prisoner’s Dilemma κάθε παίκτης έχει συμφέρον να παίξει D • Δε δικαιολογείται η συνεργασία • Το ίδιο και στο επαναλαμβανόμενο PD C D C D

  4. Στην πραγματικότητα παρατηρούμε συνεργασία. Γιατί όχι και στο PD; • Τα πραγματικά προβλήματα δεν αντιπροσωπεύονται από το PD • Δεν ισχύει πάντα η υπόθεση του απόλυτα εγωιστή παίκτη • Τα σύνθετα πραγματικά παίγνια έχουν στη βάση τους το PD αλλά έχουν περισσότερα επίπεδα

  5. 1ο και 2ο Πρωτάθλημα του Axelrod • Ένα σύνθετο παίγνιο με το PD στη βάση του • Προσέγγιση με πειράματα με υπολογιστή

  6. Κανόνες • Παίζουν προγράμματα γραμμένα σε κάποια γλώσσα προγραμματισμού (πχ Basic, Fortran, C κλπ) • Όλα τα προγράμματα παίζουν έναν αγώνα με όλα τα άλλα ανά δύο • Ένας αγώνας είναι 200 επαναλήψεις του PD • Τα προγράμματα έχουν πρόσβαση σε όλη την ιστορία του τρέχοντα αγώνα • Σκορ σε κάθε αγώνα είναι το άθροισμα των πόντων από τις 200 επαναλήψεις PD • Συνολικό σκορ κάθε προγράμματος το άθροισμα των επιμέρους σκορ των αγώνων • Νικητής το πρόγραμμα με το μεγαλύτερο συνολικό σκορ

  7. Και στα δύο πρωταθλήματα νικητής ήταν το πρόγραμμα ‘Tit for Tat’ («σου κάνω ό,τι μου κάνεις») • Παίζει ως εξής: - Στην πρώτη κίνηση παίζει C - Στη ν-οστή κίνηση παίζει ό,τι έπαιξε ο αντίπαλος στη (ν-1)-οστή κίνηση • Άλλα προγράμματα: -Πάντα C - Πάντα D - Τυχαία κίνηση - Πάντα C μέχρι ο αντίπαλος να παίξει D, μετά πάντα D • Όλα τα top προγράμματα έπαιζαν αρχικά C • Άρα είναι έξυπνη κίνηση να δηλώνεις εξαρχής πρόθεση συνεργασίας

  8. 3ο (εξελικτικό) πρωτάθλημα του Axelrod • 1000 γύροι • Κάθε γύρος είναι ένα απλό πρωτάθλημα (όπως τα προηγούμενα) • Το ποσοστό εκπροσώπησης των προγραμμάτων σε κάθε γύρο είναι ανάλογο του σκορ που συγκέντρωσαν στον προηγούμενο γύρο (Πήρε το όνομα από την εξέλιξη στη βιολογία) • Μετά από 1000 γύρους το πρόγραμμα Tit for Tat είχε τη μεγαλύτερη εκπροσώπηση • Τελικά η συνεργασία μπορεί να επικρατήσει εξελικτικά

More Related