Τι είναι το δίλημμα των φυλακισμένων;

Στο ίδιο το παιχνίδι εκπροσωπούνται οι ποινές (και οι ανταμοιβές, κατά περίπτωση) χρησιμότητα αριθμούς. Οι θετικοί αριθμοί αντιπροσωπεύουν καλά αποτελέσματα, οι αρνητικοί αριθμοί αντιπροσωπεύουν κακές εκβάσεις και ένα αποτέλεσμα είναι καλύτερο από το άλλο, αν ο αριθμός που σχετίζεται με αυτό είναι μεγαλύτερος. (Προσέξτε, ωστόσο, πώς λειτουργεί αυτό για τους αρνητικούς αριθμούς, αφού το -5, για παράδειγμα, είναι μεγαλύτερο από -20!)

Στον παραπάνω πίνακα, ο πρώτος αριθμός σε κάθε πλαίσιο αναφέρεται στο αποτέλεσμα για τον παίκτη 1 και ο δεύτερος αριθμός αντιπροσωπεύει το αποτέλεσμα για τον παίκτη 2. Αυτοί οι αριθμοί αντιπροσωπεύουν μόνο ένα από τα πολλά σύνολα αριθμών που είναι συνεπείς με τη ρύθμιση του διλήμματος των κρατουμένων.

Μόλις καθοριστεί ένα παιχνίδι, το επόμενο βήμα στην ανάλυση του παιχνιδιού είναι να αξιολογήσει τις στρατηγικές των παικτών και να προσπαθήσει να καταλάβει πώς οι παίκτες είναι πιθανό να συμπεριφέρονται. Οι οικονομολόγοι κάνουν λίγες υποθέσεις όταν αναλύουν τα παιχνίδια - πρώτον, υποθέτουν ότι και οι δύο παίκτες το γνωρίζουν οι αποδόσεις τόσο για τον εαυτό τους όσο και για τον άλλο παίκτη, και, δεύτερον, υποθέτουν ότι και οι δύο παίκτες ψάχνουν προς το

instagram viewer
ορθολογικά μεγιστοποιήσουν τη δική τους πληρωμή από το παιχνίδι.

Μια εύκολη αρχική προσέγγιση είναι να αναζητήσουμε αυτά που ονομάζονται κυρίαρχες στρατηγικές- στρατηγικές που είναι καλύτερες ανεξάρτητα από τη στρατηγική που επιλέγει ο άλλος παίκτης. Στο παραπάνω παράδειγμα, η επιλογή να εξομολογηθεί είναι μια κυρίαρχη στρατηγική και για τους δύο παίκτες:

Δεδομένου ότι η ομολογία είναι καλύτερη και για τους δύο παίκτες, δεν προκαλεί έκπληξη το γεγονός ότι το αποτέλεσμα όπου ομολογούν οι δύο παίκτες είναι ένα αποτέλεσμα ισορροπίας του παιχνιδιού. Τούτου λεχθέντος, είναι σημαντικό να είμαστε λίγο πιο ακριβείς με τον ορισμό μας.

Η έννοια του a Ισορροπία Nash κωδικοποιήθηκε από μαθηματικό και θεωρητικό παιγνίων John Nash. Με απλά λόγια, μια ισορροπία Nash είναι ένα σύνολο στρατηγικών βέλτιστης ανταπόκρισης. Για ένα παιχνίδι δύο παικτών, μια ισορροπία Nash είναι ένα αποτέλεσμα όπου η στρατηγική του παίκτη 2 είναι η καλύτερη απάντηση στη στρατηγική του παίκτη 1 και η στρατηγική του παίκτη 1 είναι η καλύτερη απάντηση στη στρατηγική του παίκτη 2.

Η εξεύρεση της ισορροπίας Nash μέσω αυτής της αρχής μπορεί να παρουσιαστεί στον πίνακα των αποτελεσμάτων. Σε αυτό το παράδειγμα, οι καλύτερες απαντήσεις του παίκτη 2 στον παίκτη 1 περνούν με πράσινο χρώμα. Εάν ο παίκτης 1 εξομολογηθεί, η καλύτερη απάντηση του παίκτη 2 είναι να ομολογήσει, δεδομένου ότι το -6 είναι καλύτερη από -10. Αν ο παίκτης 1 δεν εξομολογηθεί, η καλύτερη απάντηση του παίκτη 2 είναι να ομολογήσει, δεδομένου ότι το 0 είναι καλύτερη από -1. (Σημειώστε ότι αυτή η συλλογιστική είναι πολύ παρόμοια με τη συλλογιστική που χρησιμοποιείται για τον προσδιορισμό των κυρίαρχων στρατηγικών.)

Οι καλύτερες απαντήσεις του παίκτη 1 κυκλώνονται μπλε. Εάν ο παίκτης 2 εξομολογηθεί, η καλύτερη απάντηση του παίκτη 1 είναι να ομολογήσει, δεδομένου ότι -6 είναι καλύτερη από -10. Αν ο παίκτης 2 δεν ομολογεί, η καλύτερη απάντηση του παίκτη 1 είναι να ομολογήσει, αφού 0 είναι καλύτερη από -1.

Η ισορροπία Nash είναι το αποτέλεσμα όπου υπάρχει ένας πράσινος κύκλος και ένας μπλε κύκλος, καθώς αυτό αντιπροσωπεύει ένα σύνολο από καλύτερες στρατηγικές απόκρισης και για τους δύο παίκτες. Γενικά, είναι δυνατόν να έχουμε πολλαπλές ισορροπίες Nash ή καθόλου καθόλου (τουλάχιστον σε καθαρές στρατηγικές όπως περιγράφεται εδώ).

Μπορεί να παρατηρήσατε ότι η ισορροπία Nash σε αυτό το παράδειγμα φαίνεται να μην είναι βέλτιστη με κάποιο τρόπο (συγκεκριμένα, επειδή δεν είναι ο βέλτιστος Pareto), καθώς είναι δυνατό και για τους δύο παίκτες να πάρουν -1 αντί των -6. Αυτό είναι ένα φυσικό αποτέλεσμα της αλληλεπίδρασης που υπάρχει στο παιχνίδι - θεωρητικά, δεν ομολογεί ότι θα είναι ένα βέλτιστη στρατηγική για την ομάδα συλλογικά, αλλά τα ατομικά κίνητρα αποτρέπουν αυτό το αποτέλεσμα επιτευχθεί. Για παράδειγμα, εάν ο παίκτης 1 σκέφτηκε ότι ο παίκτης 2 θα παραμείνει σιωπηλός, θα είχε κίνητρο να τον ξεπεράσει παρά να παραμείνει σιωπηλός και αντίστροφα.

Για το λόγο αυτό, μια ισορροπία Nash μπορεί επίσης να θεωρηθεί ως αποτέλεσμα όπου κανένας παίκτης δεν έχει κίνητρο να αποκλίνει μονομερώς (δηλ. Από τον ίδιο) από τη στρατηγική που οδήγησε σε αυτό το αποτέλεσμα. Στο παραπάνω παράδειγμα, μόλις οι παίκτες επιλέξουν να ομολογήσουν, κανένας παίκτης δεν μπορεί να κάνει καλύτερα αλλάζοντας το μυαλό του μόνος του.

instagram story viewer