O ερευνητής που προγραμμάτισε τον τέλειο ηλεκτρονικό υπολογιστή για πόκερ

Παιχνίδια όπως το πόκερ ανοίγουν νέες δυνατότητες για τους ηλεκτρονικούς υπολογιστές στο μέλλον.

Όταν ο Τουόμας Σάντχολμ ξεκίνησε να μελετά το πόκερ στα πλαίσια της έρευνάς του στην τεχνητή νοημοσύνη πριν από 12 χρόνια, δεν φαντάστηκε ποτέ ότι ένας υπολογιστής θα ήταν σε θέση να νικήσει τους καλύτερους παίκτες. «Τουλάχιστον, δεν πίστευα ότι αυτό θα συνέβαινε όσο ζω» λέει.

Αλλά εν τέλει ο Σάντχολμ, καθηγητής ηλεκτρονικών υπολογιστών στο Πανεπιστήμιο Carnegie Mellon, κατάφερε να αναπτύξει μαζί με τον διδακτορικό φοιτητή Νόαμ Μπράουν ένα λογισμικό τεχνητής νοημοσύνης που είναι σε θέση να κάνει ακριβώς αυτό.

Το πρόγραμμα, με την επωνυμία Libratus, κέρδισε τέσσερις επαγγελματίες παίκτες του πόκερ σε ένα τουρνουά διάρκειας 20 ημερών που ολοκληρώθηκε στις 30 Ιανουαρίου. Στο τέλος, το Libratus κατέληξε να προηγείται των παικτών κατά 1,7 εκατομμύρια δολάρια σε τσιπ.

«Δεν το περίμενα ότι θα κερδίζαμε με τόση διαφορά» λέει ο Σάντχολμ. «Μας έδινα 50-50 πιθανότητες νίκης στην αρχή».

Τα παιχνίδια είναι εδώ και καιρό ένα εργαλείο για τη βελτίωση των επιδόσεων της τεχνητής νοημοσύνης και την παρακολούθηση και μέτρηση της προόδου στον κλάδο.

Το λογισμικό Deepmind AlphaGo της Google κατάφερε πέρυσι να κερδίσει τον παίκτη-θρύλο Λι Σίντολ στο πανάρχαιο και πολυσύνθετο κινεζικό παιχνίδι Go. Και ο Watson της IBM έμεινε στην ιστορία για τη νίκη του επί των πρωταθλητών του Jeopardy!, Κεν Τζένινγκς και Μπραντ Ρούτερ, το 2011. Τέλος, το 1996 ο Deep Blue του IBM κέρδισε τον τότε παγκόσμιο πρωταθλητή του σκακιού, Γκάρι Κασπάροφ.

Αυτό που κάνει το πόκερ να διαφέρει από ένα παιχνίδι σκακιού ή Go είναι το επίπεδο της αβεβαιότητας που συνδέεται μ’ αυτό. Σε αντίθεση με τα προαναφερθέντα παιχνίδια, οι παίκτες του πόκερ δεν έχουν πρόσβαση σε όλα τα δεδομένα του παιχνιδιού. Ενώ οι παίκτες του σκακιού και του Go μπορούν να δουν όλη τη σκακιέρα ή το ταμπλό, μαζί με τα πιόνια του αντιπάλου, στο πόκερ δεν μπορείς να ξέρεις τι χαρτιά έχει ο αντίπαλός σου.

Παιχνίδια όπως το πόκερ – ή αλλιώς καταστάσεις «ατελούς πληροφόρησης», όπως είναι γνωστές – ανοίγουν νέες δυνατότητες για τους ηλεκτρονικούς υπολογιστές στο μέλλον, λέει ο Σάντχολμ.

Όπως εξηγεί ο ίδιος, το Libratus είναι επιτυχημένο επειδή σκέφτεται κατά τη διάρκεια του παιχνιδιού τρόπους βελτίωσης της στρατηγικής του, ενώ την ίδια στιγμή η τεχνητή νοημοσύνη εντοπίζει ποιες «τρύπες» βρήκε ο αντίπαλος στη στρατηγική του προγράμματος και τις χρησιμοποιεί για τη βελτίωσή του μετά από κάθε παιχνίδι.

Ο Σάντχολμ επισημαίνει ότι το πόκερ ήταν πραγματικά η τελευταία μεγάλη πρόκληση για την τεχνητή νοημοσύνη. «Μέχρι σήμερα, το Τέξας Χόλντεμ είχε καταφέρει να μας διαφύγει. Πλέον, πετύχαμε μια πραγματικά υπεράνθρωπη επίδοση» καταλήγει.