Σε ένα ιδιαίτερο πείραμα που συνδυάζει την τεχνολογική πρωτοπορία με τη νοσταλγία της ψηφιακής ιστορίας, το ChatGPT 4o της OpenAI ηττήθηκε από ένα… Atari 2600 στο σκάκι. Και μάλιστα, σε επίπεδο αρχαρίων. Το αποτέλεσμα αυτής της αναμέτρησης εγείρει ερωτήματα για τα όρια των σύγχρονων γλωσσικών μοντέλων όταν καλούνται να λειτουργήσουν εκτός του πεδίου εξειδίκευσής τους.
Πίσω από την ασυνήθιστη αυτή μονομαχία βρίσκεται ο μηχανικός της Citrix, Robert Caruso, ο οποίος αποφάσισε να δοκιμάσει το ChatGPT σε ένα σενάριο που, θεωρητικά, έπρεπε να είναι απλό: να κερδίσει μια παρτίδα σκάκι ενάντια στον εμβληματικό επεξεργαστή του Atari 2600, μέσω του Video Chess cartridge του 1979, σε αρχάριο επίπεδο δυσκολίας. Η αναμέτρηση έγινε μέσω εξομοίωσης και το ChatGPT κλήθηκε να λαμβάνει αποφάσεις βάσει εικόνων της σκακιέρας.
Η πρόβλεψη του Caruso ήταν ότι το προηγμένο AI μοντέλο θα κέρδιζε εύκολα. Εξάλλου, είχε στη διάθεσή του πολλαπλάσια υπολογιστική ισχύ και μία τεράστια βάση δεδομένων, ενώ η «αντίπαλός» του ήταν μια απλοϊκή μηχανή που μπορεί να υπολογίζει μόνο μία ή δύο κινήσεις μπροστά. Ωστόσο, τα πράγματα δεν εξελίχθηκαν όπως περίμενε.
Στην ανάρτησή του στο LinkedIn, ο Caruso περιγράφει με χιούμορ αλλά και έκπληξη την έκβαση της δοκιμής:
Το ChatGPT κατατροπώθηκε. Παρά το γεγονός ότι είχε σαφή εικόνα της αρχικής διάταξης της σκακιέρας, μπέρδεψε τους πύργους με τους αξιωματικούς, αγνόησε βασικές στρατηγικές όπως πιρούνια πιονιών, και έχανε συχνά την παρακολούθηση των θέσεων των κομματιών.
Μάλιστα, στην προσπάθειά του να δικαιολογήσει τα λάθη του, το ChatGPT αρχικά απέδωσε τις αποτυχίες στην “αφαιρετικότητα” των εικονιδίων του Atari, αλλά ακόμη και όταν μεταφέρθηκε στη χρήση της κλασικής σκακιστικής σημειογραφίας, οι επιδόσεις του δεν βελτιώθηκαν.
Η ήττα επήλθε μετά από περίπου 90 λεπτά παιχνιδιού, παρά το γεγονός ότι ο Caruso παρενέβαινε περιοδικά για να εμποδίσει τις πιο καταστροφικές επιλογές του μοντέλου. Όταν πλέον δεν υπήρχε αμφιβολία για την έκβαση, το ChatGPT παραδέχθηκε την ήττα του, ζητώντας όμως… άλλη μια ευκαιρία για επανεκκίνηση.
Το περιστατικό, αν και σαφώς αντιμετωπίζεται με χιουμοριστικό και πειραματικό χαρακτήρα, φωτίζει μια ουσιαστική διάσταση των δυνατοτήτων και των ορίων της τεχνητής νοημοσύνης. Το ChatGPT, αν και αποτελεί ένα εξαιρετικά ικανό εργαλείο για παραγωγή κειμένου, ανάλυση δεδομένων ή βοήθεια σε σύνθετες λεκτικές εργασίες, δεν είναι σχεδιασμένο για την επίλυση προβλημάτων που απαιτούν αυστηρή λογική και στρατηγική, όπως το σκάκι. Σε αντίθεση με εξειδικευμένες σκακιστικές μηχανές όπως το Stockfish, που διαθέτουν ELO άνω των 3.600 μονάδων, το ChatGPT δεν διαθέτει εσωτερικό μοντέλο του παιχνιδιού με την απαραίτητη ακρίβεια.
[via]