Τουρνουά για την ανάδειξη του καλύτερου «σκακιστή» τεχνητής νοημοσύνης διεξήχθη μεταξύ του ChatGPT της OpenAI και του Grok της εταιρείας του Έλον Μασκ, με νικητή το πρώτο.
Ιστορικά, οι εταιρείες τεχνολογίας χρησιμοποιούν συχνά το σκάκι για να αξιολογήσουν την πρόοδο και τις δυνατότητες ενός υπολογιστή, με τα σύγχρονα σκακιστικά μηχανήματα να είναι πρακτικά ανίκητα ακόμη και απέναντι στους κορυφαίους σκακιστές του κόσμου.
Η συγκεκριμένη διοργάνωση δεν αφορούσε υπολογιστές σχεδιασμένους ειδικά για σκάκι, αλλά μεταξύ μοντέλων AI για καθημερινή χρήση.
Σύμφωνα με το BBC, το μοντέλο o3 της OpenAI αναδείχθηκε αήττητο στο τουρνουά και στον τελικό επικράτησε του Grok 4 της xAI, ρίχνοντας ακόμη περισσότερο λάδι στη φωτιά της συνεχιζόμενης κόντρας μεταξύ των δύο εταιρειών.
Στην τρίτη θέση βρέθηκε το Gemini της Google, νικώντας ένα διαφορετικό μοντέλο της OpenAI.
Υπενθυμίζεται πως ο Έλον Μασκ και ο Σαμ Άλτμαν, αμφότεροι συνιδρυτές της OpenAI, υποστηρίζουν πως τα πιο πρόσφατα μοντέλα τους είναι τα πιο έξυπνα στον κόσμο.
Τα λάθη του Grok
Όπως αποδείχθηκε πάντως, τα συγκεκριμένα συστήματα, αν και διακρίνονται σε πολλές καθημερινές εργασίες, στο σκάκι βρίσκονται ακόμη σε φάση βελτίωσης – με το Grok να κάνει αρκετά λάθη στους τελικούς, συμπεριλαμβανομένης της επανειλημμένης απώλειας της βασίλισσάς του.
«Μέχρι τους ημιτελικούς φαινόταν πως τίποτα δεν θα σταματούσε το Grok από το να κατακτήσει τη νίκη» είπε ο Πέδρο Πινιάτα, αρθρογράφος του chess.com, καλύπτοντας τον τελικό. «Εκτός από κάποιες στιγμές αδυναμίας, η AI του X έμοιαζε με διαφορά ο ισχυρότερος σκακιστής. Αλλά η ψευδαίσθηση κατέρρευσε την τελευταία ημέρα του τουρνουά».
«Το Grok έκανε πολλά λάθη σε αυτές τις παρτίδες, αλλά η OpenAI όχι» δήλωσε ο γκραν μετρ Χικάρου Νακαμούρα κατά τη διάρκεια της live μετάδοσής του για τον τελικό.
Γιατί η τεχνητή νοημοσύνη παίζει σκάκι;
Το τουρνουά σκακιού με AI πραγματοποιήθηκε στην πλατφόρμα Kaggle, που ανήκει στην Google και επιτρέπει σε επιστήμονες δεδομένων να αξιολογούν τα συστήματά τους μέσω διαγωνισμών.
Οκτώ μεγάλα γλωσσικά μοντέλα από τις Anthropic, Google, OpenAI, xAI, καθώς και από τις κινεζικές DeepSeek και Moonshot AI, αναμετρήθηκαν μεταξύ τους στο τριήμερο τουρνουά της Kaggle.
Οι δημιουργοί AI χρησιμοποιούν δοκιμές γνωστές ως benchmarks για να ελέγχουν τις δεξιότητες των μοντέλων τους σε τομείς όπως η συλλογιστική ή η συγγραφή κώδικα.
Ως περίπλοκα παιχνίδια στρατηγικής με αυστηρούς κανόνες, το σκάκι και το γκο έχουν χρησιμοποιηθεί συχνά για να αξιολογηθεί η ικανότητα ενός μοντέλου να μαθαίνει πώς να πετυχαίνει το καλύτερο δυνατό αποτέλεσμα – σε αυτή την περίπτωση, να ξεπερνά τον αντίπαλο για να κερδίσει.