ChatGPT και Grok πήραν μέρος σε τουρνουά σκακιού -Ποιο σύστημα τεχνητής νοημοσύνης κέρδισε

Τουρνουά για την ανάδειξη του καλύτερου «σκακιστή» τεχνητής νοημοσύνης διεξήχθη μεταξύ του ChatGPT της OpenAI και του Grok της εταιρείας του Έλον Μασκ, με νικητή το πρώτο.

Ιστορικά, οι εταιρείες τεχνολογίας χρησιμοποιούν συχνά το σκάκι για να αξιολογήσουν την πρόοδο και τις δυνατότητες ενός υπολογιστή, με τα σύγχρονα σκακιστικά μηχανήματα να είναι πρακτικά ανίκητα ακόμη και απέναντι στους κορυφαίους σκακιστές του κόσμου.

Η συγκεκριμένη διοργάνωση δεν αφορούσε υπολογιστές σχεδιασμένους ειδικά για σκάκι, αλλά μεταξύ μοντέλων AI για καθημερινή χρήση.

Σύμφωνα με το BBC, το μοντέλο o3 της OpenAI αναδείχθηκε αήττητο στο τουρνουά και στον τελικό επικράτησε του Grok 4 της xAI, ρίχνοντας ακόμη περισσότερο λάδι στη φωτιά της συνεχιζόμενης κόντρας μεταξύ των δύο εταιρειών.

Στην τρίτη θέση βρέθηκε το Gemini της Google, νικώντας ένα διαφορετικό μοντέλο της OpenAI.

Υπενθυμίζεται πως ο Έλον Μασκ και ο Σαμ Άλτμαν, αμφότεροι συνιδρυτές της OpenAI, υποστηρίζουν πως τα πιο πρόσφατα μοντέλα τους είναι τα πιο έξυπνα στον κόσμο.

Τα λάθη του Grok

Όπως αποδείχθηκε πάντως, τα συγκεκριμένα συστήματα, αν και διακρίνονται σε πολλές καθημερινές εργασίες, στο σκάκι βρίσκονται ακόμη σε φάση βελτίωσης – με το Grok να κάνει αρκετά λάθη στους τελικούς, συμπεριλαμβανομένης της επανειλημμένης απώλειας της βασίλισσάς του.

«Μέχρι τους ημιτελικούς φαινόταν πως τίποτα δεν θα σταματούσε το Grok από το να κατακτήσει τη νίκη» είπε ο Πέδρο Πινιάτα, αρθρογράφος του chess.com, καλύπτοντας τον τελικό. «Εκτός από κάποιες στιγμές αδυναμίας, η AI του X έμοιαζε με διαφορά ο ισχυρότερος σκακιστής. Αλλά η ψευδαίσθηση κατέρρευσε την τελευταία ημέρα του τουρνουά».

«Το Grok έκανε πολλά λάθη σε αυτές τις παρτίδες, αλλά η OpenAI όχι» δήλωσε ο γκραν μετρ Χικάρου Νακαμούρα κατά τη διάρκεια της live μετάδοσής του για τον τελικό.

Γιατί η τεχνητή νοημοσύνη παίζει σκάκι;

Το τουρνουά σκακιού με AI πραγματοποιήθηκε στην πλατφόρμα Kaggle, που ανήκει στην Google και επιτρέπει σε επιστήμονες δεδομένων να αξιολογούν τα συστήματά τους μέσω διαγωνισμών.

Οκτώ μεγάλα γλωσσικά μοντέλα από τις Anthropic, Google, OpenAI, xAI, καθώς και από τις κινεζικές DeepSeek και Moonshot AI, αναμετρήθηκαν μεταξύ τους στο τριήμερο τουρνουά της Kaggle.

Οι δημιουργοί AI χρησιμοποιούν δοκιμές γνωστές ως benchmarks για να ελέγχουν τις δεξιότητες των μοντέλων τους σε τομείς όπως η συλλογιστική ή η συγγραφή κώδικα.

Ως περίπλοκα παιχνίδια στρατηγικής με αυστηρούς κανόνες, το σκάκι και το γκο έχουν χρησιμοποιηθεί συχνά για να αξιολογηθεί η ικανότητα ενός μοντέλου να μαθαίνει πώς να πετυχαίνει το καλύτερο δυνατό αποτέλεσμα – σε αυτή την περίπτωση, να ξεπερνά τον αντίπαλο για να κερδίσει.

Ακολουθήστε το στο Google News και μάθετε πρώτοι όλες τις ειδήσεις

Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, στο

Source link

Τα λάθη του Grok

Γιατί η τεχνητή νοημοσύνη παίζει σκάκι;

Related posts

Η ByteDance παρουσίασε το εξελιγμένο πρόγραμμα δημιουργίας κειμένων Doubao 2.0

Η Κίνα κατασκεύασε το «αόρατο» βλήμα των 80mm

Ποιες θέσεις εργασίας θα εξαφανιστούν τα επόμενα 5 χρόνια λόγω της Τεχνητής Νοημοσύνης;