Η τεχνητή νοημοσύνη αποτελεί κομμάτι της καθημερινότητας καθώς αρκετοί είναι εκείνοι που πλέον ρωτούν την AI για θέματα που τους απασχολούν.
Πίσω από τα μοντέλα της τεχνητής νοημοσύνης υπάρχουν ομάδες που δοκιμάζουν τα πάντα, ώστε το μοντέλο τεχνητής νοημοσύνης να παρουσιάζει όλα αυτά που του ζητούν.
Κάθε μοντέλο, λοιπόν, που έχει δημιουργηθεί έχει τα πλεονεκτήματα και τα μειονεκτήματά του, όπως αναφέρει η ιστοσελίδα tomsguide.
Έρευνα της εταιρείας Prolific με έδρα το Ηνωμένο Βασίλειο εξέτασε εμπειρίες διαφορετικών χρηστών σε διάφορα μοντέλα τεχνητής νοημοσύνης.
Η τεχνητή νοημοσύνη μπορεί να προβλέψει τη μελλοντική σας υγεία, όπως και τον καιρό
Αξιολογώντας τις εμπειρίες 21.352 ατόμων με τα εργαλεία, κατάφεραν όχι μόνο να βρουν έναν συνολικό νικητή, αλλά και να αναλύσουν τα αποτελέσματα ανά ηλικία, τοποθεσία (δοκιμάστηκε τόσο στο Ηνωμένο Βασίλειο όσο και στις ΗΠΑ) και πολιτικές πεποιθήσεις.
Αυτό περιλαμβάνει ξεχωριστές λίστες για:
- Ηνωμένο Βασίλειο: ηλικιακές ομάδες
- Ηνωμένο Βασίλειο: εθνικότητα
- Ηνωμένο Βασίλειο: πολιτικές απόψεις
- ΗΠΑ: ηλικιακές ομάδες
- ΗΠΑ: εθνικότητα
- ΗΠΑ: πολιτικές απόψεις
Κάθε συμμετέχοντας κλήθηκε να αλληλεπιδράσει με δύο ξεχωριστά μοντέλα τεχνητής νοημοσύνης και να τους ζητήθηκε να διατυπώσουν την άποψή τους για το ποιο μοντέλο ήταν καλύτερο σε κάθε αλληλεπίδραση.
Τι δείχνουν τα αποτελέσματα για τα μοντέλα τεχνητής νοημοσύνης;
Αν περιμένετε να συναντήσετε το δημοφιλές ChatGPT στις πρώτες θέσεις, πλανάστε, καθώς αυτό πλασάρεται στην 8η θέση με το μοντέλο GPT-4.1.
Νικητής στη συνολική απόδοση αλλά και σε υποκατηγορίες ήταν το Gemini 2.5-Pro.
Οι 18-34χρονοι στο Ηνωμένο Βασίλειο, οι ψηφοφόροι των Δημοκρατικών και οι άνω των 55 ετών στις ΗΠΑ συμφώνησαν όλοι ότι το Gemini 2.5 Pro ήταν το καλύτερο συνολικό μοντέλο. Ο μόνος τομέας στον οποίο όλες οι οι ομάδες κατέταξαν κάτι πάνω από το Gemini ήταν η εμπιστοσύνη, η ηθική και η ασφάλεια, και αυτό ήταν το Grok-3, ένα κάπως οξύμωρο εύρημα, λαμβάνοντας υπόψη ορισμένα από τα ζητήματα ασφάλειας και ηθικής που είχε πρόσφατα το μοντέλο τεχνητής νοημοσύνης. Ακολουθούν το Deepseek, το Magistral Le Chat και το Grok.
Όπως σημειώνει η ιστοσελίδα tomsguide, τα αποτελέσματα δεν αντικατοπτρίζουν την απόδοση των μοντέλων, καθώς όταν δοκιμάζονται βάσει άλλων μετρήσεων οι επιλογές είναι το ChatGPT, το Gemini, το Claude και το Grok.