Η κούρσα των AI video generators μόλις έγινε πιο έντονη. Η Runway ανακοίνωσε τη νέα έκδοση του μοντέλου text-to-video, Gen-4.5, και η εταιρεία δεν το παρουσιάζει απλώς ως μια αναβάθμιση, αλλά ως το μεγαλύτερο άλμα που έχει κάνει μέχρι σήμερα. Στο επίσημο blog της, η startup από την Καλιφόρνια υποστηρίζει ότι το μοντέλο ανεβάζει τον πήχη τόσο στην οπτική πιστότητα όσο και στη φυσική συνέπεια των παραγόμενων βίντεο, φτάνοντας σε επίπεδο όπου η διάκριση ανάμεσα σε πραγματικά πλάνα και υλικό που προέρχεται από AI γίνεται ολοένα και δυσκολότερη.
Η υπόσχεση είναι κινηματογραφική ποιότητα και σχεδόν πλήρης ρεαλισμός. Δεν πρόκειται πλέον για εντυπωσιακά clips που «μοιάζουν» με live action, καθώς η Runway μιλά για εικόνες που μπορούν να σταθούν δίπλα σε πραγματικές λήψεις ή ακόμα και υψηλής ποιότητας CGI χωρίς να προδίδουν την ψηφιακή τους προέλευση. Το μεγάλο στοίχημα, όμως, δεν βρίσκεται μόνο στην εικόνα. Όπως υπογραμμίζει η εταιρεία, ο πυρήνας της αναβάθμισης αφορά τον τρόπο με τον οποίο η μηχανή προσομοιώνει τον φυσικό κόσμο.
Η έκδοση Gen-4.5 έχει σχεδιαστεί για να αποδίδει αντικείμενα με αίσθηση βάρους και αδράνειας, κι όχι απλώς να τα μετακινεί οπτικά στο κάδρο. Το ίδιο ισχύει και για πιο δύσκολα στοιχεία, όπως υγρά: νερό που συμπεριφέρεται σαν πραγματικό νερό, λάδι που ρέει όπως περιμένει κανείς από λάδι, και αλληλεπιδράσεις που προσπαθούν να ακολουθήσουν τους φυσικούς νόμους. Σύμφωνα με τη Runway, οι βελτιώσεις στη διαχείριση σύνθετων prompts επιτρέπουν στην AI να διατηρεί τη σωστή σκηνική σύνθεση και τη συνοχή των πλάνων χωρίς να πέφτει η ποιότητα στις πιο απαιτητικές περιγραφές.
Ένα ακόμα δυνατό κομμάτι της νέας έκδοσης είναι ο έλεγχος των visual styles. Η εταιρεία αναφέρει ότι το μοντέλο αποδίδει πλέον πιο σταθερά και με συνέπεια σε διαφορετικές αισθητικές προσεγγίσεις — από πλήρη φωτορεαλισμό έως πιο «κινηματογραφικό» ύφος ή ακόμη και στυλιζαρισμένες animation τεχνοτροπίες. Με αυτό το εύρος, η Gen-4.5 στοχεύει σε επαγγελματίες του κινηματογράφου, δημιουργούς περιεχομένου και studios που χρειάζονται ένα εργαλείο ικανό να παράγει footage με συγκεκριμένο καλλιτεχνικό προσανατολισμό και όχι απλώς βίντεο-demo.
Η διανομή του μοντέλου θα γίνει σταδιακά σε όλους τους χρήστες και —όπως αναφέρει η εταιρεία— χωρίς υποχώρηση στις επιδόσεις ταχύτητας και επεξεργασίας σε σχέση με προηγούμενες εκδόσεις. Ωστόσο, η Runway παραδέχεται ανοιχτά ότι δεν έχουν λυθεί όλα τα προβλήματα. Η Gen-4.5 εξακολουθεί να παρουσιάζει προβλήματα στο κομμάτι της χρονικής συνέπειας: αντικείμενα μπορεί να εξαφανίζονται ή να μεταβάλλονται ξαφνικά ανάμεσα στα καρέ, ενώ σε ορισμένες περιπτώσεις το αποτέλεσμα και η αιτία δεν συμβαίνουν με σωστή σειρά — όπως μια πόρτα που ανοίγει πριν κάποιος πιάσει το χερούλι.
Ακόμα κι έτσι, η Runway επιμένει ότι τα βίντεο που παράγει το μοντέλο μπορούν να είναι «πρακτικά αδύνατο να διακριθούν από αληθινά».
Πηγή




