Η OpenAI ετοιμάζεται να κάνει το επόμενο βήμα στην εξερεύνηση της παραγωγικής τεχνητής νοημοσύνης. Σύμφωνα με δημοσίευμα του The Information, η εταιρεία εργάζεται πάνω σε ένα νέο εργαλείο που θα μπορεί να παράγει μουσική με βάση γραπτές ή ηχητικές οδηγίες. Με απλά λόγια, οι χρήστες θα μπορούν να ζητούν από την AI να συνθέσει μια μελωδία, να προσθέσει ρυθμό ή ακόμα και να συνοδεύσει μια φωνητική ηχογράφηση με μουσικά όργανα, όλα με μία μόνο περιγραφή ή δείγμα ήχου.
Αν επιβεβαιωθεί, το εργαλείο αυτό θα μπορούσε να φέρει επανάσταση στη μουσική παραγωγή, ιδιαίτερα για δημιουργούς που δεν έχουν πρόσβαση σε στούντιο ή επαγγελματικά εργαλεία. Σύμφωνα με τις πληροφορίες, η OpenAI δοκιμάζει το σύστημα ώστε να μπορεί να «καταλαβαίνει» μουσικές οδηγίες όπως «γράψε ένα χαλαρό κομμάτι τύπου lo-fi για βίντεο στο YouTube» ή «πρόσθεσε ρυθμική κιθάρα σε αυτά τα φωνητικά».
Αν και δεν είναι σαφές πότε θα κυκλοφορήσει ή αν θα είναι αυτόνομο προϊόν, θεωρείται πιθανό να ενσωματωθεί στις υπάρχουσες πλατφόρμες της εταιρείας, όπως το ChatGPT ή την εφαρμογή βίντεο Sora. Μια τέτοια ενοποίηση θα επέτρεπε στους χρήστες να δημιουργούν ολοκληρωμένες εμπειρίες multimedia (σενάριο, φωνή, εικόνα, ήχος) μέσα από ένα ενιαίο περιβάλλον.
Ένα ενδιαφέρον στοιχείο του ρεπορτάζ είναι η συνεργασία της OpenAI με φοιτητές του Juilliard School, μία από τις πιο διάσημες μουσικές σχολές παγκοσμίως. Οι φοιτητές φέρεται να συμμετέχουν στη διαδικασία σχολιασμού και ανάλυσης παρτιτούρων, ώστε να δημιουργηθεί ένα αξιόπιστο σύνολο δεδομένων για την εκπαίδευση του μοντέλου.
Η δημιουργία ενός εργαλείου που να «κατανοεί» τη μουσική σε επίπεδο θεωρίας και σύνθεσης απαιτεί εξαιρετικά προσεκτική δουλειά στα δεδομένα εκπαίδευσης. Η μουσική, σε αντίθεση με την εικόνα ή το κείμενο, διαθέτει πολυδιάστατη δομή: ρυθμό, αρμονία, μελωδία, δυναμική και ύφος. Η OpenAI, με αυτή τη συνεργασία, φαίνεται να προσπαθεί να εξασφαλίσει ότι το μοντέλο της θα έχει πραγματική μουσική παιδεία και όχι απλώς την ικανότητα να παράγει ήχους που μοιάζουν «αρκετά σωστοί».
Η ιδέα της «παραγωγής μουσικής» (generative music) δεν είναι καινούρια. Η Google, για παράδειγμα, έχει παρουσιάσει το MusicLM, ενώ νεότερες startups όπως η Suno έχουν ήδη καταφέρει να δημιουργούν τραγούδια που μοιάζουν επαγγελματικά. Η OpenAI, ωστόσο, διαθέτει ένα πλεονέκτημα: το οικοσύστημα εργαλείων της, που επιτρέπει τη σύνδεση διαφορετικών μοντέλων σε μία ενιαία ροή εργασίας. Έτσι, ένας δημιουργός θα μπορούσε, θεωρητικά, να γράψει ένα σενάριο στο ChatGPT, να παράγει ένα βίντεο στο Sora και να ζητήσει από το νέο μουσικό εργαλείο να συνθέσει το soundtrack χωρίς να φύγει ποτέ από την πλατφόρμα.
Όπως συμβαίνει με κάθε τεχνολογία τεχνητής νοημοσύνης, η είδηση δεν έχει προκαλέσει μόνο ενθουσιασμό αλλά και ανησυχία. Οι δημιουργοί και οι συνθέτες φοβούνται ότι ένα AI που μπορεί να παράγει μουσική με επαγγελματικό ήχο θα μπορούσε να υπονομεύσει τη δουλειά τους ή να προκαλέσει νομικά ζητήματα σχετικά με τα πνευματικά δικαιώματα.
Είναι πιθανό η OpenAI να προσπαθήσει να αποφύγει τέτοιες συγκρούσεις εξασφαλίζοντας ότι το μοντέλο της εκπαιδεύεται μόνο με μουσική που έχει αδειοδοτηθεί ή με δεδομένα που δημιουργούνται ειδικά για τον σκοπό αυτό, όπως φαίνεται να κάνει με τη συνεργασία του Juilliard. Παρ’ όλα αυτά, η συζήτηση για το ποιος έχει τα δικαιώματα μιας μουσικής δημιουργίας από AI είναι ακόμα ανοιχτή.
[source]




