Ένας υπερυπολογιστής σχεδιασμένος για να εξερευνά τα βάθη του Σύμπαντος χρησιμοποιήθηκε για έναν εντελώς διαφορετικό σκοπό: για να αποκρυπτογραφήσει τη γλώσσα της ζωής. Ερευνητές του University of Glasgow αξιοποίησαν την τεράστια υπολογιστική ισχύ του Tursa – μιας μηχανής που συνήθως χρησιμοποιείται σε μελέτες σωματιδιακής φυσικής και αστροφυσικής από το βρετανικό ερευνητικό κέντρο DiRAC – για να δημιουργήσουν ένα μοντέλο τεχνητής νοημοσύνης ικανό να κατανοεί πώς «επικοινωνούν» μεταξύ τους οι πρωτεΐνες. Το αποτέλεσμα ονομάζεται PLM-Interact και υπόσχεται να αλλάξει ριζικά τον τρόπο που προσεγγίζουμε τη διάγνωση και τη θεραπεία ασθενειών, από τον καρκίνο έως τις ιογενείς λοιμώξεις.
Οι πρωτεΐνες είναι τα πραγματικά «μηχανήματα» της ζωής. Κάθε βιολογική διεργασία, από την ανάπτυξη των ιστών μέχρι τη μεταφορά σημάτων στα κύτταρα, εξαρτάται από τις αλληλεπιδράσεις τους. Όμως η κατανόηση αυτών των αλληλεπιδράσεων είναι εξαιρετικά περίπλοκη. Στο εργαστήριο, η ταυτοποίηση του τρόπου με τον οποίο δύο πρωτεΐνες δεσμεύονται ή συνεργάζονται μπορεί να απαιτεί μήνες, αν όχι χρόνια, πειραματισμού. Εδώ είναι που μπαίνει στο παιχνίδι ο Tursa: ένα σύστημα GPU «extreme scaling» που επέτρεψε στους επιστήμονες να εκπαιδεύσουν ένα μοντέλο γλώσσας 650 εκατομμυρίων παραμέτρων πάνω σε περισσότερα από 421.000 ζεύγη ανθρώπινων πρωτεϊνών.
Με απλά λόγια, η τεχνητή νοημοσύνη «έμαθε» να διαβάζει τις πρωτεΐνες όπως ένας γλωσσολόγος θα ανέλυε μια άγνωστη γλώσσα, αναγνωρίζοντας μοτίβα, συντακτικούς κανόνες και σημασιολογικές σχέσεις. Η λογική είναι ότι, όπως οι λέξεις συνδυάζονται για να δημιουργήσουν προτάσεις με νόημα, έτσι και οι πρωτεΐνες συνδυάζονται με συγκεκριμένους τρόπους για να ενεργοποιήσουν ή να ρυθμίσουν βιολογικές λειτουργίες.
Διαβάστε επίσης
Τα αποτελέσματα ήταν εντυπωσιακά. Το PLM-Interact κατόρθωσε να προβλέψει με ακρίβεια αυξημένη κατά 16 έως 28 τοις εκατό σε σχέση με τα πιο πρόσφατα μοντέλα, όπως το AlphaFold3 της Google DeepMind, ποιες πρωτεΐνες αλληλεπιδρούν μεταξύ τους και πώς συγκεκριμένες μεταλλάξεις μπορούν να διακόψουν αυτή την επικοινωνία. Σε πειράματα, το μοντέλο εντόπισε πέντε βασικές πρωτεϊνικές αλληλεπιδράσεις που σχετίζονται με κρίσιμες βιολογικές διεργασίες, όπως η πολυμερίωση του RNA και η ενδοκυτταρική μεταφορά πρωτεϊνών – τη στιγμή που τα υπόλοιπα μοντέλα εντόπιζαν μόλις μία.
Ένα από τα πιο συναρπαστικά στοιχεία της έρευνας είναι ότι το PLM-Interact μπορεί να αναλύσει και τις συνέπειες των γενετικών μεταλλάξεων, προσφέροντας νέες προοπτικές για την κατανόηση κληρονομικών νοσημάτων και καρκίνων. Όταν το σύστημα εκπαιδεύτηκε με δεδομένα από ανθρώπινες και ιικές πρωτεΐνες, κατάφερε να προβλέψει με πολύ μεγαλύτερη ακρίβεια τον τρόπο που οι ιοί συνδέονται με τα κύτταρα του ανθρώπινου οργανισμού.
Όπως σημείωσε ο καθηγητής David L. Robertson, ένας από τους επικεφαλής της μελέτης,
Η ανάγκη να κατανοήσουμε πώς οι ιοί αλληλεπιδρούν με το ανθρώπινο σώμα έγινε ξεκάθαρη κατά τη διάρκεια της πανδημίας COVID-19. Εργαλεία όπως το PLM-Interact μπορούν να αποδειχθούν καθοριστικά για την προετοιμασία μας απέναντι σε μελλοντικές υγειονομικές κρίσεις.
Πέρα όμως από την άμεση ιατρική του αξία, το έργο αυτό ανοίγει μια νέα εποχή για τη βιοτεχνολογία. Η έρευνα, που δημοσιεύτηκε στο περιοδικό Nature Communications, προτείνει ότι μοντέλα όπως το PLM-Interact θα μπορούσαν στο μέλλον να επιταχύνουν δραματικά την ανακάλυψη νέων φαρμάκων και εμβολίων. Η τεχνητή νοημοσύνη, με τη δυνατότητά της να αναλύει εκατομμύρια βιοχημικές αλληλεπιδράσεις σε λίγες ώρες, μπορεί να μειώσει σημαντικά το χρόνο και το κόστος που απαιτείται για την ανάπτυξη νέων θεραπειών.
Οι ερευνητές τονίζουν ότι το μεγαλύτερο πλεονέκτημα του μοντέλου δεν είναι μόνο η ταχύτητα, αλλά και η δυνατότητα να κατανοεί σχέσεις που δεν είναι άμεσα ορατές στα πειραματικά δεδομένα. Με τη βοήθεια της υπολογιστικής γλωσσολογίας και των νευρωνικών δικτύων, το PLM-Interact αναγνωρίζει τις «λέξεις» και τη «γραμματική» του μοριακού διαλόγου μέσα στο ανθρώπινο σώμα, επιτρέποντας στους επιστήμονες να χαρτογραφήσουν την πολυπλοκότητα της ζωής με τρόπο που μέχρι πρόσφατα φάνταζε αδύνατος.
[source]




