Αλγόριθμος με ελληνική υπογραφή «βλέπει» τις… «άτακτες» πρωτεΐνες

Μια ομάδα ερευνητών, ανάμεσά τους και Έλληνες βρήκαν έναν τρόπο να διερευνήσουν τη δομή ενός σημαντικού κλάσματος του συνόλου των ανθρώπινων πρωτεϊνών που μέχρι τώρα φαινόταν «σκοτεινό» και μη παρατηρήσιμο.

Συχνά σκεφτόμαστε τις πρωτεΐνες ως θρεπτικά συστατικά στο φαγητό μας ή ως το κύριο στοιχείο των μυών μας, αλλά ως μικροσκοπικά μόρια μέσα στα κύτταρα επιτελούν πολλές, διαφορετικές και ζωτικές λειτουργίες.
Η λειτουργία των πρωτεϊνών εξαρτάται απόλυτα από το σχήμα τους, αλλά όταν ο σχηματισμός τους πάει στραβά και προκύπτουν παραμορφωμένες δομές, τότε προκαλούν προβλήματα που μπορεί

να είναι από ελαφρώς «ανώδυνα», όταν παραμελούν το σημαντικό τους έργο, έως πολύ σημαντικά, όταν σχηματίζουν ένα άβολο χάος μέσα στο εσωτερικό των κυττάρων.

Να όμως που τα πράγματα δεν είναι πάντα ακριβώς έτσι. Και αυτό γιατί υπάρχουν χαοτικές και ‘άτακτες’ πρωτεΐνες που επιτελούν σημαντικούς βιολογικούς ρόλους παρά την εγγενή αταξία τους. Υπολογίζεται δε ότι αυτές οι πρωτεΐνες, που ονομάζονται εγγενώς διαταραγμένες (intrinsically disordered protein, IDR), αφορούν περίπου το 30% του ανθρώπινου πρωτεώματος (σύνολο πρωτεϊνών), και διαδραματίζουν σημαντικούς λειτουργικούς ρόλους μέσα στο κύτταρο ως κόμβοι αλληλεπίδρασης κατά τη διάρκεια βιολογικών διεργασιών (στη μεταγραφή, τη μετάφραση και τη σηματοδότηση). Πολυάριθμες δε, μεταλλαγές που συσχετίζονται με νευρολογικές ασθένειες εντοπίζονται σε εγγενώς διαταραγμένες πρωτεϊνικές περιοχές (intrinsically disordered protein regions, IDRs), συμπεριλαμβανομένων μεταλλαγών που συνδέονται με την πλάγια μυατροφική σκλήρυνση (ALS).

«Αυτά τα πρωτεϊνικά τμήματα που είναι γνωστά ως εγγενώς διαταραγμένες περιοχές (IDRs), δεν παρουσιάζουν μια σταθερή δευτεροταγή (χωροδιάταξη) ή τριτοταγή δομή (τρισδιάστατο σχήμα) και αλλάζουν με ταχύτητα τη διαμόρφωσή τους, θέτοντας ένα σημαντικό πρόβλημα στην πρόβλεψη της δομής τους», εξηγεί ο Δρ Ζαχαρίας-Φαίδων Μπροτζάκης, μεταδιδακτορικός ερευνητής στο εργαστήριο του Γεωργίου Σκρέτα, διευθυντή του Ινστιτούτου Βιοκαινοτομίας στο Ερευνητικό Κέντρο Βιοϊατρικών Επιστημών «Αλέξανδρος Φλέμινγκ» (ΕΚΕΒΕ Φλέμινγκ).

Η ακριβής πρόβλεψη των πρωτεϊνικών δομών από αλληλουχίες αμινοξέων (τα δομικά τους μόρια) υπήρξε ένας διαχρονικός στόχος στη βιολογία. Κατά καιρούς, ισχυροί αλγόριθμοι μηχανικής μάθησης, συμπεριλαμβανομένων των AlphaFold και RoseTTAFold, εκπαιδεύτηκαν για να προβλέπουν με λεπτομέρεια το σχήμα (δομή) των φυσικών πρωτεϊνών, με βάση αποκλειστικά τις αλληλουχίες των αμινοξέων τους και το κατάφεραν με υψηλή ακρίβεια. Το 2022, η εταιρεία τεχνητής νοημοσύνης DeepMind πρόβλεψε τις δομές του 98,5% των πρωτεϊνών (περίπου 200 εκατομμύρια πρωτεΐνες) στο ανθρώπινο πρωτέωμα, λύνοντας με επιτυχία ένα πρόβλημα το οποίο απασχολούσε τους επιστήμονες για περισσότερα από 50 χρόνια και χαρίζοντας στους Demis Hassabis και John Jumper το βραβείο Νόμπελ Χημείας 2024.

Οι αλγόριθμοι δεν δουλεύουν σε όλες τις πρωτεΐνες

Παρότι το AlphaFold2 και άλλες μέθοδοι που βασίζονται στη μηχανική μάθηση μπορούν πλέον να προβλέψουν με ακρίβεια τις δομές των περισσότερων πρωτεϊνών, δυστυχώς τα «βρίσκουν λίγο σκούρα» με τις ανθρώπινες πρωτεΐνες που περιέχουν εγγενώς διαταραγμένες περιοχές (IDRs), οι οποίες είναι εξαιρετικά εύκαμπτες και δεν αναδιπλώνονται αυτόνομα.

«Ο επιτυχημένος αλγόριθμος AlphaFold2 δεν δίνει καλή πρόβλεψη του τρισδιάστατου σχήματος εγγενώς διαταραγμένων περιοχών αφενός γιατί δεν έχει εκπαιδευτεί σε τέτοια δεδομένα, αφετέρου επειδή αυτές οι πρωτεΐνες χαρακτηρίζονται από μια εγγενή δυναμική, δηλαδή παρουσιάζουν ένα σύνολο διαμορφώσεων και όχι μια σταθερή διαμόρφωση. Με άλλα λόγια δεν έχουν μια σταθερή μορφή αλλά παίρνουν πολλές μορφές, τη μια μετά την άλλη. Οι προβλέψεις της δομής πρωτεϊνών με το AlphaFold2 δεν μπορούν να προσφέρουν ρεαλιστικές αναπαραστάσεις αυτών των ‘άτακτων’ και ‘χαοτικών’ πρωτεϊνικών περιοχών στο σύνολό τους», εξηγεί ο Δρ. Μπροτζάκης
Σύμφωνα με τον Έλληνα ερευνητή, οι εγγενώς διαταραγμένες πρωτεΐνες, όπως και οι δομημένες πρωτεΐνες επιτελούν εξίσου σημαντικό βιολογικό ρόλο στο κύτταρο, παρότι πηγαίνουν κόντρα στο κλασικό δόγμα της βιολογίας ότι ένα και μοναδικό σταθερό σχήμα μιας πρωτεΐνης καθορίζει και τον ρόλο της.

«Τις τελευταίες δεκαετίες πυκνώνει η συναίνεση των ερευνητών για τον καθοριστικό ρόλο που παίζει η εγγενής ‘αταξία’ των πρωτεϊνών στη λειτουργία τους. Αυτό είναι ορατό στις εγγενώς διαταραγμένες πρωτεΐνες ή σε εγγενώς διαταραγμένες περιοχές μερικών δομημένων πρωτεϊνών, όπου η λειτουργικότητά τους στηρίζεται ακριβώς στη δυνατότητα τους να εξερευνούν και να λαμβάνουν διαφορετικά σχήματα (δομές). Για παράδειγμα, το νουκλεόσωμα, που είναι η βασική μονάδα συσκευασίας του DNA στη χρωματίνη (σύμπλοκο γενετικού υλικού με πρωτεΐνες) του κυτταρικού πυρήνα, αποτελείται από μερικώς διαταραγμένες πρωτεΐνες (ιστόνες), γύρω από τις οποίες τυλίγονται περίπου 147 ζεύγη βάσεων (γράμματα) DNA. Αυτές οι ιστόνες επιτελούν τον ρόλο του gate-keeper (θυρωρού) κατά τη μετάφραση του DNA σε πρωτεΐνες, ‘μαζεύοντας’ και ‘απλώνοντας’ την πολυπεπτιδική αλυσίδα, ανοίγοντας και κλείνοντας την ‘πόρτα’ σε διάφορους παράγοντες (μεταγραφικούς) για να προχωρήσουν με την κωδικοποίηση του DNA», προσθέτει ο Δρ Μπροτζάκης.

Ένα σκοτεινό κομμάτι του πρωτεώματος

Τώρα, μια ομάδα ερευνητών από το ΕΚΕΒΕ «Φλέμινγκ» και από το Centre for Misfolding Diseases του Πανεπιστημίου του Κέιμπριτζ, βρήκαν έναν τρόπο να διερευνήσουν τη δομή αυτού του σημαντικού κλάσματος του πρωτεώματος που δείχνει μέχρι τώρα να είναι «σκοτεινό» και μη παρατηρήσιμο.

Η ομάδα ανέπτυξε και χρησιμοποίησε έναν αλγόριθμο με την ονομασία AlphaFold-Metainference, ο οποίος εκπαιδεύτηκε σε δεδομένα από διαθέσιμες βάσεις για αναδιπλωμένες πρωτεΐνες αλλά και σε προσομοιώσεις μοριακής δυναμικής (της κίνησης ενός βιολογικού μορίου ή ενός συστήματος πολλών μορίων). Τα ευρήματα της μελέτης δημοσιεύτηκαν πρόσφατα στο επιστημονικό περιοδικό Nature Communication.

«Το AlphaFold έχει μεταμορφώσει τη δομική βιολογία παρέχοντας ακριβείς προβλέψεις των δομών των πρωτεϊνών. Τώρα δείξαμε πώς να επεκτείνουμε αυτές τις προβλέψεις σε εγγενώς διαταραγμένες πρωτεΐνες, οι οποίες αποτελούν περίπου το 1/3 του ανθρώπινου πρωτεώματος και εμπλέκονται ουσιαστικά σε όλες τις μεγάλες ασθένειες» τονίζει ο ερευνητής αναφοράς της δημοσίευσης Μικέλε Βεντρούσκολο, καθηγητής Βιοφυσικής στο Centre for Misfolding Diseases του Πανεπιστημίου του Κέιμπριτζ.

«Με έκπληξη διαπιστώσαμε ότι παρόλο που το AlphaFold δεν προβλέπει με ακρίβεια την τρισδιάστατη δομή εγγενώς διαταραγμένων πρωτεϊνών, μπορεί να προβλέψει τις αποστάσεις μεταξύ των αμινοξέων. Έτσι, προχωρήσαμε στην ενσωμάτωση αυτής της πληροφορίας σε προσομοιώσεις μοριακής δυναμικής με αποτέλεσμα να προβλέψουμε με ακρίβεια τις τρισδιάστατες δομές που υιοθετούν οι διαταραγμένες πρωτεΐνες αλλά και την κίνησή τους», εξηγεί ο επικεφαλής συγγραφέας της μελέτης Δρ. Μπροτζάκης.

Σύμφωνα με τον ίδιο, ο αλγόριθμος δοκιμάστηκε σε πρωτεΐνες με διαταραγμένες και με μη διαταραγμένες περιοχές συμπεριλαμβανομένης της πρωτεΐνης TDP-43 που σχετίζεται με τη μυατροφική πλευρική σκλήρυνση (ALS), της αταξίνης-3, η οποία συνδέεται με τη νόσο Machado-Joseph (επίσης γνωστή ως νωτιαία παρεγκεφαλιδική αταξία τύπου 3) και της πρωτεΐνης πράιον που σχετίζεται με τη νόσο Creutzfeldt-Jakob (γνωστή ώς υποξεία σπογγώδης εγκεφαλοπάθεια).

«Δοκιμάσαμε τον αλγόριθμο σε σύνολο 11 IDPs και 7 PDPs (ένα είδος ενζύμων), αλλά πιο συγκεκριμένα το δοκιμάσαμε σε πρωτεΐνες σοβαρών ασθενειών, όπως αυτές που αναφέρονται παραπάνω, για τη ανίχνευση μορίων φαρμακευτικού ενδιαφέροντος. Σε όλες τις περιπτώσεις όπου δοκιμάστηκε ο αλγόριθμος ξεπέρασε τις προβλέψεις του AlphaFold. Στο 80% των περιπτώσεων μάλιστα, ξεπέρασε ή είχε ίδια ακρίβεια με προσομοιώσεις μοριακής δυναμικής. Ο αλγόριθμος εμφανίζει πλεονέκτημα στον δομικό χαρακτηρισμό εγγενώς διαταραγμένων πρωτεΐνών», διευκρινίζει Δρ. Μπροτζάκης.

Οι επιστήμονες έχουν τώρα έναν γρήγορο και πιο ακριβή τρόπο να ανακαλύπτουν δομικά σύνολα διαταραγμένων πρωτεϊνών, ιδιαίτερα στις περιπτώσεις όπου δεν υπάρχουν πειραματικά δεδομένα. «Μπορούμε στο μέλλον να αξιοποιήσουμε αυτή την πληροφορία ώστε να προχωρήσουμε σε ανακάλυψη μορίων φαρμακευτικού ενδιαφέροντος τα οποία μπορούν να αλληλεπιδρούν ισχυρά με αυτές τις πρωτεΐνες και να τροποποιούν τη δυναμική τους ώστε να αποτρέπεται για παράδειγμα, η προβληματική τους αναδίπλωση σε τοξικές μορφές, όπως π.χ. σε αμυλοειδή ινίδια, που παρατηρούνται σε πολλές νευροεκφυλιστικές νόσους», αναφέρει ο Έλληνας ερευνητής.
Σύμφωνα με τον ίδιο, ο χαρακτηρισμός των συνόλων διαμορφώσεων που επιτυγχάνουν οι διαταραγμένες πρωτεΐνες είναι ένας αναπτυσσόμενος κλάδος. «Αυτό που προσφέρει η έρευνά μας είναι ο συνδυασμός ταχύτητας και ακρίβειας. Προχωράμε στην εφαρμογή του αλγόριθμου και σε άλλα βιομόρια όπως DNA, RNA», καταλήγει ο ερευνητής.

#ΕΠΙΣΤΗΜΗ #ΑΛΓΟΡΙΘΜΟΣ
Keywords
Τυχαία Θέματα
Αλγόριθμος, ΐνες,algorithmos, ΐnes