Πώς οι υπολογιστές βοηθούν τους βιολόγους να σπάσουν τα μυστικά της ζωής

Όταν το ανθρώπινο γονιδίωμα μήκους τριών δισεκατομμυρίων γραμμάτων αλληλουχήθηκε, μπήκαμε σε ένα νέο «OmicsΕποχή της βιολογικής έρευνας. Οι επιστήμονες αγωνίζονται τώρα να ακολουθήσουν τα γονιδιώματα (όλα τα γονίδια) ή τα πρωτεόματα (όλες τις πρωτεΐνες) διαφόρων οργανισμών - και στη διαδικασία συλλέγουν τεράστιες ποσότητες δεδομένων.

Για παράδειγμα, ένας επιστήμονας μπορεί να χρησιμοποιήσει εργαλεία «omics», όπως προσδιορισμό αλληλουχίας DNA για να πειράξει ποια ανθρώπινα γονίδια επηρεάζονται από λοίμωξη από ιική γρίπη. Αλλά επειδή το ανθρώπινο γονιδίωμα έχει τουλάχιστον 25,000 γονίδια συνολικά, ο αριθμός των γονιδίων που έχουν αλλάξει ακόμη και κάτω από ένα τόσο απλό σενάριο θα μπορούσε ενδεχομένως να είναι χιλιάδες.

Αν και ο προσδιορισμός αλληλουχίας και ταυτοποίησης γονιδίων και πρωτεϊνών τους δίνει ένα όνομα και ένα μέρος, δεν μας λέει τι κάνουν. Πρέπει να καταλάβουμε πώς αυτά τα γονίδια, οι πρωτεΐνες και όλα τα πράγματα στο μεταξύ αλληλεπιδρούν σε διαφορετικές βιολογικές διαδικασίες.

Σήμερα, ακόμη και τα βασικά πειράματα αποδίδουν μεγάλα δεδομένα και μία από τις μεγαλύτερες προκλήσεις είναι η αποσύνδεση των σχετικών αποτελεσμάτων από το θόρυβο του περιβάλλοντος. Οι υπολογιστές μας βοηθούν να ξεπεράσουμε αυτό το βουνό δεδομένων. αλλά μπορούν ακόμη και να προχωρήσουν ένα βήμα πιο πέρα ​​από αυτό, βοηθώντας μας να βρούμε επιστημονικές υποθέσεις και να εξηγήσουμε νέες βιολογικές διαδικασίες. Η επιστήμη των δεδομένων, στην ουσία, επιτρέπει την αιχμή βιολογικής έρευνας.

Υπολογιστές στη διάσωση

Οι υπολογιστές διαθέτουν μοναδική ικανότητα να χειρίζονται τεράστια σύνολα δεδομένων, καθώς μπορούν ταυτόχρονα να παρακολουθούν όλες τις σημαντικές προϋποθέσεις που απαιτούνται για την ανάλυση.


εσωτερικά εγγραφείτε γραφικό


Αν και αυτοί θα μπορούσε να αντικατοπτρίζει τα ανθρώπινα λάθη Είναι προγραμματισμένοι με, οι υπολογιστές μπορούν να αντιμετωπίζουν αποτελεσματικά μεγάλες ποσότητες δεδομένων και δεν είναι προκατειλημμένοι προς τους οικείους, όπως θα μπορούσαν να είναι οι ερευνητές.

Οι υπολογιστές μπορούν επίσης να διδαχθούν να αναζητούν συγκεκριμένα μοτίβα σε πειραματικά σύνολα δεδομένων - μια έννοια που ονομάζεται μηχανική μάθηση, που προτάθηκε για πρώτη φορά στη δεκαετία του 1950, κυρίως από μαθηματικό Alan Turing. Ένας αλγόριθμος που έχει μάθει τα μοτίβα από σύνολα δεδομένων μπορεί στη συνέχεια να κληθεί να κάνει προβλέψεις με βάση νέα δεδομένα που δεν είχε συναντήσει ποτέ πριν.

Η μηχανική μάθηση έχει φέρει επανάσταση στη βιολογική έρευνα, καθώς μπορούμε τώρα να χρησιμοποιήσουμε μεγάλα σύνολα δεδομένων και να ζητήσουμε από τους υπολογιστές να βοηθήσουν στην κατανόηση της υποκείμενης βιολογίας.

Εκπαίδευση υπολογιστών να σκέφτονται προσομοιώνοντας τις διαδικασίες εγκεφάλου

Χρησιμοποιήσαμε ένα ενδιαφέρον είδος μηχανικής μάθησης, που ονομάζεται τεχνητό νευρικό δίκτυο (ANN), στο δικό μας εργαστήριο. Οι εγκέφαλοι είναι πολύ διασυνδεδεμένα δίκτυα νευρώνων, τα οποία επικοινωνούν στέλνοντας ηλεκτρικούς παλμούς μέσω της νευρικής καλωδίωσης. Ομοίως, ένα ANN προσομοιώνει στον υπολογιστή ένα δίκτυο νευρώνων καθώς ενεργοποιούνται και απενεργοποιούνται ως απόκριση σε άλλα σήματα νευρώνων.

Εφαρμόζοντας αλγόριθμους που μιμούνται τις διαδικασίες των πραγματικών νευρώνων, μπορούμε να κάνουμε το δίκτυο να μάθει να επιλύει πολλούς τύπους προβλημάτων. Η Google χρησιμοποιεί ένα ισχυρό ANN για το πλέον διάσημο Έργο Deep Dream όπου οι υπολογιστές μπορούν να ταξινομήσουν και ακόμη και να δημιουργήσουν εικόνες.

Η ομάδα μας μελετά το ανοσοποιητικό σύστημα, με στόχο ανακαλύπτοντας νέες θεραπείες για τον καρκίνο. Έχουμε χρησιμοποιήσει υπολογιστικά μοντέλα ANN για να μελετήσουμε κωδικούς πρωτεϊνών μικρής επιφάνειας που χρησιμοποιούν τα ανοσοκύτταρα μας για να προσδιορίσουμε αν κάτι είναι ξένο για το σώμα μας και συνεπώς πρέπει να επιτεθεί. Εάν καταλαβαίνουμε περισσότερα για το πώς τα κύτταρα του ανοσοποιητικού μας συστήματος (όπως τα Τ-κύτταρα) διαφοροποιούν τα φυσιολογικά / μόνα και τα μη φυσιολογικά / ξένα κύτταρα, μπορούμε να σχεδιάσουμε καλύτερα εμβόλια και θεραπείες.

Εξετάσαμε τους διαθέσιμους στο κοινό καταλόγους χιλιάδων κωδικών πρωτεϊνών που έχουν αναγνωριστεί από ερευνητές με την πάροδο των ετών. Διαχωρίσαμε αυτό το μεγάλο σύνολο δεδομένων σε δύο: φυσιολογικούς κωδικούς αυτο-πρωτεΐνης που προέρχονται από υγιή ανθρώπινα κύτταρα και μη φυσιολογικούς κωδικούς πρωτεΐνης που προέρχονται από ιούς, όγκους και βακτήρια. Στη συνέχεια στρίψαμε σε ένα τεχνητό νευρικό δίκτυο που αναπτύχθηκε στο εργαστήριό μας.

Μόλις τροφοδοτήσαμε τους κωδικούς πρωτεΐνης στο ANN, ο αλγόριθμος μπόρεσε να αναγνωρίσει θεμελιώδεις διαφορές μεταξύ φυσιολογικών και μη φυσιολογικών πρωτεϊνικών κωδικών. Θα ήταν δύσκολο για τους ανθρώπους να παρακολουθούν τέτοια είδη βιολογικών φαινομένων - υπάρχουν κυριολεκτικά χιλιάδες από αυτούς τους κωδικούς πρωτεΐνης για ανάλυση στο μεγάλο σύνολο δεδομένων. Χρειάζεται μια μηχανή για να αντιμετωπίσει αυτά τα πολύπλοκα προβλήματα και να καθορίσει τη νέα βιολογία.

Προβλέψεις μέσω μηχανικής μάθησης

Η πιο σημαντική εφαρμογή της μηχανικής μάθησης στη βιολογία είναι η χρησιμότητά της στην πραγματοποίηση προβλέψεων με βάση μεγάλα δεδομένα. Οι προβλέψεις που βασίζονται σε υπολογιστή μπορούν να κατανοήσουν μεγάλα δεδομένα, να δοκιμάσουν υποθέσεις και να εξοικονομήσουν πολύτιμο χρόνο και πόρους.

Για παράδειγμα, στον τομέα της βιολογίας Τ-κυττάρων, το να γνωρίζουμε ποιοι ιικοί κωδικοί πρωτεΐνης στοχεύουν είναι κρίσιμοι στην ανάπτυξη εμβολίων και θεραπειών. Αλλά υπάρχουν τόσοι πολλοί μεμονωμένοι κωδικοί πρωτεΐνης από οποιονδήποτε ιό που είναι πολύ ακριβό και δύσκολο να δοκιμάσετε πειραματικά τον καθένα.

Αντ 'αυτού, εκπαιδεύσαμε το τεχνητό νευρικό δίκτυο για να βοηθήσουμε το μηχάνημα να μάθει όλα τα σημαντικά βιοχημικά χαρακτηριστικά των δύο τύπων πρωτεϊνών-κωδικών - φυσιολογικό έναντι μη φυσιολογικό. Στη συνέχεια, ζητήσαμε από το μοντέλο να «προβλέψει» ποιοι νέοι κωδικοί πρωτεΐνης ιού μοιάζουν με την «μη φυσιολογική» κατηγορία και θα μπορούσαν να θεωρηθούν από τα Τ-κύτταρα και, επομένως, από το ανοσοποιητικό σύστημα. Δοκιμάσαμε το μοντέλο ANN σε διαφορετικές πρωτεΐνες ιών που δεν έχουν μελετηθεί ποτέ πριν.

Σίγουρα, όπως ένας επιμελής μαθητής που είναι πρόθυμος να ευχαριστήσει τον δάσκαλο, το νευρικό δίκτυο μπόρεσε να εντοπίσει με ακρίβεια την πλειονότητα τέτοιων κωδικοποιητικών πρωτεϊνών Τ-κυττάρων σε αυτόν τον ιό. Δοκιμάσαμε επίσης πειραματικά τους κωδικούς πρωτεΐνης που επισημάνθηκε για να επικυρώσουμε την ακρίβεια των προβλέψεων του ANN. Χρησιμοποιώντας αυτό το μοντέλο νευρωνικού δικτύου, ένας επιστήμονας μπορεί έτσι γρήγορη πρόβλεψη όλους τους σημαντικούς σύντομους κωδικούς πρωτεΐνης από έναν επιβλαβή ιό και δοκιμάστε τους να αναπτύξουν μια θεραπεία ή ένα εμβόλιο, αντί να μαντέψουν και να τους δοκιμάσουν ξεχωριστά.

Υλοποίηση της μηχανικής εκμάθησης με σύνεση

Χάρη στη συνεχή βελτίωση, η επιστήμη των μεγάλων δεδομένων και η μηχανική μάθηση καθίστανται ολοένα και πιο απαραίτητα για κάθε είδους επιστημονική έρευνα. Οι δυνατότητες χρήσης υπολογιστών για εκπαίδευση και πρόβλεψη στη βιολογία είναι σχεδόν ατελείωτες. Από τον προσδιορισμό του συνδυασμού βιοδείξεων που είναι καλύτεροι για την ανίχνευση μιας ασθένειας έως την κατανόηση του λόγου ορισμένοι ασθενείς επωφελούνται από μια συγκεκριμένη θεραπεία για τον καρκίνο, η εξόρυξη μεγάλων συνόλων δεδομένων που χρησιμοποιούν υπολογιστές έχει γίνει πολύτιμη διαδρομή για έρευνα.

Φυσικά, υπάρχουν περιορισμοί. Το μεγαλύτερο πρόβλημα με την επιστήμη των μεγάλων δεδομένων είναι τα ίδια τα δεδομένα. Εάν τα δεδομένα που λαμβάνονται από μελέτες -omics είναι ελαττωματικά στην αρχή ή βασίζονται σε κακή επιστήμη, οι μηχανές θα εκπαιδευτούν σε κακά δεδομένα - οδηγώντας σε κακές προβλέψεις. Ο μαθητής είναι τόσο καλός όσο ο δάσκαλος.

Επειδή οι υπολογιστές δεν είναι αισθαντικοί (ακόμηΜπορούν, στην αναζήτησή τους για μοτίβα, να τα βρουν ακόμη και όταν δεν υπάρχουν, δημιουργώντας ξανά, κακά δεδομένα και μη αναπαραγωγική επιστήμη.

Και ορισμένοι ερευνητές έχουν εκφράσει ανησυχίες σχετικά με τη δημιουργία υπολογιστών μαύρα κουτιά δεδομένων για επιστήμονες που δεν καταλαβαίνουν σαφώς τους χειρισμούς και τις τεχνικές που πραγματοποιούν για λογαριασμό τους.

Παρά τα προβλήματα αυτά, τα οφέλη των μεγάλων δεδομένων και των μηχανών θα συνεχίσουν να τα καθιστούν πολύτιμους συνεργάτες στην επιστημονική έρευνα. Έχοντας υπόψη τις προειδοποιήσεις, είμαστε σε θέση να κατανοήσουμε τη βιολογία μέσα από τα μάτια μιας μηχανής.

Σχετικά με το ΣυγγραφέαςΗ Συνομιλία

Σρι Κρίσνα, Υποψήφιος Διδάκτορας, Βιολογικός Σχεδιασμός, Σχολή Μηχανικών Βιολογικών και Συστημάτων Υγείας, Κρατικό Πανεπιστήμιο της Αριζόνα και Ντιέγκο Τσέουελ, Διδακτορικός φοιτητής στα Εφαρμοσμένα Μαθηματικά, Κρατικό Πανεπιστήμιο της Αριζόνα

Αυτό το άρθρο δημοσιεύθηκε αρχικά στις Η Συνομιλία. Διαβάστε το αρχικό άρθρο.


Σχετικό βιβλίο:

at InnerSelf Market και Amazon