Shutterstock/Valentyn640

Το 1956, κατά τη διάρκεια ενός μονοετούς ταξιδιού στο Λονδίνο και στις αρχές της δεκαετίας του 20, ο μαθηματικός και θεωρητικός βιολόγος Jack D. Cowan επισκέφτηκε τον Wilfred Taylor και το παράξενο νέο του.learning machine". Κατά την άφιξή του έμεινε μπερδεμένος από την «τεράστια τράπεζα μηχανημάτων» που τον αντιμετώπισε. Ο Cowan μπορούσε μόνο να σταθεί δίπλα του και να παρακολουθήσει «το μηχάνημα να κάνει το πράγμα του». Αυτό που φαινόταν ότι έκανε ήταν να εκτελεί ένα «σχήμα συσχετιστικής μνήμης» - φαινόταν ότι μπορούσε να μάθει πώς να βρίσκει συνδέσεις και να ανακτά δεδομένα.

Μπορεί να έμοιαζε με βαριά μπλοκ κυκλώματος, συγκολλημένα με το χέρι σε μια μάζα καλωδίων και κουτιών, αλλά αυτό που ο Cowan έβλεπε ήταν μια πρώιμη αναλογική μορφή ενός νευρωνικού δικτύου – ένας πρόδρομος της πιο προηγμένης τεχνητής νοημοσύνης του σήμερα, συμπεριλαμβανομένου του πολυσυζητημένο ChatGPT με την ικανότητά του να δημιουργεί γραπτό περιεχόμενο σε απόκριση σχεδόν σε οποιαδήποτε εντολή. Η υποκείμενη τεχνολογία του ChatGPT είναι ένα νευρωνικό δίκτυο.

Καθώς ο Cowan και ο Taylor στέκονταν και παρακολουθούσαν τη λειτουργία του μηχανήματος, δεν είχαν ιδέα πώς ακριβώς κατάφερνε να εκτελέσει αυτό το έργο. Η απάντηση στον μυστηριώδη μηχανικό εγκέφαλο του Taylor μπορεί να βρεθεί κάπου στους «αναλογικούς νευρώνες» του, στους συσχετισμούς που δημιουργούνται από τη μνήμη του μηχανήματος και, το πιο σημαντικό, στο γεγονός ότι η αυτοματοποιημένη λειτουργία του δεν μπορούσε πραγματικά να εξηγηθεί πλήρως. Θα χρειαστούν δεκαετίες για να βρουν αυτά τα συστήματα το σκοπό τους και να ξεκλειδωθεί αυτή η δύναμη.

Ο όρος νευρωνικό δίκτυο ενσωματώνει ένα ευρύ φάσμα συστημάτων, αλλά κεντρικά, σύμφωνα με την IBM, αυτά τα «νευρωνικά δίκτυα – επίσης γνωστά ως τεχνητά νευρωνικά δίκτυα (ANN) ή προσομοιωμένα νευρωνικά δίκτυα (SNN) – αποτελούν υποσύνολο της μηχανικής μάθησης και βρίσκονται στην καρδιά των αλγορίθμων βαθιάς μάθησης». Είναι σημαντικό ότι ο ίδιος ο όρος, η μορφή και η δομή τους «εμπνέονται από τον ανθρώπινο εγκέφαλο, μιμούμενοι τον τρόπο που οι βιολογικοί νευρώνες σηματοδοτούν ο ένας στον άλλον».

Μπορεί να υπήρχε κάποια υπολειπόμενη αμφιβολία για την αξία τους στα αρχικά της στάδια, αλλά καθώς περνούσαν τα χρόνια, οι μόδες της τεχνητής νοημοσύνης στράφηκαν σταθερά προς τα νευρωνικά δίκτυα. Συχνά γίνεται κατανοητό ότι είναι το μέλλον της τεχνητής νοημοσύνης. Έχουν μεγάλες επιπτώσεις για εμάς και για το τι σημαίνει να είσαι άνθρωπος. Έχουμε ακούσει απηχήσεις αυτών των ανησυχιών πρόσφατα με εκκλήσεις για παύση των νέων εξελίξεων τεχνητής νοημοσύνης για μια περίοδο έξι μηνών, ώστε να διασφαλιστεί η εμπιστοσύνη στις επιπτώσεις τους.


εσωτερικά εγγραφείτε γραφικό


Θα ήταν σίγουρα λάθος να απορρίψουμε το νευρωνικό δίκτυο ως αποκλειστικά για γυαλιστερά, εντυπωσιακά νέα gadget. Έχουν ήδη καθιερωθεί στη ζωή μας. Μερικά είναι ισχυρά στην πρακτικότητά τους. Ήδη από το 1989, μια ομάδα με επικεφαλής τον Yann LeCun στα εργαστήρια AT&T Bell χρησιμοποίησε τεχνικές back-propagation για να εκπαιδεύσει ένα σύστημα αναγνωρίζουν χειρόγραφους ταχυδρομικούς κώδικες. Το πρόσφατο ανακοίνωση της Microsoft ότι οι αναζητήσεις του Bing θα τροφοδοτούνται από την τεχνητή νοημοσύνη, καθιστώντας το τον «συμπιλότο» σας για τον Ιστό, δείχνει πώς τα πράγματα που ανακαλύπτουμε και πώς τα καταλαβαίνουμε θα αποτελούν όλο και περισσότερο προϊόν αυτού του τύπου αυτοματισμού.

Αντλώντας από τεράστια δεδομένα για την εύρεση μοτίβων, η τεχνητή νοημοσύνη μπορεί παρομοίως να εκπαιδευτεί ώστε να κάνει πράγματα όπως η αναγνώριση εικόνων με ταχύτητα – με αποτέλεσμα να ενσωματώνονται σε αναγνώριση προσώπου, για παράδειγμα. Αυτή η ικανότητα αναγνώρισης προτύπων έχει οδηγήσει σε πολλές άλλες εφαρμογές, όπως π.χ πρόβλεψη χρηματιστηριακών αγορών.

Τα νευρωνικά δίκτυα αλλάζουν επίσης τον τρόπο με τον οποίο ερμηνεύουμε και επικοινωνούμε. Αναπτύχθηκε από τον με ενδιαφέροντα τίτλο Google Brain Team, Google Translate είναι μια άλλη σημαντική εφαρμογή ενός νευρωνικού δικτύου.

Δεν θα θέλατε να παίξετε σκάκι ή Shogi με ένα. Η κατανόηση των κανόνων και η ανάκληση των στρατηγικών και όλων των καταγεγραμμένων κινήσεων σημαίνει ότι είναι εξαιρετικά καλοί στα παιχνίδια (αν και το ChatGPT φαίνεται να αγώνα με Wordle). Τα συστήματα που προβληματίζουν τους ανθρώπους του Go (το Go είναι ένα διαβόητο επιτραπέζιο παιχνίδι στρατηγικής) και τους γκραν μάστερ του σκακιού, είναι κατασκευασμένο από νευρωνικά δίκτυα.

Αλλά η εμβέλειά τους υπερβαίνει κατά πολύ αυτές τις περιπτώσεις και συνεχίζει να επεκτείνεται. Μια αναζήτηση διπλωμάτων ευρεσιτεχνίας που περιορίζεται μόνο στις αναφορές της ακριβούς φράσης «νευρωνικά δίκτυα» παράγει 135,828 αποτελέσματα. Με αυτήν την ταχεία και συνεχή επέκταση, οι πιθανότητες να μπορέσουμε να εξηγήσουμε πλήρως την επιρροή της τεχνητής νοημοσύνης μπορεί να γίνονται όλο και πιο μικρές. Αυτά είναι τα ερωτήματα που έχω εξετάσει στην έρευνά μου και το νέο μου βιβλίο για την αλγοριθμική σκέψη.

Μυστηριώδη στρώματα «άγνωσης»

Κοιτάζοντας πίσω στην ιστορία των νευρωνικών δικτύων μας λέει κάτι σημαντικό για τις αυτοματοποιημένες αποφάσεις που καθορίζουν το παρόν μας ή εκείνες που θα έχουν πιθανώς πιο βαθύ αντίκτυπο στο μέλλον. Η παρουσία τους μας λέει επίσης ότι είναι πιθανό να κατανοήσουμε τις αποφάσεις και τις επιπτώσεις της τεχνητής νοημοσύνης ακόμη λιγότερο με την πάροδο του χρόνου. Αυτά τα συστήματα δεν είναι απλά μαύρα κουτιά, δεν είναι απλώς κρυμμένα κομμάτια ενός συστήματος που δεν μπορούν να φανούν ή να κατανοηθούν.

Είναι κάτι διαφορετικό, κάτι που έχει τις ρίζες του στους στόχους και τον σχεδιασμό αυτών των συστημάτων. Υπάρχει μια μακροχρόνια επιδίωξη του ανεξήγητου. Όσο πιο αδιαφανές, τόσο πιο αυθεντικό και προηγμένο θεωρείται το σύστημα. Δεν πρόκειται μόνο για τα συστήματα που γίνονται πιο πολύπλοκα ή για τον περιορισμό της πρόσβασης στον έλεγχο της πνευματικής ιδιοκτησίας (αν και αυτά αποτελούν μέρος του). Αντίθετα, πρέπει να πούμε ότι το ήθος που τους οδηγεί έχει ένα ιδιαίτερο και ενσωματωμένο ενδιαφέρον για την «άγνωστη». Το μυστήριο κωδικοποιείται ακόμη και στην ίδια τη μορφή και τον λόγο του νευρωνικού δικτύου. Έρχονται με βαθιά συσσωρευμένα στρώματα – εξ ου και η φράση βαθιά μάθηση – και μέσα σε αυτά τα βάθη βρίσκονται τα ακόμη πιο μυστηριώδη «κρυμμένα στρώματα». Τα μυστήρια αυτών των συστημάτων βρίσκονται βαθιά κάτω από την επιφάνεια.

Υπάρχει μια καλή πιθανότητα όσο μεγαλύτερη είναι η επίδραση που έχει η τεχνητή νοημοσύνη στη ζωή μας, τόσο λιγότερο θα καταλάβουμε πώς και γιατί. Σήμερα υπάρχει μια ισχυρή ώθηση για την τεχνητή νοημοσύνη που είναι εξηγήσιμη. Θέλουμε να ξέρουμε πώς λειτουργεί και πώς καταλήγει σε αποφάσεις και αποτελέσματα. Η ΕΕ ανησυχεί τόσο πολύ για τους δυνητικά «απαράδεκτους κινδύνους» και ακόμη και «επικίνδυνες» εφαρμογές που αυτή τη στιγμή προχωρά ένας νέος νόμος AI προορίζεται να θέσει ένα «παγκόσμιο πρότυπο» για την «ανάπτυξη ασφαλούς, αξιόπιστης και ηθικής τεχνητής νοημοσύνης».

Αυτοί οι νέοι νόμοι θα βασίζονται στην ανάγκη επεξήγησης, απαιτώντας αυτό «Για συστήματα τεχνητής νοημοσύνης υψηλού κινδύνου, οι απαιτήσεις για δεδομένα υψηλής ποιότητας, τεκμηρίωση και ιχνηλασιμότητα, διαφάνεια, ανθρώπινη εποπτεία, ακρίβεια και ευρωστία είναι απολύτως απαραίτητες για τον μετριασμό των κινδύνων για τα θεμελιώδη δικαιώματα και την ασφάλεια που θέτει η τεχνητή νοημοσύνη». Δεν πρόκειται μόνο για πράγματα όπως τα αυτοοδηγούμενα αυτοκίνητα (αν και τα συστήματα που διασφαλίζουν την ασφάλεια εμπίπτουν στην κατηγορία της τεχνητής νοημοσύνης υψηλού κινδύνου της ΕΕ), είναι επίσης ανησυχητικό ότι θα εμφανιστούν στο μέλλον συστήματα που θα έχουν επιπτώσεις στα ανθρώπινα δικαιώματα.

Αυτό αποτελεί μέρος ευρύτερων εκκλήσεων για διαφάνεια στην τεχνητή νοημοσύνη, ώστε οι δραστηριότητές της να μπορούν να ελεγχθούν, να ελεγχθούν και να αξιολογηθούν. Ένα άλλο παράδειγμα θα ήταν το Royal Society's ενημέρωση πολιτικής σχετικά με την εξηγήσιμη τεχνητή νοημοσύνη στην οποία επισημαίνουν ότι «οι συζητήσεις πολιτικής σε όλο τον κόσμο απαιτούν ολοένα και περισσότερες εκκλήσεις για κάποια μορφή επεξήγησης της τεχνητής νοημοσύνης, ως μέρος των προσπαθειών για ενσωμάτωση ηθικών αρχών στο σχεδιασμό και την ανάπτυξη συστημάτων με δυνατότητα τεχνητής νοημοσύνης».

Αλλά η ιστορία των νευρωνικών δικτύων μας λέει ότι είναι πιθανό να απομακρυνθούμε περισσότερο από αυτόν τον στόχο στο μέλλον, αντί να τον πλησιάσουμε.

Εμπνευσμένο από τον ανθρώπινο εγκέφαλο

Αυτά τα νευρωνικά δίκτυα μπορεί να είναι πολύπλοκα συστήματα, αλλά έχουν κάποιες βασικές αρχές. Εμπνευσμένοι από τον ανθρώπινο εγκέφαλο, επιδιώκουν να αντιγράψουν ή να προσομοιώσουν μορφές βιολογικής και ανθρώπινης σκέψης. Ως προς τη δομή και το σχεδιασμό είναι, όπως Η IBM εξηγεί επίσης, που αποτελείται από «στρώσεις κόμβων, που περιέχουν ένα στρώμα εισόδου, ένα ή περισσότερα κρυφά επίπεδα και ένα στρώμα εξόδου». Μέσα σε αυτό, «κάθε κόμβος, ή τεχνητός νευρώνας, συνδέεται με έναν άλλο». Επειδή απαιτούν εισροές και πληροφορίες για τη δημιουργία αποτελεσμάτων, «βασίζονται σε δεδομένα εκπαίδευσης για να μάθουν και να βελτιώσουν την ακρίβειά τους με την πάροδο του χρόνου». Αυτές οι τεχνικές λεπτομέρειες έχουν σημασία, αλλά και η επιθυμία να μοντελοποιηθούν αυτά τα συστήματα με βάση την πολυπλοκότητα του ανθρώπινου εγκεφάλου.

Η κατανόηση της φιλοδοξίας πίσω από αυτά τα συστήματα είναι ζωτικής σημασίας για την κατανόηση του τι σημαίνουν στην πράξη αυτές οι τεχνικές λεπτομέρειες. Σε ένα Συνέντευξη 1993, ο επιστήμονας των νευρωνικών δικτύων Teuvo Kohonen κατέληξε στο συμπέρασμα ότι ένα «αυτο-οργανωμένο» σύστημα «είναι το όνειρό μου», που λειτουργεί «κάτι σαν αυτό που κάνει το νευρικό μας σύστημα ενστικτωδώς». Για παράδειγμα, ο Kohonen απεικόνισε πώς ένα «αυτοοργανούμενο» σύστημα, ένα σύστημα που παρακολουθούσε και διαχειριζόταν τον εαυτό του, «θα μπορούσε να χρησιμοποιηθεί ως πίνακας παρακολούθησης για κάθε μηχανή… σε κάθε αεροπλάνο, αεροπλάνο αεριωθούμενου αεροπλάνου ή κάθε πυρηνικό σταθμό παραγωγής ενέργειας, ή κάθε αυτοκίνητο". Αυτό, σκέφτηκε, θα σήμαινε ότι στο μέλλον «θα μπορούσατε να δείτε αμέσως σε ποια κατάσταση βρίσκεται το σύστημα».

Ο πρωταρχικός στόχος ήταν να υπάρχει ένα σύστημα ικανό να προσαρμόζεται στο περιβάλλον του. Θα ήταν στιγμιαίο και αυτόνομο, λειτουργώντας στο στυλ του νευρικού συστήματος. Αυτό ήταν το όνειρο, να έχουμε συστήματα που θα μπορούσαν να χειριστούν τον εαυτό τους χωρίς την ανάγκη πολλής ανθρώπινης παρέμβασης. Οι πολυπλοκότητες και τα άγνωστα του εγκεφάλου, του νευρικού συστήματος και του πραγματικού κόσμου θα έρθουν σύντομα να ενημερώσουν την ανάπτυξη και το σχεδιασμό των νευρωνικών δικτύων.

"Κάτι ψάρι σε αυτό"

Αλλά πηδώντας πίσω στο 1956 και σε αυτήν την περίεργη μηχανή εκμάθησης, ήταν η πρακτική προσέγγιση που είχε ακολουθήσει ο Taylor κατά την κατασκευή του που τράβηξε αμέσως την προσοχή του Cowan. Είχε ξεκάθαρα ιδρώσει πάνω από τη συναρμολόγηση των κομματιών και των κομματιών. Taylor, παρατήρησε ο Κάουαν κατά τη διάρκεια μιας συνέντευξης από τη δική του πλευρά στην ιστορία αυτών των συστημάτων, «δεν το έκανε θεωρητικά και δεν το έκανε σε υπολογιστή». Αντίθετα, με εργαλεία στο χέρι, «έχτισε στην πραγματικότητα το υλικό». Ήταν ένα υλικό πράγμα, ένας συνδυασμός εξαρτημάτων, ίσως ακόμη και ένα τέχνασμα. Και «όλα έγιναν με αναλογικό κύκλωμα» χρειάστηκε ο Taylor, σημειώνει ο Cowan, «αρκετά χρόνια για να το κατασκευάσει και να παίξει μαζί του». Μια περίπτωση δοκιμής και λάθους.

Όπως είναι λογικό, ο Cowan ήθελε να καταλάβει αυτό που έβλεπε. Προσπάθησε να πείσει τον Τέιλορ να του εξηγήσει αυτή τη μηχανή εκμάθησης. Οι διευκρινίσεις δεν ήρθαν. Ο Κάουαν δεν μπορούσε να πείσει τον Τέιλορ να του περιγράψει πώς λειτουργούσε το πράγμα. Οι αναλογικοί νευρώνες παρέμειναν μυστήριο. Το πιο εκπληκτικό πρόβλημα, σκέφτηκε ο Cowan, ήταν ότι ο Taylor «δεν καταλάβαινε πραγματικά τι συνέβαινε». Αυτό δεν ήταν απλώς μια στιγμιαία διακοπή της επικοινωνίας μεταξύ των δύο επιστημόνων με διαφορετικές ειδικότητες, ήταν κάτι παραπάνω από αυτό.

Σε μία συνέντευξη από τα μέσα της δεκαετίας του 1990, αναπολώντας τη μηχανή του Taylor, ο Cowan αποκάλυψε ότι «μέχρι σήμερα στις δημοσιευμένες εργασίες δεν μπορείτε να καταλάβετε ακριβώς πώς λειτουργεί». Αυτό το συμπέρασμα υποδηλώνει πώς το άγνωστο είναι βαθιά ενσωματωμένο στα νευρωνικά δίκτυα. Το ανεξήγητο αυτών των νευρωνικών συστημάτων είναι παρόν ακόμη και από τα θεμελιώδη και αναπτυξιακά στάδια που χρονολογούνται σχεδόν επτά δεκαετίες.

Αυτό το μυστήριο παραμένει σήμερα και βρίσκεται μέσα σε προχωρημένες μορφές τεχνητής νοημοσύνης. Το ανεξιχνίαστο της λειτουργίας των συσχετισμών που έγιναν από το μηχάνημα του Taylor οδήγησε τον Cowan να αναρωτηθεί αν υπήρχε «κάτι ψύχραιμο σε αυτό».

Μακριές και μπερδεμένες ρίζες

Ο Cowan αναφέρθηκε στη σύντομη επίσκεψή του με τον Taylor όταν ρωτήθηκε για την υποδοχή της δικής του δουλειάς μερικά χρόνια αργότερα. Στη δεκαετία του 1960 οι άνθρωποι ήταν, συλλογίστηκε ο Cowan, «λίγο αργοί να δουν το νόημα ενός αναλογικού νευρωνικού δικτύου». Αυτό συνέβη παρά το γεγονός ότι, θυμάται ο Cowan, το έργο του Taylor της δεκαετίας του 1950 για τη «συνειρμική μνήμη» βασίστηκε σε «αναλογικούς νευρώνες». Ο βραβευμένος με Νόμπελ ειδικός σε νευρωνικά συστήματα, Ο Leon N. Cooper, κατέληξε ότι οι εξελίξεις γύρω από την εφαρμογή του μοντέλου του εγκεφάλου στη δεκαετία του 1960, θεωρήθηκαν «ως ένα από τα βαθιά μυστήρια». Εξαιτίας αυτής της αβεβαιότητας, παρέμεινε ένας σκεπτικισμός για το τι θα μπορούσε να επιτύχει ένα νευρωνικό δίκτυο. Όμως τα πράγματα άρχισαν σιγά σιγά να αλλάζουν.

Πριν από περίπου 30 χρόνια ο νευροεπιστήμονας Walter J. Freeman, ο οποίος εξεπλάγη από το «αξιοσημείωτοςΤο φάσμα των εφαρμογών που είχαν βρεθεί για τα νευρωνικά δίκτυα, σχολίαζε ήδη το γεγονός ότι δεν τις έβλεπε ως «ένα θεμελιωδώς νέο είδος μηχανής». Ήταν ένα αργό έγκαυμα, με την τεχνολογία να έρχεται πρώτα και μετά να βρεθούν οι επόμενες εφαρμογές για αυτήν. Αυτό πήρε χρόνο. Πράγματι, για να βρούμε τις ρίζες της τεχνολογίας των νευρωνικών δικτύων, θα μπορούσαμε να επιστρέψουμε ακόμη πιο μακριά από την επίσκεψη του Cowan στη μυστηριώδη μηχανή του Taylor.

Ο επιστήμονας του νευρικού δικτύου Τζέιμς Άντερσον και ο επιστημονικός δημοσιογράφος Έντουαρντ Ρόζενφελντ έχουν σημειώσει ότι το υπόβαθρο των νευρωνικών δικτύων πηγαίνει πίσω στη δεκαετία του 1940 και κάποιες πρώιμες προσπάθειες, όπως περιγράφουν, «να κατανοήσουν τα ανθρώπινα νευρικά συστήματα και να χτίσουν τεχνητά συστήματα που ενεργούν με τον τρόπο που ενεργούμε, τουλάχιστον λίγο». Και έτσι, στη δεκαετία του 1940, τα μυστήρια του ανθρώπινου νευρικού συστήματος έγιναν επίσης τα μυστήρια της υπολογιστικής σκέψης και της τεχνητής νοημοσύνης.

Συνοψίζοντας αυτή τη μεγάλη ιστορία, ο συγγραφέας της πληροφορικής Ο Λάρι Χάρντεστι τόνισε ότι η βαθιά μάθηση με τη μορφή νευρωνικών δικτύων «μπαίνει και βγαίνει από τη μόδα για περισσότερα από 70 χρόνια». Πιο συγκεκριμένα, προσθέτει, αυτά τα «νευρωνικά δίκτυα προτάθηκαν για πρώτη φορά το 1944 από τους Warren McCulloch και Walter Pitts, δύο ερευνητές του Πανεπιστημίου του Σικάγο που μετακόμισαν στο MIT το 1952 ως ιδρυτικά μέλη αυτού που μερικές φορές αποκαλείται το πρώτο τμήμα γνωστικών επιστημών».

Αλλού, 1943 είναι μερικές φορές η δεδομένη ημερομηνία ως το πρώτο έτος για την τεχνολογία. Είτε έτσι είτε αλλιώς, για περίπου 70 χρόνια οι λογαριασμοί υποδηλώνουν ότι τα νευρωνικά δίκτυα μπήκαν και βγήκαν από τη μόδα, συχνά παραμελούνται, αλλά μερικές φορές παίρνουν έδαφος και κινούνται σε πιο mainstream εφαρμογές και συζητήσεις. Η αβεβαιότητα παρέμεινε. Αυτοί οι πρώτοι προγραμματιστές συχνά περιγράφουν τη σημασία της έρευνάς τους ότι παραβλέπεται, έως ότου βρήκε τον σκοπό της συχνά χρόνια και μερικές φορές δεκαετίες αργότερα.

Μεταβαίνοντας από τη δεκαετία του 1960 στα τέλη της δεκαετίας του 1970 μπορούμε να βρούμε περαιτέρω ιστορίες για τις άγνωστες ιδιότητες αυτών των συστημάτων. Ακόμη και τότε, μετά από τρεις δεκαετίες, το νευρωνικό δίκτυο εξακολουθούσε να έχει την αίσθηση του σκοπού. Ο David Rumelhart, ο οποίος είχε ένα υπόβαθρο στην ψυχολογία και ήταν συν-συγγραφέας μιας σειράς βιβλίων που εκδόθηκαν το 1986 που αργότερα θα τραβούσαν την προσοχή ξανά στα νευρωνικά δίκτυα, βρέθηκε να συνεργάζεται για την ανάπτυξη νευρωνικών δικτύων με τον συνάδελφό του Jay McClelland.

Εκτός από συνάδελφοι, είχαν επίσης συναντηθεί πρόσφατα σε ένα συνέδριο στη Μινεσότα όπου η ομιλία του Rumelhart για την «κατανόηση της ιστορίας» είχε προκαλέσει κάποια συζήτηση μεταξύ των αντιπροσώπων.

Μετά από εκείνο το συνέδριο, ο McClelland επέστρεψε με μια σκέψη για το πώς να αναπτύξει ένα νευρωνικό δίκτυο που θα μπορούσε να συνδυάζει μοντέλα για να είναι πιο διαδραστικά. Αυτό που έχει σημασία εδώ είναι Η ανάμνηση του Rumelhart των «ωρών και ωρών και ωρών μαλακίας στον υπολογιστή».

Καθίσαμε και τα κάναμε όλα αυτά στον υπολογιστή και φτιάξαμε αυτά τα μοντέλα υπολογιστών, και απλά δεν τα καταλάβαμε. Δεν καταλάβαμε γιατί δούλευαν ή γιατί δεν δούλευαν ή τι ήταν επικριτικό για αυτούς.

Όπως ο Τέιλορ, έτσι και ο Ρούμελχαρτ βρήκε τον εαυτό του να ασχολείται με το σύστημα. Δημιούργησαν επίσης ένα λειτουργικό νευρωνικό δίκτυο και, το σημαντικότερο, δεν ήταν επίσης σίγουροι πώς ή γιατί λειτουργούσε με τον τρόπο που λειτουργούσε, φαινομενικά μαθαίνοντας από δεδομένα και βρίσκοντας συσχετισμούς.

Μίμηση του εγκεφάλου - στρώμα μετά από στρώμα

Ίσως έχετε ήδη παρατηρήσει ότι όταν συζητάμε την προέλευση των νευρωνικών δικτύων, η εικόνα του εγκεφάλου και η πολυπλοκότητα που προκαλεί αυτό δεν είναι ποτέ μακριά. Ο ανθρώπινος εγκέφαλος λειτουργούσε ως ένα είδος προτύπου για αυτά τα συστήματα. Στα πρώτα στάδια, συγκεκριμένα, ο εγκέφαλος – ακόμα ένα από τα μεγάλα άγνωστα – έγινε μοντέλο για το πώς θα μπορούσε να λειτουργήσει το νευρωνικό δίκτυο.

Έτσι, αυτά τα πειραματικά νέα συστήματα διαμορφώθηκαν σε κάτι που η λειτουργία του ήταν σε μεγάλο βαθμό άγνωστη. Ο μηχανικός νευροϋπολογιστών Carver Mead έχει μιλήσει αποκαλυπτικά της σύλληψης ενός «γνωστικού παγόβουνου» που είχε βρει ιδιαίτερα ελκυστική. Είναι μόνο η κορυφή του παγόβουνου της συνείδησης που γνωρίζουμε και η οποία είναι ορατή. Η κλίμακα και η μορφή των υπολοίπων παραμένει άγνωστη κάτω από την επιφάνεια.

Σε 1998, Τζέιμς Αντερσον, ο οποίος εργαζόταν για κάποιο χρονικό διάστημα σε νευρωνικά δίκτυα, σημείωσε ότι όταν επρόκειτο για έρευνα στον εγκέφαλο «η σημαντική ανακάλυψή μας φαίνεται να είναι η συνειδητοποίηση ότι πραγματικά δεν ξέρουμε τι συμβαίνει».

Σε αναλυτικό απολογισμό στο Financial Times το 2018, ο δημοσιογράφος τεχνολογίας Ρίτσαρντ Γουότερς σημείωσε πώς τα νευρωνικά δίκτυα «διαμορφώνονται σε μια θεωρία σχετικά με τον τρόπο λειτουργίας του ανθρώπινου εγκεφάλου, περνώντας δεδομένα μέσα από στρώματα τεχνητών νευρώνων μέχρι να εμφανιστεί ένα αναγνωρίσιμο μοτίβο». Αυτό δημιουργεί ένα πρόβλημα, πρότεινε ο Waters, καθώς «σε αντίθεση με τα λογικά κυκλώματα που χρησιμοποιούνται σε ένα παραδοσιακό πρόγραμμα λογισμικού, δεν υπάρχει τρόπος παρακολούθησης αυτής της διαδικασίας για να προσδιοριστεί ακριβώς γιατί ένας υπολογιστής δίνει μια συγκεκριμένη απάντηση». Το συμπέρασμα του Waters είναι ότι αυτά τα αποτελέσματα δεν μπορούν να επιλεχθούν. Η εφαρμογή αυτού του τύπου μοντέλου του εγκεφάλου, λαμβάνοντας τα δεδομένα μέσα από πολλά επίπεδα, σημαίνει ότι η απάντηση δεν μπορεί να ανιχνευθεί εύκολα. Η πολλαπλή επίστρωση είναι ένας καλός λόγος για αυτό.

Σκληρότητα Παρατήρησε επίσης ότι αυτά τα συστήματα «μοντελοποιούνται χαλαρά στον ανθρώπινο εγκέφαλο». Αυτό φέρνει μια προθυμία για ολοένα μεγαλύτερη πολυπλοκότητα επεξεργασίας προκειμένου να προσπαθήσουμε να ταιριάξουμε με τον εγκέφαλο. Το αποτέλεσμα αυτού του στόχου είναι ένα νευρωνικό δίκτυο που «αποτελείται από χιλιάδες ή και εκατομμύρια απλούς κόμβους επεξεργασίας που είναι πυκνά διασυνδεδεμένοι». Τα δεδομένα κινούνται μέσω αυτών των κόμβων προς μία μόνο κατεύθυνση. Ο Hardesty παρατήρησε ότι «ένας μεμονωμένος κόμβος μπορεί να συνδεθεί με πολλούς κόμβους στο επίπεδο κάτω από αυτόν, από τον οποίο λαμβάνει δεδομένα, και με πολλούς κόμβους στο επίπεδο πάνω από αυτόν, στους οποίους στέλνει δεδομένα».

Τα μοντέλα του ανθρώπινου εγκεφάλου ήταν μέρος του τρόπου με τον οποίο σχεδιάστηκαν και σχεδιάστηκαν αυτά τα νευρωνικά δίκτυα από την αρχή. Αυτό είναι ιδιαίτερα ενδιαφέρον αν σκεφτούμε ότι ο εγκέφαλος ήταν ο ίδιος ένα μυστήριο της εποχής (και από πολλές απόψεις εξακολουθεί να είναι).

«Η προσαρμογή είναι όλο το παιχνίδι»

Επιστήμονες όπως ο Mead και ο Kohonen ήθελαν να δημιουργήσουν ένα σύστημα που θα μπορούσε πραγματικά να προσαρμοστεί στον κόσμο στον οποίο βρισκόταν. Θα ανταποκρινόταν στις συνθήκες του. Ο Mead ήταν σαφές ότι η αξία στα νευρωνικά δίκτυα ήταν ότι μπορούσαν να διευκολύνουν αυτόν τον τύπο προσαρμογής. Εκείνη την εποχή, και αναλογιζόμενος αυτή τη φιλοδοξία, πρόσθεσε ο Μιντ ότι η παραγωγή της προσαρμογής «είναι ολόκληρο το παιχνίδι». Αυτή η προσαρμογή χρειάζεται, σκέφτηκε, «λόγω της φύσης του πραγματικού κόσμου», ο οποίος κατέληξε στο συμπέρασμα ότι είναι «πολύ μεταβλητός για να κάνει οτιδήποτε απόλυτο».

Αυτό το πρόβλημα έπρεπε να ληφθεί υπόψη, ειδικά καθώς, σκέφτηκε, ότι αυτό ήταν κάτι που «το νευρικό σύστημα το είχε καταλάβει εδώ και πολύ καιρό». Όχι μόνο αυτοί οι καινοτόμοι δούλευαν με μια εικόνα του εγκεφάλου και των αγνώστων του, αλλά το συνδύαζαν με ένα όραμα για τον «πραγματικό κόσμο» και τις αβεβαιότητες, τα άγνωστα και τη μεταβλητότητα που αυτό φέρνει. Τα συστήματα, σκέφτηκε ο Mead, έπρεπε να είναι σε θέση να ανταποκρίνονται και να προσαρμοστούν στις περιστάσεις χωρίς εντολή.

Περίπου την ίδια εποχή στη δεκαετία του 1990, ο Stephen Grossberg – ειδικός στα γνωστικά συστήματα που εργάζεται στα μαθηματικά, την ψυχολογία και τη βιοϊατρική μηχανική – υποστήριξε επίσης ότι Η προσαρμογή θα ήταν το σημαντικό βήμα μακροπρόθεσμα. Ο Γκρόσμπεργκ, καθώς εργαζόταν στη μοντελοποίηση νευρωνικών δικτύων, σκέφτηκε ότι όλα «αφορούσαν το πώς τα βιολογικά συστήματα μέτρησης και ελέγχου έχουν σχεδιαστεί για να προσαρμόζονται γρήγορα και σταθερά σε πραγματικό χρόνο σε έναν ταχέως μεταβαλλόμενο κόσμο». Όπως είδαμε νωρίτερα με το «όνειρο» του Kohonen για ένα «αυτο-οργανωμένο» σύστημα, μια έννοια του «πραγματικού κόσμου» γίνεται το πλαίσιο στο οποίο η απόκριση και η προσαρμογή κωδικοποιούνται σε αυτά τα συστήματα. Ο τρόπος με τον οποίο γίνεται κατανοητός και φαντασμένος αυτός ο πραγματικός κόσμος διαμορφώνει αναμφίβολα τον τρόπο με τον οποίο αυτά τα συστήματα έχουν σχεδιαστεί για να προσαρμόζονται.

Κρυφά στρώματα

Καθώς τα επίπεδα πολλαπλασιάζονταν, η βαθιά μάθηση έδινε νέα βάθη. Το νευρωνικό δίκτυο εκπαιδεύεται χρησιμοποιώντας δεδομένα εκπαίδευσης που, Εξήγησε ο Hardesty, «τροφοδοτείται στο κάτω στρώμα – το στρώμα εισόδου – και περνά από τα επόμενα στρώματα, πολλαπλασιάζεται και αθροίζεται με πολύπλοκους τρόπους, μέχρι να φτάσει τελικά, ριζικά μετασχηματισμένο, στο επίπεδο εξόδου». Όσο περισσότερα επίπεδα, τόσο μεγαλύτερος είναι ο μετασχηματισμός και τόσο μεγαλύτερη είναι η απόσταση από την είσοδο στην έξοδο. Η ανάπτυξη των Μονάδων Επεξεργασίας Γραφικών (GPUs), για παράδειγμα, στα παιχνίδια, πρόσθεσε ο Hardesty, «έδωσε τη δυνατότητα στα δίκτυα ενός επιπέδου της δεκαετίας του 1960 και στα δίκτυα δύο έως τριών επιπέδων της δεκαετίας του 1980 να ανθίσουν στα δέκα, τα 15 ή ακόμα και τα 50. -τα δίκτυα επιπέδων του σήμερα».

Τα νευρωνικά δίκτυα γίνονται όλο και πιο βαθιά. Πράγματι, αυτή η προσθήκη επιπέδων, σύμφωνα με τον Hardesty, είναι «αυτό στο οποίο αναφέρεται το «βαθιά» στη «βαθιά μάθηση». Αυτό έχει σημασία, προτείνει, επειδή «επί του παρόντος, η βαθιά μάθηση είναι υπεύθυνη για τα συστήματα με τις καλύτερες επιδόσεις σε σχεδόν κάθε τομέα της έρευνας της τεχνητής νοημοσύνης».

Όμως το μυστήριο γίνεται ακόμα βαθύτερο. Καθώς τα στρώματα των νευρωνικών δικτύων έχουν συσσωρευτεί υψηλότερα, η πολυπλοκότητά τους έχει αυξηθεί. Έχει επίσης οδηγήσει στην ανάπτυξη σε αυτά που αναφέρονται ως «κρυμμένα στρώματα» μέσα σε αυτά τα βάθη. Η συζήτηση για τον βέλτιστο αριθμό κρυφών επιπέδων σε ένα νευρωνικό δίκτυο βρίσκεται σε εξέλιξη. Ο θεωρητικός των ΜΜΕ Η Beatrice Fazi έχει γράψει ότι «εξαιτίας του τρόπου με τον οποίο λειτουργεί ένα βαθύ νευρωνικό δίκτυο, που βασίζεται σε κρυφά νευρωνικά στρώματα που βρίσκονται ανάμεσα στο πρώτο στρώμα των νευρώνων (το στρώμα εισόδου) και το τελευταίο στρώμα (το επίπεδο εξόδου), οι τεχνικές βαθιάς μάθησης είναι συχνά αδιαφανείς ή δυσανάγνωστες ακόμη και στους προγραμματιστές που τα έστησαν αρχικά».

Καθώς τα επίπεδα αυξάνονται (συμπεριλαμβανομένων αυτών των κρυφών επιπέδων) γίνονται ακόμη λιγότερο εξηγήσιμα – ακόμη και, όπως αποδεικνύεται, πάλι, σε αυτούς που τα δημιουργούν. Κάνοντας μια παρόμοια άποψη, η εξέχουσα και διεπιστημονική στοχαστής των νέων μέσων Katherine Hayles Σημειώνεται επίσης ότι υπάρχουν όρια στο «πόσα μπορούμε να γνωρίζουμε για το σύστημα, αποτέλεσμα σχετικό με το «κρυφό στρώμα» στο νευρωνικό δίκτυο και στους αλγόριθμους βαθιάς μάθησης».

Επιδιώκοντας το ανεξήγητο

Συνολικά, αυτές οι μακροχρόνιες εξελίξεις αποτελούν μέρος αυτού που ο κοινωνιολόγος της τεχνολογίας Taina Bucher ονόμασε το «προβληματικό του αγνώστου». Επεκτείνοντας την επιρροή έρευνά του για την επιστημονική γνώση στον τομέα της τεχνητής νοημοσύνης, ο Χάρι Κόλινς έχει επισημάνει ότι Ο στόχος με τα νευρωνικά δίκτυα είναι ότι μπορεί να παράγονται από έναν άνθρωπο, αρχικά τουλάχιστον, αλλά «από τη στιγμή που γραφτεί το πρόγραμμα ζει τη δική του ζωή, σαν να λέγαμε. χωρίς τεράστια προσπάθεια, το πώς ακριβώς λειτουργεί το πρόγραμμα μπορεί να παραμείνει μυστήριο». Αυτό έχει απήχηση εκείνων των μακροχρόνιων ονείρων για ένα αυτοοργανωμένο σύστημα.

Θα πρόσθετα σε αυτό ότι το άγνωστο και ίσως ακόμη και το άγνωστο έχει επιδιωχθεί ως θεμελιώδες μέρος αυτών των συστημάτων από τα πρώτα τους στάδια. Υπάρχει μια καλή πιθανότητα όσο μεγαλύτερη είναι η επίδραση που έχει η τεχνητή νοημοσύνη στη ζωή μας, τόσο λιγότερο θα καταλάβουμε πώς και γιατί.

Αλλά αυτό δεν ταιριάζει με πολλούς σήμερα. Θέλουμε να γνωρίζουμε πώς λειτουργεί η τεχνητή νοημοσύνη και πώς καταλήγει στις αποφάσεις και τα αποτελέσματα που μας επηρεάζουν. Καθώς οι εξελίξεις στην τεχνητή νοημοσύνη συνεχίζουν να διαμορφώνουν τη γνώση και την κατανόησή μας για τον κόσμο, τι ανακαλύπτουμε, πώς μας φέρονται, πώς μαθαίνουμε, καταναλώνουμε και αλληλεπιδρούμε, αυτή η ώθηση για κατανόηση θα μεγαλώνει. Όταν πρόκειται για εξηγήσιμη και διαφανή τεχνητή νοημοσύνη, η ιστορία των νευρωνικών δικτύων μας λέει ότι είναι πιθανό να απομακρυνθούμε περισσότερο από αυτόν τον στόχο στο μέλλον, αντί να τον πλησιάσουμε.

Ντέιβιντ Μπιρ, Καθηγητής Κοινωνιολογίας, Πανεπιστήμιο του York

Αυτό το άρθρο αναδημοσιεύθηκε από το Η Συνομιλία υπό την άδεια Creative Commons. Διαβάστε το αρχικό άρθρο.