Daboost / Shutterstock

Με την πρόσφατη απόλυση και γρήγορη επαναπρόσληψη του Sam Altman από το OpenAI, οι συζητήσεις γύρω από την ανάπτυξη και τη χρήση της τεχνητής νοημοσύνης (AI) βρίσκονται και πάλι στο επίκεντρο. Το πιο ασυνήθιστο είναι ότι ένα εξέχον θέμα στο ρεπορτάζ των μέσων ενημέρωσης ήταν η ικανότητα του Συστήματα AI για να κάνουν μαθηματικά.

Προφανώς, μέρος του δράματος στο OpenAI σχετιζόταν με την ανάπτυξη ενός νέου από την εταιρεία Αλγόριθμος AI που ονομάζεται Q*. Το σύστημα έχει συζητηθεί ως μια σημαντική πρόοδος και ένα από τα κύρια χαρακτηριστικά του ήταν η ικανότητα μαθηματικής λογικής.

Αλλά δεν είναι τα μαθηματικά, το θεμέλιο της τεχνητής νοημοσύνης; Πώς θα μπορούσε ένα σύστημα τεχνητής νοημοσύνης να έχει πρόβλημα με τη μαθηματική συλλογιστική, δεδομένου ότι οι υπολογιστές και οι αριθμομηχανές μπορούν να εκτελούν μαθηματικές εργασίες;

Το AI δεν είναι μια ενιαία οντότητα. Είναι ένα συνονθύλευμα στρατηγικών για την εκτέλεση υπολογισμών χωρίς άμεσες οδηγίες από ανθρώπους. Όπως θα δούμε, ορισμένα συστήματα AI είναι ικανά στα μαθηματικά.

Ωστόσο, μια από τις πιο σημαντικές τρέχουσες τεχνολογίες, τα μεγάλα γλωσσικά μοντέλα (LLM) πίσω από τα chatbots AI, όπως το ChatGPT, έχει αγωνιστεί μέχρι στιγμής για να μιμηθεί τη μαθηματική λογική. Αυτό συμβαίνει επειδή έχουν σχεδιαστεί για να επικεντρώνονται στη γλώσσα.


εσωτερικά εγγραφείτε γραφικό


Εάν ο νέος αλγόριθμος Q* της εταιρείας μπορεί να λύσει αόρατα μαθηματικά προβλήματα, τότε αυτό μπορεί κάλλιστα είναι μια σημαντική ανακάλυψη. Τα μαθηματικά είναι μια αρχαία μορφή ανθρώπινης λογικής που μεγάλα γλωσσικά μοντέλα (LLM) μέχρι στιγμής έχουν αγωνιστεί να μιμηθούν. Τα LLM είναι η τεχνολογία που βασίζεται σε συστήματα όπως π.χ ChatGPT του OpenAI.

Τη στιγμή της γραφής, οι λεπτομέρειες του αλγορίθμου Q* και των δυνατοτήτων του είναι περιορισμένες, αλλά άκρως ενδιαφέρουσες. Υπάρχουν λοιπόν διάφορες λεπτές λεπτομέρειες που πρέπει να λάβετε υπόψη πριν θεωρήσετε το Q* επιτυχημένο.

Για παράδειγμα, τα μαθηματικά είναι ένα μάθημα με το οποίο ο καθένας ασχολείται σε διάφορους βαθμούς και το επίπεδο των μαθηματικών στο οποίο είναι ικανό το Q* παραμένει ασαφές. Ωστόσο, έχει δημοσιευτεί ακαδημαϊκή εργασία που χρησιμοποιεί εναλλακτικές μορφές τεχνητής νοημοσύνης για την προώθηση των μαθηματικών σε επίπεδο έρευνας (συμπεριλαμβανομένων μερικών που γράφτηκαν από εμένα, και ένα γραμμένο από μια ομάδα μαθηματικών σε συνεργασία με ερευνητές στο Google DeepMind).

Αυτά τα συστήματα AI θα μπορούσαν να περιγραφούν ως ικανά στα μαθηματικά. Ωστόσο, είναι πιθανό ότι το Q* δεν χρησιμοποιείται για να βοηθήσει τους ακαδημαϊκούς στην εργασία τους, αλλά μάλλον προορίζεται για άλλο σκοπό.

Ωστόσο, ακόμα κι αν το Q* είναι ανίκανο να ξεπεράσει τα όρια της έρευνας αιχμής, είναι πολύ πιθανό να βρεθεί κάποια σημασία στον τρόπο κατασκευής του που θα μπορούσε να δημιουργήσει δελεαστικές ευκαιρίες για μελλοντική ανάπτυξη.

Όλο και πιο άνετο

Ως κοινωνία, αισθανόμαστε όλο και πιο άνετα με τη χρήση εξειδικευμένης τεχνητής νοημοσύνης για την επίλυση προκαθορισμένων τύπων προβλημάτων. Για παράδειγμα, ψηφιακούς βοηθούς, αναγνώριση προσώπου, να ηλεκτρονικά συστήματα συστάσεων θα είναι οικείο στους περισσότερους ανθρώπους. Αυτό που παραμένει άπιαστο είναι ένα λεγόμενο «τεχνητή γενική νοημοσύνη» (AGI) που έχει ευρείες συλλογιστικές ικανότητες συγκρίσιμες με αυτές ενός ανθρώπου.

Τα μαθηματικά είναι μια βασική δεξιότητα που φιλοδοξούμε να διδάξουμε σε κάθε παιδί σχολικής ηλικίας και σίγουρα θα χαρακτηρίζονταν ως βασικό ορόσημο στην αναζήτηση του AGI. Πώς αλλιώς, λοιπόν, τα μαθηματικά ικανά συστήματα τεχνητής νοημοσύνης θα βοηθούσαν την κοινωνία;

Η μαθηματική νοοτροπία σχετίζεται με ένα πλήθος εφαρμογών, για παράδειγμα την κωδικοποίηση και τη μηχανική, και έτσι ο μαθηματικός συλλογισμός είναι μια ζωτικής σημασίας μεταβιβάσιμη δεξιότητα τόσο για την ανθρώπινη όσο και για την τεχνητή νοημοσύνη. Μια ειρωνεία είναι ότι το AI βασίζεται, σε θεμελιώδες επίπεδο, στα μαθηματικά.

Για παράδειγμα, πολλές από τις τεχνικές που εφαρμόζονται από αλγόριθμους AI καταλήγουν τελικά σε μια μαθηματική περιοχή γνωστή ως άλγεβρα μήτρας. Ένας πίνακας είναι απλώς ένα πλέγμα αριθμών, του οποίου μια ψηφιακή εικόνα είναι ένα γνώριμο παράδειγμα. Κάθε pixel είναι τίποτα περισσότερο από αριθμητικά δεδομένα.

Τα μεγάλα γλωσσικά μοντέλα είναι επίσης εγγενώς μαθηματικά. Με βάση ένα τεράστιο δείγμα κειμένου, μια μηχανή μπορεί να μάθει τις πιθανότητες για τις λέξεις που είναι είναι πολύ πιθανό να ακολουθήσει μια προτροπή (ή ερώτηση) από τον χρήστη στο chatbot. Εάν θέλετε ένα προεκπαιδευμένο LLM να εξειδικεύεται σε ένα συγκεκριμένο θέμα, τότε μπορεί να προσαρμοστεί σωστά στη μαθηματική βιβλιογραφία ή σε οποιονδήποτε άλλο τομέα μάθησης. Ένα LLM μπορεί να δημιουργήσει κείμενο που διαβάζεται σαν να καταλαβαίνει τα μαθηματικά.

Δυστυχώς, κάτι τέτοιο δημιουργεί ένα LLM που είναι καλό στο μπλόφα, αλλά κακό στη λεπτομέρεια. Το θέμα είναι ότι μια μαθηματική πρόταση είναι, εξ ορισμού, αυτή στην οποία μπορεί να εκχωρηθεί ένα αδιαμφισβήτητη τιμή Boole (δηλαδή αληθινό ή ψευδές). Ο μαθηματικός συλλογισμός ισοδυναμεί με τη λογική αφαίρεση νέων μαθηματικών δηλώσεων από εκείνες που είχαν καθοριστεί προηγουμένως.

Ο Συνήγορος του διαβόλου

Φυσικά, οποιαδήποτε προσέγγιση στον μαθηματικό συλλογισμό που βασίζεται σε γλωσσικές πιθανότητες θα οδηγηθεί έξω από τη λωρίδα της. Ένας τρόπος να αντιμετωπιστεί αυτό θα μπορούσε να είναι η ενσωμάτωση κάποιου συστήματος επίσημης επαλήθευσης στην αρχιτεκτονική (ακριβώς πώς είναι χτισμένο το LLM), το οποίο ελέγχει συνεχώς τη λογική πίσω από τα άλματα που γίνονται από το μεγάλο γλωσσικό μοντέλο.

Μια ένδειξη ότι αυτό έχει γίνει θα μπορούσε να είναι στο όνομα Q*, το οποίο θα μπορούσε εύλογα να αναφέρεται ένας αλγόριθμος που αναπτύχθηκε στη δεκαετία του 1970 για να βοηθήσει με τον απαγωγικό συλλογισμό. Εναλλακτικά, το Q* θα μπορούσε να αναφέρεται στο Q-learning, στο οποίο ένα μοντέλο μπορεί να βελτιωθεί με την πάροδο του χρόνου δοκιμάζοντας και επιβραβεύοντας τα σωστά συμπεράσματα.

Ωστόσο, υπάρχουν πολλές προκλήσεις για τη δημιουργία μαθηματικά ικανών AI. Για παράδειγμα, μερικά από τα πιο ενδιαφέροντα μαθηματικά αποτελούνται από εξαιρετικά απίθανα γεγονότα. Υπάρχουν πολλές περιπτώσεις στις οποίες κάποιος μπορεί να πιστεύει ότι υπάρχει ένα μοτίβο με βάση μικρούς αριθμούς, αλλά απροσδόκητα καταρρέει όταν κάποιος ελέγχει αρκετές περιπτώσεις. Αυτή η ικανότητα είναι δύσκολο να ενσωματωθεί σε ένα μηχάνημα.

Μια άλλη πρόκληση μπορεί να αποτελεί έκπληξη: η μαθηματική έρευνα μπορεί να είναι εξαιρετικά δημιουργική. Πρέπει να είναι, γιατί οι επαγγελματίες πρέπει να εφεύρουν νέες έννοιες και ωστόσο να μένουν μέσα σε αυτές επίσημοι κανόνες ενός αρχαίου θέματος.

Οποιαδήποτε μεθοδολογία τεχνητής νοημοσύνης που έχει εκπαιδευτεί μόνο για να βρίσκει μοτίβα σε προϋπάρχοντα μαθηματικά δεν θα μπορούσε πιθανώς ποτέ να δημιουργήσει πραγματικά νέα μαθηματικά. Δεδομένου του αγωγού μεταξύ μαθηματικών και τεχνολογίας, αυτό φαίνεται να αποκλείει τη σύλληψη νέων τεχνολογικών επαναστάσεων.

Αλλά ας παίξουμε τον δικηγόρο του διαβόλου για μια στιγμή και ας φανταστούμε αν η τεχνητή νοημοσύνη θα μπορούσε πράγματι να δημιουργήσει νέα μαθηματικά. Το προηγούμενο επιχείρημα εναντίον αυτού έχει ένα ελάττωμα, καθώς θα μπορούσε επίσης να ειπωθεί ότι οι καλύτεροι ανθρώπινοι μαθηματικοί είχαν επίσης εκπαιδευτεί αποκλειστικά σε προϋπάρχοντα μαθηματικά. Τα μεγάλα γλωσσικά μοντέλα μας έχουν εκπλήξει στο παρελθόν και θα το κάνουν ξανά.Η Συνομιλία

Τομ Όλιβερ, Λέκτορας, Επιστήμη και Μηχανική Υπολογιστών, Πανεπιστήμιο του Westminster

Αυτό το άρθρο αναδημοσιεύθηκε από το Η Συνομιλία υπό την άδεια Creative Commons. Διαβάστε το αρχικό άρθρο.