δοκιμή Turing και ai 10 17

Pexels/Google Deepmind, CC BY-SA

Το 1950, ο Βρετανός επιστήμονας υπολογιστών Άλαν Τούρινγκ πρότεινε μια πειραματική μέθοδο για την απάντηση στο ερώτημα: μπορούν οι μηχανές να σκέφτονται; Πρότεινε αν ένας άνθρωπος δεν μπορούσε να πει αν μιλούσε σε μια μηχανή τεχνητής νοημοσύνης (AI) ή σε άλλον άνθρωπο μετά από πέντε λεπτά ανάκρισης, αυτό θα αποδείκνυε ότι η τεχνητή νοημοσύνη έχει ανθρώπινη νοημοσύνη.

Αν και τα συστήματα τεχνητής νοημοσύνης απέμεναν πολύ από το να περάσουν το τεστ του Τούρινγκ κατά τη διάρκεια της ζωής του, ο ίδιος υπέθεσε ότι

«[…] σε περίπου πενήντα χρόνια θα είναι δυνατός ο προγραμματισμός των υπολογιστών […] για να τους κάνει να παίξουν το παιχνίδι μίμησης τόσο καλά που ένας μέσος ανακριτής δεν θα έχει περισσότερες από 70% πιθανότητες να κάνει τη σωστή αναγνώριση μετά από πέντε λεπτά προβληματισμός.

Σήμερα, περισσότερα από 70 χρόνια μετά την πρόταση του Τούρινγκ, καμία τεχνητή νοημοσύνη δεν κατάφερε να περάσει επιτυχώς το τεστ πληρώντας τις συγκεκριμένες προϋποθέσεις που περιέγραψε. Παρόλα αυτά, όπως μερικοί τίτλοι αντανακλούν, μερικά συστήματα έχουν πλησιάσει αρκετά.

Ένα πρόσφατο πείραμα δοκίμασε τρία μεγάλα μοντέλα γλώσσας, συμπεριλαμβανομένου του GPT-4 (η τεχνολογία AI πίσω από το ChatGPT). Οι συμμετέχοντες πέρασαν δύο λεπτά συνομιλώντας είτε με άλλο άτομο είτε με ένα σύστημα AI. Η τεχνητή νοημοσύνη ζητήθηκε να κάνει μικρά ορθογραφικά λάθη - και να σταματήσει εάν ο ελεγκτής γινόταν πολύ επιθετικός.


εσωτερικά εγγραφείτε γραφικό


Με αυτήν την προτροπή, το AI έκανε καλή δουλειά για να ξεγελάσει τους δοκιμαστές. Όταν συνδυάζονται με ένα bot τεχνητής νοημοσύνης, οι δοκιμαστές μπορούσαν να μαντέψουν σωστά αν μιλούσαν σε ένα σύστημα τεχνητής νοημοσύνης μόνο το 60% του χρόνου.

Δεδομένης της ταχείας προόδου που επιτεύχθηκε στον σχεδιασμό συστημάτων επεξεργασίας φυσικής γλώσσας, ενδέχεται να δούμε την τεχνητή νοημοσύνη να περνάει το αρχικό τεστ του Turing μέσα στα επόμενα χρόνια.

Είναι όμως πράγματι η μίμηση των ανθρώπων ένα αποτελεσματικό τεστ ευφυΐας; Και αν όχι, ποια είναι κάποια εναλλακτικά σημεία αναφοράς που θα μπορούσαμε να χρησιμοποιήσουμε για να μετρήσουμε τις δυνατότητες του AI;

Περιορισμοί της δοκιμής Turing

Ενώ ένα σύστημα που περνά το τεστ Turing μας δίνει μερικοί απόδειξη ότι είναι έξυπνο, αυτό το τεστ δεν είναι ένα αποφασιστικό τεστ νοημοσύνης. Ένα πρόβλημα είναι ότι μπορεί να παράγει "ψευδώς αρνητικά".

Τα σημερινά μεγάλα γλωσσικά μοντέλα είναι συχνά σχεδιασμένα για να δηλώνουν αμέσως ότι δεν είναι ανθρώπινα. Για παράδειγμα, όταν κάνετε μια ερώτηση στο ChatGPT, συχνά προλογίζει την απάντησή του με τη φράση "ως μοντέλο γλώσσας AI". Ακόμα κι αν τα συστήματα τεχνητής νοημοσύνης έχουν την υποκείμενη ικανότητα να περάσουν τη δοκιμή Turing, αυτού του είδους ο προγραμματισμός θα παρακάμπτει αυτήν την ικανότητα.

Το τεστ κινδυνεύει επίσης με ορισμένα είδη «ψευδώς θετικών». Ως φιλόσοφος Νεντ Μπλοκ τόνισε Σε ένα άρθρο του 1981, ένα σύστημα θα μπορούσε λογικά να περάσει το τεστ Turing απλά κωδικοποιημένο με μια ανθρώπινη απόκριση σε οποιαδήποτε πιθανή είσοδο.

Από εκεί και πέρα, το τεστ Τούρινγκ εστιάζει ιδιαίτερα στην ανθρώπινη γνώση. Εάν η γνώση τεχνητής νοημοσύνης διαφέρει από την ανθρώπινη γνώση, ένας ειδικός ανακριτής θα μπορεί να βρει κάποια εργασία όπου η τεχνητή νοημοσύνη και οι άνθρωποι διαφέρουν ως προς την απόδοση.

Σχετικά με αυτό το πρόβλημα, ο Turing έγραψε:

Αυτή η αντίρρηση είναι πολύ ισχυρή, αλλά τουλάχιστον μπορούμε να πούμε ότι αν, ωστόσο, μπορεί να κατασκευαστεί μια μηχανή για να παίξει το παιχνίδι μίμησης ικανοποιητικά, δεν χρειάζεται να μας προβληματίζει αυτή η αντίρρηση.

Με άλλα λόγια, ενώ η επιτυχία της δοκιμής Turing είναι καλή απόδειξη ότι ένα σύστημα είναι έξυπνο, η αποτυχία δεν είναι καλή απόδειξη ότι ένα σύστημα είναι δεν έξυπνος.

Επιπλέον, το τεστ δεν είναι καλό μέτρο για το αν οι AI έχουν συνειδητότητα, αν μπορούν να αισθανθούν πόνο και ευχαρίστηση ή αν έχουν ηθική σημασία. Σύμφωνα με πολλούς γνωστικούς επιστήμονες, η συνείδηση ​​περιλαμβάνει ένα συγκεκριμένο σύμπλεγμα νοητικών ικανοτήτων, συμπεριλαμβανομένης της ύπαρξης λειτουργικής μνήμης, υψηλότερων σκέψεων και της ικανότητας να αντιλαμβάνεται κανείς το περιβάλλον του και να μοντελοποιεί πώς κινείται το σώμα του γύρω του.

Το τεστ Turing δεν απαντά στο ερώτημα εάν τα συστήματα AI ή όχι έχουν αυτές τις ικανότητες.

Οι αυξανόμενες δυνατότητες του AI

Το τεστ Turing βασίζεται σε μια συγκεκριμένη λογική. Δηλαδή: οι άνθρωποι είναι έξυπνοι, επομένως οτιδήποτε μπορεί να μιμηθεί αποτελεσματικά τους ανθρώπους είναι πιθανό να είναι έξυπνο.

Αλλά αυτή η ιδέα δεν μας λέει τίποτα για τη φύση της νοημοσύνης. Ένας διαφορετικός τρόπος μέτρησης της νοημοσύνης της τεχνητής νοημοσύνης περιλαμβάνει την πιο κριτική σκέψη για το τι είναι η νοημοσύνη.

Προς το παρόν δεν υπάρχει κανένα τεστ που να μπορεί να μετρήσει έγκυρα την τεχνητή ή ανθρώπινη νοημοσύνη.

Στο ευρύτερο επίπεδο, μπορούμε να σκεφτούμε τη νοημοσύνη ως το ικανότητα για την επίτευξη μιας σειράς στόχων σε διαφορετικά περιβάλλοντα. Πιο έξυπνα συστήματα είναι εκείνα που μπορούν να επιτύχουν ένα ευρύτερο φάσμα στόχων σε ένα ευρύτερο φάσμα περιβαλλόντων.

Ως εκ τούτου, ο καλύτερος τρόπος για να παρακολουθείτε τις προόδους στον σχεδιασμό συστημάτων τεχνητής νοημοσύνης γενικής χρήσης είναι να αξιολογήσετε την απόδοσή τους σε μια ποικιλία εργασιών. Οι ερευνητές μηχανικής μάθησης έχουν αναπτύξει μια σειρά σημείων αναφοράς που το κάνουν αυτό.

Για παράδειγμα, το GPT-4 ήταν σε θέση να απαντήσει σωστά Το 86% των ερωτήσεων για τη μαζική κατανόηση γλώσσας πολλαπλών εργασιών – ένα σημείο αναφοράς που μετρά την απόδοση σε τεστ πολλαπλών επιλογών σε μια σειρά ακαδημαϊκών θεμάτων σε επίπεδο κολεγίου.

Επίσης σημείωσε ευνοϊκά μέσα AgentBench, ένα εργαλείο που μπορεί να μετρήσει την ικανότητα ενός μεγάλου γλωσσικού μοντέλου να συμπεριφέρεται ως πράκτορας, για παράδειγμα, περιηγώντας στον ιστό, αγοράζοντας προϊόντα στο διαδίκτυο και ανταγωνιζόμενοι σε παιχνίδια.

Είναι ακόμα σχετικό το τεστ Turing;

Το τεστ Turing είναι ένα μέτρο μίμησης – της ικανότητας του AI να προσομοιώνει την ανθρώπινη συμπεριφορά. Τα μεγάλα γλωσσικά μοντέλα είναι μιμητές ειδικών, κάτι που τώρα αντικατοπτρίζεται στη δυνατότητά τους να περάσουν το τεστ Turing. Αλλά η ευφυΐα δεν είναι το ίδιο με τη μίμηση.

Υπάρχουν τόσα είδη νοημοσύνης, όσα και οι στόχοι που πρέπει να επιτευχθούν. Ο καλύτερος τρόπος για να κατανοήσετε τη νοημοσύνη του AI είναι να παρακολουθήσετε την πρόοδό του στην ανάπτυξη μιας σειράς σημαντικών δυνατοτήτων.

Ταυτόχρονα, είναι σημαντικό να μην συνεχίσουμε να «αλλάζουμε τα γκολπόστ» όταν πρόκειται για το αν η τεχνητή νοημοσύνη είναι έξυπνη. Δεδομένου ότι οι δυνατότητες της τεχνητής νοημοσύνης βελτιώνονται ταχύτατα, οι επικριτές της ιδέας της νοημοσύνης τεχνητής νοημοσύνης βρίσκουν συνεχώς νέες εργασίες που τα συστήματα τεχνητής νοημοσύνης μπορεί να δυσκολεύονται να ολοκληρώσουν – μόνο για να διαπιστώσουν ότι έχουν ξεπεράσει άλλο ένα εμπόδιο.

Σε αυτό το πλαίσιο, το σχετικό ερώτημα δεν είναι εάν τα συστήματα AI είναι έξυπνα - αλλά πιο συγκεκριμένα, τι είδη ευφυΐας που μπορεί να έχουν.Η Συνομιλία

Σάιμον Γκόλντσταϊν, Αναπληρωτής Καθηγητής, Ινστιτούτο Φιλοσοφίας Dianoia, Αυστραλιανό Καθολικό Πανεπιστήμιο, Αυστραλιανό Καθολικό Πανεπιστήμιο και Cameron Domenico Kirk-Giannini, Επίκουρος Καθηγητής Φιλοσοφίας, Πανεπιστήμιο Rutgers

Αυτό το άρθρο αναδημοσιεύθηκε από το Η Συνομιλία υπό την άδεια Creative Commons. Διαβάστε το αρχικό άρθρο.