Shhhh, Ακούνε - Μέσα στην επερχόμενη επανάσταση της φωνής
Οι εταιρείες θα μπορούσαν σύντομα να προσαρμόσουν αυτό που προσπαθούν να σας πουλήσουν με βάση τη διάθεση που μεταδίδεται από τον ήχο της φωνής σας.
CSA-Printstock μέσω Getty Images

Αποφασίζετε να καλέσετε ένα κατάστημα που πουλάει μερικές μπότες πεζοπορίας που σκέφτεστε να αγοράσετε. Καθώς καλείτε, ενεργοποιείται ο υπολογιστής μιας εταιρείας τεχνητής νοημοσύνης που προσλαμβάνεται από το κατάστημα. Ανακτά την ανάλυσή του για το στυλ ομιλίας που χρησιμοποιήσατε όταν τηλεφωνήσατε σε άλλες εταιρείες τις υπηρεσίες της εταιρείας λογισμικού. Ο υπολογιστής κατέληξε στο συμπέρασμα ότι είστε «φιλικοί και ομιλητικοί».

Χρησιμοποιώντας προγνωστική δρομολόγηση, σας συνδέει με έναν αντιπρόσωπο εξυπηρέτησης πελατών, τον οποίο η εταιρική έρευνα έχει αναγνωρίσει ότι είναι ιδιαίτερα καλός να πάρει φιλικούς και ομιλητικούς πελάτες για να αγοράσει πιο ακριβές εκδόσεις των προϊόντων που σκέφτονται.

Αυτή η υποθετική κατάσταση μπορεί να ακούγεται σαν να προέρχεται από κάποιο μακρινό μέλλον. Αλλά αυτοματοποιημένες δραστηριότητες μάρκετινγκ με φωνητική καθοδήγηση όπως αυτή συμβαίνουν συνεχώς.

Εάν ακούσετε "Αυτή η κλήση καταγράφεται για εκπαίδευση και έλεγχο ποιότητας", δεν παρακολουθεί μόνο τον αντιπρόσωπο εξυπηρέτησης πελατών.


εσωτερικά εγγραφείτε γραφικό


Μπορεί επίσης να είσαι εσύ.

Κατά τη διεξαγωγή έρευνας για το επικείμενο βιβλίο μου, «The Voice Catchers: Πώς ακούνε οι έμποροι να εκμεταλλευτούν τα συναισθήματά σας, το απόρρητό σας και το πορτοφόλι σας, "Έκανα πάνω από 1,000 εμπορικά περιοδικά και άρθρα ειδήσεων σχετικά με τις εταιρείες που συνδέονται με διάφορες μορφές προφίλ φωνής. Εξετάσαμε εκατοντάδες σελίδες νόμων ΗΠΑ και ΕΕ που ισχύουν για τη βιομετρική παρακολούθηση. Ανέλυσα δεκάδες διπλώματα ευρεσιτεχνίας. Και επειδή εξελίσσεται τόσο πολύ αυτή η βιομηχανία, μίλησα με 43 άτομα που εργάζονται για τη διαμόρφωσή του.

Σύντομα μου φάνηκε σαφές ότι βρισκόμαστε στα πρώτα στάδια μιας επανάστασης φωνητικού προφίλ που οι εταιρείες βλέπουν ως αναπόσπαστο στο μέλλον του μάρκετινγκ.

Χάρη στην αγκαλιά του κοινού των έξυπνων ηχείων, των έξυπνων οθονών αυτοκινήτων και των τηλεφώνων που ανταποκρίνονται στη φωνή - μαζί με την άνοδο της φωνητικής νοημοσύνης στα τηλεφωνικά κέντρα - οι έμποροι λένε ότι είναι στα πρόθυρα να μπορούν να χρησιμοποιήσουν τεχνολογία φωνητικής ανάλυσης υποβοηθούμενης από AI για να επιτύχουν άνευ προηγουμένου πληροφορίες για τις ταυτότητες και τις τάσεις των αγοραστών. Με αυτόν τον τρόπο, πιστεύουν ότι θα είναι σε θέση να παρακάμψουν τα λάθη και τις απάτες που σχετίζονται με τις παραδοσιακές στοχευμένες διαφημίσεις.

Όχι μόνο οι άνθρωποι μπορούν να χαρακτηριστούν από τα πρότυπα ομιλίας τους, αλλά μπορούν επίσης να αξιολογηθούν από τον ήχο των φωνών τους - οι οποίες, σύμφωνα με ορισμένους ερευνητές, είναι μοναδικό και μπορεί να αποκαλύψει τα συναισθήματα, τις προσωπικότητες και ακόμη και τα φυσικά χαρακτηριστικά τους.

Ελαττώματα στη στοχευμένη διαφήμιση

Κορυφαία στελέχη μάρκετινγκ που πήρα από συνέντευξη είπαν ότι αναμένουν ότι οι αλληλεπιδράσεις των πελατών τους θα περιλαμβάνουν φωνητικό προφίλ μέσα σε μια δεκαετία περίπου.

Μέρος αυτού που τους προσελκύει σε αυτή τη νέα τεχνολογία είναι η πεποίθηση ότι το τρέχον ψηφιακό σύστημα δημιουργίας μοναδικών προφίλ πελατών - και στη συνέχεια η στόχευσή τους με εξατομικευμένα μηνύματα, προσφορές και διαφημίσεις - έχει σημαντικά μειονεκτήματα.

Μια σιγοβράζουσα ανησυχία μεταξύ διαφημιζόμενων στο Διαδίκτυο, ένα που ξέσπασε στο ανοιχτό κατά τη διάρκεια της δεκαετίας του 2010, είναι ότι τα δεδομένα πελατών συχνά δεν είναι ενημερωμένα, τα προφίλ μπορεί να βασίζονται σε πολλούς χρήστες μιας συσκευής, τα ονόματα μπορεί να συγχέονται και τα άτομα ψεύδονται.

Οι διαφημιστές είναι επίσης ανήσυχοι αποκλεισμός διαφημίσεων και κάντε κλικ στην απάτη, που συμβαίνει όταν ένας ιστότοπος ή μια εφαρμογή χρησιμοποιεί bots ή χαμηλόμισθους εργαζόμενους για να κάνουν κλικ σε διαφημίσεις που τοποθετούνται εκεί, ώστε οι διαφημιζόμενοι να πρέπει να πληρώσουν.

Αυτά είναι όλα εμπόδια στην κατανόηση μεμονωμένων αγοραστών.

Η φωνητική ανάλυση, από την άλλη πλευρά, θεωρείται ως μια λύση που καθιστά σχεδόν αδύνατο για τους ανθρώπους να κρύψουν τα συναισθήματά τους ή να αποφύγουν την ταυτότητά τους.

Κατασκευή της υποδομής

Το μεγαλύτερο μέρος της δραστηριότητας στη δημιουργία φωνητικών προφίλ πραγματοποιείται σε κέντρα υποστήριξης πελατών, τα οποία σε μεγάλο βαθμό δεν είναι δημόσια.

Αλλά υπάρχουν επίσης εκατοντάδες εκατομμύρια των Amazon Echoes, του Google Nests και άλλων έξυπνων ηχείων εκεί έξω. Τα smartphone περιέχουν επίσης τέτοια τεχνολογία.

Όλοι ακούνε και καταγράφουν τις ατομικές φωνές των ανθρώπων. Απαντούν στα αιτήματά σας. Όμως, οι βοηθοί συνδέονται επίσης με προηγμένα προγράμματα μηχανικής μάθησης και βαθιά νευρωνικά προγράμματα που αναλύουν τι λέτε και πώς το λέτε

Τα τηλεφωνικά κέντρα μπορούν να χρησιμοποιούν τεχνολογία φωνητικής υποστήριξης AI για να καθορίσουν εάν θα αναβαθμίσουν συγκεκριμένους πελάτες.Τα τηλεφωνικά κέντρα μπορούν να χρησιμοποιούν τεχνολογία φωνητικής υποστήριξης AI για να καθορίσουν εάν θα αναβαθμίσουν συγκεκριμένους πελάτες. Ralf Hiemisch μέσω Getty Images

Η Amazon και η Google - οι κορυφαίοι προμηθευτές έξυπνων ηχείων εκτός Κίνας - φαίνεται να κάνουν μικρή φωνητική ανάλυση σε αυτές τις συσκευές πέρα ​​από την αναγνώριση και την απόκριση σε μεμονωμένους κατόχους. Ίσως φοβούνται ότι η υπερβολική προώθηση της τεχνολογίας, σε αυτό το σημείο, θα οδηγήσει σε κακή δημοσιότητα.

Παρ 'όλα αυτά, οι συμφωνίες χρηστών του Amazon και της Google - καθώς και της Pandora, της Bank of America και άλλων εταιρειών στις οποίες οι χρήστες έχουν πρόσβαση ρουτίνα μέσω εφαρμογών τηλεφώνου - τους δίνουν το δικαίωμα να χρησιμοποιούν τους ψηφιακούς βοηθούς τους να σας καταλάβω με τον τρόπο που ακούτε.

Η πιο δημόσια εφαρμογή του προφίλ φωνής του Amazon μέχρι στιγμής είναι το βραχιολάκι Halo, που ισχυρίζεται ότι γνωρίζει τα συναισθήματα που μεταφέρετε όταν μιλάτε σε συγγενείς, φίλους και εργοδότες. Η εταιρεία διαβεβαιώνει τους πελάτες ότι δεν χρησιμοποιεί δεδομένα Halo για δικούς της σκοπούς. Αλλά είναι σαφώς μια απόδειξη της έννοιας - και ένα νεύμα προς το μέλλον.

Τα διπλώματα ευρεσιτεχνίας δείχνουν το μέλλον

Τα διπλώματα ευρεσιτεχνίας από αυτές τις εταιρείες τεχνολογίας προσφέρουν ένα όραμα για το τι έρχεται.

Σε ένα δίπλωμα ευρεσιτεχνίας Amazon, μια συσκευή με τον βοηθό της Alexa λαμβάνει παρατυπίες στην ομιλία μιας γυναίκας που υποδηλώνουν κρυολόγημα χρησιμοποιώντας «ανάλυση του βήματος, του σφυγμού, της φωνής, του τρεμούλιασμα και / ή της αρμονίας της φωνής ενός χρήστη, όπως καθορίζεται από την επεξεργασία των δεδομένων φωνής». Από αυτό το συμπέρασμα, η Alexa ρωτά αν η γυναίκα θέλει μια συνταγή για κοτόπουλο. Όταν λέει όχι, προσφέρει να πουλήσει τις σταγόνες βήχα της με παράδοση μιας ώρας

Ένα άλλο δίπλωμα ευρεσιτεχνίας του Amazon προτείνει μια εφαρμογή για να βοηθήσει έναν πωλητή καταστήματος να αποκρυπτογραφήσει τη φωνή ενός αγοραστή για να βυθίσει τις ασυνείδητες αντιδράσεις στα προϊόντα. Ο ισχυρισμός είναι ότι ο τρόπος με τον οποίο ακούγονται οι άνθρωποι φέρεται να κάνει καλύτερη δουλειά, δείχνοντας τι τους αρέσει οι άνθρωποι από τα λόγια τους.

Και μία από τις ιδιόκτητες εφευρέσεις της Google περιλαμβάνει την παρακολούθηση μελών της οικογένειας σε πραγματικό χρόνο χρησιμοποιώντας ειδικά μικρόφωνα τοποθετημένα σε ολόκληρο το σπίτι. Βάσει του βήματος των υπογραφών φωνής, το κύκλωμα Google εισάγει πληροφορίες για το φύλο και την ηλικία - για παράδειγμα, ένα ενήλικο αρσενικό και ένα θηλυκό παιδί - και τα επισημαίνει ως ξεχωριστά άτομα.

Το δίπλωμα ευρεσιτεχνίας της εταιρείας ισχυρίζεται ότι με την πάροδο του χρόνου ο "διαχειριστής πολιτικής οικιακής χρήσης" του συστήματος θα μπορεί να συγκρίνει τα πρότυπα ζωής, όπως πότε και πόσο καιρό τα μέλη της οικογένειας τρώνε γεύματα, πόσο καιρό τα παιδιά παρακολουθούν τηλεόραση και πότε λειτουργούν οι ηλεκτρονικές συσκευές παιχνιδιών - και στη συνέχεια ζητήστε από το σύστημα να προτείνει καλύτερα προγράμματα φαγητού για τα παιδιά ή να προσφέρετε τον έλεγχο της τηλεόρασης και του παιχνιδιού τους.

Σαγηνευτική παρακολούθηση

Στη Δύση, ο δρόμος προς αυτό το διαφημιστικό μέλλον ξεκινά με εταιρείες που ενθαρρύνουν τους χρήστες να τους επιτρέψουν να συλλέξουν φωνητικά δεδομένα. Οι εταιρείες κερδίζουν την άδεια των πελατών, προσελκύοντας τους να αγοράσουν φτηνές τεχνολογίες φωνής

Όταν οι εταιρείες τεχνολογίας έχουν αναπτύξει περαιτέρω λογισμικό φωνητικής ανάλυσης - και οι άνθρωποι εξαρτώνται ολοένα και περισσότερο από συσκευές φωνής - περιμένω από τις εταιρείες να ξεκινήσουν εκτεταμένο προφίλ και μάρκετινγκ βάσει φωνητικών δεδομένων. Πηγαίνοντας στην επιστολή, αν όχι το πνεύμα οποιουδήποτε νόμου περί απορρήτου, οι εταιρείες, αναμένω, θα προχωρήσουν στις νέες ενσαρκώσεις τους, ακόμη και αν οι περισσότεροι από τους χρήστες τους εντάχθηκαν πριν υπάρξει αυτό το νέο επιχειρηματικό μοντέλο.

Αυτό το κλασικό δόλωμα και διακόπτης σηματοδότησε την άνοδο τόσο του Google όσο και του Facebook. Μόνο όταν ο αριθμός των ατόμων που συγκεντρώνονταν σε αυτούς τους ιστότοπους έγινε αρκετά μεγάλος για να προσελκύσει διαφημιζόμενους με υψηλές πληρωμές, τα επιχειρηματικά τους μοντέλα σταθεροποιήθηκαν γύρω από την πώληση διαφημίσεων εξατομικευμένων σε αυτά που γνώριζαν η Google και το Facebook για τους χρήστες τους.

Μέχρι τότε, οι ιστότοποι είχαν γίνει τόσο σημαντικά μέρη των καθημερινών δραστηριοτήτων των χρηστών τους που οι άνθρωποι ένιωθαν ότι δεν μπορούσαν να φύγουν, παρά τις ανησυχίες τους για τη συλλογή και ανάλυση δεδομένων που δεν κατάλαβαν και δεν μπορούσαν να ελέγξουν.

Αυτή η στρατηγική έχει ήδη αρχίσει να διαδραματίζει ως δεκάδες εκατομμύρια καταναλωτές αγοράστε το Amazon Echoes σε τιμές δώρου.

Η σκοτεινή πλευρά του προφίλ φωνής

Εδώ είναι το πλεονέκτημα: Δεν είναι σαφές πόσο ακριβές είναι το προφίλ φωνής, ειδικά όταν πρόκειται για συναισθήματα.

Είναι αλήθεια, σύμφωνα με τη μελετητή αναγνώρισης φωνής Carnegie Mellon, Ρίτα Σινγκ, ότι η δραστηριότητα των φωνητικών νεύρων σας συνδέεται με τη συναισθηματική σας κατάσταση. Ωστόσο, η Singh μου είπε ότι ανησυχεί ότι με την εύκολη διαθεσιμότητα πακέτων μηχανικής μάθησης, τα άτομα με περιορισμένες δεξιότητες θα μπουν στον πειρασμό να διεξάγουν κακές αναλύσεις της φωνής των ανθρώπων, οδηγώντας σε συμπεράσματα που είναι τόσο αμφίβολα όσο οι μέθοδοι.

Υποστηρίζει επίσης ότι τα συμπεράσματα που συνδέουν τη φυσιολογία με τα συναισθήματα και τις μορφές στρες μπορεί να είναι πολιτισμικά προκατειλημμένα και επιρρεπή σε λάθη. Αυτή η ανησυχία δεν έχει αποτρέψει τους εμπόρους, οι οποίοι συνήθως χρησιμοποιούν φωνητικό προφίλ για να εξαγάγουν συμπεράσματα σχετικά με τα συναισθήματα, τις στάσεις και τις προσωπικότητες των ατόμων.

Ενώ μερικές από αυτές τις προόδους υπόσχομαι να κάνω τη ζωή πιο εύκολη, δεν είναι δύσκολο να δούμε πώς μπορεί να γίνει κατάχρηση και εκμετάλλευση της φωνητικής τεχνολογίας. Τι γίνεται αν η φωνητική περιγραφή λέει σε έναν υποψήφιο εργοδότη ότι είστε κακός κίνδυνος για μια δουλειά που επιθυμείτε ή χρειάζεστε απεγνωσμένα; Τι γίνεται αν λέει σε μια τράπεζα ότι είστε κακός κίνδυνος για δάνειο; Τι γίνεται αν ένα εστιατόριο αποφασίσει ότι δεν θα λάβει την κράτησή σας επειδή ακούτε χαμηλή τάξη ή πολύ απαιτητικό;

Σκεφτείτε, επίσης, τη διάκριση που μπορεί να λάβει χώρα αν οι επαγγελματίες φωνής ακολουθούν τους ισχυρισμούς ορισμένων επιστημόνων ότι είναι δυνατή η χρήση φωνητικών κλήσεων ενός ατόμου για να πείτε το ύψος, το βάρος, τη φυλή, το φύλο και την υγεία του ατόμου.

Οι άνθρωποι υπόκεινται ήδη σε διαφορετικές προσφορές και ευκαιρίες βάσει των προσωπικών πληροφοριών που έχουν συλλέξει οι εταιρείες. Το χαρακτηριστικό φωνής προσθέτει ένα ιδιαίτερα ύπουλο μέσο σήμανσης. Σήμερα, ορισμένες πολιτείες όπως το Ιλλινόις και το Τέξας απαιτούν από τις εταιρείες να ζητήσουν άδεια πριν από τη διεξαγωγή ανάλυσης φωνητικών, προσώπων ή άλλων βιομετρικών χαρακτηριστικών.

Ωστόσο, άλλες πολιτείες αναμένουν από τους πολίτες να γνωρίζουν τις πληροφορίες που συλλέγονται σχετικά με αυτές από τις πολιτικές απορρήτου ή τους όρους παροχής υπηρεσιών - που σημαίνει ότι σπάνια θα το κάνουν. Και η ομοσπονδιακή κυβέρνηση δεν έχει θεσπίσει έναν σαρωτικό νόμο εποπτείας μάρκετινγκ.

Με την επικείμενη ευρεία υιοθέτηση της τεχνολογίας φωνητικής ανάλυσης, είναι σημαντικό για τους κυβερνητικούς ηγέτες να υιοθετήσουν πολιτικές και κανονισμούς που προστατεύουν τις προσωπικές πληροφορίες που αποκαλύπτονται από τον ήχο της φωνής ενός ατόμου.

Μία πρόταση: Ενώ η χρήση του πιστοποίηση φωνής - ή χρησιμοποιώντας τη φωνή ενός ατόμου για να αποδείξει την ταυτότητά του - θα μπορούσε να επιτραπεί υπό ορισμένες προσεκτικά ρυθμισμένες συνθήκες, όλα τα προφίλ φωνής θα πρέπει να απαγορεύονται στις αλληλεπιδράσεις των εμπόρων με άτομα. Αυτή η απαγόρευση πρέπει επίσης να ισχύει για πολιτικές εκστρατείες και κυβερνητικές δραστηριότητες χωρίς ένταλμα.

Αυτός φαίνεται να είναι ο καλύτερος τρόπος για να διασφαλιστεί ότι η επόμενη εποχή του προφίλ φωνής περιορίζεται προτού ενσωματωθεί υπερβολικά στην καθημερινή ζωή και είναι πολύ διαπερατή για έλεγχο.Η Συνομιλία

Σχετικά με το Συγγραφέας

Τζόζεφ Τόρο, Robert Lewis Shayon Καθηγητής Media Systems & Industries, Πανεπιστήμιο της Πενσυλβάνια

Αυτό το άρθρο αναδημοσιεύθηκε από το Η Συνομιλία υπό την άδεια Creative Commons. Διαβάστε το αρχικό άρθρο.