Ομιλία με υπολογιστή: Ο φωνητικός έλεγχος απενεργοποιείται

Εάν τα απροσδόκητα πακέτα αρχίσουν να εμφανίζονται στην πόρτα σας, ίσως θελήσετε να μιλήσετε με μία από τις έξυπνες συσκευές σας.

Νωρίτερα αυτό το μήνα, μια εξάχρονη στο Ντάλας ρώτησε την οικογένειά της Amazon Echo έξυπνο ηχείο για κουκλόσπιτο. Και η Alexa, ο τεχνητός βοηθός του Amazon, Siri, αμέσως παρήγγειλαν ένα στο σπίτι τους.

Μια ειδησεογραφική εκπομπή του Σαν Ντιέγκο πήρε την ιστορία και την επανέλαβε άθελά της όταν ένας από τους παρουσιαστές ειδήσεων σχολίασε: "Λατρεύω το κοριτσάκι, λέγοντας" Η Alexa μου παραγγέλνει ένα κουκλόσπιτο "." Ακούγοντας αυτό, αρκετές άλλες συσκευές Amazon σε σπίτια σε όλο το Σαν Ντιέγκο προσπάθησε να αγοράσει περισσότερα κουκλόσπιτα.

Αναφορά ειδήσεων του CW6 Σαν Ντιέγκο για την τυχαία αγορά κούκλας της Alexa.

{youtube}oI2KLIULjXc{/youtube}

Η ιστορία μπορεί να ακούγεται οικτρά σε κάποιον που έχει προσπαθήσει να συνομιλήσει με το Siri της Apple ή την Cortana της Microsoft. Οι συσκευές μας έχουν γίνει αρκετά καλές στο να μας ακούνε, αλλά αυτό δεν σημαίνει πάντα ότι το καταλαβαίνουν.

Οι ερευνητές της Microsoft πρόσφατα επισήμαναν αυτό ως ένα πιθανό πρόβλημα με τις σημερινές διεπαφές ομιλίας: πωλούνται ως «έξυπνοι» βοηθοί, με έξυπνα αστεία και κοσμικές γνώσεις, ωστόσο συχνά μας απογοητεύουν με την έλλειψη κοινής λογικής.


εσωτερικά εγγραφείτε γραφικό


Σε μικρή μελέτη, οι ερευνητές διαπίστωσαν ότι οι άνθρωποι που συνέχισαν να μιλούν με τους ψηφιακούς βοηθούς τους με τον καιρό ήταν εκείνοι που είχαν ξεκινήσει με τις χαμηλότερες προσδοκίες.

Τι κάνει πραγματικά μια φωνητική διεπαφή;

Όταν μιλάτε σε μια φωνητική διεπαφή, πρέπει:

  • «Ακούστε» τον ήχο της φωνής σας και ξεχωρίστε τον από τον θόρυβο στο παρασκήνιο
  • καταλάβετε πού ξεκινά και τελειώνει κάθε λέξη, αγνοώντας τα «umms» και τα «ahhs»
  • Αντιστοιχίστε τον ήχο κάθε λέξης με μια λέξη στο λεξικό, επιλέγοντας τη σωστή από το πλαίσιο, εάν υπάρχει ομοφώνια
  • να ερμηνεύσει σωστά το νόημα ολόκληρης της πρότασης
  • δημιουργήστε μια ουσιαστική και χρήσιμη απάντηση που ταιριάζει με το αίτημά σας.

Κάθε μία από αυτές είναι μια σύνθετη τεχνική πρόκληση και διαφορετικές τεχνολογικές εταιρείες έχουν σημειώσει πρόοδο σε διαφορετικούς τομείς.

Το Google Now είναι ικανό να δίνει σχετικές απαντήσεις σε ένα ευρύ φάσμα αιτημάτων, επειδή επωφελείται από τη συλλογή δεδομένων της Google σχετικά με τον ιστό και τις προσωπικές σας δραστηριότητες, εάν χρησιμοποιείτε υπηρεσίες Google.

Το Amazon Echo είναι ιδιαίτερα καλό στο να ακούει τα αιτήματά σας από ένα θορυβώδες δωμάτιο, χάρη στη συστοιχία μικροφώνων μακρινού πεδίου που ακυρώνει τον θόρυβο. Φυσικά, είναι επίσης καλό να κάνετε αγορές μέσω Amazon.

Τα τελευταία χρόνια, οι φωνητικές διεπαφές έχουν γίνει πολύ καλύτερες στην κατανόηση της καθημερινής ή «φυσικής» ομιλίας και όχι μόνο παραστατικές και προσεκτικά διατυπωμένες εντολές. Είναι ακόμα καλύτεροι στο χειρισμό απλών ερωτημάτων, όπως «ποιος παίζει στο Australian Open;», και τείνουν να αντιμετωπίζουν πιο περίπλοκα αιτήματα, όπως «ποιος παίζει στο Australian Open για πρώτη φορά φέτος;», και παρακολούθηση ερωτήσεις, όπως "θα βρέξει κατά τη διάρκεια των τελικών;".

Η κατάσταση είναι ακόμη πιο μικτή για άλλες γλώσσες εκτός από τα αγγλικά: ενώ το Siri υποστηρίζει περισσότερες από 40 γλώσσες και διαλέκτους, μέχρι στιγμής το Alexa είναι διαθέσιμο μόνο στα αγγλικά και τα γερμανικά. Αλλά όλα αυτά τα χαρακτηριστικά βελτιώνονται σταθερά.

Εκεί που οι διεπαφές φωνής τραυλίζουν

Έτσι, οι φωνητικές διεπαφές θα αναλάβουν σύντομα όλη μας την τεχνολογία, όπως προβλέπεται στην ταινία Αυτήν; Gartner, εταιρεία τεχνολογικής έρευνας, έχει προβλέψεις ότι το επόμενο έτος, το 30% των αλληλεπιδράσεών μας με την τεχνολογία θα είναι συνομιλίες με διεπαφές με δυνατότητα φωνής.

Αλλά οι φωνητικές διεπαφές έχουν περιορισμούς και δεν μπορούν όλοι να επιλυθούν με καλύτερη τεχνολογία.

Η φωνή είναι ένα κεντρικό μέσο διασύνδεσης με την τεχνολογία στην ταινία Her του Spike Jonze.

{youtube}ne6p6MfLBxc{/youtube}

Η ηχορύπανση είναι ένα μεγάλο εμπόδιο. Μπορεί η συσκευή σας να ξεχωρίσει αυτό που λέτε από τον θόρυβο στο παρασκήνιο γύρω σας; Η τεχνολογία μπορεί να βοηθήσει σε αυτό, όπως μείωση θορύβου, εξατομικευμένη αναγνώριση φωνής και ανάγνωση χειλιών.

Τι γίνεται όμως με τον θόρυβο στο παρασκήνιο που δημιουργείτε για τους άλλους μιλώντας στην έξυπνη συσκευή σας; Φανταστείτε ένα άτομο να κάθεται δίπλα σας στο γραφείο - ή στο αεροπλάνο - να συνομιλεί με το Siri ενώ προσπαθείτε να διαβάσετε και μπορείτε να δείτε γιατί οι φωνητικές διεπαφές μπορεί να μην είναι πάντα κοινωνικά αποδεκτές.

Ένα άλλο σύνολο θεμάτων προέρχεται από τις ψυχικές απαιτήσεις των φωνητικών διεπαφών. Η εκμάθηση χρήσης συστήματος με φωνή μπορεί να είναι δύσκολη, ειδικά αν δεν υπάρχει οθόνη, όπως συμβαίνει με το Amazon Echo.

Αν έχετε καλέσει ποτέ μια τράπεζα ή μια τηλεφωνική εταιρεία, γνωρίζετε τον άθλιο συνδυασμό συγκέντρωσης και πλήξης που προέρχεται από την ακρόαση μιας συνθετικής φωνητικής λίστας από όλες τις επιλογές σας, ενώ περιμένετε αυτήν που χρειάζεστε και προσπαθείτε να μην τις αναμίξετε πάνω. Οι παραδοσιακές γραφικές διεπαφές αποφεύγουν αυτό το πρόβλημα, δείχνοντάς σας τις διαθέσιμες επιλογές και σας επιτρέπουν να πατήσετε γρήγορα την επιλογή σας.

Αφού μάθετε φωνητικές εντολές, η χρήση τους μπορεί να αποσπά την προσοχή. Οι ερευνητές διαπίστωσαν ότι οι φωνητικές εντολές εκτροχιάστε το τρένο της σκέψης σας περισσότερο από ένα ποντίκι και πληκτρολόγιο.

Αυτό είναι ιδιαίτερα επικίνδυνο για τις φωνητικές διεπαφές στο αυτοκίνητο: ένα ζευγάρι μελετών από το Πανεπιστήμιο της Γιούτα διαπίστωσαν ότι οι οδηγοί ήταν αποσπούν την προσοχή για έως και 27 δευτερόλεπτα μετά τη χρήση φωνητικών εντολών.

Έρευνα του Πανεπιστημίου της Γιούτα / AAA Foundation for Traffic Safety σχετικά με την απόσπαση της προσοχής των οδηγών.

{vimeo}108281698{/vimeo}

Βρίσκεις τη φωνή του;

Έτσι, οι φωνητικές διεπαφές είναι απίθανο να αναλάβουν πλήρως, αλλά θα βρουν χρήσιμες θέσεις στη ζωή μας. Είναι ήδη κοινά στα αυτοκίνητα, όπου ελπίζουμε ότι θα αποσπούν λιγότερο την προσοχή καθώς βελτιώνεται η τεχνολογία.

Στην κουζίνα, μπορείτε να ζητήσετε από την Alexa να σας μιλήσει μέσω μιας συνταγής ή να ενημερώσει τη λίστα αγορών σας, ενώ τα χέρια σας είναι απασχολημένα με το μαγείρεμα. Στην εικονική και επαυξημένη πραγματικότητα, οι φωνητικές διεπαφές μπορούν να σας επιτρέψουν να ελέγχετε το σύστημα όταν δεν βλέπετε καθόλου τα χέρια σας.

Στην εκμάθηση γλωσσών, μπορούν να χρησιμοποιηθούν για εξάσκηση προφοράς. Το πιο σημαντικό, οι διεπαφές φωνής βοηθούν τους χρήστες με κινητικές διαταραχές, RSI ή δυσλεξία να ξεπεράσουν τις αναπηρίες τους.

Οι φωνητικές διεπαφές είναι μια πολυαναμενόμενη τεχνολογία και υπάρχουν καλοί λόγοι για να σκεφτούμε ότι ήρθε επιτέλους η ώρα τους. Απλώς θυμηθείτε ότι μπορεί να μην είναι ακόμη τόσο έξυπνοι όσο ακούγονται. Και ίσως θελήσετε να βάλετε έναν κωδικό PIN στις φωνητικές αγορές εάν υπάρχουν παιδιά.

Η Συνομιλία

Σχετικά με το Συγγραφέας

Fraser Allison, υποψήφιος διδάκτορας στην αλληλεπίδραση ανθρώπου-υπολογιστή, Πανεπιστήμιο της Μελβούρνης

Αυτό το άρθρο δημοσιεύθηκε αρχικά στις Η Συνομιλία. Διαβάστε το αρχικό άρθρο.

Σχετικά αντικείμενα

{amazonWS:searchindex=KindleStore;keywords=AmazonEcho" target="_blank" rel="nofollow noopener">InnerSelf Market και Amazon