• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • La tecnologia dell'assistente vocale rischia di essere troppo umana

    Credito:tomasso79/Shutterstock

    Più di 200 milioni di case ora dispongono di un altoparlante intelligente che fornisce accesso a Internet con comando vocale, secondo una stima globale. Aggiungi questo agli assistenti virtuali parlanti installati su molti smartphone, per non parlare degli elettrodomestici da cucina e delle automobili, e questo è un sacco di Alexa e Siris.

    Perché parlare è una parte fondamentale dell'essere umano, si è tentati di pensare che questi assistenti dovrebbero essere progettati per parlare e comportarsi come noi. Anche se questo ci darebbe un modo affidabile per interagire con i nostri dispositivi, replicare conversazioni umane genuinamente realistiche è incredibilmente difficile. Cosa c'è di più, la ricerca suggerisce che far sembrare una macchina umana potrebbe essere inutile e persino disonesto. Anziché, potremmo aver bisogno di ripensare a come e perché interagiamo con questi assistenti e imparare ad abbracciare i vantaggi del loro essere una macchina.

    I progettisti di tecnologie vocali parlano spesso del concetto di "umanità". I recenti sviluppi nello sviluppo della voce artificiale hanno portato le voci di questi sistemi a confondere il confine tra uomo e macchina, suonando sempre più umano. Ci sono stati anche sforzi per rendere il linguaggio di queste interfacce più umano.

    Forse il più famoso è Google Duplex, un servizio in grado di prenotare appuntamenti telefonicamente. Per aggiungere alla natura umana del sistema, Google ha incluso espressioni come "hmm" e "uh" nell'output vocale del suo assistente, suoni che comunemente usiamo per segnalare che stiamo ascoltando la conversazione o che intendiamo iniziare a parlare presto. Nel caso di Google Duplex, questi sono stati usati con l'obiettivo di suonare naturale. Ma perché suonare naturale o più umano è così importante?

    Inseguire questo obiettivo di rendere i sistemi che suonino e si comportino come noi forse deriva dalle ispirazioni della cultura pop che usiamo per alimentare la progettazione di questi sistemi. L'idea di parlare con le macchine ci ha affascinato in letteratura, televisione e cinema da decenni, attraverso personaggi come HAL 9000 in 2001:A Space Odyssey o Samantha in Her. Questi personaggi ritraggono conversazioni senza soluzione di continuità con le macchine. Nel caso di Lei, esiste persino una storia d'amore tra un sistema operativo e il suo utente. criticamente, tutte queste macchine suonano e rispondono nel modo in cui pensiamo che farebbero gli esseri umani.

    Ci sono sfide tecnologiche interessanti nel tentativo di ottenere qualcosa che assomigli alle conversazioni tra noi e le macchine. A tal fine, Amazon ha recentemente lanciato l'Alexa Prize, cercando di "creare socialbot in grado di dialogare in modo coerente e coinvolgente con gli umani su una serie di eventi attuali e argomenti popolari come l'intrattenimento, gli sport, politica, tecnologia, e moda." L'attuale round di competizione chiede ai team di produrre una conversazione di 20 minuti tra uno di questi robot e un interlocutore umano.

    Queste grandi sfide, come altri attraverso la scienza, anticipare chiaramente lo stato dell'arte, portando benefici pianificati e non pianificati. Tuttavia, quando si cerca di dare alle macchine la capacità di dialogare veramente con noi come gli altri esseri umani, dobbiamo pensare a cosa sono effettivamente le nostre interazioni parlate con le persone e se questo è lo stesso del tipo di conversazione che vogliamo avere con le macchine.

    Dialoghiamo con altre persone per portare a termine le cose e per costruire e mantenere relazioni reciproche, e spesso questi due scopi si intrecciano. Eppure le persone vedono le macchine come strumenti che servono a scopi limitati e hanno poco appetito per costruire il tipo di relazioni con le macchine che facciamo ogni giorno con altre persone.

    Perseguire conversazioni naturali con macchine che suonano come noi può diventare un obiettivo inutile e gravoso. Crea aspettative irrealistiche di sistemi che possono effettivamente comunicare e capire come noi. Chiunque abbia interagito con Amazon Echo o Google Home sa che questo non è possibile con i sistemi esistenti.

    Questo è importante in quanto le persone devono avere un'idea di come ottenere un sistema per fare cose che, poiché le interfacce di sola voce hanno pulsanti e immagini limitati, sono guidati in modo significativo da ciò che il sistema dice e da come lo dice. L'importanza del design dell'interfaccia significa che l'umanità stessa potrebbe non solo essere discutibile ma ingannevole, soprattutto se usato per ingannare le persone facendole credere che stiano interagendo con un'altra persona. Anche se il loro intento può essere quello di creare voci intelligibili, le aziende tecnologiche devono considerare il potenziale impatto sugli utenti.

    Guardare oltre l'umanità

    Piuttosto che abbracciare costantemente l'umanità, possiamo accettare che ci possano essere limiti fondamentali, tecnologico e filosofico, ai tipi di interazioni che possiamo e vogliamo avere con le macchine.

    Dovremmo essere ispirati dalle conversazioni umane piuttosto che usarle come un gold standard percepito per l'interazione. Ad esempio, considerando questi sistemi come esecutori piuttosto che come conversatori simili a umani, può essere un modo per aiutare a creare interfacce più coinvolgenti ed espressive. In alcuni contesti può essere necessario incorporare elementi specifici della conversazione, ma dobbiamo pensare se sia necessaria un'interazione conversazionale di tipo umano, piuttosto che usarlo come obiettivo di progettazione predefinito.

    È difficile prevedere come sarà la tecnologia in futuro e come cambieranno e si svilupperanno le percezioni sociali intorno ai nostri dispositivi. Forse alle persone andrà bene avere conversazioni con le macchine, fare amicizia con i robot e chiedere il loro consiglio.

    Ma attualmente siamo scettici su questo. Dal nostro punto di vista tutto ha a che fare con il contesto. Non tutte le interazioni e le interfacce sono uguali. Potrebbe essere necessaria una tecnologia vocale per stabilire e promuovere una qualche forma di legame sociale o emotivo, come in applicazioni sanitarie specifiche. Se questo è lo scopo, allora ha senso che le macchine conversano in modo più appropriato per quello scopo, magari suonando umane in modo che l'utente riceva il giusto tipo di aspettative.

    Eppure questo non è universalmente necessario. In modo cruciale, questa somiglianza umana dovrebbe collegarsi a ciò che i sistemi possono effettivamente fare con la conversazione. Realizzare sistemi che non hanno la capacità di conversare come un umano dal suono umano può fare molto più male che bene.

    Questo articolo è stato ripubblicato da The Conversation con una licenza Creative Commons. Leggi l'articolo originale.




    © Scienza https://it.scienceaq.com