Un esempio di come Amazon Alexa potrebbe determinare la posizione di una persona all'interno di una casa. Credito:Romit Roy Chowdhury
Altoparlanti intelligenti:pensa, un Amazon Alexa o un Google Home:offrono un'ampia varietà di funzionalità per aiutare a liberare sia il nostro tempo che le nostre mani. Possiamo ascoltare le notizie del mattino mentre ci laviamo i denti, chiedi un bollettino meteorologico mentre scegli un cappotto, e imposta un timer per il forno mentre maneggi due pentole calde contemporaneamente. Secondo Voicebot.ai, Alexa ne supporta più di 100, 000 competenze in tutto il mondo, ma un compito che non ha padroneggiato è determinare la posizione dell'utente in casa.
Questo compito di localizzazione è stato al centro di un articolo pubblicato di recente da un team di ricerca dell'Università dell'Illinois a Urbana-Champaign, "Localizzazione vocale utilizzando i riflessi del muro nelle vicinanze". Il lavoro è stato accettato alla 26a Conferenza Internazionale Annuale su Mobile Computing and Networking. Nella carta, il team, guidato dallo studente laureato del Coordinated Science Lab Sheng Shen, esplora lo sviluppo di VoLoc, un sistema che utilizza l'array di microfoni su Alexa, così come gli echi della stanza della voce umana, per dedurre la posizione dell'utente all'interno della casa.
Conoscere la posizione di un utente all'interno di una casa potrebbe aiutare un dispositivo intelligente a supportare meglio le competenze attualmente disponibili. Ad esempio, dopo aver ricevuto comandi come "accendi la luce" o "aumenta la temperatura, " Alexa attualmente deve indovinare quale luce e quale stanza è al centro del comando. Usando una tecnica nota come triangolazione inversa, Shen e il consulente Romit Roy Choudhury si stanno avvicinando alla localizzazione vocale.
"Applicare questa tecnica agli altoparlanti intelligenti comporta alcune sfide, " condiviso Shen, uno studente di ingegneria elettrica e informatica (ECE). "Primo, dobbiamo separare la voce umana diretta e ciascuno degli echi della stanza dalla registrazione del microfono. Quindi, dobbiamo calcolare accuratamente la direzione per ciascuno di questi echi. Entrambe le sfide sono difficili perché i microfoni registrano semplicemente una miscela di tutti i suoni insieme".
VoLoc affronta questi ostacoli attraverso un "algoritmo di allineamento e cancellazione" che isola in modo iterativo le direzioni di ciascuno dei segnali vocali in arrivo, e da loro, reverse triangola la posizione dell'utente. Alcuni aspetti della geometria della stanza vengono appresi spontaneamente, che poi aiuta con la triangolazione. Anche se questa è una svolta importante, Shen e Roy Choudhury hanno in programma di espandere presto la ricerca a più applicazioni.
"Il nostro prossimo passo immediato è costruire il quadro di riferimento dello smart speaker, " ha spiegato Shen. "Questo potrebbe significare sovrapporre le posizioni, come previsto da VoLoc, su una planimetria per determinare che l'utente si trova nella lavanderia. In alternativa, se l'altoparlante intelligente rileva i suoni emessi dalla lavatrice e dall'asciugatrice nella stessa posizione del comando vocale, può giungere alla stessa conclusione."
Le possibilità di questa funzione sono apparentemente infinite e potrebbero migliorare le attuali capacità di Alexa.
"Le implicazioni sono importanti, " ha detto Roy Choudhury, un professore CSL e il W.J. "Jerry" Sanders III—Advanced Micro Devices, Inc. Scholar in Ingegneria Elettrica e Informatica. "La posizione può aiutare Alexa a migliorare il riconoscimento vocale, poiché è possibile caricare diversi vocabolari e modelli vocali. Per esempio, un comando come "aggiungi urgente alla lista della spesa" potrebbe non avere senso, ma se Alexa sa che l'utente è in lavanderia, Alexa potrebbe essere in grado di dedurre che l'utente ha effettivamente detto "aggiungi detersivo alla lista della spesa".
Shen e Roy Choudhury riconoscono che la tecnologia potrebbe erodere ulteriormente la privacy, consentendo ad aziende come Amazon e Google di scrutare più da vicino le nostre case e la nostra vita quotidiana. Però, credono anche che i benefici siano vitali, poiché i dispositivi intelligenti sensibili al contesto potrebbero diventare tecnologie di supporto cruciali per la vita indipendente degli anziani e altro ancora.
Per esempio, la tecnologia potrebbe essere utilizzata per ricordare a un nonno che vive in modo indipendente di prendere le medicine quando passa davanti all'armadietto dei medicinali, o per ricordare a un bambino di chiudere il rubinetto quando esce dal bagno con il rubinetto ancora aperto.
"È più che interpretare i comandi vocali, " ha detto Shen. "Fornisce un paio di occhi in più anche quando si tratta di prendersi cura dei propri cari".