La nuova tecnologia migliora la percezione del parlato

I futuri utenti di apparecchi acustici saranno in grado di indirizzare il proprio ascolto in modo più accurato grazie alla nuova tecnologia danese. Un ricercatore dell'Università di Aalborg utilizza l'apprendimento automatico per insegnare a un programma per computer come rimuovere il rumore indesiderato e migliorare il parlato.

Una delle principali sfide per le persone con perdita dell'udito è comprendere il parlato in ambienti rumorosi. Il problema viene chiamato effetto cocktail party perché le situazioni in cui molte persone parlano contemporaneamente spesso rendono molto difficile distinguere ciò che viene detto dall'individuo con cui stai parlando.

Anche se la maggior parte degli apparecchi acustici moderni incorpora varie forme di tecnologia di miglioramento del linguaggio, gli ingegneri stanno ancora lottando per sviluppare un sistema che apporti un miglioramento significativo.

dottorato di ricerca Lo studente Mathew Kavalekalam dell'Audio Lab Analysis dell'Università di Aalborg sta utilizzando l'apprendimento automatico per sviluppare un algoritmo che consente a un computer di distinguere tra parole pronunciate e rumore di fondo. Il progetto è svolto in collaborazione con ricercatori di apparecchi acustici di GN Advanced Science ed è supportato da Innovation Fund Denmark.

Il computer ascolta e impara

"Il centro dell'udito all'interno del nostro cervello di solito esegue una serie di calcoli estremamente complicati che ci consentono di concentrarci su una singola voce, anche se ci sono molte altre persone che parlano in sottofondo, " spiega Mathew Kavalekalam, Università di Aalborg. "Ma questa capacità è molto difficile da ricreare in una macchina".

Mathew Kavalekalam ha iniziato con un modello digitale che descrive come viene prodotto il linguaggio in un corpo umano, dai polmoni attraverso la gola e la laringe, bocca e cavità nasali, i denti, labbra, eccetera.

Ha usato il modello per descrivere il tipo di segnale che un computer dovrebbe "ascoltare" quando cerca di identificare una voce parlante. Ha poi detto al computer di iniziare ad ascoltare e imparare.

Il rumore non è solo rumore

"Il rumore di fondo varia a seconda dell'ambiente, dal rumore della strada o del traffico se sei fuori al rumore delle persone che parlano in un pub o in una caffetteria, " Dice Mathew Kavalekalam. "Questo è uno dei tanti motivi per cui è così difficile costruire un modello per il miglioramento del parlato che filtri il discorso che vuoi ascoltare dal balbettio a cui non sei interessato".

All'università di Aalborg, Mathew Kavalekalam ha riprodotto varie registrazioni di voci che parlano al computer e ha aggiunto gradualmente diversi tipi di rumore di fondo a un livello crescente.

Applicando questo machine learning, il software per computer ha sviluppato un modo per riconoscere i modelli sonori e calcolare come migliorare il suono particolare delle voci parlanti e non il rumore di fondo.

Quindici per cento di miglioramento

Il risultato del lavoro di Kavalekalam è un software che può aiutare efficacemente le persone con problemi di udito a comprendere meglio il parlato. È in grado di identificare e migliorare le parole pronunciate anche in ambienti molto rumorosi.

Finora il modello è stato testato su dieci persone che hanno confrontato il parlato e il rumore di fondo con e senza l'uso dell'algoritmo di Kavalekalam.

Ai soggetti del test è stato chiesto di eseguire semplici compiti che coinvolgessero il colore, numeri e lettere che venivano loro descritti in ambienti rumorosi.

I risultati indicano che Kavalekalam potrebbe aver sviluppato una soluzione promettente. La percezione del parlato dei soggetti del test è migliorata del quindici percento in ambienti molto rumorosi.

Elaborazione del segnale scattante

Però, c'è ancora del lavoro da fare prima che il software di Mathew Kavalekalam trovi la sua strada nei nuovi apparecchi acustici. La tecnologia deve essere ottimizzata e messa a punto prima che sia praticamente applicabile.

L'algoritmo deve essere ottimizzato per consumare meno potenza di elaborazione. Anche se la tecnologia diventa sempre più veloce e potente, ci sono limitazioni hardware in piccole, apparecchi acustici moderni.

"Quando si tratta di miglioramento del linguaggio, l'elaborazione del segnale deve essere davvero scattante. Se il suono è ritardato nell'apparecchio acustico, non si sincronizza con i movimenti della bocca e questo finirà per confonderti ancora di più, " spiega Mathew Kavalekalam.

Numero di dipendenti della redazione di giornali statunitensi in forte calo:sondaggio

Spagna:i tassisti bloccano le strade per i servizi di trasporto passeggeri

Elettronica