I ricercatori sviluppano un sistema di riconoscimento dinamico dei caratteri della tastiera

Rappresentazione a blocchi della fase di addestramento (linee rigide e tratteggiate) e di test (linee tratteggiate) del sistema proposto. Credito:S. Misra e R. H. Laskar.

Ricercatori presso NIT Silchar, India, hanno recentemente sviluppato un nuovo sistema di riconoscimento dei caratteri della tastiera basato sui gesti della mano dinamico. Questo sistema di tastiera virtuale, presentato in un articolo pubblicato nel Journal of Ambient Intelligence and Humanized Computing di Springer , utilizza un approccio basato sull'immagine per il riconoscimento dei gesti che è un modello, velocità e scala invarianti in natura.

"Il riconoscimento gestuale è un promettente campo di studio grazie alla sua vasta gamma di applicazioni, " Songita Misra, uno dei ricercatori che ha condotto lo studio, ha detto a TechXplore. "Un sistema di riconoscimento dei gesti può essere applicato nei sistemi di realtà virtuale, realtà aumentata, assistenza sanitaria, veicoli, per aiutare i pazienti con disabilità visive o motorie, per elettrodomestici, robot, minerario e molte altre applicazioni, che aumentano ogni giorno che passa."

Il riconoscimento dei gesti potrebbe migliorare le interazioni uomo-computer in una varietà di aree. Sebbene gli strumenti di riconoscimento dei gesti possano avere una vasta gamma di applicazioni, finora, pochissime organizzazioni e istituzioni hanno cercato di introdurre questi sistemi nella società.

"Durante l'indagine sulla letteratura, Ho osservato che la maggior parte degli studi esistenti sono limitati a gesti statici o gesti dinamici di piccola durata come "muoviti a sinistra, ' 'vai a destra, ' 'clicca, ' 'fermare, ' eccetera., che può sostanzialmente sostituire al massimo i tradizionali telecomandi mouse e TV, " ha detto Songhita. "Con l'aumento della domanda di applicazioni, la complessità del sistema da parte del progettista è destinata ad aumentare. Perciò, è richiesto uno studio e un'analisi approfonditi nel campo dei sistemi dinamici lunghi."

Diagramma di flusso del modello di classificazione gerarchico proposto. Credito:S. Misra e R. H. Laskar.

Le tastiere tradizionali supportano un'ampia gamma di caratteri, comprese lettere maiuscole e minuscole inglesi, operatori aritmetici, numeri arabi, e altri caratteri ASCII stampabili. Un sistema di riconoscimento dei gesti che copre tutti questi caratteri è molto impegnativo da sviluppare a causa dei suoi significativi requisiti di database, così come le possibili complicazioni associate al rilevamento della mano, monitoraggio, estrazione di caratteristiche e uso di classificatori.

Nel loro recente studio, Songhita ei suoi colleghi hanno deciso di sviluppare un sistema di tastiera virtuale con circa 95 caratteri. Ancora, a causa delle difficoltà legate a questo compito, il loro sistema attualmente supporta 58.

"La nostra squadra, che include la mia guida Dr. Rabul Hussain Laskar, La dottoressa Joyeeta singha ed io, è riuscito a sviluppare un sistema di 58 caratteri stampabili da tastiera utilizzando sia pennarelli colorati che a mano nuda, " ha spiegato Songhita. "La nostra ricerca in questo campo è iniziata nel 2013 presso il nostro Speech and Image lab al NIT Silchar."

I ricercatori hanno sviluppato un approccio gerarchico al riconoscimento dei gesti che si basa sulla co-articolazione dell'auto, caratteristiche di posizione e traiettoria. I modelli all'avanguardia esistenti per il riconoscimento dei gesti si basano sulle caratteristiche della traiettoria temporale, che dipendono dal percorso sequenziale 2-D frame-wise seguito da gesti particolari.

I 58 caratteri della tastiera classificati nello studio. Credito:S. Misra e R. H. Laskar.

A causa di questa dipendenza, le caratteristiche analizzate da questi approcci possono essere influenzate dal rumore di traiettoria o da altre variazioni nel pattern, velocità o scala. L'approccio ideato da Songhita e dai suoi colleghi, d'altra parte, utilizza modelli di immagine che non si ottengono frame-wise, e quindi non sono influenzati dal modello, velocità, variazioni di scala o di traiettoria.

I ricercatori hanno fuso queste caratteristiche basate sull'immagine e sulla traiettoria in un modello di classificazione gerarchico ibrido. Il loro modello ha raggiunto il 3,9% di precisione in più rispetto a un modello di classificazione della traiettoria non gerarchico di base, con tassi di classificazione errata inferiori per caratteri come '0' e 'O' o 'Z' e '2'.

"La versione estesa del nostro lavoro è stata approvata da IMPRINT-II per la sponsorizzazione sotto SERB, ora legale, India, per una durata di tre anni, " ha detto Songhita. "Il nostro progetto, che è in collaborazione con IIT Guwahati, era tra i 121 progetti selezionati da oltre 2000 proposte. Questo è un grande traguardo per noi, anche per l'istituto. Il nostro sarà sicuramente uno dei primi progetti in India a concentrarsi esclusivamente sullo sviluppo di un sistema di interfaccia virtuale per l'immissione di testo".

Il recente studio condotto da Songhita e dai suoi colleghi si è concentrato sullo sviluppo di un modello di classificazione gerarchica in grado di affrontare database di grandi dimensioni senza ridurre l'accuratezza del sistema. L'obiettivo del progetto più ampio approvato da IMPRINT-II, però, sarà quello di sviluppare un sistema di riconoscimento dei gesti adatto ai disabili per 95 caratteri stampabili della tastiera utilizzando sia marcatori di colore che il rilevamento a mano nuda. Una volta che questo sistema è completo, sarà utilizzato per l'uso da parte di utenti anziani e ipovedenti, così come altri che potrebbero trarne vantaggio.

"Lo sviluppo di un sistema di vocabolario così ampio sarà un compito impegnativo, " Disse Songhita. "Finora, abbiamo sviluppato un sistema di riconoscimento di 58 caratteri utilizzando tecniche basate sulla visione."

Nissan-Renault su strada più liscia ma i dossi incombono:analisti

Linee, le barre dicono ai pedoni dove vuole andare l'auto

Elettronica

Test A/B:come le aziende offline stanno imparando da Google per migliorare i profitti

Thomson Reuters annuncia 3, 200 tagli di posti di lavoro in due anni

Come rendere i computer più veloci e rispettosi del clima

Scienza

Los Angeles sarà la prima negli Stati Uniti ad installare body scanner della metropolitana

Un semplice retrofit trasforma i microscopi elettronici in fotocamere su scala atomica ad alta velocità

Che cos'è una relazione simbiotica?