Utilizzando un algoritmo sviluppato dai ricercatori della Brown University, un robot è stato in grado di copiare uno schizzo della Gioconda usando tratti di penna simili a quelli umani. Credito:Atsunobu Kotani/Brown University
Un algoritmo sviluppato dagli scienziati informatici della Brown University consente ai robot di mettere nero su bianco, scrivere parole usando modelli di tratto simili alla scrittura umana. è un passo, dicono i ricercatori, verso robot in grado di comunicare più fluentemente con colleghi e collaboratori umani.
"Solo guardando un'immagine di destinazione di una parola o di uno schizzo, il robot può riprodurre ogni colpo come un'azione continua, " disse Atsunobu Kotani, uno studente universitario alla Brown che ha guidato lo sviluppo dell'algoritmo. "Ciò rende difficile per le persone distinguere se è stato scritto dal robot o effettivamente scritto da un umano".
L'algoritmo utilizza reti di deep learning che analizzano immagini di parole o schizzi scritti a mano e possono dedurre la probabile serie di tratti di penna che li ha creati. Il robot può quindi riprodurre le parole o gli schizzi utilizzando i tratti di penna che ha appreso. In un documento che sarà presentato alla Conferenza Internazionale di Robotica e Automazione di questo mese, i ricercatori dimostrano un robot che è stato in grado di scrivere "ciao" in 10 lingue che utilizzano diversi set di caratteri. Il robot è stato anche in grado di riprodurre bozzetti, compreso uno della Gioconda.
Stefanie Tellex, un assistente professore di informatica presso Brown e consulente di Kotani, afferma che ciò che rende unico questo lavoro è la capacità del robot di apprendere l'ordine dei tratti da zero.
"Molto del lavoro esistente in quest'area richiede che il robot disponga di informazioni sull'ordine dei colpi in anticipo, " disse Tellex. "Se volevi che il robot scrivesse qualcosa, qualcuno dovrebbe programmare gli ordini di corsa ogni volta. Con quello che ha fatto Atsu, puoi disegnare quello che vuoi e il robot può riprodurlo. Non sempre esegue l'ordine dei tratti perfetto, ma ci si avvicina parecchio".
Un altro aspetto notevole del lavoro, Tellex dice, è così che l'algoritmo è stato in grado di generalizzare la sua capacità di riprodurre i tratti. Kotani ha addestrato il suo algoritmo di deep learning utilizzando una serie di caratteri giapponesi, e ha dimostrato di poter riprodurre i caratteri e i tratti che li hanno creati con una precisione del 93% circa. Ma con grande sorpresa dei ricercatori, l'algoritmo finì per essere in grado di riprodurre tipi di caratteri molto diversi che non aveva mai visto prima:stampa inglese e corsivo, Per esempio.
"Saremmo stati felici se avesse imparato solo i caratteri giapponesi, " ha detto Tellex. "Ma una volta che ha iniziato a lavorare in inglese, siamo rimasti stupiti. Poi abbiamo deciso di vedere fino a che punto potevamo spingerci".
Tellex e Kotani hanno chiesto a tutti coloro che lavorano nel laboratorio Humans to Robots di Tellex di scrivere "ciao" nelle loro lingue native, che includeva il greco, Hindi, Urdu, Cinese e Yiddish tra gli altri. Il robot è stato in grado di riprodurli tutti con una ragionevole precisione del tratto.
Utilizzando un algoritmo sviluppato dai ricercatori della Brown University, un robot è stato in grado di scrivere "ciao" utilizzando modelli di tratti simili a quelli umani in 10 lingue diverse, ciascuna con diversi set di caratteri. Il robot è stato anche in grado di copiare un abbozzo della Gioconda. Credito:Humans to Robots Lab / Brown University
"Sento che c'è qualcosa di veramente bello nel robot che scrive in così tante lingue diverse, " Tellex ha detto. "Ho pensato che fosse davvero cool."
Ma il capolavoro del sistema potrebbe essere la sua copia dello schizzo della Gioconda di Kotani. Ha disegnato il suo schizzo su una lavagna a secco nel laboratorio di Tellex, e poi ha permesso al robot di copiarlo, abbastanza fedelmente, sulla stessa lavagna appena sotto l'originale di Kotani.
"Era la mattina presto che il nostro robot ha finalmente disegnato la Gioconda sulla lavagna, " ha detto Kotani. "Quando sono tornato al laboratorio, tutti erano in piedi intorno alla lavagna a guardare la Gioconda e mi chiedevano se [il robot] l'avesse disegnata. Non potevano crederci".
È stato un grande momento per Kotani perché "è stato il momento in cui il nostro robot ha definito ciò che va oltre la semplice stampa". Una stampante a getto d'inchiostro può ricreare un'immagine, ma lo fa con una testina di stampa che va avanti e indietro costruendo l'immagine riga per riga. Ma questo era il robot che creava un'immagine con tratti simili a quelli umani, che per Kotani è "qualcosa di molto più umano ed espressivo".
Chiave per far funzionare il sistema, Kotani dice, è che l'algoritmo utilizza due modelli distinti dell'immagine che sta cercando di riprodurre. Utilizzando un modello globale che considera l'immagine nel suo insieme, l'algoritmo identifica un probabile punto di partenza per eseguire il primo colpo. Una volta che l'ictus è iniziato, l'algoritmo ingrandisce, guardando l'immagine pixel per pixel per determinare dove dovrebbe andare quel tratto e quanto dovrebbe essere lungo. Quando raggiunge la fine della corsa, l'algoritmo chiama di nuovo il modello globale per determinare dove dovrebbe iniziare il prossimo colpo, poi si torna al modello ingrandito. Questo processo viene ripetuto fino al completamento dell'immagine.
Sia Kotani che Tellex affermano che il lavoro è un passo verso una migliore comunicazione tra persone e robot. In definitiva, immaginano robot in grado di lasciare post-it, prendere dettatura o disegnare diagrammi per i loro colleghi e collaboratori umani.
"Voglio che un robot sia in grado di fare tutto ciò che può fare una persona, " ha detto Tellex. "Sono particolarmente interessato a un robot in grado di utilizzare il linguaggio. La scrittura è un modo in cui le persone usano il linguaggio, quindi abbiamo pensato che dovremmo provare questo."