Una foto originale (a sinistra); la stessa foto ritagliata dalla tecnologia esistente, come il software negli smartphone; e la stessa foto ritagliata dal modello dei ricercatori per contenere la parte visivamente significativa della foto. Credito:James Wang e Jia Li / Penn State
I computer possono ora ritagliare automaticamente le foto per catturare la parte più interessante in modo esteticamente gradevole, grazie ai ricercatori della Penn State.
"Quando si ritaglia manualmente un'immagine, gli umani identificano la parte più interessante o accattivante della foto, anche se decentrata, e ritagliano la foto per inquadrarla, ma gli strumenti esistenti ritagliano le foto al centro dell'immagine, senza considerare se quella sezione contenga una parte visivamente significativa della foto, " ha detto Jia Li, professore di statistica, chi, insieme al suo collega James Wang, professore di scienze e tecnologie dell'informazione, recentemente ricevuto il brevetto U.S. n. 10, 186, 040 per il modello. "Abbiamo risolto questo problema creando un modello statistico che identifica rapidamente il significato visivo di ogni parte segmentata di una foto e ritaglia la foto complessiva in modo esteticamente gradevole".
Secondo i ricercatori, il software potrebbe essere utilizzato negli smartphone, sui social media e sui browser internet, dove le foto sono state tradizionalmente ritagliate automaticamente nel mezzo, spesso manca il soggetto principale o produce un risultato esteticamente sgradevole.
Il team ha modellato la quantità di tempo in cui è probabile che un occhio umano si soffermi su un particolare segmento di un'immagine utilizzando una catena di Markov, che è un modello statistico. L'attenzione prestata a qualsiasi segmento dipende dai suoi attributi individuali come il colore, consistenza e luminosità, così come la sua relazione spaziale con altri segmenti. I ricercatori hanno codificato tutti questi diversi tipi di informazioni all'interno dei parametri della catena di Markov. Il modello statistico classifica quindi i segmenti, con il significato più alto assegnato al segmento che trattiene l'occhio più a lungo. Questo ordinamento aiuta il modello a determinare la posizione migliore per il ritaglio. La decisione tiene conto anche della qualità estetica dell'immagine ritagliata.
"La disposizione spaziale dei segmenti in un'immagine gioca un ruolo importante nel determinare il significato, " ha detto Li. "Il modello considera come i segmenti interagiscono spazialmente, senza presumere che il centro geometrico dell'immagine sia necessariamente più importante. Per esempio, due segmenti con lo stesso aspetto possono avere punteggi di significatività piuttosto diversi a seconda della loro posizione rispetto al resto dell'immagine."
Secondo Li e Wang, il modello funziona rapidamente per ritagliare le foto e richiede pochissima potenza di calcolo.
"Il nostro codice impiega circa 50 millisecondi per elaborare un'immagine di 400 per 300 pixel su un comune computer desktop o laptop, " ha detto Wang. "Di conseguenza, il nostro metodo è adatto a dispositivi con memoria e potenza di calcolo limitate."
Il team spera di commercializzare il suo metodo per i motori di ricerca Internet e le società di telefonia mobile, tra gli altri.
"Ritagliando le foto in modo esteticamente più gradevole, una serie di applicazioni relative alle foto possono essere migliorate, soprattutto quando le dimensioni dello schermo sono piccole, come nei telefoni, orologi o tablet, " ha detto Wang. "Inoltre, il modello può aiutare le aziende di annunci visivi a migliorare le loro percentuali di clic."