Questa schermata mostra un fotogramma di un video in Scoop, Lo strumento di Voxel 51 per organizzare i video in base al loro contenuto. I veicoli sono riconosciuti per tipologia, fare e colorare. La piattaforma di Voxel51 esegue l'elaborazione video AI che identifica gli oggetti e le azioni nel video. Credito:Voxel51
Voxel51, una startup dell'Università del Michigan, ha lanciato oggi il suo prodotto di punta, una piattaforma software progettata per semplificare, più veloce e più conveniente per accedere al potenziale non sfruttato dei dati video.
Il software è rivolto alle aziende che lavorano con i video ma faticano a estrarre da esso le informazioni di cui hanno bisogno. Mentre il video è una ricca forma di dati, è difficile da analizzare e ricercare a causa della sua complessità, file di grandi dimensioni e mancanza di unità definite come le parole.
Voxel51 ha deciso di superare questi ostacoli con la sua piattaforma di analisi video e librerie software open source che, insieme, abilitare il riconoscimento video all'avanguardia. Identifica e segue oggetti e azioni in ogni clip. Come dice il co-fondatore Brian Moore, "Trasformiamo il video in valore."
La loro attenzione iniziale, che è particolarmente rilevante per le auto senza conducente, è su riprese video da scene stradali e per la sicurezza pubblica. In entrambe queste applicazioni, le fotocamere sono sensori chiave, ma richiede tempo per gli esseri umani elaborare i dati in modo che un computer possa analizzarli. Più veloce, l'elaborazione automatizzata dovrebbe accelerare lo sviluppo di una migliore visione artificiale.
"Questa è la prima e unica piattaforma pubblicamente disponibile per la comprensione della scena stradale, " ha detto il co-fondatore Jason Corso, un professore di ingegneria elettrica e informatica. "Le case automobilistiche le stanno costruendo, ma in silos proprietari. Il nostro sarà disponibile per chiunque da usare e provare.
"Con la democratizzazione dell'elaborazione video e l'accesso a grandi, biblioteche annotate, consentiamo alle startup più giovani di competere con i team dotati di risorse che lavorano su auto senza conducente e altre applicazioni di visione artificiale nelle grandi aziende".
Nei veicoli senza conducente di oggi, gli algoritmi di percezione sono prodotti con tecniche di machine learning, il che significa che devono essere addestrati su video clip che sono annotati con l'identificazione e il tracciamento degli oggetti, ad esempio, pedoni, veicoli, lampioni, cartelli e semafori.
Questa schermata mostra un fotogramma di un video in Scoop, Lo strumento di Voxel 51 per organizzare i video in base al loro contenuto. Veicoli, segnali e pedoni sono etichettati e tracciati attraverso la clip. La piattaforma di Voxel51 esegue l'elaborazione video AI che identifica gli oggetti e le azioni nel video. Credito:Voxel51
Prima che i sistemi siano addestrati, il video deve essere annotato, di solito da un essere umano. Ecco perché è dispendioso in termini di tempo e denaro creare dati di addestramento per algoritmi di apprendimento automatico.
Con Voxel51, gli utenti possono fare affidamento sul software AI della piattaforma per accelerare gran parte di questo processo. Quindi, è possibile cercare contenuti video molto specifici, ad esempio un dog sitter. E con la libreria open source, alcuni utenti hanno accesso a set di dati molto più grandi di quelli che potrebbero altrimenti permettersi di acquisire.
"C'è una chiara necessità del tipo di tecnologia AI all'avanguardia che è stata sviluppata da Voxel51 nello spazio dei veicoli automatizzati, e siamo entusiasti dei progressi già fatti, "ha detto Bryce Pilz, direttore delle licenze presso U-M Tech Transfer.
"Proprio adesso, La tecnologia Voxel51 sta aiutando i veicoli autonomi di Mcity a dare un senso a ciò che vedono sulla strada in modo che possano prendere decisioni migliori, e non abbiamo dubbi che alla fine vedremo queste innovazioni farsi strada nei veicoli di produzione, rendendoli più sicuri, più efficiente e affidabile."
Oltre a mettere nelle mani degli sviluppatori una potente analisi video AI, Il principale elemento di differenziazione nascosto di Voxel51 è che la loro elaborazione opera nel volume spazio-temporale attraverso i frame, dove possono catturare il movimento e i cambiamenti di aspetto nel tempo. In altre parole, non stanno guardando i pixel ma i voxel.
La società ha raccolto 2 milioni di dollari in capitale di rischio. Si trova ad Ann Arbor, impiega 15 persone e ne assume molte di più, dice Corso.
"Fin dagli albori dell'informatica moderna, gli esseri umani si sono adattati ai computer. Penso che sia ora che i computer inizino ad adattarsi a noi, e questo implica una comprensione più profonda del mondo visivo, " Corso ha detto. "La nuova piattaforma di Voxel51 è un passo importante in quella direzione. Vogliamo consentire alle nuove aziende di aggiungere capacità di percezione visiva con facilità e potenza dove altrimenti non sarebbero state in grado".