Credito:dani3315, Shutterstock
I Big Data sono ancora una cosa d'élite:solo le aziende più ricche e esperte di IT hanno la possibilità di scalfire la superficie del suo potenziale. Tutto questo potrebbe cambiare grazie a una piattaforma di analisi dei Big Data sviluppata nell'ambito del progetto TOREADOR, che gestirà automaticamente tutti i principali problemi relativi alla preparazione dei dati su richiesta.
"Le aspettative sui Big Data sono molto alte, ma il divario tra ambizione ed esecuzione è ancora ampio, soprattutto per le PMI, Il dottor Ernesto Damiani sospira. E dovrebbe saperlo:dall'inizio del 2016 Il Dr. Damiani ha guidato un consorzio di 10 persone che ha esaminato le ragioni di queste fortune alterne e le possibili soluzioni.
Se relativamente poche PMI hanno incorporato l'analisi dei Big Data nelle loro offerte o processi interni, è principalmente per due motivi. Il primo è una mancanza di competenza nell'analisi dei Big Data, come spiega il dottor Damiani. Una società disposta, ad esempio, per adattare la propria offerta al comportamento del cliente utilizzando un'app gratuita dovrebbe ricorrere a consulenze molto costose. Attualmente è l'unico modo per mappare gli obiettivi aziendali su una classe di soluzioni tecnologiche e di data science.
"Concretamente, il brief del progetto potrebbe essere qualcosa sulla falsariga di "raccogliere gli eventi generati dalle app dei clienti principali e usarli per addestrare un classificatore multicategoria scalabile a foresta casuale del loro comportamento da distribuire su un servizio cloud pubblico", " lui dice.
La seconda ragione è il lungo tempo di roll-out e, ancora, il costo proibitivo delle campagne Big Data anche quando l'approccio data science è già stato individuato. Insieme, questi problemi hanno tenuto le PMI e le aziende non esperte di ICT lontane dall'analisi dei Big Data, sebbene rappresentino una quota sostanziale della spina dorsale manifatturiera dell'UE.
La metodologia e il toolkit TOREADOR (TrustwOrthy model-awaRE Analytics Data platfORm) offrono una soluzione a entrambi i problemi:automatizzano e semplificano l'analisi dei Big Data, rendendo la sua personalizzazione in base ai requisiti dei clienti specifici del dominio molto più semplice di prima.
Il framework TOREADOR supporta due trasformazioni automatizzate. Il primo parte da un modello dichiarativo leggibile dalla macchina che raccoglie gli obiettivi del proprietario dei dati, e termina in un modello procedurale indipendente dalla tecnologia sensibile alla semantica che descrive il calcolo da eseguire. Quindi, la seconda trasformazione si basa sul modello procedurale per calcolare un modello di distribuzione dipendente dalla tecnologia. Quest'ultimo può essere eseguito su una piattaforma Apache, presso la sede del cliente, su servizi cloud commerciali come AWS, come codice Python eseguibile sulla piattaforma Azure o come contenitore Docker.
"I nostri modelli dichiarativi possono raccogliere in modo interattivo gli obiettivi di business delle campagne Big Data e consentire al toolkit TOREADOR di fornire consigli automatici sulla fattibilità delle soluzioni. I nostri modelli procedurali forniscono quindi una descrizione innovativa del calcolo dell'analisi dei Big Data nella semantica OWL/S- standard consapevoli, e i nostri compilatori traducono questi modelli procedurali in flussi di lavoro completamente eseguibili o persino in codice Python parallelizzato in modo nativo. Stiamo esaminando un processo di sviluppo iterativo, dove gli utenti non esperti di IT possono impostare rapidamente una campagna generando un flusso di lavoro eseguibile su un servizio cloud pubblico, e poi, se necessario, chiamare gli sviluppatori per generare codice Python autonomo, " spiega il dottor Damiani.
I partner del progetto hanno già identificato quattro progetti pilota industriali nel campo della manutenzione predittiva dei motori aeronautici, gestione predittiva degli impianti solari, analisi dei registri delle applicazioni aziendali, e analisi dei flussi di clic per le applicazioni di e-commerce.
"La piattaforma TOREADOR è disponibile ed è stata implementata nei quattro siti pilota. È stata anche resa disponibile come pre-release gratuita per membri selezionati della comunità TOREADOR, che è composta da società europee (molte delle quali PMI) assunte con l'aiuto di TAIGER (Spagna), una PMI innovativa nel consorzio TOREADOR. I dettagli su questi primi utenti sono disponibili sul nostro sito web. Oltretutto, la metodologia TOREADOR è stata rilasciata ad altri progetti europei utilizzando campagne Big Data come EVOTION, " dice il dottor Damiani.
Il completamento del progetto è previsto per la fine del 2018. Fino ad allora, il consorzio intende continuare ad ampliare il catalogo dei servizi disponibili nella piattaforma e fornire esempi di campagne Big Data abilitate a TOREADOR, compresa la formazione e l'implementazione di modelli avanzati di machine learning.