Dott. Andreas Jedlitschka, Fraunhofer IESE, spiega in un'intervista perché oggi gli scienziati dei dati sono così richiesti. Credito:Fraunhofer IESE
Il data scientist è uno dei lavori più interessanti del 21° secolo. Questa impressione è confermata quando dai un'occhiata ai portali di lavoro online pertinenti. Secondo uno studio del McKinsey Global Institute, negli USA la domanda supera di gran lunga l'offerta – e questo non sembra essere diverso in Germania. Ma cos'è che rende questo lavoro così interessante in primo luogo? Qualcuno che lo sa è il dottor Andreas Jedlitschka, Capo del dipartimento di ingegneria dei dati presso l'Istituto Fraunhofer per l'ingegneria del software sperimentale IESE e membro del comitato di esperti sulla scienza dei dati dell'organismo di certificazione personale presso l'Istituto Fraunhofer per l'informatica applicata FIT, San Agostino.
Perché le aziende hanno un bisogno così enorme di specialisti dei dati?
Con il crescente networking tra tutte le aree fino agli ecosistemi digitali, aumenta esponenzialmente anche il diluvio di dati nelle aziende e nelle organizzazioni. Allo stesso tempo, la crescente disponibilità di dati e le storie di successo pubblicate sulla stampa portano anche a un crescente desiderio di utilizzare i dati in modo sistematico, cioè., per eseguire analisi dei dati, e quindi nasce la necessità di esperti in grado di eseguirli. Questi "specialisti dei dati" sono spesso combinati con il termine scienziati dei dati.
Cosa rende uno scienziato dei dati in primo luogo?
Prima di tutto, Vorrei definire il termine "Data Science":Data Science significa estrarre conoscenza dai dati e farlo idealmente a beneficio dell'azienda. Fare così, metodi e tecniche dell'informatica, matematica, e vengono utilizzate le statistiche. Il profilo professionale è vario e spazia dall'analisi dei Big Data e l'analisi visiva tramite l'architettura dei Big Data fino all'integrazione. Inoltre, devono essere presi in considerazione i modelli di business, risp. sviluppato, e quindi va anche inteso. Per di più, devi parlare con il cliente, cioè., l'utente delle informazioni in qualità di destinatario, e con l'esperto di dominio.
Quali sono i compiti che svolgono i data scientist, e di quali competenze hanno bisogno?
I data scientist devono essere esperti in più discipline contemporaneamente:non solo valutano i dati, ma deve anche comprendere i contesti di business nelle aziende e nelle organizzazioni. Devono identificare fonti di dati adeguate, determinare e migliorare la qualità dei dati, mettere insieme i dati, preparare ed eseguire analisi, e poi valutare i risultati in termini di criteri dati. Se lavori come data scientist, spesso si hanno grandi responsabilità poiché decisioni strategiche di vasta portata o anche vite umane possono dipendere dai risultati delle analisi dei dati – basti pensare ai sistemi utilizzati per il supporto alla diagnosi in ambito medico o ai processi di apprendimento utilizzati in vari ambiti nei veicoli autonomi. Ecco perché i dati sottostanti e i risultati delle analisi devono essere continuamente verificati in termini di plausibilità, completezza, correttezza, e pertinenza, in collaborazione con esperti del settore. Il profilo dei requisiti di un data scientist cresce in base a come il suo lavoro è integrato nell'azienda e include non solo competenze tecniche, ma anche una serie di soft skills come la capacità di lavorare in team, spiccate capacità comunicative, e creatività.
Come diventare un data scientist? Quali sono i presupposti, risp. quali conoscenze pregresse sono richieste?
Al Fraunhofer, offriamo un corso certificato nell'ambito della Big Data Alliance, dove rendiamo i partecipanti adatti ai progetti Big Data. I partecipanti sono spesso decisori, ma principalmente sviluppatori aziendali, analisti, responsabili dei dati, e sviluppatori di software. Il prerequisito è una conoscenza di base dell'informatica e della matematica. Nei corsi per principianti, i partecipanti apprendono gli importanti fondamenti, processi, e best practice per gestire grandi quantità di dati e per lo sviluppo di soluzioni intelligenti con elevati standard di privacy e sicurezza. Nei corsi avanzati, i singoli processi sono studiati in dettaglio; quindi l'obiettivo è essere in grado di applicare ciò che è stato appreso. In questi corsi, insegniamo lo stato dell'arte delle conoscenze in un produttore neutrale, praticamente rilevante, e allo stesso tempo in maniera teoricamente valida.
Anche i giovani scienziati provenienti dall'università beneficiano del tuo corso di certificazione. Quale background è necessario per avere la possibilità di diventare un data scientist qualificato?
I ricercatori che provengono direttamente dall'università hanno un'ottima conoscenza della materia, soprattutto dal loro programma di studi, come l'informatica o la matematica. Quello che spesso manca ai giovani scienziati, però, è un'ampia panoramica e l'esperienza pratica necessaria per collaborare a progetti Big Data. E questo è esattamente ciò che imparano nel nostro corso di data scientist. La formazione è progettata per una vasta gamma di applicazioni. Imparano come gli sviluppatori aziendali sbloccano il potenziale dei Big Data nella loro azienda, come i data engineer descrivono e integrano i dati, come gli analisti utilizzano i processi di apprendimento automatico per rilevare modelli e tendenze, e come gli ingegneri del software utilizzano database moderni e metodi di calcolo distribuiti per sviluppare sistemi di Big Data robusti e scalabili. Tutto questo tenendo conto della privacy e della sicurezza. L'obiettivo è acquisire conoscenze di base in tutte le aree rilevanti. Chi lo desidera può poi diventare un data scientist certificato.