• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • La scienza dei dati è un campo in crescita. Ecco come addestrare le persone a farlo

    Avere i dati a portata di mano non è sufficiente:i data scientist devono sapere come applicarli. Credito:Gorodenkoff/Shutterstock

    Il mondo è inondato di dati. C'è uno tsunami virtuale di dati in movimento in tutto il mondo, rinnovandosi quotidianamente. Prendiamo solo i mercati finanziari globali. Generano grandi quantità di dati:quotazioni azionarie, prezzi vantaggiosi, indici, prezzi delle opzioni e dei futures, per citarne solo alcuni.

    Ma i dati non servono se non ci sono persone in grado di raccogliere, fascicolare, analizzarlo e applicarlo a beneficio della società. Tutti i dati generati dai mercati finanziari globali vengono utilizzati per la gestione patrimoniale e patrimoniale e devono essere analizzati e compresi correttamente per consentire un buon processo decisionale. È qui che entra in gioco la scienza dei dati.

    L'obiettivo principale della scienza dei dati è estrarre informazioni dai dati in varie forme, sia strutturato che non strutturato. È un campo multidisciplinare, coinvolgendo tutto, dalla matematica applicata alla statistica, dall'intelligenza artificiale all'apprendimento automatico. E sta crescendo. Ciò è dovuto ai progressi nella tecnologia informatica e alla velocità di elaborazione, il costo relativamente basso per memorizzare i dati, e la massiccia disponibilità di dati da Internet e da altre fonti come i mercati finanziari globali.

    Affinché la scienza dei dati avvenga, Certo, hai bisogno di scienziati dei dati. Poiché la scienza dei dati è di portata così ampia, essere uno scienziato dei dati copre una vasta gamma di professioni. Questi includono statistici, ricercatori operativi, ingegneri, scienziati informatici, attuari, fisici e studenti di macchine.

    Questa varietà non è necessariamente una cosa negativa. Dalla mia esperienza pratica, Ho imparato presto che quando si risolvono problemi di data science, hai bisogno di una serie di persone. Alcuni possono lavorare in profondità sulla teoria e altri possono esplorare l'area di applicazione.

    Ma come dovrebbero essere formati questi data scientist in modo che siano preparati per le sfide dei big data che li attendono?

    Gli scienziati dei dati utilizzano in genere tecniche matematiche innovative dai propri sottocampi per cercare di risolvere i problemi in una particolare area di applicazione. Le aree di applicazione – finanza, Salute, agricoltura e astronomia sono solo alcuni esempi, sono molto diverse. Ciò significa che ognuno pone problemi diversi, e quindi gli scienziati dei dati hanno bisogno di conoscenze sulla particolare area di applicazione.

    Per esempio, si consideri l'astrofisica e lo Square Kilometer Array in costruzione sulla punta meridionale dell'Africa. Sarà il più grande radiotelescopio del mondo quando sarà completato a metà degli anni '20. Si dice che la serie di telescopi riceva dati a un terabyte al secondo e che i ricercatori siano generalmente interessati ad analizzare le masse di dati al fine di rilevare piccoli segnali inglobati nel rumore bianco.

    In finanza, i ricercatori sfruttano le grandi basi di dati in modo molto diverso:ad esempio per saperne di più sul comportamento creditizio dei loro clienti.

    I sottocampi più affermati della scienza dei dati sono la statistica e la ricerca operativa e potrebbe valere la pena imparare dai programmi di formazione stabiliti in questi campi. Le università stanno formando abbastanza laureati in questi campi? E questo allenamento è abbastanza buono?

    Sebbene gli studenti in questi campi siano ben formati accademicamente, molti laureati in statistica e ricerca operativa non hanno conoscenza dei campi in cui dovrebbero applicare le tecniche matematiche. Tendono anche a combattere con capacità di problem solving del mondo reale, oltre a mancare di capacità di programmazione numerica e di gestione dei dati. Questo perché tali competenze non sono affrontate adeguatamente in molti curricula.

    Così, attingendo da questi fallimenti e dalle lezioni dei sottocampi consolidati della scienza dei dati, cosa dovrebbero insegnare le università agli aspiranti scienziati dei dati? Ecco la mia lista.

    • Scienze matematiche e computazionali, compresi i corsi di statistica e teoria della probabilità, intelligenza artificiale, apprendimento automatico, ricerche operative, e informatica.
    • capacità di programmazione;
    • capacità di gestione dei dati;
    • Conoscenza della materia in campi di applicazione selezionati; e
    • Capacità di problem solving professionale.

    Questo elenco potrebbe essere ampliato a livello post-laurea. E, sia a livello universitario che post-laurea, tutti questi corsi dovrebbero avere un elemento pratico. Ciò consente agli studenti di sviluppare sia la professionalità che le capacità di problem solving.

    Ad esempio, presso il Center for Business Mathematics and Informatics della South Africa's North-West University, io e i miei colleghi abbiamo organizzato un programma di formazione professionale che vede gli studenti lavorare per sei mesi presso un'azienda cliente per risolvere un problema specifico del settore. Questi problemi sono principalmente nel campo finanziario; Per esempio, modelli per prevedere la capacità e la disponibilità a pagare di un cliente, modelli per migliorare le collezioni e modelli per l'identificazione delle frodi.

    Questo aiuta gli studenti a sviluppare le competenze necessarie per funzionare nel mondo del lavoro, gestire dati reali e applicarli a problemi reali piuttosto che lavorare solo a livello teorico. Inoltre, come un collega e ho sostenuto in precedenti ricerche, aiuta a colmare il divario tra mondo accademico e industria e rende così la scienza dei dati più rilevante. I programmi BMI sono stati riconosciuti e lodati da esperti internazionali.

    Scienza dei dati, come un campo, crescerà solo nei prossimi decenni. È imperativo che le università formino laureati in grado di gestire enormi tranche di dati, lavorare a stretto contatto con le industrie che producono e applicano questi dati e rendere i dati qualcosa che può cambiare il mondo in meglio.

    Questo articolo è stato ripubblicato da The Conversation con una licenza Creative Commons. Leggi l'articolo originale.




    © Scienza https://it.scienceaq.com