Con ogni notizia, i concetti di data mining delle informazioni sanitarie si spostano ancora più in alto nell'agenda della ricerca e della politica in questo settore. Le informazioni cliniche e i dati genetici contenuti nelle cartelle cliniche elettroniche (EHR) rappresentano un'importante fonte di informazioni utili per la ricerca biomedica, ma accedervi in modo utile può essere difficile.
Scrivendo sull'International Journal of Intelligent Engineering Informatica, Hassan Mahmoud e Enas Abbas della Benha University e della Ibrahim Fathy Ain Shams University, in Egitto, discutere la necessità di metodi innovativi ed efficaci per rappresentare questa enorme quantità di dati. Sottolineano che esistono tecniche di data mining e tecniche basate sull'ontologia che possono svolgere un ruolo importante nel rilevare le sindromi nei pazienti in modo efficiente e accurato. Una sindrome è definita come un insieme di sintomi e indicatori medici concomitanti associati a una determinata malattia o disturbo.
Il team ha esaminato lo stato dell'arte e si è concentrato anche sulla revisione delle ben note tecniche di data mining come alberi decisionali (J48), Ingenuo Bayes, perceptron multistrato (MLP), e le tecniche della foresta casuale (RF) e hanno confrontato il modo in cui ciascuna di esse si comporta nella classificazione di una particolare sindrome, cardiopatia.
Il team conclude che negli esperimenti con un set di dati pubblico, il classificatore RF fornisce le migliori prestazioni in termini di precisione. Nel futuro, suggeriscono che il data mining andrà a beneficio dell'assistenza sanitaria e della medicina in modo significativo per la costruzione di un sistema in grado di rilevare una sindrome specifica.