L'apprendimento automatico migliora le ricerche nel database di letteratura biomedica più grande del mondo

Risultati ordinati per pertinenza, al posto della data, fornire un'esperienza migliorata per gli utenti di PubMed, il più grande database di letteratura biomedica al mondo, secondo uno studio pubblicato il 28 agosto sulla rivista ad accesso aperto PLOS Biologia di Zhiyong Lu e colleghi della National Library of Medicine (NLM)/National Center for Biotechnology Information (NCBI), che sviluppa e mantiene PubMed.

PubMed contiene oltre 28 milioni di abstract di articoli dalla letteratura biomedica, con una media di altri due aggiunti ogni minuto. È una risorsa indispensabile, di portata globale, a cui accedono milioni di utenti ogni giorno. Fin dal suo inizio, i risultati della ricerca sono stati restituiti solo in ordine cronologico inverso, prima il più recente, un sistema di classificazione che enfatizzasse l'attualità piuttosto che la pertinenza rispetto alla query di ricerca. Nel 2013, è stato introdotto un sistema di classificazione della pertinenza, ma dipendeva da fattori di ponderazione artificiali e richiedeva continui aggiustamenti manuali.

A giugno 2017, Lo staff di NLM/NCBI ha introdotto un algoritmo di apprendimento automatico che attinge a dozzine di segnali di pertinenza, comprese le risposte degli utenti, in particolare, la frequenza dei click-through agli articoli restituiti per una determinata ricerca, per migliorare il ranking di pertinenza. Questo sistema di classificazione, chiamato Migliore corrispondenza, viene offerto come alternativa all'ordinamento cronologico. Il team ha scoperto che la percentuale di clic è aumentata del 20% sui risultati restituiti da Best Match rispetto agli stessi risultati presentati in ordine cronologico. L'utilizzo complessivo dell'ordinamento per pertinenza è aumentato dal 7,5% di tutte le ricerche prima dell'introduzione della migliore corrispondenza al 12% ad aprile 2018. Poiché i sistemi di apprendimento automatico dipendono dall'input dell'utente per migliorare, l'aumento dell'uso dovrebbe consentire al sistema di "insegnare a se stesso" per diventare più prezioso per i suoi utenti nel tempo.

"Globale, il nuovo algoritmo Best-Match mostra un miglioramento significativo nella ricerca di informazioni rilevanti rispetto all'ordine temporale predefinito in PubMed, " hanno affermato gli autori. "Incoraggiamo gli utenti di PubMed a provare questa nuova ricerca di pertinenza e fornire input per aiutarci a continuare a migliorare il metodo di classificazione".

Il potere terrificante degli stereotipi – e come affrontarli

Tutti possiamo contribuire a migliorare la comunicazione per le persone con disabilità

Altro