Un vero articolo scientifico (dal set di dati KDD Cup) con citazioni note è stato utilizzato per dimostrare come l'algoritmo potrebbe generare raccomandazioni per i ricercatori che cercano informazioni in un campo correlato. La figura mostra le prime 15 citazioni consigliate dalla metrica. Di queste 15 citazioni previste, cinque di esse (contrassegnate con asterischi) erano citazioni effettive dall'articolo. In confronto, altri metodi non sono riusciti a prevedere nessuna delle citazioni effettive. I segmenti colorati nelle “proporzioni argomento” indicano la probabilità che un articolo appartenga a un argomento specifico. Credito:Annali di statistica applicata
Uno statistico NUS ha sviluppato una metrica che tiene conto automaticamente delle variazioni di citazione in diverse discipline per misurare il merito di ricerca di articoli scientifici.
Il merito (impatto) della ricerca degli articoli scientifici è spesso utilizzato come uno dei parametri per giudicare la qualità dei risultati della ricerca. Questo di solito è ottenuto dalle citazioni di lavori di ricerca già pubblicati sulla rivista. Però, diverse discipline accademiche hanno comportamenti di ricerca e pratiche di citazione differenti. Per esempio, gli articoli in determinate discipline (ad esempio la matematica) hanno generalmente citazioni basse mentre altri campi (ad esempio la biologia molecolare) in confronto hanno una media di più citazioni. Quindi, un confronto della qualità della ricerca tra diverse discipline basato su conteggi di citazioni grezze non rifletterebbe accuratamente il merito della ricerca.
Prof Linda TAN del Dipartimento di Statistica e Probabilità Applicata, NUS ha sviluppato una metrica a livello di articolo, denominata "metrica di visibilità adattata per argomento", che è in grado di tenere conto automaticamente della variazione delle attività di citazione tra i diversi campi di ricerca. Lo calcola senza utilizzare le classificazioni di campo esistenti etichettate per il singolo articolo ma utilizzando una rete complessa contenente attributi appartenenti all'articolo selezionato. Ogni articolo non deve necessariamente appartenere a un singolo campo ma può appartenere a più campi con vari gradi. Ciò può fornire un indicatore migliore per confrontare le singole pubblicazioni scientifiche in diversi campi. Il team di ricerca ha anche sviluppato un efficiente algoritmo di calcolo utilizzando questa metrica per aiutare i ricercatori accademici con consigli sugli articoli.
Il professor Tan ha detto, "Quando il nostro metodo viene applicato al set di dati di benchmarking della KDD Cup 2003 (knowledge discovery and data mining competition) che ha circa 30, 000 articoli di fisica delle alte energie, ha dimostrato prestazioni migliori per i consigli sugli articoli essendo più accurato nel prevedere le citazioni effettive dagli articoli di prova, rispetto ad altri modelli disponibili."