Un nuovo documento condotto dal Knowledge Lab fornisce una misura diversa degli influencer nella borsa di studio. Credito:Università di Chicago
Per secoli, scienziati e studiosi hanno misurato l'influenza degli individui e delle scoperte attraverso citazioni, una statistica grezza soggetta a distorsioni, politica e altre distorsioni. Un nuovo documento condotto dal Knowledge Lab dell'Università di Chicago descrive un modo diverso di tenere il punteggio nella scienza, una misura più diretta di come le idee influenti si propagano attraverso la borsa di studio e la cultura.
Il modello computazionale punta i riflettori sul lavoro che ha cambiato il percorso della scienza ma è rimasto sottovalutato. Lo stesso approccio può anche essere adattato per tracciare l'influenza in altre aree dove non esiste una cultura della citazione, come la letteratura o la musica, hanno detto gli autori del documento pubblicato la scorsa settimana in Atti dell'Accademia Nazionale delle Scienze .
"Stiamo misurando quanto gli scritti di scienziati e studiosi influenzino la discussione delle idee in futuro, " ha detto James Evans, direttore del Knowledge Lab e professore di sociologia all'UChicago. "L'influenza è un processo politicizzato; coloro che ottengono l'influenza, ottenere il credito, e quelli che ottengono il credito ottengono il capitale per fare la prossima grande cosa. Questa è la prima volta che abbiamo una maggiore capacità di identificare l'influenza, e anche per diagnosticare le influenze sociali e strategiche sul comportamento delle citazioni".
Il nuovo documento integra la precedente ricerca del Knowledge Lab utilizzando approcci computazionali e di apprendimento automatico su enormi raccolte di testo, sovvenzioni, recensioni, citazioni e dati scientifici per studiare come si formano le scoperte, evolversi e diventare ampiamente accettati. Il loro lavoro è stato recentemente presentato in una recensione sulla rivista Scienza , co-autore di Evans, che ha descritto come i metodi basati sui dati hanno approfondito la comprensione del processo scientifico e offerto nuove intuizioni su come realizzare in modo più efficiente importanti scoperte future.
Andare oltre le citazioni
In teoria, i riferimenti in un documento accademico consentono agli autori di accreditare i loro predecessori, i ricercatori e il lavoro su cui hanno costruito la loro nuova scoperta. Ma in pratica, le citazioni vengono scelte per molte ragioni:è più probabile che gli autori citino se stessi, potenti colleghi nel loro campo e ricercatori presso prestigiose istituzioni, e spesso tendono a citare articoli più recenti o già molto citati.
Nonostante queste imperfezioni, molti studi computazionali di influenza scientifica hanno utilizzato il record di citazione come un utile proxy. Il nuovo studio, guidato dall'ex ricercatore postdottorato del Knowledge Lab Aaron Gerow, mostra un romanzo, approccio più profondo, utilizzando sia il testo completo degli articoli che le informazioni esterne come l'identità dell'autore, affiliazione e reputazione della rivista.
Utilizzando un metodo computazionale noto come modellazione di argomenti, inventato dal coautore David Blei della Columbia University, il modello tiene traccia di "influenza discorsiva, " o parole e frasi ricorrenti attraverso testi storici che misurano come gli studiosi parlano effettivamente di un campo, invece delle loro attribuzioni. Per determinare l'influenza di un determinato documento, i ricercatori potrebbero rimuoverlo statisticamente dalla storia e vedere come si sarebbe svolto il discorso scientifico senza il suo contributo.
"Non solo possiamo scoprire come gli argomenti sono cambiati nel tempo, ma possiamo effettivamente simulare il futuro senza un dato documento del passato, e guarda come il discorso in avanti è stato diverso con e senza un dato documento, " disse Gerow, ora assistente professore alla Goldsmiths, Università di Londra. "Le citazioni sono un tipo di impatto, e l'influenza discorsiva è di un tipo diverso. Nessuno dei due è la storia completa, ma lavorano insieme per dare un quadro migliore di ciò che sta influenzando la scienza".
Addestrare il modello su enormi raccolte di testi dalla linguistica computazionale, fisica, e attraverso scienza e borsa di studio (JSTOR), gli autori quantificano vari pregiudizi e discernono modelli di influenza distinti. Gli scienziati che pubblicavano con insistenza in un singolo campo avevano maggiori probabilità di essere "canonizzati" in un modo che costringeva altri a citarli in modo sproporzionato rispetto ai contributi discorsivi dei loro articoli. D'altra parte, le scoperte che hanno attraversato i confini disciplinari avevano maggiori probabilità di avere un impatto discorsivo fuori misura ma meno citazioni, probabilmente perché il "proprietario" dell'idea ei suoi alleati rimangono socialmente e istituzionalmente distanti dall'autore citante.
Bellezze addormentate e influencer sconosciuti
Un'interessante sottocategoria di carta che il modello ha rilevato è nota come "bellezze addormentate, " o documenti che sono rimasti relativamente sconosciuti per anni o addirittura decenni prima di sperimentare un'esplosione tardiva di citazioni. Ad esempio, un documento del 1947 sul grafene rimase oscuro e dimenticato fino agli anni '90 con una rinascita dell'interesse per la ricerca sul materiale e un eventuale premio Nobel.
"I giornali hanno un ciclo di notizie, quando molte persone ne parlano e le citano, e poi non sono più nuove notizie, " Evans ha detto. "Il nostro modello mostra che alcuni documenti hanno molta più influenza di quanto le citazioni in genere dimostrino, come queste "belle addormentate, ' che non ha avuto molta influenza all'inizio, ma è diventato apprezzato e importante in seguito."
Lo stesso modello può essere utilizzato anche per tracciare l'influenza in altre aree, come la letteratura e la musica, hanno detto gli autori. Testo di poesie o testi di canzoni, e anche caratteristiche extra-testuali come la struttura delle strofe o le progressioni di accordi, potrebbe alimentare il modello per trovare influencer poco riconosciuti e mappare la diffusione di nuovi concetti e innovazioni.
"C'è un'enorme quantità di cultura letteraria che finisce per influenzare ogni genere di cose, ma che semplicemente non ha una tecnologia di riferimento simile alle citazioni, "Ha detto Evans. "Anche se abbiamo sviluppato e convalidato questo modello su testo scientifico, ora possiamo usarlo per qualsiasi cosa, soprattutto casi in cui non ci sono tracce di influenza ma modelli nel contenuto stesso. È come fare tendenza su Twitter, ma dove tutto è Twitter. Questa è la cosa più eccitante per me".