È molto probabile che tu abbia inviato o ricevuto un messaggio che è stato confuso grazie alla correzione automatica o al completamento automatico. Ci sono centinaia di meme in cui questi errori causano problemi di comunicazione, spesso con risultati esilaranti. Come questo. O questo. O questo.
Ma non è così divertente quando succede al tuo articolo scientifico. I documenti accademici includono spesso file supplementari con dati, tabelle e grafici a supporto della conclusione del paper. Molti di questi file sono fogli di calcolo.
Dal 2004, gli scienziati hanno notato che Microsoft Excel, il popolare programma per fogli di calcolo, ha la cattiva abitudine di cambiare alcuni nomi di geni in altri tipi di dati. Per esempio, i genetisti usano MARCH1 come scorciatoia per il dito di tipo CH ad anello associato alla membrana 1. Ma Excel interpreta MARCH1 come una data, convertendolo automaticamente in 1 marzo o un'altra designazione per il primo marzo.
Excel identifica erroneamente alcuni altri nomi di geni come coordinate o punti mobili. Potresti essere in grado di scoprire che 1 marzo è in realtà MARZO1, ma che ne dici di 2.31E+13? Ecco come Excel converte l'identificatore RIKEN 2310009E13. RIKEN è un enorme istituto di ricerca in Giappone che, tra l'altro, conduce progetti genomici. (Per il record, abbiamo provato a inserire l'identificatore RIKEN in un foglio di calcolo Excel e l'abbiamo convertito automaticamente in 2.31E+19, ancora sbagliato e ancora non quello che si intende in quei documenti accademici.)
Nonostante il fatto che i ricercatori abbiano identificato per la prima volta questo problema più di un decennio fa, persiste oggi. I ricercatori Mark Ziemann, Yotam Eren e Assam El-Osta ne hanno proiettati più di 35, 000 file supplementari per vedere quanto fosse effettivamente diffuso il problema. Hanno sviluppato un software automatizzato che cercava qualsiasi dato che sembrava potesse essere un elenco di nomi di geni. ne hanno individuati 7, 467 elenchi di geni che rappresentano i dati supplementari per 3, 597 articoli pubblicati in 18 diverse riviste. Si è scoperto che 704 di quei documenti pubblicati includevano file con errori di formato Excel al loro interno. Questo è un tasso di fallimento del 19,6 percento. In altre parole, quasi uno su cinque articoli pubblicati include file supplementari con errori di formattazione Excel al loro interno.
Questo non è solo un inconveniente. I ricercatori si affidano a lavori pubblicati per guidare i propri progetti. Se i file contengono errori, può essere difficile e dispendioso in termini di tempo risolvere il problema e trovare i dati pertinenti.
Perché non disattivare semplicemente le funzionalità di formattazione automatica? Secondo il gruppo di ricerca, non c'è modo di disabilitare in modo permanente le funzionalità in Excel. Potresti essere in grado di modificare manualmente ogni opzione ogni volta che crei un nuovo file, ma è inefficiente. hanno fatto notare, però, che Fogli Google non segue lo stesso approccio alla formattazione. Cosa c'è di più, se prima metti tutti i tuoi dati in Fogli Google e poi li copi in un altro programma di fogli di calcolo, la formattazione rimane intatta.
È un po' comico che una funzione destinata ad aiutare le persone a utilizzare i fogli di calcolo stia causando un tale mal di testa negli ambienti accademici. Forse le versioni future di Excel includeranno un'opzione per disabilitare le funzionalità di formattazione automatica a tempo indeterminato. Fino ad allora, i genetisti dovrebbero ricontrollare il loro lavoro o considerare il passaggio a Fogli Google.