• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Il linguaggio lo rivela:come un algoritmo può aiutarci a rilevare le notizie false

    Nel tentativo di affrontare il crescente problema delle fake news online, un algoritmo che identifica i modelli nel linguaggio può aiutare a distinguere tra articoli di notizie fattuali e imprecisi. Credito:Shutterstock

    Hai mai letto qualcosa online e condiviso tra le tue reti, solo per scoprire che era falso?

    In qualità di ingegnere informatico e linguista computazionale che trascorre la maggior parte del suo lavoro e anche le ore di svago davanti allo schermo di un computer, Sono preoccupato per quello che leggo online. Nell'era dei social, molti di noi consumano fonti di notizie inaffidabili. Siamo esposti a un flusso selvaggio di informazioni nei nostri social network, specialmente se passiamo molto tempo a scansionare i post casuali dei nostri amici su Twitter e Facebook.

    Io e i miei colleghi del Discourse Processing Lab della Simon Fraser University abbiamo condotto ricerche sulle caratteristiche linguistiche delle fake news.

    Gli effetti delle fake news

    Uno studio nel Regno Unito ha rilevato che circa i due terzi degli adulti intervistati leggono regolarmente notizie su Facebook, e che la metà di quelli ha avuto l'esperienza di credere inizialmente a una notizia falsa. Un altro studio, condotto da ricercatori del Massachusetts Institute of Technology, si è concentrato sugli aspetti cognitivi dell'esposizione a notizie false e ha scoperto che, in media, i lettori di notizie credono a un titolo di notizie false almeno il 20 percento delle volte.

    Le storie false si stanno diffondendo 10 volte più velocemente delle notizie vere e il problema delle notizie false minaccia seriamente la nostra società.

    Per esempio, durante le elezioni del 2016 negli Stati Uniti, un numero sorprendente di cittadini statunitensi credeva e condivideva una cospirazione palesemente falsa sostenendo che Hilary Clinton fosse collegata a un giro di traffico di esseri umani gestito da una pizzeria. Il proprietario del ristorante ha ricevuto minacce di morte, e un credente si è presentato al ristorante con una pistola. Questa - e una serie di altre notizie false distribuite durante la stagione elettorale - ha avuto un impatto innegabile sui voti delle persone.

    Spesso è difficile trovare l'origine di una storia dopo i gruppi partigiani, i bot dei social media e gli amici degli amici l'hanno condiviso migliaia di volte. I siti Web di verifica dei fatti come Snopes e Buzzfeed possono affrontare solo una piccola parte delle voci più popolari.

    La tecnologia alla base di Internet e dei social media ha consentito questa diffusione di disinformazione; forse è il momento di chiedersi cosa ha da offrire questa tecnologia nell'affrontare il problema.

    In un'intervista, Hilary Clinton parla di Pizzagate e del problema delle fake news online.

    Omaggi nello stile di scrittura

    I recenti progressi nell'apprendimento automatico hanno permesso ai computer di completare istantaneamente attività che avrebbero richiesto molto più tempo agli esseri umani. Per esempio, ci sono programmi per computer che aiutano la polizia a identificare i volti criminali in pochi secondi. Questo tipo di intelligenza artificiale allena algoritmi per classificare, individuare e prendere decisioni.

    Quando l'apprendimento automatico viene applicato all'elaborazione del linguaggio naturale, è possibile costruire sistemi di classificazione del testo che riconoscono un tipo di testo da un altro.

    Negli ultimi anni, gli scienziati dell'elaborazione del linguaggio naturale sono diventati più attivi nella costruzione di algoritmi per rilevare la disinformazione; questo ci aiuta a comprendere le caratteristiche delle fake news e a sviluppare la tecnologia per aiutare i lettori.

    Un approccio trova importanti fonti di informazione, assegna a ciascuna fonte un punteggio di credibilità e poi li integra per confermare o smentire una determinata affermazione. Questo approccio dipende fortemente dal rintracciare la fonte originale delle notizie e dal valutare la sua credibilità in base a una varietà di fattori.

    Un secondo approccio esamina lo stile di scrittura di un articolo di notizie piuttosto che la sua origine. Le caratteristiche linguistiche di uno scritto possono dirci molto sugli autori e sui loro motivi. Per esempio, parole e frasi specifiche tendono a comparire più frequentemente in un testo ingannevole rispetto a uno scritto onestamente.

    Individuazione di notizie false

    La nostra ricerca identifica le caratteristiche linguistiche per rilevare le notizie false utilizzando l'apprendimento automatico e la tecnologia di elaborazione del linguaggio naturale. La nostra analisi di un'ampia raccolta di articoli di notizie verificati su una varietà di argomenti mostra che, in media, gli articoli di notizie false utilizzano più espressioni comuni nell'incitamento all'odio, così come le parole legate al sesso, morte e ansia. Notizia genuina, d'altra parte, contiene una proporzione maggiore di parole relative al lavoro (affari) e al denaro (economia).

    Ciò suggerisce che un approccio stilistico combinato con l'apprendimento automatico potrebbe essere utile per rilevare notizie sospette.

    Il nostro rilevatore di notizie false è costruito sulla base di caratteristiche linguistiche estratte da un ampio corpo di articoli di notizie. Prende un pezzo di testo e mostra quanto sia simile alle notizie false e alle notizie reali che ha visto prima. (Provalo!)

    La sfida principale, però, è costruire un sistema in grado di gestire la vasta gamma di argomenti delle notizie e il rapido cambio di titoli online, perché gli algoritmi informatici imparano dai campioni e se questi campioni non sono sufficientemente rappresentativi delle notizie online, le previsioni del modello non sarebbero affidabili.

    Un'opzione è che esperti umani raccolgano ed etichettino una grande quantità di articoli di notizie false e reali. Questi dati consentono a un algoritmo di apprendimento automatico di trovare caratteristiche comuni che continuano a verificarsi in ogni raccolta indipendentemente dalle altre varietà. In definitiva, l'algoritmo sarà in grado di distinguere con sicurezza tra articoli di notizie reali o falsi inediti.

    Questo articolo è stato ripubblicato da The Conversation con una licenza Creative Commons. Leggi l'articolo originale.




    © Scienza https://it.scienceaq.com