• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • L'algoritmo del rilevatore di notizie false funziona meglio di un essere umano

    Credito:CC0 Dominio Pubblico

    Un sistema basato su algoritmi che identifica indizi linguistici rivelatori nelle notizie false potrebbe fornire agli aggregatori di notizie e ai siti di social media come Google News una nuova arma nella lotta contro la disinformazione.

    I ricercatori dell'Università del Michigan che hanno sviluppato il sistema hanno dimostrato che è paragonabile e talvolta migliore degli umani nell'identificare correttamente le notizie false.

    In un recente studio, ha trovato con successo falsi fino al 76 percento delle volte, rispetto a un tasso di successo umano del 70 percento. Inoltre, il loro approccio di analisi linguistica potrebbe essere utilizzato per identificare articoli di notizie false che sono troppo nuovi per essere smentiti incrociando i loro fatti con altre storie.

    Rada Mihalcea, il professore di informatica e ingegneria della U-M dietro il progetto, ha affermato che una soluzione automatizzata potrebbe essere uno strumento importante per i siti che stanno lottando per affrontare un assalto di notizie false, spesso creati per generare clic o per manipolare l'opinione pubblica.

    Catturare storie false prima che abbiano conseguenze reali può essere difficile, come aggregatore e siti di social media oggi fanno molto affidamento su editori umani che spesso non riescono a tenere il passo con l'afflusso di notizie. Inoltre, le attuali tecniche di debunking spesso dipendono dalla verifica esterna dei fatti, che può essere difficile con le storie più recenti. Spesso, quando una storia si dimostra falsa, il danno è già stato fatto.

    L'analisi linguistica ha un approccio diverso, analizzare attributi quantificabili come la struttura grammaticale, scelta delle parole, punteggiatura e complessità. Funziona più velocemente degli umani e può essere utilizzato con una varietà di diversi tipi di notizie.

    "Puoi immaginare un numero qualsiasi di applicazioni per questo nella parte anteriore o posteriore di un sito di notizie o di social media, " Ha detto Mihalcea. "Potrebbe fornire agli utenti una stima dell'affidabilità di singole storie o di un intero sito di notizie. Oppure potrebbe essere una prima linea di difesa sul back-end di un sito di notizie, segnalando storie sospette per un'ulteriore revisione. Un tasso di successo del 76% lascia un margine di errore abbastanza ampio, ma può comunque fornire informazioni preziose quando viene utilizzato insieme agli umani".

    Gli algoritmi linguistici che analizzano il discorso scritto sono abbastanza comuni oggi, ha detto Mihalcea. La sfida per costruire un rilevatore di notizie false non sta nella costruzione dell'algoritmo stesso, ma nel trovare i dati giusti con cui addestrare quell'algoritmo.

    Le notizie false appaiono e scompaiono rapidamente, che rende difficile la raccolta. È disponibile anche in molti generi, complicando ulteriormente il processo di raccolta. notizie satiriche, Per esempio, è facile da raccogliere, ma il suo uso dell'ironia e dell'assurdità lo rendono meno utile per addestrare un algoritmo per rilevare notizie false che hanno lo scopo di fuorviare.

    In definitiva, Il team di Mihalcea ha creato i propri dati, crowdsourcing di un team online che ha decodificato notizie autentiche verificate in falsi. Ecco come vengono create la maggior parte delle fake news, Mihalcea ha detto, da individui che li scrivono rapidamente in cambio di una ricompensa monetaria.

    partecipanti allo studio, reclutato con l'aiuto di Amazon Mechanical Turk, sono stati pagati per diventare corti, notizie reali in notizie simili ma false, imitando lo stile giornalistico degli articoli. Alla fine del processo, il team di ricerca aveva un set di dati di 500 notizie vere e false.

    Hanno quindi alimentato queste coppie di storie etichettate a un algoritmo che ha eseguito un'analisi linguistica, l'insegnamento stesso distingue tra notizie vere e false. Finalmente, il team ha trasformato gli algoritmi in un set di dati di notizie reali e false estratte direttamente dal web, compensando il tasso di successo del 76%.

    I dettagli del nuovo sistema e il set di dati utilizzato dal team per costruirlo sono disponibili gratuitamente, e Mihalcea afferma che potrebbero essere utilizzati da siti di notizie o altre entità per costruire i propri sistemi di rilevamento di notizie false. Afferma che i sistemi futuri potrebbero essere ulteriormente perfezionati incorporando metadati come i collegamenti e i commenti associati a una determinata notizia online.

    Un documento che descrive in dettaglio il sistema sarà presentato il 24 agosto alla 27a Conferenza internazionale sulla linguistica computazionale a Santa Fe, N.M. Mihalcea ha lavorato con Veronica Perez-Rosas, assistente ricercatrice in informatica e ingegneria della U-M, ricercatore di psicologia Bennett Kleinberg presso l'Università di Amsterdam e studentessa universitaria UM Alexandra Lefevre.

    Il documento è intitolato "Rilevamento automatico di notizie false".


    © Scienza https://it.scienceaq.com