Per identificare le notizie false, Il nuovo strumento di apprendimento automatico del Fraunhofer FKIE analizza sia il testo che i metadati. Attestazione:Fraunhofer FKIE
storie inventate, fatti distorti:le notizie false si stanno diffondendo a macchia d'olio su Internet e spesso vengono condivise senza pensarci, in particolare sui social. In risposta, I ricercatori Fraunhofer hanno sviluppato un sistema che analizza automaticamente i post sui social media, filtrando deliberatamente le notizie false e la disinformazione. Per fare questo, lo strumento analizza sia il contenuto che i metadati, classificandolo utilizzando tecniche di apprendimento automatico e attingendo all'interazione dell'utente per ottimizzare i risultati man mano che procede.
Le notizie false sono progettate per provocare una risposta specifica o incitare all'agitazione contro un individuo o un gruppo di persone. Il suo scopo è influenzare e manipolare l'opinione pubblica su temi mirati del giorno. Queste notizie false possono diffondersi a macchia d'olio su Internet, in particolare sui social media come Facebook o Twitter. Inoltre, identificarlo può essere un compito difficile. È qui che uno strumento di classificazione sviluppato dall'Istituto Fraunhofer per la comunicazione, Elaborazione delle informazioni ed ergonomia FKIE entra in gioco, analizzare automaticamente i post sui social media ed elaborare grandi quantità di dati.
Oltre all'elaborazione del testo, lo strumento include anche i metadati nella sua analisi e fornisce i suoi risultati in forma visiva. "Il nostro software si concentra su Twitter e altri siti web. I tweet sono dove trovi i link che puntano alle pagine web che contengono le vere notizie false. In altre parole, i social media fungono da trigger, se ti piace. Le notizie false sono spesso ospitate su siti Web progettati per imitare la presenza sul Web delle agenzie di stampa e possono essere difficili da distinguere dai siti autentici. In molti casi, si baseranno su notizie ufficiali, ma in cui la formulazione è stata modificata, " spiega il prof. Ulrich Schade del Fraunhofer FKIE, il cui gruppo di ricerca ha sviluppato lo strumento.
Schade e il suo team iniziano il processo costruendo librerie composte da notizie serie e anche testi che gli utenti hanno identificato come notizie false. Questi poi formano i set di apprendimento utilizzati per addestrare il sistema. Per filtrare le notizie false, i ricercatori utilizzano tecniche di apprendimento automatico che cercano automaticamente marcatori specifici nei testi e nei metadati. Ad esempio, in un contesto politico, potrebbero essere formulazioni o combinazioni di parole che raramente ricorrono nel linguaggio quotidiano o nei reportage giornalistici, come "l'attuale cancelliere della Germania". Anche gli errori linguistici sono una bandiera rossa. Ciò è particolarmente comune quando l'autore della notizia falsa scriveva in una lingua diversa dalla propria lingua madre. In tali casi, punteggiatura errata, ortografia, le forme verbali o la struttura della frase sono tutti avvertimenti di una potenziale notizia falsa. Altri indicatori potrebbero includere espressioni fuori luogo o formulazioni ingombranti.
"Quando forniamo al sistema una serie di marcatori, lo strumento insegnerà da solo a selezionare i marker che funzionano. Un altro fattore decisivo è la scelta dell'approccio di apprendimento automatico che fornirà i migliori risultati. È un processo che richiede molto tempo, perché devi eseguire i vari algoritmi con diverse combinazioni di marker, "dice Schade.
I metadati forniscono indizi vitali
I metadati vengono utilizzati anche come marker. Infatti, svolge un ruolo cruciale nella differenziazione tra fonti di informazione autentiche e notizie false:ad esempio, con quale frequenza vengono pubblicati i post, quando è programmato un tweet, e a che ora? Il tempismo di un post può essere molto significativo. Ad esempio, può rivelare il paese e il fuso orario dell'autore della notizia. Un'alta frequenza di invio suggerisce bot, che aumenta la probabilità di una notizia falsa. I social bot inviano i loro link a un numero enorme di utenti, ad esempio per diffondere incertezza tra il pubblico. Anche le connessioni e i follower di un account possono rivelarsi terreno fertile per gli analisti.
Questo perché consente ai ricercatori di costruire mappe termiche e grafici dei dati inviati, inviare reti di frequenza e follower. Queste strutture di rete e i loro singoli nodi possono essere utilizzati per calcolare quale nodo della rete ha fatto circolare una notizia falsa o ha avviato una campagna di notizie false.
Un'altra caratteristica dello strumento automatizzato è la sua capacità di rilevare l'incitamento all'odio. I post che si spacciano per notizie ma includono anche incitamento all'odio spesso si collegano a notizie false. "L'importante è sviluppare un marcatore in grado di identificare casi chiari di incitamento all'odio. Gli esempi includono espressioni come 'feccia politica' o 'negro', "dice il linguista e matematico.
I ricercatori sono in grado di adattare il loro sistema a vari tipi di testo per classificarli. Sia gli enti pubblici che le imprese possono utilizzare lo strumento per identificare e combattere le fake news. "Il nostro software può essere personalizzato e formato per soddisfare le esigenze di qualsiasi cliente. Per gli enti pubblici, può essere un utile sistema di allerta precoce, "dice Schade.