• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • La routine quotidiana dei rumors:il machine learning decifra le fake news

    Credito:Pixabay/CC0 di dominio pubblico

    Ricerca pubblicata sull'International Journal of Cloud Computing esamina come l'apprendimento automatico potrebbe consentirci di analizzare la natura e le caratteristiche degli aggiornamenti dei social media e rilevare quali di questi aggiornamenti stanno aggiungendo grinta al mulino delle voci piuttosto che essere reali.

    Le fake news sono state con noi sin dal primo gossip trasmesso su una voce nel corso della giornata. Ma, con l'avvento dei social media, ora è molto più facile diffondere notizie false, disinformazione e propaganda a un vasto pubblico globale con pochi vincoli. Una voce può creare o distruggere una reputazione. In questi giorni, ciò potrebbe accadere in tutto il mondo attraverso l'amplificazione della camera dell'eco dei social media.

    Mohammed Al-Sarem, Muna Al-Harby, Faisal Saeed ed Essa Abdullah Hezzam della Taibah University di Medina, in Arabia Saudita, hanno esaminato i diversi approcci di pre-elaborazione del testo per avvicinarsi alle grandi quantità di dati che fluiscono quotidianamente dai social media . Il modo in cui questi approcci funzionano nella successiva analisi di rilevamento delle voci è fondamentale per individuare e fermare le notizie false. Il team ha testato vari approcci su un set di dati di tweet relativi a notizie politiche dall'Arabia Saudita.

    La preelaborazione può esaminare le tre caratteristiche più rilevanti di un aggiornamento prima che venga eseguita l'analisi del testo e suddividere di conseguenza i diversi aggiornamenti:in primo luogo, può esaminare l'uso dei punti interrogativi e dei punti esclamativi e il conteggio delle parole. In secondo luogo, può controllare se un account è verificato o ha proprietà più spesso associate a un account falso o bot, come il conteggio dei tweet, le risposte, i retweet, ecc. Terzo, può esaminare le funzionalità basate sull'utente, come l'utente nome e il logo o l'immagine del profilo dell'utente.

    I ricercatori hanno scoperto che la pre-elaborazione può migliorare significativamente l'analisi quando l'output viene inviato a qualsiasi classificatore di Support Vector Machine (SVM), multinomiale naïve Bayes (MNB) e K-nearest neighbor (KNN). Tuttavia, tali classificatori reagiscono in modo diverso a seconda della combinazione di tecniche di preelaborazione utilizzata. Ad esempio, rimuovere le stop word e pulire i tag di codifica, come HTML, stemming e tokenizzazione. + Esplora ulteriormente

    Uno studio mostra che gli utenti verificati sono tra i maggiori colpevoli quando si tratta di condividere notizie false




    © Scienza https://it.scienceaq.com