• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Ripulire i social media con l'apprendimento automatico

    Credito:CC0 di pubblico dominio

    Lo spam di contenuti per adulti o pornografici è un problema crescente sui social media. Nuova ricerca sull'International Journal of Business Intelligence and Data Mining discute come tale contenuto potrebbe essere rilevato e rimosso rapidamente in modo tempestivo.

    Deepali Dhaka, Surbhi Kakar e Monica Mehrotra di Jamia Millia Islamia (Central University) a Jamia Nagar, Nuova Delhi, India, spiegano come l'esperienza utente generale e quella dei giovani che utilizzano i social media potrebbero essere migliorate se si possono filtrare contenuti spam osceni in modo efficace e veloce. Gli strumenti di apprendimento automatico sono spesso la via da seguire per rilevare particolari tipi di contenuto e il team ha dimostrato che uno di questi strumenti, XGboost, è in grado di rilevare il contenuto di spam per adulti con una precisione superiore al 90%. Questo è stato l'algoritmo di classificazione più efficace dei sei testati e adattati dal team per rilevare lo spam pornografico su Twitter.

    Pertanto, meno di dieci aggiornamenti ogni cento segnalati come spam per adulti sarebbero falsi positivi. L'approccio del team doveva analizzare solo un piccolo numero di caratteristiche, sistema di valori, entropia delle parole, diversità lessicale e incorporamenti di parole, per poter estrarre gli aggiornamenti di spam per adulti dal flusso generale di aggiornamenti su uno dei più noti piattaforme di social media, Twitter.

    Inerente al rilevamento positivo è che, in generale, gli utenti quotidiani della piattaforma discutono un'ampia varietà di argomenti in contesti diversi e scrivono e condividono in quello che potrebbe essere definito un modo organico. Al contrario, gli spammer e gli spammer pornografici, in questo caso, tendono ad avere un approccio fisso o addirittura completamente automatizzato ai loro aggiornamenti, una limitata diversità di argomenti, come ci si aspetterebbe, e un lessico molto limitato. Queste e altre caratteristiche dei messaggi di spam, li rendono riconoscibili dall'algoritmo. + Esplora ulteriormente

    Twitter afferma di rimuovere 1 milione di account di spam al giorno




    © Scienza https://it.scienceaq.com