• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Un metodo basato sul deep learning per rilevare il cyberbullismo su Twitter

    L'architettura del sistema. Credito:Al-Ajlan &Ykhlef.

    Ricercatori della King Saud University, In Arabia Saudita, hanno sviluppato un nuovo approccio per rilevare il cyberbullismo su Twitter utilizzando il deep learning chiamato OCDD. In contrasto con altri approcci di apprendimento profondo, che estraggono funzionalità dai tweet e le inviano a un classificatore, il loro metodo rappresenta un tweet come un insieme di vettori di parole.

    Negli ultimi anni, il cyberbullismo sui social media è diventato un problema enorme e ampiamente discusso. Il cyberbullismo comporta l'uso di canali di comunicazione online per intimidire altri utenti inviando messaggi intimidatori, messaggi minacciosi o offensivi. Ciò può avere conseguenze psicologiche e talvolta pericolose per la vita delle vittime.

    I ricercatori di tutto il mondo hanno cercato di sviluppare nuovi modi per rilevare il cyberbullismo, gestirlo e ridurne la diffusione sui social media. Molti approcci di deep learning per identificare il cyberbullismo funzionano analizzando le caratteristiche testuali e utente. Però, queste tecniche hanno diverse limitazioni, che possono ridurre notevolmente le loro prestazioni.

    Ad esempio, alcuni di questi approcci cercano di migliorare il rilevamento introducendo nuove funzionalità. Tuttavia, aumentare il numero di funzionalità può complicare le fasi di estrazione e selezione delle funzionalità. Inoltre, questi approcci non considerano che alcuni dati utente, come età e data di nascita, può essere facilmente fabbricato. Per affrontare i limiti dei metodi di rilevamento del cyberbullismo esistenti, Monirah A. Al-Ajlan e Mourad Ykhlef, due ricercatori della King Saud University, ha proposto un nuovo approccio chiamato rilevamento ottimizzato del cyberbullismo su Twitter (OCDD).

    "A differenza del lavoro precedente in questo campo, OCDD non estrae le funzionalità dai tweet e le invia a un classificatore:piuttosto, rappresenta un tweet come un insieme di vettori di parole, " spiegano i ricercatori nel loro articolo, pubblicato su IEEE Explore e presentato al 21 ns Conferenza nazionale sui computer della Saudi Computer Society (NCC). "In questo modo, la semantica delle parole è preservata, e le fasi di estrazione e selezione delle caratteristiche possono essere eliminate."

    Al-Ajlan e Ykhlef hanno costruito il loro approccio su dati di addestramento etichettati e hanno generato incorporamenti di parole per singole parole utilizzando GloVe, un algoritmo di apprendimento non supervisionato in grado di ottenere rappresentazioni vettoriali per le parole. Questi word embedding vengono quindi inviati a una rete neurale convoluzionale (CNN) per rilevare se potrebbero essere associati al cyberbullismo.

    Gli algoritmi della CNN sono tipicamente costituiti da un livello di input e di output, così come molti altri strati. L'impostazione manuale dei parametri per ciascuno di questi livelli può essere un'attività impegnativa e dispendiosa in termini di tempo. I ricercatori hanno quindi deciso di incorporare un algoritmo di ottimizzazione metaeuristica nel loro modello, che può facilitare questo processo identificando valori ottimali o quasi ottimali da utilizzare per la classificazione.

    "OCDD fa avanzare lo stato attuale del rilevamento del cyberbullismo eliminando il difficile compito di estrazione/selezione delle funzionalità e sostituendolo con vettori di parole che catturano la semantica delle parole e la CNN che classifica i tweet in un modo più intelligente rispetto ai tradizionali algoritmi di classificazione, " scrivono i ricercatori nel loro paper.

    Quando testato su attività di estrazione di testo, OCDD ha ottenuto risultati molto promettenti. Però, deve ancora essere implementato e valutato nei contesti di rilevamento del cyberbullismo. I ricercatori stanno ora progettando di adattare il loro approccio in modo che possa analizzare anche il testo in arabo.

    © 2019 Science X Network




    © Scienza https://it.scienceaq.com