• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Un modello per prevedere la dimensione e la forma dei thread di commenti online

    Esempio di un processo di ramificazione Hawkes. Il nodo rosso (all'estrema sinistra) rappresenta un post sui social media. I nodi verdi e blu rappresentano rispettivamente gli eventi "immigrati" e "figli". Credito:Krohn &Weninger, adattato con il permesso dal lavoro di Medvedev et al.

    Su piattaforme di social media come Reddit e Twitter le persone possono esprimere le proprie opinioni e prendere parte a discussioni su una varietà di argomenti. Questo viene generalmente fatto nei thread di commento, che consentono agli utenti di commentare i post esistenti.

    Un thread di commenti è essenzialmente una conversazione tra diversi utenti online sotto forma di commenti. Nell'informatica, i thread di commento sono spesso considerati "alberi, " con nodi che rappresentano il post originale e i commenti successivi, e bordi diretti che rappresentano relazioni "risposta a".

    Due ricercatori dell'Università di Notre Dame hanno recentemente sviluppato un modello per prevedere la dimensione e la forma dei thread di commenti online quando li si visualizza come alberi. Hanno chiamato questo modello, introdotto in un documento pre-pubblicato su arXiv, il modello di previsione del thread di commenti (CTPM).

    "Il nostro principale obiettivo di ricerca è prevedere la dimensione e la forma di un thread di commenti sui siti di social media, "Tim Weninger, uno dei ricercatori che ha condotto lo studio, ha detto a TechXplore. "Questi siti consentono agli utenti di pubblicare notizie o immagini o altri contenuti. Poi ad altri utenti piace, condividi o commenta il post. Siamo interessati principalmente ai thread di commento, dove un utente può commentare il post stesso o rispondere a commenti come su Reddit e Twitter (ma non su Facebook o YouTube)."

    Lo studio condotto da Weninger e dalla sua collega Rachel Krohn è stato finanziato da un programma della DARPA (Defence Advanced Research Project Agency) degli Stati Uniti, che si concentra specificamente sulla simulazione sociale. Una delle domande poste da questo programma è se sia possibile simulare l'attività sui social media.

    Studi precedenti suggeriscono che le prime ore di vita di un post sono di vitale importanza per prevedere la sua futura popolarità. Infatti, i post che ricevono molta attenzione all'inizio e vengono immediatamente commentati dagli utenti generalmente innescano ulteriori discussioni online in futuro. D'altra parte, i post che inizialmente non ricevono molta attenzione tendono ad attirare meno attenzione anche in futuro.

    La maggior parte delle tecniche esistenti progettate per prevedere la dimensione e la forma dei thread dei commenti funzionano osservando i primi commenti aggiunti a un post e quindi creando un modello predittivo. Però, poiché la maggior parte dei thread di commenti è relativamente piccola, l'attesa della generazione di nuovi dati può compromettere l'obiettivo generale dell'attività di previsione.

    Il programma DARPA che finanzia lo studio ha quindi incaricato specificamente i ricercatori di indagare sulla possibilità di prevedere la popolarità di un post, compreso il numero di commenti che susciterebbe in futuro, basandosi esclusivamente sul suo titolo. Con questo obiettivo in mente, il team ha sviluppato un modello che analizza le parole nel titolo di un post di Reddit, insieme all'utente del post e al subreddit a cui è stato inviato. Queste variabili vengono utilizzate per creare un "processo Hawkes, "un modello statistico utilizzato per rappresentare punti matematici nello spazio.

    "Utilizziamo un processo Hawkes per simulare il modo in cui le persone visualizzano il post, leggi un commento, e poi decidere di rispondere ad ogni commento, " ha detto Weninger. "Il modello non è perfetto e in realtà non simula il contenuto dei commenti (cioè non indoviniamo cosa dice effettivamente il commento, solo se c'è un commento o meno), però, in media facciamo un buon lavoro nel prevedere quali commenti saranno popolari e quali non lo saranno solo in base al titolo, autore e subreddit di un post."

    Weninger e i suoi colleghi hanno valutato il modello CTPM su migliaia di discussioni di utenti reali tratte da Reddit, confrontando la sua efficacia nel prevedere la dimensione e la forma dei thread di commento con quella di altre tecniche. Sorprendentemente, il loro modello ha notevolmente superato tutti i modelli esistenti e le linee di base con cui è stato confrontato.

    "Per me il contributo più significativo di questo lavoro è la capacità del nostro modello di prevedere la dimensione e la forma delle conversazioni online, " Ha detto Weninger. "Questo è importante per le forze dell'ordine e le agenzie di difesa statunitensi perché essere in grado di prevedere il futuro nel cyberspazio consente a queste agenzie di preparare difese efficaci contro attacchi informatici e altri eventi che spesso si spostano dal mondo cibernetico al mondo fisico. "

    Nel futuro, il modello proposto da Weninger e dai suoi colleghi potrebbe essere utilizzato per prevedere la popolarità dei post su Twitter o Reddit basandosi esclusivamente sul loro titolo. Il team ora prevede di continuare a indagare su come gli esseri umani consumano e curano le informazioni online, comprese le loro interazioni con i post di altri (ad es. Mi piace, azioni, retweet, eccetera.).

    "I mi piace, azioni, voti positivi, e i retweet forniti dagli utenti sono la cosa più importante per le società di social media perché indicano quali contenuti promuovere e quali potrebbero essere spam o di bassa qualità, " Weninger ha detto. "Studiamo questi processi e come possono essere corrotti da individui o gruppi con cattive intenzioni. Il nostro lavoro futuro in quest'area esaminerà le manipolazioni dei contenuti sociali (ad esempio alterazioni dell'immagine, photoshop, deepfake, eccetera.), in quanto possiamo imparare molto sulle persone e sulla loro cultura osservando come alterano le immagini nei social media".

    © 2019 Scienza X Rete




    © Scienza https://it.scienceaq.com