• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Un nuovo studio esplora l'umorismo negli incorporamenti di parole

    Rappresentazione dei cluster individuati dai ricercatori. Credito:Gultchin et al.

    I progressi nel campo dell'IA hanno consentito lo sviluppo di strumenti in grado di comprendere una varietà di linguaggi e comunicare con gli esseri umani. Però, ci sono ancora aspetti della comunicazione umana con cui i sistemi di intelligenza artificiale lottano, uno dei quali è l'umorismo.

    Un team di ricercatori dell'Università di Oxford, Microsoft Research e TRASH hanno recentemente condotto uno studio sull'umorismo negli incorporamenti di parole. Gli incorporamenti di parole sono un popolare strumento di intelligenza artificiale che può associare parole a vettori euclidei.

    "Eravamo interessati a studiare come i computer potessero comprendere l'umorismo, "Adam Kalai, Il ricercatore Microsoft che ha condotto lo studio, ha detto a TechXplore. "Mentre l'intelligenza artificiale è abbastanza potente e può persino tradurre da una lingua all'altra, L'intelligenza artificiale non è riuscita a capire l'umorismo. Abbiamo deciso di testare se l'intelligenza artificiale fosse in grado di comprendere l'umorismo a livello di una singola parola, dal momento che molte persone trovano alcune parole come 'imbecille' un po' divertenti."

    Nel loro studio, Kalai e i suoi colleghi hanno preso in considerazione sei caratteristiche principali dell'umorismo delle parole, traendo ispirazione dalle teorie esistenti e dalle discussioni accademiche sull'umorismo. Queste caratteristiche includono:suoni umoristici (indipendentemente dal significato), giustapposizioni/incongruenze impreviste, connotazioni sessuali, connotazioni scatologiche, parole offensive e parole colloquiali.

    I ricercatori hanno studiato la misura in cui queste caratteristiche sono correlate all'umorismo e quanto bene un incorporamento di word2vec pre-addestrato su un corpus di Google News, chiamato GNEWS, potrebbe catturare ciascuno di questi. Un set di dati utilizzato nel loro studio era il set di dati di Engelthaler-Hill (EH), che consiste in valutazioni umoristiche medie per 4, 997 parole, ognuno dei quali è stato valutato su una scala da uno a cinque (da circa 35 valutatori umani).

    Per comprendere meglio le differenze nella percezione delle persone delle parole divertenti, i ricercatori hanno anche raccolto un set di dati originale più piccolo di parole altamente umoristiche, reclutare persone di lingua inglese per etichettare queste parole tramite la piattaforma Mechanical Turk di Amazon. Hanno condotto una serie di studi sulla valutazione dell'umorismo, chiedendo ai partecipanti di selezionare le parole che hanno trovato più divertenti, così come annotare le parole con le teorie umoristiche pertinenti per ciascuna.

    Figura che descrive la relazione tra le caratteristiche relative alle teorie delle parole nell'incorporamento di parole e le rispettive valutazioni dell'umorismo. Credito:Gultchin et al.

    "Abbiamo chiesto a più persone di valutare quali parole hanno trovato più divertenti tra le parole inglesi, " ha spiegato Kalai. "Abbiamo progettato uno studio in cui le persone identificavano le parole che trovavano più divertenti con il minimo sforzo (meno clic)."

    Successivamente, i ricercatori hanno studiato come le caratteristiche dell'umorismo che avevano inizialmente identificato correlassero con le valutazioni dell'umorismo nel loro set di dati, per determinare l'efficacia dei costrutti teorici nel catturare le valutazioni fornite dagli esseri umani. Inoltre, hanno testato la prevedibilità di queste valutazioni utilizzando word embedding, esplorando la misura in cui l'IA può comprendere l'umorismo.

    "Abbiamo scoperto che l'intelligenza artificiale poteva capire perché le persone trovavano alcune parole più divertenti di altre, e l'intelligenza artificiale potrebbe persino capire le differenze tra i sensi dell'umorismo, " ha detto Kalai. "AI ancora non capisce l'umorismo in frasi o testi più lunghi, ma speriamo che il nostro lavoro sia un punto di partenza".

    Kalai e i suoi colleghi hanno scoperto che gli incorporamenti di parole catturano efficacemente gli aspetti dell'umorismo delle parole come valutato nel set di dati EH, così come le differenze nelle valutazioni dell'umorismo dal loro nuovo set di dati. Le loro scoperte suggeriscono inoltre che il senso dell'umorismo delle persone potrebbe essere incorporato utilizzando una manciata di valutazioni e che le incorporazioni risultanti potrebbero essere utilizzate per prevedere le valutazioni dell'umorismo per parole precedentemente non classificate.

    "Le nostre conclusioni mostrano un'interessante applicazione degli incorporamenti di parole e aprono la strada allo sfruttamento di questi per fare più lavoro sull'umorismo dell'intelligenza artificiale, come generare o prevedere parole umoristiche corrispondenti ai sensi dell'umorismo individuali, e in aggregato, "Limor Gultchin, un ricercatore dell'Università di Oxford coinvolto nello studio, ha detto a TechXplore. "Allo stesso tempo, forniamo anche un'ulteriore convalida alle nozioni intuitive di umorismo, e conoscenze raccolte in altri campi, come la psicologia o la filosofia».

    Lo studio condotto da Kalai, Gultchin e i loro colleghi mostrano che l'incorporamento di parole potrebbe migliorare la nostra comprensione dell'umorismo in vari modi. in primo luogo, hanno scoperto che teorie consolidate dell'umorismo (ad esempio la teoria della superiorità, teoria dell'incongruenza, ecc.) sono rappresentati a vari livelli in incorporamenti di parole e possono quindi essere utilizzati per identificare o prevedere l'umorismo, catturato da valutazioni umane.

    Tabella che cattura le differenze tra un senso dell'umorismo più "femminile" e un senso dell'umorismo "maschile". Credito:Gultchin et al.

    Utilizzando rappresentazioni vettoriali di parole, i ricercatori sono stati anche in grado di definire un senso dell'umorismo individuale come un vettore medio, usare questi vettori per prevedere il senso dell'umorismo di persone diverse (cioè le valutazioni dell'umorismo che darebbero a determinate parole). Finalmente, il raggruppamento dei sensi dell'umorismo ha permesso loro di identificare i gruppi di umorismo, come "umorismo femminile, ''umorismo maschile, ''antico umorismo, ' eccetera.

    Questa è una scoperta importante, in quanto convalida l'idea che diversi gruppi di persone abbiano diversi sensi dell'umorismo. Ad esempio, hanno osservato che le parole sessuali (ad esempio "poppycock") erano più divertenti per gli uomini che per le donne, mentre le donne hanno reagito di più alle parole "divertenti" (ad esempio "gobbledegook").

    "Nell'era dei sistemi di IA prevalenti, come sistemi di raccomandazione o assistenti automatizzati, l'umorismo si dimostrerebbe probabilmente importante nel facilitare una più agevole, interazione più fluida tra utenti e sistemi automatizzati, " Gultchin ha detto. "Speriamo che questo lavoro possa essere di aiuto come prova del concetto che mostra che gli strumenti di PNL esistenti possono già aiutarci a raggiungere questo obiettivo".

    Kalain, Gultchin e i suoi colleghi renderanno disponibili pubblicamente i nuovi set di dati utilizzati nel loro studio, in modo che altri ricercatori possano utilizzarli nei loro studi. Ritengono che migliorare la comprensione dell'umorismo delle parole da parte dei sistemi di intelligenza artificiale potrebbe aprire diverse possibilità interessanti, per esempio portando allo sviluppo di strumenti per assistere i comici o migliorando le interazioni tra macchine ed esseri umani.

    "Siamo ancora in attesa di vedere come verrà accettato questo lavoro, ma esistono più direzioni future, " ha detto Gultchin. "Sarebbe davvero interessante vedere se i concetti qui esposti potrebbero davvero essere utilizzati in un sistema interattivo che produce modifiche "divertenti" alle frasi basate sul senso dell'umorismo di un individuo, come rappresentato utilizzando word embedding. Un'altra direzione interessante è vedere se alla fine possiamo imparare a prevedere e generare frasi umoristiche complete o, con i recenti sviluppi, paragrafi pieni di umorismo."

    © 2019 Scienza X Rete




    © Scienza https://it.scienceaq.com