Credito:CC0 Dominio Pubblico
Supporto decisionale strutturato:il progetto di ricerca "ArgumenText" nel campo dell'Ubiquitous Knowledge Processing ha trovato un modo per filtrare argomenti concreti pro e contro su qualsiasi argomento dal rumore di Internet.
Cercando su Google il termine di ricerca "Energia nucleare" su Internet si ottengono circa 268 milioni di risultati:Spiegazioni, definizioni, testi di lobby, articoli di giornale, aneddoti, teorie cospirazioniste. Come può qualcuno, per esempio un investitore, cercando veri argomenti pro e contro riguardo all'energia nucleare come aiuto decisionale, trovare quello che stanno cercando? Il progetto "ArgumenText" nell'ambito del Fachgebiet Ubiquitous Knowledge Processing (UKP) del Dipartimento di Informatica della TU Darmstadt ha lo scopo di filtrare argomenti concreti da masse di testo voluminose ed eterogenee.
Recentemente, è entrata in scena una demo del sistema di ricerca che ha già dimostrato la sua validità in occasione di fiere. Per esempio, chiunque ricerchi il tema dell'"Energia nucleare" lo farà, dopo pochi secondi, vedere poco meno di un centinaio di argomenti a favore e contro l'energia nucleare - da una varietà di siti Internet. La migliore CO 2 l'equilibrio e l'efficienza della generazione di energia atomica sono elencati qui, insieme alla tossicità e alla pericolosità delle sostanze utilizzate e ai lunghi periodi durante i quali emettono scorie radioattive nell'ambiente circostante. Le rispettive fonti sono collegate.
Per questo scopo, i testi disponibili su Internet vengono esaminati mediante reti neurali, classificato come pertinente o non pertinente all'argomento di ricerca, e poi sfruttato per gli argomenti. "Non vengono cercate solo singole parole, ma strutture grammaticali, vengono esaminati i contesti e la semantica per decidere se un'affermazione è un "argomento" o meno e se è a favore o contro, " spiega il dottor Johannes Daxenberger, che lavora nel team della Professoressa Iryna Gurevych come uno dei due project manager di ArgumenText.
Gli algoritmi alla base di ArgumenText sono in fase di sviluppo da parte del team nel campo stesso, basandosi su esperimenti iniziali iniziati nel 2014 con un corpo di saggi per studenti. "La sfida era rendere trasferibile a qualsiasi tipo di testo un sistema addestrato su un tipo specifico di testo, " dice il secondo project manager Dr. Christian Stab." Argomentazione in testi scientifici, Per esempio, è completamente diverso rispetto ai social media." Il team ha reso operativi vari modelli di teoria dell'argomentazione e ha insegnato ai sistemi informatici a utilizzare questi modelli. Per ottimizzare gli algoritmi, il team addetto a una potente rete di computer; un più piccolo, una rete di computer più potente in grado di indicizzare in modo efficiente i testi basati su Internet viene ora utilizzata per le operazioni in corso.
Dimostratore pubblico
Il dimostratore è stabile ed è recentemente diventato pubblicamente disponibile. Il progetto entra così nella fase successiva, che testerà specificamente quali applicazioni sono particolarmente promettenti per la nuova tecnologia. I principali gruppi target sono i decisori del mondo degli affari che devono valutare se vale la pena utilizzare un'innovazione, e giornalisti che devono raggiungere in modo rapido e affidabile il nocciolo di un argomento nel quadro di una ricerca, dice Daxenberger. "Pensiamo che il sistema potrebbe essere utilizzato con profitto in queste aree".
Ai fini della convalida, gli scienziati partecipanti stanno attualmente preparando il metodo per l'uso anche con testi in lingua tedesca. Ora, ArgumenText parla solo inglese, funziona con un corpus di testo dell'anno 2016 e funziona al meglio con le query tecniche. Questo cambierà presto. Sarà inoltre possibile effettuare ricerche in tempo reale nel numero sempre crescente di testi presenti su Internet.
Attualmente, l'algoritmo ordina le istruzioni in base all'affidabilità con cui possono fungere da argomenti. Gli scienziati stanno lavorando per l'aggregazione degli argomenti verso gli utenti, presentandoli per temi. "Questo è ovvio dal punto di vista dell'applicazione, ma di certo non banale dal punto di vista tecnico, " dice Stab. Argomento minerario, il riconoscimento di argomenti linguistici per mezzo dell'informatica, sta diventando sempre più importante e visibile, diciamo Daxenberger e Stab, nella ricerca di Digital Humanities. Il TU è stato attivo in questo settore fin dall'inizio. "Il nostro gruppo di lavoro ha ben e visibilmente stabilito il TU nel campo dell'argomento mining, "dice la professoressa Iryna Gurevych, capo dell'UKP. Per questo scopo, il team interdisciplinare collabora con il Dipartimento di Scienze Sociali e Storiche della TU, nonché con altre università della rete delle università del Reno-Meno.