• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • AI Aristo fa il test di scienze, emerge una superstar a scelta multipla

    Attestazione:aristo

    Aristo ha superato un test di scienze americano di terza media. Se ti viene detto che Aristo è un ragazzo serio che ama leggere tutto ciò che può su Faraday e suona la batteria, dirai quindi cosa, grande affare.

    Aristo, anche se, è un programma di intelligenza artificiale e gli scienziati vorrebbero che il mondo sapesse che è un grosso problema, come "un punto di riferimento nello sviluppo dell'IA, "come lo chiamava Melissa Locker Azienda veloce .

    Noi intendiamo, basta pensarci. Cade Metz, in Il New York Times , ci ha pensato. "Quattro anni fa, più di 700 scienziati informatici hanno gareggiato in un concorso per costruire un'intelligenza artificiale in grado di superare un test di scienze di terza media. C'erano $ 80, 000 in premi in denaro sulla linea. Sono stati bocciati tutti. Anche il sistema più sofisticato non potrebbe fare meglio del 60% nel test. L'intelligenza artificiale non è stata in grado di eguagliare le abilità linguistiche e logiche che ci si aspetta che gli studenti abbiano quando entrano al liceo".

    Allora chi c'è dietro al test che nel 2019 ha finalmente impressionato? Non è una cattiva ipotesi:l'Allen Institute for Artificial Intelligence, che è supervisionato da Oren Etzioni. Il loro sistema aveva le risposte corrette per oltre il 90% delle domande del test, e non si ferma qui:il sistema ha ottenuto oltre l'80% delle risposte corrette su domande a scelta multipla senza diagramma in un esame di scienze di 12° grado.

    Ora stiamo osservando "progressi significativi nello sviluppo di un'intelligenza artificiale in grado di comprendere i linguaggi e imitare la logica e il processo decisionale degli esseri umani, " ha detto Metz.

    Per il racconto diretto, dovresti leggere "Da 'F' a 'A' negli esami di scienza di New York Regents:una panoramica del progetto Aristo, " che ora è su arXiv. Questo progetto era una missione di sei anni per rispondere agli esami di scienze delle scuole elementari e superiori.

    Gli autori erano ben consapevoli che l'intelligenza artificiale non aveva fatto uno spettacolo impressionante in passato esibendosi ai livelli desiderati. Con tutta la maestria dell'IA in Go, Poker e pericolo, loro hanno detto, "la ricca varietà di esami standardizzati è rimasta una sfida fondamentale. Anche nel 2016, il miglior sistema di intelligenza artificiale ha raggiunto solo il 59,3% in una sfida per l'esame di scienze di terza media."

    L'IA ha sostenuto test a scelta multipla; il numero del 90 percento era sul non diagramma dell'esame, domande a scelta multipla.

    Ecco il modo in cui l'AI2 descrive il suo mago non umano:"Aristo unisce la lettura delle macchine e la PNL, implicazione testuale e inferenza, ragionare con incertezza, tecniche statistiche su grandi corpora, e la comprensione dei diagrammi per sviluppare la prima "macchina informata" sulla scienza".

    Il team ha coccolato Aristo per un secondo fine, meno a darsi pacche sulle spalle e più su ciò che potrebbero imparare dai comportamenti di Aristo agli esami di scienze, "poiché queste domande mettono alla prova molte delle competenze chiave richieste per l'intelligenza delle macchine, " loro hanno detto.

    Nella loro carta, hanno spiegato di più sui buoni motivi per sfruttare gli esami di scienze standardizzati.

    "Test standardizzati, in particolare esami di scienze, sono un raro esempio di una sfida che soddisfa questi requisiti. Sebbene non sia un test completo dell'intelligenza della macchina, esplorano diverse capacità fortemente associate all'intelligenza, compresa la comprensione del linguaggio, ragionamento, e l'uso delle conoscenze di buon senso. Uno degli aspetti più interessanti e accattivanti degli esami di scienze è la loro natura graduata e multiforme; diverse domande esplorano diversi tipi di conoscenza, variando sostanzialmente in difficoltà. Per questa ragione, sono stati usati per molti anni come un compito avvincente e stimolante per il campo."

    Nuovi diritti di vanteria:Aristo, gli autori hanno detto, è il primo sistema a raggiungere un punteggio superiore al 90 percento sul non diagramma, parte a scelta multipla del New York Regents 8th Grade Science Exam.

    Stephen Johnson in Pensa in grande ha scritto sull'incapacità di Aristo di fare diagrammi. Ha detto che "il sistema è progettato solo per interpretare il linguaggio, il che significa che può rispondere a domande a scelta multipla, ma non quelli che presentano un'illustrazione o un grafico."

    Ciò nonostante, la performance ha mostrato che "i moderni metodi di PNL possono portare alla padronanza di questo compito".

    Per l'istituto, L'impresa di Aristo non è presa come un trespolo sulla montagna, ma piuttosto come un passo in una direzione desiderata. Lo chiamano una pietra miliare "sulla lunga strada verso una macchina che ha una profonda comprensione della scienza e realizza il sogno originale di Paul Allen di un Aristotele digitale".

    © 2019 Scienza X Rete




    © Scienza https://it.scienceaq.com