Credito:CC0 Dominio Pubblico
Google, dal primo giorno, è diventato grande entrando nel business della ricerca di informazioni. Anni dopo, Google sta parlando seriamente di set di dati. Google sta lanciando un nuovo motore di ricerca per aiutare gli scienziati a trovare i set di dati di cui hanno bisogno.
Di mercoledì, Natasha Noy, ricercatrice di Google AI, ha annunciato il lancio di Dataset Search da parte di Google. Ora puoi accedere facilmente ai set di dati, se sei scienziato, o semplicemente "geek" dei dati in un altro tipo di inseguimento, alla ricerca di dati per il tuo lavoro e per le tue storie e per la tua curiosità intellettuale.
L'obiettivo è offrirti più di un'unica interfaccia. Jon Fingas in Engadget ha esaminato come può avvantaggiare la ricerca dei dati.
"Lo strumento fornisce un accesso più diretto ai dati presentati in uno standard aperto che chiarisce chi ha creato le informazioni, come è stato raccolto e come è consentito utilizzarlo. Non solo puoi rintracciare i dati climatici per un rapporto, ma assicurati che sia pertinente e legale da usare."
Questa è una spinta globale (come in quella internazionale) che funziona in più lingue con il supporto per altre lingue in arrivo. James Vincent in Il Verge citato Noy:"Penso che negli ultimi anni il numero di repository sia esploso".
"Inserisci semplicemente ciò che stai cercando e ti aiuteremo a guidarti al set di dati pubblicato sul sito del provider del repository, " ha detto. Attualmente, i set di dati e i dati correlati tendono a essere distribuiti su più repository di dati e si potrebbe scoprire che le informazioni su questi set di dati non sono né collegate né indicizzate dai motori di ricerca. Per la persona che effettua una ricerca, la scoperta dei dati diventa noiosa nella migliore delle ipotesi.
Sono seriamente interessati a sostenere un ecosistema in cui vengono incoraggiati gli stessi fornitori di set di dati, tramite le linee guida sviluppate da Google, descrivere i propri dati "in modo che Google (e altri motori di ricerca) possano comprendere meglio il contenuto delle loro pagine, " lei disse.
Hanno usato lo standard aperto schema.org per il loro approccio su questo. Nella lista dei desideri di Noy:che tutti i fornitori di set di dati si attengano a questo standard comune. Si spera che più repository di dati utilizzino lo standard schema.org per descrivere i loro set di dati. Quel modo, ha detto No, i set di dati fanno parte di un "ecosistema robusto".
"Uno strumento di ricerca come questo è valido quanto i metadati che gli editori di dati sono disposti a fornire. Ci auguriamo che molti di voi utilizzino gli standard aperti per descrivere i propri dati, consentendo ai nostri utenti di trovare i dati che stanno cercando."
Jon Fingas in Engadget :"Al momento è tutt'altro che una risorsa definitiva. È un inizio, però, e Google spera senza dubbio che questo incoraggerà gli altri a rendere i propri dati pubblici più ricercabili".
E se tutto questo non bastasse, Google taglierà alcuni percorsi per ottenere il massimo dai dati sui dati sui dati.
Secondo Il Verge , Jeni Tennison, capo dell'Open Data Institute, ha detto che idealmente Google pubblicherà il proprio set di dati su come viene utilizzato Dataset Search. Ha detto che Google dovrebbe pubblicare un set di dati sulla ricerca per set di dati che sarebbe stato indicizzato da Ricerca per set di dati, ha aggiunto Vincenzo. L'ha citata:
"Semplicemente capire come le persone cercano è importante... che tipo di termini usano, come li esprimono, " dice Tennison. "Se vogliamo capire come le persone cercano i dati e renderli più accessibili, sarebbe fantastico se Google aprisse i propri dati su questo." In altre parole, Ha aggiunto, Google dovrebbe pubblicare un set di dati sulla ricerca del set di dati che verrebbe indicizzato da Ricerca per set di dati.
© 2018 Tech Xplore