• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  science >> Scienza >  >> Astronomia
    Il computer cerca nei dati del telescopio prove di pianeti lontani

    Una giovane stella simile al sole circondata dal suo disco di gas e polvere che forma il pianeta. Credito:NASA/JPL-Caltech

    Come parte di uno sforzo per identificare pianeti lontani ospitali alla vita, La NASA ha istituito un progetto di crowdsourcing in cui i volontari cercano immagini telescopiche per prove di dischi di detriti attorno alle stelle, che sono buoni indicatori di esopianeti.

    Utilizzando i risultati di quel progetto, i ricercatori del MIT hanno ora addestrato un sistema di apprendimento automatico per la ricerca stessa dei dischi di detriti. La portata della ricerca richiede automazione:ci sono quasi 750 milioni di possibili fonti di luce nei dati accumulati solo attraverso la missione Wide-Field Infrared Survey Explorer (WISE) della NASA.

    Nei test, il sistema di apprendimento automatico concordava con le identificazioni umane dei dischi di detriti il ​​97 percento delle volte. I ricercatori hanno anche addestrato il loro sistema a valutare i dischi di detriti in base alla loro probabilità di contenere esopianeti rilevabili. In un articolo che descrive il nuovo lavoro sulla rivista Astronomia e informatica , i ricercatori del MIT riferiscono che il loro sistema ha identificato 367 oggetti celesti precedentemente non esaminati come candidati particolarmente promettenti per ulteriori studi.

    Il lavoro rappresenta un approccio insolito al machine learning, che è stato sostenuto da uno dei coautori del documento, Vittorio Pancrazio, un ricercatore principale presso l'Osservatorio Haystack del MIT. Tipicamente, un sistema di apprendimento automatico esaminerà una grande quantità di dati di formazione, cercando correlazioni coerenti tra le caratteristiche dei dati e qualche etichetta applicata da un analista umano, in questo caso, stelle circondate da dischi di detriti.

    Ma Pancrazio sostiene che nelle scienze, i sistemi di apprendimento automatico sarebbero più utili se incorporassero esplicitamente un po' di comprensione scientifica, per guidare le loro ricerche di correlazioni o identificare deviazioni dalla norma che potrebbero essere di interesse scientifico.

    "La visione principale è quella di andare oltre ciò su cui si sta concentrando l'intelligenza artificiale oggi, "dice Pancrazio. "Oggi, stiamo raccogliendo dati, e stiamo cercando di trovare caratteristiche nei dati. Ti ritrovi con miliardi e miliardi di funzionalità. Allora cosa ci fai con loro? Quello che vuoi sapere come scienziato non è che il computer ti dice che certi pixel sono determinate caratteristiche. Vuoi sapere 'Oh, questa è una cosa fisicamente rilevante, ed ecco i parametri fisici della cosa.'"

    Concezione della classe

    Il nuovo documento è nato da un seminario del MIT che Pankratius ha insegnato insieme a Sara Seager, la classe del 1941 Professore di Terra, Atmosferico, e Scienze Planetarie, che è ben nota per le sue ricerche sugli esopianeti. Il seminario, Astroinformatica per esopianeti, ha introdotto gli studenti alle tecniche di data science che potrebbero essere utili per interpretare la marea di dati generati dai nuovi strumenti astronomici. Dopo aver imparato le tecniche, agli studenti è stato chiesto di applicarli a questioni astronomiche in sospeso.

    Per il suo progetto finale, Tam Nguyen, uno studente laureato in aeronautica e astronautica, ha scelto il problema di addestrare un sistema di apprendimento automatico per identificare i dischi di detriti, e il nuovo documento è una conseguenza di quel lavoro. Nguyen è il primo autore sulla carta, e lei è raggiunta da Seager, Pancrazio, e Laura Eckmann, una laurea in ingegneria elettrica e informatica.

    Dal progetto di crowdsourcing della NASA, i ricercatori avevano le coordinate celesti delle sorgenti luminose che i volontari umani avevano identificato come dotate di dischi di detriti. I dischi sono riconoscibili come ellissi di luce con ellissi leggermente più luminose al centro. I ricercatori hanno anche utilizzato i dati astronomici grezzi generati dalla missione WISE.

    Per preparare i dati per il sistema di apprendimento automatico, Nguyen lo tagliò in piccoli pezzi, ha quindi utilizzato tecniche di elaborazione del segnale standard per filtrare gli artefatti causati dagli strumenti di imaging o dalla luce ambientale. Prossimo, ha identificato quei pezzi con fonti di luce al centro, e ha utilizzato algoritmi di segmentazione delle immagini esistenti per rimuovere eventuali fonti di luce aggiuntive. Questi tipi di procedure sono tipici di qualsiasi progetto di machine learning di computer vision.

    Intuizioni codificate

    Ma Nguyen ha usato i principi di base della fisica per sfoltire ulteriormente i dati. Per una cosa, ha osservato la variazione dell'intensità della luce emessa dalle sorgenti luminose attraverso quattro diverse bande di frequenza. Ha anche usato metriche standard per valutare la posizione, simmetria, e scala delle sorgenti luminose, stabilire soglie per l'inclusione nel suo set di dati.

    Oltre ai dischi di detriti etichettati dal progetto di crowdsourcing della NASA, i ricercatori avevano anche un breve elenco di stelle che gli astronomi avevano identificato come probabilmente ospitanti esopianeti. Da quelle informazioni, il loro sistema ha anche dedotto le caratteristiche dei dischi di detriti che erano correlate alla presenza di esopianeti, per selezionare i 367 candidati per ulteriori studi.

    "Date le sfide di scalabilità con i big data, sfruttare il crowdsourcing e la scienza dei cittadini per sviluppare set di dati di formazione per classificatori di apprendimento automatico per osservazioni astronomiche e oggetti associati è un modo innovativo per affrontare le sfide non solo in astronomia ma anche in diverse aree scientifiche ad alta intensità di dati, "dice Dan Crichton, che guida il Centro per la scienza e la tecnologia dei dati presso il Jet Propulsion Laboratory della NAASA. "L'uso della pipeline di scoperta assistita da computer descritta per automatizzare l'estrazione, classificazione, e il processo di convalida sarà utile per sistematizzare il modo in cui queste capacità possono essere riunite. Il documento fa un buon lavoro nel discutere l'efficacia di questo approccio applicato ai candidati ai dischi di detriti. Le lezioni apprese saranno importanti per generalizzare le tecniche ad altre applicazioni di astronomia e discipline diverse".

    "Il team scientifico di Disk Detective ha lavorato al proprio progetto di apprendimento automatico, e ora che questo giornale è uscito, dovremo incontrarci e confrontare le note, "dice Marc Kuchner, un astrofisico senior presso il Goddard Space Flight Center della NASA e leader del progetto di rilevamento del disco di crowdsourcing noto come Disk Detective. "Sono davvero contento che Nguyen stia esaminando questo aspetto perché penso davvero che questo tipo di cooperazione uomo-macchina sarà cruciale per analizzare i big data set del futuro".

    Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.




    © Scienza https://it.scienceaq.com