Sempre da una simulazione della formazione di singole galassie, a partire da un'epoca in cui l'Universo aveva solo pochi milioni di anni. Credito:Hopkins Research Group, Caltech
Gli astronomi possono svolgere tutta la loro carriera senza trovare un nuovo oggetto nel cielo. Ma per Lina Necib, uno studioso post-dottorato in fisica teorica al Caltech, la scoperta di un ammasso di stelle nella Via Lattea, ma non nato dalla Via Lattea, è arrivato presto, con un piccolo aiuto dai supercomputer, l'osservatorio spaziale Gaia, e nuovi metodi di apprendimento profondo.
Scrivendo in Astronomia della natura questa settimana, Necib e i suoi collaboratori descrivono Nyx, un nuovo vasto flusso stellare in prossimità del Sole, ciò potrebbe fornire la prima indicazione che una galassia nana si sia fusa con il disco della Via Lattea. Si pensa che questi flussi stellari siano ammassi globulari o galassie nane che sono stati allungati lungo la sua orbita dalle forze di marea prima di essere completamente distrutti.
La scoperta di Nyx ha preso una strada tortuosa, ma uno che riflette il modo sfaccettato in cui l'astronomia e l'astrofisica sono studiate oggi.
FUOCO nel Cosmo
Necib studia la cinematica, oi movimenti, delle stelle e della materia oscura nella Via Lattea. "Se ci sono gruppi di stelle che si muovono insieme in un modo particolare, questo di solito ci dice che c'è una ragione per cui si stanno muovendo insieme."
Dal 2014, ricercatori del Caltech, Università nordoccidentale, UC San Diego e UC Berkeley, tra le altre istituzioni, hanno sviluppato simulazioni altamente dettagliate di galassie realistiche come parte di un progetto chiamato FIRE (Feedback In Realistic Environments). Queste simulazioni includono tutto ciò che gli scienziati sanno su come si formano ed evolvono le galassie. Partendo dall'equivalente virtuale dell'inizio del tempo, le simulazioni producono galassie che sembrano e si comportano molto come le nostre.
Mappare la Via Lattea
In concomitanza con il progetto FIRE, l'osservatorio spaziale Gaia è stato lanciato nel 2013 dall'Agenzia spaziale europea. Il suo obiettivo è creare una mappa tridimensionale straordinariamente precisa di circa un miliardo di stelle in tutta la galassia della Via Lattea e oltre.
"È il più grande studio cinematico fino ad oggi. L'osservatorio fornisce i moti di un miliardo di stelle, " ha spiegato. "Un sottoinsieme di esso, sette milioni di stelle, hanno velocità 3D, il che significa che possiamo sapere esattamente dove si trova una stella e il suo movimento. Siamo passati da set di dati molto piccoli a fare analisi massicce che non potevamo fare prima per comprendere la struttura della Via Lattea".
La scoperta di Nyx ha comportato la combinazione di questi due importanti progetti di astrofisica e l'analisi mediante metodi di deep learning.
Tra le domande che affrontano sia le simulazioni che il rilevamento del cielo c'è:come ha fatto la Via Lattea a diventare quello che è oggi?
"Le galassie si formano inghiottendo altre galassie, " Ha detto Necib. "Abbiamo ipotizzato che la Via Lattea abbia avuto una tranquilla storia di fusione, e per un po' si è preoccupato di quanto fosse silenzioso perché le nostre simulazioni mostrano molte fusioni. Ora, con accesso a molte strutture più piccole, capiamo che non era così tranquillo come sembrava. È molto potente avere tutti questi strumenti, dati e simulazioni. Devono essere usati tutti in una volta per districare questo problema. Siamo nelle fasi iniziali per essere in grado di comprendere veramente la formazione della Via Lattea".
Applicare il Deep Learning a Gaia
Una mappa di un miliardo di stelle è una benedizione mista:così tante informazioni, ma quasi impossibile da analizzare dalla percezione umana.
"Prima, gli astronomi hanno dovuto cercare e tracciare molto, e magari usare alcuni algoritmi di clustering. Ma questo non è più davvero possibile, " Ha detto Necib. "Non possiamo fissare sette milioni di stelle e capire cosa stanno facendo. Quello che abbiamo fatto in questa serie di progetti è stato utilizzare i finti cataloghi di Gaia".
Il finto catalogo Gaia, sviluppato da Robyn Sanderson (Università della Pennsylvania), essenzialmente chiesto:'Se le simulazioni FIRE fossero reali e osservate con Gaia, cosa vedremmo?'
collaboratore di Necib, Bryan Ostdiek (precedentemente all'Università dell'Oregon, e ora all'Università di Harvard), che era stato precedentemente coinvolto nel progetto Large Hadron Collider (LHC), aveva esperienza nella gestione di enormi set di dati utilizzando machine e deep learning. Il trasferimento di questi metodi all'astrofisica ha aperto le porte a un nuovo modo di esplorare il cosmo.
"Al LHC, abbiamo simulazioni incredibili, ma temiamo che le macchine addestrate su di esse possano imparare la simulazione e non la fisica reale, " disse Ostdiek. "In modo simile, le galassie FIRE forniscono un ambiente meraviglioso per addestrare i nostri modelli, ma non sono la Via Lattea. Abbiamo dovuto imparare non solo cosa poteva aiutarci a identificare le stelle interessanti nella simulazione, ma anche come ottenere questo per generalizzare alla nostra galassia reale."
Il team ha sviluppato un metodo per tracciare i movimenti di ogni stella nelle galassie virtuali e etichettare le stelle come nate nella galassia ospite o accresciute come prodotti di fusioni di galassie. I due tipi di stelle hanno firme diverse, anche se le differenze sono spesso sottili. Queste etichette sono state utilizzate per addestrare il modello di deep learning, che è stato poi testato su altre simulazioni FIRE.
Dopo aver creato il catalogo, l'hanno applicato ai dati di Gaia. "Abbiamo chiesto alla rete neurale, 'In base a ciò che hai imparato, puoi etichettare se le stelle sono state accresciute o no?'", ha detto Necib.
Il modello ha valutato quanto fosse sicuro che una stella fosse nata al di fuori della Via Lattea in un intervallo da 0 a 1. Il team ha creato un limite con una tolleranza per l'errore e ha iniziato a esplorare i risultati.
Questo approccio di applicare un modello addestrato su un set di dati e applicarlo a uno diverso ma correlato è chiamato apprendimento di trasferimento e può essere pieno di sfide. "Dovevamo assicurarci di non imparare cose artificiali sulla simulazione, ma davvero cosa sta succedendo nei dati, " Necib ha detto. "Per questo, abbiamo dovuto dargli un piccolo aiuto e dirgli di pesare nuovamente alcuni elementi noti per dargli un po' di ancoraggio".
Hanno prima controllato per vedere se poteva identificare le caratteristiche note della galassia. Questi includono "la salsiccia di Gaia", i resti di una galassia nana che si è fusa con la Via Lattea da sei a dieci miliardi di anni fa e che ha una caratteristica forma orbitale simile a una salsiccia.
"Ha una firma molto specifica, " ha spiegato. "Se la rete neurale ha funzionato come dovrebbe, dovremmo vedere questa enorme struttura che sappiamo già essere lì."
La salsiccia di Gaia c'era, così come l'alone stellare - le stelle di sfondo che danno alla Via Lattea la sua forma rivelatrice - e il torrente Helmi, un'altra galassia nana conosciuta che si è fusa con la Via Lattea in un lontano passato ed è stata scoperta nel 1999.
Primo avvistamento:Nyx
Il modello ha identificato un'altra struttura nell'analisi:un ammasso di 250 stelle, ruotando con il disco della Via Lattea, ma anche andando verso il centro della galassia.
"Il tuo primo istinto è che hai un insetto, " Ha raccontato Necib. "E tu sei tipo, 'Oh no!' Così, Non l'ho detto a nessuno dei miei collaboratori per tre settimane. Poi ho iniziato a capire che non è un bug, in realtà è reale ed è nuovo".
Ma se fosse già stato scoperto? "Cominci a sfogliare la letteratura, assicurandomi che nessuno l'abbia visto e fortunatamente per me, nessuno aveva. Quindi ho avuto modo di nominarlo, che è la cosa più eccitante in astrofisica. l'ho chiamato Nyx, la dea greca della notte. Questa particolare struttura è molto interessante perché sarebbe stato molto difficile da vedere senza l'apprendimento automatico".
Il progetto richiedeva un'elaborazione avanzata in molte fasi diverse. Le simulazioni FIRE e FIRE-2 aggiornate sono tra i più grandi modelli computerizzati di galassie mai tentati. Ognuna delle nove simulazioni principali:tre formazioni di galassie separate, ciascuno con un punto di partenza leggermente diverso per il sole:ci sono voluti mesi per calcolare il più grande, supercomputer più veloci al mondo. Questi includevano Blue Waters presso il National Center for Supercomputing Applications (NCSA), Le strutture di elaborazione di fascia alta della NASA, e più recentemente Stampede2 presso il Texas Advanced Computing Center (TACC).
I ricercatori hanno utilizzato i cluster dell'Università dell'Oregon per addestrare il modello di deep learning e applicarlo all'enorme set di dati di Gaia. Attualmente stanno utilizzando Frontera, il sistema più veloce in qualsiasi università del mondo, per continuare il lavoro.
"Tutto in questo progetto è computazionalmente molto intensivo e non sarebbe in grado di accadere senza il calcolo su larga scala, " Disse Necib.
Passi futuri
Necib e il suo team hanno in programma di esplorare ulteriormente Nyx utilizzando telescopi terrestri. Ciò fornirà informazioni sulla composizione chimica del flusso, e altri dettagli che li aiuteranno a datare l'arrivo di Nyx nella Via Lattea, e possibilmente fornire indizi sulla provenienza.
La prossima versione dei dati di Gaia nel 2021 conterrà informazioni aggiuntive su 100 milioni di stelle nel catalogo, rendendo più probabili scoperte di cluster accresciuti.
"Quando è iniziata la missione Gaia, gli astronomi sapevano che era uno dei più grandi set di dati che avrebbero ottenuto, con tanto di cui essere entusiasti, " Necib ha detto. "Ma avevamo bisogno di evolvere le nostre tecniche per adattarsi al set di dati. Se non abbiamo modificato o aggiornato i nostri metodi, ci perderemmo la fisica che è nel nostro set di dati".
I successi dell'approccio del team Caltech potrebbero avere un impatto ancora maggiore. "Stiamo sviluppando strumenti computazionali che saranno disponibili per molte aree di ricerca e per cose non legate alla ricerca, pure, " ha detto. "Questo è il modo in cui spingiamo la frontiera tecnologica in generale".