• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  science >> Scienza >  >> Astronomia
    Osservare le stelle con i computer:cosa può insegnarci l'apprendimento automatico sul cosmo

    L'Osservatorio Vera Rubin ospiterà la LSST Camera, che raccoglierà dati su 37 miliardi di galassie e stelle nel corso di 10 anni. Gli scienziati stanno sviluppando programmi di apprendimento automatico per analizzare il flusso di dati. Credito:M. Park/Inigo Films/LSST/AURA/NSF

    Guardando il cielo notturno in una zona rurale, probabilmente vedrai la luna splendente circondata da stelle. Se sei fortunato, potresti individuare la cosa più lontana visibile ad occhio nudo:la galassia di Andromeda. È il vicino più vicino alla nostra galassia, la via Lattea. Ma questa è solo la minima parte di quello che c'è là fuori. Quando la fotocamera Legacy Survey of Space and Time (LSST) del Department of Energy (DOE) presso l'Osservatorio Vera Rubin della National Science Foundation si accende nel 2022, scatterà foto di 37 miliardi di galassie e stelle nel corso di un decennio.

    L'output di questo enorme telescopio sommergerà i ricercatori di dati. In quei 10 anni, la fotocamera LSST ne impiegherà 2, 000 foto per ogni zona del cielo del sud che copre. Ogni immagine può contenere fino a un milione di oggetti.

    "In termini di scala dei dati, la quantità di dati, la complessità dei dati, sono ben al di là degli attuali set di dati che abbiamo, " disse Rachel Mandelbaum, professore alla Carnegie Mellon University e portavoce della LSST Dark Energy Science Collaboration. "Questo apre un'enorme quantità di spazio di scoperta".

    Gli scienziati non stanno costruendo la fotocamera LSST solo per scattare belle foto. Vogliono identificare, classificare, e misurare oggetti celesti che possono rivelare informazioni sulla struttura stessa dell'universo. Comprendere l'energia oscura e altri misteri cosmologici richiede dati su supernovae e galassie. I ricercatori possono persino trovare classi di oggetti completamente nuove.

    "Ci saranno alcuni oggetti che non abbiamo mai visto prima perché questo è il punto della nuova scoperta, " ha detto Renée Hložek, un assistente professore di astrofisica presso l'Università di Toronto, che lavora con la LSST Dark Energy Science Collaboration. "Troveremo un mucchio di quelli che chiamiamo strani, o anomalie".

    Il volume e la stranezza dei dati renderanno difficile l'analisi. Mentre un osservatore di stelle nuovo in un'area potrebbe uscire sul campo con un esperto locale, gli scienziati non hanno una tale guida per nuovi pezzi dell'universo. Quindi stanno facendo da soli. Più accuratamente, stanno creando molte guide diverse che possono aiutarli a identificare e classificare questi oggetti. Gli astrofisici supportati dal DOE Office of Science stanno sviluppando queste guide sotto forma di modelli informatici che si basano sull'apprendimento automatico per esaminare i dati LSST. L'apprendimento automatico è un processo in cui un programma per computer apprende nel tempo le relazioni in un insieme di dati.

    Programmi per computer che imparano

    L'elaborazione rapida dei dati è un must per gli scienziati della Dark Energy Science Collaboration. Gli scienziati devono sapere che la fotocamera punta esattamente nel posto giusto e acquisisce i dati correttamente ogni volta. Questa rapida elaborazione li aiuta anche a sapere se qualcosa è cambiato in quella parte del cielo dall'ultima volta che l'hanno scattata. Sottraendo la foto attuale da quelle precedenti mostra loro se c'è un segno di un oggetto o fenomeno celeste interessante.

    Devono anche combinare molte foto insieme in un modo accurato e utilizzabile. Questo progetto sta esaminando le profondità dell'universo per catturare immagini di alcune delle stelle e delle galassie più deboli. Scatterà anche foto in condizioni atmosferiche non ideali. Compensare, gli scienziati hanno bisogno di programmi in grado di combinare le immagini per migliorare la chiarezza.

    L'apprendimento automatico può affrontare queste sfide oltre a gestire l'enorme quantità di dati. Poiché questi programmi analizzano più dati, più diventano precisi. Proprio come una persona che impara a identificare una costellazione, ottengono un giudizio migliore nel tempo.

    "Molti scienziati considerano l'apprendimento automatico come l'opzione più promettente per classificare le sorgenti in base a misurazioni fotometriche (misurazioni dell'intensità della luce), " ha detto Eve Kovacs, un fisico presso l'Argonne National Laboratory del DOE.

    Ma i programmi di apprendimento automatico devono imparare da soli prima di poter affrontare una pila di nuovi dati. Esistono due modi principali per "addestrare" un programma di apprendimento automatico:non supervisionato e supervisionato.

    L'apprendimento automatico non supervisionato è come qualcuno che insegna a se stesso le stelle solo dalle sue osservazioni notturne. Il programma si allena su dati non etichettati. Mentre l'apprendimento automatico non supervisionato può raggruppare immagini e identificare valori anomali, non può classificarli senza una guida di qualche tipo.

    L'apprendimento automatico supervisionato è come un principiante che si affida a una guida. I ricercatori gli forniscono un enorme insieme di dati etichettati con le classi di ciascun oggetto. Esaminando i dati più e più volte, il programma apprende la relazione tra l'osservazione e le etichette. Questa tecnica è particolarmente utile per classificare gli oggetti in gruppi noti.

    In alcuni casi, i ricercatori forniscono anche al programma una serie specifica di funzionalità da cercare, come luminosità, forma, o colore. Forniscono indicazioni sull'importanza di ciascuna funzionalità rispetto alle altre. In altri programmi, il programma di apprendimento automatico individua da sé le caratteristiche rilevanti.

    Però, l'accuratezza dell'apprendimento automatico supervisionato dipende dall'avere un buon set di allenamento, con tutta la diversità e la variabilità di una vera. Per le foto dalla fotocamera LSST, quella variabilità potrebbe includere striature da satelliti che si muovono nel cielo. Anche l'etichettatura deve essere estremamente accurata.

    "Dobbiamo mettere quanta più fisica possibile nei set di allenamento, " ha detto Mandelbaum. "Non ci toglie l'onere di capire la fisica. Lo sposta semplicemente in una parte diversa del problema".

    Indicatori di miglia sull'autostrada spaziale

    Alcuni degli oggetti più interessanti dell'universo non restano a lungo. Gli oggetti transitori appaiono molto luminosi, sbiadiscono in un determinato periodo di tempo, e poi vai al buio. Le supernovae, stelle che esplodono in modo massiccio, sono un tipo di oggetto transitorio. Gli oggetti variabili cambiano di luminosità nel tempo in modo coerente. Alcuni tipi di entrambi possono essere "candele standard, " oggetti che gli scienziati possono usare per misurare la distanza dalla Terra, come indicatori di miglia su un'autostrada. Queste candele standard forniscono informazioni sulle dimensioni e sulla storia dell'universo.

    "Se guardi abbastanza galassie in una data notte, sei quasi sicuro di scoprire una supernova, ", ha detto Kovacs.

    Per sapere se una supernova sarà utile come candela standard o meno, gli scienziati devono sapere di che tipo si tratta. Le supernove di tipo Ia possono essere candele standard. Proprio come attingere all'esperienza può dire agli astronomi se stanno guardando Marte o Venere, un programma per computer può utilizzare il suo addestramento per classificare una supernova da un'immagine.

    "L'unico neo in tutto questo è che le supernove di tipo Ia non sono esattamente candele standard. Hanno una certa quantità di variazione, " ha detto Kovacs. "Comprendere quella variazione ... in realtà sta al centro del fare tutto questo lavoro."

    Kovacs e i suoi collaboratori hanno creato un programma che utilizza i colori delle supernovae per ordinarle in categorie. In precedenza, gli scienziati hanno addestrato algoritmi di apprendimento automatico facendo loro confrontare la luminosità di una specifica supernova nel tempo con un modello basato sulla supernova di tipo Ia. Ma era probabile che i programmi classificassero erroneamente troppe supernovae come di tipo Ia. La sua squadra ha adottato un approccio diverso. Hanno identificato una serie di 17 caratteristiche che caratterizzano le curve di luce (variazione temporale dell'intensità della luce) delle supernove. Utilizzando un set di addestramento di diverse migliaia di supernove simulate, sono stati in grado di ottenere classificazioni con livelli di accuratezza estremamente elevati.

    Capire quanto sono lontani gli oggetti cosmici dalla Terra è un'altra area promettente per l'apprendimento automatico. In precedenza, gli scienziati si sono affidati a telescopi spettroscopici che utilizzano fibre ottiche per misurare con precisione le distanze di questi oggetti. Ma la fotocamera LSST troverà più di 1, 000 oggetti transitori a notte. Sono troppi per continuare a usare questa tecnica. Mandelbaum e il suo team hanno sviluppato un programma di apprendimento automatico in grado di stimare con precisione questa distanza dalle sole foto. Può anche adattare e incorporare dati spettroscopici, se disponibili.

    Ma le supernove non sono gli unici oggetti che possono essere usati come candele standard. Infatti, gli astrofisici usano spesso altri oggetti per calibrare la loro distanza. Mandelbaum e il suo team hanno utilizzato l'apprendimento automatico per trovare altre potenziali candele standard. Alimentando i dati del programma su molte stelle variabili, hanno scoperto che potrebbe creare e applicare caratteristiche che identificano una buona candela standard senza dover prima classificare la stella. Saltare quel passaggio, che richiede molte etichette, dati categorizzati:semplificato il processo. Ha anche aiutato a evitare distorsioni o errori di classificazione. Il programma ha prodotto un campione con stelle che erano candele standard altrettanto buone delle Cefeidi, una stella variabile utile ma rara. C'era un altro vantaggio:le stelle nel loro campione erano generalmente più luminose e più facili da misurare rispetto alle Cefeidi.

    "Il machine learning ti aiuta a scovare questi spazi complicati perché gli umani hanno difficoltà a pensare in più di tre dimensioni, " ha detto Kovac.

    Raccogliere e scegliere a livello galattico

    Mentre le singole stelle possono rivelare una grande quantità di informazioni, a volte hai bisogno di un'intera galassia. Usando solo una foto, è più facile calcolare la distanza della galassia ospite di una supernova piuttosto che la supernova stessa. Ma gli scienziati devono scegliere la galassia ospite giusta. Nel passato, hanno fatto questo abbinamento a mano. Ma la fotocamera LSST creerà troppi dati da gestire per gli umani.

    In uno dei progetti di Kovac, il team scientifico ha sviluppato un algoritmo che ha abbinato correttamente la galassia ospite alla supernova dal 90 al 92 percento delle volte. Non abbastanza preciso. Ma l'apprendimento automatico è venuto in soccorso. Il team ha sviluppato un programma di apprendimento automatico per dire loro quanto fosse probabile che una classificazione fosse giusta o sbagliata. Ha identificato dal sette all'otto percento dell'output originale come molto probabilmente sbagliato. La rimozione di tali elementi dai dati ha aumentato la precisione e ha reso più semplice il follow-up manuale delle foto difficili.

    Toccando la mente collettiva

    Per esplorare ulteriormente la potenza del machine learning, due dei gruppi scientifici della LSST Camera hanno trovato un modo unico per attingere alle capacità intellettuali degli scienziati:hanno organizzato un concorso. In collaborazione con Kaggle, un sito web per i data scientist, hanno preso di mira non astronomi specializzati nell'apprendimento automatico per sviluppare programmi per ordinare i dati futuri dalla fotocamera LSST.

    "Se parli solo alle persone che conosci, si perde quella diversità di pensiero della comunità più ampia, " ha detto Hložek, che ha condotto la gara. "Volevamo che le persone lavorassero davvero insieme per mettere in comune i loro modelli e i loro dati".

    In particolare, volevano che i programmi individuassero tipi di oggetti che gli astrofisici potrebbero non aver visto prima. Hanno dato al gruppo tre milioni di oggetti da ordinare in 15 categorie, con il 15 che è "Non l'ho mai visto prima".

    "Vogliamo prepararci per essere aperti a quel tipo di lavoro, " Ha detto Hložek. "Quali sono i modi in cui può manifestarsi la stranezza?"

    più di 1, 300 concorrenti in 1, 000 squadre hanno partecipato alla sfida, che si è conclusa a dicembre 2018. Ora, i ricercatori della LSST Camera stanno ordinando i codici per combinarli nel miglior set di programmi possibile.

    Tutta questa attività sta accadendo anni prima che la fotocamera LSST venga accesa. I programmi di apprendimento automatico riveleranno sicuramente ancora di più una volta che i dati iniziano a fluire. Mentre i computer non possono guardare le stelle con meraviglia, forniranno sempre più informazioni sugli oggetti celesti che ispirano tale stupore in noi.


    © Scienza https://it.scienceaq.com