• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • Il nuovo modello di base migliora la precisione per l'interpretazione delle immagini di telerilevamento

    Credito:Unsplash/CC0 di dominio pubblico

    Secondo l'Aerospace Information Research Institute (AIR), Chinese Academy of Sciences (CAS), è stato sviluppato un nuovo modello di fondazione denominato RingMo per migliorare la precisione per l'interpretazione delle immagini di telerilevamento.

    Lo studio intitolato "RingMo:A Remote Sensing Foundation Model with Masked Image Modeling" è stato pubblicato in IEEE Transactions on Geoscience and Remote Sensing .

    Le immagini di telerilevamento vengono applicate in campi come la classificazione e il rilevamento delle modifiche e gli approcci di deep learning hanno contribuito al rapido sviluppo dell'interpretazione delle immagini di telerilevamento. Il paradigma di addestramento più utilizzato è l'uso di modelli pre-addestrati da ImageNet per elaborare i dati di telerilevamento per attività specifiche.

    Tuttavia ci sono problemi, come un divario di dominio tra le scene naturali e di telerilevamento e la scarsa capacità di generalizzazione dei modelli di telerilevamento. Pertanto, è necessario sviluppare un modello di base con rappresentazione generale delle caratteristiche di telerilevamento. Poiché è disponibile una grande quantità di dati senza etichetta, il metodo con supervisione automatica è migliore del metodo completamente supervisionato nel telerilevamento.

    Lo studio mira a proporre un modello di base per il telerilevamento, in grado di sfruttare i vantaggi dell'apprendimento generativo autosupervisionato per le immagini di telerilevamento. RingMo presenta un set di dati su larga scala costruito raccogliendo 2 milioni di immagini di telerilevamento da piattaforme satellitari e aeree, che coprono più scene e oggetti in tutto il mondo. Inoltre, il metodo di addestramento del modello di base del telerilevamento è progettato per oggetti densi e piccoli in complicate scene di telerilevamento.

    RingMo è il primo modello di base generativa per i dati di telerilevamento multimodale. In futuro, il modello potrà essere applicato alla ricostruzione 3D, all'edilizia residenziale, ai trasporti, alla tutela dell'acqua, alla protezione dell'ambiente e ad altri campi. + Esplora ulteriormente

    Rete di attivazione dell'attenzione reciproca sviluppata per la risposta a domande visive mediante telerilevamento




    © Scienza https://it.scienceaq.com