• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  •  science >> Scienza >  >> Altro
    Le statistiche semplici possono essere abbastanza buone

    Le distribuzioni gaussiane sono semplici e facili da capire, ma per alcuni dati come le precipitazioni e la velocità del vento, possono risultare in code fisicamente impossibili a valori negativi. Credito:Marek Uliasz / Alamy Foto

    Lo studio della discrepanza tra i dati ambientali spaziali e un'analisi statistica comunemente utilizzata suggerisce che in molti casi sono sufficienti statistiche più semplici.

    Gli scienziati ambientali e i loro colleghi statistici affrontano un dilemma comune:i test statistici più semplici caratterizzano correttamente un set di dati? E vale la pena di derivare e applicare metodi statistici che siano forse meglio abbinati ma più difficili da interpretare? Nella maggior parte dei casi vince il percorso di minor resistenza, ma la scelta di una semplice base statistica può far sorgere qualche dubbio sulla validità dei risultati dello studio statisticamente derivati.

    Il ricercatore KAUST Marc Genton e il suo studente di dottorato Yuan Yan hanno sviluppato un framework per testare esattamente quanto potrebbe essere imprecisa una mancata corrispondenza tra dati e analisi statistica, e i risultati sono sorprendenti.

    "I ricercatori tendono ad adattare i dati spaziali a un semplice modello gaussiano, la classica curva a campana simmetrica attorno al valore medio, anche se i dati potrebbero avere una distribuzione asimmetrica con caratteristiche che divergono da quella gaussiana, ", afferma Yan. "Abbiamo studiato l'effetto della 'non-gaussinità' dei dati sulla stima e la previsione statistica sotto l'assunzione gaussiana sbagliata".

    Le distribuzioni gaussiane sono generalmente intuitive, con un valore medio e deviazioni standard dalla media che implicano una distribuzione ristretta o ampia dei dati. Sono ampiamente applicati e compresi, sia dal punto di vista del professionista che per gli utenti non tecnici. Ma, in molte situazioni, in particolare per i dati ambientali, la distribuzione dei dati è distorta. Velocità del vento e precipitazioni, Per esempio, non può essere minore di zero, tuttavia una distribuzione gaussiana con un piccolo valore medio ma una distribuzione estesa a valori più alti può avere una coda all'estremità inferiore che si estende a valori negativi, certamente sbagliata, ma di quanto?

    Uno dei concetti più importanti nelle analisi statistiche spaziali è quanto fortemente i dati si influenzano a vicenda quando si trovano a una certa distanza, che è data dalla cosiddetta funzione di covarianza. Genton e Yan hanno deciso di studiare sistematicamente l'effetto dell'applicazione di un modello gaussiano per stimare la funzione di covarianza per dati non gaussiani.

    "Abbiamo sviluppato uno schema di simulazione su misura per generare dati spaziali non gaussiani con una data struttura di covarianza, " dice Genton. "Abbiamo dimostrato attraverso il nostro studio di simulazione che quando i dati spaziali non sono gaussiani, lo stimatore gaussiano di verosimiglianza dei parametri di covarianza funziona ancora meglio di uno stimatore alternativo dei minimi quadrati ponderati per dati che non sono fortemente distorti."

    La scoperta suggerisce che il semplice modello gaussiano è in effetti generalmente adeguato per la stima dei parametri per i dati spaziali in molti casi, offrendo un po' di conforto agli scienziati spaziali sulla loro scelta di approccio statistico.


    © Scienza https://it.scienceaq.com