Struttura completamente dipendente. Attestazione:Björn Böttcher
In dicembre, l'editore accademico De Gruyter ha lanciato la sua nuova rivista Statistiche aperte con un articolo di apertura del matematico della TU Dresden Dr. Björn Böttcher. L'articolo presenta l'estensione della misura statistica della multivarianza della distanza sviluppata da Böttcher e dai suoi colleghi della TU Dresden.
La multivarianza della distanza è una misura di dipendenza multivariata in grado di rilevare le dipendenze tra un numero arbitrario di vettori casuali, ciascuno dei quali può avere una dimensione distinta. Nel suo nuovo articolo, Böttcher ora presenta il concetto come una teoria unificante che combina diverse misure di dipendenza classiche. Le connessioni tra due o più variabili ad alta dimensione possono essere catturate e possono essere rilevate anche complicate dipendenze non lineari e dipendenze di ordine superiore. Per numerose discipline scientifiche, questo metodo apre nuovi approcci per rilevare e valutare le dipendenze.
Il numero di giorni di scuola persi può essere collegato all'età, sesso o origine degli studenti? In un sondaggio di 146 studenti delle scuole, gli scienziati sociali hanno analizzato varie variabili d'influenza sui giorni di scuola persi e le hanno esaminate per le dipendenze al fine di derivare un modello di previsione. Questa classica domanda è già stata ampiamente discussa e analizzata con vari approcci statistici.
La misura statistica della multivarianza della distanza presenta un nuovo approccio a questa domanda:il Dr. Björn Böttcher dell'Institute of Mathematical Stochastics è stato in grado di utilizzare la multivarianza della distanza per determinare il background culturale e una dipendenza di ordine superiore tra cui età e sesso come fattori che influenzano il mancato giorni di scuola. Poteva così suggerire un modello minimale. "Questo è un esempio elementare per un'applicazione del metodo sviluppato. Non posso giudicare se questo sia anche un risultato motivato per quanto riguarda la domanda investigata. Lavorare con dati reali e soprattutto l'interpretazione specifica del soggetto dei risultati richiede sempre competenza nella rispettivo soggetto, "Il dottor Böttcher dice, e fornisce numerosi altri esempi illustrativi dell'applicazione del suo metodo:"Nel documento, Mi riferisco a più di 350 set di dati liberamente disponibili da tutte le discipline scientifiche in cui si verificano dipendenze di ordine superiore statisticamente significative. Ancora, se queste dipendenze sono significative in termini di indagini sottostanti richiede ulteriori indagini nonché l'esperienza nei rispettivi campi, "e aggiunge, "Certo, le richieste di collaborazione sono sempre ben accette."
L'analisi statistica di solito considera le dipendenze tra le singole variabili. Soprattutto con molte variabili, è desiderabile rimuovere le variabili indipendenti prima di studiare qualsiasi tipo specifico di dipendenza. Il Dr. Björn Böttcher presenta un metodo per questo scopo chiamato "rilevamento della struttura di dipendenza, " che può essere utilizzato anche per rilevare dipendenze di ordine superiore. Le variabili sono chiamate "dipendenti di ordine superiore" se sono indipendenti a coppie, ma più di due variabili ancora si influenzano congiuntamente. Dipendenze di questo tipo non sono state finora al centro delle applicazioni.
Alcuni scienziati sospettano che le dipendenze di ordine superiore si verifichino in particolare nella genetica:l'idea di base qui è che diversi geni insieme determinano una proprietà, ma questi geni non mostrano né individualmente alcuna dipendenza l'uno dall'altro né individualmente con la proprietà, quindi in effetti questi sarebbero dipendenti di ordine superiore. La struttura della multivarianza a distanza e il metodo di rilevamento della struttura di dipendenza sono ora strumenti promettenti per tali indagini.
Le implementazioni dei nuovi metodi sono fornite per applicazioni dirette nel pacchetto "multivariance" per l'ambiente di calcolo statistico libero R.