Interfaccia dello studio di crowdsourcing. Credito:Fan et al.
Le tecniche di deep learning si stanno rivelando estremamente utili per analizzare tutti i tipi di dati, dalle immagini al testo, post online e registrazioni audio. Queste tecniche sono progettate per identificare modelli in grandi set di dati, separa gli elementi in diverse categorie e fai previsioni molto più velocemente degli umani.
In un recente studio, ricercatori della Simon Fraser University, L'Academia Sinica e il Dartmouth College hanno applicato tecniche di deep learning per identificare somiglianze e differenze tra la musica classica cinese e quella occidentale. La loro carta, pre-pubblicato su arXiv, presenta un'analisi comparativa delle registrazioni musicali utilizzando i modelli di rilevamento di eventi sonori (SED) e di riconoscimento delle emozioni del paesaggio sonoro (SER).
"Abbiamo ascoltato musica classica sia cinese che occidentale, "Jianyu Fan, uno dei ricercatori che ha condotto lo studio, ha detto a TechXplore. "Riteniamo che diversi fattori distinguano la musica cinese dalla musica occidentale, compresa la loro cultura di base, filosofia e modo di pensare. Questo è il motivo per cui siamo molto interessati a studi che mettano a confronto la musica cinese e quella occidentale".
I modelli di deep learning per l'analisi delle registrazioni musicali a volte possono avere scarsi risultati, mentre lottano per apprendere modelli nelle informazioni di alto livello, come la melodia di una canzone, armonia, ecc. Per superare i limiti incontrati negli studi precedenti, Fan e i suoi colleghi hanno applicato modelli di paesaggi sonori all'analisi della musica classica cinese e occidentale, valutarne l'efficacia nell'identificare somiglianze e differenze tra i due sottogeneri.
La distribuzione delle annotazioni emotive della musica classica occidentale. Credito:Fan et al.
Inizialmente, i ricercatori hanno compilato due set di dati annotati contenenti registrazioni di musica cinese e occidentale, soprannominato WCMED e CCMED. Successivamente, hanno addestrato separatamente un SED preaddestrato e un modello SER preaddestrato su questi set di dati, combinando entrambi con un modello di regressione del vettore di supporto (SVR). I modelli SED sono progettati per rilevare eventi sonori nei segnali audio, mentre i modelli SER sono addestrati a riconoscere l'emozione trasmessa dalle registrazioni del paesaggio sonoro.
"Mentre i precedenti studi musicali utilizzano principalmente modelli basati sulla musica, eravamo curiosi di sapere se un modello addestrato sul paesaggio sonoro generale può essere utilizzato per analizzare la musica e in che modo sono diversi per la musica classica cinese e occidentale, " Fan ha spiegato. "Pertanto, abbiamo provato a utilizzare due modelli basati sul suono generale:un modello di rilevamento degli eventi sonori e un modello di riconoscimento delle emozioni del paesaggio sonoro".
I ricercatori hanno utilizzato tecniche di apprendimento del trasferimento per estrarre rappresentazioni di alto livello del suono. Hanno quindi usato queste rappresentazioni per addestrare il loro modello di riconoscimento delle emozioni musicali per rilevare le emozioni trasmesse dalle registrazioni musicali. Poiché il loro modello era pre-addestrato per generalizzare le caratteristiche del suono, hanno scoperto che queste rappresentazioni funzionavano meglio se abbinate a un modello più semplice, soprattutto per l'analisi della musica classica cinese. I ricercatori hanno anche formato un classificatore di deep learning sui set di dati che hanno creato e hanno condotto ulteriori analisi concentrandosi su caratteristiche specifiche delle canzoni cinesi e occidentali.
"Poiché il nostro obiettivo è utilizzare modelli di paesaggio sonoro pre-addestrati per analizzare e confrontare la musica classica cinese e occidentale, non ci aspettavamo che il modello funzionasse perfettamente per diversi tipi di audio e diversi tipi di attività, " Fan ha detto. "Tuttavia, i nostri risultati suggeriscono che è efficace per prevedere l'eccitazione della musica classica cinese e occidentale utilizzando modelli di paesaggio sonoro".
La distribuzione delle annotazioni emotive della musica classica cinese. Credito:Fan et al
I risultati raccolti da Fan e dai suoi colleghi suggeriscono che i modelli SED e SER sono strumenti promettenti per l'analisi delle registrazioni musicali. interessante, l'analisi comparativa della musica classica cinese e occidentale utilizzando queste tecniche ha portato a risultati che sono allineati con le idee presentate dai teorici della musica in Cina.
I ricercatori hanno anche osservato che il loro classificatore di deep learning riconosceva le registrazioni di paesaggi sonori come musica classica cinese. Ciò suggerisce che le registrazioni di paesaggi sonori in genere condividono più somiglianze con la musica classica cinese che con la musica classica occidentale.
"Il nostro studio ha evidenziato che esistono alcune somiglianze tra la musica classica cinese e le registrazioni di paesaggi sonori, "Fan ha detto. "Questi risultati sono in linea con quelli riportati dai musicologi cinesi e dai filosofi cinesi di musica classica".
Nel futuro, lo studio condotto da questo team di ricercatori potrebbe ispirare altri studi che mettano a confronto diversi generi musicali basati sull'analisi di modelli di soundscape. Nel frattempo, Fan e i suoi colleghi hanno in programma di continuare a indagare sulle somiglianze e le differenze tra la musica cinese e quella occidentale utilizzando metodi di deep learning, cercando anche di costruire modelli in grado di comporre automaticamente nuova musica classica.
© 2020 Scienza X Rete