SampleMatch自動檢索匹配的音樂曲目鼓樣本的模型
基于機器學(xué)習(xí)的計算模型已成功應(yīng)用于廣泛的復(fù)雜信息處理任務(wù),包括那些涉及從大型檔案中檢索特定數(shù)據(jù)項的任務(wù)。法國索尼計算機科學(xué)實驗室(CSL)的研究人員一直在嘗試開發(fā)機器學(xué)習(xí)技術(shù),以幫助音樂制作人輕松識別和檢索數(shù)據(jù)庫中的特定音頻樣本。
為此,SonyCSL的研究員StefanLattner最近推出了SampleMatch,這是一種基于機器學(xué)習(xí)的模型,可以自動從大型檔案中檢索與特定音樂曲目相匹配的鼓樣本。他的模型將于12月在ISMIR2022會議上展示,這是一個專注于音樂信息檢索的領(lǐng)先活動。
“我們在SonyCSL的音樂團隊正在研究可以讓音樂制作人的生活更輕松的人工智能,”進行這項研究的研究人員之一StefanLattner告訴TechXplore。“在音樂制作中,有許多任務(wù)可以讓AI發(fā)揮價值。目前相對乏味的一項任務(wù)是鼓樣本選擇。”
鼓樣本選擇是音樂制作人必須搜索能夠與特定無鼓音樂軌道很好地配合使用的鼓樣本的過程。由于鼓樣本庫通常很大,因此識別合適的鼓樣本可能非常耗費時間和精力。
目前,音樂制作人只能使用一些基本的計算工具,這些工具旨在幫助他們進行鼓樣本選擇過程。這些主要包括按標(biāo)簽或關(guān)鍵字過濾大型數(shù)據(jù)集。
幾年前,Lattner著手開發(fā)一種新系統(tǒng),該系統(tǒng)可以更直觀、更有效的方式檢索鼓樣本。然而,由于當(dāng)時可用技術(shù)的限制,該系統(tǒng)需要相對復(fù)雜。
“我發(fā)現(xiàn)我之前創(chuàng)建的系統(tǒng)不是很優(yōu)雅,所以我沒有發(fā)布它,”拉特納解釋道。“隨著對比學(xué)習(xí)的最新進展(以及神經(jīng)網(wǎng)絡(luò)編碼器的改進),估計兩個數(shù)據(jù)點是否適合在一起變得更加容易。結(jié)果,系統(tǒng)變得更加通用,我的方法可以用來估計適合多種聲音。”
使用SampleMatch時,音樂家可以在制作的任何階段將他們的音軌輸入到他們的系統(tǒng)中。然后,系統(tǒng)會根據(jù)計算出的最匹配的鼓樣本庫自動對鼓樣本庫進行排序。
Lattner使用包含4,830首電子音樂曲目和885首著名流行/搖滾曲目的大型數(shù)據(jù)集訓(xùn)練SampleMatch。具體來說,他使用了器樂的音頻對(即合成基礎(chǔ)、貝斯、吉他、打擊墊、弦樂、合唱團、鍵盤和人聲)和匹配的鼓音軌。
“SampleMatch接受了我們知道會匹配的音頻對的訓(xùn)練,”Lattner說。“現(xiàn)在,當(dāng)我們向模型展示一對新配對時,它將提供一個‘匹配分?jǐn)?shù)’。雖然已經(jīng)有系統(tǒng)使用提取的音樂特征匹配音頻樣本,但它們的檢索質(zhì)量取決于預(yù)定義的特征和樣本類型。對于鼓樣本,甚至不清楚我們應(yīng)該查看哪些特征來計算匹配分?jǐn)?shù)。"
雖然Lattner訓(xùn)練他的模型以了解哪些鼓樣本與特定音軌相匹配,但它也可以用于其他形式的音頻匹配。事實上,通過使用不同的訓(xùn)練樣本對,SampleMatch也可以被教導(dǎo)檢索匹配的貝斯、吉他或其他樂器音軌。
“音樂家在音樂制作中的一些審美選擇仍然很神秘。”拉特納說。“雖然很明顯一種樂器不應(yīng)該用鼓樣本彈奏,但沒有理論為什么有些適合你的音軌,有些則不適合。通過展示例子,計算機現(xiàn)在可以學(xué)習(xí)我們在何時應(yīng)用的美學(xué)原則聽。在某種程度上,計算機學(xué)會了像人類一樣傾聽。
將來,Lattner和他在SonyCSL的同事創(chuàng)建的音頻檢索模型可以幫助音樂制作人為其音軌尋找合適的鼓樣本或其他樂器樣本。此外,仔細(xì)分析系統(tǒng)如何學(xué)會組織數(shù)據(jù)可以幫助設(shè)計可能指導(dǎo)音樂制作工作的新理論。更具體地說,系統(tǒng)的逆向工程可能允許研究人員概述音樂家在混合音樂時應(yīng)遵循的一些一般規(guī)則。
“在我們未來的工作中,我們希望將這種方法與我們的DrumGAN技術(shù)相結(jié)合,以生成直接匹配給定音軌的鼓樣本,”Lattner補充道。“同時,我們還希望將SampleMatch擴展到其他類型的樣本。”
標(biāo)簽: