反饋延遲網(wǎng)絡(luò)音色優(yōu)化的方法
【專利摘要】本發(fā)明涉及一種反饋延遲網(wǎng)絡(luò)音色優(yōu)化的方法,在選擇反饋延遲網(wǎng)絡(luò)延遲線的延遲系數(shù)時(shí)通過(guò)以下步驟進(jìn)行:根據(jù)預(yù)設(shè)選擇條件選擇確定多個(gè)延遲系數(shù)組合;計(jì)算多個(gè)所述延遲系數(shù)組合所分別對(duì)應(yīng)的多個(gè)頻譜平整度值;比較多個(gè)所述頻譜平整度值,將其中數(shù)值最大的頻譜平整度值對(duì)應(yīng)的延遲系數(shù)組合作為反饋延遲網(wǎng)絡(luò)延遲線的延遲系數(shù)組合。本發(fā)明通過(guò)比較多個(gè)延遲系數(shù)組合對(duì)應(yīng)的多個(gè)所述頻譜平整度值,將其中的數(shù)值最大的頻譜平整度值對(duì)應(yīng)的延遲系數(shù)組合作為反饋延遲網(wǎng)絡(luò)延遲線的延遲系數(shù)組合,可以使得輸出信號(hào)的音色高度自然。
【專利說(shuō)明】
反饋延遲網(wǎng)絡(luò)音色優(yōu)化的方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于音頻信號(hào)處理技術(shù)領(lǐng)域,具體涉及一種反饋延遲網(wǎng)絡(luò)音色優(yōu)化的方 法。
【背景技術(shù)】
[0002] 基于耳機(jī)及揚(yáng)聲器的音頻信號(hào)的渲染經(jīng)常會(huì)用到對(duì)于房間混響模擬。其中基于耳 機(jī)的植染包括與揚(yáng)聲器同樣的方法和耳機(jī)獨(dú)有的耳機(jī)雙聲道虛擬環(huán)繞聲的方法。其應(yīng)用場(chǎng) 景如在安靜的室內(nèi),通過(guò)新品信號(hào)處理算法,可以通過(guò)揚(yáng)聲器播放進(jìn)行混響處理的音頻信 號(hào),已達(dá)到模擬劇場(chǎng)、山洞的效果。進(jìn)行此類(lèi)音頻信號(hào)處理可以使用將原信號(hào)與期望房間的 混響進(jìn)行卷積的方法。但在實(shí)際應(yīng)用中,由于房間混響(即沖擊響應(yīng))通常為階數(shù)極高的FIR 濾波器,應(yīng)用時(shí)導(dǎo)致算法復(fù)雜度升高,效率降低。
[0003] 另外在很多應(yīng)用中,對(duì)于房間的混響需要進(jìn)行微調(diào)或?qū)崟r(shí)變換。沖擊響應(yīng)卷積的 方法不能滿足此類(lèi)需求。因此,在實(shí)際應(yīng)用中常使用反饋延遲網(wǎng)絡(luò)(Feedback Delay Network,F(xiàn)DN)的方法進(jìn)行房間混響的模擬。含有3條延遲線的反饋延遲網(wǎng)絡(luò)如圖1所示。
[0004] 其中,輸入信號(hào)為i,輸出信號(hào)為o,M為延遲線的延遲系數(shù)或參數(shù)(即延遲的采樣點(diǎn) 數(shù)),Z為z變換符號(hào),g為增益項(xiàng),q為反饋矩陣元素。圖2中的系統(tǒng)可以在時(shí)域或頻域中使用。 當(dāng)在時(shí)域時(shí),g、q為一實(shí)數(shù)。當(dāng)在頻域時(shí),g、q為一維向量,維度表示頻點(diǎn)。
[0005] 在反饋延遲網(wǎng)絡(luò)第一次有信號(hào)輸入時(shí),輸入信號(hào)i(n)在進(jìn)入反饋延遲網(wǎng)絡(luò)時(shí)將分 別輸入至若干個(gè)延遲線中。如在圖2中,延遲線的數(shù)量為3條。在經(jīng)過(guò)延遲線時(shí)輸入信號(hào) 將被延遲輸出j個(gè)采樣點(diǎn)。在延遲線輸出信號(hào)上將加入相應(yīng)的增益值U,其取值將在后面詳 述。最后所有延遲線上的輸出信號(hào)將被疊加輸出,即O(H)。延遲線輸出信號(hào)在被疊加之前, 會(huì)被同時(shí)輸入到反饋系統(tǒng)中。在延遲線的輸出信號(hào)被反饋至輸入端之前,延遲線的輸出信 號(hào)會(huì)經(jīng)過(guò)反饋矩陣的混合處理。反饋矩陣的作用為將輸入信號(hào)進(jìn)行混合,使得最終輸出結(jié) 果的隨機(jī)性增加。在房間混響模擬的應(yīng)用中,這種處理將會(huì)使輸出信號(hào)更具隨機(jī)性、更像真 實(shí)房間的混響?;旌暇仃嚨妮敵鲂盘?hào)將被反饋至下一幀的輸入端,與下一幀的輸入進(jìn)行疊 加。在疊加后的信號(hào)x(n)可以全面表征整個(gè)反饋延遲系統(tǒng)的性質(zhì):
[0006] 圖2系統(tǒng)中的X所在點(diǎn)的信號(hào)可用公式1表示:
[0007
[0008] 其中,x、q已知。g可由期望的房間反射時(shí)間(T60)求得(dB域):
[0009]
[0010] 其中fs為音頻信號(hào)的采樣率。
[0011] 到這里,只有M的值還未確定。M的選擇既影響反饋延遲網(wǎng)絡(luò)內(nèi)的增益,又影響延遲 時(shí)間。實(shí)際上,M的選擇最終會(huì)影響反饋延遲網(wǎng)絡(luò)在還原房間聲學(xué)特性的自然度-即人工生 成的房間混響和真實(shí)房間的混響間在音色等方面的差別。M選擇不良會(huì)導(dǎo)致最終結(jié)果音色 失真,雖然目前有人提出M的一些選擇條件,但根據(jù)該條件選擇M后,在實(shí)際應(yīng)用中,發(fā)現(xiàn)即 使?jié)M足上述要求,最終輸出的音頻信號(hào)仍然會(huì)有一定的音色失真,嚴(yán)重影響聽(tīng)感。
【發(fā)明內(nèi)容】
[0012]本發(fā)明的目的在于解決上述的技術(shù)問(wèn)題而提供一種反饋延遲網(wǎng)絡(luò)音色優(yōu)化的方 法,旨在利用優(yōu)化算法得到使得輸出信號(hào)音色高度自然的延遲線參數(shù)。
[0013]為實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
[0014] -種反饋延遲網(wǎng)絡(luò)音色優(yōu)化的方法,在選擇反饋延遲網(wǎng)絡(luò)延遲線的延遲系數(shù)時(shí)通 過(guò)以下步驟進(jìn)行;
[0015] 根據(jù)預(yù)設(shè)選擇條件選擇確定多個(gè)延遲系數(shù)組合;
[0016] 計(jì)算多個(gè)所述延遲系數(shù)組合所分別對(duì)應(yīng)的多個(gè)頻譜平整度值;
[0017]比較多個(gè)所述頻譜平整度值,將其中的數(shù)值最大的頻譜平整度值對(duì)應(yīng)的延遲系數(shù) 組合作為反饋延遲網(wǎng)絡(luò)延遲線的延遲系數(shù)組合。
[0018] 所述根據(jù)預(yù)設(shè)選擇條件選擇確定多個(gè)延遲系數(shù)組合滿足下列條件:
[0019] EiMi彡0.15fs · T60且Max(Mi)彡2.5 · Min(Mi),
[0020] 其中,1彡i彡I,I為延遲線數(shù)量,M表示延遲線系數(shù),I條延遲線互質(zhì),T60為房間混 響,fs為音頻信號(hào)的采樣率。
[0021 ]所述頻譜平整度值的計(jì)算公式如下:
[0022]
[0023] 其中3 = -f ,Flatness為頻譜平整度,取值范圍為(0,l),fs為音頻信號(hào)的采樣率, x(k)為反饋延遲網(wǎng)絡(luò)的輸出頻率響應(yīng)的幅值,k代表頻率。
[0024] 或者,所述頻譜平整度值的計(jì)算采用如下公式:
[0025]
[0026] 其中,灰,Flatness為頻譜平整度,取值范圍為(0,1),w = 2Jik,Gi(w)為延遲線的 頻率響應(yīng)的幅值,f s為音頻信號(hào)的采樣率,k代表頻率,I Si < I,I為延遲線數(shù)量。
[0027] 本發(fā)明通過(guò)比較多個(gè)延遲系數(shù)組合對(duì)應(yīng)的多個(gè)所述頻譜平整度值,將其中的數(shù)值 最大的頻譜平整度值對(duì)應(yīng)的延遲系數(shù)組合作為反饋延遲網(wǎng)絡(luò)延遲線的延遲系數(shù)組合,可以 使得輸出信號(hào)的音色高度自然。
【附圖說(shuō)明】
[0028] 圖1為含有3條延遲線的反饋延遲網(wǎng)絡(luò)的示意圖;
[0029] 圖2為含有3條延遲線的反饋延遲網(wǎng)絡(luò)的具體實(shí)施示意圖;
[0030] 圖3為滿足現(xiàn)有條件的M對(duì)應(yīng)的頻率響應(yīng)圖;
[0031]圖4為本發(fā)明優(yōu)化M后的頻率響應(yīng)圖;
[0032]圖5為滿足現(xiàn)有條件的M對(duì)應(yīng)的時(shí)間頻率響應(yīng)圖;
[0033]圖6為本發(fā)明優(yōu)化M后的時(shí)間頻率響應(yīng)圖。
【具體實(shí)施方式】
[0034]下面,結(jié)合實(shí)例對(duì)本發(fā)明的實(shí)質(zhì)性特點(diǎn)和優(yōu)勢(shì)作進(jìn)一步的說(shuō)明,但本發(fā)明并不局 限于所列的實(shí)施例。
[0035] 一種反饋延遲網(wǎng)絡(luò)音色優(yōu)化的方法,在選擇反饋延遲網(wǎng)絡(luò)延遲線的延遲系數(shù)時(shí)通 過(guò)以下步驟進(jìn)行;
[0036] SlOl,根據(jù)預(yù)設(shè)選擇條件選擇確定多個(gè)延遲系數(shù)組合;
[0037] S102,計(jì)算多個(gè)所述延遲系數(shù)組合所分別對(duì)應(yīng)的多個(gè)頻譜平整度值;
[0038] S103,比較多個(gè)所述頻譜平整度值,將其中的數(shù)值最大的頻譜平整度值對(duì)應(yīng)的延 遲系數(shù)組合作為反饋延遲網(wǎng)絡(luò)延遲線的延遲系數(shù)組合。
[0039] 本發(fā)明通過(guò)比較多個(gè)延遲系數(shù)組合對(duì)應(yīng)的多個(gè)所述頻譜平整度值,將其中的數(shù)值 最大的頻譜平整度值對(duì)應(yīng)的延遲系數(shù)組合作為反饋延遲網(wǎng)絡(luò)延遲線的延遲系數(shù)組合,對(duì)輸 入信號(hào)按此延遲系數(shù)組合進(jìn)行反饋延遲處理后輸出,從而可以使得輸出信號(hào)的音色高度自 然。
[0040] 本發(fā)明中,所述根據(jù)預(yù)設(shè)選擇條件選擇確定多個(gè)延遲系數(shù)組合滿足下列條件:
[0041] EiMi彡0.15fs · T60且Max(Mi)彡2.5 · Min(Mi),
[0042] 其中,彡I,i為正整數(shù),I為延遲線總數(shù)量,M表示延遲線系數(shù)(Delay Line Lengths),I條延遲線互質(zhì),T60為房間混響,fs為音頻信號(hào)的采樣率。
[0043] 所述I條延遲線互質(zhì)是指包括多條延遲線,如圖2所示有3條延遲線,M1,M 2,M3,它們 之間兩兩互質(zhì)I1表示第i條延遲線的延遲系數(shù)或參數(shù),即延遲的采樣點(diǎn)數(shù)。該預(yù)設(shè)選擇條 件是意思是多條延遲線中的延遲項(xiàng)M的總和大于等于0.15*f s*T60。如圖2所示,則為MdM2+ M3 大于等于 0.15*fs*T60
[0044] 通過(guò)使預(yù)先選擇的延遲線的延遲系數(shù)組合滿足上列條件,然后在利用頻譜平整度 對(duì)延遲線的延遲系數(shù)M組合進(jìn)行選擇,從而在該條件下選擇計(jì)算出頻譜平整度最接近理想 狀態(tài)的頻譜平整度值所對(duì)應(yīng)的延遲線的延遲系數(shù)M組合,并利用該延遲線的延遲系數(shù)M組合 作為反饋延遲網(wǎng)絡(luò)的延遲優(yōu)化參數(shù)對(duì)音色進(jìn)行優(yōu)化輸出,從而使得輸出信號(hào)的音色高度自 然。
[0045] 本發(fā)明中,所述頻譜平整度值的理想的計(jì)算公式如下:
[0046]
[0047] 其中,l = f,fs為音頻信號(hào)的采樣率,F(xiàn)latness為頻譜平整度,取值范圍為(0,1), 1代表頻譜的絕對(duì)平整,X(k)為反饋延遲網(wǎng)絡(luò)的輸出頻率響應(yīng)的幅值,k代表頻率。
[0048] 然而在上述優(yōu)化過(guò)程中,通過(guò)生成沖擊響應(yīng)再進(jìn)行優(yōu)化的方式可能導(dǎo)致模擬時(shí)間 變長(zhǎng),為縮短模擬時(shí)間,上述優(yōu)化的方法可近似通過(guò)頻率響應(yīng)解析解的近似方式得到。因?yàn)?單條延遲反饋線可等效于一個(gè)梳狀濾波器,其頻率響應(yīng)解析解H( z)為:
[0049]
[0050] g為增益如圖1所示,M為延遲線延遲參數(shù),故頻率響應(yīng)的幅值G(W)為:
[0051]
[0052 ]其中e為自然對(duì)數(shù),j為虛數(shù)符號(hào),w為角頻率,故系統(tǒng)總頻響X (k)可近似為:
[0053] x(k)^EiGi(w)
[0054] 其中,W = 2Jik,I<i<I,I為延遲線數(shù)量,所述頻譜平整度Flatness的優(yōu)化計(jì)算公 式可以近似為如下:
[0055]
[0056] 通過(guò)此近似的優(yōu)化公式可以大大縮短模擬時(shí)間,加快進(jìn)程。
[0057] 頻率響應(yīng)比較,參見(jiàn)圖3-6所示:
[0058] 圖3是滿足預(yù)設(shè)選擇條件下選擇的M的頻率響應(yīng),圖4是滿足預(yù)設(shè)選擇條件且使頻 譜平整度值最大條件下的頻率響應(yīng),可以看出通過(guò)頻譜平整度優(yōu)化的頻譜更平整。
[0059]圖5是滿足預(yù)設(shè)選擇條件下選擇的M的時(shí)間頻率響應(yīng),圖6是滿足預(yù)設(shè)選擇條件且 使頻譜平整度值最大條件下的時(shí)間頻率響應(yīng),可見(jiàn)通過(guò)頻譜平整度優(yōu)化的結(jié)果的時(shí)間頻率 譜更均勻、隨機(jī),即更自然,像真實(shí)測(cè)量的房間Late部分頻響。
[0060]以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人 員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng) 視為本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1. 一種反饋延遲網(wǎng)絡(luò)音色優(yōu)化的方法,其特征在于,在選擇反饋延遲網(wǎng)絡(luò)延遲線的延 遲系數(shù)時(shí)通過(guò)W下步驟進(jìn)行; 根據(jù)預(yù)設(shè)選擇條件選擇確定多個(gè)延遲系數(shù)組合; 計(jì)算多個(gè)所述延遲系數(shù)組合所分別對(duì)應(yīng)的多個(gè)頻譜平整度值; 比較多個(gè)所述頻譜平整度值,將其中的數(shù)值最大的頻譜平整度值對(duì)應(yīng)的延遲系數(shù)組合 作為反饋延遲網(wǎng)絡(luò)延遲線的延遲系數(shù)組合。2. 根據(jù)權(quán)利要求1所述反饋延遲網(wǎng)絡(luò)音色優(yōu)化的方法,其特征在于,所述根據(jù)預(yù)設(shè)選擇 條件選擇確定多個(gè)延遲系數(shù)組合滿足下列條件: EiMi^O. 15fs ? T60且Max(Mi)《2.5 ? Min(Mi), 其中,為延遲線數(shù)量,M表示延遲線系數(shù),I條延遲線互質(zhì),T60為房間混響,fs 為音頻信號(hào)的采樣率。3. 根據(jù)權(quán)利要求1或2所述反饋延遲網(wǎng)絡(luò)音色優(yōu)化的方法,其特征在于,所述頻譜平整 度值的計(jì)算公式如下:其中natness為頻譜平整度,取值范圍為(0,l),fs為音頻信號(hào)的采樣率,X化) 為反饋延遲網(wǎng)絡(luò)的輸出頻率響應(yīng)的幅值,k代表頻率。4. 根據(jù)權(quán)利要求1或2所述反饋延遲網(wǎng)絡(luò)音色優(yōu)化的方法,其特征在于,所述頻譜平整 度值的計(jì)算采用如下公式?其CFlatness為頻譜平整度,取值范圍為(0,l),w = 2址,Gi(W)為第i條延遲線 的頻率響應(yīng)的幅值,fs為音頻信號(hào)的采樣率,k代表頻率,1《1《1,1為延遲線數(shù)量。
【文檔編號(hào)】H04S7/00GK105916095SQ201610374440
【公開(kāi)日】2016年8月31日
【申請(qǐng)日】2016年5月31日
【發(fā)明人】楊維國(guó), 侯歡, 周寅騰
【申請(qǐng)人】音曼(北京)科技有限公司