用于壓縮音頻信號(hào)的音頻壓縮系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種用于壓縮輸入音頻信號(hào)的音頻壓縮系統(tǒng)(100),所述音頻壓縮系統(tǒng)(100)包括:數(shù)字濾波器(101),其用于對(duì)所述輸入音頻信號(hào)進(jìn)行濾波以獲得濾波后音頻信號(hào),所述數(shù)字濾波器(101)包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響曲線形成;以及壓縮器(103),其用于基于所述濾波后音頻信號(hào)壓縮所述輸入音頻信號(hào)以獲得壓縮后音頻信號(hào)。
【專利說明】
用于壓縮音頻信號(hào)的音頻壓縮系統(tǒng)
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及音頻信號(hào)處理的領(lǐng)域。
【背景技術(shù)】
[0002] 音頻信號(hào)的動(dòng)態(tài)范圍的減小是錄音、放音和廣播領(lǐng)域中的重要話題。動(dòng)態(tài)范圍的 減小可能與使音頻信號(hào)的特性適應(yīng)于所采用的音頻設(shè)備的物理能力相關(guān)。
[0003] 為了減小音頻信號(hào)的動(dòng)態(tài)范圍,可以采用壓縮器。壓縮器的壓縮特性可以通過多 個(gè)壓縮參數(shù)控制,所述壓縮參數(shù)可能大大影響音頻信號(hào)的感知質(zhì)量。
[0004]參數(shù)的調(diào)整由于人聲感知的復(fù)雜特性可能具有挑戰(zhàn)性且極大地取決于音頻信號(hào) 的特性。
[0005] 在音頻工程師協(xié)會(huì)期刊1984年第3 2卷第3 16到3 27頁(yè)上的G.W.麥克納利 (G.W.McNally)的"數(shù)字音頻信號(hào)的動(dòng)態(tài)范圍控制(Dynamic Range Control of Digital Audio Signals)"中,描述使用壓縮器的動(dòng)態(tài)范圍壓縮。
【發(fā)明內(nèi)容】
[0006] 本發(fā)明的目標(biāo)是提供一種用于有效地壓縮輸入音頻信號(hào)的音頻壓縮系統(tǒng),所述系 統(tǒng)允許壓縮后音頻信號(hào)的高感知質(zhì)量。
[0007]此目標(biāo)通過獨(dú)立權(quán)利要求項(xiàng)的特征實(shí)現(xiàn)。另外的實(shí)施形式通過附屬權(quán)利要求項(xiàng)、 描述以及圖式顯而易見。
[0008] 本發(fā)明是基于以下發(fā)現(xiàn):輸入音頻信號(hào)可以通過數(shù)字濾波器濾波,其中數(shù)字濾波 器的頻率傳遞函數(shù)的基于頻率的幅值可以通過人耳的等響曲線形成。通過借助數(shù)字濾波器 對(duì)輸入音頻信號(hào)進(jìn)行濾波,輸入音頻信號(hào)的具有人耳的低響度靈敏度的部分可以被放大且 輸入音頻信號(hào)的具有人耳的高響度靈敏度的部分可以被衰減。換句話說,根據(jù)本發(fā)明,對(duì)于 音頻信號(hào)處理,考慮人聲感知的特性。壓縮器可以基于濾波后音頻信號(hào)依次壓縮輸入音頻 信號(hào)以獲得壓縮后音頻信號(hào)。因此壓縮可以集中在輸入音頻信號(hào)的具有人耳的低響度靈敏 度的部分上且因此增強(qiáng)壓縮后音頻信號(hào)的感知質(zhì)量。
[0009] 根據(jù)第一方面,本發(fā)明涉及一種用于壓縮輸入音頻信號(hào)的音頻壓縮系統(tǒng),所述音 頻壓縮系統(tǒng)包括:數(shù)字濾波器,其用于對(duì)輸入音頻信號(hào)進(jìn)行濾波以獲得濾波后音頻信號(hào),所 述數(shù)字濾波器包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響曲線形 成;以及壓縮器,其用于基于所述濾波后音頻信號(hào)壓縮輸入音頻信號(hào)以獲得壓縮后音頻信 號(hào)。因此,可以實(shí)現(xiàn)壓縮后音頻信號(hào)的高感知質(zhì)量。
[0010] 輸入音頻信號(hào)可以是采樣后和/或量化后音頻信號(hào)。輸入音頻信號(hào)可以包括單聲 道音頻信號(hào)、立體聲音頻信號(hào)或多聲道音頻信號(hào)。
[0011] 數(shù)字濾波器可以實(shí)施為有限脈沖響應(yīng)(finite impulse response,F(xiàn)IR)濾波器或 無限脈沖響應(yīng)(infinite impulse response,IIR)濾波器。數(shù)字濾波器的濾波特性可以使 用頻率傳遞函數(shù)在頻域中確定。
[0012] 人耳的等響曲線可能與基于頻率的聲壓曲線有關(guān),其中人類使用純的和/或穩(wěn)定 的音調(diào)感知恒定響度。人耳的等響曲線可以是根據(jù)ISO 226:2003的等響曲線。
[0013] 濾波后音頻信號(hào)可以是采樣后和/或量化后音頻信號(hào)。濾波后音頻信號(hào)可以包括 單聲道音頻信號(hào)、立體聲音頻信號(hào)或多聲道音頻信號(hào)。
[0014]壓縮器可以是數(shù)字壓縮器。壓縮器可以用于組合輸入音頻信號(hào)與濾波后音頻信號(hào) 以獲得壓縮后音頻信號(hào)。
[0015] 壓縮后音頻信號(hào)可以是采樣后和/或量化后音頻信號(hào)。壓縮后音頻信號(hào)可以包括 單聲道音頻信號(hào)、立體聲音頻信號(hào)或多聲道音頻信號(hào)。
[0016] 在根據(jù)第一方面本身的音頻壓縮系統(tǒng)的第一實(shí)施形式中,數(shù)字濾波器是用于對(duì)時(shí) 域輸入音頻信號(hào)進(jìn)行時(shí)域?yàn)V波以提供時(shí)域中的濾波后音頻信號(hào)的時(shí)域?yàn)V波器。因此,可以 實(shí)現(xiàn)對(duì)輸入音頻信號(hào)進(jìn)行濾波的低時(shí)延。
[0017] 可以對(duì)時(shí)域輸入音頻信號(hào)采樣以獲得一系列樣本,所述樣本可以通過時(shí)域?yàn)V波器 濾波以獲得濾波后音頻信號(hào)的一系列樣本。時(shí)域?yàn)V波器可以例如使用直接形式結(jié)構(gòu)或柵格 結(jié)構(gòu)實(shí)施。
[0018] 在根據(jù)第一方面本身或第一方面的任何前述實(shí)施形式的音頻壓縮系統(tǒng)的第二實(shí) 施形式中,頻率傳遞函數(shù)具有在預(yù)定頻率之下或之上的恒定幅值。因此,可以限制頻率傳遞 函數(shù)的幅值的總范圍。
[0019] 在預(yù)定頻率之下的恒定幅值的情況下,預(yù)定頻率可以例如是10Hz。在預(yù)定頻率之 上的恒定幅值的情況下,預(yù)定頻率可以例如是7kHz。
[0020] 頻率傳遞函數(shù)的幅值可以基于頻率歸一化。基于頻率的頻率傳遞函數(shù)的幅值的均 值可以具有值一。
[0021] 在根據(jù)第一方面本身或第一方面的任何前述實(shí)施形式的音頻壓縮系統(tǒng)的第三實(shí) 施形式中,頻率傳遞函數(shù)的相位基于頻率而線性增大或減小。因此,可以實(shí)現(xiàn)數(shù)字濾波器的 恒定群時(shí)延。
[0022]在根據(jù)第一方面本身、第一方面的第一實(shí)施形式或第一方面的第二實(shí)施形式的音 頻壓縮系統(tǒng)的第四實(shí)施形式中,頻率傳遞函數(shù)的相位是基于頻率恒定的,具體來說等于零。 因此,可以有效地實(shí)施數(shù)字濾波器。
[0023] 在根據(jù)第一方面本身或第一方面的任何前述實(shí)施形式的音頻壓縮系統(tǒng)的第五實(shí) 施形式中,頻率傳遞函數(shù)通過濾波器系數(shù)確定,其中數(shù)字濾波器包括確定單元和濾波單元, 其中所述確定單元用于基于至少一個(gè)等響曲線確定濾波器系數(shù),其中所述濾波單元用于基 于所確定的濾波器系數(shù)對(duì)音頻信號(hào)進(jìn)行濾波。因此,可以實(shí)現(xiàn)數(shù)字濾波器的濾波特性的調(diào) 適。
[0024] 確定單元可以用于基于至少一個(gè)等響曲線使用例如帕克斯-麥克萊倫算法的數(shù)字 濾波器設(shè)計(jì)技術(shù)確定濾波器系數(shù)。濾波器系數(shù)可以是實(shí)數(shù),例如2.5或7.8,或復(fù)數(shù),例如1+j 或4_3j。濾波器系數(shù)可以包括濾波器抽頭。
[0025] 濾波單元可以包括有限脈沖響應(yīng)(finite impulse response,F(xiàn)IR)或無限脈沖響 應(yīng)(infinite impulse response,IIR)濾波器結(jié)構(gòu)。
[0026]在根據(jù)第一方面的第五實(shí)施形式的音頻壓縮系統(tǒng)的第六實(shí)施形式中,確定單元用 于從與不同等響曲線相關(guān)聯(lián)的濾波器系數(shù)的集合選擇與所述等響曲線相關(guān)聯(lián)的濾波器系 數(shù)以便確定濾波器系數(shù)。因此,數(shù)字濾波器可以采用不同的等響曲線。
[0027] 在根據(jù)第一方面的第六實(shí)施形式的音頻壓縮系統(tǒng)的第七實(shí)施形式中,不同的等響 曲線與音頻信號(hào)的不同響度級(jí)相關(guān)聯(lián),其中確定單元進(jìn)一步用于確定音頻信號(hào)的響度級(jí), 其中確定單元進(jìn)一步用于基于所確定的響度級(jí)選擇與等響曲線相關(guān)聯(lián)的濾波器系數(shù)。因 此,數(shù)字濾波器的頻率傳遞函數(shù)可以根據(jù)音頻信號(hào)的響度級(jí)調(diào)適。
[0028] 音頻信號(hào)的響度級(jí)可能與在預(yù)定時(shí)間間隔內(nèi)的音頻信號(hào)的平均能量有關(guān)。所述預(yù) 定時(shí)間間隔可以例如是20ms或100ms。
[0029] 在根據(jù)第一方面本身或第一方面的任何前述實(shí)施形式的音頻壓縮系統(tǒng)的第八實(shí) 施形式中,壓縮器用于基于濾波后音頻信號(hào)確定壓縮增益信號(hào),且用于組合輸入音頻信號(hào) 與壓縮增益信號(hào)以獲得壓縮后音頻信號(hào)。因此,可以有效地執(zhí)行輸入音頻信號(hào)的壓縮。
[0030] 壓縮增益信號(hào)可以基于例如分段線性壓縮特性曲線的壓縮特性曲線從濾波后音 頻信號(hào)得到。輸入音頻信號(hào)與壓縮增益信號(hào)的組合可以包括輸入音頻信號(hào)與壓縮增益信號(hào) 的相乘。
[0031] 在根據(jù)第一方面本身或第一方面的任何前述實(shí)施形式的音頻壓縮系統(tǒng)的第九實(shí) 施形式中,音頻壓縮系統(tǒng)進(jìn)一步包括用于對(duì)壓縮后音頻信號(hào)進(jìn)行濾波的均衡濾波器,所述 均衡濾波器包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響曲線形 成。因此,可以實(shí)現(xiàn)音頻壓縮系統(tǒng)的平坦的頻率響應(yīng)。
[0032] 人耳的等響曲線可能與基于頻率的聲壓曲線有關(guān),其中人類使用純的和/或穩(wěn)定 的音調(diào)感知恒定響度。人耳的等響曲線可以是根據(jù)ISO 226:2003的等響曲線。
[0033]在根據(jù)第一方面本身或第一方面的任何前述實(shí)施形式的音頻壓縮系統(tǒng)的第十實(shí) 施形式中,音頻壓縮系統(tǒng)進(jìn)一步包括用于減小時(shí)域中的壓縮后音頻信號(hào)的最大幅值的峰值 限制器。因此,可以減輕壓縮后音頻信號(hào)的削波效果。
[0034] 峰值限制器可以實(shí)現(xiàn)為具有高壓縮閾值和/或高壓縮比的動(dòng)態(tài)范圍壓縮器。
[0035] 根據(jù)第二方面,本發(fā)明涉及一種用于壓縮輸入音頻信號(hào)的音頻壓縮方法,所述音 頻壓縮方法包括:通過數(shù)字濾波器對(duì)輸入音頻信號(hào)進(jìn)行濾波以獲得濾波后音頻信號(hào),所述 數(shù)字濾波器包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響曲線形 成;以及基于濾波后音頻信號(hào)壓縮輸入音頻信號(hào)以獲得壓縮后音頻信號(hào)。因此,可以實(shí)現(xiàn)壓 縮后音頻信號(hào)的高感知質(zhì)量。
[0036] 音頻壓縮方法可以通過根據(jù)第一方面本身或第一方面的任何實(shí)施形式的音頻壓 縮系統(tǒng)執(zhí)行。音頻壓縮方法的另外特征可直接由根據(jù)第一方面本身或第一方面的任何實(shí)施 形式的音頻壓縮系統(tǒng)的功能性產(chǎn)生。
[0037] 根據(jù)第三方面,本發(fā)明涉及一種用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波器,所述數(shù) 字濾波器包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響曲線形成。 因此,可以提供用于與人聲感知有關(guān)的應(yīng)用的數(shù)字濾波器。
[0038] 人耳的等響曲線可能與基于頻率的聲壓曲線有關(guān),其中人類使用純的和/或穩(wěn)定 的音調(diào)感知恒定響度。人耳的等響曲線可以是根據(jù)ISO 226:2003的等響曲線。
[0039] 根據(jù)第四方面,本發(fā)明涉及一種用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波方法,所述 數(shù)字濾波方法包括通過數(shù)字濾波器對(duì)音頻信號(hào)進(jìn)行濾波,所述數(shù)字濾波器包括具有基于頻 率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響曲線形成。因此,可以提供用于與人聲 感知有關(guān)的應(yīng)用的數(shù)字濾波方法。
[0040] 所述數(shù)字濾波方法可以通過根據(jù)第三方面本身的數(shù)字濾波器執(zhí)行。數(shù)字濾波方法 的另外特征可以直接由根據(jù)第三方面本身的數(shù)字濾波器的功能性產(chǎn)生。
[0041] 在根據(jù)第四方面本身的數(shù)字濾波方法的第一實(shí)施形式中,頻率傳遞函數(shù)通過濾波 器系數(shù)確定,其中所述數(shù)字濾波方法包括基于至少一個(gè)等響曲線確定濾波器系數(shù),且基于 所確定的濾波器系數(shù)對(duì)音頻信號(hào)進(jìn)行濾波。因此,可以實(shí)現(xiàn)數(shù)字濾波方法的濾波特性的調(diào) 適。
[0042] 在根據(jù)第四方面的第一實(shí)施形式的數(shù)字濾波方法的第二實(shí)施形式中,濾波器系數(shù) 的確定包括從與不同等響曲線相關(guān)聯(lián)的濾波器系數(shù)的集合選擇與所述等響曲線相關(guān)聯(lián)的 濾波器系數(shù)以便確定濾波器系數(shù)。因此,數(shù)字濾波方法可以采用不同的等響曲線。
[0043]根據(jù)第五方面,本發(fā)明涉及一種包括程序代碼的計(jì)算機(jī)程序,所述程序代碼當(dāng)在 計(jì)算機(jī)上執(zhí)行時(shí)用于執(zhí)行根據(jù)第二方面本身的音頻壓縮方法或用于執(zhí)行根據(jù)第四方面本 身或第四方面的任何實(shí)施形式的數(shù)字濾波方法。因此,可以自動(dòng)且可重復(fù)的方式應(yīng)用所述 方法。
[0044] 可以機(jī)器可讀程序代碼的形式提供所述計(jì)算機(jī)程序。所述程序代碼可以包括用于 計(jì)算機(jī)的處理器的一系列命令。計(jì)算機(jī)的處理器可以用于執(zhí)行程序代碼。
[0045] 本發(fā)明可以用硬件和/或軟件實(shí)施。
【附圖說明】
[0046] 本發(fā)明的【具體實(shí)施方式】將結(jié)合以下附圖進(jìn)行描述,其中:
[0047] 圖1示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的音頻壓縮系統(tǒng)的圖式;
[0048] 圖2示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的音頻壓縮方法的圖式;
[0049] 圖3示出根據(jù)實(shí)施形式的用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波器的圖式;
[0050] 圖4示出根據(jù)實(shí)施形式的用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波方法的圖式;
[0051]圖5示出根據(jù)實(shí)施形式的高動(dòng)態(tài)范圍音頻信號(hào)和壓縮后音頻信號(hào)的圖式;
[0052]圖6示出根據(jù)實(shí)施形式的動(dòng)態(tài)范圍壓縮原理的圖式;
[0053]圖7示出根據(jù)實(shí)施形式的使用指數(shù)衰減的時(shí)間平滑的圖式;
[0054]圖8示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的音頻壓縮系統(tǒng)的圖式;
[0055] 圖9示出根據(jù)實(shí)施形式的不同等響曲線的圖式;
[0056] 圖10示出根據(jù)實(shí)施形式的用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波器的圖式;
[0057] 圖11示出根據(jù)實(shí)施形式的用于對(duì)人耳的響度靈敏度建模的數(shù)字濾波器的頻率響 應(yīng)的圖式;
[0058] 圖12示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的壓縮器的圖式;
[0059] 圖13示出根據(jù)實(shí)施形式的均衡濾波器的頻率響應(yīng)的圖式;
[0060] 圖14示出說明根據(jù)實(shí)施形式的音頻壓縮系統(tǒng)對(duì)輸入音頻信號(hào)的作用的圖式;
[0061] 圖15示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的音頻壓縮系統(tǒng)的圖式;
[0062] 圖16示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的壓縮器的圖式;以及
[0063] 圖17示出根據(jù)實(shí)施形式的用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波器的圖式。
[0064] 相同參考符號(hào)指代相同或等效的特征。
【具體實(shí)施方式】
[0065] 圖1示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的音頻壓縮系統(tǒng)100的圖式。
[0066] 音頻壓縮系統(tǒng)100包括:數(shù)字濾波器101,其用于對(duì)輸入音頻信號(hào)進(jìn)行濾波以獲得 濾波后音頻信號(hào),所述數(shù)字濾波器101包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值 通過人耳的等響曲線形成;以及壓縮器103,其用于基于濾波后音頻信號(hào)壓縮輸入音頻信號(hào) 以獲得壓縮后音頻信號(hào)。
[0067] 輸入音頻信號(hào)可以是采樣后和/或量化后音頻信號(hào)。輸入音頻信號(hào)可以包括單聲 道音頻信號(hào)、立體聲音頻信號(hào)或多聲道音頻信號(hào)。
[0068] 數(shù)字濾波器101可以實(shí)施為有限脈沖響應(yīng)(finite impulse response,F(xiàn)IR)濾波 器或無限脈沖響應(yīng)(infinite impulse response,IIR)濾波器。數(shù)字濾波器101的濾波特性 可以使用頻率傳遞函數(shù)在頻域中確定。
[0069] 人耳的等響曲線可能與基于頻率的聲壓曲線有關(guān),其中人類使用純的和/或穩(wěn)定 的音調(diào)感知恒定響度。人耳的等響曲線可以是根據(jù)ISO 226:2003的等響曲線。
[0070] 濾波后音頻信號(hào)可以是采樣后和/或量化后音頻信號(hào)。濾波后音頻信號(hào)可以包括 單聲道音頻信號(hào)、立體聲音頻信號(hào)或多聲道音頻信號(hào)。
[0071] 壓縮器103可以是數(shù)字壓縮器。壓縮器103可以用于組合輸入音頻信號(hào)與濾波后音 頻信號(hào)以獲得壓縮后音頻信號(hào)。
[0072] 壓縮后音頻信號(hào)可以是采樣后和/或量化后音頻信號(hào)。壓縮后音頻信號(hào)可以包括 單聲道音頻信號(hào)、立體聲音頻信號(hào)或多聲道音頻信號(hào)。
[0073] 圖2示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的音頻壓縮方法200的圖式。
[0074]音頻壓縮方法200包括:通過數(shù)字濾波器對(duì)輸入音頻信號(hào)進(jìn)行濾波201以獲得濾波 后音頻信號(hào),所述數(shù)字濾波器包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人 耳的等響曲線形成;且基于濾波后音頻信號(hào)壓縮203輸入音頻信號(hào)以獲得壓縮后音頻信號(hào)。 [0075]音頻壓縮方法200可以通過圖1的音頻壓縮系統(tǒng)100執(zhí)行。音頻壓縮方法200的另外 特征可以直接由圖1的音頻壓縮系統(tǒng)100的功能性產(chǎn)生。
[0076] 圖3示出根據(jù)實(shí)施形式的用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波器101的圖式。
[0077] 數(shù)字濾波器101包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的 等響曲線形成。
[0078] 人耳的等響曲線可能與基于頻率的聲壓曲線有關(guān),其中人類使用純的和/或穩(wěn)定 的音調(diào)感知恒定響度。人耳的等響曲線可以是根據(jù)ISO 226:2003的等響曲線。
[0079] 圖4示出根據(jù)實(shí)施形式的用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波方法400的圖式。
[0080] 數(shù)字濾波方法400包括通過數(shù)字濾波器對(duì)音頻信號(hào)進(jìn)行濾波401,所述數(shù)字濾波器 包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響曲線形成。
[0081] 數(shù)字濾波方法400可以通過圖3的數(shù)字濾波器101執(zhí)行。數(shù)字濾波方法400的另外特 征可以直接由圖3的數(shù)字濾波器101的功能性產(chǎn)生。
[0082] 圖5示出根據(jù)實(shí)施形式的高動(dòng)態(tài)范圍音頻信號(hào)和壓縮后音頻信號(hào)的圖式。在左邊, 描繪具有峰值幅度1的原始高動(dòng)態(tài)范圍音頻信號(hào)。在右邊,描繪具有峰值幅度1但減少的動(dòng) 態(tài)范圍的壓縮后音頻信號(hào)。
[0083]例如平板計(jì)算機(jī)或智能電話的移動(dòng)裝置通常配備有較小的低質(zhì)量微型揚(yáng)聲器和 低功率放大器。因此,可以通過在此類裝置中的電聲系統(tǒng)再現(xiàn)的聲音的質(zhì)量可能被限制。具 體來說,可以產(chǎn)生的最大聲壓級(jí)可能被限制。這可能導(dǎo)致較高程度的信號(hào)失真和受限的動(dòng) 態(tài)范圍。
[0084]此外,此類裝置通常用于在可能需要高輸出電平的嘈雜環(huán)境中播放聲音。甚至,進(jìn) 一步的處理,例如為了補(bǔ)償揚(yáng)聲器之間的較小距離的立體聲擴(kuò)展,可能更進(jìn)一步減小最大 輸出電平。
[0085] 此問題的一個(gè)解決方案可以是較高質(zhì)量的揚(yáng)聲器和具有較高輸出功率的放大器 的集成。然而,這可能需要可能不能集成到較小移動(dòng)裝置中的較大揚(yáng)聲器和消耗來自電池 的更多能量的放大器。因此,可能需要能夠增強(qiáng)通過此類移動(dòng)裝置產(chǎn)生的聲學(xué)信號(hào)的所感 知響度的信號(hào)處理技術(shù)。音頻信號(hào)的動(dòng)態(tài)范圍壓縮(Dynamic range compression,DRC)可 以是一種用于響度增強(qiáng)的技術(shù)。DRC的目標(biāo)可以是增加平均信號(hào)能量同時(shí)將峰值能量保持 在由電聲系統(tǒng)的能力施加的限制內(nèi)。為了實(shí)現(xiàn)此效果,一個(gè)策略可以是增強(qiáng)弱信號(hào)成分的 電平。
[0086] 圖5中說明音頻信號(hào)的動(dòng)態(tài)范圍壓縮的效果。左圖示出典型的音樂實(shí)例的信號(hào)幅 度。有規(guī)律地出現(xiàn)的高幅度峰值通常與擊鼓相對(duì)應(yīng)。信號(hào)可以進(jìn)行歸一化以獲得峰值幅度 1,所述峰值幅度可以與可以由電聲系統(tǒng)處理的最大幅度相對(duì)應(yīng)。數(shù)字音頻信號(hào)的幅度通常 約束到區(qū)間[_1;1]。超出這些限制的幅度可能導(dǎo)致削波,即,所述幅度可能受到所述限制的 限制。這可能導(dǎo)致高信號(hào)失真。此峰值幅度可以限制信號(hào)的總輸出電平,因?yàn)樗赡軆H很少 地在高動(dòng)態(tài)范圍音頻信號(hào)中出現(xiàn)。大部分信號(hào)可能具有低幅度。在此信號(hào)上執(zhí)行的動(dòng)態(tài)范 圍壓縮操作的結(jié)果可以產(chǎn)生繪制在圖5的右邊上的幅度。盡管所產(chǎn)生的信號(hào)的峰值幅度可 以仍為1,但可以界定所感知的平均響度的平均幅度可能高得多。具體來說,具有低幅度的 成分可以大大增強(qiáng)??梢员唤缍榈湍芰砍煞峙c高能量成分的比值的動(dòng)態(tài)范圍可以減小。
[0087] 圖6示出根據(jù)實(shí)施形式的動(dòng)態(tài)范圍壓縮原理的圖式。說明了動(dòng)態(tài)范圍壓縮的使用 基于峰值幅度檢測(cè)的靜態(tài)壓縮曲線的基本原理。無壓縮的情況通過實(shí)線說明。使用_15dB的 壓縮閾值和3:1的壓縮比的壓縮的情況通過虛線說明。
[0088] 輸入信號(hào)X和壓縮后信號(hào)X。之間的傳遞函數(shù)可以示出以下特性。在輸入信號(hào)X的電 平在以dB指定的給定閾值T之下的情況下,可能不修改所述輸入信號(hào)的電平;壓縮后信號(hào) Xc 可以與X相同。在輸入信號(hào)X的電平超出閾值T的情況下,X??梢越o定壓縮比R減小。壓縮比可 以使輸入信號(hào)的電平變化與輸出信號(hào)的電平變化有關(guān)。在此實(shí)例中,R = 3的壓縮比可以指 示輸入信號(hào)中超出閾值T 3dB的電平可以減小到輸出信號(hào)中在閾值之上僅1 dB的電平。因 此,與輸入信號(hào)的電平Px相比,壓縮后信號(hào)的電平4可以根據(jù)時(shí)變?cè)鲆鎔(t)減小。
[0089] 等式1可以如下給出:
[0090] Px(t) = 201ogio I x(t)
[0092][0093] 這可以是動(dòng)態(tài)范圍壓縮的基本原理。因?yàn)镈RC可以是在音樂記錄和制作中、甚至在
[0091] 模擬域中的重要話題,所以可以應(yīng)用許多不同的實(shí)施方案和擴(kuò)展。具體來說,圖6中示出的 分段線性壓縮曲線可以由軟壓縮曲線替代,例如,用S型曲線等膝狀或飽和壓縮曲線替代。 [0094]圖7示出根據(jù)實(shí)施形式的使用指數(shù)衰減的時(shí)間平滑的圖式。使用指數(shù)衰減的時(shí)間 平滑可以用于對(duì)攻擊和/或衰減時(shí)間建模。實(shí)線說明Ρχ。虛線說明使用30ms的攻擊濾波時(shí)間 常數(shù)和150ms的釋放濾波時(shí)間常數(shù)的P s。
[0095] 在沒有時(shí)間平滑的情況下,動(dòng)態(tài)范圍壓縮可能引入許多失真,因?yàn)檩敵鲂盘?hào)的電 平可能改變地太快。輸出信號(hào)可能不與輸入信號(hào)的特性類似。為了減少DRC的可聽失真,壓 縮增益可以緩慢地改變。
[0096] 實(shí)現(xiàn)此效果的方法可以是通過如圖7中所圖示添加指數(shù)衰減以用于攻擊和釋放時(shí) 間來平滑峰值幅度的檢測(cè)。為下標(biāo)為A的攻擊和下標(biāo)為R的釋放指定不同的時(shí)間常數(shù)t a、tr可 以允許控制對(duì)聲學(xué)事件的不同狀態(tài)的平滑效果。攻擊可以指代與信號(hào)電平中的增加一起的 事件的開始。釋放可以指代此事件的通常較慢的能量衰減。攻擊和釋放的指數(shù)衰減可以如 下計(jì)算:
[0097] τΑ、τκ可以被界定為達(dá)到攻擊和釋放的最后值的63%的時(shí)間;
[0098] ~且 α廣 e-9
[0099] 等式2可以如下給出:
[0100]
[0101] 隨后,Ps(t)可以替代px(t)用于等式1或2中以用于時(shí)變?cè)鲆鎔(t)的計(jì)算。
[0102] 可以使用不同的實(shí)施方案,例如,解耦、分支、前饋、反饋、側(cè)鏈、偏置和/或后置增 益實(shí)施方案。
[0103] 時(shí)間平滑參數(shù)設(shè)置可以與壓縮的量和音頻質(zhì)量之間的權(quán)衡即失真相關(guān)且可以構(gòu) 成壓縮的量和音頻質(zhì)量之間的權(quán)衡。具體來說,所述時(shí)間平滑參數(shù)設(shè)置可以影響如由鼓聲 或瞬態(tài)產(chǎn)生的幅度峰值可受影響的程度。在長(zhǎng)釋放時(shí)間常數(shù)的情況下,在峰值或瞬態(tài)之后, 信號(hào)可衰減較長(zhǎng)時(shí)間,且P y可減小太多。在短釋放時(shí)間常數(shù)的情況下,在瞬態(tài)之后可能發(fā)生 信號(hào)電平的跳躍。在長(zhǎng)攻擊時(shí)間常數(shù)的情況下,瞬態(tài)可能不衰減,因?yàn)樗鼈兛赡芏逃诠魰r(shí) 間,且峰值電平可仍較高。在短攻擊時(shí)間常數(shù)的情況下,瞬態(tài)可能被壓制,從而導(dǎo)致缺乏清 晰度,電平可能減小得太多,且瞬態(tài)的電平可與緊挨在瞬態(tài)之前的信號(hào)的電平相同。
[0104] 不同的解決方案可以應(yīng)用于DRC。評(píng)價(jià)DRC算法的四個(gè)主要標(biāo)準(zhǔn)可以是音質(zhì)、壓縮 率、計(jì)算復(fù)雜性以及用戶可控性。在壓縮和質(zhì)量之間可以存在權(quán)衡,因?yàn)楦邏嚎s通??蓪?dǎo)致 不良的音質(zhì)。在波形中的峰值,例如瞬態(tài)或攻擊,可以被衰減以獲得高壓縮增益。這可能導(dǎo) 致缺乏感知清晰度。如例如在TV和無線電廣播中使用的高質(zhì)量動(dòng)態(tài)范圍壓縮系統(tǒng)通??梢?在頻域中工作或作用于全頻帶信號(hào)的子帶分解。這可能導(dǎo)致高計(jì)算復(fù)雜性。特別是對(duì)于移 動(dòng)裝置,計(jì)算和能量資源可能是有限的。
[0105] 參數(shù)設(shè)置可以與獲得較高量的壓縮同時(shí)保持高音頻質(zhì)量相關(guān)。最優(yōu)參數(shù)設(shè)置還可 以取決于具體音頻信號(hào)和收聽環(huán)境。對(duì)于消費(fèi)裝置中的應(yīng)用,通??梢允褂帽J鼗虿⒎亲?優(yōu)的設(shè)置來預(yù)界定參數(shù)。用戶可能不具有除開和關(guān)以外的任何控制機(jī)制。
[0106] 圖8示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的音頻壓縮系統(tǒng)100的圖式。音頻 壓縮系統(tǒng)100可以包括動(dòng)態(tài)范圍壓縮系統(tǒng)。
[0107] 音頻壓縮系統(tǒng)100包括數(shù)字濾波器101、壓縮器103、均衡濾波器801以及峰值限制 器803。壓縮器103包括壓縮增益控制805和壓縮單元807。壓縮單元807包括參數(shù)規(guī)范單元 809、增益估計(jì)單元811、第一乘法器813以及第二乘法器815。參數(shù)規(guī)范單元809將壓縮閾值、 壓縮比、攻擊濾波時(shí)間常數(shù)以及釋放濾波時(shí)間常數(shù)提供給增益估計(jì)單元811。
[0108] 許多方法聚焦于音樂制作應(yīng)用。本發(fā)明尤其處理移動(dòng)放音情形,其中目標(biāo)可以是 實(shí)時(shí)地增加由智能電話和/或平板計(jì)算機(jī)等移動(dòng)裝置的揚(yáng)聲器產(chǎn)生的平均輸出電平,同時(shí) 保持高音質(zhì)和低計(jì)算復(fù)雜性以及低功耗或低電池功耗。
[0109] 本發(fā)明可以涉及如圖8中所描繪的增強(qiáng)音頻壓縮系統(tǒng)100或動(dòng)態(tài)范圍壓縮系統(tǒng)。音 頻壓縮系統(tǒng)100可以包括用于考慮人耳的靈敏度的頻率特性的人聲感知的模型,即,數(shù)字濾 波器101或?yàn)V波器等響模塊。音頻壓縮系統(tǒng)100可以包括用于減小瞬態(tài)的電平同時(shí)保持信號(hào) 清晰度的級(jí)聯(lián)動(dòng)態(tài)范圍壓縮系統(tǒng),即,與峰值限制器803或峰值限制器模塊級(jí)聯(lián)的壓縮器 103或動(dòng)態(tài)范圍壓縮模塊。音頻壓縮系統(tǒng)100或系統(tǒng)可以包括用于壓縮增益G的單一控制參 數(shù),所述控制參數(shù)可以由用戶或消費(fèi)者以連續(xù)方式控制。音頻壓縮系統(tǒng)100或系統(tǒng)可以包括 用于移動(dòng)裝置上的實(shí)時(shí)應(yīng)用的在時(shí)域中的低復(fù)雜性全頻帶實(shí)施方案。
[0110] 圖8中描繪音頻壓縮系統(tǒng)100或系統(tǒng)的流程圖。給定輸入信號(hào)x(t),音頻壓縮系統(tǒng) 100或系統(tǒng)可以執(zhí)行以下步驟。
[0111] 首先,可以應(yīng)用數(shù)字濾波器101或?yàn)V波器等響模塊,即,預(yù)處理操作,所述操作通過 用等響曲線對(duì)輸入信號(hào)X(t)進(jìn)行濾波來應(yīng)用簡(jiǎn)化響度模型以便獲得響度均衡輸入信號(hào)幻 (t)。預(yù)處理的目標(biāo)可以是加強(qiáng)信號(hào)中的人耳較不敏感的頻率。第二,可以應(yīng)用壓縮器103或 動(dòng)態(tài)范圍壓縮模塊。它可以包括參數(shù)規(guī)范單元809或參數(shù)規(guī)范模塊。給定以dB為單位的外 部、例如用戶指定的所希望的壓縮增益,可以最優(yōu)方式調(diào)整內(nèi)部動(dòng)態(tài)范圍壓縮參數(shù)T、R、ta、 tr。所述壓縮器或動(dòng)態(tài)范圍壓縮模塊可進(jìn)一步包括可以從響度均衡輸入信號(hào)xi(t)估計(jì)時(shí)變 增益g(t)的增益估計(jì)單元811或增益估計(jì)模塊。所獲得的壓縮在已經(jīng)通過均衡加強(qiáng)的區(qū)域 中可能更強(qiáng),所述區(qū)域可以與其中人耳較不敏感的區(qū)域相對(duì)應(yīng)。因此,動(dòng)態(tài)范圍壓縮的失真 可以為不太容易聽到的且可以應(yīng)用更強(qiáng)的壓縮。輸入信號(hào)x(t)的動(dòng)態(tài)范圍壓縮可以通過對(duì) 信號(hào)x(t)應(yīng)用時(shí)變?cè)鲆鎔(t)和所希望的壓縮增益G以獲得壓縮后信號(hào)xjt)來執(zhí)行。第三, 可以可選地應(yīng)用均衡濾波器801或均衡模塊,所述均衡濾波器或均衡模塊可以對(duì) Xc(t)應(yīng)用 均衡以校正取決于頻率的壓縮且重建信號(hào)xe(t)的平坦的頻率響應(yīng)。這還可以考慮揚(yáng)聲器 的頻率響應(yīng)。第四,可以可選地應(yīng)用峰值限制器803。可以應(yīng)用峰值和/或瞬態(tài)的軟限制以防 止在強(qiáng)攻擊階段中的削波以獲得輸出信號(hào)y(t)。
[0112] 圖9示出根據(jù)實(shí)施形式的不同等響曲線的圖式。
[0113] 耳朵可能并不對(duì)所有頻率同樣敏感。圖9示出對(duì)在整個(gè)可聽范圍上的不同頻率的 響應(yīng)作為示出被視為同樣響的聲壓級(jí)的曲線的集合。對(duì)于低和高頻率,聲壓級(jí)可能高得多 以獲得與在中間頻率中時(shí)相同的感知響度。曲線可在2到5kHz的范圍內(nèi)最低,在4kHz處具有 凹陷,指示耳朵可能對(duì)在此范圍中的頻率最敏感。較高或較低音調(diào)的強(qiáng)度級(jí)可以實(shí)質(zhì)上升 高以便產(chǎn)生相同的響度印象。此發(fā)現(xiàn)可以用于實(shí)現(xiàn)輸出信號(hào)的較高音質(zhì)。想法可以是在其 中人耳較不敏感的那些頻率區(qū)域中應(yīng)用更強(qiáng)的動(dòng)態(tài)范圍壓縮。
[0114] 圖10示出根據(jù)實(shí)施形式的用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波器101的圖式。數(shù) 字濾波器101可以包括濾波器等響模塊。
[0115] 數(shù)字濾波器101可以包括確定單元1001和濾波單元1003。確定單元1001可以用于 濾波器參數(shù)規(guī)范,其中可以將等響曲線提供到確定單元1001以獲得濾波器系數(shù)。濾波單元 1003可以基于濾波器系數(shù)對(duì)輸入信號(hào)x(t)進(jìn)行濾波以獲得響度均衡信號(hào)^(〇。
[0116] 可以通過用等響曲線濾波來應(yīng)用響度模型以對(duì)人耳的靈敏度建模。這可以增強(qiáng)其 中人耳較不敏感的頻率且可以使其中人耳高度敏感的頻率衰減。
[0117] 圖11示出根據(jù)實(shí)施形式的用于對(duì)人耳的響度靈敏度建模的數(shù)字濾波器的頻率響 應(yīng)的圖式。在低頻率處,放大可被約束且可能不通過揚(yáng)聲器再現(xiàn)。在高頻率處,放大可被約 束且通常通過揚(yáng)聲器增強(qiáng)。
[0118] 以下處理可以用于獲得此效果,見圖10。執(zhí)行具有類似于等響曲線的濾波器響應(yīng) 的濾波。這可以增強(qiáng)在其中人耳較不敏感的頻率處的電平且可以使其中人耳高度敏感的頻 率衰減。然后,隨后的動(dòng)態(tài)范圍壓縮可以集中在其中人耳較不敏感的頻率區(qū)域中,即高和低 頻率。因此,壓縮失真可以是不太容易聽到的。具體來說,2到5kHz或2到6kHz的頻率范圍可 幾乎不由動(dòng)態(tài)范圍壓縮修改。此范圍可以是對(duì)于聲音清晰度最重要的。
[0119] 如圖11中示出的濾波器響應(yīng)可以是基于等響曲線但根據(jù)若干方面修改。為了考慮 微型揚(yáng)聲器特性和能力,可以通過引入上限來限制最低和最高頻率的放大。此限制的動(dòng)機(jī) 可以是基于所考慮的使用小揚(yáng)聲器的應(yīng)用情形。此處,最低頻率可能不通過揚(yáng)聲器再現(xiàn)且 高頻率通常可以通過此類揚(yáng)聲器放大。限制放大可以考慮這一點(diǎn)。放大的總范圍,g卩,濾波 器響應(yīng)的最小值和最大值之間的差值,可能限于僅跨越15dB。從圖9可以看出,在單一等響 曲線的聲壓級(jí)中的最小值和最大值之間的差值可以達(dá)到80dB。在動(dòng)態(tài)范圍壓縮中,閾值T在 典型的應(yīng)用情形中可以設(shè)定成6和20dB之間的值。因此,應(yīng)用可以將某些頻率與其它頻率相 比放大80dB的均衡可以導(dǎo)致僅這些頻率被高度壓縮,然而,其它頻率可能未達(dá)到閾值且可 能因此根本不被壓縮。約束放大的總范圍可以允許控制不同頻率區(qū)域中的動(dòng)態(tài)范圍壓縮的 強(qiáng)度。
[0120] 圖12示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的壓縮器103的圖式。壓縮器103 可以包括壓縮單元807或動(dòng)態(tài)范圍壓縮模塊。
[0121] 壓縮單元807包括參數(shù)規(guī)范單元809、增益估計(jì)單元811、第一乘法器813以及第二 乘法器815。參數(shù)規(guī)范單元809將壓縮閾值T、壓縮比R以及攻擊濾波時(shí)間常數(shù)和釋放濾波時(shí) 間常數(shù)τ κ、τΑ提供給增益估計(jì)單元811??梢詫㈨懚染庖纛l信號(hào)X1(t)提供到增益估計(jì)單元 811。可以將輸入音頻信號(hào)x(t)提供到第二乘法器815。壓縮后音頻信號(hào)x c(t)可以通過第二 乘法器815提供。
[0122] 隨后,可以對(duì)輸入信號(hào)應(yīng)用動(dòng)態(tài)范圍壓縮,如圖12中示出。動(dòng)態(tài)范圍壓縮可以遵循 大體描述且可以使用相同的符號(hào)。
[0123] 首先,給定例如由用戶指定的所希望的壓縮增益G,用于如所引入的動(dòng)態(tài)范圍壓縮 的參數(shù)T、R、TA、tr可以如下得到。目標(biāo)可以是壓縮信號(hào)使得在x c(t)的峰值幅度和可以在不 削波的情況下再現(xiàn)的最大值Pmax之間產(chǎn)生G的余量。
[0124]
[0125] T = Pmax-G · A(l+1/R)
[0126] 發(fā)現(xiàn)可以是,為了獲得所希望的增益,R和T的不同的值是可能的。降低閾值可以允 許獲得較高G,但同時(shí)還可能增加受DRC影響的信號(hào)成分的量。增加壓縮比R,在閾值之上的 成分可能得到更強(qiáng)壓縮。選擇就感知質(zhì)量而言最優(yōu)的R和Τ值可能是困難的任務(wù)。發(fā)現(xiàn)是,閾 值Τ和壓縮比R之間的特定關(guān)系有希望獲得高質(zhì)量。此外,泛聽測(cè)試揭示:當(dāng)近似為下式時(shí), 動(dòng)態(tài)范圍壓縮的感知質(zhì)量最優(yōu)
[0127] R^G/(2dB)〇
[0128] 時(shí)間平滑常數(shù)tA、tr可通過減少壓縮的量以確保可對(duì)于獲得高感知質(zhì)量重要的時(shí) 間連續(xù)性來影響DRC結(jié)果。因此,所實(shí)現(xiàn)的最終壓縮低于所希望的G。平滑越強(qiáng),即,時(shí)間常數(shù) τΑ、τΚ越大,所實(shí)現(xiàn)的壓縮就越低。為了獲得最佳可能的感知質(zhì)量,可以取決于所希望的壓縮 增益G選擇時(shí)間常數(shù)的參數(shù)值。
[0129] TA^-0.0002sec/dB · G+0.006sec
[0130] TR^-〇.〇〇33sec/dB · G+0.12sec
[0131] 感知收聽測(cè)試揭示:時(shí)間常數(shù)和G之間的線性相關(guān)性產(chǎn)生最佳結(jié)果。為了增加 G的 值,時(shí)間常數(shù)可以線性減小。
[0132]作為平滑的結(jié)果,PS<PX可能發(fā)生。因此,可能希望添加容差λ多1以保證可以實(shí)現(xiàn) 所希望的壓縮增益G。所述容差可以考慮到,快速瞬態(tài)可能被攻擊衰減錯(cuò)過且可以導(dǎo)致高信 號(hào)峰值。因此,可以根據(jù)攻擊時(shí)間常數(shù)選擇容差的值。
[0133] λ=1.122+65 · Ι/sec · τΑ
[0134] 在得到最優(yōu)參數(shù)設(shè)置之后,可以從響度均衡信號(hào)x,⑴估計(jì)時(shí)變?cè)鲆鎔(t)。
[0135]
[0136]
[0137]
[0138] 且
[0139] aR =^?/τ\.αΑ=^?/:^
[0140] 最后,所述增益可以與所希望的壓縮增益G相乘或通過所希望的壓縮增益G放大且 最后與原始輸入信號(hào)X(t)相乘,且不與響度均衡信號(hào)相乘。這提供最佳可能質(zhì)量,因?yàn)樵?信號(hào)未由響度模型改變而是僅由響度校正增益改變。
[0141] xc(t)=x(t) · l〇G/20 · g(t)
[0142] 圖13示出根據(jù)實(shí)施形式的例如均衡濾波器801的均衡濾波器的頻率響應(yīng)的圖式。
[0143] 作為可選的后處理步驟,可以對(duì)信號(hào)應(yīng)用均衡濾波器801??赡芟M庋a(bǔ)償取決 于頻率的動(dòng)態(tài)范圍壓縮。通過響度模型增強(qiáng)的頻率范圍可以得到更強(qiáng)壓縮且因此可以接收 與通過響度模型衰減的頻率相比更低的電平。盡管此方法可以確保動(dòng)態(tài)范圍壓縮可以集中 在其中人耳對(duì)壓縮失真較不敏感的頻率范圍中,但它還可能產(chǎn)生不具有平坦的頻率響應(yīng)的 輸出信號(hào)。為了補(bǔ)償此效果,可以使用具有等響曲線的變體的再次濾波。
[0144] 可以調(diào)整如圖13中示出的濾波器響應(yīng)以補(bǔ)償由預(yù)處理濾波器針對(duì)相等響度產(chǎn)生 的影響增益g(t)的計(jì)算的非線性壓縮。因?yàn)樵鲆鎔(t)從響度均衡信號(hào)得到但可以應(yīng)用到原 始輸入信號(hào),所以壓縮后信號(hào)通??赡懿痪哂衅教沟念l率響應(yīng)。具體來說,可以使低和高頻 率衰減。在使用產(chǎn)生6dB的壓縮增益G的閾值T=12dB和2:1的比值的示例性壓縮的情況下, 圖13中示出的濾波器響應(yīng)可以被設(shè)計(jì)用于補(bǔ)償此效果。在此情況下,低和高頻率可以被放 大約2dB以便實(shí)現(xiàn)平坦的頻率響應(yīng)。對(duì)于G的不同值,所述響應(yīng)可以線性縮放。
[0145] 可能希望均衡補(bǔ)償取決于頻率的動(dòng)態(tài)范圍壓縮??梢允褂镁哂械软懬€的變體的 濾波。可能地,均衡取決于壓縮增益。并且,可以考慮目標(biāo)輸出裝置以界定均衡。
[0146] 圖14示出說明根據(jù)實(shí)施形式的例如音頻壓縮系統(tǒng)100的音頻壓縮系統(tǒng)對(duì)輸入音頻 信號(hào)x(t)的作用的圖式。音頻壓縮系統(tǒng)可以包括動(dòng)態(tài)范圍壓縮系統(tǒng)。第一波形示出輸入信 號(hào)x(t),第二波形示出在步驟三即均衡之后的音頻信號(hào)x e(t),且第三波形示出在步驟四即 峰值限制之后的音頻信號(hào)y (t)。
[0147] 作為最終步驟,可以應(yīng)用峰值限制器以防止輸出信號(hào)中的削波。削波可以涉及信 號(hào)的超出最大可能值Pmax的幅度。由于用時(shí)間常數(shù)tr、ta執(zhí)行的時(shí)間平滑,例如擊鼓等快速且 強(qiáng)的瞬態(tài)可能未被壓縮。因此,信號(hào)電平中的快速變化可以保留在輸出信號(hào)中,這可以是確 保高感知質(zhì)量或信號(hào)清晰度的重要方面。然而,這些峰值還可能防止可以在沒有削波的情 況下實(shí)現(xiàn)所希望的壓縮增益G。此問題的一個(gè)直接的解決方案可以是減小用于動(dòng)態(tài)范圍壓 縮模塊中的時(shí)間常數(shù)。但這可能降低質(zhì)量。
[0148] 當(dāng)添加峰值限制器作為最終處理步驟時(shí),可以實(shí)現(xiàn)高音質(zhì)同時(shí)避免削波。峰值限 制器可以是可以被調(diào)節(jié)以僅影響信號(hào)的其余峰值的動(dòng)態(tài)范圍壓縮器。為此目的,閾值T可以 設(shè)定成高閾值,例如T = _ldB,且壓縮比也可以較高,例如R = 60:l。與用于攻擊和釋放時(shí)間 常數(shù)的較小值一起,這些設(shè)置可以確保超出閾值且因此導(dǎo)致削波的任何峰值可以非常大的 比值被壓縮,例如R = 60:l。因此,超出閾值的峰值可以被較強(qiáng)地壓縮或軟削波以確保它們 不超出此閾值。
[0149] 通過壓縮單元或動(dòng)態(tài)范圍壓縮模塊執(zhí)行的緩慢動(dòng)態(tài)范圍壓縮可以確保可以通過 壓縮保持音頻信號(hào)的緩慢演進(jìn)的長(zhǎng)期和中期特性,且快速反應(yīng)峰值限制器可以執(zhí)行軟削波 以僅防止削波。在組合中,可以盡可能地保持信號(hào)質(zhì)量,具體來說信號(hào)清晰度,同時(shí)仍確保 高壓縮增益。
[0150] 圖14比較輸入信號(hào)x(t)與在均衡之后的壓縮后信號(hào)Xe(t)以及在峰值限制之后的 最終輸出信號(hào)y(t)。在動(dòng)態(tài)范圍壓縮之后,所述信號(hào)的中期水平特性可以得到保持,但超出 幅度值[_1;+1]的峰值可以保留在信號(hào) Xe(t)中。這些最后可以通過峰值限制器軟削波以獲 得?目號(hào)y(t)。
[0151] 圖15示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的音頻壓縮系統(tǒng)100的圖式。音 頻壓縮系統(tǒng)100可以包括動(dòng)態(tài)范圍壓縮系統(tǒng)。
[0152] 音頻壓縮系統(tǒng)100包括使用響度模型的數(shù)字濾波器101、壓縮器103、均衡濾波器 801以及峰值限制器803。壓縮器103包括壓縮增益控制805、用于內(nèi)部參數(shù)調(diào)適的參數(shù)規(guī)范 單元809以及用于動(dòng)態(tài)范圍壓縮的減壓縮單元1501??梢詫⑤斎胍纛l信號(hào)提供到數(shù)字濾波 器101且提供到減壓縮單元1501。輸出信號(hào)可以通過峰值限制器803提供。
[0153] 應(yīng)用簡(jiǎn)化的響度模型,即數(shù)字濾波器101或具有等響曲線的濾波器,可以加強(qiáng)其中 人耳較不敏感的頻率??梢詫?shí)現(xiàn)動(dòng)態(tài)范圍壓縮。由于響度模型,壓縮可以在其中耳朵較不敏 感且壓縮失真可不太容易聽到的區(qū)域中更強(qiáng)。應(yīng)用均衡以校正取決于頻率的壓縮且以重建 平坦頻率響應(yīng)可以是所希望的??刹捎糜糜诜乐乖趶?qiáng)攻擊階段中的削波的峰值限制器803。
[0154]圖16示出根據(jù)實(shí)施形式的用于壓縮輸入音頻信號(hào)的壓縮器103的圖式。壓縮器103 可以包括壓縮單元807或動(dòng)態(tài)范圍壓縮模塊。
[0155] 壓縮單元807包括參數(shù)規(guī)范單元809、增益估計(jì)單元811以及合路器單元1601。參數(shù) 規(guī)范單元809將壓縮閾值、壓縮比、攻擊濾波時(shí)間常數(shù)以及釋放濾波時(shí)間常數(shù)提供給增益估 計(jì)單元811??梢詫㈨懚染庖纛l信號(hào)提供到增益估計(jì)單元811。輸入音頻信號(hào)可以提供到 合路器單元1601。壓縮后音頻信號(hào)可以通過合路器單元1601提供。
[0156] 可以實(shí)現(xiàn)動(dòng)態(tài)范圍壓縮??梢詮捻懚染庑盘?hào)估計(jì)增益且將其應(yīng)用到原始輸入信 號(hào)。簡(jiǎn)化動(dòng)態(tài)范圍壓縮的參數(shù)設(shè)置可以是所希望的。用戶可以連續(xù)方式指定所希望的壓縮 增益G??梢缘玫絼?dòng)態(tài)范圍壓縮的參數(shù)THU且可以將其提供到DRC算法。因?yàn)榭赡艹霈F(xiàn) PS<PX,所以可以添加容差λ多1以獲得所希望的壓縮增益。
[0157] 圖17示出根據(jù)實(shí)施形式的用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波器101的圖式。數(shù) 字濾波器101可以包括濾波器等響模塊。
[0158] 數(shù)字濾波器101可以包括使用等響曲線的確定單元1001,以及濾波單元1003。濾波 單元1003可以對(duì)輸入音頻信號(hào)進(jìn)行濾波以提供響度均衡音頻信號(hào)。數(shù)字濾波器101可以是 基于響度模型。
[0159] 本發(fā)明可以經(jīng)專門定制用于在具有有限的電聲系統(tǒng)、處理能力和功耗的移動(dòng)裝置 上的應(yīng)用??梢蕴峁┹^高音質(zhì)。壓縮失真可以集中在具有較低的人耳靈敏度的頻率范圍中。 緩慢壓縮和快速峰值限制的組合可以盡可能地保留信號(hào)的緩慢和快速成分兩者的原始特 性??梢员A舾兄逦取?梢蕴峁┯脩艨煽貜?qiáng)度的壓縮??刹捎糜糜谥付ㄋM膲嚎s增 益的單一壓縮增益參數(shù)。所述參數(shù)可連續(xù)地調(diào)整以適應(yīng)于信號(hào)內(nèi)容和/或收聽環(huán)境。可以提 供計(jì)算簡(jiǎn)單的實(shí)施方案。可采用全頻帶處理而非頻域和/或子帶處理。可以實(shí)現(xiàn)低時(shí)延,因 為沒有頻率變換和/或子帶分解可被采用。
[0160] 在實(shí)施形式中,本發(fā)明涉及一種用于音頻信號(hào)的增強(qiáng)的動(dòng)態(tài)范圍壓縮的方法和設(shè) 備,包括用于考慮人耳的靈敏度的頻率特性的人聲感知的全頻帶模型,以及用于減小瞬態(tài) 的電平同時(shí)保持信號(hào)清晰度的級(jí)聯(lián)動(dòng)態(tài)范圍壓縮和軟削波系統(tǒng)。
[0161] 在實(shí)施形式中,本發(fā)明涉及所述方法和設(shè)備,進(jìn)一步包括用于使用戶以連續(xù)方式 控制用于壓縮增益的單一控制參數(shù)的單元,以及用于從指定的壓縮增益參數(shù)得到最優(yōu)參數(shù) 設(shè)置的內(nèi)部轉(zhuǎn)換器。
[0162] 在實(shí)施形式中,本發(fā)明涉及終端和/或解碼器特征。
【主權(quán)項(xiàng)】
1. 一種用于壓縮輸入音頻信號(hào)的音頻壓縮系統(tǒng)(100),其特征在于,所述音頻壓縮系統(tǒng) (100)包括: 數(shù)字濾波器(101),其用于對(duì)所述輸入音頻信號(hào)進(jìn)行濾波以獲得濾波后音頻信號(hào),所述 數(shù)字濾波器(101)包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響曲 線形成;以及 壓縮器(103),其用于基于所述濾波后音頻信號(hào)壓縮所述輸入音頻信號(hào)以獲得壓縮后 音頻信號(hào)。2. 根據(jù)權(quán)利要求1所述的音頻壓縮系統(tǒng)(100),其特征在于,所述數(shù)字濾波器(101)是用 于對(duì)時(shí)域輸入音頻信號(hào)進(jìn)行時(shí)域?yàn)V波以提供時(shí)域中的濾波后音頻信號(hào)的時(shí)域?yàn)V波器。3. 根據(jù)前述權(quán)利要求中任一項(xiàng)所述的音頻壓縮系統(tǒng)(100),其特征在于,所述頻率傳遞 函數(shù)具有在預(yù)定頻率之下或之上的恒定幅值。4. 根據(jù)前述權(quán)利要求中任一項(xiàng)所述的音頻壓縮系統(tǒng)(100),其特征在于,所述頻率傳遞 函數(shù)的相位基于頻率而線性增大或減小。5. 根據(jù)權(quán)利要求1到3所述的音頻壓縮系統(tǒng)(100),其特征在于,所述頻率傳遞函數(shù)的相 位是基于頻率恒定的,具體來說等于零。6. 根據(jù)前述權(quán)利要求中任一項(xiàng)所述的音頻壓縮系統(tǒng)(100),其特征在于,所述頻率傳遞 函數(shù)通濾波器系數(shù)確定,其中所述數(shù)字濾波器(101)包括確定單元(1001)和濾波單元 (1003),其中所述確定單元(1001)用于基于至少一個(gè)等響曲線確定所述濾波器系數(shù),其中 所述濾波單元(1003)用于基于所述所確定的濾波器系數(shù)對(duì)所述音頻信號(hào)進(jìn)行濾波。7. 根據(jù)權(quán)利要求6所述的音頻壓縮系統(tǒng)(100),其特征在于,所述確定單元(1001)用于 從與不同等響曲線相關(guān)聯(lián)的濾波器系數(shù)的集合選擇與所述等響曲線相關(guān)聯(lián)的濾波器系數(shù) 以便確定所述濾波器系數(shù)。8. 根據(jù)權(quán)利要求7所述的音頻壓縮系統(tǒng)(100),其特征在于,所述不同等響曲線與所述 音頻信號(hào)的不同響度級(jí)相關(guān)聯(lián),其中所述確定單元(1001)進(jìn)一步用于確定所述音頻信號(hào)的 所述響度級(jí),其中所述確定單元(1001)進(jìn)一步用于基于所述所確定的響度級(jí)選擇與所述等 響曲線相關(guān)聯(lián)的所述濾波器系數(shù)。9. 根據(jù)前述權(quán)利要求中任一項(xiàng)所述的音頻壓縮系統(tǒng)(100),其特征在于,所述壓縮器 (103)用于基于所述濾波后音頻信號(hào)確定壓縮增益信號(hào),且用于組合所述輸入音頻信號(hào)與 所述壓縮增益信號(hào)以獲得所述壓縮后音頻信號(hào)。10. 根據(jù)前述權(quán)利要求中任一項(xiàng)所述的音頻壓縮系統(tǒng)(100),其特征在于,進(jìn)一步包括 用于對(duì)所述壓縮后音頻信號(hào)進(jìn)行濾波的均衡濾波器(801),所述均衡濾波器(801)包括具有 基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響曲線形成。11. 根據(jù)前述權(quán)利要求中任一項(xiàng)所述的音頻壓縮系統(tǒng)(100),其特征在于,進(jìn)一步包括 用于減小時(shí)域中的所述壓縮后音頻信號(hào)的最大幅值的峰值限制器(803)。12. -種用于壓縮輸入音頻信號(hào)的音頻壓縮方法(200),其特征在于,所述音頻壓縮方 法(200)包括: 通過數(shù)字濾波器(101)對(duì)所述輸入音頻信號(hào)進(jìn)行濾波(201)以獲得濾波后音頻信號(hào),所 述數(shù)字濾波器(101)包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響 曲線形成;以及 基于所述濾波后音頻信號(hào)壓縮(203)所述輸入音頻信號(hào)以獲得壓縮后音頻信號(hào)。13. -種用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波器(101),其特征在于,所述數(shù)字濾波器 (101)包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響曲線形成。14. 一種用于對(duì)音頻信號(hào)進(jìn)行濾波的數(shù)字濾波方法(400),其特征在于,所述數(shù)字濾波 方法(400)包括通過數(shù)字濾波器(101)對(duì)所述音頻信號(hào)進(jìn)行濾波(401),所述數(shù)字濾波器 (101)包括具有基于頻率的幅值的頻率傳遞函數(shù),所述幅值通過人耳的等響曲線形成。15. -種計(jì)算機(jī)程序,其特征在于,包括當(dāng)在計(jì)算機(jī)上執(zhí)行時(shí)用于執(zhí)行根據(jù)權(quán)利要求12 所述的音頻壓縮方法(200)或用于執(zhí)行根據(jù)權(quán)利要求14所述的數(shù)字濾波方法(400)的程序 代碼。
【文檔編號(hào)】H03G7/00GK105900335SQ201480073003
【公開日】2016年8月24日
【申請(qǐng)日】2014年1月30日
【發(fā)明人】彼得·格羅舍, 郎玥, 張清
【申請(qǐng)人】華為技術(shù)有限公司