音頻信號(hào)處理的制作方法
【專利說(shuō)明】
[0001] 相關(guān)申請(qǐng)奪叉引用
[0002] 本申請(qǐng)要求申請(qǐng)日為2013年11月27日、發(fā)明名稱為"音頻信號(hào)處理"、申請(qǐng)?zhí)枮?201310629975. 6的中國(guó)專利申請(qǐng)的優(yōu)先權(quán)。
技術(shù)領(lǐng)域
[0003] 本發(fā)明總體上涉及音頻信號(hào)處理,更具體地,涉及用于低延遲的特定于設(shè)備的音 頻信號(hào)處理的方法和系統(tǒng)。
【背景技術(shù)】
[0004] 為了以良好的質(zhì)量回放音頻信號(hào),通常需要對(duì)音頻信號(hào)進(jìn)行處理。例如,可以根 據(jù)目標(biāo)回放設(shè)備的特性或者參數(shù)來(lái)處理音頻信號(hào)。這種處理稱為特定于設(shè)備的(device specific)或者以設(shè)備為中心(device centric)音頻信號(hào)處理。一般而言,特定于設(shè)備的 音頻信號(hào)處理包括與根據(jù)回放設(shè)備和/或環(huán)境的呈現(xiàn)和校正有關(guān)的所有處理。通常,特定 于設(shè)備的音頻信號(hào)處理可以包括均衡器(equalizer)處理、調(diào)節(jié)器(regulator)處理、峰值 限制(peak limiting)處理,等等。作為示例,如果回放設(shè)備重現(xiàn)音頻信號(hào)中的高頻分量的 能力有限,則可以對(duì)音頻信號(hào)進(jìn)行處理以相應(yīng)地抑制高頻分量,從而避免在回放中的任何 破音、失真或者其他可聽(tīng)到的瑕疵。當(dāng)然,將會(huì)理解,可以出于任何其他目的來(lái)處理音頻信 號(hào)。
[0005] 對(duì)于VoIP(網(wǎng)際語(yǔ)音)通信和游戲等某些情況而言,音頻信號(hào)處理的延遲是一個(gè) 重要因素。較長(zhǎng)的音頻信號(hào)處理延遲很可能降低應(yīng)用的總體性能,并且對(duì)用戶體驗(yàn)造成不 良影響。然而目前,用于音頻信號(hào)處理的方案通常出于保真度的考慮而無(wú)法使延遲最小化。 具體而言,音頻信號(hào)處理通常包括在時(shí)域與頻域之間的變換。例如,音頻信號(hào)可以從時(shí)域被 變換到頻域以獲得一系列頻率系數(shù)。這些頻率系數(shù)可以根據(jù)回放設(shè)備的特性而被修改。繼 而,具有經(jīng)修改系數(shù)的音頻信號(hào)被變換回時(shí)域以便回放。在音頻處理延遲與計(jì)算效率之間 存在著權(quán)衡。為了實(shí)現(xiàn)濾波器頻率響應(yīng)中的高分辨率,已知的方案不得不以較高的計(jì)算代 價(jià)或者顯著的延遲進(jìn)行操作。而且,為了允許對(duì)所有頻率參數(shù)的精細(xì)控制,現(xiàn)有方案通常將 會(huì)引入較高的失真或者較長(zhǎng)的延遲。然而,在某些音頻信號(hào)處理(例如,特定于設(shè)備的音頻 處理)中,可能僅需要修改少數(shù)頻帶的帶能量便能夠滿足多數(shù)用戶的質(zhì)量需求。
[0006] 由此,本領(lǐng)域中需要一種低延遲的音頻信號(hào)處理的解決方案。
【發(fā)明內(nèi)容】
[0007] 為了解決上述以及其他潛在的問(wèn)題,本發(fā)明提出一種用于處理音頻信號(hào)的方法和 系統(tǒng)。
[0008] 在一方面,本發(fā)明的實(shí)施例提供一種用于處理音頻信號(hào)的方法。該方法包括:針對(duì) 所述音頻信號(hào)的當(dāng)前幀,至少部分地基于所述當(dāng)前幀的頻率參數(shù),確定多個(gè)預(yù)定義頻帶的 頻帶能量;通過(guò)處理所述頻帶能量,生成所述多個(gè)預(yù)定義頻帶的頻帶增益;以及使用預(yù)定 義的頻帶濾波器組,基于所述頻帶增益生成針對(duì)所述當(dāng)前幀的頻點(diǎn)增益,所述頻帶濾波器 組特定于所述多個(gè)預(yù)定義頻帶。
[0009] 在另一方面,本發(fā)明的實(shí)施例提供一種用于處理音頻信號(hào)的系統(tǒng)。該系統(tǒng)包括:頻 帶能量確定單元,被配置為針對(duì)所述音頻信號(hào)的當(dāng)前幀,至少部分地基于所述當(dāng)前幀的頻 率參數(shù),確定多個(gè)預(yù)定義頻帶的頻帶能量;頻帶增益生成單元,被配置為通過(guò)處理所述頻帶 能量,生成所述多個(gè)預(yù)定義頻帶的頻帶增益;以及頻點(diǎn)增益生成單元,被配置為使用預(yù)定義 的頻帶濾波器組,基于所述頻帶增益生成針對(duì)所述當(dāng)前幀的頻點(diǎn)增益,所述頻帶濾波器組 特定于所述多個(gè)預(yù)定義頻帶。
[0010] 通過(guò)下文描述將會(huì)理解,根據(jù)本發(fā)明的實(shí)施例,可以簡(jiǎn)單地通過(guò)操作特定數(shù)目的 預(yù)定義頻帶的頻帶增益來(lái)實(shí)現(xiàn)音頻信號(hào)處理,其中所述頻帶是實(shí)現(xiàn)根據(jù)例如人類聽(tīng)覺(jué)特性 或者模型而被定義和固定下來(lái)的。由于頻帶是事先固定的,因此可以使用預(yù)定義的頻帶濾 波器組,基于頻帶增益導(dǎo)出頻點(diǎn)增益,從而降低音頻信號(hào)處理的延遲。本發(fā)明的實(shí)施例所帶 來(lái)的其他益處將通過(guò)下文描述而清楚。
【附圖說(shuō)明】
[0011] 通過(guò)參考附圖閱讀下文的詳細(xì)描述,本發(fā)明實(shí)施例的上述以及其他目的、特征和 優(yōu)點(diǎn)將變得易于理解。在附圖中,以示例而非限制性的方式示出了本發(fā)明的若干實(shí)施例,其 中:
[0012] 圖1示出了根據(jù)本發(fā)明的一個(gè)示例實(shí)施例的用于處理音頻信號(hào)的方法的流程圖;
[0013] 圖2示出了根據(jù)本發(fā)明的另一示例實(shí)施例的用于處理音頻信號(hào)的方法的流程圖;
[0014] 圖3示出了根據(jù)本發(fā)明的一個(gè)示例實(shí)施例的加窗信號(hào)的框圖;
[0015] 圖4A和圖4B示出了根據(jù)本發(fā)明的一個(gè)示例實(shí)施例的對(duì)數(shù)掃略(log swe?。┬盘?hào) 的頻帶激勵(lì)的框圖;
[0016] 圖5示出了根據(jù)本發(fā)明的示例實(shí)施例的示例對(duì)稱的五個(gè)揚(yáng)聲器配置的示例的示 意圖;
[0017] 圖6示出了根據(jù)本發(fā)明的示例實(shí)施例的用于處理音頻信號(hào)的系統(tǒng)的框圖;以及
[0018] 圖7示出了適于實(shí)現(xiàn)本發(fā)明的示例實(shí)施例的計(jì)算機(jī)系統(tǒng)的框圖。
[0019] 在各個(gè)附圖中,相同或?qū)?yīng)的標(biāo)號(hào)表不相同或?qū)?yīng)的部分。
【具體實(shí)施方式】
[0020] 下面將參考附圖中示出的若干示例實(shí)施例來(lái)描述本發(fā)明的原理。應(yīng)當(dāng)理解,描述 這些實(shí)施例只是為了使本領(lǐng)域技術(shù)人員能夠更好地理解進(jìn)而實(shí)現(xiàn)本發(fā)明,而并非以任何方 式限制本發(fā)明的范圍。
[0021] 本發(fā)明的基本思想是:通過(guò)控制頻域中的一組預(yù)定義頻帶的頻帶增益來(lái)處理音頻 信號(hào)。根據(jù)本發(fā)明的實(shí)施例,待操作的頻帶可以根據(jù)例如人類聽(tīng)覺(jué)特性或者模型而被事先 定義和固定。而且,由于頻帶是事先固定的,因此可以使用預(yù)定義的頻帶濾波器組以頻帶增 益為基礎(chǔ)生成頻點(diǎn)增益,從而縮短音頻信號(hào)處理中的延遲。另外,由于所要處理的頻率系數(shù) 的減少,與時(shí)頻變換(時(shí)域向頻域的變換)和頻時(shí)變換(頻域向時(shí)域的變換)相關(guān)聯(lián)的時(shí) 間代價(jià)將會(huì)顯著降低。
[0022] 首先參考圖1,其示出了根據(jù)本發(fā)明的示例實(shí)施例的用于處理音頻信號(hào)的方法 100的流程圖。
[0023] 在步驟S101,對(duì)于待處理的音頻信號(hào)的當(dāng)前幀或者塊,至少部分地基于當(dāng)前幀的 頻率參數(shù)來(lái)確定多個(gè)預(yù)定義頻帶的頻帶能量。在某些實(shí)施例中,音頻信號(hào)可以作為頻域信 號(hào)被輸入。例如,音頻信號(hào)的形式可以是一系列頻點(diǎn),每個(gè)頻點(diǎn)例如被表示為一個(gè)復(fù)數(shù)。備 選地,輸入音頻信號(hào)可以處于時(shí)域中,并且因此需要被變換到頻域中,這將在下文詳述。
[0024] 根據(jù)本發(fā)明的實(shí)施例,頻帶可以事先定義,例如根據(jù)人類聽(tīng)覺(jué)特性或者模型來(lái)定 義。例如,已經(jīng)證明:人類用戶對(duì)特定范圍內(nèi)的頻率是敏感的,例如0到24kHz的范圍。相 應(yīng)地,將僅對(duì)處于該范圍內(nèi)的頻帶進(jìn)行頻域處理。這樣,本發(fā)明的實(shí)施例利用了一種遵循人 類聽(tīng)覺(jué)系統(tǒng)的方便、高效的簡(jiǎn)化,以有助于降低延遲。例如,在某些實(shí)施例中,〇到24kHz范 圍內(nèi)的頻率可以被劃分為20個(gè)頻帶。應(yīng)當(dāng)注意,這僅僅是出于說(shuō)明目的,任何其他適當(dāng)?shù)?頻率范圍和/或頻帶數(shù)目均可被使用。
[0025] 對(duì)于當(dāng)前幀的每個(gè)預(yù)定義頻帶,可以存在與之關(guān)聯(lián)的頻率參數(shù)。頻率參數(shù)可以通 過(guò)各種不同的方式獲得。例如,在上文描述的某些實(shí)施例中,頻域音頻信號(hào)可以包括多個(gè)頻 點(diǎn),每個(gè)頻點(diǎn)被表示為一個(gè)復(fù)數(shù)。在這樣的實(shí)施例中,每個(gè)復(fù)數(shù)的實(shí)部和虛部可以被用作頻 率參數(shù)。備選地或附加地,可以通過(guò)對(duì)音頻信號(hào)的任何適當(dāng)?shù)念l率分析或者處理來(lái)獲得頻 率參數(shù)。
[0026] 每個(gè)頻帶的頻帶能量可以基于當(dāng)前幀的關(guān)聯(lián)頻率參數(shù)而確定。給定頻率參數(shù),可 以將頻帶能量計(jì)算為例如頻率參數(shù)的和或者平方和,這方面的示例實(shí)施例將在下文詳述。
[0027] 接下來(lái),方法100進(jìn)行到步驟S102,在此處理頻帶能量以生成預(yù)定義頻帶的頻帶 增益。根據(jù)本發(fā)明的實(shí)施例,對(duì)一個(gè)或多個(gè)頻帶能量的處理可以通過(guò)任何適當(dāng)?shù)念l域音頻 處理技術(shù)來(lái)實(shí)現(xiàn),包括但不限于均衡器處理、調(diào)節(jié)器處理、峰值限制處理,等等。相應(yīng)地,均 衡器、調(diào)節(jié)器、峰值限制器或者任何其他設(shè)備均可與本發(fā)明的實(shí)施例結(jié)合使用,不論它們是 目前已知的還是將來(lái)開(kāi)發(fā)的。特別地,在某些實(shí)施例中,為了生成頻帶增益,可以根據(jù)用于 回放音頻信號(hào)的回放設(shè)備的一個(gè)或多個(gè)參數(shù)來(lái)處理頻帶能量,從而實(shí)現(xiàn)特定于設(shè)備的音頻 信號(hào)處理。通過(guò)處理頻帶能量而生成頻帶增益的很多技術(shù)是已知的并且可以用于本發(fā)明的 實(shí)施例。本發(fā)明的范圍在這方面不受限制。
[0028] 繼而,在步驟S103,生成當(dāng)前幀的頻點(diǎn)增益。根據(jù)本發(fā)明的實(shí)施例,可以使用特定 于所述多個(gè)預(yù)定義頻帶的多個(gè)預(yù)定義頻帶濾波器組,以基于頻帶增益生成頻點(diǎn)增益。例如, 可以針對(duì)每個(gè)預(yù)定義頻帶而設(shè)計(jì)一個(gè)濾波器組。如上所述,頻帶是預(yù)定義的。相應(yīng)地,特定 于每個(gè)頻帶的頻帶濾波器組也可以被事先設(shè)計(jì)。通過(guò)向頻帶增益應(yīng)用這樣的頻帶濾波器 組,可以獲得多個(gè)頻點(diǎn)增益,其形式例如是濾波器系數(shù)。
[0029] 給定頻點(diǎn)增益,例如可以通過(guò)將頻點(diǎn)增益與相應(yīng)的頻點(diǎn)相乘來(lái)確定當(dāng)前幀的頻域 輸出。特別地,在某些實(shí)施例中,當(dāng)前幀的頻域輸出可以僅僅基于當(dāng)前幀的頻點(diǎn)來(lái)確定。在 某些備選實(shí)施例中,當(dāng)前幀的頻域輸出不僅可以基于當(dāng)前幀的頻點(diǎn)增益、而且還可以基于 音頻信號(hào)的至少一個(gè)先前幀的頻點(diǎn)增益而被確定。
[0030] 通過(guò)執(zhí)行方法100,本發(fā)明的實(shí)施例能夠以較低的延遲來(lái)處理音頻信號(hào)。具體而 言,如上所述,已知的方案需要獲得和處理大量的頻率系數(shù)以滿足質(zhì)量要求,這將導(dǎo)致變換 中的較長(zhǎng)延遲。相反,根據(jù)本發(fā)明的實(shí)施例,只需要針對(duì)特定數(shù)目的預(yù)定義的、固定的頻帶 來(lái)控制頻帶增益。由此,時(shí)頻變換和頻時(shí)變換的時(shí)間代價(jià)將會(huì)被顯著降低。而且,生成的頻 率增益可以通過(guò)預(yù)定義的頻帶濾波器組而被轉(zhuǎn)換為頻點(diǎn)增益,這些頻帶濾波器組是特定于 預(yù)定義頻帶的。因?yàn)檫@些頻帶濾波器組可以根據(jù)頻帶的定義而被設(shè)計(jì),因此快速地實(shí)現(xiàn)頻 點(diǎn)增益和頻域輸出的生成。
[0031] 圖2示出了根據(jù)本發(fā)明的示例實(shí)施例的用于處理音頻信號(hào)的方法200的流程圖。 將會(huì)理解,方法200可以被視為上文描述的方法100的