專利名稱:雙耳信號(hào)的信號(hào)生成的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及產(chǎn)生雙耳信號(hào)的與房間反射和/或回響有關(guān)的貢獻(xiàn)、產(chǎn)生雙耳信號(hào)自身、以及形成彼此間相似性減小的頭部相關(guān)傳遞函數(shù)集合。
背景技術(shù):
人類聽(tīng)覺(jué)系統(tǒng)能夠確定感知到的聲音來(lái)自哪個(gè)或哪些方向。為此,人類聽(tīng)覺(jué)系統(tǒng)評(píng)估右耳處接收到的聲音與左耳處接收到的聲音之間的特定差異。特定差異包括例如所謂的耳間提示,所述耳間提示是指耳朵之間的聲音信號(hào)差。耳間提示是最重要的定位方法。 耳朵之間的壓力等級(jí)差(即,耳間聲級(jí)差(ILD))是用于定位的最重要的單個(gè)提示。當(dāng)聲音從水平面以非零仰角到達(dá)時(shí),該聲音在每個(gè)耳朵中具有不同的聲級(jí)。與未被遮擋的耳朵相比,被遮擋的耳朵具有必然受抑制的聲像。用于定位的另一非常重要的特性是耳間時(shí)間差(ITD)。與未被遮擋的耳朵相比,被遮擋的耳朵離聲源的距離更遠(yuǎn),從而更晚獲得聲音波前。在低頻下強(qiáng)調(diào)ITD的含義,與未被遮擋的耳朵相比,低頻聲音在到達(dá)被遮擋的耳朵時(shí)沒(méi)有衰減很多。ITD在較高頻率下不太重要,這是因?yàn)槁曇舨ㄩL(zhǎng)與耳朵之間的距離更接近。因此,換言之,定位利用以下事實(shí)當(dāng)聲音從聲源分別傳播到收聽(tīng)者的左耳和右耳時(shí),聲音經(jīng)過(guò)與收聽(tīng)者的頭部、耳朵和肩膀的不同交互。當(dāng)人收聽(tīng)立體聲信號(hào)時(shí)會(huì)出現(xiàn)問(wèn)題,其中將由擴(kuò)音器裝置經(jīng)由耳機(jī)來(lái)再現(xiàn)的所述立體聲信號(hào)。當(dāng)收聽(tīng)者感到聲源位于頭部中時(shí),收聽(tīng)者很有可能認(rèn)為聲音不自然、難聽(tīng)并且煩擾。這種現(xiàn)象在學(xué)術(shù)上通常稱作“頭內(nèi)”定位。長(zhǎng)期收聽(tīng)“頭中”聲音會(huì)導(dǎo)致收聽(tīng)疲勞。 由于人類聽(tīng)覺(jué)系統(tǒng)在定位聲源時(shí)所依賴的信息(即,耳間提示)丟失或不清楚,因此會(huì)出現(xiàn)這種現(xiàn)象。為了呈現(xiàn)立體聲信號(hào)或者甚至具有多于兩個(gè)聲道的多聲道信號(hào)以實(shí)現(xiàn)耳機(jī)再現(xiàn), 可以使用方向?yàn)V波器來(lái)對(duì)這些交互進(jìn)行建模。例如,從解碼后的多聲道信號(hào)產(chǎn)生耳機(jī)輸出可以包括在解碼之后利用一對(duì)方向?yàn)V波器對(duì)每個(gè)信號(hào)進(jìn)行濾波。這些濾波器典型地對(duì)從房間內(nèi)虛擬聲源向收聽(tīng)者耳道的聲音傳輸進(jìn)行建模,所謂的雙耳房間傳遞函數(shù)(BRTF)。 BRTF執(zhí)行時(shí)間修改、聲級(jí)修改和譜修改、以及對(duì)房間反射和回響進(jìn)行建模??梢栽跁r(shí)間域或頻域?qū)崿F(xiàn)方向?yàn)V波器。然而,由于需要許多(即,NX2,其中N是解碼聲道的個(gè)數(shù))濾波器,所以這些方向?yàn)V波器非常長(zhǎng),如,在44. IkHz下有20000個(gè)濾波器抽頭,濾波過(guò)程需要非常大的計(jì)算量。 因此,有時(shí)將方向?yàn)V波器減小到最小。所謂的頭部相關(guān)傳遞函數(shù)(HRTF)包含方向信息,所述方向信息包括耳間提示。一般的處理模塊用于對(duì)房間反射和回響進(jìn)行建模。房間處理模塊可以是在時(shí)域或頻域的回響算法,并且可以對(duì)單聲道或二聲道輸入信號(hào)起作用,其中所述單聲道或二聲道輸入信號(hào)是通過(guò)對(duì)多聲道輸入信號(hào)的聲道求和而從多聲道輸入信號(hào)得到的。例如,在WO 99/14983A1中描述了這種結(jié)構(gòu)。如所描述的,房間處理模塊實(shí)現(xiàn)房間反射和/或回響。房間反射和回響對(duì)于所定位的聲音是重要的,尤其相對(duì)于距離和外化 (externalization)——意味著在收聽(tīng)者頭部外面感知到聲音。前述文獻(xiàn)還建議使用方向?yàn)V波器作為在相應(yīng)聲道的不同地延遲的版本上工作的HR濾波器集合,以對(duì)從聲源到相應(yīng)耳朵的直接路徑和不同反射進(jìn)行建模。此外,在對(duì)通過(guò)一對(duì)耳機(jī)提供更愉悅收聽(tīng)體驗(yàn)的多種方法的描述中,該文獻(xiàn)還建議分別相對(duì)于左后方聲道和右后方聲道的和與差,對(duì)中心聲道與左前方聲道的混合以及中心聲道與右前方聲道的混合進(jìn)行延遲。然而,這樣實(shí)現(xiàn)的收聽(tīng)結(jié)果仍然很大程度上缺乏雙耳輸出信號(hào)的空間寬度的減小以及缺乏外化。此外,已經(jīng)認(rèn)識(shí)到,除了上述呈現(xiàn)多聲道信號(hào)以實(shí)現(xiàn)耳機(jī)再現(xiàn)的方法外,常常對(duì)電影對(duì)白和音樂(lè)中的語(yǔ)音的一部分感到不自然、有回響并且空間上不等。
發(fā)明內(nèi)容
因此,本發(fā)明的目的是提供一種雙耳信號(hào)生成方案,從而實(shí)現(xiàn)更穩(wěn)定且舒適的耳機(jī)再現(xiàn)。根據(jù)權(quán)利要求1、3、4和7中任一項(xiàng)所述的設(shè)備以及根據(jù)權(quán)利要求16至19中任一項(xiàng)雙耳所述的方法實(shí)現(xiàn)了該目的。本發(fā)明所基于的第一思想是,通過(guò)以下操作可以實(shí)現(xiàn)用于耳機(jī)再現(xiàn)的更穩(wěn)定且舒適的雙耳信號(hào)以不同方式處理并因此而減小在多個(gè)聲道的左聲道和右聲道、所述多個(gè)聲道的前聲道和后聲道、以及所述多個(gè)聲道的中心聲道和非中心聲道中的至少一對(duì)聲道之間的相似性,從而得到彼此間相似性減小的聲道集合。然后將該彼此間相似性減小的聲道集合饋送至多個(gè)方向?yàn)V波器,多個(gè)方向?yàn)V波器后面是分別針對(duì)左耳和右耳的相應(yīng)混頻器。通過(guò)減小多聲道輸入信號(hào)的聲道的彼此間相似性,可以增大雙耳輸出信號(hào)的空間寬度并可以改善外化。本發(fā)明所基于的另一思想是,通過(guò)以下操作可以實(shí)現(xiàn)用于耳機(jī)再現(xiàn)的更穩(wěn)定且舒適的雙耳信號(hào)在譜變化的意義上,在所述多個(gè)聲道中的至少兩個(gè)聲道之間,以不同方式執(zhí)行相位和/或幅度修改,從而得到彼此間相似性減小的聲道集合,然后可以將所述彼此間相似性減小的聲道集合饋送至多個(gè)方向?yàn)V波器,所述多個(gè)方向?yàn)V波器后面是分別針對(duì)左耳和右耳的相應(yīng)混頻器。同樣,通過(guò)減小多聲道輸入信號(hào)的聲道的彼此間相似性,可以增大雙耳輸出信號(hào)的空間寬度并可以改善外化。當(dāng)通過(guò)以下方式來(lái)形成彼此間相似性減小的頭部相關(guān)傳遞函數(shù)集合時(shí),也可以實(shí)現(xiàn)上述優(yōu)點(diǎn)使原始的多個(gè)頭部相關(guān)傳遞函數(shù)的脈沖響應(yīng)相對(duì)于彼此而延遲,或在譜變化的意義上,相對(duì)于彼此以不同方式修改原始的多個(gè)頭部相關(guān)傳遞函數(shù)的脈沖響應(yīng)的相位響應(yīng)和/或幅度響應(yīng)??梢岳?,響應(yīng)于要使用的虛擬聲源位置的指示,通過(guò)使用頭部相關(guān)傳遞函數(shù)作為方向?yàn)V波器,作為設(shè)計(jì)步驟離線地進(jìn)行形成,或者在雙耳信號(hào)生成期間在線地進(jìn)行形成。本發(fā)明所基于的另一思想是,在以下情況下,電影或音樂(lè)中的一些部分產(chǎn)生更自然地感知的耳機(jī)再現(xiàn)形成多聲道信號(hào)的聲道的單聲道或立體聲下混頻,其中將對(duì)所述多聲道信號(hào)應(yīng)用房間處理器以產(chǎn)生雙耳信號(hào)的與房間反射/回響有關(guān)的貢獻(xiàn),使得所述多個(gè)聲道以在多聲道信號(hào)的至少兩個(gè)聲道之間不同的聲級(jí)處對(duì)單聲道或立體聲下混頻作出貢獻(xiàn)。例如,發(fā)明人意識(shí)到,典型地電影對(duì)白和音樂(lè)中的話音主要被混頻到多聲道信號(hào)的中心聲道,并且中心聲道信號(hào)在被饋送至房間處理模塊時(shí)產(chǎn)生常常不自然的回響和在譜方面不等的感知輸出。然而發(fā)明人發(fā)現(xiàn),通過(guò)利用聲級(jí)降低(例如3-12dB或具體地6dB的衰減)將中心聲道饋送至房間處理模塊,可以克服這種缺陷。
在下文中,關(guān)于附圖更詳細(xì)地描述了優(yōu)選實(shí)施例,附圖中圖1示出了根據(jù)實(shí)施例的用于生成雙耳信號(hào)的設(shè)備的框圖;圖2示出了根據(jù)另一實(shí)施例的用于形成彼此間相似性遞減的頭部相關(guān)傳遞函數(shù)集合的設(shè)備的框圖;圖3示出了根據(jù)另一實(shí)施例的用于生成雙耳信號(hào)的與房間反射和/或回響有關(guān)的貢獻(xiàn)的設(shè)備;圖如和4b示出了根據(jù)不同實(shí)施例的圖3的房間處理器的框圖;圖5示出了根據(jù)實(shí)施例的圖3的下混頻發(fā)生器發(fā)生器的框圖;圖6示出了根據(jù)實(shí)施例的對(duì)使用空間音頻編碼的多聲道信號(hào)的圖示加以表示的示意圖;圖7示出了根據(jù)實(shí)施例的雙耳輸出信號(hào)發(fā)生器;圖8示出了根據(jù)另一實(shí)施例的雙耳輸出信號(hào)發(fā)生器的框圖;圖9示出了根據(jù)另一實(shí)施例的雙耳輸出信號(hào)發(fā)生器的框圖;圖10示出了根據(jù)另一實(shí)施例的雙耳輸出信號(hào)發(fā)生器的框圖;圖11示出了根據(jù)另一實(shí)施例的雙耳輸出信號(hào)發(fā)生器的框圖;圖12示出了根據(jù)實(shí)施例的圖11的雙耳空間音頻解碼器的框圖;以及圖13示出了根據(jù)實(shí)施例的圖11的修改后的空間音頻解碼器的框圖。
具體實(shí)施例方式圖1示出了用于產(chǎn)生雙耳信號(hào)的設(shè)備,所述雙耳信號(hào)例如用于基于對(duì)多個(gè)聲道加以表示的多聲道信號(hào)的耳機(jī)再現(xiàn),以及用于通過(guò)具有與每個(gè)聲道相關(guān)聯(lián)的虛擬聲源位置的揚(yáng)聲器配置來(lái)再現(xiàn)。該設(shè)備通常以附圖標(biāo)記10來(lái)表示,包括相似性減小器12、多個(gè)方向?yàn)V波器14a-14h (方向?yàn)V波器14)、第一混頻器16a和第二混頻器16b。相似性減小器12被配置為將表示多個(gè)聲道18a_18d的多聲道信號(hào)18變成聲道彼此間相似性減小的聲道20a-20d聲道集合20。由多聲道信號(hào)18表示所表示的聲道 18a-18d的個(gè)數(shù)可以是兩個(gè)或多個(gè)。僅出于示意的目的,圖1中已經(jīng)明確示出了 4個(gè)聲道聲道18a-18d。多個(gè)聲道18例如可以包括中心聲道、左前方聲道、右前方聲道、左后方聲道以及右后方聲道。聲音設(shè)計(jì)器根據(jù)多個(gè)單獨(dú)音頻信號(hào)對(duì)聲道18a-18d進(jìn)行混頻,其中所述多個(gè)單獨(dú)音頻信號(hào)表示例如單獨(dú)指令、聲樂(lè)作品或其他單獨(dú)聲源,假定或目的在于由揚(yáng)聲器裝置(圖1中未示出)來(lái)再現(xiàn)聲道18a-18d,使揚(yáng)聲器位于與每個(gè)聲道18a-18d相關(guān)聯(lián)的預(yù)定虛擬聲源位置。根據(jù)圖1的實(shí)施例,多個(gè)聲道18a_18d至少包括左右聲道對(duì)、前后聲道對(duì)、或者中心與非中心聲道對(duì)。當(dāng)然,在多個(gè)聲道18a-18d(聲道18)內(nèi)可以存在多于一個(gè)上述對(duì)。相似性減小器12被配置為以不同方式處理并從而減小多個(gè)聲道中各個(gè)聲道之間的相似性, 以得到由聲道20a-20d組成的彼此間相似性減小的聲道集合20。根據(jù)第一方面,相似性減小器12可以減小多個(gè)聲道18中的左右聲道、多個(gè)聲道18中的前后聲道、以及多個(gè)聲道18中的中心與非中心聲道中至少一對(duì)聲道之間的相似性,以得到由聲道20a-20d組成的彼此間相似性減小聲道集合20。根據(jù)第二方面,附加地/備選地,相似性減小器(1 在譜變化的情況下在多個(gè)聲道中的至少兩個(gè)聲道之間以不同方式執(zhí)行相位和/或幅度修改,以得到彼此間相似性減小聲道集合20。如以下將更詳細(xì)描述的,例如,相似性減小器12可以通過(guò)使各個(gè)對(duì)相對(duì)于彼此而延遲,或通過(guò)例如在多個(gè)頻帶中的每個(gè)頻帶中將各個(gè)聲道對(duì)延遲不同的量,來(lái)實(shí)現(xiàn)不同的處理,從而得到彼此間相關(guān)性減小聲道集合20。當(dāng)然,也存在其他可能來(lái)減小聲道之間的相關(guān)性。換言之,相關(guān)性減小器12可以具有傳遞函數(shù),根據(jù)該傳遞函數(shù),每個(gè)聲道的譜能量分布保持相同,即,該傳遞函數(shù)作為相關(guān)音頻譜范圍上的量值1,然而相似性減小器12以不同方式修改其子帶或頻率分量的相位。例如,相關(guān)性減小器12可以被配置為同樣對(duì)聲道18的所有聲道或一個(gè)或多個(gè)聲道進(jìn)行相位修改,使得針對(duì)特定的頻帶,使第一聲道的信號(hào)相對(duì)于另一聲道而延遲至少一個(gè)采樣。此外,相關(guān)性減小器12可以被配置為同樣引起相位修改,使得對(duì)于多個(gè)頻帶,第一聲道相對(duì)于另一聲道的組延遲表現(xiàn)出至少八分之一采樣的標(biāo)準(zhǔn)偏差。所考慮的頻帶可以是Bark頻帶或任何其子集或其他頻帶子部分 (sub-division)。減小相關(guān)性并不是防止人類聽(tīng)覺(jué)系統(tǒng)遭遇頭內(nèi)定位的唯一途徑。相關(guān)性僅僅是多種可能方式之一,通過(guò)這些方式,人類聽(tīng)覺(jué)系統(tǒng)測(cè)量到達(dá)兩只耳朵的聲音的相似性,從而測(cè)量聲音的回程方向(in-bound direction)。相應(yīng)地,相似性減小器12還可以通過(guò)例如在多個(gè)頻帶中的每個(gè)頻帶中對(duì)各個(gè)聲道進(jìn)行不同量的聲級(jí)減小,來(lái)實(shí)現(xiàn)不同的處理,從而以譜形成的方式得到彼此間相似性減小聲道集合20。譜形成可以例如擴(kuò)大相對(duì)譜形成減小,例如由于耳朵的遮擋而引起的后聲道聲音相對(duì)于前聲道聲音的相對(duì)譜形成減小。相應(yīng)地,相似性減小器12可以相對(duì)于其他聲道對(duì)后聲道進(jìn)行譜變化聲級(jí)減小。在該譜形成中,相似性減小器12可以具有在相關(guān)音頻譜范圍上恒定的相位響應(yīng),然而相似性減小器12以不同方式修改其子頻帶或頻率分量的幅度。多聲道信號(hào)18表示多個(gè)聲道18a_18d的方式在原則上不限于任何特定表示。例如,多聲道信號(hào)18可以使用空間音頻編碼以壓縮方式表示多個(gè)聲道18a-18d。根據(jù)空間音頻編碼,可以利用多個(gè)聲道18a-18d被下混頻到的下混頻信號(hào)伴隨下混頻信息和空間參數(shù)來(lái)表示所述多個(gè)聲道18a-18d,其中所述下混頻信息表示將獨(dú)立聲道18a-18d混頻到下混頻聲道中所依據(jù)的混頻比,所述空間參數(shù)例如利用聲級(jí)/強(qiáng)度差、相位差、時(shí)間差和/或各個(gè)單獨(dú)聲道18a-18d之間的相關(guān)性/相關(guān)性的度量來(lái)描述多聲道信號(hào)的空間圖像。將相關(guān)性減小器12的輸出分割成各個(gè)單獨(dú)的聲道20a-20d??梢宰鳛闀r(shí)間信號(hào)、或作為光譜圖 (例如,譜分解到子頻帶中)來(lái)輸出聲道20a-20d。方向?yàn)V波器Ha-14h被配置為對(duì)聲道20a-20d中相應(yīng)的一個(gè)聲道的從與相應(yīng)聲道相關(guān)聯(lián)的虛擬聲源位置向收聽(tīng)者相應(yīng)耳道的聲傳播進(jìn)行建模。在圖1中,方向?yàn)V波器 Ha-14d對(duì)向例如左耳道的聲傳播進(jìn)行建模,而方向?yàn)V波器He-14d對(duì)向右耳道的聲傳輸進(jìn)行建模。方向?yàn)V波器可以對(duì)從室內(nèi)虛擬聲源位置向收聽(tīng)者耳道的聲傳輸進(jìn)行建模,并且可以通過(guò)執(zhí)行時(shí)間、聲級(jí)和譜修改并可選地對(duì)房間反射和回響進(jìn)行建模,來(lái)執(zhí)行該建模。可以在時(shí)域或頻域?qū)崿F(xiàn)方向?yàn)V波器18a-18h。即,方向?yàn)V波器可以是諸如濾波器、HR濾波器之類的時(shí)域?yàn)V波器,或者可以通過(guò)將各個(gè)傳遞函數(shù)采樣值與聲道20a-20d的各個(gè)譜值相乘而在頻域工作。具體地,方向?yàn)V波器Ha-14h可以被選擇為對(duì)相應(yīng)的頭部相關(guān)傳遞函數(shù)進(jìn)行建模,所述頭部相關(guān)傳遞函數(shù)描述了從相應(yīng)的虛擬聲源位置到相應(yīng)耳道的相應(yīng)聲道信號(hào) 20a-20d的交互,包括例如與人的頭部、耳朵和肩膀的交互。第一混頻器16a被配置為對(duì)方向?yàn)V波器14a_14d的輸出進(jìn)行混頻,以得到用于對(duì)雙耳輸出信號(hào)的左聲道作出貢獻(xiàn)或者甚至就是雙耳輸出信號(hào)的左聲道的信號(hào)22a,其中方向?yàn)V波器Ha-14d對(duì)于向收聽(tīng)者左耳道的聲傳輸進(jìn)行建模;而第二混頻器16b被配置為對(duì)方向?yàn)V波器14e-14h的輸出進(jìn)行混頻,以得到用于對(duì)雙耳輸出信號(hào)的右聲道作出貢獻(xiàn)或者甚至就是雙耳輸出信號(hào)的右聲道的信號(hào) 22b,其中方向?yàn)V波器He-14h對(duì)于向收聽(tīng)者右耳道的聲傳輸進(jìn)行建模。如以下將關(guān)于各個(gè)實(shí)施例而更詳細(xì)描述的,可以向信號(hào)2 和22b添加其他貢獻(xiàn), 以考慮室內(nèi)反射和/或回響。通過(guò)這種方式,可以降低方向?yàn)V波器14a_14h的復(fù)雜度。在圖1的設(shè)備中,相似性減小器12抵消對(duì)分別輸入到混頻器16a和16b中的相關(guān)信號(hào)進(jìn)行求和的負(fù)面效應(yīng),據(jù)此,可以導(dǎo)致雙耳輸出信號(hào)2 和22b的空間寬度有很大的減小并且缺乏外化。相似性減小器12所實(shí)現(xiàn)的去相關(guān)減小了這些負(fù)面效應(yīng)。在進(jìn)入下一實(shí)施例之前,換言之,圖1示出了從例如解碼后的多聲道信號(hào)產(chǎn)生耳機(jī)輸出的信號(hào)流。每個(gè)信號(hào)由方向?yàn)V波器對(duì)來(lái)濾波。例如,聲道18a由方向?yàn)V波器對(duì) Ha-He來(lái)濾波。不幸地,在典型的多聲道聲音產(chǎn)生中,聲道18a_18d之間存在很大的相似性(如,相關(guān)性)。這會(huì)對(duì)雙耳輸出信號(hào)造成負(fù)面影響。即,在用方向?yàn)V波器14a_14h處理了多聲道信號(hào)之后,在混頻器16a和16b中將方向?yàn)V波器14a-14h輸出的中間信號(hào)相加,以形成耳機(jī)輸出信號(hào)20a和20b。對(duì)相似/相關(guān)的輸出信號(hào)求和會(huì)使得輸出信號(hào)20a和20b 的空間寬度大大減小并且缺乏外化。這對(duì)于左右信號(hào)和中心聲道的相似性/相關(guān)性來(lái)說(shuō)是尤為成問(wèn)題的。相應(yīng)地,相似性減小器12用于盡可能地減小這些信號(hào)之間的相似性。應(yīng)注意,通過(guò)去除相似性減小器12,同時(shí)將方向性濾波器修改為不僅執(zhí)行前述對(duì)聲傳輸?shù)慕#€實(shí)現(xiàn)上述不相似性(如,去相關(guān)),可以實(shí)現(xiàn)相似性減小器12為了減小多個(gè)聲道18a-18d(聲道18)中各個(gè)聲道之間的相似性而執(zhí)行的大多數(shù)測(cè)量。相應(yīng)地,方向性傳感器可以不對(duì)HRTF進(jìn)行建模,而是對(duì)修改后的頭部相關(guān)傳遞函數(shù)進(jìn)行建模。圖2例如示出了設(shè)備,該設(shè)備用于形成彼此間相似性減小的頭部相關(guān)傳遞函數(shù)集合,以對(duì)聲道集合的從與相應(yīng)聲道相關(guān)聯(lián)的虛擬聲源位置向收聽(tīng)者耳道的聲傳輸進(jìn)行建模。通常由30來(lái)表示的設(shè)備包括HRTF提供器32和HRTF處理器34。HRTF提供器32被配置為提供原始的多個(gè)HRTF。步驟32可以包括使用標(biāo)準(zhǔn)仿真頭部的測(cè)量,以測(cè)量從特定聲位置向標(biāo)準(zhǔn)仿真收聽(tīng)者的耳道的頭部相關(guān)傳遞函數(shù)。類似地,HRTF提供器32可以被配置為簡(jiǎn)單地從存儲(chǔ)器查找或加載原始HRTF。備選地,HRTF提供器32可以被配置為例如根據(jù)感興趣的虛擬聲源位置按照預(yù)定的公式來(lái)計(jì)算HRTF。相應(yīng)地,HRTF提供器32可以被配置為工作在用于設(shè)計(jì)雙耳輸出信號(hào)發(fā)生器的設(shè)計(jì)環(huán)境中,或者可以是這種雙耳輸出信號(hào)發(fā)生器信號(hào)自身的一部分,以例如響應(yīng)于虛擬聲源位置的選擇或改變來(lái)在線提供原始HRTF。例如,設(shè)備30可以是雙耳輸出信號(hào)發(fā)生器的一部分,所述雙耳輸出信號(hào)發(fā)生器能夠提供針對(duì)不同揚(yáng)聲器配置的多聲道信號(hào),不同揚(yáng)聲器布置具有與其聲道相關(guān)聯(lián)的不同虛擬聲源位置聲道。在這種情況下,HRTF提供器32可以被配置為以適于當(dāng)前預(yù)期虛擬聲源位置的方式來(lái)提供原始HRTF。HRTF處理器34被配置為使至少HRTF對(duì)的脈沖響應(yīng)相對(duì)于彼此而位移,或在譜變
10化的情況下以不同方式相對(duì)于彼此來(lái)修改HRTF對(duì)的相位和/或幅度響應(yīng)。HRTF對(duì)可以對(duì)左右聲道、前后聲道、以及中心與非中心聲道中的一對(duì)聲道進(jìn)行建模。實(shí)際上,可以利用應(yīng)用于多聲道信號(hào)中的一個(gè)或多個(gè)聲道的以下技術(shù)之一或這些技術(shù)的組合來(lái)實(shí)現(xiàn)這一點(diǎn) 即,將相應(yīng)聲道的HRTF延遲;修改相應(yīng)HRTF的相位響應(yīng)和/或?qū)ο鄳?yīng)HRTF應(yīng)用諸如全通濾波器之類的去相關(guān)濾波器,從而得到彼此間相關(guān)性減小的HRTF集合;和/或在譜修改的情況下修改相應(yīng)HRTF的幅度響應(yīng),從而得到至少彼此間相似性減小的HRTF集合。在任一情況下,得到的各個(gè)聲道之間的去相關(guān)性/不相似性可以支持人類聽(tīng)覺(jué)系統(tǒng)外部地定位聲源,從而防止發(fā)生頭內(nèi)定位。例如,HRTF處理器34可以被配置為同樣引起聲道HRTF中的全部聲道、一個(gè)或多個(gè)聲道的相位響應(yīng)的修改,使得引入特定頻帶的第一 HRTF的組延遲, 或者將第一 HRTF的特定頻帶相對(duì)于另一個(gè)HRTF延遲至少一個(gè)采樣。此外,HRTF處理器 34可以被配置為同樣引起相位響應(yīng)的修改,使得針對(duì)多個(gè)頻帶,第一 HRTF相對(duì)于另一個(gè) HRTF的組延遲表現(xiàn)出至少八分之一采樣的標(biāo)準(zhǔn)偏差。所考慮的頻帶可以是Bark頻帶或其子頻帶或任何其他頻帶子部分。從HRTF處理器34得到的彼此間相似性減小的HRTF集合可以用于設(shè)定圖1的設(shè)備的方向?yàn)V波器14a_14h的HRTF,其中,可以存在或不存在相似性減小器12。由于修改后的HRTF的不相似性特性,即使當(dāng)沒(méi)有相似性減小器12時(shí)也可以類似地實(shí)現(xiàn)與雙耳輸出信號(hào)的空間寬度以及改進(jìn)的外化有關(guān)的前述優(yōu)點(diǎn)。如上所述,圖1的設(shè)備可以伴隨另一通路,所述另一通路被配置為基于輸入聲道 18a_18d中的至少一些聲道的下混頻,得到雙耳輸出信號(hào)的與房間反射和/或回響有關(guān)的貢獻(xiàn)。這降低了方向?yàn)V波器Ha-14h的復(fù)雜度。圖3示出了用于產(chǎn)生雙耳信號(hào)的這種與房間反射和/或房間回響有關(guān)的貢獻(xiàn)的設(shè)備。設(shè)備40包括彼此串聯(lián)的下混頻發(fā)生器42和房間處理器44,其中房間處理器44在下混頻發(fā)生器42后面。設(shè)備40可以連接在圖1的設(shè)備的輸入與雙耳輸出信號(hào)的輸出之間,在圖1的設(shè)備的輸入處輸入多聲道信號(hào)18,在雙耳輸出信號(hào)的該輸出處,將房間處理器44的左聲道貢獻(xiàn)46a添加到輸出22a,將房間處理器44 的右聲道輸出46b添加到輸出22b。下混頻發(fā)生器42根據(jù)多聲道信號(hào)18的聲道形成單聲道或立體聲下混頻48,處理器44被配置為通過(guò)基于單聲道或立體聲信號(hào)48對(duì)房間反射和 /或回響進(jìn)行建模,來(lái)產(chǎn)生雙耳信號(hào)的與房間反射和/或回響有關(guān)的貢獻(xiàn)的左聲道46a和右聲道46b。房間處理器44所基于的思想是,例如可以基于下混頻(例如,多聲道信號(hào)18的聲道的簡(jiǎn)單的求和)以對(duì)收聽(tīng)者透明的方式來(lái)建模在房間內(nèi)出現(xiàn)的房間反射/回響。由于與沿著從聲源到耳道的直接路徑或視線傳播的聲音相比,房間反射/回響出現(xiàn)較晚,所以房間處理器的脈沖響應(yīng)代表或替代圖1所示方向?yàn)V波器的脈沖響應(yīng)的尾部。可以將方向?yàn)V波器的脈沖響應(yīng)限制為收聽(tīng)者頭部、耳朵和肩膀處出現(xiàn)的直接路徑以及反射和衰減進(jìn)行建模,從而縮短方向?yàn)V波器的脈沖響應(yīng)。當(dāng)然,方向?yàn)V波器所建模的內(nèi)容與房間處理器44所建模的內(nèi)容之間的界限可以自由改變,使得方向?yàn)V波器還可以例如對(duì)第一房間反射/回響進(jìn)行建模。圖如和仙示出了房間處理器的內(nèi)部結(jié)構(gòu)的可能實(shí)現(xiàn)。根據(jù)圖la,為房間處理器 44饋送單聲道下混頻信號(hào)48,房間處理器44包括兩個(gè)回響濾波器50a和50b。與方向?yàn)V波器類似,回響濾波器50a和50b可以被實(shí)現(xiàn)為在時(shí)域或頻域操作?;仨憺V波器50a和50b
11的輸入都接收單聲道下混頻信號(hào)48?;仨憺V波器50a的輸出提供左聲道貢獻(xiàn)輸出46a,而回響濾波器50b輸出右聲道貢獻(xiàn)信號(hào)46b。圖4b示出了在為房間處理器44提供立體聲下混頻信號(hào)48的情況下,房間濾波器44的內(nèi)部結(jié)構(gòu)的示例。在這種情況下,房間處理器包括四個(gè)回響濾波器50a-50d?;仨憺V波器50a和50b的輸入連接至立體聲下混頻48的第一聲道48a,而回響濾波器50c和50d的輸入連接至立體聲下混頻48的另一聲道48b?;仨憺V波器50a和50c的輸出連接至加法器52a的輸入,加法器52a的輸出提供左聲道貢獻(xiàn)46a。 回響濾波器50b和50d的輸出連接至另一加法器52b的輸入,所述另一加法器52b的輸出提供右聲道貢獻(xiàn)46b。盡管已經(jīng)描述了下混頻發(fā)生器42可以簡(jiǎn)單地通過(guò)對(duì)每個(gè)聲道均等地加權(quán)來(lái)對(duì)多聲道信號(hào)18的聲道進(jìn)行求和,然而圖3的實(shí)施例并不限于此。相反,圖3的下混頻發(fā)生器 42可以被配置為形成單聲道或立體聲下混頻48,使得多個(gè)聲道,以在多聲道信號(hào)18的至少兩個(gè)聲道之間不同的聲級(jí)處,對(duì)單聲道或立體聲下混頻作出貢獻(xiàn)。通過(guò)這種方式,可以防止或促使被混頻到多聲道信號(hào)的特定的一個(gè)或多個(gè)聲道中的多聲道信號(hào)的特定內(nèi)容(如,語(yǔ)音或背景音樂(lè))受到房間處理,從而避免不自然的聲音。例如,圖3的下混頻發(fā)生器42可以被配置為形成單聲道或立體聲下混頻48,使得多聲道信號(hào)18的多個(gè)聲道的中的中央聲道以相對(duì)于多聲道信號(hào)18的其他聲道而言聲級(jí)降低的方式對(duì)單聲道或立體聲下混頻信號(hào)48作出貢獻(xiàn)。例如,聲級(jí)降低的量可以在3dB和 12dB之間。聲級(jí)降低可以均勻地分布在多聲道信號(hào)18的聲道的有效譜范圍上,或者可以是頻率相關(guān)的,如,集中在特定的譜部分(如,典型地被話音信號(hào)占用的譜部分)上。相對(duì)于其他聲道而言聲級(jí)降低的量可以與所有其他聲道相同。即,可以以同樣的聲級(jí)將其他聲道混頻到下混頻信號(hào)48中。備選地,可以以不等的聲級(jí)將其他聲道混頻到下混頻信號(hào)48中。 那么可以針對(duì)其他聲道的均值或者包括聲級(jí)降低的那個(gè)聲道在內(nèi)的所有聲道的均值,來(lái)測(cè)量相對(duì)于其他聲道而言的聲級(jí)降低的量。如果是這樣,則其他聲道的混頻權(quán)重的標(biāo)準(zhǔn)偏差或所有聲道的混頻權(quán)重的標(biāo)準(zhǔn)變差可以小于等級(jí)降低的聲道相對(duì)于上述均值而言混頻權(quán)重的等級(jí)降低的66%。相對(duì)于中心聲道而言的等級(jí)降低的效果是經(jīng)由貢獻(xiàn)56a和56b得到的雙耳輸出信號(hào)至少在以下更詳細(xì)描述的一些情況下被收聽(tīng)者更自然地感知到,而沒(méi)有聲級(jí)降低。換言之,下混頻發(fā)生器42形成多聲道信號(hào)18的聲道的加權(quán)和,其中與中心聲道相關(guān)聯(lián)的加權(quán)值相對(duì)于其他聲道的加權(quán)值而減小。在電影對(duì)白或音樂(lè)的話音部分期間,中心頻率的聲級(jí)降低是尤為有利的。由于非話音階段中的聲級(jí)降低,在這些話音部分期間得到的音頻印象改善過(guò)度地補(bǔ)償了微小懲罰。然而,根據(jù)備選實(shí)施例,聲級(jí)降低不是恒定的。相反,下混頻發(fā)生器42可以被配置為在關(guān)閉聲級(jí)降低的模式與開(kāi)啟聲級(jí)降低的模式之間進(jìn)行切換。換言之,下混頻發(fā)生器42可以被配置為以時(shí)間變化的方式來(lái)改變聲級(jí)降低的量。變化可以是二進(jìn)制形式或模擬形式的, 在零與最大值之間。下混頻發(fā)生器42可以被配置為根據(jù)在多聲道信號(hào)18內(nèi)包含的信息來(lái)執(zhí)行模式切換或聲級(jí)降低量變化。例如,下混頻發(fā)生器42可以被配置為檢測(cè)話音階段或區(qū)分這些話音階段與非話音階段,或者可以為中心聲道的連續(xù)幀分配對(duì)話音內(nèi)容(至少是順序量表(ordinal scale)的話音內(nèi)容)進(jìn)行測(cè)量的話音內(nèi)容測(cè)量。例如,下混頻發(fā)生器42 利用話音濾波器來(lái)檢測(cè)中心聲道中話音的存在,并確定該濾波器的輸出聲級(jí)是否超過(guò)了和閾值。然而,下混頻發(fā)生器42對(duì)中心聲道內(nèi)話音階段的檢測(cè)并不是執(zhí)行上述與時(shí)間有關(guān)的聲級(jí)降低量變化的模式切換的唯一方式。例如,多聲道信號(hào)18可以具有與該多聲道信號(hào)18 相關(guān)聯(lián)的輔助信息,所述輔助信息尤其用于區(qū)分話音階段與非話音階段,或者定量地測(cè)量話音內(nèi)容。在這種情況下,下混頻發(fā)生器42將響應(yīng)于該輔助信息來(lái)操作。另一種可能是, 下混頻發(fā)生器42還可以根據(jù)例如中心聲道、左聲道和右聲道的電流等級(jí)之間的比較,來(lái)執(zhí)行上述模式切換或聲級(jí)降低量變化。如果中心聲道分別各自地比左聲道和右聲道或者比左聲道與右聲道之和高出特定的閾值比率,則下混頻發(fā)生器42可以假定當(dāng)前存在話音階段并相應(yīng)地作出動(dòng)作,即,執(zhí)行聲級(jí)降低。類似地,下混頻發(fā)生器42可以使用中心聲道、左聲道和右聲道之間的聲級(jí)差,以實(shí)現(xiàn)上述相依性。除此之外,下混頻發(fā)生器42可以響應(yīng)于用于對(duì)多聲道信號(hào)18的多個(gè)聲道的空間圖像加以描述的空間參數(shù)。圖5中示出了這一點(diǎn)。圖5示出了在多聲道信號(hào)18利用特殊音頻編碼(即,通過(guò)使用多個(gè)聲道被下混頻到的下混頻信號(hào)62,以及對(duì)多個(gè)聲道的空間圖像加以描述的空間參數(shù)64)來(lái)表示多個(gè)聲道的情況下,下混頻發(fā)生器42的示例??蛇x地, 多聲道信號(hào)18還可以包括對(duì)單獨(dú)聲道被混頻到下混頻信號(hào)62或下混頻信號(hào)62的獨(dú)立聲道中的比值加以描述的下混頻信息,因?yàn)橄禄祛l聲道62可以例如是普通下混頻信號(hào)62或立體聲下混頻信號(hào)62。圖5的下混頻發(fā)生器42包括解碼器64和混頻器66。解碼器64根據(jù)空間音頻解碼對(duì)多聲道信號(hào)18進(jìn)行解碼,以得到包括尤其是中心聲道66和其他聲道68 在內(nèi)的多個(gè)聲道?;祛l器66被配置為通過(guò)執(zhí)行上述聲級(jí)降低,對(duì)中心聲道66和其他非中心聲道68進(jìn)行混頻,以得到單聲道或立體聲信號(hào)48。如虛線70所指示的,如上所述,混頻器66可以被配置為使用空間參數(shù)64,以在聲級(jí)降低模式與變化聲級(jí)降低量的非聲級(jí)降低模式之間切換?;祛l器66所使用的空間參數(shù)64可以例如是對(duì)可以如何可以從下混頻信號(hào) 62得到中心聲道66、左聲道或右聲道加以描述的聲道預(yù)測(cè)系數(shù),其中混頻器66可以附加地使用對(duì)上述左聲道和右聲道之間的相干性或交叉相關(guān)加以表示的聲道間相干/交叉相關(guān)參數(shù),上述左聲道和右聲道可以分別是是左前方聲道與左后方聲道的下混頻以及右前方聲道與右后方聲道的下混頻。例如,可以以固定的比率將中心聲道混頻到立體聲下混頻信號(hào) 62的上述左聲道和右聲道中。在這種情況下,兩個(gè)聲道預(yù)測(cè)系數(shù)就足夠確定如何從立體聲下混頻信號(hào)62的兩個(gè)聲道的相應(yīng)線性組合中得到中心聲道、左聲道和右聲道。例如,混頻器66可以使用聲道預(yù)測(cè)系數(shù)的和與差之間的比率,以區(qū)分話音階段與非話音階段。盡管描述了關(guān)于中心聲道的聲級(jí)降低以示例多個(gè)聲道的加權(quán)求和,使得中心聲道以在多聲道信號(hào)18的至少兩個(gè)聲道之間不同的聲級(jí),對(duì)單聲道或立體聲混頻作出貢獻(xiàn),然而也存在其他示例,在所述其他示例中,有利地將其他聲道相對(duì)于另一個(gè)或另一些聲道進(jìn)行聲級(jí)降低或聲級(jí)放大,這是因?yàn)?,在與多聲道信號(hào)中的其他內(nèi)容相同但降低/提高的聲級(jí)下,所述另一個(gè)或另一些聲道中存在的一些聲源內(nèi)容將受到或不受到房間處理。關(guān)于利用下混頻信號(hào)62和空間參數(shù)64來(lái)表示多個(gè)輸入聲道的可能性,非常概括地說(shuō)明了圖5。關(guān)于圖6,強(qiáng)化了該描述。關(guān)于圖6的描述還用于理解關(guān)于圖10至13而描述的以下實(shí)施例。圖6示出了譜分解成多個(gè)子頻帶82的下混頻信號(hào)62。在圖6中,將子頻帶82示例性地示為水平延伸,子頻帶82被布置為使得子頻帶頻率如頻域箭頭84所指示的從底部到頂部增大。沿水平方向的延伸應(yīng)表示時(shí)間軸86。例如,下混頻信號(hào)62包括針對(duì)每個(gè)子頻帶82的譜值序列88。通過(guò)采樣值88來(lái)采樣子頻帶82的時(shí)間分辨率可以由濾波器組時(shí)隙90來(lái)限定。因此,時(shí)隙90和子頻帶92限定了某一時(shí)間/頻率分辨率或柵格。通過(guò)如圖6中虛線所示將相鄰的采樣值88合并成時(shí)間/頻率片92來(lái)限定較粗略的時(shí)間/頻率柵格,這些片限定了時(shí)間/頻率參數(shù)分辨率或柵格。前述空間參數(shù)62是在該時(shí)間/頻率參數(shù)分辨率92下限定的。時(shí)間/頻率參數(shù)分辨率92可以隨時(shí)間改變。為此,可以將多聲道信號(hào)62分成連續(xù)幀94。對(duì)于每一幀,可以單獨(dú)地設(shè)置時(shí)間/頻率參數(shù)分辨率92。在解碼器64在時(shí)域接收下混頻信號(hào)62的情況下,解碼器64可以包括內(nèi)部分析濾波器組,以得到如圖6所示的下混頻信號(hào)62的表示。備選地,下混頻信號(hào)62以如圖6所示的形式進(jìn)入解碼器64,在這種情況下解碼器64中不需要分析濾波器組。如圖5中已經(jīng)提到的,對(duì)于每個(gè)片92,可以存在兩個(gè)聲道預(yù)測(cè)參數(shù),所述聲道預(yù)測(cè)參數(shù)關(guān)于相應(yīng)的時(shí)間/頻率片92揭示如何可以從立體聲下混頻信號(hào)62的左聲道和右聲道得到右聲道和左聲道。此外,對(duì)于片92, 還可以存在聲道間相干/交叉相關(guān)(ICC)參數(shù),所述聲道間相干/交叉相關(guān)(ICC)參數(shù)指示要從立體聲下混頻信號(hào)62得到的左聲道和右聲道之間的相似性,其中已將一個(gè)聲道完全混頻到立體聲下混頻信號(hào)62的一個(gè)聲道中,而將另一聲道完全混頻到立體聲下混頻信號(hào)62的另一聲道中。然而,對(duì)于每個(gè)片92還可以存在聲道聲級(jí)差(CLD)參數(shù),所述聲道聲級(jí)差(CLD)參數(shù)指示上述左聲道與右聲道之間的聲級(jí)差。可以對(duì)CLD參數(shù)應(yīng)用對(duì)數(shù)標(biāo)度的非均勻量化,其中當(dāng)聲道之間存在較大的聲級(jí)差時(shí),非均勻量化具有接近零dB的高精度以及較粗糙的分辨率。此外,在空間參數(shù)64內(nèi)可以存在其他參數(shù)。這些參數(shù)可以尤其地限定用于通過(guò)混頻來(lái)形成上述左聲道和右聲道的聲道(如,左后方聲道、左前方聲道、右后方聲道和右前方聲道)有關(guān)的CLD和ICC。應(yīng)注意,上述實(shí)施例可以彼此相組合。以上已經(jīng)提到了一些組合可能性。下文中將關(guān)于圖7至13的實(shí)施例來(lái)描述其他可能性。此外,圖1和5的前述實(shí)施例分別假定設(shè)備內(nèi)實(shí)際存在中間聲道20、66和68。然而,情況并不必須如此。例如,通過(guò)省去相似性減小器 12,可以使用由圖2的設(shè)備得到的修改后的HRTF來(lái)限定圖1的方向?yàn)V波器,在這種情況下, 通過(guò)在時(shí)間/頻率參數(shù)分辨率92內(nèi)合適地組合空間參數(shù)和修改后的HRTF,并相應(yīng)地應(yīng)用所得到的線性組合系數(shù)以形成雙耳信號(hào)2 和22b,圖1的設(shè)備可以對(duì)表示多個(gè)聲道18a-18d 的下混頻信號(hào)(如圖5所示的下混頻信號(hào)62)起作用。類似地,下混頻發(fā)生器42可以被配置為適當(dāng)?shù)亟M合空間參數(shù)64以及針對(duì)中心聲道要實(shí)現(xiàn)的聲級(jí)降低量,以得到用于房間處理器44的單聲道或立體聲下混頻48。圖7示出了根據(jù)實(shí)施例的雙耳輸出信號(hào)發(fā)生器。通常以附圖標(biāo)記100來(lái)表示的發(fā)生器包括多聲道解碼器102、雙耳輸出104以及分別在多聲道解碼器102與雙耳輸出之間延伸的兩個(gè)路徑,即, 直接路徑106和回響路徑108。在直接路徑中,方向?yàn)V波器110連接至多聲道解碼器102的輸出。直接路徑還包括由加法器112組成的第一加法器組以及由加法器114組成的第二加法器組。加法器112對(duì)前一半方向?yàn)V波器110的輸出信號(hào)進(jìn)行求和,第二加法器114對(duì)后一半方向?yàn)V波器114的輸出信號(hào)進(jìn)行求和。第一加法器112和第二加法器114的求和后的輸出表示雙耳輸出信號(hào)2 和22b的前述直接路徑貢獻(xiàn)。提供加法器116和118,以將貢獻(xiàn)信號(hào)2 和22b與回響路徑108提供的雙耳貢獻(xiàn)信號(hào)(即,信號(hào)46a和46b)相組合。在回響路徑108中,混頻器120和房間處理器122串聯(lián)在多聲道解碼器102的輸出與加法器116 和118的相應(yīng)輸入之間,加法器116和118的輸出限定了在輸出104處輸出的雙耳輸出信號(hào)。
為了易于理解圖7的設(shè)備的以下描述,在圖1至6中使用的附圖標(biāo)記部分地用于表示圖7中與圖1至6中出現(xiàn)的元件相對(duì)應(yīng)或用于執(zhí)行圖1至6中出現(xiàn)的元件的功能的元件。在以下描述中,相應(yīng)的描述將更清楚。然而應(yīng)注意,為了易于以下描述,在假定相似性減小器執(zhí)行相關(guān)性減小的前提下描述了以下實(shí)施例。相應(yīng)地,在下文中相似性減小器是指相關(guān)性減小器。然而從上文中可以清楚看出,以下概述的實(shí)施例完全可以用于相似性減小器執(zhí)行相似性降低而不是相關(guān)性減小的情況。此外,在假定用于針對(duì)房間處理產(chǎn)生下混頻的混頻器產(chǎn)生中心聲道聲級(jí)降低的情況下,起草了下述實(shí)施例,然而如上所述,這完全可以應(yīng)用于備選實(shí)施例。圖7的設(shè)備使用信號(hào)流從解碼后的多聲道信號(hào)IM在輸出104處產(chǎn)生耳機(jī)輸出。多聲道解碼器102根據(jù)比特流輸入1 處的比特流輸入得到解碼后的多聲道124,例如通過(guò)空間音頻解碼來(lái)得到。在解碼之后,由方向?yàn)V波器110組成的方向?yàn)V波器對(duì)對(duì)解碼后的多聲道信號(hào)124的每個(gè)信號(hào)或聲道進(jìn)行濾波。例如,方向?yàn)V波器20 DirFilterd, L) 和DirFilteHl,R)對(duì)解碼后的多聲道信號(hào)124的第一(上)聲道進(jìn)行濾波,方向?yàn)V波器 DirFilter (2, L)和DirFilter (2,R)對(duì)聲道第二(從頂部起第二個(gè))信號(hào)或聲道進(jìn)行濾波,等等。這些濾波器110可以對(duì)從房間內(nèi)虛擬聲源到收聽(tīng)者耳道的聲傳輸(所謂的雙耳房間傳遞函數(shù)(BRTF))進(jìn)行建模。這些濾波器110可以執(zhí)行時(shí)間、聲級(jí)和譜修改,并且還可以部分地對(duì)房間反射和回響進(jìn)行建模。可以在時(shí)域或頻域?qū)崿F(xiàn)方向?yàn)V波器110。由于可能需要許多個(gè)(NX 2,其中N是解碼聲道的個(gè)數(shù))濾波器110,所以如果這些方向?yàn)V波器應(yīng)當(dāng)對(duì)房間反射和回響完整地建模,則這些方向?yàn)V波器可以相當(dāng)長(zhǎng),即,在44. IkHz下20000個(gè)濾波器抽頭,在這種情況下濾波過(guò)程需要非常大的計(jì)算量。有利地將方向?yàn)V波器110減至最小,所謂的頭部相關(guān)傳遞函數(shù)(HRTF)和公共處理模塊122用于對(duì)房間反射和回響進(jìn)行建模。房間處理模塊122可以在時(shí)域或頻域?qū)崿F(xiàn)回響算法,并且可以根據(jù)一個(gè)或兩個(gè)聲道輸入信號(hào)48進(jìn)行操作,所述一個(gè)或兩個(gè)聲道輸入信號(hào)48是通過(guò)混頻器120內(nèi)的混頻矩陣根據(jù)解碼后的多聲道輸入信號(hào)1 來(lái)計(jì)算的。房間處理模塊實(shí)現(xiàn)房間反射和/或回響。房間反射和回響對(duì)于定位聲音來(lái)說(shuō)是重要的,尤其是在距離和外化(意味著在收聽(tīng)者頭部的外部感知到聲音)方面。典型地,產(chǎn)生多聲道聲音,使得主要聲音能量包含在前聲道中,即,左前、右前、中心。電影對(duì)白和音樂(lè)中的話音典型地被混頻到中心聲道。如果中心聲道信號(hào)被饋送至房間處理模塊122,則通常將合成的輸出不自然地感知為回響和頻譜上不等。因此,根據(jù)圖7的實(shí)施例,將中心聲道以顯著的聲級(jí)降低(如,衰減了 6dB)饋送至房間處理模塊122,如上所述,所述聲級(jí)降低是在混頻器120內(nèi)執(zhí)行的。到目前為止,圖7的實(shí)施例包括根據(jù)圖3和5 的配置,其中圖7的附圖標(biāo)記102、124、120和122分別對(duì)應(yīng)于圖3和5中的附圖標(biāo)記18、 64 ;附圖標(biāo)記66和68的組合;附圖標(biāo)記66 ;和附圖標(biāo)記44。圖8示出了根據(jù)另一實(shí)施例的另一雙耳輸出信號(hào)發(fā)生器。該發(fā)生器總體上由附圖標(biāo)記140來(lái)表示。為了易于描述圖8,使用了與圖7中的附圖標(biāo)記相同的附圖標(biāo)記。為了表明混頻器120并不必須具有如圖3、5和7的實(shí)施例中指示的功能(即,執(zhí)行關(guān)于中心聲道的聲級(jí)降低),使用附圖標(biāo)記40’來(lái)分別表示方框102、120和122的布置。換言之,混頻器 122內(nèi)的聲級(jí)降低在圖8的情況下是可選的。然而與圖7不同,分別在每對(duì)方向?yàn)V波器110 與針對(duì)解碼后多聲道信號(hào)124的相關(guān)聲道的解碼器102的輸出之間連接去相關(guān)器。用附圖標(biāo)記14&、1422、等等來(lái)表示去相關(guān)器。去相關(guān)器142^14 用作圖1所示的相關(guān)減小器12。 僅如圖8所示,但是不必為解碼后的多聲道信號(hào)124的每個(gè)聲道提供去相關(guān)器144、1422。 而是,一個(gè)去相關(guān)性就足以。去相關(guān)器142可以簡(jiǎn)單地是延遲。優(yōu)選地,每個(gè)延遲142^14 所引起的延遲量可以互不相同。另一種可能是,去相關(guān)器142^14 還可以是全通濾波器, 即,具有傳遞函數(shù)的濾波器,其中該傳遞函數(shù)的幅度恒定為1,但相應(yīng)聲道譜分量的相位變化。優(yōu)選地去相關(guān)器142^14 所引起的相位修改針對(duì)每個(gè)聲道而不同。當(dāng)然也可以存在其他情況。例如,去相關(guān)器142^14 可以被實(shí)現(xiàn)為HR濾波器等等。因此,根據(jù)圖8的實(shí)施例,元件1421-1424,110、112和114根據(jù)圖1的設(shè)備10來(lái)操作。類似于圖8,圖9示出了圖7的雙耳輸出信號(hào)發(fā)生器的變體。因此,還使用與圖7 所用附圖標(biāo)記相同的附圖標(biāo)記來(lái)說(shuō)明圖9。與圖8的實(shí)施例相類似,混頻器122的聲級(jí)降低僅在圖9的情況下是可選的,因此圖9中的附圖標(biāo)記是40’,而不是像圖7中一樣是’ 40。 圖9的實(shí)施例解決了在多聲道聲音產(chǎn)生過(guò)程中所有聲道之間存在顯著相關(guān)性的問(wèn)題。在利用方向?yàn)V波器110處理了多聲道信號(hào)之后,加法器122和144對(duì)每個(gè)濾波器對(duì)的二聲道中間信號(hào)進(jìn)行求和,以在輸出104處形成耳機(jī)輸出信號(hào)。加法器112和114對(duì)相關(guān)的輸出信號(hào)進(jìn)行求和導(dǎo)致輸出104處的輸出信號(hào)的空間寬度極大減小并且缺乏外化。這對(duì)于解碼后的多聲道信號(hào)124內(nèi)左右信號(hào)和中心聲道的相關(guān)性而言是尤為成問(wèn)題的。根據(jù)圖9的實(shí)施例,方向?yàn)V波器被配置為盡可能具有去相關(guān)的輸出。為此,圖9的設(shè)備包括設(shè)備30,所述設(shè)備30用于根據(jù)某一原始HRTF集合來(lái)形成要由方向?yàn)V波器110使用的彼此間相關(guān)性減小 HRTF集合。如上所述,關(guān)于與解碼后多聲道信號(hào)124的一個(gè)或多個(gè)聲道相關(guān)聯(lián)的方向?yàn)V波器對(duì)的HRTF,設(shè)備30可以使用以下技術(shù)之一或以下技術(shù)的組合例如通過(guò)對(duì)濾波器的脈沖響應(yīng)進(jìn)行移位(例如通過(guò)對(duì)濾波器抽頭進(jìn)行移位),對(duì)方向?yàn)V波器或相應(yīng)的方向?yàn)V波器對(duì)進(jìn)行延遲;修改相應(yīng)方向?yàn)V波器的相位響應(yīng);以及對(duì)相應(yīng)聲道的相應(yīng)方向?yàn)V波器應(yīng)用諸如全通濾波器之類的去相關(guān)濾波器。這樣的全通濾波器可以被實(shí)現(xiàn)為^R濾波器。如上所述,設(shè)備30可以響應(yīng)于在比特流輸入126處的比特流所針對(duì)的揚(yáng)聲器配置的改變來(lái)工作。圖7至9的實(shí)施例關(guān)注于解碼后的多聲道信號(hào)。以下實(shí)施例涉及麥克風(fēng)的參數(shù)多聲道解碼??傮w來(lái)說(shuō),空間音頻解碼是一種多聲道壓縮技術(shù),該技術(shù)采用多聲道音頻信號(hào)中的感知性聲道間不相關(guān)性來(lái)實(shí)現(xiàn)更高的壓縮率??梢栽诳臻g提示或空間參數(shù)(即,對(duì)多聲道音頻信號(hào)的空間圖像加以描述的參數(shù))方面實(shí)現(xiàn)這一點(diǎn)??臻g提示典型地包括聲級(jí)/強(qiáng)度差、相位差以及聲道之間相關(guān)性/相關(guān)性的度量,并且可以以非常緊湊的方式來(lái)表示。空間音頻編碼的構(gòu)思已被產(chǎn)生MPEG環(huán)繞標(biāo)準(zhǔn)(即,IS0/IEC23003-1)的MPEG所采用??臻g參數(shù)(如,空間音頻編碼中采用的空間參數(shù))還可以用于描述方向?yàn)V波器。通過(guò)這么做,可以將解碼空間音頻數(shù)據(jù)與應(yīng)用方向?yàn)V波器的步驟相組合,以高效地解碼并呈現(xiàn)用于耳機(jī)再現(xiàn)的多聲道音頻。圖10中給出了針對(duì)耳機(jī)輸出的空間音頻解碼器的一般結(jié)構(gòu)。圖10的解碼器一般用附圖標(biāo)記200來(lái)表示,并且包括雙耳空間子頻帶修改器202,所述雙耳空間子頻帶修改器202包括針對(duì)立體聲或單聲道下混頻信號(hào)204的輸入、針對(duì)空間參數(shù)206的另一輸入、 以及針對(duì)雙耳輸出信號(hào)208的輸出。下混頻信號(hào)與空間參數(shù)206 —起構(gòu)成前述多聲道信號(hào) 18,并且表示所述多聲道信號(hào)18的多個(gè)聲道。內(nèi)部地,子頻帶修改器202包括以上述順序連接在下混頻信號(hào)輸入與子頻帶修改器202的輸出之間的分析濾波器組208、矩陣化單元或線性組合器210、以及合成濾波器組 212。此外,子頻帶修改器202包括參數(shù)轉(zhuǎn)換器214,由空間參數(shù)206和如設(shè)備30所得到的修改后的HRTF集合來(lái)饋送該參數(shù)轉(zhuǎn)換器214。在圖10中,假定下混頻信號(hào)之前已被解碼,包括例如熵編碼。為雙耳空間音頻解碼器饋送下混頻信號(hào)204。參數(shù)轉(zhuǎn)換器214使用空間參數(shù)206以及以修改后HRTF參數(shù)216 的形式對(duì)方向?yàn)V波器的參數(shù)描述,來(lái)形成雙耳參數(shù)218。矩陣化單元210以2X2矩陣(在立體聲下混頻信號(hào)的情況下)以及1X2矩陣(在單聲道下混頻信號(hào)204的情況下)的形式在頻域?qū)⑦@些參數(shù)218應(yīng)用于分析濾波器組208(參見(jiàn)圖6)所輸出的譜值88。換言之,雙耳參數(shù)218在圖6所示的時(shí)間/頻率參數(shù)分辨率92方面變化,并且應(yīng)用于每個(gè)采樣值88。 可以使用內(nèi)插分別將矩陣系數(shù)和雙耳參數(shù)218從較粗略的時(shí)間/頻率參數(shù)域92平滑到分析濾波器組208的時(shí)間/頻率分辨率。即,在立體聲下混頻204的情況下,單元210執(zhí)行的矩陣化針對(duì)由下混頻信號(hào)204的左聲道的采樣值與下混頻信號(hào)204的右聲道的相應(yīng)采樣值組成的每一個(gè)采樣值對(duì),產(chǎn)生兩個(gè)采樣值。產(chǎn)生的兩個(gè)采樣值分別是雙耳輸出信號(hào)208的左聲道和右聲道的一部分。在單聲道下混頻信號(hào)204的情況下,單元210執(zhí)行的矩陣化針對(duì)由單聲道下混頻信號(hào)204每個(gè)采樣值,產(chǎn)生兩個(gè)采樣值,即,一個(gè)采樣值針對(duì)雙耳輸出信號(hào)208的左聲道,另一個(gè)采樣值針對(duì)雙耳輸出信號(hào)208的右聲道。雙耳參數(shù)218限定了從下混頻信號(hào)204的一個(gè)或兩個(gè)采樣值到雙耳輸出信號(hào)208的相應(yīng)左聲道采樣值和右聲道采樣值的矩陣運(yùn)算。雙耳參數(shù)218已經(jīng)反映了修改后的HRTF參數(shù)。因此,雙耳參數(shù)218如上所述將多聲道信號(hào)18的輸入聲道去相關(guān)。因此,矩陣化單元210的輸出是如圖6所示的修改后的譜圖。合成濾波器組212 根據(jù)該修改后的光譜圖來(lái)重構(gòu)雙耳輸出信號(hào)208。換言之,合成濾波器組212將矩陣化單元 210產(chǎn)生的二聲道信號(hào)輸出轉(zhuǎn)換到時(shí)域。當(dāng)然,這是可選的。在圖10的情況下,不分別處理房間反射和回響效應(yīng)。如果有的話,必須在HRTF 216中考慮這些效應(yīng)。圖11示出了將雙耳空間音頻解碼器200’與單獨(dú)的房間反射/回響處理相結(jié)合的雙耳輸出信號(hào)發(fā)生器。圖11中的附圖標(biāo)記200’表示圖11的雙耳空間音頻解碼器200’可以使用修改后的HRTF,即,如圖2所示的原始HRTF。然而可選地,圖11的雙耳空間音頻解碼器200’可以是圖10所示的雙耳空間音頻解碼器。在任何情況下,除了雙耳空間解碼器200’以外,圖11中通常以附圖標(biāo)記230來(lái)表示的雙耳輸出信號(hào)發(fā)生器都還包括下混頻音頻解碼器232、修改后的空間音頻子頻帶修改器234、房間處理器122以及兩個(gè)加法器116和118。下混頻音頻解碼器232連接在比特流輸入1 與雙耳空間解碼器200’ 的雙耳空間音頻子頻帶修改器202之間。下混頻音頻解碼器232被配置為對(duì)輸入1 處的比特流輸入進(jìn)行解碼,以得到下混頻信號(hào)214和空間參數(shù)206。除了空間參數(shù)206以外,還向雙耳空間音頻子頻帶修改器202以及修改后的空間音頻子頻帶修改器234提供下混頻信號(hào)204。修改后的空間音頻子頻帶修改器234利用空間參數(shù)206以及修改后的參數(shù)236根據(jù)下混頻信號(hào)204來(lái)計(jì)算用作房間處理器122的輸入的單聲道或立體聲下混頻48,其中所述修改后的參數(shù)236反映了上述中心聲道的聲級(jí)降低量。加法器116和118逐個(gè)聲道地對(duì)雙耳空間音頻子頻帶修改器202和房間處理器122的貢獻(xiàn)輸出進(jìn)行求和,以在輸出238處產(chǎn)生雙耳輸出信號(hào)。圖12示出了圖11的雙耳解碼器200’的功能的框圖。應(yīng)注意,圖12沒(méi)有示出圖 11的雙耳空間解碼器200’的實(shí)際內(nèi)部結(jié)構(gòu),而是示出了雙耳空間解碼器200’得到的信號(hào)修改。已經(jīng)提到過(guò),雙耳空間解碼器200’的內(nèi)部結(jié)構(gòu)通常符合圖10所示的結(jié)構(gòu),與圖10 所示結(jié)構(gòu)的區(qū)別在于,當(dāng)雙耳空間解碼器200’以原始HRTF來(lái)工作時(shí),可以省略設(shè)備30。此外,圖12示例性地針對(duì)雙耳空間解碼器200’使用由多聲道信號(hào)18表示的僅三個(gè)聲道以形成雙耳輸出信號(hào)208的情況,示出了雙耳空間解碼器200’的功能。具體地,“2至3”即, TTT盒(box)用于從立體聲下混頻204的兩個(gè)聲道中得到中心聲道M2、右聲道244和左聲道對(duì)6。換言之,圖12示例性地假定下混頻204是立體聲混頻。TTT盒248所使用的空間參數(shù)206包括上述聲道預(yù)測(cè)系數(shù)。圖12中由延遲L、延遲R和延遲C來(lái)表示的三個(gè)去相關(guān)器實(shí)現(xiàn)了相關(guān)性減小。這三個(gè)去相關(guān)器與例如圖1和7的情況下引入的去相關(guān)相對(duì)應(yīng)。然而,同樣已經(jīng)提到過(guò),盡管實(shí)際結(jié)構(gòu)與圖10所示的相對(duì)應(yīng),但圖12僅示出了由雙耳空間解碼器200’實(shí)現(xiàn)的信號(hào)修改。因此,盡管相對(duì)于形成方向?yàn)V波器14的HRTF,將形成相關(guān)性減小器12的延遲示為單獨(dú)的特征,然而相關(guān)性減小器12中延遲的存在可以被看作是HRTF 參數(shù)的修改,其中這些HRTF參數(shù)形成圖12的方向?yàn)V波器14的原始HRTF。首先,圖12僅示出了雙耳空間解碼器200’針對(duì)耳機(jī)再現(xiàn)將聲道去相關(guān)。通過(guò)簡(jiǎn)單的方式,即,通過(guò)在矩陣M和雙耳空間解碼器200’的參數(shù)處理中添加延遲模塊,實(shí)現(xiàn)了去相關(guān)。因此,雙耳空間解碼器200’可以對(duì)單獨(dú)的聲道應(yīng)用以下修改,即優(yōu)選地將中心聲道延遲至少一個(gè)采樣,在每個(gè)頻帶中以不同的間隔來(lái)延遲中心聲道,優(yōu)選地左聲道和右聲道延遲至少一個(gè)采樣,和/或在每個(gè)頻帶中以不同的間隔來(lái)延遲左聲道和右聲道。圖13示出了圖11的修改后的空間音頻子頻帶修改器的結(jié)構(gòu)的示例。圖13的子頻帶修改器2;34包括2至3或TTT盒洸2、加權(quán)級(jí)^^_264e、第一加法器和^6b、第二加法器^Sa和^Sb、針對(duì)立體聲下混頻204的輸入、針對(duì)空間參數(shù)206的輸入、針對(duì)殘差信號(hào)270的另一輸入、以及針對(duì)下混頻48的輸出,其中下混頻48由房間處理器來(lái)處理,根據(jù)圖13,下混頻48是立體聲信號(hào)。圖13在結(jié)構(gòu)上限定了修改后的空間音頻子頻帶修改器234的實(shí)施例,圖13的TTT 盒沈2僅通過(guò)使用空間參數(shù)206根據(jù)立體聲下混頻204來(lái)重構(gòu)中心聲道、右聲道M4和左聲道對(duì)6。同樣已經(jīng)提到過(guò),在圖12的情況下,實(shí)際上并不計(jì)算聲道M2-M6。相反,雙耳空間音頻子頻帶修改器修改矩陣M,使得將立體聲下混頻信號(hào)204直接轉(zhuǎn)變成反映HRTF的雙耳貢獻(xiàn)。然而,圖13的TTT盒206實(shí)際上執(zhí)行重構(gòu)??蛇x地,如圖13所示,當(dāng)基于立體聲下混頻204和空間參數(shù)206來(lái)重構(gòu)聲道242-246時(shí),TTT盒262可以使用反映預(yù)測(cè)殘差的殘差信號(hào)270,如上所述,殘差信號(hào)包括聲道預(yù)測(cè)系數(shù)以及可選地ICC值。第一加法器被配置為將聲道242-246相加,以形成立體聲下混頻48的左聲道。具體地,加法器和沈乩形成加權(quán)和,其中加權(quán)值由加權(quán)級(jí)沈如、264b、264c和沈如來(lái)限定,加權(quán)級(jí)沈如、264b、264c和沈如可以對(duì)相應(yīng)的聲道246至242應(yīng)用相應(yīng)的加權(quán)值EQll、EQkl和EQa。類似地,加法器和形成聲道246至M2的加權(quán)和,其中加權(quán)級(jí)^4b、264d和沈如形成加權(quán)值,加權(quán)和形成立體聲下混頻48的右聲道。如上所述,選擇加權(quán)級(jí)沈如_26如的參數(shù)270,使得實(shí)現(xiàn)立體聲下混頻48中的上述中心聲道聲級(jí)降低,從而如上所述產(chǎn)生關(guān)于自然聲音感知的優(yōu)點(diǎn)。因此,換言之,圖13示出了可以與圖12的雙耳空間解碼器200’相結(jié)合應(yīng)用的房間處理模塊。在圖13中,下混頻信號(hào)204用于饋送該模塊。下混頻信號(hào)204包含多聲道信號(hào)的所有信號(hào),以能夠提供立體聲加兼容性。如上所述,希望為房間處理模塊饋送僅包含減小的中心信號(hào)在內(nèi)的信號(hào)。圖13的修改后的空間音頻子頻帶修改器用于執(zhí)行這種聲級(jí)降低。 具體地,根據(jù)圖13,可以使用殘差信號(hào)270,以重構(gòu)中心、左和右聲道M2-M6。中心、左和右聲道M2-246的殘差信號(hào)可以由下混頻音頻解碼器232來(lái)解碼,盡管圖11中未示出??梢葬槍?duì)左、右和中心聲道242-246將加權(quán)級(jí)沈如-26如所應(yīng)用的EQ參數(shù)和加權(quán)值實(shí)值化??梢源鎯?chǔ)和應(yīng)用針對(duì)中心聲道M2的單個(gè)參數(shù)集合,根據(jù)圖13,示例性地將中心聲道相等地混頻到立體聲下混頻48的左和右輸出。饋送到修改后的空間音頻子頻帶修改器234中的EQ參數(shù)270可以具有以下特性。 首先,優(yōu)選地可以使中心聲道信號(hào)衰減至少6dB。此外,中心聲道信號(hào)可以具有低通特性。 此外,可以在低頻下提高其余聲道的差信號(hào)。為了補(bǔ)償中心聲道242相對(duì)于其他聲道244 和246而言較低的電平,應(yīng)當(dāng)相應(yīng)地增大在雙耳空間音頻子頻帶修改器202中使用的針對(duì)中心聲道的HRTF參數(shù)的增益。設(shè)定EQ參數(shù)的主要目的是減小在用于房間處理模塊的輸出中的中心聲道信號(hào)。 然而,僅應(yīng)將中心聲道抑制到有限程度在TTT盒內(nèi)從左下混頻聲道和右下混頻聲道減去中心聲道信號(hào)。如果降低了中心聲級(jí),則左和右聲道中的偽跡可以變得可聽(tīng)。因此,EQ級(jí)中的中心聲級(jí)降低是在抑制與偽跡之間的折衷。能夠?qū)で髮?duì)EQ參數(shù)的固定設(shè)定,但這并不是對(duì)所有信號(hào)而言都是最優(yōu)的。相應(yīng)地,根據(jù)實(shí)施例,可以使用自適應(yīng)算法或模塊274利用以下參數(shù)之一或以下參數(shù)的組合來(lái)控制中心聲級(jí)降低的量可以如虛線276所指示的來(lái)使用空間參數(shù)206,其中空間參數(shù)206用于在TTT盒 262內(nèi)根據(jù)左和右下混頻聲道204來(lái)解碼中心聲道M2。還可以如虛線278所指示的來(lái)使用中心聲道、左聲道和右聲道的聲級(jí)。還可以如虛線278所指示的來(lái)使用中心聲道、左聲道和右聲道242-246之間的聲級(jí)差。還可以如虛線278所指示的來(lái)使用單一類型檢測(cè)算法的輸出,如,話音活動(dòng)性檢測(cè)器。最后,如虛線280所指示的,可以使用對(duì)音頻內(nèi)容加以描述的動(dòng)態(tài)元數(shù)據(jù)的靜態(tài), 以確定中心聲級(jí)降低的量。盡管在設(shè)備的上下文中描述了一些方面,然而應(yīng)清楚,這些方面還展現(xiàn)了相應(yīng)方法的描述,其中模塊或設(shè)備與方法步驟或方法步驟的特征相對(duì)應(yīng)。類似地,在方法步驟的上下文中描述的方面也展現(xiàn)了對(duì)相應(yīng)設(shè)備的相應(yīng)模塊或項(xiàng)目或特征的描述,如,ASIC的一部分、程序代碼的子例程、或已編程的可編程邏輯的一部分。本發(fā)明的已編碼音頻信號(hào)可以存儲(chǔ)在數(shù)字存儲(chǔ)介質(zhì)上,或者可以在諸如無(wú)線傳輸介質(zhì)或有線傳輸介質(zhì)(如,互聯(lián)網(wǎng))之類的傳輸介質(zhì)上傳輸。根據(jù)特定的實(shí)現(xiàn)需求,可以以硬件或軟件的形式來(lái)實(shí)現(xiàn)本發(fā)明??梢允褂脭?shù)字存儲(chǔ)介質(zhì)(例如,軟盤、DVD、CD、ROM、PROM、EPROM、EEPROM或閃存)來(lái)執(zhí)行這些實(shí)現(xiàn),其中所述數(shù)字存儲(chǔ)介質(zhì)上存儲(chǔ)有電可讀控制信號(hào),所述電可讀控制信號(hào)與可編程計(jì)算機(jī)系統(tǒng)協(xié)作 (或能夠與可編程計(jì)算機(jī)系統(tǒng)協(xié)作),使得執(zhí)行相應(yīng)的方法。根據(jù)本發(fā)明的一些實(shí)施例包括一種數(shù)據(jù)載體,所述數(shù)據(jù)載體具有電可讀控制信號(hào),所述電可讀控制信號(hào)能夠與可編程計(jì)算機(jī)系統(tǒng)協(xié)作,使得執(zhí)行本文描述的方法之一。通常,可以將本發(fā)明的實(shí)施例實(shí)現(xiàn)為具有程序代碼的計(jì)算機(jī)程序產(chǎn)品,所述程序代碼操作用于在所述計(jì)算機(jī)程序產(chǎn)品在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行方法之一。所述程序代碼可以例如存儲(chǔ)在機(jī)器可讀載體上。其他實(shí)施例包括存儲(chǔ)在機(jī)器可讀載體上的、用于執(zhí)行本文描述的方法之一的計(jì)算機(jī)程序。因此換言之,本發(fā)明方法的實(shí)施例是一種具有程序代碼的計(jì)算機(jī)程序,所述程序代碼用于當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)上運(yùn)行時(shí)執(zhí)行本文描述的方法之一。因此,本發(fā)明方法的另一實(shí)施例是一種數(shù)據(jù)載體(或數(shù)據(jù)存儲(chǔ)介質(zhì)、或計(jì)算機(jī)可讀介質(zhì)),包括存儲(chǔ)在該數(shù)據(jù)載體上的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序用于執(zhí)行本文描述的方
法之一。因此,本發(fā)明方法的另一實(shí)施例是一種數(shù)據(jù)流或信號(hào)序列,所述數(shù)據(jù)流或信號(hào)序列表示用于執(zhí)行本文描述的方法之一的計(jì)算機(jī)程序。所述數(shù)據(jù)流或信號(hào)序列可以例如被配置為經(jīng)由數(shù)據(jù)通信連接來(lái)傳遞,例如經(jīng)由互聯(lián)網(wǎng)來(lái)傳遞。另一實(shí)施例包括一種處理裝置,例如計(jì)算機(jī)或可編程邏輯器件,所述處理裝置被配置為適于執(zhí)行本文描述的方法之一。另一實(shí)施例包括一種計(jì)算機(jī),在所述計(jì)算機(jī)上安裝有用于執(zhí)行本文描述的方法之一的計(jì)算機(jī)程序。在一些實(shí)施例中,可以使用一種可編程邏輯器件(例如,現(xiàn)場(chǎng)可編程門陣列)來(lái)執(zhí)行本文描述的方法的一些或全部功能。在一些實(shí)施例中,現(xiàn)場(chǎng)可編程門陣列可以與微處理器協(xié)作,以執(zhí)行本發(fā)明描述的方法之一。通常,方法優(yōu)選地由任何硬件設(shè)備來(lái)執(zhí)行。上述實(shí)施例僅僅用于說(shuō)明本發(fā)明的原理。應(yīng)理解,對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),對(duì)本文描述的布置和細(xì)節(jié)的修改和改變是顯而易見(jiàn)的。因此,本發(fā)明僅由所附權(quán)利要求的范圍來(lái)限定,而不由本文中通過(guò)描述和說(shuō)明實(shí)施例而提供的特定細(xì)節(jié)來(lái)限定。
20
權(quán)利要求
1.一種用于基于多聲道信號(hào)來(lái)產(chǎn)生雙耳信號(hào)的設(shè)備,所述多聲道信號(hào)表示多個(gè)聲道并且用于由揚(yáng)聲器配置來(lái)再現(xiàn),所述揚(yáng)聲器配置具有與每個(gè)聲道相關(guān)聯(lián)的虛擬聲源位置,所述設(shè)備包括相似性減小器(12),用于以不同方式處理并因此減小在所述多個(gè)聲道的左聲道和右聲道、所述多個(gè)聲道的前聲道和后聲道、以及所述多個(gè)聲道的中心聲道和非中心聲道中的至少一對(duì)聲道之間的相似性,以得到彼此間相似性減小的聲道集合(20);多個(gè)方向?yàn)V波器(14),用于針對(duì)彼此間相似性減小的聲道集合(20)中一個(gè)相應(yīng)聲道, 對(duì)從與所述彼此間相似性減小的聲道集合中的該相應(yīng)聲道相關(guān)聯(lián)的虛擬聲源位置向收聽(tīng)者的相應(yīng)耳道的聲傳輸進(jìn)行建模;第一混頻器(16a),用于將對(duì)向收聽(tīng)者的第一耳道的聲傳輸加以建模的方向?yàn)V波器的輸出進(jìn)行混頻,以得到雙耳信號(hào)的第一聲道(22a);以及第二混頻器(16b),用于將對(duì)向收聽(tīng)者的第二耳道的聲傳輸加以建模的方向?yàn)V波器的輸出進(jìn)行混頻,以得到雙耳信號(hào)的第二聲道(22b)。
2.根據(jù)權(quán)利要求1所述的設(shè)備,其中,相關(guān)性減小器(12)被配置為通過(guò)以下操作來(lái)以不同方式執(zhí)行處理在所述多個(gè)聲道的左聲道和右聲道、所述多個(gè)聲道的前聲道和后聲道、以及所述多個(gè)聲道的中心聲道和非中心聲道中的至少一對(duì)聲道之間,引起相對(duì)延遲,或在譜變化意義上, 以不同方式執(zhí)行相位修改;和/或在譜變化意義上,在所述多個(gè)聲道的左聲道和右聲道、所述多個(gè)聲道的前聲道和后聲道、以及所述多個(gè)聲道的中心聲道和非中心聲道中的至少一對(duì)聲道之間,以不同方式執(zhí)行幅度修改。
3.一種用于基于多聲道信號(hào)來(lái)產(chǎn)生雙耳信號(hào)的設(shè)備,所述多聲道信號(hào)表示多個(gè)聲道并且用于由揚(yáng)聲器配置來(lái)再現(xiàn),所述揚(yáng)聲器配置具有與每個(gè)聲道相關(guān)聯(lián)的虛擬聲源位置,所述設(shè)備包括相似性減小器(12),用于在譜變化的意義上,在所述多個(gè)聲道中的至少兩個(gè)聲道之間, 以不同方式執(zhí)行相位和/或幅度修改,以得到彼此間相似性減小的聲道集合(20);多個(gè)方向?yàn)V波器(14),用于針對(duì)彼此間相似性減小的聲道集合(20)中一個(gè)相應(yīng)聲道, 對(duì)從與所述彼此間相似性減小的聲道集合中的該相應(yīng)聲道相關(guān)聯(lián)的虛擬聲源位置向收聽(tīng)者的相應(yīng)耳道的聲傳輸進(jìn)行建模;第一混頻器(16a),用于將對(duì)向收聽(tīng)者的第一耳道的聲傳輸加以建模的方向?yàn)V波器的輸出進(jìn)行混頻,以得到雙耳信號(hào)的第一聲道(22a);以及第二混頻器(16b),用于將對(duì)向收聽(tīng)者的第二耳道的聲傳輸加以建模的方向?yàn)V波器的輸出進(jìn)行混頻,以得到雙耳信號(hào)的第二聲道(22b)。
4.一種用于形成彼此間相似性減小的頭部相關(guān)傳遞函數(shù)集合以對(duì)多個(gè)聲道從與相應(yīng)聲道相關(guān)聯(lián)的虛擬聲源位置向收聽(tīng)者耳道的聲傳輸進(jìn)行建模的設(shè)備,所述設(shè)備包括HRTF提供器(32),用于提供原始的多個(gè)HRTF ;以及HRTF處理器(34),用于使對(duì)預(yù)定的聲道對(duì)的聲傳輸進(jìn)行建模的HRTF的脈沖響應(yīng)相對(duì)于彼此而延遲,或在譜變化的意義上,以不同方式修改所述HRTF的脈沖響應(yīng)的相位響應(yīng)和 /或幅度響應(yīng),其中所述聲道對(duì)是以下聲道對(duì)之一多個(gè)聲道的左聲道和右聲道、所述多個(gè)聲道的前聲道和后聲道、以及所述多個(gè)聲道的中心聲道和非中心聲道。
5.根據(jù)權(quán)利要求4所述的設(shè)備,其中,HRTF提供器(3 被配置為基于虛擬聲源位置和 HRTF參數(shù)來(lái)提供所述原始的多個(gè)HRTF。
6.根據(jù)權(quán)利要求4或5所述的設(shè)備,其中,HRTF處理器(34)被配置為以不同方式對(duì)預(yù)定的聲道對(duì)的脈沖響應(yīng)進(jìn)行全通濾波。
7.一種用于基于多聲道信號(hào)來(lái)產(chǎn)生雙耳信號(hào)的與房間反射/回響有關(guān)的貢獻(xiàn)的設(shè)備, 所述多聲道信號(hào)表示多個(gè)聲道并且用于由揚(yáng)聲器配置來(lái)再現(xiàn),所述揚(yáng)聲器配置具有與每個(gè)聲道相關(guān)聯(lián)的虛擬聲源位置,所述設(shè)備包括下混頻發(fā)生器,用于形成多聲道信號(hào)的聲道的單聲道或立體聲下混頻;以及房間處理器,用于基于單聲道或立體聲信號(hào)通過(guò)對(duì)房間反射/回響進(jìn)行建模,來(lái)產(chǎn)生雙耳信號(hào)的與房間反射/回響有關(guān)的貢獻(xiàn),其中,下混頻發(fā)生器被配置為形成單聲道或立體聲下混頻,使得所述多個(gè)聲道以在多聲道信號(hào)的至少兩個(gè)聲道之間不同的聲級(jí),對(duì)單聲道或立體聲下混頻作出貢獻(xiàn)。
8.根據(jù)權(quán)利要求7所述的設(shè)備,其中,下混頻發(fā)生器被配置為形成單聲道或立體聲下混頻,使得所述多個(gè)聲道中的中心聲道相對(duì)于多聲道信號(hào)的其他聲道而言,以聲級(jí)降低的方式來(lái)對(duì)單聲道或立體聲下混頻作出貢獻(xiàn)。
9.根據(jù)權(quán)利要求7或8所述的設(shè)備,其中,下混頻發(fā)生器被配置為通過(guò)空間音頻編碼, 根據(jù)下混頻信號(hào)以及對(duì)所述多個(gè)聲道之間的聲級(jí)差、相位差、時(shí)間差和/或相關(guān)性度量加以描述的關(guān)聯(lián)空間參數(shù),來(lái)重構(gòu)所述多個(gè)聲道。
10.根據(jù)權(quán)利要求9所述的設(shè)備,其中,下混頻發(fā)生器被配置為執(zhí)行形成,使得至少兩個(gè)聲道中的第一聲道相對(duì)于該至少兩個(gè)聲道中的第二聲道而言,聲級(jí)降低的量取決于空間參數(shù)。
11.根據(jù)權(quán)利要求9所述的設(shè)備,其中,下混頻發(fā)生器被配置為通過(guò)空間音頻編碼,根據(jù)立體聲下混頻信號(hào)、聲道預(yù)測(cè)系數(shù)和殘差信號(hào)070),來(lái)重構(gòu)所述多個(gè)聲道,其中所述聲道預(yù)測(cè)系數(shù)描述如何將立體聲下混頻信號(hào)的聲道線性地組合以預(yù)測(cè)中心聲道、左聲道和右聲道構(gòu)成的三元組,所述殘差信號(hào)(270)反映了預(yù)測(cè)三元組時(shí)的預(yù)測(cè)殘差。
12.根據(jù)權(quán)利要求7至11中任一項(xiàng)所述的設(shè)備,其中,下混頻發(fā)生器被配置為執(zhí)行形成,使得至少兩個(gè)聲道中的第一聲道相對(duì)于該至少兩個(gè)聲道中的第二聲道而言,聲級(jí)降低的量取決于所述多個(gè)聲道的各個(gè)單獨(dú)聲道之間的聲級(jí)差和/或相關(guān)性。
13.根據(jù)權(quán)利要求12所述的設(shè)備,其中,下混頻發(fā)生器被配置為基于與下混頻信號(hào)一起表示所述多個(gè)聲道的空間參數(shù),來(lái)獲得所述多個(gè)聲道的各個(gè)單獨(dú)聲道之間的聲級(jí)差和/ 或相關(guān)性。
14.根據(jù)權(quán)利要求7至11中任一項(xiàng)所述的設(shè)備,其中,下混頻發(fā)生器被配置為執(zhí)行形成,使得至少兩個(gè)聲道中的第一聲道相對(duì)于該至少兩個(gè)聲道中的第二聲道而言,聲級(jí)降低的量隨時(shí)間變化,如在多聲道信號(hào)的輔助信息內(nèi)傳輸?shù)臅r(shí)間變化指示符所指示的一樣。
15.根據(jù)權(quán)利要求7所述的設(shè)備,所述設(shè)備還包括信號(hào)類型檢測(cè)器,用于檢測(cè)多聲道信號(hào)內(nèi)的語(yǔ)音階段和非語(yǔ)音階段,其中,下混頻發(fā)生器被配置為執(zhí)行形成,使得與在非語(yǔ)音階段期間相比,在語(yǔ)音階段期間聲級(jí)降低的量更高。
16.一種基于多聲道信號(hào)來(lái)產(chǎn)生雙耳信號(hào)的方法,所述多聲道信號(hào)表示多個(gè)聲道并且用于由揚(yáng)聲器配置來(lái)再現(xiàn),所述揚(yáng)聲器配置具有與每個(gè)聲道相關(guān)聯(lián)的虛擬聲源位置,所述方法包括以不同方式處理并因此減小在所述多個(gè)聲道的左聲道和右聲道、所述多個(gè)聲道的前聲道和后聲道、以及所述多個(gè)聲道的中心聲道和非中心聲道中的至少一對(duì)聲道之間的相關(guān)性,以得到彼此間相似性減小的聲道集合00);對(duì)彼此間相似性減小的聲道集合00)應(yīng)用多個(gè)方向?yàn)V波器(14),以針對(duì)彼此間相似性減小的聲道集合OO)中一個(gè)相應(yīng)聲道,對(duì)從與所述彼此間相似性減小的聲道集合中的該相應(yīng)聲道相關(guān)聯(lián)的虛擬聲源位置向收聽(tīng)者的相應(yīng)耳道的聲傳輸進(jìn)行建模;將對(duì)向收聽(tīng)者的第一耳道的聲傳輸加以建模的方向?yàn)V波器的輸出進(jìn)行混頻,以得到雙耳信號(hào)的第一聲道0 );以及將對(duì)向收聽(tīng)者的第二耳道的聲傳輸加以建模的方向?yàn)V波器的輸出進(jìn)行混頻,以得到雙耳信號(hào)的第二聲道02b)。
17.一種基于多聲道信號(hào)來(lái)產(chǎn)生雙耳信號(hào)的方法,所述多聲道信號(hào)表示多個(gè)聲道并且用于由揚(yáng)聲器配置來(lái)再現(xiàn),所述揚(yáng)聲器配置具有與每個(gè)聲道相關(guān)聯(lián)的虛擬聲源位置,所述方法包括在譜變化的意義上,在所述多個(gè)聲道中的至少兩個(gè)聲道之間,以不同方式執(zhí)行相位和/ 或幅度修改,以得到彼此間相似性減小的聲道集合OO);對(duì)彼此間相似性減小的聲道集合OO)應(yīng)用多個(gè)方向?yàn)V波器(14),以針對(duì)彼此間相似性減小的聲道集合OO)中一個(gè)相應(yīng)聲道,對(duì)從與所述彼此間相似性減小的聲道集合中的該相應(yīng)聲道相關(guān)聯(lián)的虛擬聲源位置向收聽(tīng)者的相應(yīng)耳道的聲傳輸進(jìn)行建模;將對(duì)向收聽(tīng)者的第一耳道的聲傳輸加以建模的方向?yàn)V波器的輸出進(jìn)行混頻,以得到雙耳信號(hào)的第一聲道0 );以及將對(duì)向收聽(tīng)者的第二耳道的聲傳輸加以建模的方向?yàn)V波器的輸出進(jìn)行混頻,以得到雙耳信號(hào)的第二聲道02b)。
18.一種形成彼此間相似性減小的頭部相關(guān)傳遞函數(shù)集合以對(duì)多個(gè)聲道從與相應(yīng)聲道相關(guān)聯(lián)的虛擬聲源位置向收聽(tīng)者耳道的聲傳輸進(jìn)行建模的方法,所述方法包括提供原始的多個(gè)HRTF ;以及使對(duì)預(yù)定的聲道對(duì)的聲傳輸進(jìn)行建模的HRTF的脈沖響應(yīng)相對(duì)于彼此而延遲,或在譜變化的意義上,以不同方式修改所述HRTF的脈沖響應(yīng)的相位響應(yīng)和/或幅度響應(yīng),其中所述聲道對(duì)是以下聲道對(duì)之一多個(gè)聲道的左聲道和右聲道、所述多個(gè)聲道的前聲道和后聲道、以及所述多個(gè)聲道的中心聲道和非中心聲道。
19.一種用于基于多聲道信號(hào)來(lái)產(chǎn)生雙耳信號(hào)的與房間反射/回響有關(guān)的貢獻(xiàn)的方法,所述多聲道信號(hào)表示多個(gè)聲道并且用于由揚(yáng)聲器配置來(lái)再現(xiàn),所述揚(yáng)聲器配置具有與每個(gè)聲道相關(guān)聯(lián)的虛擬聲源位置,所述方法包括形成多聲道信號(hào)的聲道的單聲道或立體聲下混頻;以及基于單聲道或立體聲信號(hào)通過(guò)對(duì)房間反射/回響進(jìn)行建模,來(lái)產(chǎn)生雙耳信號(hào)的與房間反射/回響有關(guān)的貢獻(xiàn),其中,下混頻發(fā)生器被配置為形成單聲道或立體聲下混頻,使得所述多個(gè)聲道以在多聲道信號(hào)的至少兩個(gè)聲道之間不同的聲級(jí),對(duì)單聲道或立體聲下混頻作出貢獻(xiàn)。
20. 一種計(jì)算機(jī)程序,具有用于當(dāng)所述計(jì)算機(jī)程序運(yùn)行在計(jì)算機(jī)上時(shí)執(zhí)行根據(jù)權(quán)利要求16至19中任一項(xiàng)所述的方法的指令。
全文摘要
描述了一種用于基于多聲道信號(hào)來(lái)產(chǎn)生雙耳信號(hào)的設(shè)備,所述多聲道信號(hào)表示多個(gè)聲道并且用于由揚(yáng)聲器配置來(lái)再現(xiàn),所述揚(yáng)聲器配置具有與每個(gè)聲道相關(guān)聯(lián)的虛擬聲源位置。所述設(shè)備包括相關(guān)性減小器,用于以不同方式處理并因此減小在所述多個(gè)聲道的左聲道和右聲道、所述多個(gè)聲道的前聲道和后聲道、以及所述多個(gè)聲道的中心聲道和非中心聲道中的至少一對(duì)聲道之間的相關(guān)性,以得到彼此間相似性減小的聲道集合;多個(gè)方向?yàn)V波器;第一混頻器,用于將對(duì)向收聽(tīng)者的第一耳道的聲傳輸加以建模的方向?yàn)V波器的輸出進(jìn)行混頻;以及第二混頻器,用于將對(duì)向收聽(tīng)者的第二耳道的聲傳輸加以建模的方向?yàn)V波器的輸出進(jìn)行混頻。根據(jù)另一方面,形成彼此間相似性減小的頭部相關(guān)傳遞函數(shù)集合。
文檔編號(hào)H04S7/00GK102172047SQ200980138924
公開(kāi)日2011年8月31日 申請(qǐng)日期2009年7月30日 優(yōu)先權(quán)日2008年7月31日
發(fā)明者伯恩哈德·諾伊格鮑爾, 哈拉爾德·蒙特, 安德烈亞斯·悉塞勒, 珍·普洛斯提斯, 約翰內(nèi)斯·希爾珀特 申請(qǐng)人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)