本公開涉及音頻再現(xiàn)系統(tǒng)和方法,具體來說涉及具有更高個性化程度的音頻再現(xiàn)系統(tǒng)和方法。
背景技術(shù):
市場上存在用于通過耳機來雙耳回放音頻內(nèi)容的多種算法。所述算法基于合成雙耳房間脈沖響應(yīng)(BRIR),這意味著其基于廣義頭相關(guān)傳遞函數(shù)(HRTF),諸如標(biāo)準(zhǔn)仿真頭部或來自大型HRTF數(shù)據(jù)庫的廣義函數(shù)。此外,一些算法允許用戶從一組給定的BRIR選擇最合適的BRIR。此類選擇可以改善收聽質(zhì)量;它們包括外部化和頭外定位,但是信號處理鏈中缺少個性化(例如,頭部遮蔽、肩部反射或耳廓效應(yīng))。特別地,耳廓信息是與指紋一樣獨特的。通過個人BRIR來添加個性化可以增加逼真度。
技術(shù)實現(xiàn)要素:
本文所述的方法包括以下過程:將具有內(nèi)置揚聲器的移動裝置定位在收聽環(huán)境中的第一位置處,并且將至少一個麥克風(fēng)定位在收聽環(huán)境中的至少一個第二位置處;從收聽環(huán)境中的第一位置處的移動裝置的揚聲器發(fā)射測試音頻內(nèi)容;使用收聽環(huán)境中的至少一個第二位置處的至少一個麥克風(fēng)來接收由揚聲器發(fā)射的測試音頻內(nèi)容;以及,至少部分地基于接收的測試音頻內(nèi)容,確定在由至少一個耳機回放之前將施加到期望音頻內(nèi)容的一個或多個調(diào)整;其中第一位置和第二位置彼此遠離,以使得至少一個麥克風(fēng)位于揚聲器的近場內(nèi)。
用于測量雙耳房間脈沖響應(yīng)的系統(tǒng)包括:設(shè)置在收聽環(huán)境中的第一位置處的具有內(nèi)置揚聲器的移動裝置、以及設(shè)置在收聽環(huán)境中的至少一個第二位置處的至少一個麥克風(fēng)。移動裝置被配置來通過位于收聽環(huán)境中的第一位置處的揚聲器發(fā)射測試音頻內(nèi)容,并且從耳機接收測試音頻內(nèi)容,所述測試音頻內(nèi)容由揚聲器發(fā)射并且由位于收聽環(huán)境中的至少一個第二位置處的耳機接收。移動裝置還被配置來至少部分地基于接收的音頻內(nèi)容,確定在由耳機回放之前將由移動裝置施加到期望音頻內(nèi)容的一個或多個調(diào)整,其中第一位置和第二位置彼此遠離,以使得至少一個麥克風(fēng)位于揚聲器的近場內(nèi)。
在查閱以下詳細描述和附圖時,其他系統(tǒng)、方法、特征和優(yōu)點對于本領(lǐng)域技術(shù)人員將是或?qū)⒆兊妹黠@。意圖是,所有此類額外系統(tǒng)、方法、特征和優(yōu)點包括于本說明書內(nèi),包括于本發(fā)明的范圍內(nèi),并且受隨附權(quán)利要求書保護。
附圖說明
可參考以下描述和附圖更好地理解系統(tǒng)。附圖中的部件不一定按比例繪制,而是強調(diào)示出本發(fā)明的原理。此外,在附圖中,相同參考數(shù)字在所有不同視圖中指示對應(yīng)的部分。
圖1是用于雙聲道立體聲信號、5.1聲道立體聲信號或7.1聲道立體聲信號的雙耳回放的示例性音頻系統(tǒng)的示意圖。
圖2是用于使用智能電話和移動麥克風(fēng)記錄器來測量BRIR的示例性系統(tǒng)的示意圖。
圖3是用于使用智能電話和頭戴式耳機麥克風(fēng)來測量BRIR的另一個示例性系統(tǒng)的示意圖。
圖4是用于使用智能電話來測量BRIR的示例性方法的流程圖。
圖5是示出不同激勵(stimuli)的頻率響應(yīng)的圖。
圖6是示出后智能電話揚聲器的頻率響應(yīng)(從近場測量獲得)、示例性目標(biāo)頻率響應(yīng)和逆濾波器的圖。
圖7是頭戴式耳機真實房間系統(tǒng)中的BRIR測量的示例性應(yīng)用的流程圖。
圖8是用于計算逆濾波器以便校正智能電話揚聲器缺陷的示例性方法的流程圖。
圖9是示出在智能電話揚聲器缺陷的校正之前和之后的頻率響應(yīng)的比較的圖。
圖10是示例性頻譜平衡器算法的流程圖。
圖11是用于測量耳機特性的示例性設(shè)備的示意圖。
圖12是示例性耳機均衡器算法的流程圖。
圖13是頭戴式耳機虛擬房間系統(tǒng)中的BRIR測量的示例性應(yīng)用的流程圖。
圖14是在去混響器中使用的加窗函數(shù)的圖。
圖15是在施加圖14所示的加窗函數(shù)之前和之后的BRIR的圖。
圖16是示出各種示例性測量的BRIR的幅值響應(yīng)的比較的圖。
圖17是示出形成圖16所示的圖的基礎(chǔ)的示例性測量的BRIR的相位響應(yīng)的比較的圖。
圖18是示出用作麥克風(fēng)的耳機換能器的幅值響應(yīng)的圖。
具體實施方式
通常通過五個、六個、七個或更多個揚聲器來遞送記錄的“環(huán)繞聲”。真實世界聲音從無限多個位置到達用戶(在本文中也被稱為“聽眾”,特別是當(dāng)就其聲學(xué)感知而論時)。盡管人類聽覺系統(tǒng)是雙聲道系統(tǒng),但是聽眾容易感知在三維空間的所有軸上的方向。進入人類聽覺系統(tǒng)的一個路線是通過頭戴式耳機(在本文中也被稱為“耳機”,特別是就相對于每個單獨耳朵的聲學(xué)特性而論時)。頭戴式耳機的弱點是它們無法在三維中創(chuàng)建寬敞和完全準(zhǔn)確的聲波像。由于頭戴式耳機原則上能夠提供像真實房間中的多個揚聲器所創(chuàng)建的聲波體驗一樣完全寬敞、精確定位和生動的聲波體驗,所以一些“虛擬環(huán)繞”處理器在這方面已經(jīng)取得漸進的進步。
來自各種方向的聲音由于其遇到頭部和上軀干的形狀和尺寸以及外耳(耳廓)的形狀而更改。人類大腦對不可感知為音調(diào)更改的這些修改高度敏感;相反,它們被聽眾相當(dāng)準(zhǔn)確地體驗為向上、向下、前、后或在中間定域。此聲學(xué)更改可以由HRTF表示。
一種類型的錄音已經(jīng)認識到兩個音頻聲道可以重建三維體驗。雙耳效應(yīng)錄音通過單對緊密間隔的麥克風(fēng)來進行并且旨在用于頭戴式耳機收聽。有時,麥克風(fēng)嵌入在仿真頭部或頭部/軀干中以便創(chuàng)建HRTF,在這種情況下增強了三維感。所再現(xiàn)的聲音空間可以是令人信服的,雖然沒有參考原始環(huán)境不能證明其準(zhǔn)確性。在任何情況下,這些都是很少見于商業(yè)目錄中的專業(yè)錄音。旨在捕獲前、后和有時上方的聲音的錄音通過多個麥克風(fēng)來進行,存儲在多個聲道上,并且旨在圍繞聽眾排列的多個揚聲器上進行回放。
其他系統(tǒng)(諸如Smyth Realiser)提供了完全不同的體驗,其中多聲道錄音(包括立體聲)通過頭戴式耳機聽起來與其通過真實房間中的揚聲器陣列聽起來是無差別相同的。原則上,Smyth Realiser類似于其他系統(tǒng),因為它將HRTF施加到多聲道聲音以便驅(qū)動頭戴式耳機。但隨著其他改進,Smyth Realiser采用在其他產(chǎn)品中未見到的三個關(guān)鍵部件:個性化,頭部跟蹤和每個真實收聽空間和聲音系統(tǒng)的屬性的捕獲。Smyth Realiser包括插入耳塞中的一對微型麥克風(fēng),其被放置在聽眾的耳朵中以用于測量。聽眾位于揚聲器陣列內(nèi)的收聽位置處,所述揚聲器通常是5.1聲道或7.1聲道,但是可以適應(yīng)任何配置(包括高度聲道)。通過揚聲器播放一組簡短的測試信號,然后聽眾戴上頭戴式耳機并且進行第二組簡短的測量。整個過程花費小于五分鐘。在通過揚聲器的測量中,Smyth Realiser不僅捕獲聽眾的個人HRTF,還完全表征房間、揚聲器和驅(qū)動揚聲器的電子設(shè)備。在通過頭戴式耳機的測量中,系統(tǒng)收集數(shù)據(jù)以便校正頭戴式耳機和耳朵的交互以及頭戴式耳機自身的響應(yīng)。復(fù)合數(shù)據(jù)存儲在存儲器中,并且可以用于控制連接在音頻信號路徑中的均衡器。
如可見的,由于需要專用的測量麥克風(fēng)、聲卡和其他設(shè)備,所以進行雙耳測量所需的努力是麻煩的。本文描述的方法和系統(tǒng)允許通過智能電話來測量BRIR,以便在不使用昂貴硬件的情況下易于雙耳測量。
圖1是用于由信號源101提供的雙聲道立體聲信號、5.1聲道立體聲信號或7.1聲道立體聲信號的雙耳回放的示例性音頻系統(tǒng)100的示意圖,所述信號源101可以是CD播放器、DVD播放器、車輛頭部單元、MPEG環(huán)繞聲(MPS)解碼器等。雙耳化器102根據(jù)由信號源101提供的雙聲道立體聲信號、5.1聲道立體聲信號或7.1聲道立體聲信號生成用于耳機103的雙聲道信號。BRIR測量系統(tǒng)104允許測量實際的BRIR并且向雙耳化器102提供表示BRIR的信號,以使得多聲道錄音(包括立體聲)通過耳機103聽起來與其通過真實房間中的揚聲器陣列聽起來是無差別相同的。圖1所示的示例性音頻系統(tǒng)100可以用于為汽車應(yīng)用遞送個性化多聲道內(nèi)容,并且可以針對所有類型的頭戴式耳機(即不僅用于貼耳式頭戴式耳機,還用于入耳式頭戴式耳機)。
圖2是使用智能電話201(或移動電話、平板手機、平板計算機、膝上型計算機等)的示例性BRIR測量系統(tǒng)104的示意圖,其包括揚聲器202和連接到兩個麥克風(fēng)204和205的移動音頻記錄器203。智能電話201的揚聲器202傳播由麥克風(fēng)204和205捕獲的聲音,從而建立在揚聲器202與麥克風(fēng)204和205之間的聲傳遞路徑206。通過可以是藍牙(BT)連接的雙向無線連接207,在智能電話201與記錄器203之間互換包括數(shù)字音頻信號和/或指令的數(shù)字數(shù)據(jù)。
圖3是使用智能電話301的另一個示例性BRIR測量系統(tǒng)104的示意圖,其包括揚聲器302和裝備有麥克風(fēng)304和305的頭戴式耳機303。智能電話301的揚聲器302傳播由麥克風(fēng)304和305捕獲的聲音,從而建立在揚聲器302與麥克風(fēng)304和305之間的聲傳遞路徑306。通過有線線路連接307或可替代地通過諸如BT連接(圖3中未示出)的無線連接,將數(shù)字音頻信號或模擬音頻信號從麥克風(fēng)304和305傳遞到智能電話301。相同或單獨的有線線路連接或無線連接(圖3中未示出)可以用于將數(shù)字音頻信號或模擬音頻信號從智能電話301傳遞到頭戴式耳機303,以用于再現(xiàn)這些音頻信號。
參考圖4,移動裝置(諸如圖2所示的系統(tǒng)中的智能電話201)可以從用戶接收啟動命令(過程401)。在接收到啟動命令時,智能電話201啟動專用軟件應(yīng)用(app)并且與移動音頻記錄器203建立BT連接(過程402)。智能電話201從用戶接收記錄命令,并且通過BT連接207指示移動音頻記錄器203開始記錄(過程403)。移動音頻記錄器203從智能電話201接收指令并且開始記錄(過程404)。智能電話201通過內(nèi)置揚聲器202發(fā)射測試音頻內(nèi)容,并且移動音頻記錄器203記錄由麥克風(fēng)204和205接收的測試音頻內(nèi)容(過程405)。智能電話201通過BT來指示移動音頻記錄器203停止記錄(過程406)。移動音頻記錄器203從智能電話201接收指令并且停止記錄(過程407)。移動音頻記錄器203隨后通過BT將記錄的測試音頻內(nèi)容發(fā)送到智能電話201(過程408);智能電話201從移動音頻記錄器203接收記錄的測試音頻內(nèi)容并且處理接收的測試音頻內(nèi)容(過程409)。智能電話201然后斷開與移動記錄器的BT連接(過程410),并且輸出表示BRIR的數(shù)據(jù)(過程411)。可以在圖3所示的系統(tǒng)中施加類似于圖4所示的過程的過程,但是其中在移動裝置(智能電話301)內(nèi)執(zhí)行音頻記錄。
在研究中,結(jié)合圖2所示的示例性系統(tǒng)考慮了四個激勵(測試音頻內(nèi)容):氣球爆裂501,兩種不同類型的拍手502和503、以及正弦掃描504。在消聲室中距特定測量麥克風(fēng)約一米處記錄這些激勵。在圖5中給出這些測量的脈沖響應(yīng)的幅值。從圖中可見,兩次拍手502和503在其當(dāng)前形式中不是理想的,因為它們與正弦掃描504的測量明顯不同。為了比較,還示出了脈沖激勵505。理想地,應(yīng)當(dāng)在消聲室中測量頻率響應(yīng)。然而,非專家通常不能進入消聲室。一個替代方案是使用近場測量,所述近場測量通過使用用于雙耳測量的相同麥克風(fēng)在技術(shù)上是可行的。因此,單次拍手記錄可能未必給出房間的期望特性。由此,進行測量需要來自最終用戶的更多實際努力。然而,期望使測量過程對于普通用戶是盡可能簡單和可靠的。
諸如揚聲器的聲源具有近場區(qū)和遠場區(qū)。在近場內(nèi),由揚聲器(loudspeaker)(或簡稱揚聲器(speaker))產(chǎn)生的波前是不平行的,并且波的強度隨所述范圍振蕩。為該原因,來自近場區(qū)內(nèi)的目標(biāo)的回波水平可以隨著小位置改變而大大地變化。一旦處于遠場,波前是幾乎平行的,并且強度隨著范圍而變化,在逆平方規(guī)則下平方。在遠場內(nèi),適當(dāng)?shù)匦纬刹ㄊ?,并且可以根?jù)標(biāo)準(zhǔn)方程預(yù)測回波水平。
從圖5可見,智能電話揚聲器在低頻區(qū)中表現(xiàn)出不良響應(yīng)506。在約6kHz處也可見峰值。盡管存在這些缺陷,為了以下提及的原因仍可考慮智能電話揚聲器:
a)雖然智能電話揚聲器具有有限的頻率響應(yīng),但它們?nèi)匀豢梢猿尸F(xiàn)約600Hz以上的信號(另請參見圖6)。
b)如果智能電話揚聲器自身用于呈現(xiàn)測量激勵,則最終用戶不需要攜帶諸如氣球的附加物體以用于測量。
c)掃描正弦激勵被許多制造商和研究人員證明并廣泛使用;它可以容易地在智能電話中實現(xiàn)。
d)用戶可以將智能電話(揚聲器)移動到他頭部周圍的任何位置。這給出了以方位角和高度的任何組合來測量BRIR的靈活性。
在圖6中示出根據(jù)近場測量生成的示例性智能電話揚聲器的幅值響應(yīng)601,從圖6可見頻譜具有從約700Hz向前的均勻特性。還示出了“平坦”目標(biāo)函數(shù)602、以及可用于將幅值響應(yīng)601適配到目標(biāo)函數(shù)602的示例性逆濾波器函數(shù)603。
以下描述用于BRIR計算的兩個示例性算法。使用由于頭戴式耳機真實房間(HRR)方法產(chǎn)生的BRIR,可以通過頭戴式耳機收聽用戶最喜愛的內(nèi)容,包括所測量的房間的信息。使用由于頭戴式耳機虛擬房間(HVR)方法產(chǎn)生的BRIR,可以通過頭戴式耳機收聽用戶最喜愛的內(nèi)容,僅包括雙耳信息。然而,用戶可以任選地在信號鏈中包括虛擬房間。
HRR系統(tǒng)和方法旨在通過頭戴式耳機(耳機)呈現(xiàn)包括聽眾的房間信息的雙耳內(nèi)容。在圖7中給出在包括智能電話701的HRR系統(tǒng)中的BRIR測量的示例性應(yīng)用的流程圖,并且以下進一步更詳細地描述所述示例性應(yīng)用。以下還給出了構(gòu)建框和過程的簡要描述。
通過使用智能電話揚聲器702并且將雙耳麥克風(fēng)(未示出)放置在用戶的耳道入口處來進行BRIR的測量。以期望的方位角和高度角,通過智能電話揚聲器702回放用于頻譜分析的掃描正弦信號??梢允褂靡粚μ貏e設(shè)計的雙耳麥克風(fēng),其完全阻擋聽眾的耳道。麥克風(fēng)可以是一組單獨的雙耳麥克風(fēng),并且測量硬件可以與智能電話701分開,類似于圖2所示的系統(tǒng)??商娲?,耳機換能器自身可以用作用于捕獲聲音的換能器。智能電話701可以使用執(zhí)行例如以上結(jié)合圖4描述的過程的移動應(yīng)用來進行BRIR的測量、預(yù)處理和最終計算。代替逐頻率頻譜分析(例如,如上所述的結(jié)合對應(yīng)窄帶分析的掃描窄帶激勵),可以結(jié)合諸如快速傅里葉變換(FFT)的寬帶頻譜分析或濾波器組使用寬帶激勵或脈沖。
關(guān)于智能電話揚聲器缺陷的校正,理想地需要全帶寬揚聲器以便覆蓋所有頻率范圍同時測量BRIR。由于有限帶揚聲器(即智能電話揚聲器701)用于測量,所以需要覆蓋缺失的頻率范圍。為此,使用一個雙耳麥克風(fēng)來進行近場測量。由此,如圖5所示,具有示例性幅值頻率特性(也稱為“頻率特性”或“頻率響應(yīng)”)的逆濾波器被計算并且施加到左耳和右耳BRIR測量。在給定的實例中,目標(biāo)幅值頻率響應(yīng)曲線被設(shè)置成平坦的,但可以是任何其他期望的曲線。諸如相位差和水平差的信息在該方法中未被補償,但是如果需要的話可以被補償。圖8中示出此過程的流程圖。所述過程包括智能電話揚聲器702的幅值頻率響應(yīng)的近場測量(過程801)。計算智能電話揚聲器702與測量麥克風(fēng)之間的聲學(xué)路徑的對應(yīng)傳遞函數(shù)(也稱為“傳遞特性”)(過程802),并且將其加到逆目標(biāo)幅值頻率函數(shù)803(過程804)。然后計算(線性)有限脈沖響應(yīng)(FIR)濾波器系數(shù)(過程805),并且處理其以便執(zhí)行線性到最小相位變換(過程806)。在由過程806執(zhí)行的濾波器系數(shù)的隨后長度減少之后(過程807),輸出長度減少的濾波器系數(shù)(過程808)。在圖9中給出施加校正之后的結(jié)果的比較,其中曲線圖901描繪均衡之前測量的幅值頻率特性,曲線圖902描繪均衡之后測量的幅值頻率特性,并且曲線圖903描繪用于均衡的幅值頻率特性。
關(guān)于(任選的)頻譜平衡器,如果用戶希望在聲音中嵌入某種音調(diào),則可以施加附加的均衡。為此,獲取左耳和右耳BRIR的平均值。在圖10中給出所述過程的流程圖。所述過程包括:提供用于左耳的身體相關(guān)傳遞函數(shù)BRTF L(過程1001),確定用于右耳的雙耳傳遞函數(shù)BRTF R(過程1002),平滑處理(例如,低通濾波)(過程1003和1004),以及對平滑后的雙耳傳遞函數(shù)BRTF L和BRTF R進行求和(過程1005)。然后,使用由過程1005提供的和以及目標(biāo)幅值頻率響應(yīng)1007來計算對應(yīng)逆濾波器的濾波器系數(shù)(過程1006)。在過程1008中輸出濾波器系數(shù)。
關(guān)于頭戴式耳機均衡器,由于針對耳機存在巨大的頻率特性變化(有時甚至在相同制造公司內(nèi)),需要施加均衡器來補償來自耳機的影響。為此,需要特定耳機的頻率響應(yīng)。如圖11所示,可以使用簡單的設(shè)備來進行這種耳機特性測量。用于測量耳機特性的設(shè)備包括管狀主體(在本文中被稱為“管1101”),其一端包括用于將(入耳)耳機1103聯(lián)接到管1101的適配器1102,并且其另一端裝備有閉合蓋1104、以及設(shè)置在管1101中接近蓋1104的麥克風(fēng)1105。在實踐中,可以使用一個雙耳麥克風(fēng)來代替圖11所示的麥克風(fēng)1105。管1101可以具有位于兩端之間某處的直徑收縮部1006。管1101的體積、長度和直徑應(yīng)該類似于平均人類耳道的體積、長度和直徑。所示的設(shè)備可以模擬壓力室效應(yīng);所測量的響應(yīng)因此可以接近現(xiàn)實。
在圖12中給出對應(yīng)測量過程的示意圖。所述過程包括測量耳機特性(過程1201)并且根據(jù)其計算對應(yīng)傳遞函數(shù)(過程1202)。此外,在過程1204中從過程1202所提供的傳遞函數(shù)減去目標(biāo)傳遞函數(shù)1203。根據(jù)此和,(線性地)計算FIR系數(shù)(過程1205),以便隨后執(zhí)行線性到最小相位變換(過程1206)和長度減少(過程1207)。最后,將濾波器系數(shù)1208輸出到其他應(yīng)用和/或系統(tǒng)。
再次參見圖7,所示的過程包括移動裝置的揚聲器的幅值頻率響應(yīng)的近場測量,所述揚聲器在當(dāng)前情況下是智能電話揚聲器702(過程703)。根據(jù)由過程703產(chǎn)生的信號,計算智能電話揚聲器702的幅值頻率響應(yīng)(過程704)。然后根據(jù)目標(biāo)幅值頻率響應(yīng)706和智能電話揚聲器702的所計算的幅值頻率響應(yīng)來計算逆濾波器幅值頻率響應(yīng)(過程705)。在開始并且使用智能電話揚聲器702來執(zhí)行BRIR測量(過程707)之后,對測量的BRIR和計算的逆濾波器幅值頻率響應(yīng)進行卷積(過程708)?;趯?yīng)的目標(biāo)頻率響應(yīng)710,由房間均衡器處理由過程708產(chǎn)生的信號(過程709)?;趯?yīng)的目標(biāo)頻率響應(yīng)712,由耳機均衡器處理由過程709產(chǎn)生的信號(過程711)。通過N個單聲道音頻文件714(例如,N=2個立體聲信號,N=6個5.1聲道信號,或N=8個7.1聲道信號)對由過程711產(chǎn)生的信號進行卷積(過程713),并且將此卷積結(jié)果輸出到耳機(過程715)。
頭戴式耳機虛擬房間(HVR)系統(tǒng)旨在通過耳機呈現(xiàn)雙耳內(nèi)容而不包括聽眾的房間信息。聽眾可以任選地在鏈中包括虛擬房間。在圖13中給出所述過程的示意圖。以下給出了附加構(gòu)建框的簡要描述。此過程還需要以上結(jié)合圖7-12提及的構(gòu)建框。在下文中僅描述諸如去混響器和人工混響器的附加構(gòu)建框。
去混響器/平滑處理:如果所測量的房間脈沖響應(yīng)包含不必要的峰值和陷波,則令人不愉快的音色偽像可能降低聲音質(zhì)量。為了去除房間信息或移除早期和晚期反射,可以并入(時間和/或頻譜)加窗技術(shù)。在本應(yīng)用中,如圖14所示,使用矩形窗和Blackman-Harris窗的組合。在圖15中給出了在平滑處理之前(1501)和之后(1502)的示例性BRIR。
人工混響器:在上一個框中,已經(jīng)移除所有房間相關(guān)信息。也就是說,在施加加窗函數(shù)(窗)之后,在BRIR中僅包含方向信息(例如,耳間時間差[ITD]和耳間水平差[ILD])。因此,源似乎非常接近耳朵。因此,如果需要合并距離信息,則可以任選地使用人工混響器。為此目的可使用任何最先進的混響器。
從圖13可見,在圖7所示的過程中,在BRIR測量過程707與耳機均衡過程711之間插入去混響過程1301和人工混響過程1302。此外,房間均衡過程709和對應(yīng)的目標(biāo)幅值頻率響應(yīng)710可以被頻譜平衡過程1303和對應(yīng)的目標(biāo)幅值頻率響應(yīng)1304代替。可以包括通過給定窗的加窗的去混響過程1301和卷積過程708接收逆濾波器計算過程705的輸出,其中卷積過程708現(xiàn)在可以在耳機均衡過程711與卷積過程713之間發(fā)生。
在此整個研究中,重點是不破壞BRIR的相位信息。給出了示例性BRIR的圖16中的幅值頻率響應(yīng)以及圖17中的相位頻率響應(yīng)。幅值頻率響應(yīng)示出在施加去混響器算法之后移除BRIR的銳峰和陷波。相位響應(yīng)示出甚至在去混響之后,相位信息也在很大程度上被保留。非正式收聽指示卷積語音的局部化也未被破壞。在圖16中,曲線圖1601描繪耳機均衡之后的幅值頻率響應(yīng),曲線圖1602描繪房間均衡之后的幅值頻率響應(yīng),曲線圖1603描繪去混響之后的幅值頻率響應(yīng),并且曲線圖1604描繪智能電話缺陷校正之后的幅值頻率響應(yīng)。在圖17中,曲線圖1701描繪耳機均衡之后的相位頻率響應(yīng),曲線圖1702描繪房間均衡之后的相位頻率響應(yīng),曲線圖1703描繪去混響之后的相位頻率響應(yīng),并且曲線圖1704描繪智能電話缺陷校正之后的相位頻率響應(yīng)。
圖18示出作為麥克風(fēng)的示例性耳機換能器的幅值頻率響應(yīng)。由于本文描述的系統(tǒng)可以針對消費者用戶,所以耳機換能器和外殼可以特別地用作麥克風(fēng)。在先導(dǎo)試驗中,使用可商購獲得的入耳式耳機作為麥克風(fēng)進行測量。在消聲室中通過揚聲器回放從2Hz到20kHz的掃描正弦信號。耳機膠囊離揚聲器約一米遠。為了比較,還使用參考測量系統(tǒng)來進行參考測量。在圖18中給出了測量的幅值頻率響應(yīng),其中曲線圖1801描繪了左聲道(1801)、右聲道(1802)和參考測量(1803)的幅值頻率響應(yīng)。從曲線中可見,對應(yīng)于耳機的曲線的形狀與從約1,000Hz到9,000Hz的參考測量的形狀是相當(dāng)?shù)摹?/p>
雖然已描述了本發(fā)明的各種實施方案,但是對于本領(lǐng)域的那些普通技術(shù)人員將明顯的是,在本發(fā)明的范圍內(nèi),更多的實施方案和實現(xiàn)方式是可能的。因此,除了根據(jù)隨附權(quán)利要求書及其等效物,本發(fā)明不受限制。