一種基于球諧展開(kāi)的多聲道轉(zhuǎn)換方法
【專(zhuān)利摘要】本發(fā)明提出一種基于球諧展開(kāi)的多聲道轉(zhuǎn)換方法,主要適用于將L1路多聲道揚(yáng)聲器系統(tǒng)轉(zhuǎn)換為L(zhǎng)2路多聲道揚(yáng)聲器系統(tǒng)?;诼晥?chǎng)的線性疊加理論,根據(jù)聲道數(shù)的不同采用相應(yīng)階數(shù)的球諧函數(shù)分別計(jì)算轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)的聲場(chǎng),在保證轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)在一定階數(shù)下球諧展開(kāi)聲場(chǎng)相同的情況下,計(jì)算出轉(zhuǎn)換后系統(tǒng)各個(gè)揚(yáng)聲器的增益系數(shù)。本發(fā)明實(shí)時(shí)運(yùn)算復(fù)雜度低,能夠在轉(zhuǎn)換后系統(tǒng)上恢復(fù)出聽(tīng)音區(qū)域內(nèi)原始重放系統(tǒng)的聲場(chǎng),可用于多聲道三維音頻系統(tǒng)的精簡(jiǎn)壓縮及上混合技術(shù),可以有效地兼容各種揚(yáng)聲器重放系統(tǒng)及減少傳輸帶寬。
【專(zhuān)利說(shuō)明】一種基于球諧展開(kāi)的多聲道轉(zhuǎn)換方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于聲學(xué)領(lǐng)域,尤其涉及多聲道三維音頻系統(tǒng)的精簡(jiǎn)壓縮和上混合技術(shù)?!颈尘凹夹g(shù)】
[0002]5.1環(huán)繞聲已廣泛運(yùn)用于各類(lèi)傳統(tǒng)影院和家庭影院中,但是5.1聲道缺乏對(duì)高度和距離信息的演繹,無(wú)法使聽(tīng)眾達(dá)到身臨其境的聽(tīng)覺(jué)感受。眾多先進(jìn)的科研機(jī)構(gòu)都對(duì)多聲道音頻系統(tǒng)進(jìn)行研究,其中日本廣播協(xié)會(huì)(Japan Broadcasting Corporation, NHK)科學(xué)技術(shù)研究室于2004年研發(fā)出22.2聲道原型系統(tǒng),將其列入面向下一代超高清電視的三維音頻標(biāo)準(zhǔn)。MPEG (Moving Pictures Experts Group)標(biāo)準(zhǔn)工作組也正在著手制定基于NHK22.2聲道的三維音頻標(biāo)準(zhǔn)MPEG-H。NHK22.2的原型系統(tǒng)將揚(yáng)聲器布局為上、中、下三層,分別在與聽(tīng)眾耳朵水平、高于和低于聽(tīng)眾耳朵的位置放置10個(gè)、9個(gè)和3個(gè)揚(yáng)聲器,以此創(chuàng)造出三維立體的聽(tīng)覺(jué)沖擊。然而,NHK22.2遠(yuǎn)遠(yuǎn)超出了現(xiàn)有傳輸條件及影院重放系統(tǒng)的聲道數(shù)量,傳輸設(shè)備及影院的重放系統(tǒng)短期內(nèi)均無(wú)法滿(mǎn)足于NHK22.2聲道的要求,在保持系統(tǒng)對(duì)聲場(chǎng)還原性能的同時(shí),如何減少傳輸聲道數(shù),簡(jiǎn)化重放系統(tǒng)布局是當(dāng)前亟需解決的問(wèn)題。
[0003]傳統(tǒng)的下混合方法是簡(jiǎn)化重放系統(tǒng)廣泛使用的方法,如5.1聲道壓縮到立體聲及單聲道的下混合方法已經(jīng)被國(guó)際電信聯(lián)盟(ITU)標(biāo)準(zhǔn)化。然而現(xiàn)有的下混合方法均是針對(duì)于二維環(huán)繞聲,并且每種下混合方法只能在特定的揚(yáng)聲器布局下才能達(dá)到理想的演繹效果。此類(lèi)方法并不適用于各種揚(yáng)聲器靈活布局的情況。由于各種應(yīng)用環(huán)境的面積不同、娛樂(lè)環(huán)境的需求不同,都會(huì)導(dǎo)致實(shí)際應(yīng)用中揚(yáng)聲器在數(shù)量和布局上存在較大差異,為了適應(yīng)各種多聲道系統(tǒng)配置上的區(qū)別,2011年Akio Ando基于空間聲場(chǎng)重建的思想,在IEEETransactions on Audio, Speech and Language Processing上提出一種維持重放聲場(chǎng)物理特性不變的多聲道轉(zhuǎn)換方法,旨在精確恢復(fù)NHK22.2系統(tǒng)中心點(diǎn)處聲場(chǎng)的物理特性。此方法將NHK22.2多聲道重放系統(tǒng)分別精簡(jiǎn)為10、8、6聲道,其精簡(jiǎn)原理是在保持重建前后中心點(diǎn)聲場(chǎng)的聲壓和粒子聲速不變的前提下,將原始揚(yáng)聲器系統(tǒng)的每個(gè)揚(yáng)聲器信號(hào)等同于虛擬聲源,把每個(gè)揚(yáng)聲器的信號(hào)重新分配到由三個(gè)揚(yáng)聲器組成的替代揚(yáng)聲器組中,進(jìn)而求解出替代揚(yáng)聲器組中各個(gè)揚(yáng)聲器的增益系數(shù)。然而,在理論推導(dǎo)中,該方法只是保持聲壓及粒子速度方向不變,并沒(méi)有保持粒子速度大小的一致性。并且此方法在原理上并沒(méi)有保證中心點(diǎn)以外聲音的物理特性與原始聲場(chǎng)的一致性,因此在聽(tīng)音區(qū)內(nèi)重建的聲場(chǎng)也會(huì)存在較大誤差。
[0004]由上述方法可知,多聲道轉(zhuǎn)換方法的核心問(wèn)題是空間聲場(chǎng)的精確重建,空間聲場(chǎng)重建的方法按原理可以劃分為兩種:一是求解基爾霍夫-亥姆霍茲積分方程,如波場(chǎng)合成(Wave Field Synthesis, WFS) ;二是基于聲場(chǎng)的球諧函數(shù)展開(kāi)求解揚(yáng)聲器的驅(qū)動(dòng)信號(hào),如Ambisonicso基爾霍夫-亥姆霍茲積分方程在惠更斯原理的基礎(chǔ)上將其數(shù)學(xué)化,認(rèn)為空間任一點(diǎn)的聲場(chǎng)可以用包圍該點(diǎn)的任意封閉曲面上的聲場(chǎng)及其導(dǎo)數(shù)求得,也就是說(shuō)封閉曲面上需要采用無(wú)限分布的單極點(diǎn)聲源和偶極子聲源才能精確表達(dá)封閉曲面S內(nèi)的任意位置r處的聲壓。然而,在實(shí)際應(yīng)用中,偶極子揚(yáng)聲器很少使用。介于基爾霍夫-亥姆霍茲的表達(dá)形式與聲場(chǎng)的球諧函數(shù)展開(kāi)形式具有等價(jià)性,通過(guò)聲場(chǎng)的球諧函數(shù)表達(dá)形式,某一聲源位置rs處的在某一封閉區(qū)域內(nèi)聲場(chǎng)可以由L個(gè)單極點(diǎn)聲源去近似表達(dá),無(wú)需偶極子揚(yáng)聲器,從而可以符合一般場(chǎng)合的揚(yáng)聲器類(lèi)型。因此,本發(fā)明提出一種基于球諧展開(kāi)的多聲道轉(zhuǎn)換方法,旨在盡可能地恢復(fù)原始揚(yáng)聲器系統(tǒng)聽(tīng)音區(qū)內(nèi)的聲場(chǎng)。本發(fā)明采用聲場(chǎng)的球諧展開(kāi)理論保證轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)在一定階數(shù)下球諧展開(kāi)聲場(chǎng)相同,從而在人耳感知失真較小的情況下能夠有效地兼容各種揚(yáng)聲器重放系統(tǒng)及減少傳輸帶寬,降低對(duì)影院的重放要求,為聽(tīng)眾在現(xiàn)有硬件條件下提供高質(zhì)量的三維音頻感受。
【發(fā)明內(nèi)容】
[0005]本發(fā)明針對(duì)于現(xiàn)有多聲道音頻系統(tǒng)精簡(jiǎn)方法聽(tīng)音區(qū)聲場(chǎng)恢復(fù)不精確問(wèn)題,提出一種基于球諧展開(kāi)的多聲道轉(zhuǎn)換方法,使轉(zhuǎn)換后系統(tǒng)在聽(tīng)音區(qū)的聲壓能夠與原始聲場(chǎng)基本保
持一致。
[0006]本發(fā)明的技術(shù)方案為保證轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)在一定階數(shù)下球諧展開(kāi)聲場(chǎng)相同,包括以下步驟:
[0007]步驟1,分別獲取轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)各個(gè)揚(yáng)聲器的空間分布位置信息,記為r=(r, O, φ), r = (/., (), φ);
[0008]步驟2,計(jì)算轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)所需的聲場(chǎng)球諧展開(kāi)階數(shù),對(duì)轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)聲壓進(jìn)行球諧函數(shù)展開(kāi)處理;
[0009]步驟3,建立多聲道轉(zhuǎn)換模型及聲壓匹配模型,保證轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)在所需階數(shù)下聲場(chǎng)球諧展開(kāi)的形式相同;
[0010]步驟4,根據(jù)聲壓匹配模型的矩陣形式,采用矩陣求逆法計(jì)算轉(zhuǎn)換后揚(yáng)聲器系統(tǒng)各個(gè)揚(yáng)聲器對(duì)應(yīng)于原始每一路信號(hào)所分配的增益系數(shù)wvl,即轉(zhuǎn)換矩陣W;
[0011]步驟5,采用shelf濾波器對(duì)原始L1路信號(hào)的低頻信號(hào)進(jìn)行增益調(diào)整,調(diào)整倍數(shù)為iVlog(f’/r),對(duì)轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)的距離差異進(jìn)行補(bǔ)償;
[0012]步驟6,濾波后的LI路信號(hào)組成的信號(hào)矩陣Sf⑴與步驟4求解的轉(zhuǎn)換矩陣W相乘,求得轉(zhuǎn)換后重放信號(hào)矩陣q(t),從而獲得轉(zhuǎn)換后系統(tǒng)各個(gè)揚(yáng)聲器所對(duì)應(yīng)的重放信號(hào)q(t)。
[0013]1.而且,步驟2的實(shí)現(xiàn)方式為,首先統(tǒng)計(jì)揚(yáng)聲器的數(shù)量,原始系統(tǒng)和轉(zhuǎn)換后系統(tǒng)揚(yáng)聲器數(shù)量分別記為L(zhǎng)1和L2,其次根據(jù)球諧展開(kāi)階數(shù)N與揚(yáng)聲器數(shù)量L之間的關(guān)系需滿(mǎn)足L ^ (N+1)2,則原始系統(tǒng)與轉(zhuǎn)換后系統(tǒng)在球諧展開(kāi)的階數(shù)如下式所示:
【權(quán)利要求】
1.一種基于球諧展開(kāi)的多聲道轉(zhuǎn)換方法,其特征在于,包括以下步驟: 步驟1,分別獲取轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)各個(gè)揚(yáng)聲器的空間分布位置信息,記為r=(/% O, φ), r - (/', 0.φ); 步驟2,計(jì)算轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)所需的聲場(chǎng)球諧展開(kāi)階數(shù),對(duì)轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)聲壓進(jìn)行球諧函數(shù)展開(kāi)處理; 步驟3,建立多聲道轉(zhuǎn)換模型及聲壓匹配模型,保證轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)在所需階數(shù)下聲場(chǎng)球諧展開(kāi)的形式相同; 步驟4,根據(jù)聲壓匹配模型的矩陣形式,采用矩陣求逆法計(jì)算轉(zhuǎn)換后揚(yáng)聲器系統(tǒng)各個(gè)揚(yáng)聲器對(duì)應(yīng)于原始每一路信號(hào)所分配的增益系數(shù)wvl,即轉(zhuǎn)換矩陣W; 步驟5,采用shelf濾波器對(duì)原始L1路信號(hào)的低頻信號(hào)進(jìn)行增益調(diào)整,調(diào)整倍數(shù)為νΜ.' ;η,對(duì)轉(zhuǎn)換前后揚(yáng)聲器系統(tǒng)的距離差異進(jìn)行補(bǔ)償; 步驟6,濾波后的L1路信號(hào)組成的信號(hào)矩陣Sf (t)與步驟4求解的轉(zhuǎn)換矩陣W相乘,求得轉(zhuǎn)換后重放信號(hào)矩陣q(t),從而獲得轉(zhuǎn)換后系統(tǒng)各個(gè)揚(yáng)聲器所對(duì)應(yīng)的重放信號(hào)q(t)。
2.如權(quán)利要求1所述的方法,其特征在于:步驟2的實(shí)現(xiàn)方式為,首先統(tǒng)計(jì)揚(yáng)聲器的數(shù)量,原始系統(tǒng)和轉(zhuǎn)換后系統(tǒng)揚(yáng)聲器數(shù)量分別記為L(zhǎng)1和L2,其次根據(jù)球諧展開(kāi)階數(shù)N與揚(yáng)聲器數(shù)量L之間的關(guān)系需滿(mǎn)足L > (N+1)2,則原始系統(tǒng)與轉(zhuǎn)換后系統(tǒng)在球諧展開(kāi)的階數(shù)如下式所示:
3.如權(quán)利要求1所述的方法,其特征在于:步驟3的實(shí)現(xiàn)方式為,多聲道轉(zhuǎn)換模型如下:
4.如權(quán)利要求1所述的方法,其特征在于:步驟4的實(shí)現(xiàn)方式為,聲壓匹配模型的矩陣表達(dá)形式為:
【文檔編號(hào)】H04S3/00GK103888889SQ201410137391
【公開(kāi)日】2014年6月25日 申請(qǐng)日期:2014年4月7日 優(yōu)先權(quán)日:2014年4月7日
【發(fā)明者】鮑長(zhǎng)春, 步兵, 賈懋珅, 周嶺松, 孫正陽(yáng), 朱蓉 申請(qǐng)人:北京工業(yè)大學(xué)