音頻呈現(xiàn)系統(tǒng)的制作方法
【專利說明】音頻呈現(xiàn)系統(tǒng)
【背景技術(shù)】
[0001] 本發(fā)明設(shè)及一種諸如音頻會(huì)議系統(tǒng)等之類的音頻呈現(xiàn)系統(tǒng)W及一種用于聲場(chǎng)再 現(xiàn)的方法,尤其設(shè)及一種使用多揚(yáng)聲器布置的空間多區(qū)域聲場(chǎng)再現(xiàn)。
[0002] 多區(qū)域聲場(chǎng)再現(xiàn)是一種目的在于在沒有物理隔離區(qū)域或不使用耳機(jī)的情況下向 每個(gè)收聽者提供獨(dú)立的聲音環(huán)境。隨著快速發(fā)展的娛樂和通信領(lǐng)域?qū)€(gè)性化聲音環(huán)境的 需求的不斷增長(zhǎng),開放空間的擴(kuò)展區(qū)域上的空間多區(qū)域聲場(chǎng)再現(xiàn)已經(jīng)對(duì)多種解決方案的 定義進(jìn)行了研究,例如M.Poletti在2008年的AES第125次常規(guī)音頻工程社會(huì)會(huì)刊中的 "對(duì) 2D多區(qū)域環(huán)繞聲系統(tǒng)的調(diào)查(Aninvestigationof2Dmultizonesurroundsound system) ";N.Ra血anesh和I.S.Burnett在 2011 年的IE邸ICASSP會(huì)刊第 11 期第 598 至 610 頁(yè)中的"多區(qū)域環(huán)繞系統(tǒng)中獨(dú)立窄帶聲場(chǎng)的再現(xiàn)及其到語(yǔ)音信號(hào)源的擴(kuò)展巧eprcxluction ofindependentnarrowbandsoundfieldsinamultizonesurroundsystemandits extensiontospeechsignalsources)W及Y.J.Wu和T.D.Abhayapala在 2009 年 的IE邸ICASSP會(huì)刊第93至96頁(yè)中的"空間多區(qū)域聲場(chǎng)再現(xiàn)(Spatialmultizone soundfieldreproduction)"。
[0003] 空間多區(qū)域聲場(chǎng)再現(xiàn)在聲信號(hào)處理領(lǐng)域是一個(gè)復(fù)雜而具有挑戰(zhàn)性的問題。主要目 的是通過在指定亮區(qū)內(nèi)準(zhǔn)確地再現(xiàn)所需聲場(chǎng)W提供好的定位感給收聽者,同時(shí)還控制亮區(qū) 和暗區(qū)之間的聲亮度對(duì)比。特定頻率下具有高的聲亮度的區(qū)域定義為亮區(qū),而具有低的聲 亮度的區(qū)域定義為暗區(qū)。一個(gè)區(qū)域在特定頻率下的聲亮度定義為該頻率下的空間平均的勢(shì) 能密度。聲能密度與壓力復(fù)雜幅度的平方成正比,即為聲場(chǎng)幅度的平方。最理想的是將暗 區(qū)的聲能密度設(shè)為零,然而,實(shí)際上,相對(duì)于其他區(qū)域,暗區(qū)的聲能密度通常較小。在那種情 況下,目的是為了實(shí)現(xiàn)聲亮度對(duì)比,其通過暗區(qū)和亮區(qū)之間的功率比來定義。
[0004] 通過使用由16個(gè)揚(yáng)聲器組成的線性揚(yáng)聲器陣列,IvanTashev、化sha化oppo和 M化eSeltzer已經(jīng)證實(shí)了聲波在一個(gè)區(qū)域內(nèi)彼此抵消而在另一區(qū)域內(nèi)放大。向指定聲場(chǎng)的 一側(cè)即使步行幾步就無法聽見音樂。J.Daniel、R.Nicol和S.Moreau在2003年的AES第 114次常規(guī)音頻工程社會(huì)會(huì)刊第51期第425頁(yè)的"對(duì)用于立體聲成像的高階高保真度立體 聲響復(fù)制和波場(chǎng)合成的進(jìn)一步研究(Fu;rtherinvestigationsofhi曲orderambisonics andwavefieldsynthesisforholophonicsoundimaging)"中進(jìn)行了初期理論研究, 其引入高階高保真度立體聲響復(fù)制(HOA)W基于模式匹配在多區(qū)域中再現(xiàn)聲場(chǎng)。在2008 年,Poletti提出另一種方法,使用最小二乘匹配W在多區(qū)域環(huán)繞系統(tǒng)中生成2-D單色聲 場(chǎng)。該是基于對(duì)圓形揚(yáng)聲器孔徑函數(shù)的計(jì)算,該函數(shù)允許聲源位于一圈揚(yáng)聲器內(nèi)或上面。 N.Ra血anesh和I.S.Burnett開展了進(jìn)一步研究擴(kuò)展到兩個(gè)多頻率源,然后擴(kuò)展到窄帶語(yǔ) 音信號(hào)。
[0005] 然而,上述提及的研究都沒有給從一個(gè)區(qū)域泄露到其他指定區(qū)域的聲音提供準(zhǔn)確 控制。T.Betlehem和P.Teal在2011年的IE邸ICASSP會(huì)刊第437至440頁(yè)的"多區(qū)域環(huán)繞 聲的受約束優(yōu)化方法(Aconstrainedoptimizationapproachformultizonesurround sound)"中提出了一種方法W獨(dú)立控制各個(gè)區(qū)域中的聲音,同時(shí)還控制向其他收聽者區(qū)域 的泄露。使用了一種用于確定最小化控制區(qū)域中再現(xiàn)的均方差(MS巧的揚(yáng)聲器權(quán)重的受約 束優(yōu)化,該種優(yōu)化類似于P.D.Teal、T.Betlehem和M.化letti在2010年3月的IE邸ICASSP 會(huì)刊第101至104頁(yè)中的"聲音的功率約束的全息再現(xiàn)的算法(Analgorithm化rpower constrainedholographicreproductionofsound)"。他們對(duì)揚(yáng)聲器權(quán)重的合計(jì)平方值 進(jìn)行約束W提高系統(tǒng)魯椿性。J.W.化oi和Y.H.Kim在2002年的JASA第111期第1695至 1700頁(yè)的"使用多種源的具有發(fā)光區(qū)域的聲亮區(qū)的生成(Generationofanacoustically brightzonewithanilluminatedregionusingmultiplesources) " 中提出了一種方 法,W通過在特定頻率下使用多種控制源產(chǎn)生聲亮區(qū)(具有高的聲勢(shì)能的區(qū)域)。引入了 一種聲對(duì)比控制方法W最大化兩個(gè)區(qū)域(亮區(qū)和暗區(qū))之間的聲亮度對(duì)比。用于單聲的聲 音聚焦的個(gè)人音頻系統(tǒng)被實(shí)施為一種示例應(yīng)用程序,展示了亮區(qū)和暗區(qū)之間高達(dá)20地的 壓差。J. -Y.Park、J.-比Chang、Y. -H.Kim和Y.Park在2008年10月的控制、自動(dòng)化和系 統(tǒng)的國(guó)際會(huì)議上的"使用揚(yáng)聲器的個(gè)人立體聲系統(tǒng);可行性研究(Personalstereophonic systemusingloudspeakers:feasibilitystudy)"中進(jìn)一步將聲對(duì)比控制方法應(yīng)用于個(gè) 人立體聲系統(tǒng),結(jié)果表明可W在每個(gè)耳朵周圍選擇的亮區(qū)中獲得超過20地的聲道間距。該 些方法都受限于兩個(gè)不同區(qū)域之間聲能對(duì)比的控制,而且該方法的結(jié)果不能控制聲場(chǎng)。事 實(shí)上,它們不能為亮區(qū)中的收聽者提供定位感。
[0006] Y.J.Wu和T.D.Abhayapala在 2009 年的I邸EICASSP會(huì)刊第 93 至 96 頁(yè)的"空間 多區(qū)域聲場(chǎng)再現(xiàn)(Spatialmultizonesoun壯ieldreproduction)"中提出了一種框架W 通過柱狀諧波擴(kuò)展在單個(gè)圓形揚(yáng)聲器陣列內(nèi)的不同地點(diǎn)創(chuàng)建多個(gè)2-D聲場(chǎng)。他們通過將各 個(gè)所需聲場(chǎng)轉(zhuǎn)換到單個(gè)全球坐標(biāo)系統(tǒng)W及應(yīng)用合適的角窗函數(shù)得出所需全局聲場(chǎng)。Y.Wu 和T.Abhayapala在2009年的IE邸WASPAA第309至312頁(yè)的"經(jīng)過空間帶阻濾波器的 多區(qū)域 2D聲場(chǎng)再現(xiàn)(Multizone2Dsoun壯ieldreproductionviaspatialbandstop filters)"中提出了一種改進(jìn)的方法,在暗區(qū)上使用空間帶阻濾波W抑制附近所需聲場(chǎng)的 泄露。然而,該兩個(gè)方法都是基于通過使用額外空間模式(諧波)消除對(duì)其他區(qū)域的不良 效應(yīng)該一思想。該方法的缺點(diǎn)在于其只能在指定再現(xiàn)區(qū)域之外創(chuàng)建暗區(qū),該使該方法對(duì)實(shí) 際應(yīng)用沒有重要意義。再現(xiàn)區(qū)域定義了用于呈現(xiàn)所需聲場(chǎng)的感興趣的總控制區(qū)域。感興趣 的區(qū)域可W只包含亮區(qū),暗區(qū)只能在該再現(xiàn)區(qū)域之外獲取。該再現(xiàn)區(qū)域至少通過揚(yáng)聲器劃 定范圍,并且通常限制于較小區(qū)域。
[0007] 現(xiàn)有技術(shù)中描述的方法無法通過在指定亮區(qū)內(nèi)準(zhǔn)確地再現(xiàn)所需聲場(chǎng)來提供好的 定位感給收聽者,同時(shí)還無法W有效方式控制亮區(qū)和暗區(qū)之間的聲亮度對(duì)比。現(xiàn)有技術(shù) 只能通過重構(gòu)聲場(chǎng)或在兩個(gè)區(qū)域之間無需定位信息提供聲亮度對(duì)比來部分實(shí)現(xiàn)該目標(biāo)。 T.Betlehem、P.D.Teal在2011年的IE邸ICASSP會(huì)刊第437至440頁(yè)的"多區(qū)域環(huán)繞聲 音的覺限優(yōu)化方法(Aconstrainedoptimizationapproachformulti-zonesurround sound)"中描述了一種基于凸優(yōu)化實(shí)現(xiàn)聲亮度對(duì)比和聲場(chǎng)重建的方法,但是該種方法的計(jì) 算復(fù)雜度使其在實(shí)際應(yīng)用中很難實(shí)施。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明的目的是提供一種在指定再現(xiàn)區(qū)域內(nèi)提高所需聲場(chǎng)再現(xiàn)的技術(shù)。
[0009] 該目的可W通過獨(dú)立權(quán)利要求的特征來實(shí)現(xiàn)。進(jìn)一步的實(shí)施形式在從屬權(quán)利要 求、具體說明和附圖中顯而易見。
[0010] 本發(fā)明基于W下發(fā)現(xiàn):將所需多區(qū)域聲場(chǎng)建模為所需再現(xiàn)區(qū)域上的基函數(shù)的正交 展開,其中所述正交性意味著所需再現(xiàn)區(qū)域上的集合中的任意兩個(gè)基函數(shù)的內(nèi)部乘積為0, 產(chǎn)生在加權(quán)的最小二乘意義上最接近于所需聲場(chǎng)的亥姆霍茲解,并且可W最佳地再現(xiàn)所需 聲場(chǎng)。可W通過,例如將具有亥姆霍茲方程的解集合的格萊姆-施密特過程作為輸入(假 設(shè)所述集合是完整的)形成基正交集?;蛘?,可W使用"豪斯霍爾德變換"來構(gòu)建正交集。
[0011] 一般來說,輸入解的集合不是正交的,所W使用它們很繁瑣。格萊姆-施密特過程 能夠?qū)⒄患幕瘮?shù)構(gòu)建為平行波和圓形波等基波場(chǎng)的線性組合。然后計(jì)算基波場(chǎng)的系 數(shù),該樣能夠應(yīng)用現(xiàn)有再現(xiàn)方法W使用封閉的圓形揚(yáng)聲器陣列在再現(xiàn)區(qū)域內(nèi)再現(xiàn)所需多區(qū) 域聲場(chǎng)。通過應(yīng)用優(yōu)化的半圓再現(xiàn)方法,可W使用半圓揚(yáng)聲器陣列,其要求如現(xiàn)有方法中所 介紹的揚(yáng)聲器的近似一半。
[0012] 該種技術(shù)提供了一種在指定再現(xiàn)區(qū)域內(nèi)改