三維音頻精簡(jiǎn)方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于聲學(xué)設(shè)備領(lǐng)域,尤其涉及一種基于雙耳聲壓低失真的三維多聲道音頻 系統(tǒng)揚(yáng)聲器精簡(jiǎn)技術(shù)方案。
【背景技術(shù)】
[0002] 隨著3D電影的穩(wěn)步發(fā)展,3D電視的發(fā)展也較為迅速。根據(jù)英國(guó)未來咨詢公司研究 報(bào)告,適用于家庭中的3D電視銷量預(yù)計(jì)將于2017年增加到1. 577億臺(tái),約占全球售出電視 總量的58%。由此可見,3D影視視聽體驗(yàn)不僅走入了影院,更是逐漸走入了千家萬戶。對(duì) 于現(xiàn)在的多媒體行業(yè)來說,"3D"已成為新的標(biāo)志,3D音視頻技術(shù)能帶來更好的沉浸視聽享 受,已成為多媒體領(lǐng)域的研究熱點(diǎn)。然而,當(dāng)前家庭影院系統(tǒng)仍以3D電視+立體聲/5. 1聲 道音響為主,難以重建聲音的高度感和距離感。3D音頻能夠?qū)崿F(xiàn)聲源水平、高度和距離的精 確重現(xiàn),已成為未來3D視聽系統(tǒng)中音頻系統(tǒng)的發(fā)展趨勢(shì),是當(dāng)前多媒體領(lǐng)域的重要研究方 向。
[0003] 三維多聲道音頻技術(shù)聽音區(qū)域范圍較大,適用范圍較廣,全球先進(jìn)的國(guó)家科研單 位機(jī)構(gòu)和主要的多媒體標(biāo)準(zhǔn)化組織紛紛開展三維多聲道音頻的相關(guān)研究工作。牛津大學(xué)數(shù) 學(xué)研究院于1973年提出了 Ambisonics技術(shù),從數(shù)學(xué)方面分析聲場(chǎng),對(duì)聲場(chǎng)諧波進(jìn)行分解和 重構(gòu),但隨著諧波分解的階數(shù)的增加,聲場(chǎng)準(zhǔn)確重構(gòu)的同時(shí)需要的揚(yáng)聲器數(shù)目可達(dá)上千個(gè)。 荷蘭代爾夫特理工大學(xué)在1993年給出了波場(chǎng)合成技術(shù)(Wave Field Synthesis, WFS),聲音 錄制和重放時(shí)無需數(shù)據(jù)處理,減小了復(fù)雜度,但理想的WFS重建需要揚(yáng)聲器擺放間隔較小, 揚(yáng)聲器數(shù)目也需多達(dá)幾百個(gè)。2009年,杜比公司(Dolby)推出了帶有高置聲道的ProLogic IIz多聲道三維音頻回放系統(tǒng) [2],以及后續(xù)的杜比全景聲系統(tǒng),利用64個(gè)揚(yáng)聲器,將原始二 維空間音效增加到三維,使聲音更有空間包圍感。2008年日本廣播協(xié)會(huì)(NHK)科學(xué)技術(shù)研 究實(shí)驗(yàn)室研發(fā)出了 22. 2多聲道音頻系統(tǒng),結(jié)構(gòu)簡(jiǎn)單,并能兼容5. 1環(huán)繞立體聲[3]。動(dòng)態(tài)圖 像專家組(Moving Pictures Experts Group,MPEG)于2011年啟動(dòng)了 3D音頻技術(shù)標(biāo)準(zhǔn)的 制訂和提案征集工作,在保證編碼效率的情況下期望可以通過較少數(shù)目的揚(yáng)聲器重建聲音 的三維空間信息,使3D音頻技術(shù)能夠應(yīng)用到普通家庭。2012年,我國(guó)的國(guó)家自然科學(xué)基金 委員會(huì)專門發(fā)布了"三維音頻基礎(chǔ)理論和關(guān)鍵技術(shù)研究"重點(diǎn)研究項(xiàng)目指南,重點(diǎn)支持3D 音頻技術(shù)的研究。
[0004] 但是目前現(xiàn)有的三維多聲道音頻系統(tǒng)所需揚(yáng)聲器數(shù)目較多,往往達(dá)到數(shù)十甚至上 千個(gè),難以應(yīng)用于家庭環(huán)境。針對(duì)當(dāng)前3D多聲道系統(tǒng)揚(yáng)聲器數(shù)目過多的問題,2012年,MPEG 發(fā)布了新的3D音頻需求(N12610),正式啟動(dòng)了 3D音頻技術(shù)提案的征集工作,要求在NHK 22. 2系統(tǒng)基礎(chǔ)上通過揚(yáng)聲器精簡(jiǎn)支持面向家庭電視直播等應(yīng)用。其中,揚(yáng)聲器精簡(jiǎn)技術(shù)是 通過將原始揚(yáng)聲器數(shù)目較多的多聲道系統(tǒng)中的聲道信號(hào)重新分配到較少數(shù)目的揚(yáng)聲器上, 并同時(shí)保持原有的聽音效果不變,精簡(jiǎn)過程通常包括揚(yáng)聲器排布和聲音信號(hào)分配兩部分。 為能將三維音頻系統(tǒng)更方便地適應(yīng)于家庭應(yīng)用環(huán)境,需要設(shè)計(jì)一種方法既能精簡(jiǎn)原多聲道 系統(tǒng)揚(yáng)聲器組,又能保證重建聲場(chǎng)與原聲場(chǎng)誤差最小。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明針對(duì)現(xiàn)有技術(shù)的不足,提供一種基于雙耳聲壓低失真的三維多聲道音頻系 統(tǒng)揚(yáng)聲器精簡(jiǎn)技術(shù)方案,用于將原始三維多聲道音頻系統(tǒng)中L個(gè)揚(yáng)聲器精簡(jiǎn)為M個(gè)揚(yáng)聲器, 以獲得精簡(jiǎn)后的M聲道系統(tǒng)中揚(yáng)聲器組最優(yōu)空間位置信息。
[0006] 本發(fā)明提供一種三維音頻精簡(jiǎn)方法,包括以下步驟:
[0007] 步驟1,設(shè)原始三維多聲道音頻系統(tǒng)有L個(gè)揚(yáng)聲器,分別采集原始三維多聲道音頻 系統(tǒng)中L個(gè)揚(yáng)聲器的空間位置信息,初始化待精簡(jiǎn)揚(yáng)聲器集合為包括原始三維多聲道音頻 系統(tǒng)中L個(gè)揚(yáng)聲器;空間位置信息采集實(shí)現(xiàn)方式如下,
[0008] 設(shè)L個(gè)揚(yáng)聲器排布在與聽音區(qū)域中心點(diǎn)〇之間距離為P的球面上,以聽音區(qū)域中 心點(diǎn)〇為頂點(diǎn)構(gòu)造三維空間直角坐標(biāo)系XYZ,揚(yáng)聲器在平面XOY上的投影與X軸所成的角度 記為θ,揚(yáng)聲器與Z軸的夾角記為則揚(yáng)聲器的空間位置(爐)簡(jiǎn)化標(biāo)記為(久爐);
[0009] 步驟2,采集人頭特征的空間位置信息,實(shí)現(xiàn)方式如下,
[0010] 設(shè)人頭被看作是半徑為R的標(biāo)準(zhǔn)球,人頭中心位于坐標(biāo)原點(diǎn)處,人的兩耳關(guān)于 YOZ平面對(duì)稱;則人的左耳所在的位置Left = (R,0, 0),人的右耳所在的位置為Right = (R,π,〇),人頭中心所在的位置為〇 = (〇, 〇, 〇);
[0011] 步驟3,將L個(gè)揚(yáng)聲器I1,…,L的輸入時(shí)域信號(hào)\(0,·.·,?)經(jīng)傅里葉變換得到 對(duì)應(yīng)的頻域信號(hào)((;
[0012] 步驟4,計(jì)算原始三維多聲道音頻系統(tǒng)的L個(gè)揚(yáng)聲器I1,…,L所播放的聲音信號(hào) 在左耳處產(chǎn)生的聲壓和P (Left)、在右耳處產(chǎn)生的聲壓和P (Right),以及在人頭中心〇處的 聲壓和P(O);
[0013] 步驟5,從當(dāng)前的待精簡(jiǎn)揚(yáng)聲器集合中,尋找一個(gè)使原始聲場(chǎng)失真最小的揚(yáng)聲器將 其精簡(jiǎn)剔除,包括以下子步驟,
[0014] 步驟5. 1,從當(dāng)前的待精簡(jiǎn)揚(yáng)聲器集合的L個(gè)揚(yáng)聲器中選取一個(gè)揚(yáng)聲器,將其預(yù)刪 除,得到剩余的(L-I)通道系統(tǒng),剩余的(L-I)個(gè)揚(yáng)聲器用乙…,表示;
[0015] 步驟5. 2,計(jì)算預(yù)刪除揚(yáng)聲器1;后,剩余(L-I)個(gè)揚(yáng)聲器所發(fā)出的聲音在左、右耳 處的聲壓 P7(Left)與['.(Right);
[0016] 步驟5. 3,計(jì)算預(yù)刪除揚(yáng)聲器1;后,剩余(L-I)個(gè)揚(yáng)聲器1_..工_:1所發(fā)出的聲音在 雙耳處的聲壓與原L個(gè)揚(yáng)聲器所發(fā)出聲音在雙耳處聲壓的失真值ε p并將失真值保存到失 真數(shù)組ERROR中,
[0017] 步驟5. 4,預(yù)刪除揚(yáng)聲器的選擇條件判斷,實(shí)現(xiàn)如下,
[0018] 將預(yù)刪除的揚(yáng)聲器編號(hào)J的值加1,即J = J+1 ;判斷J>L是否成立,若判斷條件不 成立,則返回步驟5. 1 ;若判斷條件成立,則結(jié)束循環(huán)操作,執(zhí)行步驟5. 5 ;
[0019] 步驟5. 5,精簡(jiǎn)剔除聲場(chǎng)失真最小的揚(yáng)聲器,實(shí)現(xiàn)如下,
[0020] 從失真數(shù)組ERROR中找到最小的雙耳處聲壓失真值ε_(tái)= ε ,,其中£]表示刪除 揚(yáng)聲器Ij后雙耳聲壓失真值,將揚(yáng)聲器I j真正執(zhí)行剔除操作;剩余(L-I)個(gè)揚(yáng)聲器f,..., 頻域信號(hào)分別記為%;
[0021] 步驟5. 6,精簡(jiǎn)剔除揚(yáng)聲器1,后,將剩余(L-I)個(gè)揚(yáng)聲器?,…,^1的頻域信號(hào) &(?),...,Jo)值賦給'(?,...,5^0),保留剩余(L-I)個(gè)揚(yáng)聲器I...,1 :1的空間位 置信息和頻域信號(hào)A (?)、· . (?) ;然后將L個(gè)揚(yáng)聲器數(shù)目減1,得到新的L個(gè)待精簡(jiǎn)的揚(yáng) 聲器所構(gòu)成的待精簡(jiǎn)揚(yáng)聲器集合I1,…,Iy進(jìn)入步驟6 ;
[0022] 步驟6,進(jìn)行精簡(jiǎn)迭代條件判斷如下,
[0023] 判斷當(dāng)前待精簡(jiǎn)揚(yáng)聲器數(shù)L是否大于M,若是則返回步驟5,對(duì)新的當(dāng)前待精簡(jiǎn)揚(yáng) 聲器集合繼續(xù)進(jìn)行精簡(jiǎn),否則結(jié)束迭代,取出當(dāng)前剩余的揚(yáng)聲器空間位置信息,得到M通道 系統(tǒng)的揚(yáng)聲器最優(yōu)空間位置排布;
[0024] 步驟7,將M通道系統(tǒng)的對(duì)應(yīng)揚(yáng)聲器上的頻域信號(hào)經(jīng)過傅立葉逆變換轉(zhuǎn)換為時(shí)域 信號(hào)。
[0025] 而且,步驟4實(shí)現(xiàn)方式如下,
[0026] 設(shè)第J個(gè)揚(yáng)聲器1:播放的聲音頻率為f,則聲音傳播的波數(shù)為 c為聲 速;揚(yáng)聲器播放的聲音在任意聽音點(diǎn)X處產(chǎn)生的聲壓為1力·
.,_其 中II1-XI為揚(yáng)聲器1;到聽音點(diǎn)X的距離,Sv(i9)為揚(yáng)聲器的頻域信號(hào),G為比例因子;
[0027] 將聲音信號(hào)劃分為α個(gè)頻帶,設(shè)α個(gè)頻帶的中心頻率為A、…、fa,對(duì)應(yīng)的波數(shù) 分別為
[0028] 揚(yáng)聲器I1,…,L所播放的聲音信號(hào)在左耳、右耳和人頭中心處產(chǎn)生的聲壓的和 P (Left)、P (Right)與 P (〇)分別為
[0029]
[0030]
[0031]
[0032] 其中,Ic1表示第I個(gè)臨界頻帶的中心頻率對(duì)應(yīng)的波數(shù),I = 1、…、a。
[0033] 而且,步驟5. 1包括以下子步驟,
[0034] 步驟5. 1. 1,根據(jù)揚(yáng)聲器I…,^1和相應(yīng)空間位置,計(jì)算當(dāng)揚(yáng)聲器I1預(yù)刪除后, 剩余(L-I)個(gè)揚(yáng)聲器1·.·,上所分配到的權(quán)值矩陣a ;= [a ;⑴... a;ai)]T如下,
[0035] 首先,已知(L-I)個(gè)揚(yáng)聲器[,…,石^所擺放的空間位置砍見)、…、以 及揚(yáng)聲器1 ;所擺放的空間位置術(shù)),根據(jù)以下公式計(jì)算參數(shù)Γ和b, CN 105120406 A 說明書 4/14 頁
[0036]
[0037] 其中,
[0038] 中間參數(shù) ifV|表示不超過該數(shù)的最大的整數(shù);
[0039] IT(X)為連帶勒讓德多項(xiàng)式如下,
[0040]
[0041] 變量 n、m 滿足 η = 1,· · ·,N,-n < m < η ;
[0042] 然后,當(dāng)預(yù)刪除揚(yáng)聲器1;后,剩余(L-I)個(gè)揚(yáng)聲器I...,ζ 所分配到的權(quán)值矩陣 a】= [a】⑴…a】(L1)]T根據(jù)公式a】=Γ 1I3計(jì)算得到;
[0043] 步驟5. 1. 2,當(dāng)揚(yáng)聲器被預(yù)刪除后,剩余(L-I)個(gè)揚(yáng)聲器?,...,IL1的頻域信號(hào)按 照以下公式計(jì)算得到
[0044]