編碼設(shè)備和方法、解碼設(shè)備和方法、以及程序的制作方法
【技術(shù)領(lǐng)域】
[0001] 本技術(shù)涉及一種編碼設(shè)備和方法、解碼設(shè)備和方法、以及程序,且具體地涉及一種 可以較少的傳輸代碼數(shù)量得到高質(zhì)量音頻的編碼設(shè)備和方法、解碼設(shè)備和方法、以及程序。
【背景技術(shù)】
[0002] 在多聲道音頻的重放中,期望在重放側(cè)上的揚聲器布置和待重放的音頻信號的聲 源位置完全相同。然而事實上,在重放側(cè)上的揚聲器布置在大多數(shù)情況下與聲源位置不是 相同的。
[0003] 由于在重放側(cè)上的揚聲器布置和聲源位置之間的差異,有不存在于揚聲器的位置 上的聲源,且因此如何重放這種聲源吸引了極大的關(guān)注。
[0004] 為了得到對應(yīng)于在重放側(cè)上的揚聲器布置的音頻信號,通常,通過使用混合方程 來混合相應(yīng)聲源位置即相應(yīng)聲道的音頻信號,并產(chǎn)生對應(yīng)于重放側(cè)上的揚聲器的新聲道的 音頻信號。
[0005]在這種情況下,照慣例,從預(yù)先提供的多種模式選擇適當?shù)哪J阶鳛樵陬A(yù)先設(shè)置 的混合方程中的參數(shù),并計算乘以在混合方程中的相應(yīng)聲道的音頻信號的混合系數(shù)(即,見 非專利文獻1)。
[0006]例如,非專利文獻1公開了下面的方程(1)被計算為在無線電產(chǎn)業(yè)和企業(yè)協(xié)會 (ARIB)的標準ARIB STD-B32版本2.2[ 1 ]中的22.2聲道布置到5.1聲道布置的向下混合。
[0016] 在方程(1)中,通過使用混合系數(shù)來使在22.2聲道布置中的聲道例如FL、FR和FC的 音頻信號相加以計算在向下混合之后的聲道L、R、C、LS和LFE的音頻信號。在方程(1)中,兩 個值之一可被選擇為參數(shù)a,而四個值之一可被選擇為參數(shù)k。
[0017] 在方程(1)中乘以在向下混合之前的聲道得到在向下混合之后的相應(yīng)聲道的音頻 信號的系數(shù)是混合系數(shù)。例如,在方程(1)中,乘以FL聲道得到L聲道的混合系數(shù)是參數(shù)a的 值,而乘以FLc聲道得到L聲道的混合系數(shù)是a/(2 1/2)。注意,在下文中,聲道也將被簡單地稱 為 "ch,,。
[0018] 引用列表 [0019]非專利文獻
[0020]非專利文獻 1:VIDEO CODING,AUDIO CODING AND MULTIPLEXING SPECIFICATIONS FOR DIGITAL BROADCASTING[在線],2009年6月29日,無線電產(chǎn)業(yè)與企業(yè)協(xié)會,[于2013年9 月 30 日搜索到],互聯(lián)網(wǎng)〈http: //www · arib · or · jp/english/html/overview/doc/2-STD-B32v2_2.pdf〉
[0021] 發(fā)明概述
[0022] 技術(shù)問題
[0023] 然而,在通過使用方程(1)執(zhí)行向下混合的方法中,預(yù)先準備混合方程和在待選擇 的方程中的參數(shù),且因此可以只使用基于參數(shù)和混合方程而計算得到的混合系數(shù)。
[0024] 為了向觀看者提供高質(zhì)量音頻,混合系數(shù)需要根據(jù)聲源的內(nèi)容的各種場景自由地 改變。
[0025] 然而,為了傳輸完全自由的混合系數(shù),必須將所有混合系數(shù)從輸入聲源獨立地傳 輸?shù)捷敵鰮P聲器。
[0026] 因此,在輸入聲源的數(shù)量是Μ個聲道且輸出揚聲器的數(shù)量是N的情況下,混合系數(shù) 的數(shù)量是ΜΧΝ。在傳遞混合系數(shù)而每個混合系數(shù)為Q位的情況下,混合系數(shù)的集合的數(shù)據(jù)量 是Μ X Ν X Q位。例如,在輸入聲源是22ch,輸出揚聲器是5ch聲道,且5位對每個混合系數(shù)是必 須的情況下,總共550位是必須的。
[0027] 此外,在一些情況下,必須根據(jù)揚聲器布置的多種模式來多個集合的傳輸混合系 數(shù),因為傳輸側(cè)不知道在重放側(cè)上的實際揚聲器布置。例如,在輸出側(cè)上的揚聲器布置可以 是7ch、5ch或2ch的情況下,必須傳輸三個集合的混合系數(shù),即用于從22ch到5ch、從22ch到 7ch、以及從22ch到2ch的向下混合的混合系數(shù)。在傳遞上述混合系數(shù)本身的情況下,產(chǎn)生巨 大數(shù)量的信息。因此,如何傳遞自由混合系數(shù)很重要。
[0028] 如上所述,在上述技術(shù)中,很難以較少的代碼數(shù)量傳遞自由混合系數(shù)以得到在重 放側(cè)上的高質(zhì)量音頻。
[0029] 本技術(shù)鑒于上述情況而被構(gòu)造,并可以較少的代碼數(shù)量得到高質(zhì)量音頻。
[0030] 對問題的解決方案
[0031]根據(jù)本技術(shù)的第一方面的編碼設(shè)備包括:配置成產(chǎn)生顯示基于在多個輸入揚聲器 和多個輸出揚聲器之間的距離而確定的混合系數(shù)的布置順序的順序表的順序表產(chǎn)生單元, 混合系數(shù)是為多個相應(yīng)的輸出揚聲器準備的多個輸入揚聲器的混合系數(shù)并且用在用于將 對應(yīng)于多個輸入揚聲器的布置的多個聲道的音頻信號轉(zhuǎn)換成對應(yīng)于多個輸出揚聲器的布 置的多個聲道的音頻信號的混合處理中;配置成以在順序表中所示的順序重新布置多個混 合系數(shù)的重新布置單元;配置成計算在以該順序重新布置的混合系數(shù)當中的兩個連續(xù)混合 系數(shù)之間的差值的差值計算單元;以及配置成對針對每個混合系數(shù)計算的差值編碼的編碼 單元。
[0032]編碼單元還可包括:配置成產(chǎn)生顯示在混合系數(shù)之間的位置關(guān)系的對稱性的對稱 表的對稱表產(chǎn)生單元;以及配置成基于對稱表確定在混合系數(shù)和具有與該混合系數(shù)對稱的 位置關(guān)系的另一混合系數(shù)具有相同值的情況下該混合系數(shù)和另一混合系數(shù)是對稱的對稱 性確定單元。編碼單元可配置成不對被確定為與另一混合系數(shù)對稱的混合系數(shù)的差值編 碼。
[0033] 對稱性確定單元還可確定具有與另一混合系數(shù)對稱的位置關(guān)系的所有混合系數(shù) 中的每一個是否與具有對稱位置關(guān)系的對應(yīng)的另一混合系數(shù)是對稱的。編碼單元可基于所 有混合系數(shù)是否都與另一混合系數(shù)是對稱的確定的結(jié)果來對差值編碼。
[0034] 編碼單元可關(guān)于差值執(zhí)行熵編碼。
[0035] 在混合系數(shù)的輸入揚聲器和另一混合系數(shù)的輸入揚聲器定位成具有左右對稱性 且混合系數(shù)的輸出揚聲器和另一混合系數(shù)的輸出揚聲器定位成具有左右對稱性的情況下, 在該混合系數(shù)和另一混合系數(shù)之間的位置關(guān)系可以是對稱的。
[0036] 差值計算單元可計算在該混合系數(shù)和具有不是-~的值并且具有與該混合系數(shù)的 順序最接近的順序的混合系數(shù)之間的差值。
[0037] 順序表產(chǎn)生單元可通過以下操作來產(chǎn)生順序表:將混合系數(shù)分類成多個類別,使 得在輸入揚聲器的數(shù)量大于輸出揚聲器的數(shù)量的情況下相同輸出揚聲器的混合系數(shù)屬于 相同的類別,同時將混合系數(shù)分類成多個類別,使得在輸出揚聲器的數(shù)量大于輸入揚聲器 的數(shù)量的情況下相同輸入揚聲器的混合系數(shù)屬于相同的類別,并且確定在每個類別中的混 合系數(shù)的布置順序。差值計算單元可計算在屬于同一類別的混合系數(shù)之間的差值。
[0038] 根據(jù)本技術(shù)的第一方面的編碼方法或程序包括以下步驟:產(chǎn)生顯示基于在多個輸 入揚聲器和多個輸出揚聲器之間的距離而確定的混合系數(shù)的布置順序的順序表,混合系數(shù) 是為多個相應(yīng)的輸出揚聲器準備的多個輸入揚聲器的混合系數(shù)并且用在用于將對應(yīng)于多 個輸入揚聲器的布置的多個聲道的音頻信號轉(zhuǎn)換成對應(yīng)于多個輸出揚聲器的布置的多個 聲道的音頻信號的混合處理中;以在順序表中所示的順序重新布置多個混合系數(shù);計算在 以該順序重新布置的混合系數(shù)當中的兩個連續(xù)混合系數(shù)之間的差值;以及對針對每個混合 系數(shù)計算的差值編碼。
[0039]根據(jù)本技術(shù)的第一方面,產(chǎn)生顯不基于在多個輸入揚聲器和多個輸出揚聲器之間 的距離而確定的混合系數(shù)的布置順序的順序表,混合系數(shù)是為多個相應(yīng)的輸出揚聲器準備 的多個輸入揚聲器的混合系數(shù)并且用在用于將對應(yīng)于多個輸入揚聲器的布置的多個聲道 的音頻信號轉(zhuǎn)換成對應(yīng)于多個輸出揚聲器的布置的多個聲道的音頻信號的混合處理中;以 在順序表中所示的順序重新布置多個混合系數(shù);計算在以該順序重新布置的混合系數(shù)當中 的兩個連續(xù)混合系數(shù)之間的差值;以及對針對每個混合系數(shù)計算的差值編碼。
[0040] 根據(jù)本技術(shù)的第二方面的解碼單元可包括:配置成產(chǎn)生顯示基于在多個輸入揚聲 器和多個輸出揚聲器之間的距離而確定的混合系數(shù)的布置順序的順序表的順序表產(chǎn)生單 元,混合系數(shù)是為多個相應(yīng)的輸出揚聲器準備的多個輸入揚聲器的混合系數(shù)并且用在用于 將對應(yīng)于多個輸入揚聲器的布置的多個聲道的音頻信號轉(zhuǎn)換成對應(yīng)于多個輸出揚聲器的 布置的多個聲道的音頻信號的混合處理中;配置成獲取通過計算在以順序表中所示的順序 布置的兩個連續(xù)混合系數(shù)之間的差值并對針對每個混合系數(shù)計算的差值編碼而得到的代 碼串并對代碼串解碼的解碼單元;配置成基于順序表將通過該解碼得到的差值加到用于計 算差值的混合系數(shù)之一以計算用于計算差值的混合系數(shù)中的另一個的相加單元;以及配置 成基于順序表重新布置混合系數(shù)并輸出混合系數(shù)的重新布置單元。
[0041] 在該混合系數(shù)和具有與該混合系數(shù)對稱的位置關(guān)系的另一混合系數(shù)具有相同值 的情況下,該混合系數(shù)和另一混合系數(shù)可以是對稱的,并且不對混合系數(shù)的差值編碼。解碼 設(shè)備還可包括配置成產(chǎn)生顯示在混合系數(shù)之間的位置關(guān)系的對稱表的對稱表產(chǎn)生單元。在 該混合系數(shù)和另一混合系數(shù)是對稱的情況下,相加單元可基于對稱表復(fù)制另一混合系數(shù)并 可將另一混合系數(shù)設(shè)置為該混合系數(shù)。
[0042] 可基于具有與另一混合系數(shù)對稱的位置關(guān)系的所有混合系數(shù)中的每一個是否與 具有對稱位置關(guān)系的對應(yīng)的另一混合系數(shù)是對稱的確定的結(jié)果來對差值編碼。解碼單元可 基于指示所有混合系數(shù)是否都與另一混合系數(shù)是對稱的確定的結(jié)果的信息來對差值編碼, 該信息包含在代碼串中。
[0043] 在混合系數(shù)的輸入揚聲器和另一混合系數(shù)的輸入揚聲器定位成具有左右對稱性 且混合系數(shù)的輸出揚聲器和另一混合系數(shù)的輸出揚聲器定位成具有左右對稱性的情況下, 在該混合系數(shù)和另一混合系數(shù)之間的位置關(guān)系可以是對稱的。
[0044] 根據(jù)本技術(shù)的第二方面的解碼方法或程序可包括以下步驟:產(chǎn)生顯示基于在多個 輸入揚聲器和多個輸出揚聲器之間的距離而確定的混合系數(shù)的布置順序的順序表,混合系 數(shù)是為多個相應(yīng)的輸出揚聲器準備的多個輸入揚聲器的混合系數(shù)并且用在用于將對應(yīng)于 多個輸入揚聲器的布置的多個聲道的音頻信號轉(zhuǎn)換成對應(yīng)于多個輸出揚聲器的布置的多 個聲道的音頻信號的混合處理中;獲取通過計算在以順序表中所示的順序布置的兩個連續(xù) 混合系數(shù)之間的差值并對針對每個混合系數(shù)計算的差值編碼而得到的代碼串并對代碼串 解碼;基于順序表將通過該解碼得到的差值加到用于計算差值的混合系數(shù)之一以計算用于 計算差值的混合系數(shù)中的另一個;以及基于順序表重新布置混合系數(shù)并輸出混合系數(shù)。 [0045]根據(jù)第二方面,產(chǎn)生顯示基于在多個輸入揚聲器和多個輸出揚聲器之間的距離而 確定的混合系數(shù)的布置順序的順序表,混合系數(shù)是為多個相應(yīng)的輸出揚聲器準備的多個輸 入揚聲器的混合系數(shù)并且用在用于將對應(yīng)于多個輸入揚聲器的布置的多個聲道的音頻信 號轉(zhuǎn)換成對應(yīng)于多個輸出揚聲器的布置的多個聲道的音頻信號的混合處理中;獲取通過計 算在以順序表中所示的順序布置的兩個連續(xù)混合系數(shù)之間的差值并對針對每個混合系數(shù) 計算的差值編碼而得到的代碼串并對代碼串解碼;基于順序表將通過該解碼得到的差值加 到用于計算差值的混合系數(shù)之一以計算用于計算差值的混合系數(shù)中的另一個;以及基于順 序表重新布置混合系數(shù)并輸出混合系數(shù)。
[0046]發(fā)明的有益效果
[0047] 根據(jù)本技術(shù)的第一方面和第二方面,可以較少的代碼數(shù)量得到高質(zhì)量音頻。
[0048] 注意,有利效果并不限于本文所述的有利效果,且可以是在本公開中所述的任何 有利效果。
[0049] 附圖的簡要說明
[0050] 圖1示出了揚聲器布置的示例。
[0051] 圖2示出了揚聲器布置的示例。
[0052]圖3示出了混合系數(shù)的示例。
[0053]圖4是用于解釋在聲源位置和揚聲器位置之間的距離的圖。
[0054]圖5示出了傳遞順序表的示例。
[0055] 圖6示出了對稱表的示例。
[0056] 圖7是用于解釋差值的計算的示例。
[0057] 圖8示出了繩字的示例。
[0058]圖9示出了報頭的語法。
[0059] 圖10示出了系數(shù)代碼串的語法。
[0060] 圖11示出了編碼設(shè)備的配置示例。
[0061] 圖12示出了系數(shù)編碼單元的配置示例。
[0062] 圖13是示出了編碼過程的流程圖。
[0063] 圖14是示出了系數(shù)編碼過程的流程圖。
[0064] 圖15是示出了系數(shù)編碼過程的流程圖。
[0065]圖16示出了解碼設(shè)備的配置示例。
[0066]圖17示出了系數(shù)解碼單元的配置示例。
[0067] 圖18是示出了解碼過程的流程圖。
[0068]圖19是示出了系數(shù)解碼過程的流程圖。
[0069]圖20是示出了系數(shù)解碼過程的流程圖。
[0070]圖21是計算機的配置示例。
[0071]實施例的描述
[0072]在下文中,將參考附圖描述應(yīng)用本技術(shù)的實施例。
[0073]〈實施例1>
[0074]〈本技術(shù)的概述〉
[0075]將描述本技術(shù)的概述。
[0076]本技術(shù)涉及能夠以少量位傳輸任意混合系數(shù)的編碼和解碼技術(shù)。
[0077]注意,在下文中,音頻信號的聲源位置和揚聲器的布置位置由水平角θ(-180° < +18〇°)和垂直角 γ (_9〇° < γ < +9〇°)表示。
[0078] 例如,揚聲器布置成在重放側(cè)上圍繞用戶,且直接在用戶前方的位置是在水平角Θ =0和垂直角γ =0處的位置。水平角θ指示從用戶角度看的橫向角,而垂直角γ指示從用戶 角度看的縱向角。具體地,例如從用戶角度看的左方向是水平角θ的正方向,且從用戶角度 看的向上方向是垂直角γ的正方向。
[0079] 在下文中,將通過使用示例視情況提供描述,在該示例中,在通過使用22ch揚聲器 布置的5ch揚聲器布置中和通過從由22.2多聲道聲音系統(tǒng)[2]所定義的22.2ch移除LFE并從 由國際標準ITU-R BS.775-1[3]所定義的5.1ch移除LFE而得到的5ch揚聲器布置中重放被 假設(shè)在22ch揚聲器布置中重放的聲源。注意,在[2]Kimio Hamasaki的"Tendency of standardization of 22.2multichannel sound system"(NHK Science&Technology Research Laboratories,R&D,No.126,2011.3.< http://www.nhk.or.jp/strl/publica/ 1(1八(1126/^^/1304-13 4(^>)中詳細公開了22.2多聲道聲音系統(tǒng)[2]。在[3]11'1]-1?85.775-1"Multichannel Stereophonic Sound System with and without accompanying Picture"(Rec·, International Telecommunications Union,Geneva,Switzerland(1992-1994))中詳細公開了國際標準ITU-R BS. 775-1 [3]。
[0080] 在本文中,作為基于22.2多聲道聲音系統(tǒng)[2]和國際標準ITU-R BS.775-1[3]的揚 聲器布設(shè)置置(聲源位置)的示例,22ch的相應(yīng)聲道的揚聲器布設(shè)置置(聲源位置)是圖1所 示的位置,且5ch的相應(yīng)聲道的揚聲器布設(shè)置置是圖2所示的位置。
[0081] 注意,在圖1和圖2中,源(m)指示識別相應(yīng)聲道的編號,且標簽指示相應(yīng)聲道的名 稱。此外,在圖1和圖2中,方位角指示相應(yīng)聲道的揚聲器位置(聲源位置)的水平角Θ,且高度 指示相應(yīng)聲道的揚聲器位置(聲源位置)的垂直角γ。
[0082] 圖 1 示出 了聲道FC、FLc、FRc、FL、FR、SiL、SiR、BL、BR、BC、TpFC、TpFL、TpFR、TpSiL、 TpSiR、TpBL、TpBR、TpBC、TpC、BtFC、BtFL和BtFR的揚聲器布設(shè)置置。圖2示出 了聲道L、R、C、 LS和RS的揚聲器布設(shè)置置。
[0083] 例如,由圖1中的源(m) = 1規(guī)定的FC聲道的揚聲器的布設(shè)置置是在水平角Θ = 〇和 垂直角γ =0處的位置。這意味著直接布置在用戶前方的揚聲器是重放FC聲道的音頻信號 的揚聲器。
[0084] 在下文中,將特別描述通過使用本技術(shù)對混合系數(shù)的編碼。
[0085] 主要在混合系數(shù)的編碼過程中執(zhí)行下面的過程STP1到過程STP6。注意,過程STP1 和過程STP2作為所謂的預(yù)備工作被執(zhí)行。
[0086](過程STP1):基于在聲源和重放側(cè)上的揚聲器之間的距離來產(chǎn)生傳遞順序表。 [0087](過程STP2):產(chǎn)生顯示在聲源和重放側(cè)上的揚聲器對之間的對稱性的對稱表。 [0088](過程STP3):基于傳遞順序表改變混合系數(shù)的傳遞順序,并接著計算在混合系數(shù) 之間的差值。
[0089](過程STP4):確定在混合系數(shù)之間的對稱性。
[0090](過程STP5):執(zhí)行基于在混合系數(shù)之間的對稱性的編碼。
[0091 ](過程STP6):對在混合系數(shù)之間的差值編碼。
[0092]在本文中,將描述混合系數(shù)。
[0093] 例如,假設(shè)執(zhí)行用于將對應(yīng)于Μ個揚聲器的布置的Μ個聲道的音頻信號,即,重放Μ 個聲源位置的Μ個聲道的音頻信號,轉(zhuǎn)換成由Ν個揚聲器重放的Ν個聲道的音頻信號的混合 處理。在這種情況下,為Ν個揚聲器中的每一個預(yù)先準備相應(yīng)的Μ個揚聲器(聲源位置)的混 合系數(shù)。
[0094] 在本文中,關(guān)于預(yù)先準備的ΜΧΝ個混合系數(shù),用于得到第η個揚聲器的音頻信號的 第m個聲源位置的混合系數(shù)被定義為MixGain(m,n)。假設(shè)混合系數(shù)MixGain(m,n)是在例如 量化分辨率是ldB且混合系數(shù)落在3dB到-27dB和-%dB的范圍內(nèi)的情況下通過分辨率集合 預(yù)先量化的離散值,每個混合系數(shù)可以用Q