[00411圖12示出3D音頻編碼器的第二實(shí)施例;
[0042]圖13示出3D音頻解碼器的第二實(shí)施例;
[0043]圖14示出3D音頻編碼器的第三實(shí)施例;以及 [0044]圖15示出3D音頻解碼器的第三實(shí)施例。
【具體實(shí)施方式】
[0045]圖2示出根據(jù)實(shí)施例的用于生成編碼的音頻信息的裝置250,該編碼的音頻信息包 括一個(gè)或多個(gè)編碼的音頻信號(hào)以及一個(gè)或多個(gè)經(jīng)處理的元數(shù)據(jù)信號(hào)。
[0046]裝置250包括用于接收一個(gè)或多個(gè)原始元數(shù)據(jù)信號(hào)并用于確定一個(gè)或多個(gè)經(jīng)處理 的元數(shù)據(jù)信號(hào)的元數(shù)據(jù)編碼器210,,其中一個(gè)或多個(gè)原始元數(shù)據(jù)信號(hào)中的每個(gè)包括多個(gè)原 始元數(shù)據(jù)樣本,其中一個(gè)或多個(gè)原始元數(shù)據(jù)信號(hào)中的每個(gè)的原始元數(shù)據(jù)樣本指示與一個(gè)或 多個(gè)音頻對(duì)象信號(hào)中的音頻對(duì)象信號(hào)相關(guān)聯(lián)的信息。
[0047]此外,裝置250包括用于對(duì)一個(gè)或多個(gè)音頻對(duì)象信號(hào)進(jìn)行編碼以獲得一個(gè)或多個(gè) 編碼的音頻信號(hào)的音頻編碼器220。
[0048]元數(shù)據(jù)編碼器210用于確定一個(gè)或多個(gè)經(jīng)處理的元數(shù)據(jù)信號(hào)(Z1,…,ZN)中的每個(gè) 經(jīng)處理的元數(shù)據(jù)信號(hào)(Zi)的多個(gè)經(jīng)處理的元數(shù)據(jù)樣本(Zi(l),,zi(n))中的每個(gè) 經(jīng)處理的元數(shù)據(jù)樣本(zdn)),以使得當(dāng)控制信號(hào)(b)指示第一狀態(tài)(b(n)=0)時(shí),所述重建 的元數(shù)據(jù)樣本(zdn))指示一個(gè)或多個(gè)原始元數(shù)據(jù)信號(hào)中的一個(gè)( Xl)的多個(gè)原始元數(shù)據(jù)樣 本中的一個(gè)(Xl(n))與所述經(jīng)處理的元數(shù)據(jù)信號(hào)(Zl)的另一個(gè)已生成的經(jīng)處理的元數(shù)據(jù)樣 本之間的差值或量化差值;并使得當(dāng)控制信號(hào)指示不同于第一狀態(tài)的第二狀態(tài)(b(n) = l) 時(shí),所述經(jīng)處理的元數(shù)據(jù)樣本(zKn))為一個(gè)或多個(gè)經(jīng)處理的元數(shù)據(jù)信號(hào)中的所述一個(gè)(Xl) 的原始元數(shù)據(jù)樣本(xi( 1 ),···,χ?(η))中的所述一個(gè)(xi(n))或?yàn)樵荚獢?shù)據(jù)樣本(xi (1),…,xi(n))中的所述一個(gè)(xi(n))的量化表示(qi(n))。
[0049] 圖1示出根據(jù)實(shí)施例的用于生成一個(gè)或多個(gè)音頻聲道的裝置100。
[0050] 裝置100包括用于根據(jù)控制信號(hào)(b)從一個(gè)或多個(gè)經(jīng)處理的元數(shù)據(jù)信號(hào)(Z1,…,ZN) 生成一個(gè)或多個(gè)重建的元數(shù)據(jù)信號(hào)( Χ1',···,ΧΝ')的元數(shù)據(jù)解碼器110,其中一個(gè)或多個(gè)重建 的元數(shù)據(jù)信號(hào)(Χ1',··_, ΧΝ')中的每個(gè)指示與一個(gè)或多個(gè)音頻對(duì)象信號(hào)的音頻對(duì)象信號(hào)相關(guān) 聯(lián)的信息,其中元數(shù)據(jù)解碼器110用于通過確定用于一個(gè)或多個(gè)重建的元數(shù)據(jù)信號(hào) (XI',…,χ Ν')中的每個(gè)的多個(gè)重建的元數(shù)據(jù)樣本(XI'(η),…,χν'(η))以生成一個(gè)或多個(gè)重 建的元數(shù)據(jù)信號(hào)( Χ1',···,ΧΝ')。
[0051] 此外,裝置100包括用于根據(jù)一個(gè)或多個(gè)音頻對(duì)象信號(hào)以及根據(jù)一個(gè)或多個(gè)重建 的元數(shù)據(jù)信號(hào)(^',…,幼'彡生成一個(gè)或多個(gè)音頻聲道的音頻聲道生成器口。。
[0052] 元數(shù)據(jù)解碼器110用于接收一個(gè)或多個(gè)經(jīng)處理的元數(shù)據(jù)信號(hào)(ζ?,…,ΖΝ)中的每個(gè) 的多個(gè)經(jīng)處理的元數(shù)據(jù)樣本( ζ1(η),···,ΖΝ(η))。此外,元數(shù)據(jù)解碼器 110用于接收控制信號(hào) (b) 〇
[0053] 此外,元數(shù)據(jù)解碼器110用于確定一個(gè)或多個(gè)重建的元數(shù)據(jù)信號(hào)(Χ1',···,ΧΝ')中的 每個(gè)重建的元數(shù)據(jù)信號(hào)( Xl')的多個(gè)重建的元數(shù)據(jù)樣本(^'(^,…^'(^^,^'("彡中的 每個(gè)重建的元數(shù)據(jù)樣本(Xl'(n)),以使得當(dāng)控制信號(hào)(b)指示第一狀態(tài)(b(n)=0)時(shí),所述 重建的元數(shù)據(jù)樣本( Xl'(η))為一個(gè)或多個(gè)經(jīng)處理的元數(shù)據(jù)信號(hào)中的一個(gè)(Zl)的經(jīng)處理的元 數(shù)據(jù)樣本中的一個(gè)( Zl(n))與所述重建的元數(shù)據(jù)信號(hào)(Xl')的另一個(gè)已生成的重建的元數(shù)據(jù) 樣本(Xl'(n-1))的和,并使得當(dāng)控制信號(hào)指示不同于第一狀態(tài)的第二狀態(tài)(b(n) = l)時(shí),所 述重建的元數(shù)據(jù)樣本(Xl'(η))為一個(gè)或多個(gè)經(jīng)處理的元數(shù)據(jù)信號(hào)(Z1,…, ZN)中的所述一個(gè) (zi)的經(jīng)處理的元數(shù)據(jù)樣本(zi(l)),···,zi(n))中的所述一個(gè)(zi(n))。
[0054] 當(dāng)提及元數(shù)據(jù)樣本時(shí),應(yīng)當(dāng)注意的是,元數(shù)據(jù)樣本的特征在于其元數(shù)據(jù)樣本值以 及與其相關(guān)的時(shí)間點(diǎn)。例如,此時(shí)間點(diǎn)可與音頻序列或其類似的起始相關(guān)。例如,索引η或k 可識(shí)別元數(shù)據(jù)信號(hào)中的元數(shù)據(jù)樣本的位置,并借此指示出(相關(guān)的)時(shí)間點(diǎn)(與起始時(shí)間相 關(guān))。應(yīng)當(dāng)注意的是,當(dāng)兩個(gè)元數(shù)據(jù)樣本與不同的時(shí)間點(diǎn)相關(guān)時(shí),即使它們的元數(shù)據(jù)樣本值 是相同的(有時(shí)可能會(huì)出現(xiàn)這樣的情況),該兩個(gè)元數(shù)據(jù)樣本也是不同的元數(shù)據(jù)樣本。
[0055] 上述實(shí)施例基于此發(fā)現(xiàn):與音頻對(duì)象信號(hào)相關(guān)聯(lián)的(由元數(shù)據(jù)信號(hào)包括的)元數(shù)據(jù) 信息常常緩慢地改變。
[0056] 例如,元數(shù)據(jù)信號(hào)可指示音頻對(duì)象的位置信息(例如,定義音頻對(duì)象的位置的方位 角、仰角或半徑)??梢约僭O(shè),在大部分時(shí)間,音頻對(duì)象的位置不會(huì)改變或僅緩慢地改變。
[0057] 或,元數(shù)據(jù)信號(hào)可以,例如指示音頻對(duì)象的音量(例如,增益),并且也可以假設(shè),在 大部分時(shí)間,音頻對(duì)象的音量緩慢地改變。
[0058] 基于此原因,無需在每個(gè)時(shí)間點(diǎn)傳輸(完整的)元數(shù)據(jù)信息。
[0059] 相反地,根據(jù)一些實(shí)施例,例如,可以僅在特定時(shí)間點(diǎn)傳輸(完整的)元數(shù)據(jù)信息, 例如周期性地,如在每第N個(gè)時(shí)間點(diǎn),如在時(shí)間點(diǎn)0、N、2N、3N等。
[0060] 例如,在實(shí)施例中,三個(gè)元數(shù)據(jù)信號(hào)指定音頻對(duì)象在3D空間中的位置。元數(shù)據(jù)信號(hào) 中的第一個(gè)可以,例如指定音頻對(duì)象的位置的方位角。元數(shù)據(jù)信號(hào)中的第二個(gè)可以,例如指 定音頻對(duì)象的位置的仰角。元數(shù)據(jù)信號(hào)中的第三個(gè)可以,例如指定關(guān)于音頻對(duì)象的距離的 半徑。
[0061 ]方位角、仰角以及半徑明確地定義出音頻對(duì)象在3D空間中離原點(diǎn)的位置,將參考 圖4示出此。
[0062]圖4示出通過方位角、仰角以及半徑表示的音頻對(duì)象在三維(3D)空間中離原點(diǎn)400 的位置410。
[0063] 仰角指定,例如從原點(diǎn)到對(duì)象位置的直線與此直線在xy平面(由X軸和y軸定義的 平面)上的正交投影之間的角度。方位角定義,例如X軸與所述正交投影之間的角度。通過指 定方位角和仰角,可定義出通過原點(diǎn)400和音頻對(duì)象的位置410的直線415。通過更進(jìn)一步地 指定半徑,可定義出音頻對(duì)象的精確位置410。
[0064] 在實(shí)施例中,方位角的范圍被定義為:-180°〈方位角< 180°,仰角的范圍被定義 為:-90°《仰角< 90°,半徑可以,例如被定義為以米[m](大于或等于0m)為單位。
[0065] 在另一實(shí)施例中,例如,可假設(shè),在xyz坐標(biāo)系中的音頻對(duì)象位置的所有X值都大于 或等于零,方位角的范圍可被定義為-90°《方位角<90°,仰角的范圍可被定義為:-90° < 仰角< 90°,以及半徑可以,例如被定義為以米[m]為單位。
[0066] 在另一實(shí)施例中,可調(diào)整元數(shù)據(jù)信號(hào)以使得方位角的范圍被定義為:-128°〈方位 角< 128°、仰角的范圍被定義為:-32°《仰角< 32°以及半徑可以,例如被定義在對(duì)數(shù)標(biāo)度 上。在一些實(shí)施例中,原始元數(shù)據(jù)信號(hào)、經(jīng)處理的元數(shù)據(jù)信號(hào)以及重建的元數(shù)據(jù)信號(hào)分別可 以包括一個(gè)或多個(gè)音頻對(duì)象信號(hào)中的一個(gè)的位置信息的縮放表示和/或音量的縮放表示。
[0067] 音頻聲道生成器120可以,例如用于根據(jù)一個(gè)或多個(gè)音頻對(duì)象信號(hào)以及根據(jù)重建 的元數(shù)據(jù)信號(hào)生成一個(gè)或多個(gè)音頻聲道,其中重建的元數(shù)據(jù)信號(hào)可以,例如指示音頻對(duì)象 的位置。
[0068] 圖5示出音頻聲道生成器假設(shè)的音頻對(duì)象和揚(yáng)聲器裝備的位置。示出xyz坐標(biāo)系的 原點(diǎn)500。此外,示出第一音頻對(duì)象的位置510和第二音頻對(duì)象的位置520。此外,圖5示出音 頻聲道生成器120為四個(gè)揚(yáng)聲器生成四個(gè)音頻聲道的方案。音頻聲道生成器120假設(shè)四個(gè)揚(yáng) 聲器511、512、513及514位于圖5所示的位置處。
[0069] 在圖5中,第一音頻對(duì)象位于接近于揚(yáng)聲器511和512的假定位置的位置510處,并 遠(yuǎn)離揚(yáng)聲器513和514。因此,音頻聲道生成器120可生成四個(gè)音頻聲道,以使得第一音頻對(duì) 象510由揚(yáng)聲器511和512而不由揚(yáng)聲器513和514再現(xiàn)。
[0070] 在其他實(shí)施例中,音頻聲道生成器120可生成四個(gè)音頻聲道,以使得第一音頻對(duì)象 510由揚(yáng)聲器511和512以高音量再現(xiàn),并由揚(yáng)聲器513和514以低音量再現(xiàn)。
[0071]此外,第二音頻對(duì)象位于接近于揚(yáng)聲器513和514的假定位置的位置520處,并遠(yuǎn)離 揚(yáng)聲器511和512。因此,音頻聲道生成器120可生成四個(gè)音頻聲道,以使得第二音頻對(duì)象520 由揚(yáng)聲器513和514而不由揚(yáng)聲器511和512再現(xiàn)。
[0072]在其他實(shí)施例中,音頻聲道生成器120可生成四個(gè)音頻聲道,以使得第二音頻對(duì)象 520由揚(yáng)聲器513和514以高音量再現(xiàn),并由揚(yáng)聲器511的512以低音量再現(xiàn)。
[0073]在可選實(shí)施例中,僅使用兩個(gè)元數(shù)據(jù)信號(hào)指定音頻對(duì)象的位置。例如,當(dāng)假設(shè)所有 音頻對(duì)象位于單個(gè)平面內(nèi)時(shí),例如可以僅指定方位角和半徑。
[0074]在其他實(shí)施例中,對(duì)于每個(gè)音頻對(duì)象,僅將單個(gè)元數(shù)據(jù)信號(hào)編碼并傳輸作為位置 信息。例如,僅將方位角指定為音頻對(duì)象的位置信息(例如可假設(shè),所有音頻對(duì)象位于具有 距中心點(diǎn)相同距離的相同平面,因此被假設(shè)為具有相同半徑)。方位角信息可以,例如足以 確定音頻對(duì)象位于接近于左揚(yáng)聲器并遠(yuǎn)離右揚(yáng)聲器的位置。在此情況下,音頻聲道生成器 120可以,例如生成一個(gè)或多個(gè)音頻聲道,以使得音頻對(duì)象由左揚(yáng)聲器而不由右揚(yáng)聲器再 現(xiàn)。
[0075] 例如,可以應(yīng)用基于矢量的幅度平移(Vector Base Amplitude Panning,VBAP)以 確定揚(yáng)聲器的音頻聲道中的每個(gè)內(nèi)的音頻對(duì)象信號(hào)的權(quán)重(例如,參見[11])。例如關(guān)于 VBAP,假設(shè)音頻對(duì)象與虛擬源相關(guān)。
[0076]在實(shí)施例中,另一元數(shù)據(jù)信號(hào)可指定每個(gè)音頻對(duì)象的音量,例如增益(例如,以分 貝[dB]表示)。
[0077] 例如,在圖5中,第一增益值可由用于位于位置510處的第一音頻對(duì)象的其他元數(shù) 據(jù)信號(hào)指定,第二增益值由用于位于位置520處的第二音頻對(duì)象的另一其他元數(shù)據(jù)信號(hào)指 定,其中第一增益值大于第二增益值。在此情況下,揚(yáng)聲器511和512可以再現(xiàn)第一音頻對(duì) 象,其再現(xiàn)第一音頻對(duì)象的音量高于揚(yáng)聲器513和514再現(xiàn)第二音頻對(duì)象的音量。
[0078] 實(shí)施例也假設(shè),音頻對(duì)象的此增益值常常緩慢地改變。因此,無需在每個(gè)時(shí)間點(diǎn)傳 輸此元數(shù)據(jù)信息。相反地,僅在特定時(shí)間點(diǎn)傳輸元數(shù)據(jù)信息。在中間的時(shí)間點(diǎn)處,例如,可以 使用被傳輸?shù)脑谙仍獢?shù)據(jù)樣本和隨后元數(shù)據(jù)樣本來近似元數(shù)據(jù)信息。例如,線性內(nèi)插法可 用于中間值的近似。例如,可以針對(duì)時(shí)間點(diǎn)近似音頻對(duì)象中的每個(gè)的增益、方位角、仰角和/ 或半徑,其中不傳輸此元數(shù)據(jù)。
[0079] 通過此方法,可以實(shí)現(xiàn)元數(shù)據(jù)的傳輸速率的可觀的節(jié)省。
[0080] 圖3示出根據(jù)實(shí)施例的系統(tǒng)。
[0081] 該系統(tǒng)包括如上所述的裝置250,其用于生成包括一個(gè)或多個(gè)編碼的音頻信號(hào)和 一個(gè)或多個(gè)經(jīng)處理的元數(shù)據(jù)信號(hào)的編碼的音頻信息。
[0082] 此外,該系統(tǒng)包括如上所述的裝置100,其用于接收一個(gè)或多個(gè)編碼的音頻信號(hào)和 一個(gè)或多個(gè)經(jīng)處理的元數(shù)據(jù)信號(hào),并用于根據(jù)一個(gè)或多個(gè)編碼的音頻信號(hào)以及根據(jù)一個(gè)或 多個(gè)經(jīng)處理的元數(shù)據(jù)信號(hào)生成一個(gè)或多個(gè)音頻聲道。
[0083] 例如,當(dāng)用于編碼的裝置250使用SA0C編碼器對(duì)一個(gè)或多個(gè)音頻對(duì)象進(jìn)行編碼時(shí), 通過應(yīng)用根據(jù)現(xiàn)有技術(shù)的SA0C解碼器,用于生成一個(gè)或多個(gè)音頻聲道的裝置100可對(duì)一個(gè) 或多個(gè)編碼的音頻信號(hào)進(jìn)行解碼,以獲得一個(gè)或多個(gè)音頻對(duì)象信號(hào)。
[0084] 實(shí)施例基于此發(fā)現(xiàn),可以擴(kuò)展差分脈沖碼調(diào)制的概念,然后此擴(kuò)展的概念適于對(duì) 用于音頻對(duì)象的元數(shù)據(jù)信號(hào)進(jìn)行編碼。
[0085] 差分脈沖碼調(diào)變(DPCM)方法針對(duì)緩慢變化的時(shí)間信號(hào)而建立,其借由差分傳輸 [10]通過量化和冗余減少不相關(guān)。圖6中示出DPCM編碼器。
[0086]在圖6的DPCM編碼器中,輸入信號(hào)X的實(shí)際輸入樣本x(n)被饋入相減單元610。在相 減單元的另一輸入處,另一個(gè)數(shù)值被饋入相減單元??梢约僭O(shè),此另一個(gè)數(shù)值為先前所接收 的樣本x(n-l),盡管量化錯(cuò)誤或其他錯(cuò)誤可能導(dǎo)致在另一輸入處的值不完全等于先前的樣 本x(n-l)。由于偏離x(n-l)的此可能偏差,減法器的另一輸入可被稱作x*(n-l)。相減單元 從x(n)減去x*(n_l)以獲得差值d(n)。
[0087]然后在量化器620中量化d(n)以獲得輸出信號(hào)y的另一輸出樣本y(n)。一般來說,y (η)等于d(n)或?yàn)榻咏赿(n)的值。
[0088] 此外,y(n)被饋入加法器630。此外,x*(n-l)被饋入加法器630。用于d(n)從減法d (]1) = 1(11)3*(11-1)中得到,且7(11)為等于或至少接近于(1(11)的值,加法器630的輸出林(11) 等或或至少接近于x(n)。
[0089] 在單元640內(nèi)x*(n)被保留一個(gè)采樣周期,然后繼續(xù)處理下一個(gè)樣本x(n+l)。
[0090] 圖7示出對(duì)應(yīng)的DPCM解碼器。
[0091] 在圖7中,來自DPCM編碼器的輸出信號(hào)y的樣本y(n)被饋入加法器71〇4(η)表示將 被重建的信號(hào)x(n)的差值。在加法器710的另一輸入處,先前所重建的樣本x'(n-l)被饋入 加法器710。從加法X'(n)=x'(n-l)+y(n)得到加法器的輸出X'(η)。由于X'(n-1)大體等于 或至少接近于x(n-l),且y(n)大體等于或接近于x(n)-x(n-l),加法器710的輸出X'(η)大體 等于或接近于x(n)。
[00