專利名稱:多信道編碼器的制作方法
技術領域:
本發(fā)明涉及多信道編碼器,例如利用空間音頻的參數描述的多信道音頻編碼器。而且,本發(fā)明還涉及在這樣的多信道編碼器中處理信號、例如空間音頻信號的方法。此外,本發(fā)明涉及解碼器,所述解碼器可操作地解碼由這樣的多信道編碼器生成的信號。
背景技術:
近年來,音頻記錄以及重現已經從非立體聲單信道格式發(fā)展到雙信道立體聲格式以及最近發(fā)展到多信道格式,例如在家庭影院系統(tǒng)中經常使用的五信道音頻格式。超音頻光盤(SACD)和數字化視頻光盤(DVD)數據載體的引入已經帶來了目前對于這樣的五信道音頻重現不斷增加的興趣。許多用戶目前在他們的家中擁有能夠提供五信道音頻重放的設備;相應地,在適當數據載體上的五信道音頻節(jié)目內容正在變得愈加可用,例如上面所述的SACD和DVD類型的數據載體。由于對于多信道節(jié)目內容不斷增長的興趣,多信道音頻節(jié)目內容的更高效編碼正在成為一個重要課題,例如提供增強的質量、更長的播放時間或甚至更多的信道中的一個或多個。
能夠通過參數描述符表示空間音頻信息(例如用于音頻節(jié)目內容)的編碼器是已知的。例如,在公開的國際PCT專利申請no.PCT/IB2003/002858(WO2004/008805)中,描述了包括至少第一信號分量(LF)、第二信號分量(LR)和第三信號分量(RF)的多信道音頻信號的編碼。這種編碼利用的方法包括以下步驟(a)通過使用第一參數編碼器編碼所述第一和第二信號分量,用于生成第一編碼信號(L)和第一組編碼參數(P2);(b)通過使用第二參數編碼器,編碼所述第一編碼信號(L)和另一個信號(R),用于生成第二編碼信號(T)和第二組編碼參數(P1),其中該另一個信號(R)由至少所述第三信號分量(RF)獲得;以及(c)至少通過從至少所述第二編碼信號(T)、所述第一組編碼參數(P2)和所述第二組編碼參數(P1)得到的結果編碼信號(T)來表示所述多信道音頻信號。
近年來,音頻信號的參數描述已經引起了興趣,因為已經顯示出傳輸描述音頻信號的量化參數需要相對少的傳輸容量。這些量化的參數能夠在解碼器中被接收和處理以重新生成感覺上不是與其對應的原始音頻信號明顯不同的音頻信號。
當前的多信道編碼器生成輸出編碼數據,其比特率基本上隨著在輸出編碼數據中傳送的音頻信道的數量線性地成比例變化。這樣的特征致使包括另外的信道出現問題,因為用于給定數據載體存儲容量的播放時間間隔或音頻表現質量將必須相應地被犧牲以適應更多的信道。
發(fā)明內容
本發(fā)明的一個目的是提供一種多信道編碼器,其可操作地提供多信道數據內容(例如多信道音頻數據內容)的更高效編碼。
發(fā)明人已經意識到,通過使用適當的編碼方法,輸出的編碼數據能夠傳送對應例如五信道音頻節(jié)目內容的信息,同時使用為傳送二信道音頻節(jié)目內容(即立體聲)通常所需的比特率。
因此,根據本發(fā)明的第一方面,提供了一種多信道編碼器,其被用來處理在N個輸入信道中所傳送的輸入信號,以生成在M個輸出信道中所傳送的相應輸出信號以及參數數據,使得M和N為整數并且N大于M,該編碼器包括(a)下混頻器,用于下混頻輸入信號以生成相應的輸出信號;以及(b)分析器,用于在下混頻期間或者作為單獨的過程處理該輸入信號,所述分析器可操作地生成補充所述輸出信號的所述參數數據,所述參數數據描述了輸入信號的N個信道之間的相互差,以便基本上允許在解碼期間從M個信道的輸出信號中重新生成所述N個信道的輸入信號中的一個或多個,所述輸出信號為兼容于在解碼器中進行重現的格式,所述解碼器提供了N個或少于N個的輸出信道以能夠向后兼容。
本發(fā)明的優(yōu)點在于該多信道編碼器能夠將多信道輸入信號更高效地編碼成輸出流,該輸出流例如可以致使與二信道立體聲重放設備相兼容。
該編碼器與較早類型的相應解碼器的這種向后兼容性以三種方式來提供(a)從編碼器輸出的下混頻信號以這樣的方式來生成,即這些信號的重放(即無需額外的處理或解碼)導致一個空間圖像,其是例如5信道空間圖像的良好近似,假定限制為相應有限數量的揚聲器。這一屬性保證了向后重放的兼容性。
(b)與下混頻信號有關的空間參數被放置在該比特流的輔助數據部分。不能解碼該輔助數據部分的解碼器將仍舊能夠解碼所傳輸的信號。這一屬性保證了向后解碼的兼容性;以及(c)存儲在比特流的輔助部分和該解碼器結構中的參數以這樣的方式來配制,即參數解碼器能夠重新生成適當的2、3和4信道信號。這一屬性在采用的重放系統(tǒng)方面提供了靈活性,并且因此提供了與2、3和4信道系統(tǒng)的向后兼容性。
優(yōu)選地,在編碼器中,分析器包括處理裝置,用于經由從時域到頻域的變換來轉換該輸入信號,并且用于處理這些被變換的輸入信號以生成參數數據。在頻域內輸入信號的處理在該編碼器內提供高效的編碼方面是有益的。更優(yōu)選地,在編碼器中,下混頻器和分析器中的至少一個被用來將輸入信號作為時間-頻率片(tile)的序列進行處理以生成該輸出信號。
優(yōu)選地,在編碼器中,該片通過相互重疊分析窗的變換來獲得。當輸出信號隨后被解碼以重新生成該輸入信號的一個表示時,這樣的重疊允許更好的連續(xù)性并且由此減少了編碼假象。
優(yōu)選地,該編碼器包括編碼裝置,用于處理該輸入信號以生成M個中間音頻數據信道用于包括在該M個輸出信號中,該分析器被用來輸出與至少下列之一有關的參數數據中的信息(a)信道間輸入信號功率比或對數水平(level)差;(b)輸入信號之間的信道間相關;(c)一個或多個信道的輸入信號和該一個或多個信道的輸入信號的功率和之間的功率比;以及(d)信號對之間的相位差或時間差。
更優(yōu)選地,在(d)中的相位差為平均相位差。
優(yōu)選地,在編碼器中,對相位差、相關數據和功率比中的至少一個進行計算之后是主要分量分析(PCA)和/或信道間相位校準以生成該輸出信號。
優(yōu)選地,為了在重新生成輸入數據時提供與該原始輸入信號更近的相似性,在所述編碼器中在該N個信道中所傳送的該輸入信號的至少一個對應效果信道。
優(yōu)選地,該編碼器適應于以適合于使用常規(guī)的重放系統(tǒng)進行重放的格式生成輸出信號。
根據本發(fā)明的第二方面,提供了一種在多信道編碼器中編碼在N個輸入信道中所傳送的輸入信號以生成在M個輸出信道中所傳送的相應輸出信號以及參數數據,使得M和N為整數并且N大于M的方法,該方法包括步驟(a)下混頻該輸入信號以生成相應的輸出信號;以及(b)當被下混頻時在分析器中處理該輸入信號或者進行單獨地處理該輸入信號,所述處理提供補充該輸出信號的所述參數數據,所述參數數據描述了N個信道的輸入數據之間的相互差,以便基本上允許在解碼期間從M個信道的輸出信號中重新生成N個信道的輸入信號,所述輸出信號為兼容于在解碼器中進行重現的格式,該解碼器提供N個或少于N個輸出信道。
優(yōu)選地,該方法適應于編碼對應5個信道的輸入信號并且生成輸出信號和參數數據,其格式兼容于對應的2信道立體聲解碼器、3信道解碼器和4信道解碼器中的一個或多個。
優(yōu)選地,在該方法中,所述處理包括經由從時域到頻域的變換來轉換輸入信號。
優(yōu)選地,在該方法中,至少一個輸入信號被作為時間-頻率片的序列來處理以生成輸出信號。
優(yōu)選地,在該方法中,所述片對應相互重疊的分析窗。
優(yōu)選地,該方法包括使用編碼裝置用于處理該輸入信號以生成M個中間音頻數據信道以便包括在該輸出信號中的步驟,該編碼裝置被用來輸出與至少下列之一相關的參數數據中的信息(a)信道間輸入信號功率比或對數水平差;(b)輸入信號之間的信道間相關;
(c)一個或多個信道的輸入信號和該一個或多個信道的輸入信號的功率和之間的功率比;以及(d)信號對之間的相位差或時間差。
更優(yōu)選地,在(d)中的相位差為平均相位差。
優(yōu)選地,在該方法中,對水平差、相關數據和功率比中的至少一個進行計算之后是主要分量分析和/或相位校準以生成該輸出信號。
優(yōu)選地,在該方法中,在N個信道中所傳送的輸入信號中的至少一個對應效果信道。
根據本發(fā)明的第三方面,提供了存儲在數據載體上的編碼數據內容,所述數據內容使用根據本發(fā)明的第二方面的方法來生成。
根據本方面的第四方面,提供了一種解碼器,其可操作地解碼由根據本發(fā)明的第一方面的編碼器所生成的編碼輸出數據,所述編碼輸出數據包括M個信道以及從N個信道的輸入信號所生成的相關參數數據,使得M<N,其中M和N為整數,該解碼器包括處理器(a)用于接收編碼的輸出數據并且將該數據從時域轉換到頻域;(b)用于在頻域中應用該參數數據以從該M個信道中提取內容,以便從該M個信道中重新生成對應N個信道中的一個或多個輸入信號的重新生成的數據內容,該數據內容不是直接包括在編碼的輸出數據中或從編碼的輸出數據中遺漏;以及(c)用于處理該重新生成的數據內容,從而在解碼器的一個或多個輸出端輸出N個信道的一個或多個重新生成的輸入信號。
優(yōu)選地,在該解碼器中,處理器可操作地應用全通去相關濾波器以獲得信號的去相關形式,用于在解碼器處重新生成N個信道的所述一個或多個輸入信號。
優(yōu)選地,在該解碼器中,處理器可操作地應用編碼器逆旋轉以將M個信道的信號和其去相關形式分離成它們的組成分量,用于在解碼器處重新生成N個信道的所述一個或多個輸入信號。
應當理解,本方面的特征能夠在不背離本發(fā)明的范圍的情況下在任何組合中被組合。
現在將參照附圖僅以示例的方式描述本發(fā)明的實施例,其中
圖1為根據本發(fā)明的第一多信道編碼器的示意圖;圖2為根據本發(fā)明的第二多信道編碼器的示意圖,包括提供效果、例如低頻效果,以及圖3為根據本發(fā)明的多信道解碼器的示意圖,該解碼器補充圖1和2的編碼器,并且能夠解碼從這樣的編碼器提供的輸出數據。
具體實施例方式
為了改善在多信道編碼器中執(zhí)行的編碼,其中給多信道編碼器提供了N個信道的輸入數據并且該多信道編碼器被用來編碼該輸入數據以生成對應的編碼的輸出數據流,本發(fā)明人已經設想該編碼器有利地可操作地(a)將該N個信道的輸入數據下混頻為M個信道,使得M<N;以及(b)當生成該輸出數據流時,生成相對小數量的參數開銷數據以結合M個信道的數據,該參數數據被用來在隨后的被提供輸出數據流的解碼器處能夠重新構建對應于N個信道的數據。
例如,該多信道編碼器優(yōu)選地為五信道編碼器,即N=5。該五信道編碼器被配置用于下混頻對應于五個輸入信道的數據,以生成兩個信道的中間數據,即M=2。而且,該五信道編碼器可操作地生成相關的參數開銷數據以結合該兩個信道的數據以生成輸出數據流,該參數數據足以使該解碼器能夠重新構建該五個輸入信道的一個表示。該解碼器是有益的,因為其能夠向后兼容以支持在其中N=2,3,4的情況,即向后兼容2信道、3信道和4信道輸出的情況。
在本發(fā)明的一個優(yōu)選實施例中,編碼器可操作地處理N個輸入數據信道。該N個輸入信道優(yōu)選地對應中心音頻數據信道、左前音頻數據信道、左后音頻數據信道、右前音頻數據信道和右后音頻數據信道;這樣的五個信道能夠創(chuàng)建適合于家庭影院型節(jié)目內容再現的明顯的3維分配。該N個輸入數據信道被下混頻為例如使用現代立體聲音頻編碼裝置編碼的兩個中間音頻數據信道。該編碼裝置有利地使用主要分量分析和/或左前和左后數據信道的相位校準。該編碼器還被用來使用單獨的主要分量分析和/或右前和右后輸入信道上的相位校準。而且,該編碼器可操作地生成包括與下列有關的信息的參數開銷數據
(a)左前和左后數據信道之間的信道間水平差;(b)右前和右后數據信道之間的信道間水平差;(c)與左前和左后數據信道相關的信道間相關數據;(d)與右前和右后數據信道相關的信道間相關數據;以及(e)在中心數據信道和該左前、左后、右前和右后數據信道的功率和之間的功率比。
這兩個中間數據信道和參數開銷數據被結合以從編碼器生成編碼的輸出數據。任選地,與信道間相位差以及優(yōu)選地一側的左前和左后數據信道與另一側的右前和右后數據信道之間的總相位差相關的數據,被包括在來自該編碼器的編碼的輸出數據中。關于本發(fā)明的這個例示實施例在(a)至(e)中執(zhí)行的參數分析,優(yōu)選地涉及時間和頻率分析;更優(yōu)選地,該分析通過后面將進一步解釋的時間-頻率片來執(zhí)行。
在本發(fā)明的優(yōu)選實施例中,編碼器的操作現在將根據其相關的數學函數參照圖1更詳細地加以描述,其中圖1的部件和信號以如表1中提供的來定義。
表1
在圖1中,示出了通常由10表示的編碼器。編碼器10分別包括第一、第二和第三輸入信道20、30、40。來自這三個信道20、30、40的輸出信號380、400、440(即LI、CI、RI)分別被耦合到混頻和參數提取單元200。該提取單元200包括相關的右和左預輸出信號460、470,即PRout、PLout,其被連接到逆變換和OLA單元210,用于分別生成編碼的右和左輸出信號480、490,即Rout、Lout。
第一信道20包括分段和變換單元100,用于分別接收左前和左后輸入信號300、310,即Slf、Slr。對應的左前和左后變換信號350、360(即TSlf、TSlr)被耦合到信道20的下混頻單元130,以及還耦合到信道20的參數分析單元110。第一參數組信號370(即PS1)被耦合到參數至下混頻矢量轉換單元120的輸入端,所述參數至下混頻矢量轉換單元120的相應輸出被耦合到下混頻單元130。
第二信道30包括分段和變換單元140,其被用來接收中心輸入信號320,即Sc。該中心中間信號400,即CI,如上所述,被從變換單元140耦合到參數提取單元200。
第三信道40包括一個分段和變換單元150,用于分別接收右前和右后輸入信號330、340,即Srf、Srr。對應的右前和右后變換信號410、420(即TSrf、TSrr)被耦合到信道40的下混頻單元180,以及還耦合到信道40的參數分析單元160。第二參數組信號430(即PS2)被耦合到參數至下混頻矢量轉換單元170的輸入端,所述參數至下混頻矢量轉換單元170的相應輸出被耦合到下混頻單元180。
參數提取單元200被用來從信道20、30、40接收信號380、400、440以生成第三參數組輸出450(即PS3)以及預輸出信號470、460,即用于OLA單元210的PRout、PLout。
編碼器10能夠在專用硬件中實現??商鎿Q地,編碼器10可以基于計算機硬件,該計算機硬件被用來執(zhí)行用于實現編碼器10的處理功能的軟件。作為又一可替換方案,編碼器10可以由耦合到在軟件控制下工作的計算機硬件的專用硬件的組合來實現。
現在將參照圖1對編碼器10的操作進行描述。信號Slf[n]、Slf[n]、Srf[n]、Srr[n]、Sc[n]分別描述了左前、左后、右前、右后和中心音頻信號的離散時間波形。在信道20、30、40中,這五個信號使用常用分段,優(yōu)選地使用重疊分析窗來進行分段。隨后,使用復變換(例如付立葉變換或同等類型的變換)將每個分段從時域變換到頻域;可替換地,復濾波器組結構(例如使用至少一種硬件或在軟件中模擬來實現)可以被使用以獲得時間/頻率片。這樣的信號處理導致在由Lf[k]、Lr[k]、Rf[k]、Rr[k]、C[k]表示的頻域中輸入信號的分段子帶表示,其中參數k表示頻率指數,L表示左,R表示右,f表示前,r表示后以及C表示中心。
在參數提取單元200中,在第一步驟中執(zhí)行數據處理以估計左前和左后信號之間的相關參數。這些參數包括水平差IIDL、相位差IPDL和相關ICCL。優(yōu)選地,相位差IPDL對應平均相位差。此外,這些參數IIDL、IPDL和ICCL如等式1至3(Eq.1至Eq.3)中提供的那樣來計算IIDL=10log10(ΣkLf[k]Lf*[k]ΣkLr[k]Lr*[k])---Eq.1]]>IPDL=∠(ΣkLf[k]Lr*[k]ΣkLf[k]Lf*[k]ΣkLr[k]Lr*[k])---Eq.2]]>ICCL=|(ΣkLf[k]Lr*[k]ΣkLf[k]Lf*[k]ΣkLr[k]Lr*[k])|---Eq.3]]>其中符號*表示復共軛。
由等式1至3描述的處理還為右前和右后信號進行重復,這樣的處理導致分別與水平差、相位差和相關有關的相應參數IIDR、IPDR和ICCR。
在參數至下混頻矢量變換單元120中,在第二步驟中執(zhí)行數據處理以計算用于兩個信號左前Lf和左后Lr的下混頻的復權重。在優(yōu)選實施例中,被發(fā)送到下混頻單元130的下混頻矢量被用來通過應用輸入信號空間的旋轉α和/或復相位校準來最大化下混頻信號Y[k]的能量。
下混頻應用如下。使用旋轉角度α將該兩個信號Lf和Lr進行旋轉以獲得主信號Y[k]和相應的殘留信號Q[k],所述旋轉角度α最大化如等式4(Eq.4)描述的主信號Y[k]的能量Y[k]Q[k]=cosαsinα-sinαcosαLf[k]exp(j(-OPDL))Lr[k]exp(j(-OPDL+IPDL))---Eq.4]]>其中,角度OPDL表示總的相位旋轉角度,同時計算相位差IPDL以保證這兩個信號Lf、Lr的最大相位校準。旋轉角度α可以使用等式5和6(Eq.5和Eq.6)根據所提取的參數來計算α=12arctan(2gICCLg2-1)---Eq.5]]>其中,g=10IIDL20---Eq.6]]>等式4的信號Q[k]隨后在參數提取單元200中被丟棄,信號Y[k]由標量β來按比例縮放以獲得信號L[k],使得信號L[k]具有與信號Q[k]的功率加上信號Y[k]的功率近似的功率;換句話說,信號Q[k]被丟棄同時所引起的信號功率中的相應損失通過按比例縮放信號Y[k]來補償。使用等式7和8(Eq.7和Eq.8)來計算標量ββ=1+1-μ1+μ---Eq.7]]>其中μ=1+4ICCL2-4(g+1g)2---Eq.8]]>還為該右前和右后信號對重復第一和第二步驟,導致生成相應的信號R[k]。應當注意到,PCA旋轉的使用可以通過使用旋轉角度α的固定值來防止(circumvent)。
在編碼器10中執(zhí)行的第三處理步驟包括將中心信號C[k]混頻到兩個信號L[k]和R[k],這導致分別產生預輸出信號470、460,即PLout、PRout。這樣的混頻按照等式9(Eq.9)來執(zhí)行PLout[k]PRout[k]=L[k]+ϵC[k]R[k]+ϵC[k]---Eq.9]]>其中,參數ε表示在與等式9相關的混頻中確定信號C[k]強度的權重,例如典型地ε=0.707。優(yōu)選地,L、C和R的相應組合在相位方面被對準,否則出現相位相消。
描述了信號C的功率相對于信號L和R的功率的參數IIDC可根據等式10(Eq.10)來計算IIDC=10log10(ϵ2ΣkC[k]C*[k]ΣkL[k]L*[k]+ΣkR[k]R*[k])---Eq.10]]>在編碼器10中,為每個時間/頻率片重復執(zhí)行包括前面所述的第一、第二和第三步驟的上述處理。
信號PLout[k]和PRout[k]隨后在編碼器中被轉換到時域并且使用重疊相加類型的和與以前的分段相結合以分別生成上述輸出信號490、480,即Lout、Rout。
來自編碼器10的輸出數據能夠通過通信網絡被傳送,例如通過因特網或其它類似的廣播網絡??商鎿Q地,或附加地,該輸出數據能夠通過數據載體進行傳送,例如DVD數據光盤或其它類似類型的數據傳送介質。
來自編碼器10的輸出數據能夠在與編碼器10兼容的解碼器中進行解碼,例如在圖3中通常由800表示的解碼器。解碼器800包括數據處理單元810,用于對從編碼器10、600接收的輸出信號480、490和相關參數數據370、430、450、690進行各種數學運算以生成相應的解碼的輸出信號(DOP)。
為了提供向后兼容性,這樣的解碼器可以為立體聲、3信道和5信道設備的至少一種。在與編碼器10兼容的立體聲型解碼器中,即其中解碼器800包括僅用于DOP的兩個解碼輸出,該立體聲類型的解碼器具有兩個重放信道,從編碼器10提供的信號Rout、Lout在立體聲型解碼器中通過兩個重放信道來再現,無須執(zhí)行進一步的處理。
在與編碼器10兼容的3信道解碼器中,具有三個重放信道的解碼器,即其中解碼器800包括用于DOP的三個解碼輸出,例如從數據載體(諸如DVD光盤)讀取的兩個信號Rout、Lout被分段并且然后被變換為上述頻域。相應的再現信號L[k]、R[k]和C[k]于是使用等式11至16(Eq.11至Eq.16)來得到L[k]R[k]C[k]=wLLoutwRRoutwLCLout+wRCRout---Eq.11]]>其中wLC=0.5ϵσC2σL2---Eq.12]]>wRC=0.5ϵσC2σL2---Eq.13]]>σL2=ΣkL[k]L*[k]---Eq.14]]>σR2=ΣkR[k]R*[k]---Eq.15]]>σC2=σL2+σR22+10-IIDC10---Eq.16]]>用于用戶欣賞的三信道音頻信號于是以類似上面描述的方式從信號L[k]、R[k]和C[k]中獲取。
在與編碼器10兼容的五信道解碼器(即提供五個解碼輸出的解碼器800)中,使用上面所述的三信道重放重建,這導致在解碼器處重新生成信號L[k]、R[k]和C[k]。在該五信道解碼器中,執(zhí)行進一步的步驟,其涉及將信號L[k]分離成其組成分量,即前左分量Lf[k]和后左分量Lr[k];類似地,信號R[k]也被分離成其組成分量,即前右分量Rf[k]和后右分量Rr[k]。這樣的信號分離利用編碼器逆旋轉運算,其補充與上面描述的編碼器10中執(zhí)行的旋轉。該逆旋轉所需的主信號Y[k]和殘留信號Q[k]使用等式17和18(Eq.17、18)在該五路解碼器中獲取Y[k]Q[k]=L[k]cosγH[k]L[k]sinγ---Eq.17]]>其中,γ=arctan(1-μ1+μ)---Eq.18]]>其中參數μ在上面等式8(Eq.8)中先前定義。在等式17中,H[k]表示全通去相關濾波器以獲得信號L[k]的去相關形式。隨后,信號Lf[k]和Lr[k]使用如等式19(Eq.19)所描述的編碼器逆旋轉函數來生成Lf[k]Lr[k]=cosα-sinαsinαcosαexp(jOPDL)00exp(jOPDL-IPDL)Y[k]Q[k]---Eq.19]]>類似的處理還應用到右側信道分量。
在與編碼器10兼容的四信道解碼器中,該四信道解碼器可操作來首先以一種類似在上面所述的五信道解碼器中使用的方式解碼五個信道,以生成五個音頻信號Slf、Slr、Srf、Srr和Sc。其后,按照等式20和21(Eq.20、21)進行簡單混頻,以生成左前和右前音頻信號Slf,playback、Srf,playback給用戶欣賞Slf,playback=Slf+qScEq.20Srr,playback=Srf+qScEq.21其中,系數q=0.707。
對于所述四信道解碼器,系數q保證了中心信號分量的總功率基本不變,不論通過單個中心揚聲器重放還是作為用戶的仿真主觀聲源(phantom apparent source of sound),該聲源是由耦合到四信道解碼器的左前和右前揚聲器創(chuàng)建的。
應當理解,上面所描述的本發(fā)明的實施例能在不背離由所附權利要求定義的本發(fā)明的范圍的前提下進行修改。
本發(fā)明人已經認識到,編碼器10不支持效果信道(LFE)的編碼,例如低頻效果信道。這樣的LFE信道是有益的,例如用于傳送聲音效果信息(諸如雷聲信息或爆炸聲信息),其在例如家庭影院系統(tǒng)中有利地伴隨著視覺信息同時呈現給用戶。因此,在本發(fā)明的一個實施例中,發(fā)明人已經意識到,有利地修改編碼器10以增強其第二信道30并且由此產生如圖2中所描述的并且在其中通常表示為600的編碼器。任選地,LFE信道具有大致120Hz的相對受限的頻率帶寬,盡管也能供給可選擇的相對更大的帶寬。
編碼器600通常類似于編碼器10,除了編碼器600的第二信道30被提供有參數分析單元630、參數至下混頻矢量單元640和下混頻單元650,它們以分別與第一和第三信道20、40的相應部件類似的方式被連接;編碼器600的信道30可操作地輸出第四參數組690,即PS4。此外,編碼器600的第二信道30包括用于接收低頻效果信號S1fe的低頻效果(lfe)輸入610,以及還有用于接收上述中心信號SC的一個輸入620。優(yōu)選地,信號Slfe的處理限于從子音頻頻率向上的120Hz頻率帶寬并且因此可能適合驅動現代的亞低音揚聲器類型的揚聲器。然而,本發(fā)明的實施例能夠使用具有遠大于120Hz的帶寬的第二信道30來實現,例如以提供對應于類似脈沖的聲音的高頻信號信息。
與編碼器10相比,包括來自編碼器600的輸出中的低頻效果信息,這要求使用額外的參數。呈現給輸入610的信號在編碼器600中被分析以確定相應的典型參數,該參數在時間/頻率片的基礎上以類似于通過編碼器10處理上述音頻信號的方式進行分析。相應的解碼器優(yōu)選地被用來包括額外的特征,用于解碼該低頻信息,以重新生成例如適合于放大以驅動家庭影院系統(tǒng)中的音頻亞低音揚聲器的信號。
在所附的權利要求中,括號中的數字和其它符號被用來幫助理解權利要求并且并非旨在以任何方式限制權利要求的范圍。
諸如“包含”、“包括”、“結合”、“包納”、“是”以及“具有”等表達當解釋本說明書和其相關權利要求時以非排他的方式被解釋,即被解釋為允許出現沒有明確定義的其他項或組件。對單數的引用還被解釋為對復數的引用,并且反之亦然。
權利要求
1.一種多信道編碼器(10;600),所述編碼器被用來處理在N個輸入信道中傳送的輸入信號(300,310,320,330,340;300,310,610,620,330,340)以生成在M個輸出信道中傳送的相應輸出信號(480,490)以及參數數據(450),使得M和N為整數并且N大于M,該編碼器包括(a)下混頻器,用于下混頻輸入信號以生成相應的輸出信號;以及(b)分析器,用于在下混頻期間或者作為單獨的過程處理該輸入信號,所述分析器可操作地生成補充輸出信號的所述參數數據,所述參數數據描述了輸入信號的N個信道之間的相互差,以便基本上允許在解碼期間從M個信道的輸出信號中重新生成所述N個信道的輸入信號中的一個或多個,所述輸出信號為兼容于解碼器中進行重現的格式,所述解碼器提供了N個或少于N個輸出信道以能夠向后兼容。
2.根據權利要求1的編碼器,其中該編碼器為5信道編碼器,所述5信道編碼器被用來以與相應的2信道立體聲解碼器、3信道解碼器和4信道解碼器中的至少一種相兼容的格式生成所述輸出信號和參數數據。
3.根據權利要求1的編碼器,其中所述分析器包括處理裝置,用于經由從時域到頻域的變換來轉換該輸入信號,并且用于處理這些被變換的輸入信號以生成參數數據。
4.根據權利要求3的編碼器,其中所述下混頻器和分析器中的至少一個被用來將輸入信號作為時間-頻率片的序列進行處理以生成該輸出信號。
5.根據權利要求4的編碼器,其中該片通過相互重疊分析窗的變換來獲得。
6.根據權利要求1的編碼器,包括編碼裝置,用于處理該輸入信號以生成M個中間音頻數據信道,以包括在M個輸出信號中,該分析器被用來輸出與至少下列之一相關的參數數據中的信息(a)信道間輸入信號功率比或對數水平差;(b)輸入信號之間的信道間相關;(c)一個或多個信道的輸入信號和該一個或多個信道的輸入信號的功率和之間的功率比;以及(d)信號對之間的相位差或時間差。
7.根據權利要求6的編碼器,其中在(d)中的所述相位差為平均相位差。
8.根據權利要求6的編碼器,其中對相位差、相關數據和功率比中的至少一個進行計算之后是主要分量分析(PCA)和/或信道間相位校準以生成該N個輸出信號。
9.根據權利要求1的編碼器,其中在N個信道中所傳送的至少一個輸入信號對應效果信道。
10.根據權利要求1的編碼器,以適合于使用常規(guī)的重放系統(tǒng)進行重放的格式生成輸出信號。
11.一種在多信道編碼器中編碼在N個輸入信道中所傳送的輸入信號以生成在M個輸出信道中所傳送的相應輸出信號以及參數數據,使得M和N為整數并且N大于M的方法,該方法包括步驟(a)下混頻該輸入信號以生成相應的輸出信號;以及(b)當被下混頻時在分析器中處理該輸入信號或者單獨地處理該輸入信號,所述處理提供補充該輸出信號的所述參數數據,所述參數數據描述了N個信道的輸入信號之間的相互差以便基本上允許在解碼期間從M個信道的輸出信號中重新生成N個信道的輸入信號,所述輸出信號是兼容于在解碼器中進行再現的格式,該解碼器提供N或少于N個信道。
12.根據權利要求11的方法,適應于編碼對應5個信道的輸入信號并且生成其格式兼容于相應的2信道立體聲解碼器、3信道解碼器和4信道解碼器中的一種或多種解碼器的輸出信號和參數數據。
13.根據權利要求11的方法,其中所述處理包括經由從時域到頻域的變換來轉換輸入信號。
14.根據權利要求13的方法,其中至少一個輸入信號被作為時間-頻率片序列來處理以生成輸出信號。
15.根據權利要求14的方法,其中所述的片對應相互重疊的分析窗。
16.根據權利要求11的方法,該方法包括使用編碼裝置用于處理該輸入信號以生成M個中間音頻數據信道以便包括在輸出信號中的步驟,該編碼裝置被用來輸出與至少下列之一相關的參數數據中的信息(a)信道間輸入功率比或對數水平差;(b)輸入信號之間的信道間相關;(c)一個或多個信道的輸入信號和該一個或多個信道的輸入信號的功率和之間的功率比;以及(d)信號對之間的功率差或時間差。
17.根據權利要求16的方法,其中功率差為平均功率差。
18.根據權利要求16的方法,其中對所述相位差、相關數據和功率比中的至少一個進行計算之后是主要分量分析(PCA)和/或信道間相位校準以生成該輸出信號。
19.根據權利要求11的方法,其中在N個信道中所傳送的輸入信號中的至少一個對應效果信道。
20.使用根據權利要求11的方法生成的編碼數據內容。
21.在其上存儲如在權利要求20中所述的編碼數據的數據載體。
22.一種解碼器(800),可操作地解碼由根據權利要求1的編碼器(10;600)生成的編碼的輸出數據(370,430,450,480,490,690),所述編碼的輸出數據(370,430,450,480,490,690)包括M個信道(480,490)以及從N個信道的輸入信號所生成的相關參數數據(370,430,450,690),使得M<N,其中M和N為整數,該解碼器(800)包括處理器(810)(a)用于接收編碼的輸出數據(370,430,450,460,490,690)并且將該數據從時域轉換到頻域;(b)用于在頻域中應用該參數數據以從該M個信道提取內容以便從該M個信道中重新生成對應N個信道中的一個或多個的輸入信號的重新生成的數據內容,該數據內容不是直接包括在編碼的輸出數據中或從編碼的輸出數據中遺漏;以及(c)用于處理該重新生成的數據,從而在解碼器的一個或多個輸出端輸出N個信道的一個或多個重新生成的輸入信號。
23.根據權利要求22的解碼器(800),其中所述處理器(810)可操作地應用全通去相關濾波器以獲得信號的去相關形式,用于在解碼器處重新生成N個信道的所述一個或多個輸入信號。
24.根據權利要求23的解碼器(800),其中所述處理器可操作來應用編碼器逆旋轉,以將M個信道的信號和其去相關形式分離成它們的組成分量,用于在解碼器處重新生成N個信道的所述一個或多個輸入信號。
25.根據權利要求24的解碼器(800),其中所述解碼器(800)可操作地單獨從在所述解碼器(800)處接收的所述編碼的輸出數據(450,480,490)中生成其一個或多個解碼器輸出(1300至1340)。
全文摘要
描述了多信道編碼器(10),用于處理在N個輸入信道中所傳送的輸入信號(300,310,320,330,340)以生成在M個輸出信道中所傳送的相應輸出信號(480,490)以及補充的參數數據(370,430,450);M和N為整數,其中N>M。編碼器(10)包括下混頻器,用于下混頻輸入信號(30,310,320,330,340)以生成相應的輸出信號(480,490),該編碼器還包括分析器,用于處理輸入信號(300,310,320,330,340)以生成參數數據(370,430,450),參數數據描述了N個信道的輸入信號之間的相互差,以允許在解碼期間從M個信道的輸出信號中重新生成N個信道輸入信號的一個或多個。這樣的編碼器(10)能夠提供高效的數據編碼以及能夠與具有少于N個解碼輸出信道的相對較簡單的解碼器向后兼容。本發(fā)明還涉及與這樣的多信道相兼容的解碼器。
文檔編號G10L19/00GK1942929SQ200580012104
公開日2007年4月4日 申請日期2005年3月25日 優(yōu)先權日2004年4月5日
發(fā)明者D·J·布里巴特, E·G·P·舒伊杰斯, G·H·霍托, M·W·范盧恩 申請人:皇家飛利浦電子股份有限公司