專利名稱:沒有反饋的頻域有源矩陣解碼的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于將大量的音頻輸入信號(例如,兩個輸入通道)解碼成更多的音頻輸出信號(例如,五個輸出通道,可以為全頻率輸出通道)的有源矩陣解碼器系統(tǒng)和方法。在一些實施例中,本發(fā)明涉及在頻域中操作、并且使用在不使用反饋的情況下產(chǎn)生的增益控制值掌控有源矩陣元件的這種矩陣解碼器系統(tǒng)和方法。
背景技術(shù):
在包括權(quán)利要求書的整個本公開中,同義地使用術(shù)語“解碼器”和“解碼器系統(tǒng)”。在包括權(quán)利要求書的整個本公開中,在廣泛的意義上使用表述在信號或數(shù)據(jù)“上” 執(zhí)行操作(例如,過濾或變換),以表示直接對信號或數(shù)據(jù)、或者信號或數(shù)據(jù)的經(jīng)處理的版本(例如,在對其執(zhí)行操作之前已經(jīng)過初步過濾的信號的版本)執(zhí)行操作。在包括權(quán)利要求書的整個本公開中,表述“后面”位置(例如,“后源位置”)表示收聽者頭部后面的位置,并且,“前面”位置(例如,“前輸出位置”)的表達方式表示收聽者頭部前面的位置。類似地,“前面”揚聲器表示位于收聽者頭部前面的揚聲器,并且“后面” 揚聲器表示位于收聽者頭部后面的揚聲器。在包括權(quán)利要求書的整個本公開中,在廣泛的意義上使用表述“系統(tǒng)”以表示裝置、系統(tǒng)或子系統(tǒng)。例如,實現(xiàn)解碼器的子系統(tǒng)可被稱為解碼器系統(tǒng),并且,包含這種子系統(tǒng)的系統(tǒng)(例如,響應(yīng)多個輸入產(chǎn)生X個輸出信號的系統(tǒng),其中,子系統(tǒng)產(chǎn)生輸入中的M個輸入,并且從外部源接收其它的X-M個輸入)也可被稱為解碼器系統(tǒng)。在包括權(quán)利要求書的整個本公開中,表述通過揚聲器的信號的“再現(xiàn)”表示導(dǎo)致?lián)P聲器響應(yīng)信號產(chǎn)生聲音,包括通過執(zhí)行信號的任何需要的放大和/或其它的處理。音頻矩陣解碼器用于將(由X個輸入信號確定的)X個離散音頻通道解碼為用于回放的(由Y個輸出信號確定的)Y個通道,其中,X和Y是整數(shù)并且Y比X大。輸入通道有時是從大量通道編碼的矩陣。矩陣編碼器/解碼器技術(shù)的例子包含四聲道立體聲(例如在以下文獻中描述的Bauer,Benjamin B.等人的“Quadraphonic Matrix Perspective-Advances in SQ Encoding and Decoding Technology", J. Audio Engineering Society.,第21卷,第9頁,1973年6月)、高保真度立體聲響復(fù)制(例如在以下文獻中描述的Michael Gerzon,"Surround-sound psychoacoustics,Criteria for the design of matrix and discrete surround-sound systems ",Wire less World, 1974^ 12 月,第 483-485 頁)、Dolby Pro Logic II 技術(shù)(例如Kenneth Gundry 在文章“A new active matrix decoder for surround sound", Proc. AES 19th International Conference on Surround Sound, 2001 年 6 月中描述的)和 Dolby Pro Logic 技術(shù)。
4
圖1是稱為無源矩陣解碼器的類型的簡單的常規(guī)的2通道到4通道解碼器的例子。無源矩陣解碼器不嘗試分析輸入信號而是關(guān)于輸入信號的編碼(如果有的話)進行假定。在圖1中,輸入信號Left Total (Lt)和Right Total (Rt)被直接饋送到左(L)輸出和右(R)輸出。通過在加法元件2中將輸入信號Lt和Rt相加,并且將得到的相加信號施加到對其施加增益的放大器1來導(dǎo)出中心(C)輸出。通過在減法元件4中產(chǎn)生輸入信號Lt 和Rt的差值,并且在低通濾波器(LPF) 3中對得到的差值信號進行低通過濾來導(dǎo)出環(huán)繞(S) 輸出。圖2是稱為有源矩陣解碼器的類型的常規(guī)的2通道到5通道解碼器的例子。圖2的解碼器包含有源解碼矩陣6。矩陣6被耦合以接收Left Total (Lt)和Right Total (Rt)輸入信號,并且被配置為響應(yīng)輸入信號和來自掌控元件7的控制信號產(chǎn)生五個輸出信號(左輸出“L”、右輸出“R”、中心輸出“C”、左環(huán)繞輸出“Ls”和右環(huán)繞輸出“Rs”)。圖2的有源矩陣解碼器在加法元件2中對輸入信號求和,并且在減法元件4中產(chǎn)生輸入信號的差值。來自元件2和4的相加和差值信號不被直接饋送到輸出通道(如圖1那樣)。作為替代,從元件2和4輸出的相加和差值信號與輸入信號Lt和Rt —起被施加到掌控元件7。響應(yīng)這些信號,掌控元件7以允許它連續(xù)“掌控”解碼矩陣6的方式分析輸入信號。解碼矩陣6基于從元件7施加的掌控控制信號來確定輸出通道混合。如何利用使用反饋的掌控元件在時域中實現(xiàn)有源解碼以產(chǎn)生用于控制有源矩陣元件的增益控制信號是眾所周知的。例如,受讓給Dolby Laboratories Licensing Corporation的美國專利7,280, 664和美國專利6,920, 223描述了這種解碼。美國專利7,280, 664的有源矩陣解碼器包括掌控元件(例如,圖16A的元件230), 該掌控元件包含使用反饋以產(chǎn)生用于產(chǎn)生有源矩陣元件要應(yīng)用的矩陣系數(shù)的控制信號的伺服電路。例如,美國專利7,280, 664的圖16A的元件230可包含圖17-19的伺服電路,其使用反饋以產(chǎn)生控制信號gL、gR、gF、gB、gLB和gRB。使用這些增益控制信號以產(chǎn)生圖16A 的自適應(yīng)矩陣214要應(yīng)用的更新的矩陣系數(shù)。例如,圖17的伺服電路響應(yīng)音頻信號樣本 Lt'和Rt'產(chǎn)生控制信號gL和gR,包含通過將信號gL和gR作為反饋施加到輸入Lt'和 Rt'(并且在元件M2、M0、252和250中分別組合信號gL和gR與輸入Lt'和Rt')。使用元件240和250的輸出(分別是(l-gL)Lt'和(l-gR)Rt')來更新控制信號LR的值。 信號LR的更新值確定控制信號gL和gR的更新值。利用不使用反饋的掌控元件在時域中實現(xiàn)有源解碼以產(chǎn)生用于控制有源矩陣元件的增益控制信號也是眾所周知的。例如,在受讓給Dolby Laboratories Licensing Corporation的美國專利4,799,260中描述了這種有源解碼。但是,在美國專利4,799,260 中描述的有源矩陣解碼是在不確定(根據(jù)知覺激發(fā)的考慮)輸入音頻信號的全頻率范圍的臨界頻帶的情況下執(zhí)行的。在美國專利4,799,260中描述的有源矩陣解碼還是在不產(chǎn)生用于這種臨界頻帶中的不同臨界頻帶的增益控制值,并且不過濾輸入音頻信號以產(chǎn)生每個在不同的臨界頻帶中的輸入子帶信號或者對于多個臨界頻帶中的每個臨界頻帶實現(xiàn)不同的有源矩陣的情況下執(zhí)行的。這里的表述(一個或更多個音頻信號的組的全頻率范圍的)“臨界頻帶”表示根據(jù)知覺激發(fā)的考慮確定的全頻率范圍的頻帶。一般地,分割全可聽頻率范圍的臨界頻帶具有跨全可聽頻率范圍隨著頻率增加的寬度。
已經(jīng)建議,在時域中執(zhí)行有源矩陣解碼,其中對于輸入音頻信號的多個臨界頻帶中的不同臨界頻帶產(chǎn)生增益控制值。例如,在其面上指示被受讓給Digital Theater Systems, Inc.的美國專利7,003,467教導(dǎo)在時域中實現(xiàn)的有源矩陣解碼器。解碼器向音頻輸入信號應(yīng)用帶通濾波器以產(chǎn)生一組輸入子帶信號,每個表示輸入信號的全頻率范圍中的不同的頻帶,然后將子帶信號解碼。美國專利7,003, 467教導(dǎo)子帶信號可被組成為更少的分組信號,每個表示輸入信號的全頻率范圍中的(稱為“Bark帶”類型的)不同的臨界頻帶,分組信號可接著被解碼。但是,美國專利7,003,467沒有教導(dǎo)(并且,在本發(fā)明之前不知道)如何在頻域中實現(xiàn)有源解碼,包括通過過濾輸入音頻信號以產(chǎn)生每個在不同的臨界頻帶中的輸入子帶信號,關(guān)于臨界頻帶中的每個臨界頻帶分別產(chǎn)生增益控制值,并且對輸入子帶信號中的每個子帶信號應(yīng)用不同的有源矩陣。美國專利7,003,467也沒有建議應(yīng)在頻域中實現(xiàn)有源音頻信號解碼,或者如何以有效的方式(例如,以低處理器速度(例如,低 MIPS)需求)實現(xiàn)這種頻域有源解碼。需要以對于每個臨界頻帶中的輸入音頻內(nèi)容定制的方式將輸入音頻信號的不同的臨界頻帶解碼(包括通過產(chǎn)生用于解碼輸入音頻中的不同的臨界頻帶的增益控制值)的有源矩陣解碼器,從而以有效的方式并且以可以低處理器速度(例如,低MIPS)需求實現(xiàn)的方式實現(xiàn)的改進的聲學(xué)性能。本發(fā)明的典型的實施例通過以對于每個臨界頻帶中的輸入音頻內(nèi)容定制的方式解碼頻域輸入音頻的不同的臨界頻帶(包含通過產(chǎn)生用于解碼輸入音頻中的不同的臨界頻帶的增益控制值),從而以更少的計算需求實現(xiàn)改進的聲學(xué)性能(包括沒有知覺偽信號的更大的頻率選擇性)。在本發(fā)明之前,不知道如何實現(xiàn)將N(例如,N= 2)個音頻輸入通道轉(zhuǎn)換成M(其中,M大于N)個全頻率音頻輸出通道的知覺激發(fā)音頻矩陣解碼器,包括通過將輸入信號轉(zhuǎn)換成頻域(當(dāng)輸入信號并非已處于頻域中時),將得到的輸入頻率成分施加到響應(yīng)于輸入頻率成分產(chǎn)生頻率成分的M個輸出流有源矩陣元件,并且在不使用反饋的情況下掌控有源矩陣元件。也不知道如何以通過使用功率比(關(guān)于一組臨界頻帶中的每個臨界頻帶從頻域輸入音頻產(chǎn)生)確定的用于掌控的準(zhǔn)則來實現(xiàn)這種掌控,包括通過以非線性的方式整形和縮放功率比。
發(fā)明內(nèi)容
在一類實施例中,本發(fā)明是一種被配置為將表示N個音頻輸入信號(輸入通道) 的輸入頻率成分的N個流解碼以產(chǎn)生確定M個音頻輸出信號(一般為全頻率輸出通道)的輸出頻率成分的M個流的知覺激發(fā)有源矩陣解碼器,其中,M和N是整數(shù)并且M比N大。解碼器包括有源矩陣子系統(tǒng),被配置為響應(yīng)輸入頻率成分的N個流(表示N個音頻輸入信號)產(chǎn)生確定M個音頻輸出信號的輸出頻率成分的M個流;和控制子系統(tǒng),與有源矩陣子系統(tǒng)耦合并且被配置為在不使用反饋的情況下響應(yīng)輸入頻率成分產(chǎn)生增益控制值,并且在輸出頻率成分的產(chǎn)生中對于有源矩陣子系統(tǒng)施加用于掌控有源矩陣元件的增益控制值??刂谱酉到y(tǒng)被配置為響應(yīng)輸入頻率成分產(chǎn)生功率比,所述功率比包含用于一組臨界頻帶中的每個臨界頻帶的(輸入頻率成分的每個塊的)至少一個功率比,并且響應(yīng)功率比產(chǎn)生增益控制值,包含通過非線性的方式將功率比整形(以及可選地將功率比縮放和平滑化)。一般地,有源矩陣子系統(tǒng)應(yīng)用多組矩陣系數(shù),每組矩陣系數(shù)用于臨界頻帶中的不同的一個。例如,在一些實施例中,用于每個臨界頻帶的增益控制值確定用于由有源矩陣子系統(tǒng)應(yīng)用于其變換頻率區(qū)間處于臨界頻帶內(nèi)的輸入頻率成分的不同的一組矩陣系數(shù)。屬于臨界頻帶之一的每個變換頻率區(qū)間中的(關(guān)于輸入頻率成分的每個塊的)輸入頻率成分是乘以與該臨界頻帶對應(yīng)的臨界頻帶的矩陣系數(shù)的矩陣。在一些實施例中,解碼器還包括被配置為將N個輸入信號從時域轉(zhuǎn)換成頻域,由此響應(yīng)N個輸入信號產(chǎn)生輸入頻率成分的N個流的輸入變換子系統(tǒng)。在一些實施例中,解碼器還包括被配置為將輸出頻率成分的流從頻域轉(zhuǎn)換成時域,由此響應(yīng)所述輸出頻率成分產(chǎn)生M個輸出信號的輸出變換子系統(tǒng)。一般地,N = 2且M = 5。并且,一般地,控制子系統(tǒng)被配置為關(guān)于一組臨界頻帶中的每個臨界頻帶(為輸入頻率系數(shù)的每個塊)產(chǎn)生一對功率比,并且(為輸入頻率系數(shù)的每個塊)從功率比產(chǎn)生用于每個所述臨界頻帶的五個增益控制值。例如,在解碼器被配置為將兩個音頻輸入信號解碼以產(chǎn)生五個音頻輸出信號(左通道輸出信號、右通道輸出信號、中心通道輸出信號、右環(huán)繞通道輸出信號和左環(huán)繞通道輸出信號)的一些實施例中,每對功率比包含左和右通道功率測量值的比、和前和后通道功率測量值的比。優(yōu)選地,臨界頻帶將掌控分割為基于心理聲學(xué)的多個頻率區(qū)域。在一類實施例中,本發(fā)明是用于解碼N個音頻輸入信號以確定M個音頻輸出信號 (一般地,全頻率輸出通道)的矩陣解碼方法,其中,M和N是整數(shù)并且M比N大,所述方法包括以下步驟(a)響應(yīng)表示N個音頻輸入信號的輸入頻率成分的N個流,操作有源矩陣子系統(tǒng)以產(chǎn)生確定M個音頻輸出信號的輸出頻率成分的M個流,(b)在不使用反饋的情況下從輸入頻率成分確定功率比,所述功率比包含一組臨界頻帶中的每個臨界頻帶的至少一個功率比;(c)從功率比確定用于臨界頻帶中的每一個的增益控制值,包括在不使用反饋的情況下以非線性的方式對功率比整形;和(d)在執(zhí)行步驟(a)的同時,使用增益控制值來掌控有源矩陣元件。在一些實施例中,步驟(C)包括在不使用反饋的情況下縮放和平滑化功率比的步驟。一般地,N = 2且M = 5,步驟(b)包括關(guān)于臨界頻帶中的每一個(為輸入頻率系數(shù)的每個塊)確定兩個功率比的步驟,并且步驟(c)包括關(guān)于臨界頻帶中的每一個(為輸入頻率系數(shù)的每個塊)確定五個增益控制值的步驟。在一些實施例中,該方法還包括以下步驟中的至少一個將音頻輸入信號從時域轉(zhuǎn)換成頻域以產(chǎn)生輸入的頻率成分的流;和將輸出頻率成分的流從頻域轉(zhuǎn)換成時域,由此產(chǎn)生M個音頻輸出信號。在典型的實施例中,本發(fā)明的解碼器為或者包含利用軟件(或固件)編程通用或?qū)S锰幚砥?、?或否則被配置為執(zhí)行本發(fā)明的方法的實施例的通用或?qū)S锰幚砥?。在一些實施例中,本發(fā)明的解碼器是被耦合以接收表示音頻輸入信號的輸入數(shù)據(jù)并且被編程 (通過適當(dāng)?shù)能浖?以通過執(zhí)行本發(fā)明的方法的實施例響應(yīng)輸入數(shù)據(jù)產(chǎn)生表示音頻輸出信號的輸出數(shù)據(jù)的通用處理器。在其它的實施例中,本發(fā)明的解碼器是通過適當(dāng)?shù)嘏渲?例如通過編程)可配置的音頻數(shù)字信號處理器(DSP)來實現(xiàn)的。音頻DSP可以是可被配置 (例如,可通過適當(dāng)?shù)能浖蚬碳痪幊?,或者可響?yīng)控制數(shù)據(jù)而被配置)以對輸入音頻執(zhí)行各種操作中的任一個的常規(guī)的音頻DSP。在操作中,被配置為根據(jù)本發(fā)明執(zhí)行有源矩陣解碼的音頻DSP被耦合以接收多個音頻輸入信號,并且DSP —般對輸入音頻執(zhí)行除了解碼以外的各種操作,或連同解碼的各種操作。根據(jù)本發(fā)明的各種實施例,在被配置(例如,被編程)為通過對輸入音頻信號執(zhí)行該方法以響應(yīng)輸入音頻信號產(chǎn)生輸出音頻信號之后,音頻 DSP可操作為執(zhí)行本發(fā)明的方法的實施例。本發(fā)明的每個方面包含被配置(例如,被編程) 為執(zhí)行本發(fā)明的方法的任何實施例的系統(tǒng)、和存儲了用于實現(xiàn)本發(fā)明的方法的任何實施例的代碼的計算機可讀介質(zhì)(例如,盤)。
圖1是常規(guī)的音頻矩陣解碼器的框圖。圖2是另一常規(guī)的音頻矩陣解碼器的框圖。圖3是本發(fā)明的有源矩陣解碼器系統(tǒng)的實施例的框圖。圖4是圖3的解碼器的自適應(yīng)矩陣16的實現(xiàn)的框圖。圖5是圖3的元件17的左/右控制電路的實現(xiàn)的框圖。圖6是圖3的元件17的前/后控制電路的實現(xiàn)的框圖。圖7是圖3的元件17的環(huán)繞控制電路的實現(xiàn)的框圖。圖8是在圖3解碼器的實現(xiàn)(例如,在圖5的元件32和42)中使用以將k = 1024 的傅立葉變換區(qū)間中的頻率成分分組成經(jīng)過濾的頻率成分的b = 40的臨界頻帶中的濾波器的示圖。圖9是作為本發(fā)明的解碼系統(tǒng)的實施例的音頻數(shù)字信號處理器(DSP)的框圖。
具體實施例方式本發(fā)明的許多實施例在技術(shù)上是可能的。本領(lǐng)域技術(shù)人員從本公開可以明白如何實現(xiàn)它們。參照圖3-9描述本發(fā)明的系統(tǒng)、方法和介質(zhì)的實施例。圖3是本發(fā)明的有源矩陣解碼器系統(tǒng)的實施例的框圖。圖3的系統(tǒng)包括時域到頻域變換段10,該時域到頻域變換段10被耦合和配置為接收時域輸入信號“Left Total"(Lt)并且通過對輸入信號Lt執(zhí)行時域到頻域的變換(例如,離散傅立葉變換,但可替換地,修正離散余弦變換、或正交鏡像濾波器組中的變換、或另一時域到頻域的變換)以產(chǎn)生頻率成分Lt'。頻率成分Lt'包含子集,每個子集處于不同的頻率區(qū)間(頻率變換區(qū)間)中。圖3的系統(tǒng)還包含時域到頻域變換段11,該時域到頻域變換段11被耦合和配置為接收時域輸入信號“Right Total"(Rt)并且通過對輸入信號Rt執(zhí)行時域到頻域的變換(例如,離散傅立葉變換,但是可替換地,修正離散余弦變換、或正交鏡像濾波器組中的變換、或另一時域到頻域變換)來產(chǎn)生頻率成分Rt'。頻率成分Rt'包含子集,每個子集處于不同的頻率區(qū)間(頻率變換區(qū)間)中。在自適應(yīng)解碼矩陣16和掌控元件17中單獨地分析和處理每個頻率區(qū)間中的頻率成分Lt'和Rt'。有源(自適應(yīng))解碼矩陣16被配置為響應(yīng)來自掌控元件17的控制信號和輸入頻率成分Lt'和Rt'產(chǎn)生輸出頻率成分的五個序列,該輸出頻率成分的五個序列在圖3中被識別為左輸出數(shù)據(jù)L'(表示來自左前源的聲音)、右輸出數(shù)據(jù)R'(表示來自右前源的聲音)、中心輸出數(shù)據(jù)C'(表示來自中心前源的聲音)、左環(huán)繞輸出數(shù)據(jù)Ls'(表示來自左后源的聲音)和右環(huán)繞輸出數(shù)據(jù)Rs'(表示來自右后源的聲音)。每個頻率成分Lt'在加法元件14中與相應(yīng)的頻率成分Rt'相加,以產(chǎn)生頻率成分序列Ft'(這里,稱為“前通道”頻率成分)。在減法元件14中從相應(yīng)的頻率成分Lt' 中減去每個頻率成分Rt'以產(chǎn)生頻率成分序列Bt'(這里,稱為“后通道”頻率成分)。頻率成分Lt'和Rt'可經(jīng)受簡單的處理以表示沿左-右軸的信號支配,并且被掌控元件17 使用以產(chǎn)生確定增益控制值gL和gR的功率比值序列。頻率成分Lt'和Rt'可經(jīng)受簡單的處理以表示沿前-后軸(與左-右軸垂直)的信號支配,并且被掌控元件17使用以產(chǎn)生確定增益控制值gF和gB的功率比值序列。當(dāng)輸入音頻信號表示主要來自一個源方向(例如,左前)的(臨界頻帶中的)聲音時,與當(dāng)它們表示主要來自另一源方向(例如,右后) 的(臨界頻帶中的)聲音時相比,掌控元件產(chǎn)生不同的(用于臨界頻帶的)一組增益控制值。對掌控元件17施加頻率成分Ft ‘和Bt ‘和頻率成分Lt ‘和Rt ‘。作為響應(yīng),掌控元件17分析每個臨界頻帶中的頻率成分Lt'和Rt',以產(chǎn)生(并且對自適應(yīng)解碼矩陣 16施加)用于關(guān)于臨界頻帶中的每一個配置矩陣16的增益控制值gL、gR、gF、gB、gLB和 gRB。響應(yīng)用于頻帶中的每一個的增益控制值gL、gR、gF、gB、gLB和gRB,自適應(yīng)矩陣16產(chǎn)生成分序列L'、R'、C'、Ls'和Rs'的(在每個這種臨界頻帶中的每個頻率區(qū)間中的) 頻率成分。每個成分序列L'、R'、C'、Ls'和Rs'的所有子集(每個所述子集處于所述頻帶中的不同的頻帶中)可選地在后處理段18中進行后處理。段18的輸出在頻域到時域變換段20中進行頻域到時域變換(一般地,逆短時離散傅立葉變換或“iSTDFT”,但是可替換地,逆修正離散余弦變換、或正交鏡像濾波器組中的變換、或另一頻域到時域變換)。從段 20輸出五個離散時域信號(左通道輸出信號L'、右通道輸出信號R'、中心通道輸出信號 C'、左環(huán)繞通道輸出信號Ls'和右環(huán)繞通道輸出信號Rs')。因此,圖3的系統(tǒng)將兩個時域音頻輸出信號(Lt、Rt)轉(zhuǎn)換成變換頻率區(qū)間中的頻域數(shù)據(jù)以供分析和處理。系統(tǒng)的控制路徑(包含圖3所示的元件12、13、14、15和17)從頻域數(shù)據(jù)產(chǎn)生關(guān)于一組臨界頻帶中的每一個的功率測量值,并且使用它們產(chǎn)生用于配置自適應(yīng)矩陣16的增益控制值。這里,圖3的系統(tǒng)中除了控制路徑中的元件以外的元件有時被稱為“信號路徑”。系統(tǒng)的控制路徑通過在濾波器12和13中帶通過濾頻域數(shù)據(jù)將頻域數(shù)據(jù)整形。響應(yīng)經(jīng)過濾的頻域數(shù)據(jù),確定頻率成分Ft'和Bt'。成分Ft'表示相加信號Ft (這里,稱為“前通道”信號或“前”信號)。成分Bt'表示差值信號Bt (這里,稱為“后通道”信號或“后”信號)。頻率成分Ft'和Bt'連同表示經(jīng)過濾的輸入信號Lt和Rt的經(jīng)過濾的頻率成分被轉(zhuǎn)換成被用于產(chǎn)生用于臨界頻帶中的每一個的增益控制值gL、gR、gF、gB、gLB 和gRB的臨界頻帶功率值(關(guān)于臨界頻帶中的每一個的功率測量值)。圖3系統(tǒng)的控制路徑和信號路徑都不包含反饋。作為替代,控制路徑信號依賴于臨界頻帶功率值的非線性表示的分析。有源解碼矩陣16在臨界頻帶內(nèi)被掌控以產(chǎn)生輸出通道數(shù)據(jù)(包含用于輸出通道中的每一個的變換頻率區(qū)間中的每一個的頻率成分)。矩陣 16將表示二通道輸入音頻的頻率成分(Lt'、Rt')乘以適當(dāng)?shù)幕旌暇仃囅禂?shù),并且,得到的輸出通道頻率成分在段18中進行可選的后處理,并接著在段20中被轉(zhuǎn)換回時域。在優(yōu)選的實施例中,使用以非線性的方式整形(例如,在圖5和圖6的電路38和 58中)并且可選地被縮放(例如在圖5和圖6的電路38和58中的電路中)和平滑化(例如,在圖5和圖6的元件33、43、45、46、53、63、65和66中)的功率比(例如,由參照圖5和圖6描述的電路的元件37和57產(chǎn)生的功率比的對)來確定(關(guān)于輸入頻率成分的每個塊的)用于有源矩陣16的增益控制值。關(guān)于臨界頻帶中的每一個產(chǎn)生用于輸入頻率成分的每個塊的功率比。臨界頻帶將掌控分割成基于心理聲學(xué)的多個頻率區(qū)域。通過這樣做,掌控具有沒有知覺偽信號的更大的頻率選擇性。因此,使用臨界頻帶而不是變換區(qū)間來掌控有源矩陣。在圖3系統(tǒng)的典型的實現(xiàn)中,變換電路10和11通過以k個頻率區(qū)間和b個臨界頻帶向輸入信號Lt和Rt中的每一個的采樣的每m個連續(xù)塊的組應(yīng)用短時離散傅立葉變換 (STDFT),將離散的輸入音頻(Lt、Rt)采樣從時域轉(zhuǎn)換成頻域。一般地,在每個這種輸入音頻采樣的組的每兩個連續(xù)塊之間存在重疊(例如,50%重疊)。一般地,b是20-40的范圍中的整數(shù)。一般地,通過電路10和11中的每一個變換的輸入音頻的每個塊由輸入音頻的 1024(或51 個采樣組成。并且,一般地,電路10和11的每一個響應(yīng)每個這種塊的輸出是512(或256)個區(qū)間中的一組頻率成分(即,每個具有512或256個頻率中的不同的一個的一組頻率成分)。圖3的有源矩陣16被配置為使用b個矩陣系數(shù)組對每個臨界頻帶中的輸入頻率系數(shù)執(zhí)行矩陣乘法,每個矩陣系數(shù)組用于b個臨界頻帶中的不同的一個。(用于臨界頻帶的)每個矩陣系數(shù)組可由如圖4所示的那樣標(biāo)注的七十個系數(shù)組成。在被配置為響應(yīng)兩個輸入通道施加多于五個的輸出通道的圖3和圖4的實施例的變形中,有源矩陣為每個臨界頻帶使用的矩陣系數(shù)組一般由多于七十個系數(shù)組成。有源矩陣16 —般被配置為向其變換頻率區(qū)間處于每個不同的臨界頻帶內(nèi)的輸入音頻的頻率成分應(yīng)用不同的矩陣系數(shù)組。屬于臨界頻帶之一的每個變換頻率區(qū)間內(nèi)的(輸入頻率成分的每個塊的)頻率成分是乘以與該臨界頻帶對應(yīng)的臨界頻帶的矩陣系數(shù)的矩陣。元件16為臨界頻帶中的每一個應(yīng)用的矩陣包含固定部分(由圖4的矩陣系數(shù)al 至alO確定)和變量部分(由圖4的系數(shù)bl至glO和元件17向矩陣16施加的增益控制值確定)。每個矩陣的固定部分與對矩陣16施加的增益控制值無關(guān)。每個矩陣的變量部分取決于增益控制值。對于每個塊m和臨界頻帶b,掌控元件17產(chǎn)生一組增益控制值gL、gR、 gF、gB、gLB和gRB,并且,如式1所示,這些增益控制值被應(yīng)用于第b個矩陣系數(shù)組(用于第b個臨界頻帶的矩陣16的矩陣系數(shù))以計算用于第b個臨界頻帶的混合矩陣值
權(quán)利要求
1.一種用于將N個音頻輸入信號解碼以確定M個音頻輸出信號的矩陣解碼方法,其中, M和N是整數(shù),并且M比N大,所述方法包括以下的步驟(a)響應(yīng)表示N個音頻輸入信號的輸入頻率成分的N個流,操作有源矩陣子系統(tǒng)以產(chǎn)生確定M個音頻輸出信號的輸出頻率成分的M個流,(b)在不使用反饋的情況下從輸入頻率成分確定功率比,所述功率比包含關(guān)于一組臨界頻帶中的每個臨界頻帶的至少一個功率比;(c)從功率比確定關(guān)于臨界頻帶中的每一個的增益控制值,包含通過在不使用反饋的情況下以非線性的方式將功率比整形;和(d)在執(zhí)行步驟(a)的同時,使用增益控制值來掌控有源矩陣元件。
2.根據(jù)權(quán)利要求1所述的方法,其中,步驟(c)包含在不使用反饋的情況下縮放和平滑化功率比的步驟。
3.根據(jù)權(quán)利要求1所述的方法,其中,N= 2并且M = 5,步驟(b)包含關(guān)于臨界頻帶中的每個臨界頻帶為輸入頻率系數(shù)的每個塊確定兩個功率比的步驟,并且步驟(c)包含關(guān)于臨界頻帶中的每個臨界頻帶為輸入頻率系數(shù)的每個塊確定五個增益控制值的步驟。
4.根據(jù)權(quán)利要求1所述的方法,還包括以下的步驟將音頻輸入信號從時域轉(zhuǎn)換成頻域以產(chǎn)生輸入頻率成分的流。
5.根據(jù)權(quán)利要求1所述的方法,還包括以下步驟將音頻輸入信號從時域轉(zhuǎn)換成頻域以產(chǎn)生輸入頻率成分的流;以及將輸出頻率成分的流從頻域轉(zhuǎn)換成時域,由此產(chǎn)生M個音頻輸出信號。
6.根據(jù)權(quán)利要求1所述的方法,其中,N= 2并且M = 5,步驟(a)包含產(chǎn)生包含左通道輸出流、右通道輸出流、中心通道輸出流、右環(huán)繞通道輸出流和左環(huán)繞通道輸出流的輸出頻率成分的五個流的步驟,并且,步驟(b)包含關(guān)于臨界頻帶中的每個臨界頻帶為輸入頻率系數(shù)的每個塊確定一對功率比的步驟,各所述一對功率比包含左和右通道功率測量值的比、和前和后通道功率測量值的比。
7.根據(jù)權(quán)利要求6所述的方法,其中,通過操作包含有源矩陣子系統(tǒng)和與有源矩陣子系統(tǒng)耦合的控制子系統(tǒng)的音頻數(shù)字信號處理器來執(zhí)行步驟(a)、步驟(b)、步驟(c)和步驟 (d),并且通過操作控制子系統(tǒng)來執(zhí)行步驟(b)和(c)以從輸入頻率成分確定功率比,并且確定增益控制值。
8.根據(jù)權(quán)利要求1所述的方法,其中,所述以非線性的方式將功率比整形包含對從功率比中的至少一個確定的至少一個值取冪的步驟。
9.一種被配置為將表示N個音頻輸入信號的輸入頻率成分的N個流解碼以產(chǎn)生確定M 個音頻輸出信號的輸出頻率成分的M個流的有源矩陣解碼器,其中,M和N是整數(shù)并且M比 N大,所述解碼器包含有源矩陣子系統(tǒng),被配置為響應(yīng)輸入頻率成分的N個流產(chǎn)生確定M個音頻輸出信號的輸出頻率成分的M個流;以及控制子系統(tǒng),與有源矩陣子系統(tǒng)耦合并且被配置為在不使用反饋的情況下響應(yīng)輸入頻率成分產(chǎn)生增益控制值,并且在輸出頻率成分的產(chǎn)生期間對有源矩陣子系統(tǒng)施加增益控制值以掌控有源矩陣元件,其中,控制子系統(tǒng)被配置為,響應(yīng)輸入頻率成分產(chǎn)生功率比,所述功率比包含關(guān)于一組臨界頻帶中的每個臨界頻帶的用于輸入頻率成分的每個塊的至少一個功率比,并且從所述功率比產(chǎn)生增益控制值,包含通過在不使用反饋的情況下以非線性的方式將功率比整形,并且其中,增益控制值包含多個子集,這些子集中的每一個用于臨界頻帶中不同的一個。
10.根據(jù)權(quán)利要求9的解碼器,其中,控制子系統(tǒng)被配置為從功率比產(chǎn)生增益控制值, 包含通過在不使用反饋的情況下縮放和平滑化功率比。
11.根據(jù)權(quán)利要求9所述的解碼器,其中,有源矩陣子系統(tǒng)被配置為向輸入頻率成分應(yīng)用多組矩陣系數(shù),每組矩陣系數(shù)用于臨界頻帶中的不同的一個。
12.根據(jù)權(quán)利要求11所述的解碼器,其中,用于臨界頻帶中的每個臨界頻帶的增益控制值確定由有源矩陣子系統(tǒng)應(yīng)用于輸入頻率成分中其頻率處于所述每個臨界頻帶內(nèi)的那些輸入頻率成分的多組矩陣系數(shù)中的不同的一組。
13.根據(jù)權(quán)利要求9所述的解碼器,還包括被配置為將N個輸入信號從時域轉(zhuǎn)換成頻域,由此響應(yīng)N個輸入信號產(chǎn)生輸入頻率成分的N個流的輸入變換子系統(tǒng)。
14.根據(jù)權(quán)利要求13所述的解碼器,其中,用于臨界頻帶中的每個臨界頻帶的增益控制值確定由有源矩陣子系統(tǒng)應(yīng)用于輸入頻率成分中其變換頻率區(qū)間處于所述每個臨界頻帶內(nèi)的那些輸入頻率成分的多組矩陣系數(shù)中的不同的一組。
15.根據(jù)權(quán)利要求9所述的解碼器,還包括被配置為將輸出頻率成分的流從頻域轉(zhuǎn)換成時域,由此響應(yīng)所述輸出頻率成分產(chǎn)生M 個輸出信號的輸出變換子系統(tǒng)。
16.根據(jù)權(quán)利要求9所述的解碼器,其中,N= 2并且M = 5,控制子系統(tǒng)被配置為關(guān)于一組臨界頻帶中的每個臨界頻帶為輸入頻率系數(shù)的每個塊產(chǎn)生一對功率比,并且關(guān)于每個所述臨界頻帶為輸入頻率系數(shù)的每個塊從功率比產(chǎn)生五個增益控制值。
17.根據(jù)權(quán)利要求16所述的解碼器,其中,所述解碼器被配置為將輸入頻率成分的兩個流解碼,以產(chǎn)生確定五個音頻輸出信號的輸出頻率成分的五個流,所述五個音頻輸出信號包含左通道輸出信號、右通道輸出信號、中心通道輸出信號、右環(huán)繞通道輸出信號和左環(huán)繞通道輸出信號,并且所述每對功率比包含左和右通道功率測量值的比、和前和后通道功率測量值的比。
18.根據(jù)權(quán)利要求9所述的系統(tǒng),其中,控制子系統(tǒng)被配置為從功率比產(chǎn)生增益控制值,包含通過對從功率比中的至少一個確定的至少一個值取冪。
19.根據(jù)權(quán)利要求9所述的系統(tǒng),其中,所述解碼器是音頻數(shù)字信號處理器。
20.根據(jù)權(quán)利要求9所述的系統(tǒng),其中,所述解碼器是包含被配置為實現(xiàn)有源矩陣子系統(tǒng)和控制子系統(tǒng)的電路的音頻數(shù)字信號處理器。
全文摘要
提供將N個音頻輸入信號解碼以產(chǎn)生M個音頻輸出信號的知覺激發(fā)的頻域有源矩陣解碼器和解碼方法,其中,M比N大,包括通過響應(yīng)表示音頻輸入信號的輸入頻率成分的N個流,產(chǎn)生確定M個音頻輸出信號的輸出頻率成分的M個流;在不使用反饋的情況下從輸入頻率成分確定功率比,所述功率比包含關(guān)于一組臨界頻帶中的每個臨界頻帶的至少一個功率比;以及,從功率比確定臨界頻帶中的每一個的增益控制值,包含通過在不使用反饋的情況下以非線性的方式將功率比整形。通過使用增益控制值來掌控有源矩陣元件。
文檔編號H04S5/00GK102282868SQ201080004384
公開日2011年12月14日 申請日期2010年1月12日 優(yōu)先權(quán)日2009年1月14日
發(fā)明者C·P·布朗 申請人:杜比實驗室特許公司