專利名稱:用于混合壓縮數(shù)字位流的方法及裝置的制作方法
技術(shù)領(lǐng)域:
本公開總體上涉及數(shù)字壓縮,更具體地涉及用于混合壓縮數(shù)字位流的方法及裝置。
背景技術(shù):
在現(xiàn)代電視或無線電廣播站中,通常采用壓縮數(shù)字位流來承載用于發(fā)送的視頻和/或音頻數(shù)據(jù)。例如,在美國(guó)針對(duì)數(shù)字電視(DTV)廣播的先進(jìn)電視系統(tǒng)委員會(huì)(ATSC)標(biāo)準(zhǔn)采用運(yùn)動(dòng)圖像專家組(MPEG)標(biāo)準(zhǔn)(例如,MPEG-1、MPEG-2、MPEG-3、MPEG-4等)來承載視頻內(nèi)容,并采用數(shù)字音頻壓縮標(biāo)準(zhǔn)(例如,公知為Dolby Digital的AC-3)來承載音頻內(nèi)容(即,ATSC標(biāo)準(zhǔn)數(shù)字音頻壓縮(AC-3),A版,2001年8月)。AC-3壓縮標(biāo)準(zhǔn)基于感知型數(shù)字音頻編碼技術(shù),該技術(shù)在最小化可感知失真的同時(shí)減少再現(xiàn)原始音頻信號(hào)所需的數(shù)據(jù)量。具體來說,AC-3壓縮標(biāo)準(zhǔn)認(rèn)識(shí)到,人耳在特定譜頻率處無法覺察到小于這些譜頻率處的掩蔽能量的頻譜能量變化。掩蔽能量是音頻片段的一特性,其取決于該音頻片段的音調(diào)和類噪聲特性??刹捎貌煌囊阎睦砺晫W(xué)模型來確定特定譜頻率處的掩蔽能量。此外,AC-3壓縮標(biāo)準(zhǔn)提供了用于數(shù)字電視(DTV)、高清晰度電視(HDTV)、數(shù)字多功能盤(DVD)、數(shù)字線纜以及衛(wèi)星傳輸?shù)氖沟媚軌驈V播特殊聲音效果(例如,環(huán)繞聲)的多聲道數(shù)字音頻格式(例如,5.1聲道格式)。
一些廣播情形要求要與主音頻服務(wù)(MAS)(其可與要廣播的主電視或無線電節(jié)目相對(duì)應(yīng))混合的輔助音頻服務(wù)(AAS),例如包含畫外音材料的音頻服務(wù)。AAS可源于實(shí)況音頻,或者可按照模擬、非壓縮數(shù)字格式或壓縮數(shù)字格式來存儲(chǔ)。將AAS與MAS混合通常包括衰減MAS并加入AAS,使得AAS可聽得見,同時(shí)MAS仍處于較低但可感知的水平。
在傳統(tǒng)的模擬廣播中,混合兩種音頻源(例如,AAS和MAS)是相對(duì)簡(jiǎn)單的任務(wù),涉及公知的衰減和放大電路。同樣,混合兩個(gè)非壓縮數(shù)字音頻流也是相對(duì)簡(jiǎn)單的任務(wù),這是因?yàn)榭刹捎霉木€性衰減和加法技術(shù)來混合非壓縮數(shù)字樣本。然而,當(dāng)任一個(gè)音頻源或兩個(gè)音頻源都提供壓縮數(shù)字音頻流時(shí)(如在全數(shù)字現(xiàn)代廣播設(shè)備的情況下)混合兩個(gè)音頻源要復(fù)雜得多。在一些已知的系統(tǒng)中,混合一個(gè)或更多個(gè)壓縮數(shù)字音頻流要求對(duì)要混合的所有流進(jìn)行解壓縮。然后采用非壓縮的數(shù)據(jù)流執(zhí)行混合,接著對(duì)所得的混合數(shù)據(jù)流進(jìn)行再壓縮。然而,這種要求對(duì)源數(shù)字流進(jìn)行解壓縮并對(duì)混合數(shù)據(jù)流進(jìn)行再壓縮的方法并非理想的,因?yàn)樵賶嚎s是昂貴的操作,其由于眾多的附加處理步驟而要求附加裝置、造成附加音頻延時(shí)、并且增加了潛在故障模式數(shù)。
圖1是用于圖2中的示例混合裝置的示例環(huán)境的框圖。
圖2是用在圖1中的示例環(huán)境下的用來混合壓縮數(shù)字位流的示例混合裝置的框圖。
圖3描述了要利用圖2中的示例混合裝置處理的示例單聲道壓縮數(shù)字音頻位流。
圖4是例示了實(shí)現(xiàn)圖2中的示例混合裝置的示例方式的框圖。
圖5描述了通過圖4中的示例混合裝置對(duì)圖3中的示例單聲道壓縮數(shù)字音頻位流執(zhí)行的示例操作序列。
圖6描述了可用來實(shí)現(xiàn)圖4中的示例混合裝置的示例量化查找表。
圖7描述了要由圖4中的示例混合裝置處理的示例多聲道壓縮數(shù)字音頻位流。
圖8描述了要通過圖4中的示例混合裝置對(duì)圖7中的示例壓縮數(shù)字音頻位流執(zhí)行的示例操作序列。
圖9是表示要用來實(shí)現(xiàn)圖4中的示例混合裝置的示例處理的流程圖。
圖10是表示用于圖9中的示例處理的第一示例修改處理的流程圖。
圖11是表示用于圖9中的示例處理并適于對(duì)圖3或圖7中的示例壓縮數(shù)字音頻位流進(jìn)行操作的第二示例修改處理的流程圖。
圖12描述了用在圖1中的示例環(huán)境下的另選示例混合裝置。
圖13是表示可用來實(shí)現(xiàn)圖12中的示例混合裝置的示例處理的流程圖。
圖14A至圖14B是表示對(duì)圖13中的示例處理的示例改進(jìn)的流程圖。
圖15是可用來實(shí)現(xiàn)圖2中的示例混合裝置的示例處理器系統(tǒng)的框圖。
具體實(shí)施例方式
總體上公開了用來對(duì)壓縮數(shù)字位流進(jìn)行組合的方法及裝置。本文公開的方法及裝置可用來在無需預(yù)先對(duì)壓縮數(shù)字位流進(jìn)行解壓縮的情況下對(duì)該壓縮數(shù)字位流進(jìn)行組合。因此,本文公開的方法及裝置無需對(duì)壓縮數(shù)字位流進(jìn)行多輪解壓縮/壓縮,多輪解壓縮/壓縮例如對(duì)于電視廣播網(wǎng)絡(luò)分支機(jī)構(gòu)來說通常是不可接受的,這是因?yàn)槎噍喗鈮嚎s/壓縮會(huì)嚴(yán)重劣化壓縮數(shù)字位流提供的媒體內(nèi)容的質(zhì)量。盡管這里給出的示例關(guān)注對(duì)各自承載音頻內(nèi)容的兩個(gè)數(shù)字位流的混合,但是所公開的方法和裝置可更一般地應(yīng)用于按照任意適當(dāng)方式組合按照任意適當(dāng)格式承載任意類型內(nèi)容的任意數(shù)量的數(shù)字?jǐn)?shù)據(jù)流。
例如,在廣播之前,本文公開的方法和裝置可用來對(duì)與根據(jù)數(shù)字音頻壓縮標(biāo)準(zhǔn)(例如,AC-3壓縮標(biāo)準(zhǔn))格式化的壓縮主數(shù)字位流相關(guān)聯(lián)的改進(jìn)離散余弦變換(MDCT)系數(shù)集進(jìn)行解包??尚薷慕?jīng)解包的MDCT系數(shù)集的尾數(shù)來將輔助數(shù)字位流與主壓縮數(shù)字位流相混合。可對(duì)所得經(jīng)修改的MDCT系數(shù)再打包以形成用來傳輸?shù)揭粋€(gè)或更多個(gè)媒體消費(fèi)點(diǎn)的壓縮混合數(shù)字位流。按照這種方式,可將輔助數(shù)字位流直接與壓縮版主數(shù)字位流相混合,而無需對(duì)壓縮主數(shù)字位流進(jìn)行解壓縮并隨后對(duì)混合數(shù)字位流進(jìn)行再壓縮。
參照?qǐng)D1,示例使用環(huán)境100例示了示例混合裝置110在包括廣播網(wǎng)絡(luò)供應(yīng)商120和服務(wù)于多個(gè)本地媒體消費(fèi)點(diǎn)140的本地服務(wù)供應(yīng)商130的廣播系統(tǒng)中的操作。廣播網(wǎng)絡(luò)供應(yīng)商120可以是能夠向一個(gè)或更多個(gè)本地服務(wù)供應(yīng)商130提供廣播內(nèi)容的任意類型的廣播網(wǎng)絡(luò)供應(yīng)商。例如,廣播網(wǎng)絡(luò)供應(yīng)商120可對(duì)與電視節(jié)目、廣播節(jié)目、體育賽事、新聞廣播等相對(duì)應(yīng)的音頻、視頻和/或多媒體內(nèi)容進(jìn)行打包,以傳輸?shù)奖镜胤?wù)供應(yīng)商130用于隨后傳輸?shù)教囟ū镜胤?wù)供應(yīng)商130所服務(wù)的本地媒體消費(fèi)點(diǎn)140。在很多情形下,廣播網(wǎng)絡(luò)供應(yīng)商120生成的音頻、視頻和/或多媒體內(nèi)容是適于廣大聽眾消費(fèi)的一般內(nèi)容。在這種情況下,本地服務(wù)供應(yīng)商130可剪輯廣播網(wǎng)絡(luò)供應(yīng)商120提供的一般內(nèi)容,以供與本地媒體消費(fèi)點(diǎn)140相關(guān)聯(lián)的特定本地聽眾進(jìn)行消費(fèi)。
本地服務(wù)供應(yīng)商130例如可由任何服務(wù)供應(yīng)商來實(shí)現(xiàn),例如本地有線電視服務(wù)供應(yīng)商、本地射頻(RF)電視服務(wù)供應(yīng)商、本地?zé)o線電廣播供應(yīng)商等。本地服務(wù)供應(yīng)商130經(jīng)由接收器150從廣播網(wǎng)絡(luò)供應(yīng)商120接收廣播內(nèi)容。接收器150可由基于廣播網(wǎng)絡(luò)供應(yīng)商120與本地服務(wù)供應(yīng)商130之間的通信鏈路的任意適合類型的接收器來實(shí)現(xiàn),例如衛(wèi)星接收器、高速數(shù)字網(wǎng)絡(luò)接收器等。另外,本地服務(wù)供應(yīng)商130可生成要與接收器150接收到的廣播內(nèi)容相混合的本地內(nèi)容160,例如用以剪輯廣播內(nèi)容以供與本地媒體消費(fèi)點(diǎn)140相關(guān)聯(lián)的特定本地聽眾進(jìn)行消費(fèi)。將經(jīng)由接收器150接收到的廣播內(nèi)容和本地內(nèi)容160施加給混合裝置110,以生成混合廣播內(nèi)容用來經(jīng)由發(fā)送器170廣播到本地媒體消費(fèi)點(diǎn)140。發(fā)送器170可采用適于本地服務(wù)供應(yīng)商130的任意適合類型的發(fā)送器來實(shí)現(xiàn),例如有線電視發(fā)送器、RF電視發(fā)送器、廣播無線電發(fā)送器等。
盡管示例使用環(huán)境100將混合裝置110示出為與本地服務(wù)供應(yīng)商130相結(jié)合地進(jìn)行操作以將來自廣播網(wǎng)絡(luò)供應(yīng)商120的內(nèi)容與本地內(nèi)容160相混合,但是也可以采用其他使用環(huán)境。例如,可由廣播網(wǎng)絡(luò)供應(yīng)商120使用混合裝置110來混合來自多個(gè)源的內(nèi)容,用以生成要提供給本地服務(wù)供應(yīng)商130的廣播內(nèi)容。另外或另選的是,可由本地服務(wù)供應(yīng)商130使用混合裝置110來混合來自多個(gè)源的內(nèi)容用以生成本地內(nèi)容160。更一般的是,混合裝置110可用在要將來自多個(gè)源的內(nèi)容相混合以生成所得混合內(nèi)容的任意情形下。
圖2示出了示例混合裝置200,該示例混合裝置200被配置為將非壓縮輔助數(shù)字位流210與壓縮主數(shù)字位流220相混合以生成所得壓縮混合數(shù)字位流230。可使用示例混合裝置200來例如在如下情況下實(shí)現(xiàn)圖1中的示例混合裝置110將本地內(nèi)容160格式化為非壓縮數(shù)字位流(例如,對(duì)應(yīng)于非壓縮輔助數(shù)字位流210),并將廣播網(wǎng)絡(luò)供應(yīng)商120提供的廣播內(nèi)容格式化為壓縮數(shù)字位流(例如,對(duì)應(yīng)于壓縮主數(shù)字位流220)。壓縮主數(shù)字位流220例如可根據(jù)諸如AC-3壓縮標(biāo)準(zhǔn)和/或MPEG-AAC壓縮標(biāo)準(zhǔn)(可采用其中任一種來利用來自各個(gè)塊的預(yù)定數(shù)量的數(shù)字化樣本對(duì)音頻信號(hào)塊進(jìn)行處理)的音頻壓縮標(biāo)準(zhǔn)來壓縮。如下所述,可以以例如48千赫茲(kHz)的采樣率來對(duì)壓縮數(shù)字位流220的源(未示出)進(jìn)行采樣以形成音頻塊。
通常,音頻壓縮技術(shù)(例如基于AC-3壓縮標(biāo)準(zhǔn)的音頻壓縮技術(shù))采用交疊音頻塊和MDCT算法來將音頻信號(hào)轉(zhuǎn)換為壓縮數(shù)字位流(例如,圖2中的壓縮主數(shù)字位流220)??筛鶕?jù)采樣的音頻信號(hào)的動(dòng)態(tài)特性來使用兩種不同的塊尺寸(即,短塊和長(zhǎng)塊)。例如,可采用AC-3短塊來最小化音頻信號(hào)的瞬態(tài)片段的預(yù)回聲,并可采用AC-3長(zhǎng)塊來實(shí)現(xiàn)音頻信號(hào)的非瞬態(tài)片段的高壓縮增益。根據(jù)AC-3壓縮標(biāo)準(zhǔn),AC-3長(zhǎng)塊對(duì)應(yīng)于512時(shí)域音頻樣本的塊,而AC-3短塊對(duì)應(yīng)于256時(shí)域音頻樣本。基于用在AC-3壓縮標(biāo)準(zhǔn)中的MDCT算法的交疊結(jié)構(gòu),在AC-3長(zhǎng)塊的情況下,通過將先前(舊)256時(shí)域樣本塊與當(dāng)前(新)256時(shí)域樣本塊連接起來而獲得512個(gè)時(shí)域樣本,以生成512時(shí)域樣本的音頻塊。然后采用MDCT算法來對(duì)AC-3長(zhǎng)塊進(jìn)行變換以生成256個(gè)變換系數(shù)。根據(jù)同一標(biāo)準(zhǔn),同樣從一對(duì)連續(xù)時(shí)域樣本音頻塊獲得AC-3短塊。然后采用MDCT算法來對(duì)AC-3短塊進(jìn)行變換以生成128個(gè)變換系數(shù)。然后對(duì)與兩個(gè)相鄰短塊相對(duì)應(yīng)的128個(gè)變換系數(shù)進(jìn)行交織以生成一組256個(gè)變換系數(shù)。由此,對(duì)AC-3長(zhǎng)塊或AC-3短塊的處理得到了相同數(shù)量的MDCT系數(shù)。作為另一示例,根據(jù)MPEG-AAC壓縮標(biāo)準(zhǔn),短塊包含128個(gè)樣本,而長(zhǎng)塊包含1024個(gè)樣本。
圖3例示了要由圖2中的示例混合裝置200處理為壓縮主數(shù)字位流220的示例單聲道壓縮數(shù)字位流的格式300。格式300基于包括多個(gè)256樣本時(shí)域音頻塊310(概括地示為A0、A1、A2、A3、A4和A5)的非壓縮數(shù)字位流。MDCT算法處理音頻塊310以生成MDCT系數(shù)集320(通過示例的方式將其示出為MA0、MA1、MA2、MA3、MA4和MA5(其中MA5未示出))。例如,MDCT算法可處理音頻塊A0和A1以生成MDCT系數(shù)集MA0。將音頻塊A0和A1連接起來生成512樣本音頻塊(例如,AC-3長(zhǎng)塊),采用MDCT算法對(duì)該512樣本音頻塊進(jìn)行MDCT變換以生成包含256個(gè)MDCT系數(shù)的MDCT系數(shù)集MA0。同樣,可對(duì)音頻塊A1和A2進(jìn)行處理以生成MDCT系數(shù)集MA1。由此,音頻塊A1是交疊音頻塊,因?yàn)槠溆脕砩蒑DCT系數(shù)集MA0和MA1兩者。按照類似的方式,采用MDCT算法來對(duì)音頻塊A2和A3進(jìn)行變換以生成MDCT系數(shù)集MA2,對(duì)音頻塊A3和A4進(jìn)行變換以生成MDCT系數(shù)集MA3,對(duì)音頻塊A4和A5進(jìn)行變換以生成MDCT系數(shù)集MA4,等等。由此,音頻塊A2是用來生成MDCT系數(shù)集MA1和MA2的交疊音頻塊,音頻塊A3是用來生成MDCT系數(shù)集MA2和MA3的交疊音頻塊,音頻塊A4是用來生成MDCT系數(shù)集MA3和MA4的交疊音頻塊,等等。合起來說,將MDCT系數(shù)集320打包以形成圖2中的壓縮數(shù)字位流220。
圖4例示了圖2中的混合裝置200的示例實(shí)現(xiàn)。在圖4的示例中,混合裝置200包括獲取單元410、解包單元420、修改單元430以及再打包單元440。盡管下面根據(jù)AC-3壓縮標(biāo)準(zhǔn)描述了混合裝置200的操作,但是可將混合裝置200實(shí)現(xiàn)為例如根據(jù)另外的和/或其他壓縮標(biāo)準(zhǔn)(例如,MPEG-AAC壓縮標(biāo)準(zhǔn))進(jìn)行操作。將利用圖5的示例更詳細(xì)描述混合裝置200的操作。
獲取單元410被配置為獲取與壓縮數(shù)字位流220(示于圖2中)相關(guān)聯(lián)的一個(gè)或更多個(gè)幀510(示于圖5中),幀510的一部分通過示例的方式示出為圖5中的幀A和幀B。如前所述,壓縮數(shù)字位流220可以是根據(jù)AC-3標(biāo)準(zhǔn)壓縮的數(shù)字位流(下文中稱作“AC-3數(shù)據(jù)流”220)。盡管AC-3數(shù)據(jù)流220可包括多個(gè)聲道,但是為了清晰起見,以下的示例將AC-3數(shù)據(jù)流220描述為僅包括一個(gè)聲道。在AC-3數(shù)據(jù)流220中,各個(gè)幀510包括多個(gè)原始MDCT系數(shù)集520。根據(jù)AC-3壓縮標(biāo)準(zhǔn),例如,各個(gè)幀510包括六個(gè)原始MDCT系數(shù)集(即,六個(gè)“音頻塊”,其中各MDCT系數(shù)集對(duì)應(yīng)于一AC-3音頻塊)。例如,幀A包括原始MDCT系數(shù)集MA0、MA1、MA2、MA3、MA4和MA5,幀B包括原始MDCT系數(shù)集MB0、MB1、MB2、MB3、MB4和MB5。
獲取單元410還被配置為例如處理與各個(gè)幀510相關(guān)聯(lián)的頭信息,例如與AC-3數(shù)據(jù)流220相關(guān)聯(lián)的聲道數(shù)。盡管如上所述示例AC-3數(shù)據(jù)流220僅包括一個(gè)聲道,但是下面將關(guān)于圖7和圖8來描述具有多個(gè)聲道的示例壓縮數(shù)字位流。
返回到圖4和圖5,解包單元420被配置為對(duì)原始MDCT系數(shù)集520進(jìn)行解包來例如確定壓縮信息,例如原始?jí)嚎s處理的參數(shù)(即,音頻壓縮技術(shù)壓縮音頻信號(hào)或音頻數(shù)據(jù)以形成壓縮數(shù)字?jǐn)?shù)據(jù)流220的方式)。例如,解包單元420可確定采用多少位來表示原始MDCT系數(shù)集520內(nèi)的各個(gè)原始MDCT系數(shù)。另外,壓縮參數(shù)可包括限制AC-3數(shù)據(jù)流220可修改的程度以確保經(jīng)由AC-3數(shù)據(jù)流220傳送的媒體內(nèi)容質(zhì)量級(jí)足夠高的信息?;旌涎b置200隨后采用由解包單元420識(shí)別的壓縮信息來將非壓縮輔助數(shù)字位流210混合到AC-3數(shù)據(jù)流220中,從而確保按照與壓縮主數(shù)字位流220中提供的壓縮信息一致的方式來執(zhí)行混合操作。
如在AC-3壓縮標(biāo)準(zhǔn)中詳細(xì)描述的,采用尾數(shù)和指數(shù)來表示各個(gè)原始MDCT系數(shù)。AC-3壓縮標(biāo)準(zhǔn)采用能夠減少表示各個(gè)原始MDCT系數(shù)所用的位數(shù)的技術(shù)。心理聲學(xué)掩蔽是可被這些技術(shù)采用的一個(gè)因素。例如,在特定頻率k處存在音頻能量Ek(例如,聲調(diào))或者在特定頻率k附近的頻帶上的擴(kuò)展處存在音頻能量Ek(例如,類噪聲特性)都產(chǎn)生掩蔽效應(yīng)。也就是說,如果在特定頻率k處或在頻率k附近的頻帶上的擴(kuò)展處的頻域能量的變化小于給定能量閾值ΔEk,則人耳不能感知該變化。因?yàn)槿硕倪@一特性,可以用與ΔEk有關(guān)的步長(zhǎng)來量化與頻率k相關(guān)聯(lián)的MDCT系數(shù)mk,而不會(huì)造成給音頻內(nèi)容帶來任何可感知的變化的風(fēng)險(xiǎn)。對(duì)于AC-3數(shù)據(jù)流220,用尾數(shù)Mk和指數(shù)Xk來表示各原始MDCT系數(shù)mk,使得mk=Mk.2-Xk,其中2-Xk表示系數(shù)mk的量化步長(zhǎng)。用來表示原始MDCT系數(shù)集520中的各原始MDCT系數(shù)的尾數(shù)Mk的位數(shù)可基于在AC-3壓縮標(biāo)準(zhǔn)中公布的已知量化查找表(例如,圖6中的示例量化查找表600)來確定。在圖6的示例中,量化查找表600提供了由四位數(shù)表示的MDCT系數(shù)的尾數(shù)碼或位模式以及對(duì)應(yīng)的尾數(shù)值。如下面詳細(xì)描述的,尾數(shù)Mk可修改為表示將非壓縮輔助數(shù)字位流210與AC-3數(shù)據(jù)流220相混合而得到的MDCT系數(shù)。
返回到圖4和圖5,修改單元430被配置為對(duì)各原始MDCT系數(shù)集520執(zhí)行逆變換以生成時(shí)域音頻塊530,通過示例的方式將時(shí)域音頻塊530示出為TA0’,…,TA3”,TA4’,TA4”,TA5’,TA5”,TB0’,TB0”,TB1’,TB1”,…,以及TB5’(TA0”到TA3’以及TB2’到TB4”未示出)。修改單元430執(zhí)行逆變換操作以生成與被連接起來以形成AC-3數(shù)據(jù)流220的原始MDCT系數(shù)集520的多個(gè)256樣本時(shí)域音頻塊相關(guān)聯(lián)的先前(舊)時(shí)域音頻塊集(其被表示為上撇號(hào)塊)集和當(dāng)前(新)時(shí)域音頻塊(其被表示為秒號(hào)塊)集。例如,修改單元430對(duì)原始MDCT系數(shù)集MA5執(zhí)行逆變換以生成時(shí)域塊TA4”和TA5’,對(duì)原始MDCT系數(shù)集MB0執(zhí)行逆變換以生成TA5”和TB0’,對(duì)原始MDCT系數(shù)集MB1執(zhí)行逆變換以生成TB0”和TB1’,等等。然后,修改單元430生成重構(gòu)的時(shí)域音頻塊540,其提供對(duì)被壓縮以形成AC-3數(shù)據(jù)流220的原始時(shí)域音頻塊的重構(gòu)。為了生成重構(gòu)的時(shí)域音頻塊540,修改單元430可例如基于已知的Princen-Bradley時(shí)域混疊消除(TDAC)技術(shù)(如在Princen等人的“Analysis/Synthesis Filter Bank Design Based on Time Domain AliasingCancellation”,Institute of Electrical and Electronics Engineers(IEEE)Transactions on Acoustics,Speech and Signal Processing,Vol.ASSP-35,No.5,pp.1153-1161(1986)(在此通過引用并入其全部?jī)?nèi)容)中描述的)來相加時(shí)域音頻塊530。例如,修改單元430可通過采用Princen-Bradley TDAC技術(shù)來將上撇號(hào)時(shí)域音頻塊TA5’和秒號(hào)時(shí)域音頻塊TA5”相加,來重構(gòu)圖3中的時(shí)域音頻塊A5(對(duì)應(yīng)于TA5R)。同樣,修改單元430可通過采用Princen-Bradley TDAC技術(shù)來將上撇號(hào)音頻塊TB0’和秒號(hào)音頻塊TB0”相加,來重構(gòu)時(shí)域音頻塊B0(對(duì)應(yīng)于TB0R)。按照這種方式,對(duì)用來形成AC-3數(shù)據(jù)流220的原始時(shí)域音頻塊進(jìn)行重構(gòu)以使得非壓縮輔助數(shù)字位流210能夠被直接混合到AC-3數(shù)據(jù)流220中。
修改單元430還被配置為將非壓縮輔助數(shù)字位流210混合到重構(gòu)的時(shí)域音頻塊540中以生成混合時(shí)域音頻塊550,通過示例的方式將混合時(shí)域音頻塊550示出為TA0X、…、TA4X、TA5X、TB0X、TB1X、…、以及TB5X(塊TA1X、TA2X、TA3X、TB2X、TB3X以及TB4X未示出)。修改單元430可通過將非壓縮輔助數(shù)字位流210中包括的時(shí)域音頻樣本與所連接的重構(gòu)時(shí)域音頻塊540中的對(duì)應(yīng)時(shí)域音頻樣本相加來實(shí)現(xiàn)混合處理,以生成混合時(shí)域音頻塊550。另外,修改單元430可被配置為在相加操作之前,衰減非壓縮輔助數(shù)字位流210和重構(gòu)時(shí)域音頻塊540中的任一個(gè)或兩者中的時(shí)域音頻樣本。例如,在AC-3數(shù)據(jù)流220對(duì)應(yīng)于MAS且非壓縮輔助數(shù)字位流210對(duì)應(yīng)于AAS的情況下,修改單元430可被配置為在相加操作之前將與MAS相對(duì)應(yīng)的重構(gòu)時(shí)域音頻塊540中的時(shí)域樣本衰減一衰減因數(shù)(例如,3dB到10dB)。這種衰減將使得AAS成為混合音頻信號(hào)中的主導(dǎo)音頻分量,但仍使得MAS按較低但可感知的級(jí)別被聽到。
返回到圖4和圖5,基于混合時(shí)域音頻塊550,修改單元430生成中間混合MDCT系數(shù)集560,通過示例的方式將中間混合MDCT系數(shù)集560示出為MA0I、...、MA4I、MA5I、MB0I、...、以及MB5I(塊MA1I、MA2I、MA3I、MB1I、MB2I、MB3I以及MB4I未示出)。根據(jù)上述示例,修改單元430基于混合時(shí)域音頻塊TA5X和TB0X生成中間混合MDCT系數(shù)集MA5I。具體來說,修改單元430將混合時(shí)域音頻塊TA5X和TB0X連接起來以形成512樣本連接音頻塊,并將該512樣本連接音頻塊轉(zhuǎn)換為中間混合MDCT系數(shù)集MA5I,如下面將更詳細(xì)描述的,可采用該中間混合MDCT系數(shù)集MA5I來修改原始MDCT系數(shù)集MA5以生成輸出混合MDCT系數(shù)集MA5X。
原始MDCT系數(shù)集520與中間混合MDCT系數(shù)集560之差表示AC-3數(shù)據(jù)流220中與將非壓縮輔助數(shù)字位流210與AC-3數(shù)據(jù)流220相混合對(duì)應(yīng)的變化。因此,可以基于原始MDCT系數(shù)集520的格式并由此基于與原始MDCT系數(shù)集520相關(guān)聯(lián)的壓縮,生成輸出混合MDCT系數(shù)集570,通過示例的方式將輸出混合MDCT系數(shù)集570示出為MA0X、...、MA4X、MA5X、MB0X、...、以及MB5X(塊MA1X、MA2X、MA3X、MB1X、MB2X、MB3X以及MB4X未示出)。例如,關(guān)于圖6,修改單元430可采用與對(duì)應(yīng)的原始MDCT系數(shù)集MA5相關(guān)聯(lián)的指數(shù)以及基于對(duì)應(yīng)的中間混合MDCT系數(shù)集MA5I的尾數(shù),按照尾數(shù)及指數(shù)格式來表示混合MDCT系數(shù)集MA5X。此外,可采用與原始MDCT系數(shù)集520相對(duì)應(yīng)的量化查找表(即,圖6中的查找表600)來量化中間混合MDCT系數(shù)560的尾數(shù)值,以生成混合MDCT系數(shù)集570的MDCT系數(shù)的尾數(shù)值。本領(lǐng)域普通技術(shù)人員將認(rèn)識(shí)到,由于在非壓縮輔助數(shù)字位流210中的混合,故而得到的量化混合尾數(shù)值表示AC-3數(shù)據(jù)流220的變化或其增加。在該示例實(shí)施中,采用原始MDCT系數(shù)的指數(shù)來生成混合MDCT系數(shù)集570的對(duì)應(yīng)混合MDCT系數(shù)。改變指數(shù)可能需要重新計(jì)算基本壓縮信號(hào)表示,從而要求壓縮信號(hào)經(jīng)歷真正的解壓縮/壓縮輪回。為了避免解壓縮/壓縮輪回,如果僅對(duì)尾數(shù)的修改不足以完全表示混合的與原始的MDCT系數(shù)之差,則適當(dāng)?shù)貙⑹苡绊懙腗DCT尾數(shù)設(shè)置為最大或最小值。
轉(zhuǎn)向圖6,示例量化查找表600包括對(duì)-0.9333到+0.9333范圍內(nèi)的示例尾數(shù)Mk的十五級(jí)量化的尾數(shù)碼和尾數(shù)值。盡管示例量化查找表600提供了與用四位表示的MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)信息,但是AC-3壓縮標(biāo)準(zhǔn)提供了與每MDCT系數(shù)的其他適合位數(shù)相關(guān)聯(lián)的量化查找表。為了例示修改單元430可生成特定混合MDCT系數(shù)的一個(gè)示例方式,考慮原始MDCT系數(shù)集MA5中包含的尾數(shù)為Mk的原始MDCT系數(shù)mk。假設(shè)原始尾數(shù)值Mk為-0.2666(即,-4/15)。采用量化查找表600,將與原始MDCT系數(shù)集MA5中的原始MDCT系數(shù)mk相對(duì)應(yīng)的尾數(shù)碼確定為0101。接著,假設(shè)混合MDCT系數(shù)集MA5X包括尾數(shù)值為XMk的混合MDCT系數(shù)xmk。此外,假設(shè)對(duì)應(yīng)的中間混合MDCT系數(shù)集MA5I的中間尾數(shù)值為-0.4300,這處于尾數(shù)碼0011與0100之間。換言之,在該示例中將非壓縮輔助位流210與AC-3位流220相混合,得到原始尾數(shù)值-0.2666與混合尾數(shù)值-0.4300之間的差為-0.1667。
為了將非壓縮輔助位流210與AC-3數(shù)據(jù)流220相混合,修改單元430可將混合MDCT系數(shù)集MA5X表示為對(duì)原始MDCT系數(shù)集MA5中的原始MDCT系數(shù)的修改。繼續(xù)以上示例,因?yàn)榕c對(duì)應(yīng)的混合MDCT系數(shù)xmk相關(guān)聯(lián)的中間混合尾數(shù)處于尾數(shù)碼0011與0100之間(因?yàn)榕c混合MDCT系數(shù)xmk相對(duì)應(yīng)的中間尾數(shù)值為-0.4300),所以尾數(shù)碼0011或尾數(shù)碼0100可替代與MDCT系數(shù)mk相關(guān)聯(lián)的尾數(shù)碼0101來表示混合MDCT系數(shù)xmk。與尾數(shù)碼0011相對(duì)應(yīng)的尾數(shù)值為-0.5333(即,-8/15),與尾數(shù)碼0100相對(duì)應(yīng)的尾數(shù)值為-0.4(即,-6/15)。在該示例中,因?yàn)榕c尾數(shù)碼0100相對(duì)應(yīng)的尾數(shù)值-0.4最接近理想的中間混合尾數(shù)值-0.4300,所以修改單元430選擇尾數(shù)碼0100來表示混合MDCT系數(shù)xmk。結(jié)果,與混合MDCT系數(shù)xmk的混合尾數(shù)XMk相對(duì)應(yīng)的新的尾數(shù)位模式0100代替原始尾數(shù)位模式0101。同樣,可按照上述方式來修改原始MDCT系數(shù)集MA5中的各個(gè)原始MDCT系數(shù),以生成混合MDCT系數(shù)集MA5X中的對(duì)應(yīng)混合MDCI系數(shù)。此外,如果中間混合尾數(shù)值在尾數(shù)值的量化范圍之外(即,大于0.9333或小于-0.9333),適當(dāng)?shù)剡x擇正限1110或負(fù)限0000作為輸出混合尾數(shù)碼。另外,如上所討論的,盡管可如上所述地修改與原始MDCT系數(shù)集中的各原始MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)碼,但是在生成對(duì)應(yīng)的混合MDCT系數(shù)時(shí)仍保持與原始MDCT系數(shù)相關(guān)聯(lián)的指數(shù)不變。
返回到圖4和圖5,再打包單元440被配置為對(duì)與AC-3數(shù)據(jù)流220中的各個(gè)幀相關(guān)聯(lián)的混合MDCT系數(shù)集570進(jìn)行再打包以生成壓縮混合數(shù)字位流230。具體來說,再打包單元440識(shí)別各原始MDCT系數(shù)集520在AC-3數(shù)據(jù)流220的幀內(nèi)的位置,從而可基于修改所識(shí)別的原始MDCT系數(shù)集520來生成對(duì)應(yīng)的混合MDCT系數(shù)集570。為了重建混合版的幀A,例如,再打包單元440可識(shí)別原始MDCT系數(shù)集MA0到MA5的位置并對(duì)其進(jìn)行修改,以在對(duì)應(yīng)的識(shí)別位置處生成對(duì)應(yīng)的混合MDCT系數(shù)集MA0X到MA5X。采用本文描述的解包、修改以及再打包處理,AC-3數(shù)據(jù)流220在輔助數(shù)字位流210與其相混合的同時(shí)保持為壓縮數(shù)字位流。因此,混合裝置200無需另外的解壓縮/壓縮輪回(這可能劣化AC-3數(shù)據(jù)流220中的媒體內(nèi)容的質(zhì)量)而將輔助數(shù)字位流210與AC-3數(shù)據(jù)流220相混合。
為簡(jiǎn)便起見,關(guān)于圖5描述了包括單個(gè)聲道的AC-3數(shù)據(jù)流220。然而,如下關(guān)于圖7和圖8所描述的,本文描述的方法和裝置可應(yīng)用于具有與多個(gè)聲道相關(guān)聯(lián)的音頻塊(例如,5.1聲道音頻(即,五個(gè)全帶寬聲道和一個(gè)低頻效果聲道))的壓縮數(shù)字?jǐn)?shù)據(jù)流。在圖7的示例中,非壓縮數(shù)字位流格式700可包括多個(gè)音頻塊集710。各個(gè)音頻塊集710可包括與多個(gè)聲道(例如,包括左前聲道、中央聲道、右前聲道、左后聲道、右后聲道以及低頻效果(LFT)聲道(例如,超重低音炮聲道))相關(guān)聯(lián)的音頻塊720和730。例如,音頻塊集AUD0包括與左前聲道相關(guān)聯(lián)的音頻塊A0L、與中央聲道相關(guān)聯(lián)的音頻塊A0C、與右前聲道相關(guān)聯(lián)的音頻塊A0R、與左后聲道相關(guān)聯(lián)的音頻塊A0RL、與右后聲道相關(guān)聯(lián)的音頻塊A0RR、以及與LFE聲道相關(guān)聯(lián)的音頻塊A0LFE。類似地,音頻塊集AUD1包括與左前聲道相關(guān)聯(lián)的音頻塊A1L、與中央聲道相關(guān)聯(lián)的音頻塊A1C、與右前聲道相關(guān)聯(lián)的音頻塊A1R、與左后聲道相關(guān)聯(lián)的音頻塊A1RL、與右后聲道相關(guān)聯(lián)的音頻塊A1RR、以及與LFE聲道相關(guān)聯(lián)的音頻塊A1LFE。
可按照與上面關(guān)于圖3所述的方式類似的方式來壓縮音頻塊集710中與特定聲道相關(guān)聯(lián)的各個(gè)音頻塊。例如,可對(duì)圖8中的與中央聲道相關(guān)聯(lián)的音頻塊810(其與圖7中的中央聲道相對(duì)應(yīng),且通過示例的方式示出為A0C、A1C、A2C、以及A3C、...、A5C(A4C未示出))進(jìn)行變換,以生成與壓縮中央聲道數(shù)字位流800相關(guān)聯(lián)的MDCT系數(shù)集820。如上所述,各個(gè)MDCT系數(shù)集820可從通過連接先前(舊)256樣本音頻塊和當(dāng)前(新)256樣本音頻塊而形成的512樣本音頻塊中得出。MDCT算法然后可處理時(shí)域音頻塊810(例如,A0C到A5C)以生成MDCT系數(shù)集(例如,M0C到M5C)。
在包括將AAS與和5.1聲道音頻相對(duì)應(yīng)的MAS相混合的應(yīng)用中,可以優(yōu)選地將AAS數(shù)字位流與MAS 5.1聲道音頻位流的中央聲道相混合。在這種情況下,壓縮的中央聲道數(shù)字位流800對(duì)應(yīng)于圖2中的壓縮主數(shù)字位流220,并可采用圖4中的混合裝置200來將輔助數(shù)字位流210與壓縮中央聲道數(shù)字位流800相混合?;旌涎b置200可按照與以上關(guān)于圖5和圖6描述的處理類似的方式來執(zhí)行混合操作。例如,基于壓縮中央聲道數(shù)字位流800的MDCT系數(shù)集820,獲取單元410如上所述地獲取多個(gè)幀(未示出)以及與各個(gè)幀相關(guān)聯(lián)的頭信息。頭信息包括與壓縮中央聲道數(shù)字位流800相關(guān)聯(lián)的壓縮信息。對(duì)于各個(gè)幀,解包單元420對(duì)原始MDCT系數(shù)集820進(jìn)行解包以確定與原始MDCT系數(shù)集820相關(guān)聯(lián)的壓縮信息。例如,解包單元420可識(shí)別原始?jí)嚎s處理表示各個(gè)原始MDCT系數(shù)集820中的各個(gè)原始MDCT系數(shù)的尾數(shù)所用的位數(shù)??刹捎眠@種壓縮信息來如以上關(guān)于圖5和圖6描述地將輔助數(shù)字位流210與壓縮中央聲道數(shù)字位流800相混合。修改單元430然后生成經(jīng)逆變換的時(shí)域音頻塊830,通過示例的方式將其示出為TA0C”、TA1C’、TA1C”、TA2C’、TA2C”以及TA3C’。時(shí)域音頻塊830包括先前(舊)時(shí)域音頻塊(其表示為上撇號(hào)塊)集和當(dāng)前(新)時(shí)域音頻塊(其表示為秒號(hào)塊)集。通過例如基于Princen-Bradley TDAC技術(shù)來將對(duì)應(yīng)上撇號(hào)塊和秒號(hào)塊相加,可對(duì)被壓縮以形成壓縮中央聲道數(shù)字位流800的原始時(shí)域音頻塊進(jìn)行重構(gòu)以形成重構(gòu)時(shí)域音頻塊840。例如,修改單元430可將時(shí)域音頻塊TA1C’和TA1C”相加來重構(gòu)時(shí)域音頻塊A1C(即,TA1CR)。同樣,修改單元430可將時(shí)域音頻塊TA2C’和TA2C”相加來重構(gòu)時(shí)域音頻塊A2C(即,TA2CR)。
為了將輔助數(shù)字位流210與壓縮中央聲道數(shù)字位流800相混合,修改單元430將輔助數(shù)字位流210與重構(gòu)時(shí)域音頻塊840相混合以生成混合時(shí)域音頻塊850。例如,修改單元430可將輔助數(shù)字位流210混合到重構(gòu)時(shí)域音頻塊TA1CR中以生成混合時(shí)域音頻塊TA1CX。
基于混合時(shí)域音頻塊850,修改單元430可生成混合MDCT系數(shù)集860。例如,修改單元430可將混合時(shí)域音頻塊TA1CX和TA2CX連接起來以生成與混合MDCT系數(shù)M1CX相對(duì)應(yīng)的中間混合MDCT系數(shù)集M1CI(未示出)。如以上關(guān)于圖5和圖6所討論的,修改單元430基于中間混合MDCT系數(shù)(未示出)修改原始MDCT系數(shù)集820來生成對(duì)應(yīng)的混合MDCT系數(shù)集860。例如,修改單元430可采用混合MDCT系數(shù)集M1CI的理想值來修改MDCT系數(shù)集M1C的原始尾數(shù)以生成混合MDCT系數(shù)集M1CX。再打包單元440然后可對(duì)混合MDCT系數(shù)集860再打包以生成對(duì)應(yīng)于將輔助數(shù)字位流210與壓縮中央聲道數(shù)字位流800相混合的壓縮混合數(shù)字位流230。
圖9到圖11示出了表示用于實(shí)現(xiàn)圖4中的示例混合裝置200的示例處理的流程圖。在這些示例中,流程圖所表示的處理可以由可機(jī)讀指令集來實(shí)現(xiàn),該可機(jī)讀指令集可包括由處理器(例如在下面關(guān)于圖15討論的示例計(jì)算機(jī)2000中示出的處理器2020)執(zhí)行的一個(gè)或更多個(gè)程序。一個(gè)或更多個(gè)處理可以用存儲(chǔ)在諸如CD-ROM、軟盤、硬盤驅(qū)動(dòng)器、DVD或與處理器2020相關(guān)聯(lián)的存儲(chǔ)器2030的有形介質(zhì)上的軟件來實(shí)現(xiàn),但是本領(lǐng)域普通技術(shù)人員將容易理解,所述一個(gè)或更多個(gè)程序以及/或者其部分另選地可由除處理器2020以外的裝置來執(zhí)行,并且/或者可以以廣為公知的方式用固件或?qū)S糜布韺?shí)現(xiàn)。例如,混合裝置200、獲取單元410、解包單元420、修改單元430和/或再打包單元440中的任一個(gè)或全部可由軟件、硬件和/或固件的任意組合來實(shí)現(xiàn)。此外,盡管參照?qǐng)D9到圖11中例示的流程圖描述了示例處理,但是本領(lǐng)域普通技術(shù)人員將容易理解,可另選地采用實(shí)現(xiàn)本文描述的示例方法和裝置的很多其他方法。例如,參照?qǐng)D9到圖11中例示的流程圖,可改變塊的執(zhí)行順序,并且/或者可對(duì)所描述的塊的一部分進(jìn)行改變、刪除、組合和/或?qū)⑵浼?xì)分為多個(gè)塊。
圖9中示出了例示用以實(shí)現(xiàn)圖4中的示例混合裝置200的示例處理900的流程圖。在圖9的示例中,示例處理900開始于塊905,在塊905處獲取裝置410獲取與圖2中的非壓縮輔助數(shù)字位流210(其對(duì)應(yīng)于AAS)相關(guān)聯(lián)的幀(以下在對(duì)圖9到圖11的描述中將其稱為“非壓縮AAS幀”)。接著,控制進(jìn)行到塊910,在塊910處獲取單元410獲取與壓縮主數(shù)字位流220(其對(duì)應(yīng)于MAS)相關(guān)聯(lián)的幀(以下在對(duì)圖9到圖11的描述中將其稱作“壓縮MAS幀”),例如圖5中的幀A。獲得的壓縮MAS幀可包括通過交疊并連接多個(gè)音頻塊而形成的多個(gè)原始MDCT系數(shù)集。根據(jù)AC-3壓縮標(biāo)準(zhǔn),例如,壓縮MAS幀可包括六個(gè)MDCT系數(shù)集(即,六個(gè)“音頻塊”,其中各MDCT系數(shù)集對(duì)應(yīng)于一AC-S音頻塊),例如圖5中的原始MDCT系數(shù)集520。在塊910處獲得壓縮MAS幀之后,控制進(jìn)行到塊920,在塊920處獲取單元410還識(shí)別與壓縮MAS幀相關(guān)聯(lián)的頭信息。例如,獲取單元410可確定與對(duì)應(yīng)于所獲得MAS幀的壓縮主數(shù)字位流220相關(guān)聯(lián)的聲道數(shù)。
然后控制進(jìn)行到塊930,在塊930處解包單元420對(duì)包括在獲得的壓縮MAS幀中的多個(gè)原始MDCT系數(shù)集520進(jìn)行解包,以確定與用來生成壓縮MAS幀的原始?jí)嚎s處理相關(guān)聯(lián)的壓縮信息。具體來說,解包單元420識(shí)別各原始MDCT系數(shù)集520中的各原始MDCT系數(shù)mk的尾數(shù)Mk和指數(shù)Xk。然后按照依照AC-3壓縮標(biāo)準(zhǔn)的方式將原始MDCT系數(shù)的指數(shù)集合起來。解包單元420還確定用來表示各原始MDCT系數(shù)的尾數(shù)的位數(shù),從而可采用AC-3壓縮標(biāo)準(zhǔn)規(guī)定的適合量化查找表來如以上關(guān)于圖6所述地修改多個(gè)原始MDCT系數(shù)集。然后控制進(jìn)行到塊940以實(shí)現(xiàn)修改處理,下面將關(guān)于圖10對(duì)其進(jìn)行更詳細(xì)的描述。
如在圖10中所例示的,修改處理940開始于塊1010,在塊1010處修改單元430對(duì)原始MDCT系數(shù)集520執(zhí)行逆變換以生成諸如時(shí)域音頻塊530的經(jīng)逆變換的時(shí)域音頻塊。具體來說,修改單元430生成與用來生成對(duì)應(yīng)原始MDCT系數(shù)集的各256樣本原始時(shí)域音頻塊530相關(guān)聯(lián)的先前(舊)時(shí)域音頻塊(其例如表示為圖5中的上撇號(hào)塊)和當(dāng)前(新)時(shí)域音頻塊(其表示為圖5中的秒號(hào)塊)。如以上關(guān)于圖5所描述的,例如,修改單元430可從MDCT系數(shù)集MA5生成TA4”和TA5’、從MDCT系數(shù)集MB0生成TA5”和TB0’、并且從MDCT系數(shù)集MB1生成TB0”和TB1’。然后控制進(jìn)行到塊1020,在塊1020處修改單元430基于例如Princen-Bradley TDAC技術(shù)對(duì)相應(yīng)的舊塊和新塊進(jìn)行相加來重構(gòu)時(shí)域音頻塊,以生成重構(gòu)的時(shí)域音頻塊,例如圖5中的重構(gòu)時(shí)域音頻塊540。根據(jù)以上示例,可將舊塊TA5’和新塊TA5”相加來重構(gòu)時(shí)域音頻塊A5(即,經(jīng)重構(gòu)時(shí)域音頻塊TA5R),同時(shí)可將上撇號(hào)塊TB0’和秒號(hào)塊TB0”相加來重構(gòu)時(shí)域音頻塊B0(即,經(jīng)重構(gòu)時(shí)域音頻塊TB0R)。
為了將在圖9的塊905處獲得的非壓縮AAS幀與在塊910處獲得的壓縮MAS幀相混合,控制進(jìn)行到塊1040,在塊1040處修改單元430將非壓縮AAS幀與從壓縮MAS幀得到的重構(gòu)時(shí)域音頻塊相混合。例如,修改單元430可將來自非壓縮AAS幀的樣本加入到重構(gòu)時(shí)域音頻塊TA5R中,以生成圖5中的混合時(shí)域音頻塊TA5X。修改單元430還可在進(jìn)行相加處理以生成混合時(shí)域音頻塊550之前,衰減與壓縮MAS幀或非壓縮AAS幀相對(duì)應(yīng)的重構(gòu)時(shí)域音頻塊中的任一個(gè)或兩者。然后控制進(jìn)行到塊1050,在塊1050處基于混合時(shí)域音頻塊550,修改單元430生成中間混合MDCT系數(shù)集,例如圖5中的中間混合MDCT系數(shù)集560。如上所述,可采用兩個(gè)混合時(shí)域音頻塊550(其中每一個(gè)塊都包括256個(gè)樣本)來生成中間混合MDCT系數(shù)集560。例如,可連接混合時(shí)域音頻塊TA5X和TB0X,然后用其來生成中間混合MDCT系數(shù)集MA5I。
接著,控制進(jìn)行到塊1060,在塊1060處修改單元430基于修改與在圖9的塊910處獲得的壓縮MAS幀相對(duì)應(yīng)的原始MDCT系數(shù)集520來確定輸出混合MDCT系數(shù)集570。例如,基于在圖9的塊930處確定的并與和壓縮MAS幀相對(duì)應(yīng)的壓縮數(shù)字?jǐn)?shù)據(jù)流220相關(guān)聯(lián)的壓縮信息,修改單元430如以上關(guān)于圖4至圖6所描述地計(jì)算與混合MDCT系數(shù)集MA5X中的各混合MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)值。按照這種方式,修改單元430可修改原始MDCT系數(shù)集520,以確定表示對(duì)應(yīng)于非壓縮AAS幀的輔助數(shù)字位流210與對(duì)應(yīng)于壓縮MAS幀的壓縮主數(shù)字位流220的混合的混合MDCT系數(shù)集570。根據(jù)以上示例,修改單元430可基于中間混合MDCT系數(shù)集MA5I來修改原始MDCT系數(shù)集MA5以確定混合MDCT系數(shù)集MA5X的表示。例如,修改單元430可用中間混合MDCT系數(shù)集MA5I中的對(duì)應(yīng)中間混合MDCT系數(shù)的量化中間尾數(shù)來替代MDCT系數(shù)集MA5中的原始MDCT系數(shù)的尾數(shù),以生成混合MDCT系數(shù)集MA5X中的混合MDCT系數(shù)。另選的是,修改單元430可計(jì)算與原始MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)碼和與對(duì)應(yīng)的中間混合MDCT系數(shù)相關(guān)聯(lián)的尾數(shù)碼之間的差,并基于該差修改原始MDCT系數(shù)以生成輸出混合MDCT系數(shù)集。在另一情況下,在修改原始MDCT系數(shù)集以生成混合MDCT系數(shù)集之后,修改處理940結(jié)束并返回控制到圖9中的塊950。
返回到圖9,在塊950處再打包單元440對(duì)混合MDCT系數(shù)集570進(jìn)行再打包以生成壓縮混合數(shù)字位流230。再打包單元440識(shí)別MDCT系數(shù)集在幀內(nèi)的位置,從而可在原始MDCT系數(shù)集的位置處代入混合MDCT系數(shù)集來重建該幀。然后控制進(jìn)行到塊955,在塊955處再打包單元440輸出所得再打包的幀以生成壓縮混合數(shù)字位流230。然后,在塊960處,如果混合裝置200確定需要處理壓縮主數(shù)字位流220的另外的幀,則控制返回到塊910。然而如果已處理了壓縮主數(shù)字位流220中的全部幀,則處理900結(jié)束。
如上所述,已知的混合技術(shù)通常將壓縮主數(shù)字位流解壓縮為非壓縮時(shí)域樣本、將輔助數(shù)字位流與非壓縮主數(shù)字位流相混合、并且將混合時(shí)域樣本再壓縮為壓縮混合數(shù)字位流。相對(duì)的是,在圖9的示例處理900中,壓縮主數(shù)字位流220在本文描述的示例解包、修改以及再打包處理期間保持為壓縮。因此,無需另外的解壓縮/壓縮輪回(這可能劣化壓縮混合數(shù)字位流230中的內(nèi)容的質(zhì)量),就可將輔助數(shù)字位流210混合到壓縮主數(shù)字位流220中。
為了進(jìn)一步例示圖9和圖10中的示例修改處理940,圖11描述了AC-3數(shù)據(jù)幀修改處理940的詳細(xì)流程圖,該AC-3數(shù)據(jù)幀修改處理940用來修改MAS壓縮數(shù)字位流220的AC-3數(shù)據(jù)幀以反映MAS數(shù)字位流220與AAS數(shù)字位流210的混合。示例AC-3數(shù)據(jù)幀修改處理940開始于塊1110,混合裝置200的解包單元420讀取例如在圖9的塊930處確定的所獲AC-3幀的壓縮信息。接著,控制進(jìn)行到塊1120,在塊1120處修改單元430將MDCT系數(shù)集計(jì)數(shù)初始化為零。在正在處理AC-3幀的情況下,各AC-3幀包括具有壓縮域數(shù)據(jù)的六個(gè)MDCT系數(shù)集(例如,圖5中的MA0、MA1、MA2、MA3、MA4和MA5,在AC-3標(biāo)準(zhǔn)中它們還公知為“音頻塊”)。因此,在塊1130處,混合裝置200的修改單元430確定MDCT系數(shù)集計(jì)數(shù)是否等于六。
如果在塊1130處MDCT系數(shù)集計(jì)數(shù)還未等于六,從而表示至少一個(gè)以上的MDCT系數(shù)集需要進(jìn)行處理,則控制進(jìn)行到塊1140和1150,在塊1140和1150處修改單元430分別提取與對(duì)應(yīng)于MAS壓縮數(shù)字位流220的AC-3數(shù)據(jù)幀的原始MDCT系數(shù)相關(guān)聯(lián)的指數(shù)和尾數(shù)(例如,以上關(guān)于圖6描述的原始尾數(shù)Mk)。然后控制進(jìn)行到塊1154,在塊1154處修改單元430根據(jù)以上圖5和圖6的示例并基于所提取的尾數(shù)和指數(shù),來重構(gòu)與MAS壓縮數(shù)字位流220的AC-3數(shù)據(jù)幀相對(duì)應(yīng)的時(shí)域音頻塊。接著,在塊1158處,修改單元430將重構(gòu)MAS時(shí)域音頻塊與AAS數(shù)字位流210的對(duì)應(yīng)音頻塊相混合。修改單元430可在將對(duì)應(yīng)塊相加起來以執(zhí)行混合處理之前,衰減重構(gòu)MAS時(shí)域音頻塊或AAS時(shí)域音頻塊中的任一個(gè)或兩者。需要進(jìn)行衰減例如來得到MAS的音頻內(nèi)容與AAS的音頻內(nèi)容之間的理想音頻幅值關(guān)系。在典型的情形下,MAS可被衰減3到10dB的因數(shù),以使得AAS中包括的畫外音內(nèi)容可在MAS的音頻內(nèi)容外被聽到。
接著,控制進(jìn)行到塊1160,在塊1160處修改單元430計(jì)算與在塊1158處生成的所得混合時(shí)域音頻塊相關(guān)聯(lián)的新(中間)混合尾數(shù)值。然后控制進(jìn)行到塊1170,在塊1170處修改單元430通過修改與和MAS壓縮數(shù)字位流220相對(duì)應(yīng)的AC-3數(shù)據(jù)幀的原始MDCT系數(shù)相關(guān)聯(lián)的原始尾數(shù)來生成最終的混合尾數(shù)。例如,可通過基于與MAS壓縮數(shù)字位流220的原始MDCT系數(shù)相關(guān)聯(lián)的壓縮信息對(duì)新混合尾數(shù)進(jìn)行量化來確定最終混合尾數(shù)(但是限于與原始尾數(shù)的位表示相關(guān)聯(lián)的范圍內(nèi))。然后控制進(jìn)行到塊1180,在塊1180處修改單元430將MDCT系數(shù)集計(jì)數(shù)遞增1,控制返回到塊1130。
盡管以上描述的圖11的示例處理包括六個(gè)MDCT系數(shù)集(例如,MDCT系數(shù)集計(jì)數(shù)的閾值為六),但是相反可采用使用更多或更少M(fèi)DCT系數(shù)集的處理。然而,在圖11的示例中,如果在塊1130處MDCT系數(shù)集計(jì)數(shù)等于六,則處理了全部MDCT系數(shù)集,使得完成了對(duì)當(dāng)前幀的混合處理。然后控制進(jìn)行到例如圖9的塊950以進(jìn)行后續(xù)的處理。
圖12描述了另選示例混合裝置1200,該示例混合裝置1200被配置為將壓縮輔助數(shù)字位流1210與壓縮主數(shù)字位流1220相混合以生成所得壓縮混合數(shù)字位流1230。例如在將本地內(nèi)容160格式化為壓縮數(shù)字位流(例如,對(duì)應(yīng)于壓縮輔助數(shù)字位流1210)并且將廣播網(wǎng)絡(luò)供應(yīng)商120提供的廣播內(nèi)容格式化為壓縮數(shù)字位流(例如,對(duì)應(yīng)于壓縮主數(shù)字位流1220)的情況下,可采用圖12中的示例混合裝置1200來實(shí)現(xiàn)圖1中的示例混合裝置110。與對(duì)圖2中的壓縮主數(shù)字位流220一樣,例如可根據(jù)諸如AC-3壓縮標(biāo)準(zhǔn)和/或MPEG-AAC壓縮標(biāo)準(zhǔn)(可采用其中的任一種來利用來自各塊的預(yù)定數(shù)量的數(shù)字化樣本對(duì)音頻信號(hào)塊進(jìn)行處理)的音頻壓縮標(biāo)準(zhǔn)來對(duì)壓縮主數(shù)字位流1220和壓縮輔助位流1210進(jìn)行壓縮??梢砸岳?8千赫茲(kHz)的采樣率來對(duì)壓縮數(shù)字位流1210和1220的源(未示出)進(jìn)行采樣以形成如以上關(guān)于圖3和圖7的示例描述的音頻塊。
圖13和圖14A至圖14B示出了表示用于實(shí)現(xiàn)圖12的示例混合裝置1200的示例處理的流程圖。在這些示例中,流程圖所表示的處理可以由可機(jī)讀指令集來實(shí)現(xiàn),該可機(jī)讀指令集可包括由處理器(例如在下面關(guān)于圖15討論的示例計(jì)算機(jī)2000中示出的處理器2020)執(zhí)行的一個(gè)或更多個(gè)程序。一個(gè)或更多個(gè)處理可以用存儲(chǔ)在諸如CD-ROM、軟盤、硬盤、DVD或與處理器2020相關(guān)聯(lián)的存儲(chǔ)器2030的有形介質(zhì)上的軟件來實(shí)現(xiàn),但是本領(lǐng)域普通技術(shù)人員將容易理解,所述一個(gè)或更多個(gè)程序以及/或者其一部分另選地可由除處理器2020以外的裝置來執(zhí)行,并且/或者可以以廣為人知的方式用固件或?qū)S糜布韺?shí)現(xiàn)。例如,混合裝置1200的全部或部分可由軟件、硬件和/或固件的任意組合來實(shí)現(xiàn)。此外,盡管參照?qǐng)D13和圖14A至圖14B例示的流程圖描述了示例處理,但是本領(lǐng)域普通技術(shù)人員將容易理解,可另選地采用實(shí)現(xiàn)本文描述的示例方法和裝置的很多其他方法。例如,參照?qǐng)D13和圖14A至圖14B中例示的流程圖,可改變塊的執(zhí)行順序,并且/或者可對(duì)所描述的塊的一部分進(jìn)行改變、刪除、組合和/或?qū)⑵浼?xì)分為多個(gè)塊。
圖13中示出了例示用以實(shí)現(xiàn)圖12的示例混合裝置1200的示例處理1300的流程圖。如下面將更詳細(xì)地描述的,為了在根據(jù)圖13的示例的壓縮域中將與壓縮輔助數(shù)字位流1210相關(guān)聯(lián)的AAS源和與壓縮主數(shù)字位流1220相關(guān)聯(lián)的MAS源相組合,在AAS有效期間,將與AAS相關(guān)聯(lián)的壓縮音頻幀視為主要音頻源。然后對(duì)MAS音頻幀進(jìn)行解包以獲得其MDCT系數(shù)。在衰減(通常衰減10dB因數(shù))之后,采用從包括在對(duì)應(yīng)AAS幀中的壓縮信息獲得的步長(zhǎng)對(duì)MAS MDCT系數(shù)進(jìn)行重新量化。該量化得到AAS幀中的各MDCT系數(shù)的尾數(shù)變化值。實(shí)現(xiàn)對(duì)AAS幀中的AAS尾數(shù)的這些變化,得到將較低音量級(jí)處的MAS音頻信號(hào)與AAS音頻相混合。經(jīng)修改的AAS幀然后成為輸出壓縮數(shù)字位流1230。在AAS具有相對(duì)窄頻譜內(nèi)容的情況下,通過如圖14A至圖14B所示在壓縮之前將偽噪聲信號(hào)加入到AAS音頻信號(hào)中可容納MAS音頻信號(hào)的更寬頻譜內(nèi)容。偽噪聲的加入使得編碼處理(例如,其可通過AC-3編碼器來執(zhí)行)分配更多位來容納偽噪聲信號(hào)的更寬頻譜內(nèi)容,因而支持MAS音頻信號(hào)的頻譜內(nèi)容。
盡管下面對(duì)圖13的描述主要是針對(duì)AC-3壓縮位流的,但是圖13的示例以及本文描述的任何其他示例都可容易地應(yīng)用于諸如MPEG-AAC的其他壓縮技術(shù)。例如,圖13總體地例示了包含在如下步驟中的操作(1)對(duì)MAS壓縮位流進(jìn)行解包以生成各MAS“音頻塊”的MDCT系數(shù)(將其表示為AMAS);(2)對(duì)AAS壓縮位流進(jìn)行解包以生成各AAS“音頻塊”的MDCT系數(shù)(將其表示為BAAS);(3)將AMAS衰減一因數(shù)α以獲得MDCT系數(shù)αAMAS;(4)通過修改BAAS的尾數(shù)來將BAAS和αAMAS相組合;以及(5)對(duì)經(jīng)修改的幀進(jìn)行再打包并將其輸出。
轉(zhuǎn)向圖13,示例處理1300使得圖12中的示例混合裝置1200并行處理來自AAS的AC-3幀和來自MAS的AC-3幀,其中AAS對(duì)應(yīng)于壓縮輔助數(shù)字位流1210,而MAS對(duì)應(yīng)于壓縮主數(shù)字位流1220。在AAS的情況下,示例處理1300開始于塊1304,在塊1304處混合裝置1200從壓縮輔助數(shù)字位流1210獲取壓縮AAS幀。然后,在塊1308處,混合裝置1200對(duì)包含在壓縮AAS幀中的AAS頭信息進(jìn)行解包,來例如確定壓縮AAS幀中存在的音頻聲道數(shù)??刂七M(jìn)行到塊1312,在塊1312處混合裝置1200重置表示AAS幀中的AAS MDCT系數(shù)集的個(gè)數(shù)的計(jì)數(shù)器。接著,在塊1316處,混合裝置1200確定是否處理了幀中的所有MDCT系數(shù)集,這在AC-3編碼的情況下對(duì)應(yīng)于六個(gè)MDCT系數(shù)集。
如果在塊1316處混合裝置1200確定還沒有對(duì)所有的MDCT系數(shù)集進(jìn)行處理(例如,在AC-3編碼的情況下計(jì)數(shù)器不等于六),則控制進(jìn)行到塊1320和1324,在塊1320和1324處,針對(duì)各AAS MDCT系數(shù)集(或者,等同地,針對(duì)各AAS“音頻塊”),對(duì)相關(guān)聯(lián)的尾數(shù)和指數(shù)進(jìn)行解包,并根據(jù)對(duì)應(yīng)的經(jīng)解包的指數(shù)來確定系數(shù)量化步長(zhǎng)??蓪⒏鰽AS MDCT系數(shù)的尾數(shù)的量化步長(zhǎng)例如存儲(chǔ)在存儲(chǔ)器(例如,圖15中的存儲(chǔ)器2030)內(nèi)的數(shù)據(jù)結(jié)構(gòu)中。該數(shù)據(jù)結(jié)構(gòu)還可包含幀中從AAS幀的開始到特定尾數(shù)位置的實(shí)際位計(jì)數(shù)。另外或另選的是,可將關(guān)于AAS幀對(duì)應(yīng)于長(zhǎng)塊還是對(duì)應(yīng)于短塊的信息存儲(chǔ)在該數(shù)據(jù)結(jié)構(gòu)中。在完成了塊1320和1324處的處理之后,控制進(jìn)行到塊1328,在塊1328處混合裝置1200修改被處理的AAS幀中的各AAS尾數(shù),以反映AAS幀與對(duì)應(yīng)的MAS幀的混合。下面將更詳細(xì)地描述塊1328處執(zhí)行的處理。在完成了塊1328處的處理之后,控制接著進(jìn)行到塊1332,在塊1332處混合裝置1200遞增與AAS幀中的AAS MDCT系數(shù)集的個(gè)數(shù)相對(duì)應(yīng)的計(jì)數(shù)器。然后控制返回到塊1316。
在圖13的示例中與AAS并行地被處理的MAS的情況下,示例處理1300開始于塊1354,在塊1354處混合裝置1200從壓縮主數(shù)字位流1220中獲取壓縮MAS幀。接著,在塊1358處,混合裝置1200對(duì)包括在壓縮MAS幀中的MAS頭信息進(jìn)行解包,以例如確定壓縮MAS幀中存在的音頻聲道的個(gè)數(shù)??刂七M(jìn)行到塊1362,在塊1362處混合裝置1200重置表示MAS幀中的MAS MDCT系數(shù)集的個(gè)數(shù)的計(jì)數(shù)器。接著,在塊1366處混合裝置1200確定是否處理了幀中的所有MDCT系數(shù)集,這在AC-3編碼的情況下對(duì)應(yīng)于六個(gè)MDCT系數(shù)集。
如果在塊1366處混合裝置1200確定還沒有對(duì)所有的MAS MDCT系數(shù)集進(jìn)行處理(例如,在AC-3編碼的情況下計(jì)數(shù)器不等于六),則控制進(jìn)行到塊1370,在塊1370處對(duì)MAS幀進(jìn)行解包以生成與各MASMDCT系數(shù)集(或者,等同地,各MAS“音頻塊”)相對(duì)應(yīng)的MAS MDCT系數(shù)集。然后控制進(jìn)行到塊1374,在塊1374處將MAS MDCT系數(shù)衰減一衰減因數(shù)(例如,3與10dB之間的因數(shù))??刂七M(jìn)行到塊1378,在塊1378處通過將尾數(shù)值除以塊1320處確定的并且與AAS幀中的對(duì)應(yīng)頻率指數(shù)相關(guān)聯(lián)的適當(dāng)量化步長(zhǎng),以確定各衰減MAS MDCT系數(shù)的尾數(shù)。在塊1328處采用這些量化衰減MAS尾數(shù)來修改對(duì)應(yīng)的AAS尾數(shù),以反映MAS幀與AAS幀的混合。在完成了塊1378處的處理之后,控制接著進(jìn)行到塊1382,在塊1382處混合裝置1200遞增與MAS幀中的MAS MDCT系數(shù)集的個(gè)數(shù)相對(duì)應(yīng)的計(jì)數(shù)器。然后控制返回到塊1366。
然而如果在塊1316和1366處混合裝置1200分別確定處理了所獲得的AAS和MAS幀的所有AAS MDCT系數(shù)和MAS MDCT系數(shù),則控制隨后進(jìn)行到塊1390,在塊1390處混合裝置120對(duì)經(jīng)修改的AAS MDCT系數(shù)進(jìn)行再打包以形成混合AC-3音頻幀。然后控制進(jìn)行到塊1394,在塊1394處混合裝置1200輸出要包含在壓縮混合數(shù)字位流1230中的混合AC-3音頻幀。
為了更好地理解圖13中的示例處理1300執(zhí)行的處理,考慮如下示例操作,其中以4位來表示在塊1328處的AAS MDCT系數(shù),這得到在-1.0到1.0范圍內(nèi)的15級(jí)量化的尾數(shù)。出于該示例的目的假設(shè)AAS MDCT系數(shù)的原始尾數(shù)值為-4.0/15=-0.2666。然后,根據(jù)圖6中示出的示例AC-3量化查找表600,與原始AAS尾數(shù)相對(duì)應(yīng)的位模式為0101(十進(jìn)制數(shù)5)。接著,出于該示例的目的假設(shè)在塊1378處確定的經(jīng)衰減MAS尾數(shù)值等于-0.1634。該衰減的MAS尾數(shù)值造成對(duì)AAS尾數(shù)的相應(yīng)變化,使得在塊1328處確定中間(新)修改AAS尾數(shù)值等于-0.4300,其在量化查找表600中位于量化值-8/15=-0.5333與-6/15=-0.4之間。值-6/15最接近于中間修改AAS尾數(shù)值-0.4300,因此在塊1328處選擇位模式0100(十進(jìn)制數(shù)4)來替代用于表示原始AAS尾數(shù)的原始碼,以生成所得混合MDCT系數(shù)。
在以上示例中,如果在塊1328處確定的中間修改尾數(shù)值位于可選尾數(shù)值范圍以外(例如,在量化表600中的±14/15范圍之外),則適當(dāng)?shù)赜膳c可選尾數(shù)值的正限或負(fù)限相對(duì)應(yīng)的位模式來表示由塊1328輸出的尾數(shù)。另選的是,可以改變指數(shù)來得到更小的所需尾數(shù)值,但是這種指數(shù)變化是所不希望的,因?yàn)檫@將需要重復(fù)包括掩蔽計(jì)算在內(nèi)的整個(gè)編碼/壓縮算法。此外,由于將混合尾數(shù)值限于許可上限和下限范圍內(nèi)而造成的任何誤差都可能對(duì)MAS的音頻質(zhì)量造成可以忽略的影響。具體來說,在畫外音混合中,由于將MAS的音頻級(jí)衰減到相對(duì)較低的值,所以由于對(duì)尾數(shù)值改變的強(qiáng)制限制導(dǎo)致的誤差通常對(duì)音頻質(zhì)量具有相對(duì)可忽略的影響。
在一些情況下,AAS主要是頻譜范圍主要限于低頻段的語(yǔ)音信號(hào),由此可采用相對(duì)較少的位來表示更高頻率分量。在這種情況下,例如主要是音樂并且較高頻譜內(nèi)容豐富的MAS可能由于AAS采用的量化處理而導(dǎo)致較高頻譜能量的損失。圖14A至圖14B分別例示了改進(jìn)處理1400和1450,它們可用來通過在壓縮之前將已知的偽白噪聲與時(shí)域AAS信號(hào)相混合來人工地提高AAS音頻的頻譜保真度。由于所加入的偽白噪聲,AC-3編碼器將在可用來表示MAS音頻的較高頻譜內(nèi)容的較寬頻譜范圍上分配更多的尾數(shù)位,由此減少對(duì)音頻質(zhì)量的影響。在混合處理期間,可通過適當(dāng)?shù)臏p法處理來消除已知的偽白噪聲的影響。
轉(zhuǎn)向圖14A,處理1400對(duì)時(shí)域AAS信號(hào)進(jìn)行操作,并開始于塊1404,在塊1404處,處理1400確定要加入到時(shí)域AAS信號(hào)中的偽噪聲時(shí)域樣本。偽噪聲樣本可通過處理1400基于任何已知的偽噪聲生成算法來生成,或者通過處理1400預(yù)先生成、存儲(chǔ)在存儲(chǔ)器(例如,圖15中的存儲(chǔ)器2030)中,并從該存儲(chǔ)器中讀取。可生成擁有頻譜范圍比由處理1400處理的時(shí)域AAS信號(hào)更寬的頻譜特性的偽噪聲樣本。接著,在塊1408處,處理1400將偽噪聲時(shí)域樣本加入到AAS時(shí)域樣本中。最后,控制進(jìn)行到塊1412,在塊1412處,處理1400對(duì)由將偽噪聲時(shí)域樣本加入到原始AAS時(shí)域信號(hào)中而得到的時(shí)域信號(hào)進(jìn)行壓縮。在處理了全部AAS時(shí)域樣本后,處理1400結(jié)束。
轉(zhuǎn)向圖14B,將對(duì)圖13中的示例處理1300的改進(jìn)例示為要在處理1300的塊1374和1378之間執(zhí)行的塊1450。塊1450用來取消在圖14A的示例處理1400的塊1408處加入偽噪聲時(shí)域樣本的效果。在圖14B中,在塊1374處衰減了MAS MDCT系數(shù)之后,控制處理1300進(jìn)行到塊1450。在塊1450處,作為由處理1300的塊1378和1328執(zhí)行的混合處理的一部分,從經(jīng)衰減的MAS MDCT系數(shù)中減去偽噪聲樣本的影響以使得去除偽噪聲。本領(lǐng)域普通技術(shù)人員將理解,可通過很多方式從經(jīng)衰減的MASMDCT系數(shù)中減去偽噪聲樣本的影響。在一個(gè)示例中,可將已知的偽噪聲時(shí)域樣本存儲(chǔ)在圖12的混合裝置1200中,使得混合裝置可適當(dāng)?shù)貙?duì)經(jīng)時(shí)間對(duì)準(zhǔn)的偽噪聲樣本進(jìn)行MDCT變換,來生成要從經(jīng)衰減的MASMDCT系數(shù)中減去的偽噪聲MDCT系數(shù)。在另一示例中,混合裝置1220可存儲(chǔ)與偽噪聲樣本的平均頻譜特性相對(duì)應(yīng)的平均偽噪聲MDCT系數(shù)集,由此緩解對(duì)實(shí)時(shí)計(jì)算偽噪聲MDCT系數(shù)或?qū)崿F(xiàn)時(shí)間對(duì)準(zhǔn)以選擇用于MDCT變換的適當(dāng)偽噪聲樣本的需求。在任何情況下,在塊1450處從MAS MDCT系數(shù)中減去偽噪聲樣本的影響之后,控制進(jìn)行到塊1378及其之后的塊,以實(shí)現(xiàn)以上關(guān)于圖13描述的混合處理。
圖15是可用來實(shí)現(xiàn)本文所公開的方法和裝置的示例處理器系統(tǒng)2000的框圖。處理器系統(tǒng)2000可以是臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、筆記本計(jì)算機(jī)、個(gè)人數(shù)字助理(PDA)、服務(wù)器、因特網(wǎng)設(shè)備或任何其他類型的計(jì)算設(shè)備。
圖15中例示的處理器系統(tǒng)2000包括芯片組2010,芯片組2010包括存儲(chǔ)器控制器2012和輸入/輸出(I/O)控制器2014。如廣為公知的,芯片組通常提供存儲(chǔ)器和I/O管理功能,以及可由處理器2020訪問或使用的多個(gè)通用和/或?qū)S眉拇嫫?、定時(shí)器等。采用一個(gè)或更多個(gè)處理器來實(shí)現(xiàn)處理器2020。在另選情況下,可采用其他處理技術(shù)來實(shí)現(xiàn)處理器2020。處理器2020包括緩沖存儲(chǔ)器2022,該緩沖存儲(chǔ)器2022可采用一級(jí)統(tǒng)一緩沖存儲(chǔ)器(L1)、二級(jí)統(tǒng)一緩沖存儲(chǔ)器(L2)、三級(jí)統(tǒng)一緩沖存儲(chǔ)器(L3)、以及/或者任何其他適合存儲(chǔ)數(shù)據(jù)的結(jié)構(gòu)來實(shí)現(xiàn)。
常規(guī)上,存儲(chǔ)器控制器2012執(zhí)行如下功能使得處理器2020能夠經(jīng)由總線2040訪問包括易失性存儲(chǔ)器2032和非易失性存儲(chǔ)器2034的主存儲(chǔ)器2030,并與之通信。易失性存儲(chǔ)器2032可通過同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(SDRAM)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM)、RAMBUS動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(RDRAM)、和/或任何其他類型的隨機(jī)存取存儲(chǔ)器設(shè)備來實(shí)現(xiàn)。非易失性存儲(chǔ)器2034可使用閃存、只讀存儲(chǔ)器(ROM)、電子可擦寫可編程只讀存儲(chǔ)器(EEPROM)、和/或任何其他理想類型的存儲(chǔ)器設(shè)備來實(shí)現(xiàn)。
處理器系統(tǒng)2000還包括連接到總線2040的接口電路2050。該接口電路2050可采用諸如以太網(wǎng)接口、通用串行總線(USB)、第三代輸入/輸出接口(3GIO)接口、和/或任何其他適合類型接口的任何類型的已知接口標(biāo)準(zhǔn)來實(shí)現(xiàn)。
一個(gè)或更多個(gè)輸入設(shè)備2060連接到接口電路2050。輸入設(shè)備2060允許用戶輸入數(shù)據(jù)和命令到處理器2020中。例如,輸入設(shè)備2060可由鍵盤、鼠標(biāo)、觸敏顯示器、跟蹤板、跟蹤球、isopoint、和/或語(yǔ)音識(shí)別系統(tǒng)來實(shí)現(xiàn)。
一個(gè)或更多個(gè)輸出設(shè)備2070也連接到接口電路2050。例如,輸出設(shè)備2070可由媒體呈現(xiàn)設(shè)備(例如,發(fā)光顯示器(LED)、液晶顯示器(LCD)、陰極射線管(CRT)顯示器、打印機(jī)和/或揚(yáng)聲器)來實(shí)現(xiàn)。接口電路2050由此通常除其他事物之外還包括圖形驅(qū)動(dòng)器卡。
處理器系統(tǒng)2000還包括一個(gè)或更多個(gè)大容量存儲(chǔ)設(shè)備2080來存儲(chǔ)軟件和數(shù)據(jù)。這種大容量存儲(chǔ)設(shè)備2080的示例包括軟盤和驅(qū)動(dòng)器、硬盤驅(qū)動(dòng)器、光盤和驅(qū)動(dòng)器、以及數(shù)字多功能盤(DVD)和驅(qū)動(dòng)器。
接口電路2050還包括諸如調(diào)制解調(diào)器或網(wǎng)絡(luò)接口卡的通信設(shè)備,以便于經(jīng)由網(wǎng)絡(luò)與外部計(jì)算機(jī)交換數(shù)據(jù)。處理器系統(tǒng)2000與網(wǎng)絡(luò)之間的通信鏈接可以是任意類型的網(wǎng)絡(luò)連接,例如以太網(wǎng)連接、數(shù)字用戶線(DSL)、電話線、蜂窩式電話系統(tǒng)、同軸線纜等。
對(duì)輸入設(shè)備2060、輸出設(shè)備2070、大容量存儲(chǔ)設(shè)備2080和/或網(wǎng)絡(luò)的訪問通常是由I/O控制器2014按照傳統(tǒng)方式控制的。具體來說,I/O控制器2014執(zhí)行以下功能,即,使得處理器2020能夠經(jīng)由總線2040和接口電路2050與輸入設(shè)備2060、輸出設(shè)備2070、大容量存儲(chǔ)設(shè)備2080和/或網(wǎng)絡(luò)進(jìn)行通信。
盡管在處理器系統(tǒng)2000內(nèi)將圖15中示出的組件描述為分立的塊,但也可將由這些塊中的一些執(zhí)行的功能集成在單個(gè)半導(dǎo)體電路內(nèi),或者可采用兩個(gè)或更多個(gè)分立的集成電路來實(shí)現(xiàn)。例如,盡管在芯片組2010內(nèi)將存儲(chǔ)器控制器2012和I/O控制器2014描述為分立的塊,但也可將存儲(chǔ)器控制器2012和I/O控制器2014集成在單個(gè)半導(dǎo)體電路內(nèi)。
本文公開的方法和裝置尤其適用于按照AC-3標(biāo)準(zhǔn)執(zhí)行的數(shù)字位流。然而,本文公開的方法和裝置可應(yīng)用于其他數(shù)字音頻編碼技術(shù)。
另外,盡管本公開是針對(duì)示例電視和無線電廣播系統(tǒng)而做出的,但是應(yīng)當(dāng)理解,所公開的系統(tǒng)可容易地應(yīng)用于很多其他媒體系統(tǒng)。因此,盡管本公開描述了示例系統(tǒng)和處理,但是所公開的示例也并非實(shí)現(xiàn)這種系統(tǒng)的唯一方式。
盡管本文描述了特定示例方法、裝置及制造品,但是本專利的覆蓋范圍并不限于此。相反,本專利覆蓋字面上或在等同原則下完全落入所附權(quán)利要求范圍內(nèi)的所有方法、裝置及制造品。例如,盡管本公開描述了除了其他組件還包括在硬件上執(zhí)行的軟件的示例系統(tǒng),但是應(yīng)當(dāng)注意,這種系統(tǒng)僅僅是例示性的,且不應(yīng)被視為限制。具體來說,應(yīng)當(dāng)想到,所公開的硬件和軟件組件中的任一個(gè)或全部可完全由專用硬件、完全由固件、完全由軟件、或者由硬件、固件和/或軟件的某種組合來實(shí)現(xiàn)。
本專利要求于2004年7月2提交的題為“壓縮位流的混合系統(tǒng)及方法”且序列號(hào)為60/585115的美國(guó)臨時(shí)申請(qǐng)和于2004年7月8日提交的題為“壓縮位流的混合系統(tǒng)及方法”且序列號(hào)為60/586354的美國(guó)臨時(shí)申請(qǐng)的優(yōu)先權(quán)。本申請(qǐng)還涉及于2004年6月14日提交的題為“嵌入水印的方法及裝置”的第PCT/US04/18953號(hào)國(guó)際專利申請(qǐng)。在此通過引用并入序列號(hào)為60/585115的美國(guó)臨時(shí)申請(qǐng)、序列號(hào)為60/586354的美國(guó)臨時(shí)申請(qǐng)和第PCT/US04/18953號(hào)國(guó)際專利申請(qǐng)的全部?jī)?nèi)容。
權(quán)利要求
1.一種用于將第一壓縮數(shù)字位流與第二數(shù)字位流相混合的方法,該方法包括以下步驟獲取與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的幀;對(duì)所述幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集;以及修改所述多個(gè)原始變換系數(shù)集以將所述第二數(shù)字位流與所述第一壓縮數(shù)字位流相混合。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述修改所述多個(gè)原始變換系數(shù)集的步驟包括確定與多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼;并且用與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼來代替與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的第二尾數(shù)碼。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述確定與多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼的步驟包括確定與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的量化步長(zhǎng);基于將和所述第一壓縮數(shù)字位流相關(guān)聯(lián)的元素與和所述第二數(shù)字位流相關(guān)聯(lián)的元素相組合,來生成所述混合變換系數(shù);基于所述量化步長(zhǎng)來對(duì)所述混合變換系數(shù)進(jìn)行量化以生成量化尾數(shù);并且基于所述量化尾數(shù)來確定與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述量化步長(zhǎng)基于與所述對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的指數(shù)。
5.根據(jù)權(quán)利要求3所述的方法,其中,所述將和所述第一壓縮數(shù)字位流相關(guān)聯(lián)的元素與和所述第二數(shù)字位流相關(guān)聯(lián)的元素相組合的步驟包括將和所述第一壓縮數(shù)字位流相關(guān)聯(lián)的所述元素與和所述第二數(shù)字位流相關(guān)聯(lián)的所述元素相加。
6.根據(jù)權(quán)利要求5所述的方法,該方法進(jìn)一步包括以下步驟在將所述第一壓縮數(shù)字位流的所述元素和所述第二數(shù)字位流的所述元素相加之前,對(duì)所述第一壓縮數(shù)字位流的所述元素或所述第二數(shù)字位流的所述元素中的至少一個(gè)進(jìn)行衰減。
7.根據(jù)權(quán)利要求1所述的方法,其中,所述修改所述多個(gè)原始變換系數(shù)集的步驟包括基于所述多個(gè)原始變換系數(shù)集來生成多個(gè)時(shí)域音頻塊;基于所述多個(gè)時(shí)域音頻塊來生成多個(gè)重構(gòu)音頻塊;并且基于所述多個(gè)重構(gòu)音頻塊和所述第二數(shù)字位流來生成多個(gè)混合音頻塊。
8.根據(jù)權(quán)利要求7所述的方法,其中,所述基于所述多個(gè)時(shí)域音頻塊來生成多個(gè)重構(gòu)音頻塊的步驟包括基于第一時(shí)域音頻塊和第二時(shí)域音頻塊來生成重構(gòu)時(shí)域音頻塊。
9.根據(jù)權(quán)利要求8所述的方法,其中,所述基于第一時(shí)域音頻塊和第二時(shí)域音頻塊生成重構(gòu)時(shí)域音頻塊的步驟包括將所述第一時(shí)域音頻塊與所述第二時(shí)域音頻塊相加。
10.根據(jù)權(quán)利要求1所述的方法,其中,所述修改多個(gè)變換系數(shù)集的步驟包括基于多個(gè)混合變換系數(shù)集來修改所述多個(gè)原始變換系數(shù)集。
11.根據(jù)權(quán)利要求10所述的方法,該方法進(jìn)一步包括通過基于與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的壓縮信息確定與所述多個(gè)混合變換系數(shù)集中的每一個(gè)的混合變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼,來生成多個(gè)混合系數(shù)集。
12.根據(jù)權(quán)利要求1所述的方法,其中,所述多個(gè)原始變換系數(shù)集中的每一個(gè)都包括一個(gè)或更多個(gè)改進(jìn)離散余弦變換系數(shù)。
13.根據(jù)權(quán)利要求1所述的方法,其中,所述第一壓縮數(shù)字位流是根據(jù)音頻壓縮標(biāo)準(zhǔn)進(jìn)行壓縮的。
14.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的幀的步驟包括獲取與多個(gè)音頻聲道中的至少一個(gè)相關(guān)聯(lián)的音頻塊。
15.根據(jù)權(quán)利要求1所述的方法,其中,所述對(duì)所述幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集的步驟包括確定與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的壓縮信息。
16.根據(jù)權(quán)利要求1所述的方法,該方法進(jìn)一步包括基于多個(gè)混合變換系數(shù)集對(duì)所述幀進(jìn)行再打包。
17.根據(jù)權(quán)利要求1所述的方法,其中,所述第一壓縮數(shù)字位流對(duì)應(yīng)于主音頻服務(wù),所述第二數(shù)字位流對(duì)應(yīng)于輔助音頻服務(wù)。
18.根據(jù)權(quán)利要求1所述的方法,其中,所述第二數(shù)字位流是經(jīng)壓縮的。
19.根據(jù)權(quán)利要求18所述的方法,其中,在壓縮之前將偽噪聲信號(hào)加入到所述第二數(shù)字位流中。
20.根據(jù)權(quán)利要求19所述的方法,其中,所述修改所述多個(gè)原始變換系數(shù)集的步驟包括確定與多個(gè)偽噪聲變換系數(shù)集之一的偽噪聲變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼;并且基于所述第一尾數(shù)碼修改與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的第二尾數(shù)碼。
21.根據(jù)權(quán)利要求20所述的方法,其中,所述多個(gè)偽噪聲變換系數(shù)集是基于所述偽噪聲信號(hào)的平均頻譜特性來確定的。
22.一種數(shù)據(jù)流混合裝置,該數(shù)據(jù)流混合裝置包括獲取單元,用于獲取與第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的幀;解包單元,用于對(duì)所述幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集;以及修改單元,用于修改所述多個(gè)原始變換系數(shù)集以將第二數(shù)字?jǐn)?shù)據(jù)流與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相混合。
23.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為確定與多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼;并且用與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼來代替與所述多個(gè)變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的第二尾數(shù)碼。
24.根據(jù)權(quán)利要求23所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為確定與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的量化步長(zhǎng);基于和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素與和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素的組合,來生成所述混合變換系數(shù);基于所述量化步長(zhǎng)來對(duì)所述混合變換系數(shù)進(jìn)行量化以生成量化尾數(shù);并且基于所述量化尾數(shù)來確定與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼。
25.根據(jù)權(quán)利要求24所述的數(shù)據(jù)流混合裝置,其中,所述量化步長(zhǎng)基于與所述對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的指數(shù)。
26.根據(jù)權(quán)利要求24所述的數(shù)據(jù)流混合裝置,其中,和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素與和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素的組合包括將和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素與和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素相加。
27.根據(jù)權(quán)利要求26所述的數(shù)據(jù)流混合裝置,其中,和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素與和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的元素的組合進(jìn)一步包括在將和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素與和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素相加之前,對(duì)和所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素或和所述第二數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的所述元素中的至少一個(gè)進(jìn)行衰減。
28.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為基于所述多個(gè)原始變換系數(shù)集來生成多個(gè)時(shí)域音頻塊;基于所述多個(gè)時(shí)域音頻塊來生成多個(gè)重構(gòu)音頻塊;并且基于所述多個(gè)重構(gòu)音頻塊和所述第二數(shù)字?jǐn)?shù)據(jù)流來生成多個(gè)混合音頻塊。
29.根據(jù)權(quán)利要求28所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為基于所述多個(gè)時(shí)域音頻塊中的第一時(shí)域音頻塊和第二時(shí)域音頻塊來生成所述多個(gè)重構(gòu)音頻塊中的一重構(gòu)時(shí)域音頻塊。
30.根據(jù)權(quán)利要求29所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為將所述第一時(shí)域音頻塊和所述第二時(shí)域音頻塊相加以生成重構(gòu)時(shí)域音頻塊。
31.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述修改單元被配置為基于多個(gè)混合變換系數(shù)集來修改所述多個(gè)原始變換系數(shù)集。
32.根據(jù)權(quán)利要求31所述的數(shù)據(jù)流混合裝置,其中,所述修改單元進(jìn)一步被配置為基于所述第二數(shù)字?jǐn)?shù)據(jù)流和與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的壓縮信息,來生成所述多個(gè)混合變換系數(shù)集。
33.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述多個(gè)原始變換系數(shù)集中的每一個(gè)都包括一個(gè)或更多個(gè)改進(jìn)離散余弦變換系數(shù)。
34.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流是根據(jù)音頻壓縮標(biāo)準(zhǔn)進(jìn)行壓縮的。
35.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述獲取單元被配置為獲取與多個(gè)音頻聲道相關(guān)聯(lián)的音頻塊。
36.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述解包單元被配置為獲得與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的壓縮信息。
37.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,其中,所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流與主音頻服務(wù)相關(guān)聯(lián),所述第二數(shù)字?jǐn)?shù)據(jù)流與輔助音頻服務(wù)相關(guān)聯(lián)。
38.根據(jù)權(quán)利要求22所述的數(shù)據(jù)流混合裝置,該數(shù)據(jù)流混合裝置進(jìn)一步包括再打包單元,該再打包單元用于基于多個(gè)混合變換系數(shù)集對(duì)所述幀進(jìn)行再打包。
39.一種存儲(chǔ)有可機(jī)讀指令的制造品,所述可機(jī)讀指令在執(zhí)行時(shí)使得機(jī)器進(jìn)行以下操作獲取與第一壓縮數(shù)字位流相關(guān)聯(lián)的幀;對(duì)所述幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集;以及修改所述多個(gè)原始變換系數(shù)集以將第二數(shù)字位流與所述第一壓縮數(shù)字位流相混合。
40.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令在執(zhí)行時(shí)使得所述機(jī)器通過以下步驟來修改所述多個(gè)原始變換系數(shù)集確定與多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼;并且用與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼來代替與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的第二尾數(shù)碼。
41.根據(jù)權(quán)利要求40所述的制造品,其中,所述指令在執(zhí)行時(shí)使得所述機(jī)器通過以下步驟來確定與所述多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼確定與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的量化步長(zhǎng);基于將和所述第一壓縮數(shù)字位流相關(guān)聯(lián)的元素與和所述第二數(shù)字位流相關(guān)聯(lián)的元素相組合,來生成所述混合變換系數(shù);基于所述量化步長(zhǎng)來對(duì)所述混合變換系數(shù)進(jìn)行量化以生成量化尾數(shù);并且基于所述量化尾數(shù)來確定與所述混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼。
42.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令在執(zhí)行時(shí)使得所述機(jī)器通過以下步驟來修改所述多個(gè)原始變換系數(shù)集基于所述多個(gè)原始變換系數(shù)集來生成多個(gè)時(shí)域音頻塊;基于所述多個(gè)時(shí)域音頻塊來生成多個(gè)重構(gòu)音頻塊;并且基于所述多個(gè)重構(gòu)音頻塊和所述第二數(shù)字位流來生成多個(gè)混合音頻塊。
43.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令在執(zhí)行時(shí)進(jìn)一步使得所述機(jī)器執(zhí)行以下操作通過基于與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的壓縮信息確定與多個(gè)混合系數(shù)集中的每一個(gè)的混合變換系數(shù)相關(guān)聯(lián)的尾數(shù)碼,來生成所述多個(gè)混合系數(shù)集。
44.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令在執(zhí)行時(shí)進(jìn)一步使得所述機(jī)器執(zhí)行以下操作通過獲取與多個(gè)音頻聲道中的至少一個(gè)相關(guān)聯(lián)的音頻塊,來獲取與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的幀。
45.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令使得所述機(jī)器執(zhí)行以下操作通過識(shí)別與所述第一壓縮數(shù)字位流相關(guān)聯(lián)的壓縮信息,對(duì)所述幀進(jìn)行解包以獲得所述多個(gè)原始變換系數(shù)集。
46.根據(jù)權(quán)利要求39所述的制造品,其中,所述指令在執(zhí)行時(shí)進(jìn)一步使得所述機(jī)器執(zhí)行以下操作基于多個(gè)混合變換系數(shù)集對(duì)所述幀進(jìn)行再打包。
47.根據(jù)權(quán)利要求39所述的制造品,其中,所述第一壓縮數(shù)字位流與主音頻服務(wù)相關(guān)聯(lián),所述第二數(shù)字位流與輔助音頻服務(wù)相關(guān)聯(lián)。
48.一種用于混合數(shù)字?jǐn)?shù)據(jù)流的系統(tǒng),該系統(tǒng)包括第一源,用于提供第一壓縮數(shù)字?jǐn)?shù)據(jù)流;第二源,用于提供第二數(shù)字?jǐn)?shù)據(jù)流;以及混合裝置,用于無需對(duì)所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流進(jìn)行解壓縮地將所述第二數(shù)字?jǐn)?shù)據(jù)流與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相混合。
49.根據(jù)權(quán)利要求48所述的系統(tǒng),其中,所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流包括多個(gè)變換系數(shù)。
50.根據(jù)權(quán)利要求49所述的系統(tǒng),其中,所述混合裝置被配置為基于所述第二數(shù)字?jǐn)?shù)據(jù)流修改所述多個(gè)變換系數(shù)。
51.根據(jù)權(quán)利要求50所述的系統(tǒng),其中,所述多個(gè)變換系數(shù)包括相應(yīng)的多個(gè)原始尾數(shù)和原始指數(shù),所述混合裝置被配置為僅修改所述多個(gè)原始尾數(shù)以修改所述多個(gè)變換系數(shù)。
52.根據(jù)權(quán)利要求51所述的系統(tǒng),其中,所述多個(gè)變換系數(shù)是多個(gè)原始變換系數(shù),所述混合裝置被配置為通過基于所述第二數(shù)字?jǐn)?shù)據(jù)流和與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的壓縮信息確定多個(gè)混合變換系數(shù),來修改所述多個(gè)原始變換系數(shù)。
53.根據(jù)權(quán)利要求52所述的系統(tǒng),其中,所述壓縮信息包括至少一個(gè)量化步長(zhǎng)。
54.根據(jù)權(quán)利要求52所述的系統(tǒng),其中,確定所述多個(gè)混合變換系數(shù)包括對(duì)與所述多個(gè)混合變換系數(shù)相關(guān)聯(lián)的多個(gè)混合尾數(shù)進(jìn)行量化。
55.根據(jù)權(quán)利要求54所述的系統(tǒng),其中,所述混合裝置被配置為基于所述多個(gè)量化混合尾數(shù)和所述壓縮信息來修改所述多個(gè)原始尾數(shù)。
56.根據(jù)權(quán)利要求48所述的系統(tǒng),其中,所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流是根據(jù)音頻壓縮標(biāo)準(zhǔn)來壓縮的。
57.根據(jù)權(quán)利要求48所述的系統(tǒng),其中,所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流與主音頻服務(wù)相關(guān)聯(lián),所述第二數(shù)字?jǐn)?shù)據(jù)流與輔助數(shù)據(jù)服務(wù)相關(guān)聯(lián)。
58.根據(jù)權(quán)利要求48所述的系統(tǒng),其中,所述第二數(shù)字?jǐn)?shù)據(jù)流是非壓縮的。
59.一種用于將第一壓縮數(shù)字?jǐn)?shù)據(jù)流與第二數(shù)字?jǐn)?shù)據(jù)流相組合的方法,該方法包括以下步驟獲取與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相關(guān)聯(lián)的幀;對(duì)所述幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集;以及修改所述多個(gè)原始變換系數(shù)集以將所述第二數(shù)字?jǐn)?shù)據(jù)流與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相組合。
60.根據(jù)權(quán)利要求59所述的方法,其中,所述組合包括混合,并且其中,所述修改所述多個(gè)原始變換系數(shù)集以將所述第二數(shù)字?jǐn)?shù)據(jù)流與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相組合的步驟包括修改所述多個(gè)原始變換系數(shù)集以將所述第二數(shù)字?jǐn)?shù)據(jù)流與所述第一壓縮數(shù)字?jǐn)?shù)據(jù)流相混合。
61.根據(jù)權(quán)利要求59所述的方法,其中,所述修改所述多個(gè)原始變換系數(shù)集的步驟包括確定與多個(gè)混合變換系數(shù)集之一的混合變換系數(shù)相關(guān)聯(lián)的第一尾數(shù)碼;并且用與所述混合變換系數(shù)相關(guān)聯(lián)的所述第一尾數(shù)碼來代替與所述多個(gè)原始變換系數(shù)集之一的對(duì)應(yīng)原始變換系數(shù)相關(guān)聯(lián)的第二尾數(shù)碼。
62.根據(jù)權(quán)利要求59所述的方法,其中,所述多個(gè)原始變換系數(shù)集中的每一個(gè)都包括一個(gè)或更多個(gè)改進(jìn)離散余弦變換系數(shù)。
全文摘要
本發(fā)明公開了用于混合(200)壓縮數(shù)字位流(230)的方法、裝置及制造品。本文公開的示例方法包括以下步驟獲取與第一壓縮數(shù)字位流(220)相關(guān)聯(lián)的幀;對(duì)該幀進(jìn)行解包以獲得多個(gè)原始變換系數(shù)集;以及修改所述多個(gè)原始變換系數(shù)集來將第二數(shù)字位流(210)與所述第一壓縮數(shù)字位流(220)相混合。
文檔編號(hào)G06K9/46GK1993700SQ200580026107
公開日2007年7月4日 申請(qǐng)日期2005年6月29日 優(yōu)先權(quán)日2004年7月2日
發(fā)明者韋努戈帕爾·斯里尼瓦桑, 約翰·C·派弗 申請(qǐng)人:尼爾遜媒介研究股份有限公司