用于再現(xiàn)三維音頻的方法和設(shè)備的制造方法
【專利摘要】公開了一種用于再現(xiàn)三維音頻的方法和設(shè)備。所述用于再現(xiàn)三維音頻的方法可包括以下步驟:接收包括多個輸入聲道的多聲道信號;并且響應(yīng)于所述多聲道信號的頻率范圍執(zhí)行下混合以將所述多個輸入聲道的格式轉(zhuǎn)換為具有高度感的多個輸出聲道。
【專利說明】
用于再現(xiàn)三維音頻的方法和設(shè)備
技術(shù)領(lǐng)域
[0001 ]本發(fā)明涉及一種用于通過使用給定的輸出聲道提供高處(overhead)聲像的三維(3D)音頻再現(xiàn)方法和設(shè)備。
【背景技術(shù)】
[0002]由于視頻和音頻處理技術(shù)的進(jìn)步,具有高圖像質(zhì)量和高音頻質(zhì)量的多媒體內(nèi)容是廣泛普及的。用戶期望具有現(xiàn)實視頻和音頻的高圖像質(zhì)量和高聲音質(zhì)量的內(nèi)容,因此對三維(3D)視頻和3D音頻的研究正在積極地進(jìn)行。
[0003]3D音頻是這樣的技術(shù):多個揚(yáng)聲器位于水平面上的不同位置,并輸出相同的音頻信號或不同的音頻信號,從而使用戶感受到空間感。然而,實際的音頻在水平面上的各個位置被提供,并也在不同的高度被提供。因此,需要開發(fā)一種有效地再現(xiàn)通過位于水平面上的揚(yáng)聲器在不同高度提供的音頻信號的技術(shù)。
【發(fā)明內(nèi)容】
[0004]技術(shù)問題
[0005]本發(fā)明提供了一種用于在包括水平輸出聲道的再現(xiàn)布局中提供高處聲像的三維(3D)音頻再現(xiàn)方法和設(shè)備。
[0006]技術(shù)方案
[0007]根據(jù)本發(fā)明的一個方面,提供了一種三維(3D)音頻再現(xiàn)方法,包括:接收包括多個輸入聲道的多聲道信號;根據(jù)所述多聲道信號的頻率范圍執(zhí)行下混合以將所述多個輸入聲道格式轉(zhuǎn)換到具有高度感的多個輸出聲道。
[0008]執(zhí)行下混合的步驟可包括:在對所述多聲道信號的第一頻率范圍進(jìn)行相位校準(zhǔn)之后對所述多聲道信號的第一頻率范圍執(zhí)行下混合,并在不進(jìn)行相位校準(zhǔn)的情況下對所述多聲道信號的剩余的第二頻率范圍執(zhí)行下混合。
[0009]第一頻率范圍可具有比預(yù)定頻率更低的頻帶。
[0010]所述多個輸出聲道可包括水平聲道。
[0011]執(zhí)行下混合的步驟可包括:基于所述多聲道信號的特征,應(yīng)用不同的下混合矩陣。
[0012]所述多聲道信號的特征可包括帶寬和相關(guān)度。
[0013]執(zhí)行下混合的步驟可包括:根據(jù)比特流中包括的渲染類型,應(yīng)用音色渲染和空間清染之一。
[0014]渲染類型可根據(jù)所述多聲道信號的特征是否是瞬態(tài)而被確定。
[0015]根據(jù)本發(fā)明的另一方面,提供了一種3D音頻再現(xiàn)設(shè)備,包括:核心解碼器,被配置為對比特流進(jìn)行解碼;格式轉(zhuǎn)換器,被配置為從核心解碼器接收包括多個輸入聲道的多聲道信號,并被配置為根據(jù)所述多聲道信號的頻率范圍執(zhí)行下混合以將所述多個輸入聲道渲染到具有高度感的多個輸出聲道。
[0016]有益效果
[0017]在包括水平輸出聲道的再現(xiàn)布局中,當(dāng)對垂直輸入聲道執(zhí)行高度渲染或空間渲染時,確定對輸入信號執(zhí)行還是不執(zhí)行相位校準(zhǔn),然后執(zhí)行下混合。因此,在經(jīng)過渲染的輸出聲道信號中的特定頻率范圍內(nèi)的信號不經(jīng)過相位校準(zhǔn),從而可提供精確的同步。
[0018]此外,在剩余頻率范圍內(nèi)的信號經(jīng)過相位校準(zhǔn)和下混合兩者,因此在整個有源下混合處理期間計算量的增加和高度感的惡化可被最小化。
【附圖說明】
[0019]圖1是根據(jù)實施例的三維(3D)音頻再現(xiàn)設(shè)備的示意性結(jié)構(gòu)的框圖。
[0020]圖2是根據(jù)實施例的3D音頻再現(xiàn)設(shè)備的詳細(xì)結(jié)構(gòu)的框圖。
[0021 ]圖3是根據(jù)實施例的渲染器和混合器的框圖。
[0022]圖4是根據(jù)實施例的3D音頻再現(xiàn)方法的流程圖。
[0023]圖5是根據(jù)實施例的3D音頻再現(xiàn)方法的詳細(xì)流程圖。
[0024]圖6解釋根據(jù)實施例的有源下混合方法。
[0025]圖7是根據(jù)另一實施例的3D音頻再現(xiàn)設(shè)備的結(jié)構(gòu)的框圖。
[0026]圖8是根據(jù)實施例的音頻渲染設(shè)備的框圖。
[0027]圖9是根據(jù)另一實施例的音頻渲染設(shè)備的框圖。
[0028]圖10是根據(jù)實施例的音頻渲染方法的流程圖。
[0029]圖11是根據(jù)另一實施例的音頻渲染方法的流程圖。
【具體實施方式】
[0030]以下將參照附圖更充分地描述實施例。在這些附圖中,相同的標(biāo)號指示相同的元件,并將不對其進(jìn)行重復(fù)說明。
[0031]然而,實施例可按照許多不同的形式被實施,并且不應(yīng)被解釋為受限于在此陳述的示例性實施例。然而,這不限制本公開,應(yīng)該理解,本公開覆蓋了發(fā)明構(gòu)思的理念和技術(shù)范圍內(nèi)的所有修改、等同物和替換。在實施例的描述中,當(dāng)認(rèn)為對相關(guān)技術(shù)的特定詳細(xì)說明會不必要地模糊本發(fā)明構(gòu)思的實質(zhì)時,省略對相關(guān)技術(shù)的特定詳細(xì)說明。然而,本領(lǐng)域的普通技術(shù)人員能理解本發(fā)明可在沒有這些具體細(xì)節(jié)的情況下實現(xiàn)。
[0032]雖然包括序號的術(shù)語(如“第一”、“第二”等)會被用于描述各種組件,這些組件不可被這些術(shù)語限制。術(shù)語第一和第二不應(yīng)該被用于附加任何重要的順序,而是被用于將一個元件與另一個元件區(qū)分。
[0033]下面實施例中使用的術(shù)語僅用于描述特定的實施例,并且不意圖限制本發(fā)明構(gòu)思的范圍。除非上下文中有明顯不同的含義,否則使用單數(shù)的表述包含復(fù)數(shù)表述。在下面的實施例中,將理解,諸如“包括”、“具有”、“包含”的術(shù)語意圖表示存在說明書中公開的特征、數(shù)字、步驟、動作、組件、部件或它們的組合,并且不意圖排除可存在或可添加一個或更多個其它特征、數(shù)字、步驟、動作、組件、部件或組合的可能。
[0034]在下面的實施例中,術(shù)語“…模塊”和“…單元”執(zhí)行至少一個功能或操作,并且可被實現(xiàn)為硬件、軟件或硬件和軟件的組合。此外,除了使用特定硬件實現(xiàn)的“…模塊”或“…單元”,多個“…模塊”或多個“…單元”可集成為至少一個模塊并因此使用至少一個處理器實現(xiàn)。
[0035]圖1和圖2是根據(jù)實施例的三維(3D)音頻再現(xiàn)設(shè)備100和200的框圖。3D音頻再現(xiàn)設(shè)備100可將下混合的多聲道音頻信號輸出到將被再現(xiàn)的聲道。將被再現(xiàn)的聲道被稱為輸出聲道,并且,多聲道音頻信號被假設(shè)為包括多個輸入聲道。根據(jù)實施例,輸出聲道可與水平聲道相應(yīng),輸入聲道可與水平聲道或垂直聲道相應(yīng)。
[0036]3D音頻是指這樣的音頻:通過不但再現(xiàn)音高和音調(diào)還再現(xiàn)方向感或距離感來使收聽者能夠感受到擬真感,并且具有使不位于聲源產(chǎn)生的空間中的收聽者能夠感受到方向、距離和空間的空間信息。
[0037]在下文的描述中,音頻信號的聲道可以是輸出聲音的揚(yáng)聲器。隨著聲道數(shù)量的增加,揚(yáng)聲器的數(shù)量會增多。根據(jù)實施例的3D音頻再現(xiàn)設(shè)備100可將具有大量聲道的多聲道音頻信號渲染到將被再現(xiàn)的聲道,并對經(jīng)過渲染的信號進(jìn)行下混合,使得多聲道音頻信號在聲道數(shù)量少的環(huán)境中被再現(xiàn)。多聲道信號可包括能夠輸出具有高度感的聲音的聲道例如,垂直聲道。
[0038]能夠輸出具有高度感的聲音的聲道可以是能夠通過位于收聽者的頭頂上方的揚(yáng)聲器輸出聲音信號以使收聽者能夠感受到高度的聲道。水平聲道可表示為能夠通過位于與收聽者處于相同水平面的平面的揚(yáng)聲器輸出聲音信號的聲道。
[0039]聲道數(shù)量少的環(huán)境可以是這樣的環(huán)境:不包括能夠輸出具有高度感的聲音的聲道,并且聲音能通過布置在水平面上的揚(yáng)聲器(即,通過水平聲道)輸出。
[0040]此外,在下文的描述中,水平聲道可能是包括能通過布置在水平面上的揚(yáng)聲器輸出的音頻信號的聲道。高處聲道或垂直聲道可表示包括能通過布置在高處而不是布置在水平面上且能夠輸出具有高度感的聲音的揚(yáng)聲器輸出的音頻信號的聲道。
[0041]參照圖1,根據(jù)實施例的3D音頻再現(xiàn)設(shè)備100包括渲染器110和混合器120。然而,不是所有示出的組件都是必要的。3D音頻再現(xiàn)設(shè)備100可通過比圖1示出的組件更多或更少的組件來實現(xiàn)。
[0042]3D音頻再現(xiàn)設(shè)備100可對多聲道音頻信號進(jìn)行渲染和混合,并將作為結(jié)果產(chǎn)生的多聲道音頻信道輸出到將被再現(xiàn)的聲道。例如,多聲道音頻信號是22.2聲道信號,將被再現(xiàn)的聲道可以是5.1或7.1聲道。3D音頻再現(xiàn)設(shè)備100可通過確定將與多聲道音頻信號的各個聲道匹配的聲道來執(zhí)行渲染,并可將與確定的將被再現(xiàn)的聲道相應(yīng)的各個聲道的信號組合來輸出最終信號,從而對經(jīng)過渲染的音頻信號進(jìn)行混合。
[0043]渲染器110可根據(jù)聲道和頻率來對多聲道音頻信號進(jìn)行渲染。渲染器110可對多聲道音頻信號的高處聲道執(zhí)行空間清染或高度清染(elevat1n rendering),并可對多聲道音頻聲道的水平聲道執(zhí)行音色清染(timbral rendering)。
[0044]為了對高處聲道進(jìn)行渲染,渲染器110可根據(jù)頻率范圍,通過使用不同方法對已通過空間高度濾波器(例如,基于頭相關(guān)傳輸濾波器(HRTF)的均衡器)的高處聲道進(jìn)行渲染。基于HRTF的均衡器通過應(yīng)用在關(guān)于復(fù)雜路徑(例如,從頭表面的衍射和從耳部的反射)以及簡單路徑差(例如,兩耳之間的高差和聲音信號在兩耳之間的到達(dá)時間差)的特征根據(jù)聲音到達(dá)方向而被改變的現(xiàn)象中發(fā)生的音調(diào)變換,將包括在高處聲道中的音頻信號變換為從不同方向到達(dá)的聲音的音調(diào)?;贖RTF的均衡器可通過改變多聲道音頻信號的音質(zhì)來處理包括在高處信道中的音頻信號,以使收聽者能夠識別3D音頻。
[0045]清染器110可通過使用添加到最接近聲道(add to the closest channel)的方法,對高處聲道信號之中的在第一頻率范圍中的信號進(jìn)行渲染,并可通過使用多聲道平移(multichannel panning)方法來對在第二頻率范圍中的剩余信號進(jìn)行清染。為了方便說明,在第一頻率范圍中的信號被稱為低頻信號,在第二頻率范圍中的信號被稱為高頻信號。更適宜地,在第二頻率范圍中的信號可表示2.8KHz到1KHz的信號,在第一頻率范圍中的信號可表示剩余信號,即,等于或低于2.SKHz的信號或者等于或高于1KHz的信號。根據(jù)多聲道平移方法,針對將被渲染的不同聲道不同地設(shè)置的增益值可被應(yīng)用于多聲道音頻信號,因此多聲道音頻信號的每個聲道信號可被渲染到至少一個水平聲道。已經(jīng)分別應(yīng)用了增益值的聲道信號可經(jīng)過混合被組合,并輸出為最終信號。
[0046]由于低頻信號具有強(qiáng)的衍射特性,因此即使當(dāng)多聲道音頻信號的每個聲道信號被渲染到僅一個聲道,而不是根據(jù)多聲道平移方法將每個聲道信號渲染到多個聲道時,也可向收聽者提供相似的音質(zhì)。因此,根據(jù)實施例的3D音頻再現(xiàn)設(shè)備100可通過使用添加到最接近聲道的方法來對低頻信號進(jìn)行渲染,從而避免了當(dāng)多個聲道被混合到一個輸出聲道時音質(zhì)惡化。就是說,如果多個聲道被混合到一個輸出聲道,則音質(zhì)可能根據(jù)聲道信號之間的干擾而被放大或降低,導(dǎo)致音質(zhì)的惡化。因此,通過將一個聲道混合到一個輸出聲道可避免音質(zhì)的惡化。
[0047]根據(jù)添加到最接近聲道的方法,多聲道音頻信號的每個聲道可被渲染到將被渲染的聲道之中的最接近的聲道,而不是被渲染到多個聲道。
[0048]此外,通過使用不同的方法對具有不同頻率的多聲道音頻信號執(zhí)行渲染,3D音頻再現(xiàn)設(shè)備100可在不降低音質(zhì)的情況下使甜點(sweet spot)變寬。就是說,通過使用添加到最接近聲道的方法來對具有強(qiáng)衍射特性的低頻信號進(jìn)行渲染,可避免當(dāng)多個聲道被混合到一個輸出聲道時音質(zhì)的惡化。甜點可以是使收聽者能夠無失真地最佳地收聽3D音頻的預(yù)定范圍。隨著甜點變寬,收聽者可在寬的范圍中無失真地最佳地收聽3D音頻。當(dāng)收聽者不位于甜點處,收聽者會聽到具有失真的音質(zhì)或聲像的聲音。
[0049]混合器120可通過將經(jīng)由渲染器110平移到水平輸出聲道的輸入聲道的信號組合來輸出最終信號?;旌掀?20可以以預(yù)定區(qū)段為單位將輸入聲道的信號混合。例如,混合器120可以以幀為單位的將輸入聲道的信號混合。
[°°50] 根據(jù)實施例的混合器120可通過使用有源下混合(active downmixing)方法來對根據(jù)頻率渲染的信號進(jìn)行下混合。具體地,混合器120可通過使用有源下混合方法來對低頻信號進(jìn)行混合?;旌掀?20可通過使用基于被渲染到將被再現(xiàn)的聲道的信號的能量值確定最終信號的幅度或?qū)⒈粦?yīng)用到最終信號的增益的能量保存(power preserving)方法,對高頻信號進(jìn)行混合?;旌掀?20不僅可通過使用能量保存方法,還可通過使用除了在無需相位校準(zhǔn)的情況下對信號進(jìn)行混合的方法之外的方法來對對高頻信號進(jìn)行下混合。
[0051]在有源下混合方法中,在使用被合并到信號將被混合到的聲道的信號之間的協(xié)方差矩陣執(zhí)行下混合之前,首先對信號的相位進(jìn)行校準(zhǔn)。例如,可基于在將被下混合的信號中具有最大能量的信號對信號的相位進(jìn)行校準(zhǔn)。根據(jù)有源下混合方法,將被下混合的信號的相位被校準(zhǔn)使得在將被下混合的信號之間可發(fā)生相長干涉,因此可避免由于在下混合期間可能發(fā)生的相消干涉而導(dǎo)致的音質(zhì)失真。具體地講,當(dāng)具有反相位的相關(guān)聲音信號被輸入,并根據(jù)有源下混合方法被下混合時,可避免發(fā)生由于相消干涉而導(dǎo)致經(jīng)過下混合的聲音信號的音調(diào)改變或聲音消失的現(xiàn)象。
[0052]在虛擬渲染中,高處聲道信道通過基于HRTF的均衡器,并且3D音頻信號經(jīng)由多聲道平移被再現(xiàn)。根據(jù)所述虛擬渲染,同步的聲源經(jīng)由環(huán)繞的揚(yáng)聲器被再現(xiàn),因此具有高度感的3D音頻被輸出。具體地講,由于經(jīng)由環(huán)繞揚(yáng)聲器再現(xiàn)同步聲源,相同的雙聲道信號可被提供,因此高處聲像可被提供。
[0053]但是,當(dāng)根據(jù)有源下混合方法對信號進(jìn)行下混合時,信號的相位可變得不同,因此聲道的信號彼此不同步,因此高度感無法被提供。例如,當(dāng)在下混合期間高處聲道信號彼此不同步時,由于雙耳之間的聲音信號的到達(dá)時間差而能夠識別的高度感消失,并因此由于應(yīng)用有源下混合方法會使音質(zhì)惡化。
[0054]由于在兩耳之間的聲音信號到達(dá)時間差難以被識別,并且在低頻分量中顯著發(fā)生相位重疊,因此,混合器120可根據(jù)有源下混合方法對具有強(qiáng)衍射特征的低頻信號進(jìn)行混合?;旌掀?20可根據(jù)不包括相位校準(zhǔn)的混合方法,對具有由于在雙耳之間的聲音信號到達(dá)時間差而能夠識別的強(qiáng)高度感的高頻信號進(jìn)行混合。例如,混合器120可通過根據(jù)能量保存方法保護(hù)由于相消干涉而被抵消的能量,對高頻信號進(jìn)行混合,同時使由相消干涉引起的音質(zhì)惡化最小化。
[0055]此外,根據(jù)實施例,可通過在正交鏡像濾波器(QMF)組中將具有特定的交叉頻率或更高交叉頻率的頻帶分量視為高頻,并將剩余頻帶分量視為低頻,對低頻信號和高頻信號中的每個信號執(zhí)行渲染和混合。QMF可以是將輸入信號劃分為低頻信號和高頻信號并輸出低頻和高頻的濾波器。
[0056]有源下混合可對每個頻帶執(zhí)行有源下混合,有源下混合包括非常大量的計算,諸如將被下混合的聲道之間的協(xié)方差的計算。因此,當(dāng)僅低頻信號經(jīng)由有源下混合被混合時,計算量可被減少。例如,如果3D音頻再現(xiàn)設(shè)備100在QMF組中,在僅對以48KHz采樣的信號之中的等于或小于2.SKHz的信號和等于或大于1KHz的信號執(zhí)行相位校準(zhǔn)之后,對等于或小于2.SKHz的信號和等于或大于1KHz的信號執(zhí)行下混合,并在不進(jìn)行相位校準(zhǔn)的情況下對2.SKHz到1KHz的剩余信號執(zhí)行下混合,可減少約1/3的計算量。
[0057]此外,對于實際錄制的聲源,對于高頻信號來說,聲道信號與另一聲道同相的概率低。因此,當(dāng)高頻信號經(jīng)由有源下混合被混合時,可能執(zhí)行不必要的計算。
[0058]參照圖2,根據(jù)實施例的3D音頻再現(xiàn)設(shè)備200包括音頻分析單元210、渲染器220、混合器230和輸出單元240。圖2中的3D音頻再現(xiàn)設(shè)備200、渲染器220和混合器230與圖1中的3D音頻再現(xiàn)設(shè)備100、渲染器110和混合器120相應(yīng),因此,省略對其的多余的描述。然而,所有示出的組件是非必要的。3D音頻再現(xiàn)設(shè)備200可通過比圖2中示出的組件更多或更少的組件被實現(xiàn)。
[0059]音頻分析單元210可通過分析多聲道音頻信號來選擇渲染模式,并可從多聲道音頻信號中分離并輸出部分信號。音頻分析單元210可包括渲染模式選擇單元211和渲染信號分離單元212。
[0060]渲染模式選擇單元211可以以預(yù)定區(qū)段為單位確定在多聲道音頻信號中是否存在許多瞬態(tài)信號(諸如掌聲、雨聲等)。在下文的描述中,包括許多瞬態(tài)信號(諸如掌聲和雨聲)的音頻信號將被稱為掌聲信號。
[0061]根據(jù)實施例的3D音頻再現(xiàn)設(shè)備200可從多聲道音頻信號中分離出掌聲信號,并且根據(jù)掌聲信號的特征執(zhí)行聲道渲染和混合。
[0062]渲染模式選擇單元211可根據(jù)以幀為單位在多聲道信號中是否包括掌聲信號,將普通模式和掌聲模式之一選為清染模式。清染器220可根據(jù)由清染模式選擇單元211選擇的模式執(zhí)行渲染。就是說,渲染器220可根據(jù)選擇的模式對掌聲信號進(jìn)行渲染。
[0063]渲染模式選擇單元211可在多聲道音頻信號中不包括掌聲信號時選擇普通模式。在普通模式下,可由空間渲染器221對高處聲道信號進(jìn)行渲染,可由音色渲染器222對水平聲道信號進(jìn)行渲染。就是說,可在不考慮掌聲信號的情況下執(zhí)行渲染。
[0064]渲染模式選擇單元211可在多聲道音頻信號中包括掌聲信號時選擇掌聲模式。在掌聲模式下,可將掌聲信號分離出,并可對分離出的掌聲信號執(zhí)行音色渲染。
[0065]渲染模式選擇單元211可通過使用多聲道音頻信號中包括的或從其他裝置單獨接收的掌聲比特信息,以預(yù)定區(qū)段或幀為單位,確定在多聲道音頻信號中是否包括掌聲信號。根據(jù)基于MPEG的編解器,掌聲比特信息可包括bsTsEnable和bsTempShapeEnableChannel標(biāo)志信息,并且渲染模式選擇單元211可根據(jù)上述的標(biāo)志信息選擇渲染模式。
[0066]此外,渲染模式選擇單元211可基于多聲道音頻信號之中的期望被確定的預(yù)定區(qū)段或幀的特征,選擇渲染模式。就是說,渲染模式選擇單元211可根據(jù)多聲道音頻信號的預(yù)定區(qū)段或幀的特征是否具有包括掌聲信號的音頻信號的特征,選擇渲染模式。
[0067]渲染模式選擇單元211可基于以下條件中的至少一個條件確定在多聲道信號中是否包括掌聲信號:在多聲道音頻信號的預(yù)定區(qū)段或幀中是否存在多個輸入聲道中的無音調(diào)的寬帶信號并且與聲道相應(yīng)的寬帶信號是否具有相似的級別,短區(qū)段的脈沖是否重復(fù),以及聲道間的相關(guān)性是否為低。
[0068]當(dāng)確定多聲道音頻信號的當(dāng)前區(qū)段中包括掌聲信號時,渲染模式選擇單元211可將掌聲模式選為渲染模式。
[0069]當(dāng)渲染模式選擇單元211選擇掌聲模式時,渲染信號分離單元212可從普通聲音信號中分離出多聲道音頻信號中包括的掌聲信號。
[0070]當(dāng)基于MPEGUSAC的bsTsEnable標(biāo)志被使用時,可根據(jù)該標(biāo)志信息執(zhí)行音色渲染,而不管相應(yīng)聲道的高度,就好像水平聲道信號一樣。此外,高處聲道信號可被假設(shè)為水平聲道信號,并可根據(jù)該標(biāo)志信息被下混合。就是說,渲染信號分離單元212可根據(jù)該標(biāo)志信息分離出多聲道音頻信號中的預(yù)定區(qū)段中包括的掌聲信號,并且被分離出的掌聲信號可經(jīng)過音色渲染,就如像水平聲道信號一樣。
[0071]在沒有使用標(biāo)志的情況下,渲染信號分離單元212可在聲道之間分析信號并分離出掌聲信號分量。從高處信號中分離出的掌聲信號可經(jīng)過音色渲染,除了掌聲信號之外的信號可經(jīng)過空間渲染。
[0072]渲染器220包括空間渲染器221和音色渲染器222,其中,空間渲染器221根據(jù)空間渲染方法對高處聲道信號進(jìn)行渲染,音色渲染器222根據(jù)音色渲染方法對水平聲道信號或掌聲信號進(jìn)行渲染。
[0073]空間渲染器221通過根據(jù)頻率使用不同方法對高處聲道信號進(jìn)行渲染??臻g渲染器221可通過使用添加到最接近聲道的方法來對低頻信號進(jìn)行渲染,并可通過使用音色渲染方法對高頻信號進(jìn)行渲染。在下文中,空間渲染方法可以是對高處信號進(jìn)行渲染的方法,并可包括多聲道平移方法。
[0074]音色渲染器222可通過使用從音色渲染方法、添加到最接近聲道的方法、能量提升方法中選擇的至少一種方法來對水平聲道信號或掌聲信號進(jìn)行渲染。在下文中,音色渲染方法可以是對水平聲道信號進(jìn)行渲染的方法,并且可包括下混合方程或矢量基礎(chǔ)幅度平移(VBAP)方法。
[0075]混合器230可以以聲道為單位計算經(jīng)過渲染的信號并輸出最終信號。根據(jù)實施例的混合器230可根據(jù)有源下混合方法對根據(jù)頻率渲染的信號進(jìn)行混合。因此,根據(jù)實施例的3D音頻再現(xiàn)設(shè)備200可通過根據(jù)在相位校準(zhǔn)之后執(zhí)行下混合的有源下混合方法對低頻信號進(jìn)行混合,來減少音調(diào)失真。音調(diào)失真可由相消干涉引起。3D音頻再現(xiàn)設(shè)備200可根據(jù)在不執(zhí)行相位校準(zhǔn)的情況下執(zhí)行下混合的方法(例如,能量保存方法),對除了低頻信號以外的高頻信號進(jìn)行混合,從而防止高度感由于有源下混合方法的應(yīng)用而惡化。
[0076]輸出單元240可經(jīng)由揚(yáng)聲器最終輸出由混合器230輸出的混合后的信號。此時,輸出單元240可通過根據(jù)混合后的信號的聲道,經(jīng)由不同的揚(yáng)聲器輸出聲音信號。
[0077]圖3是根據(jù)實施例的空間渲染器301和混合器302的框圖。圖3中的空間渲染器301和混合器302與圖2中的空間渲染器221和混合器230相同,因此省略對其的多余描述。然而,所有示出的組件不是必須的。空間渲染器301和混合器302可通過比圖3中示出的組件更多或更少的組合來實現(xiàn)。
[0078]參照圖3,空間渲染器301可包括HRTF變換濾波器310、低通濾波器(LPF)320、高通濾波器(HPF) 330、添加到最接近聲道平移單元340和多聲道平移單元350。
[0079]HRTF變換濾波器310可對包括在多聲道音頻信號中的高處聲道信號執(zhí)行基于HRTF的均衡。
[0080]LPF 320可從經(jīng)過基于HRTF的均衡的高處聲道信號中分離出特定頻率范圍內(nèi)的分量,例如,等于或低于2.8KHz的低頻分量。
[0081 ] HPF 330可從經(jīng)過基于HRTF的均衡的高處聲道信號中分離出等于或高于2.8KHz的高頻分量。
[0082]不同于LPF 320和HPF 330,帶通濾波器可將2.8KHz到1KHz的頻率分量分類為高頻分量,并將其余頻率分量分類為低頻分量。
[0083]當(dāng)高處聲道被投射到水平面上時,添加到最接近聲道平移單元340可將高處聲道信號中的低頻分量渲染到最接近的聲道。
[0084]多聲道平移單元350可根據(jù)多聲道平移方法對高處聲道信號的高頻分量進(jìn)行渲染。
[0085]參照圖3,混合器302包括有源下混合模塊360和能量保存模塊370。
[0086]有源下混合模塊360可根據(jù)有源下混合方法,對由添加到最接近聲道平移單元340渲染的高處聲道信號的低頻分量進(jìn)行混合。有源下混合模塊360可根據(jù)對針對每個聲道組合的信號的相位進(jìn)行校準(zhǔn)的有源下混合方法,對低頻分量進(jìn)行混合,從而引起相長干涉。
[0087]能量保存模塊370可根據(jù)能量保存方法,對由多聲道平移單元350渲染的高處聲道信號的高頻分量進(jìn)行混合。能量保存模塊370可根據(jù)基于被分別渲染到聲道的信號的能量值確定最終信號的幅度或?qū)⒈粦?yīng)用到最終信號的增益的能量保存方法,對高頻分量進(jìn)行混合。根據(jù)實施例,能量保存模塊370可根據(jù)上述的能量保存方法對高頻分量信號進(jìn)行混合,但本發(fā)明并不限于本實施例。能量保存模塊370可根據(jù)另一種無需相位校準(zhǔn)的方法來對高頻分量信號進(jìn)行混合。
[0088]混合器302可將由有源下混合模塊360和能量保存模塊370獲得的混合后的信號組合,以輸出混合后的3D聲音信號。
[0089]現(xiàn)在將參照圖4和圖5詳細(xì)描述根據(jù)實施例的3D音頻再現(xiàn)方法。
[0090]圖4和圖5是根據(jù)實施例的3D音頻再現(xiàn)方法的流程圖。
[0091]參照圖4,在操作S401,3D音頻再現(xiàn)設(shè)備100可獲得期望被再現(xiàn)的多聲道音頻信號。
[0092]在操作S403,3D音頻再現(xiàn)設(shè)備100可對每個聲道執(zhí)行渲染。根據(jù)實施例,3D音頻再現(xiàn)設(shè)備100可根據(jù)頻率執(zhí)行渲染,但本發(fā)明不限于該實施例。3D音頻再現(xiàn)設(shè)備100可根據(jù)各種方法執(zhí)行渲染。
[0093]在操作S405,3D音頻再現(xiàn)設(shè)備100可基于有源下混合方法,對在操作S403獲得的根據(jù)頻率渲染的信號進(jìn)行混合。詳細(xì)地說,3D音頻再現(xiàn)設(shè)備100可在對包括低頻分量的第一頻率范圍執(zhí)行相位校準(zhǔn)之后,對包括低頻分量的第一頻率范圍執(zhí)行下混合,并可在不執(zhí)行相位校準(zhǔn)的情況下對包括高頻分量的第二頻率范圍執(zhí)行下混合。例如,3D音頻再現(xiàn)設(shè)備100可根據(jù)通過應(yīng)用根據(jù)針對聲道分別渲染的信號的能量值確定的增益來執(zhí)行混合使得由于相消干涉而抵消的能量可被保存的能量保存方法,對高頻分量進(jìn)行混合。
[0094]因此,根據(jù)實施例的3D音頻再現(xiàn)設(shè)備100可通過將有源下混合方法應(yīng)用到特定的頻率范圍(例如,2.8KHz到I OKHz)中的高頻分量,可使可能發(fā)生的高度感下降最小化。
[0095]圖5是圖4中的3D音頻再現(xiàn)方法中包括的針對每個頻率進(jìn)行渲染和混合的流程圖。
[0096]參照圖5,在操作S501,3D音頻再現(xiàn)設(shè)備100可獲得將被再現(xiàn)的多聲道音頻信號。當(dāng)多聲道音頻信號包括掌聲信號時,3D音頻再現(xiàn)設(shè)備100可從多聲道音頻信號中分離出掌聲信號,并根據(jù)掌聲信號的特征執(zhí)行聲道渲染和混合。
[0097]在操作S503,3D音頻再現(xiàn)設(shè)備100可從在操作S501獲得的多聲道音頻信號中分離出高處聲道信號和水平聲道信號,并可對高處聲道信號和水平聲道信號中的每個聲道信號執(zhí)行渲染和混合。換句話說,3D音頻再現(xiàn)設(shè)備100可對在高處聲道信號執(zhí)行空間渲染和混合,并對水平聲道信號執(zhí)行音色渲染和混合。
[0098]在操作S505,3D音頻再現(xiàn)設(shè)備100可通過使用HRTF變換濾波器對高處聲道信號進(jìn)行濾波,從而可提供高度感。
[0099]在操作S507,3D音頻再現(xiàn)設(shè)備100可將高處聲道信號分為高頻分量的信號和低頻分量的信號,并對高頻分量的信號和低頻分量的信號執(zhí)行混合和渲染。
[0100]在操作S509和S511,3D音頻再現(xiàn)設(shè)備100可根據(jù)空間渲染方法對高處聲道信號的高頻信號進(jìn)行渲染??臻g渲染方法可包括多聲道平移方法。多聲道平移可指多聲道音頻信號的聲道信號被分配到將被再現(xiàn)的聲道。在這種情況下,已經(jīng)應(yīng)用了平移系數(shù)的聲道信號可被分配到將被再現(xiàn)的聲道。高頻分量信號可被分配到環(huán)繞聲道,從而提供雙耳強(qiáng)度差(ILD)隨著高度感增加而減小的特征。聲音信號可通過前聲道和將被平移的多個聲道的數(shù)量而被定位。
[0101]在操作S513,3D音頻再現(xiàn)設(shè)備100可根據(jù)除了有源下混合方法以外的方法,對在操作S511獲得的經(jīng)過渲染的高頻信號進(jìn)行混合。例如,3D音頻再現(xiàn)設(shè)備100可通過使用能量保存模塊來對經(jīng)過渲染的高頻信號進(jìn)行混合。
[0102]在操作S515,3D音頻再現(xiàn)設(shè)備100可根據(jù)上述的添加到最接近聲道的平移方法,對高處聲道信號的低頻信號進(jìn)行渲染。當(dāng)多個信號(即,多聲道音頻信號中的若干聲道信號)被混合到單個聲道時,音質(zhì)由于這若干聲道信號和單個聲道的相位之間的差異被消除或者放大,導(dǎo)致音質(zhì)惡化。根據(jù)添加到最接近聲道的平移方法,當(dāng)?shù)皖l信號被投射到每個聲道水平面上時,3D音頻再現(xiàn)設(shè)備100可將低頻信號與最接近的聲道映射,從而防止音質(zhì)惡化。
[0103]當(dāng)多聲道音頻信號是頻率信號或濾波器組信號時,與低頻相應(yīng)的頻段(bin)或頻帶(band)可根據(jù)添加到最接近聲道平移方法而被渲染,與高頻相應(yīng)的頻段或頻帶可根據(jù)多聲道平移方法而被渲染。頻段或頻帶可表示在頻域中與預(yù)定單位相應(yīng)的信號部分。
[0104]在操作S521,3D音頻再現(xiàn)設(shè)備100可根據(jù)能量保存方法,對在操作S519獲得的經(jīng)過渲染的水平聲道信號進(jìn)行混合。
[0105]在操作S523,3D音頻再現(xiàn)設(shè)備100可對高處聲道信號和水平聲道信號進(jìn)行混合以輸出混合后的最終信號。
[0106]圖6是示出根據(jù)實施例的有源下混合方法的示例的曲線圖。
[0107]當(dāng)信號610和信號620被混合時,這兩個信號610和620彼此不同相,因此兩者間可能發(fā)生相消干涉,導(dǎo)致音質(zhì)的失真。因此,根據(jù)有源下混合方法,具有相對小能量的信號610的相位與信號620的相位對準(zhǔn),相位被校準(zhǔn)的信號610和620可被混合。參照混合后的信號630,由于信號610的相位后移,可能發(fā)生相長干涉。
[0108]圖7是根據(jù)另一實施例的3D音頻再現(xiàn)設(shè)備的結(jié)構(gòu)框圖。圖7中的3D音頻再現(xiàn)設(shè)備大致可包括核心解碼器710和格式轉(zhuǎn)換器730。
[0109]參照圖1,核心解碼器710對比特流進(jìn)行解碼以輸出具有多個輸入聲道的音頻信號。根據(jù)實施例,核心解碼器710根據(jù)語音和音頻統(tǒng)一編碼(USAC)算法進(jìn)行操作,但是本發(fā)明不限于此。在這種情況下,核心解碼器110可輸出例如具有22.2聲道格式的音頻信號。核心解碼器710可通過對下混合后的信號或比特流中包括的立體聲聲道進(jìn)行上混合,輸出例如具有22.2聲道格式的音頻信號。根據(jù)再現(xiàn)環(huán)境,聲道可以指揚(yáng)聲器。
[0110]格式轉(zhuǎn)換器730被包括以對聲道的格式進(jìn)行轉(zhuǎn)換,并可使用下混合器還實現(xiàn),其中,下混合器將接收到的具有多個輸入聲道的聲道結(jié)構(gòu)轉(zhuǎn)換為到具有期望的再現(xiàn)格式的多個輸出聲道。輸出聲道的數(shù)量少于輸入聲道的數(shù)量。多個輸入聲道可包括多個水平聲道和至少一個具有高度的垂直聲道。每個垂直聲道可以是能通過位于收聽者的頭頂上方的揚(yáng)聲器輸出聲音信號的聲道,從而使收聽者能夠感受到高度。每個水平聲道可以是能通過與收聽者處于同一水平面的揚(yáng)聲器輸出聲音信號的聲道。多個輸出聲道可僅包括水平聲道。
[0111]格式轉(zhuǎn)換器730可根據(jù)再現(xiàn)布局,將從核心解碼器710接收到的具有22.2聲道格式的輸入聲道轉(zhuǎn)換為具有5.0或5.1聲道格式的輸出聲道。輸入聲道或輸出聲道可具有各種格式。格式轉(zhuǎn)換器730可基于信號特征,根據(jù)渲染類型,使用不同的下混合矩陣。也就是說,下混合器可對子帶域(例如,QMF域)內(nèi)的信號執(zhí)行自適應(yīng)的下混合處理。根據(jù)另一實施例,當(dāng)再現(xiàn)布局僅包括水平聲道時,格式轉(zhuǎn)換器730可通過對輸入聲道執(zhí)行垂直渲染來提供具有高度的高處聲像。高處聲像可被提供給環(huán)繞聲道揚(yáng)聲器,但本發(fā)明不限于此。
[0112]格式轉(zhuǎn)換器730可根據(jù)不同類型的聲道,對多個輸入聲道執(zhí)行不同類型的渲染。不同的基于HRTF的均衡器可根據(jù)作為垂直聲道(S卩,高處聲道)的輸入聲道的類型而被使用。根據(jù)作為垂直聲道(即,高處聲道)的輸入聲道的類型,相同的平移系數(shù)可被應(yīng)用到所有的頻率,或不同的平移系數(shù)可被應(yīng)用到不同的頻率范圍。
[0113]具體地,可使用添加到最接近聲道的平移方法來對輸入聲道之中的特定垂直聲道(例如,諸如等于或低于2.8KHz的低頻信號或者等于或高于1KHz的高頻信號的第一頻率范圍信號)進(jìn)行渲染,而可使用多聲道平移方法對2.SKHz到1KHz的第二頻率范圍信號進(jìn)行渲染。根據(jù)添加到最接近聲道的平移方法,輸入聲道可被平移到多個輸出聲道中的最接近的信號輸出聲道,而不是被渲染到幾個聲道。根據(jù)多聲道平移方法,可通過使用針對將被渲染的不同輸出聲道而設(shè)置的不同增益,將每個輸入聲道平移到至少一個水平聲道。
[0114]當(dāng)多個輸入聲道包括N個垂直聲道和M個水平聲道時,格式轉(zhuǎn)換器730可將N個垂直聲道中的每個垂直聲道渲染到多個輸出聲道,將M個水平聲道中的每個水平聲道渲染到多個輸出聲道,并可對渲染結(jié)果進(jìn)行混合以產(chǎn)生與再現(xiàn)布局相應(yīng)的多個最終輸出聲道。
[0115]圖8是根據(jù)實施例音頻渲染設(shè)備的框圖。參照圖8,音頻渲染設(shè)備包括第一渲染器810和第二渲染器830。第一渲染器810和第二渲染器830可基于渲染類型進(jìn)行操作。渲染器類型可由編碼器端基于音頻場景來確定,并可以以標(biāo)志的形式被傳輸。根據(jù)實施例,可基于帶寬以及音頻信號的相關(guān)度來確定。例如,在一幀內(nèi)的音頻場景具有寬帶和高去相關(guān)特性的情況和其他情況下,可區(qū)分渲染類型。
[0116]參照圖8,在音頻場景具有寬帶并在幀內(nèi)去相關(guān)性很高的情況下,第一渲染器810可通過使用第一下混合矩陣執(zhí)行音色渲染。音色渲染可被應(yīng)用到瞬態(tài)信號,如掌聲或雨聲。
[0117]在不應(yīng)用音色渲染的其他情況下,第二渲染器830可通過使用第二下混合矩陣執(zhí)行高度渲染或空間渲染,從而將具有高度感的聲像提供給多個輸出聲道。
[0118]第一渲染器810和第二渲染器830可針對在初始化階段中給出的輸入聲道格式和輸出聲道格式產(chǎn)生下混合參數(shù),即,下混合矩陣。為此,可使用用于從預(yù)先設(shè)定的轉(zhuǎn)換規(guī)則列表中選擇最合適于每個輸入聲道的映射規(guī)則的算法。每個規(guī)則與將一個輸入聲道到至少一個輸出聲道的映射相關(guān)。輸入聲道可與單個信號輸出聲道映射,可與兩個輸出聲道映射,可與多個輸出聲道映射,或者可與根據(jù)頻率而具有不同平移系數(shù)的多個輸出聲道映射。
[0119]可根據(jù)構(gòu)成期望的再現(xiàn)布局的輸出聲道選擇每個輸入聲道的最佳映射。作為映射的結(jié)果,下混合增益連同被應(yīng)用到每個輸入聲道的均衡器可被定義。
[0120]圖9是根據(jù)另一實施例的音頻渲染設(shè)備的框圖。參照圖9,音頻渲染設(shè)備可大致包括濾波器910、相位校準(zhǔn)單元930和下混合器950。圖9中的音頻渲染設(shè)備可獨立地操作,或可被包括在圖7的格式轉(zhuǎn)換器730中或圖8的第二渲染器830中。
[0121]參照圖9,濾波器910可用作帶通濾波器以從在解碼器輸出中的垂直輸入聲道信號中濾波出特定頻率范圍的信號。根據(jù)實施例,濾波器910可從剩余的頻率分量中區(qū)分出
2.8KHz到I OKHz的頻率分量。2.8KHz到I OKHz的頻率分量可在無改變的情況下被提供給下混合器950,剩余的頻率分量可被提供給相位調(diào)整單元930。在水平輸入聲道的情況下,由于在所有頻率范圍內(nèi)的頻率分量經(jīng)過相位調(diào)整,濾波器910可能不是必須的。
[0122]相位校準(zhǔn)單元930可對除了 2.8KHz到1KHz以外的頻率范圍內(nèi)的頻率分量執(zhí)行相位校準(zhǔn)。經(jīng)過相位校準(zhǔn)的頻率分量(即,等于或低于2.8KHz或者等于或高于1KHz的頻率分量)可被提供給下混合器950。
[0123]下混合器950可針對從濾波器910或相位校準(zhǔn)單元930接收的頻率分量執(zhí)行下混入口 ο
[0124]圖10是根據(jù)實施例的音頻渲染方法的流程圖,并可與圖9中的音頻渲染設(shè)備相應(yīng)。
[0125]參照圖10,在操作S1010,音頻渲染設(shè)備可接收多聲道音頻信號。詳細(xì)地說,在操作S1010,音頻渲染設(shè)備可接收多聲道音頻信號中包括的高處聲道信號(S卩,垂直聲道信號)。
[0126]在操作S1030,音頻渲染設(shè)備可根據(jù)預(yù)定的頻率范圍確定下混合方法。
[0127]在操作S1050,音頻渲染設(shè)備可在對高處聲道信號的分量中的除了預(yù)設(shè)頻率范圍之外的頻率范圍的分量執(zhí)行相位校準(zhǔn)之后,對該分量執(zhí)行下混合。
[0128]在操作S1070,音頻渲染設(shè)備可在不執(zhí)行相位校準(zhǔn)的情況下,對高處聲道信號的分量中的預(yù)設(shè)頻率范圍的分量執(zhí)行下混合。
[0129]圖11是根據(jù)另一實施例的音頻渲染方法的流程圖,并可與圖8中的音頻渲染設(shè)備相應(yīng)。
[0130]參照圖11,在操作S1110,音頻渲染設(shè)備可接收多聲道音頻信號。
[0131 ]在操作SI 130,音頻渲染設(shè)備可檢查渲染類型。
[0132]在操作S1150,當(dāng)渲染類型是音色渲染時,音頻渲染設(shè)備可通過使用第一下混合矩陣執(zhí)行下混合。
[0133]在操作S1170,當(dāng)渲染類型是空間渲染時,音頻渲染設(shè)備可通過使用第二下混合矩陣執(zhí)行下混合。用于空間渲染的第二下混合矩陣包括空間高度濾波器系數(shù)和多聲道平移系數(shù)。
[0134]上述的實施例是本發(fā)明的組件和特征在預(yù)定的形式上的組合。除非明確地描述,否則每個組件和特征可被認(rèn)為是可選擇的。每個組件和特征可在無需與其他組件或特性組合的情況下被實現(xiàn)。一些組件和/或特征可以彼此組合以構(gòu)成實施例。實施例中描述的操作的順序可以被改變。在一個實施例中的一些組件或特征可被包括在另一個實施例中,或可被另一個實施例中的相應(yīng)組件或特征替換。因此,顯然,沒有明確地指定相互的關(guān)系的權(quán)利要求可被組合以構(gòu)成實施例,或可在提交申請之后經(jīng)過修改作為新的權(quán)利要求而被包括。
[0135]實施例可通過各種手段(例如,硬件、固件、軟件或者它們的組合)被實施。當(dāng)實施例通過硬件實施時,實施例可通過至少一個專用集成電路(ASIC)、至少一個數(shù)字信號處理器(DSP)、至少一個數(shù)字信號處理裝置(DSPD)、至少一個可編程邏輯裝置(PLD)、至少一個現(xiàn)場可編程門陣列(FPGA)、至少一個處理器、至少一個控制器、至少一個微控制器或至少一個微處理器被實施。
[0136]當(dāng)實施例通過固件或軟件被實施時,該實施例能夠通過使用模塊、程序、函數(shù)等等被寫成計算機(jī)程序來執(zhí)行上述的功能和操作,并能在使用計算機(jī)可讀記錄介質(zhì)執(zhí)行程序的通用數(shù)字計算機(jī)中被實施。在上述實施例中可使用的數(shù)據(jù)結(jié)構(gòu)、程序命令或數(shù)據(jù)文件可通過若干方法被記錄在計算機(jī)可讀記錄介質(zhì)中。計算機(jī)可讀記錄介質(zhì)是可存儲由計算機(jī)系統(tǒng)隨后讀取的數(shù)據(jù)并可位于處理器內(nèi)部或外部的任何類型的存儲裝置。計算機(jī)可讀記錄介質(zhì)的示例可包括磁介質(zhì)、磁光介質(zhì)和專門被配置為存儲并執(zhí)行程序命令的硬件裝置(諸如,只讀存儲器(R0M)、隨機(jī)存取存儲器(RAM)或閃存。計算機(jī)可讀記錄介質(zhì)也可以是傳輸指定程序命令、數(shù)據(jù)結(jié)構(gòu)等等的信號的傳輸介質(zhì)。程序命令的示例可包括可由計算機(jī)通過使用注釋器等執(zhí)行的高級語言代碼以及由編譯器產(chǎn)生的機(jī)器語言代碼。此外,這里描述的實施例能夠使用用于電子配置、信號處理和/或控制、數(shù)據(jù)處理等等的任何數(shù)量的常規(guī)技術(shù)。詞語“機(jī)制”、“元件”、“手段”、“配置”被廣泛使用,并不局限于機(jī)械或物理的實施例,而是可包括與處理器結(jié)合的軟件例程等。
[0137]在此示出和描述的具體實施是說明性的示例,不意圖以任何形式限制本發(fā)明的范圍。為簡明起見,傳統(tǒng)的電子產(chǎn)品、控制系統(tǒng)、軟件開發(fā)和本系統(tǒng)的其他功能方面可能沒有被詳細(xì)的描述。此外,在呈現(xiàn)的各圖中示出的連接線或連接器旨在表示各個元件之間的示例性功能關(guān)系和/或物理或邏輯的耦合。應(yīng)該指出的是,許多替代的或額外的功能關(guān)系、物理連接或邏輯連接可以存在于一個實用設(shè)備中。
[0138]在描述本發(fā)明的上下文中(特別是在權(quán)利要求的上下文中)對術(shù)語“一”和“一個”和“該”和類似指示物的使用被解釋為包括單數(shù)和復(fù)數(shù)。此外,除非另有說明,否則文中值的范圍的詳述僅僅旨在用作單獨地將每個單獨的值指定為落入該范圍內(nèi)的速記方法,每個單獨的值被結(jié)合到說明書中,就好像它在此被單獨的列舉。另外,本文所描述的所有的方法的步驟可以以任何合適的順序被執(zhí)行,除非在此另有說明或與上下文明顯矛盾。本發(fā)明不局限于這些步驟的描述順序。對于任何或所有的示例或在此提供的示例性語言(例如,“諸如”)僅僅是為了更好地說明本發(fā)明構(gòu)思,除非另有聲明,否則不對發(fā)明構(gòu)思的范圍構(gòu)成限制。不脫離本發(fā)明的精神和范圍的眾多修改和調(diào)整對于本領(lǐng)域的普通技術(shù)人員來說將明顯。
【主權(quán)項】
1.一種三維音頻再現(xiàn)方法,包括: 接收包括多個輸入聲道的多聲道信號; 根據(jù)所述多聲道信號的頻率范圍執(zhí)行下混合以將所述多個輸入信道格式轉(zhuǎn)換為具有高度感的多個輸出聲道。2.如權(quán)利要求1所述的三維音頻再現(xiàn)方法,其中,執(zhí)行下混合的步驟包括:在對所述多聲道信號的第一頻率范圍進(jìn)行相位校準(zhǔn)之后,對所述多聲道信號的第一頻率范圍執(zhí)行下混合,并在不進(jìn)行相位校準(zhǔn)的情況下對所述多聲道信號的剩余的第二頻率范圍執(zhí)行下混合。3.如權(quán)利要求2所述的三維音頻再現(xiàn)方法,其中,第一頻率范圍具有比預(yù)定頻率更低的頻帶。4.如權(quán)利要求1所述的三維音頻再現(xiàn)方法,其中,所述多個輸出聲道包括水平聲道。5.如權(quán)利要求1所述的三維音頻再現(xiàn)方法,其中,執(zhí)行下混合的步驟包括:基于所述多聲道信號的特征,應(yīng)用不同的下混合矩陣。6.如權(quán)利要求5所述的三維音頻再現(xiàn)方法,其中,所述多聲道信號的特征包括帶寬和相關(guān)度。7.如權(quán)利要求1所述的三維音頻再現(xiàn)方法,其中,執(zhí)行下混合的步驟包括:根據(jù)比特流中包括的渲染類型,應(yīng)用音色渲染和空間渲染之一。8.如權(quán)利要求7所述的三維音頻再現(xiàn)方法,其中,渲染類型是根據(jù)所述多聲道信號的特征是否是瞬態(tài)而被確定的。9.一種非暫時性計算機(jī)可讀記錄介質(zhì),其中,在所述非暫時性計算機(jī)可讀記錄介質(zhì)上記錄了計算機(jī)程序,當(dāng)該計算機(jī)程序被計算機(jī)運(yùn)行時,該計算機(jī)程序執(zhí)行如權(quán)利要求1-8之一所述的方法。10.一種三維音頻再現(xiàn)設(shè)備,包括: 核心解碼器,被配置為對比特流進(jìn)行解碼; 格式轉(zhuǎn)換器,被配置為從核心解碼器接收包括多個輸入聲道的多聲道信號,并被配置為根據(jù)所述多聲道信號的頻率范圍執(zhí)行下混合以將所述多個輸入聲道渲染成具有高度感的多個輸出聲道。11.如權(quán)利要求10所述的三維音頻再現(xiàn)設(shè)備,其中,格式轉(zhuǎn)換器在對所述多聲道信號的第一頻率范圍進(jìn)行相位校準(zhǔn)之后,對所述多聲道信號的第一頻率范圍執(zhí)行下混合,并在不進(jìn)行相位校準(zhǔn)的情況下對所述多聲道信號的剩余的第二頻率范圍執(zhí)行下混合。12.如權(quán)利要求11所述的三維音頻再現(xiàn)設(shè)備,其中,第一頻率范圍包括低頻分量。13.如權(quán)利要求10所述的三維音頻再現(xiàn)設(shè)備,其中,所述多個輸出聲道包括水平聲道。14.如權(quán)利要求10所述的三維音頻再現(xiàn)設(shè)備,其中,格式轉(zhuǎn)換器根據(jù)比特流中包括的渲染類型,應(yīng)用音色渲染和空間渲染之一。15.如權(quán)利要求14所述的三維音頻再現(xiàn)設(shè)備,其中,渲染類型是基于所述多聲道信號的特征以幀為單位而被設(shè)置的。
【文檔編號】H04S3/00GK106063297SQ201580012023
【公開日】2016年10月26日
【申請日】2015年1月12日 公開號201580012023.7, CN 106063297 A, CN 106063297A, CN 201580012023, CN-A-106063297, CN106063297 A, CN106063297A, CN201580012023, CN201580012023.7, PCT/2015/303, PCT/KR/15/000303, PCT/KR/15/00303, PCT/KR/2015/000303, PCT/KR/2015/00303, PCT/KR15/000303, PCT/KR15/00303, PCT/KR15000303, PCT/KR1500303, PCT/KR2015/000303, PCT/KR2015/00303, PCT/KR2015000303, PCT/KR201500303
【發(fā)明人】田相培, 金善民
【申請人】三星電子株式會社