處理音頻信號的設(shè)備及其方法
【專利說明】
[0001] 本申請是2012年7月6日提交的國際申請日為2011年1月6日的申請?zhí)枮?201180005568. 7 (PCT/KR2011/000075)的,發(fā)明名稱為"處理音頻信號的設(shè)備及其方法"專 利申請的分案申請。
技術(shù)領(lǐng)域
[0002] 本發(fā)明涉及一種用于處理音頻信號的設(shè)備及其方法。雖然本發(fā)明適合于寬范圍的 應(yīng)用,但是它特別適合于編碼或解碼音頻信號。
【背景技術(shù)】
[0003] 通常,在用于將多個對象下混合為單聲道或立體聲信號的處理中,分別從對象信 號提取參數(shù)。這些參數(shù)可用于解碼器。并且,經(jīng)由用戶進行的選擇來控制對象中的每個的 平移(panning)和增益。
【發(fā)明內(nèi)容】
[0004] 技術(shù)問題
[0005] 然而,為了控制每個對象信號,需要適當(dāng)?shù)囟ㄎ换蚱揭圃谙禄旌现邪ǖ拿總€源。
[0006] 此外,對象參數(shù)需要通過聲道定向的解碼方案來被靈活地轉(zhuǎn)換為用于上混合的多 聲道參數(shù),以提供向下的兼容性。
[0007] 技術(shù)解決方案
[0008] 因此,本發(fā)明涉及一種用于處理音頻信號的設(shè)備及其方法,所述設(shè)備及其方法實 質(zhì)上消除了由于現(xiàn)有技術(shù)的限制和缺點導(dǎo)致的問題中的一個或多個。
[0009] 本發(fā)明的一個目的是提供一種用于處理音頻信號的設(shè)備及其方法,通過所述設(shè)備 及其方法,控制對象的增益或平移以輸出單聲道信號、立體聲信號或多聲道信號。
[0010] 本發(fā)明的另一個目的是提供一種用于處理音頻信號的設(shè)備及其方法,通過所述設(shè) 備及其方法,當(dāng)用戶調(diào)整對象的增益或平移時,可以控制由于過度抑制或提升特定對象的 增益或平移而產(chǎn)生的失真。
[0011] 本發(fā)明的另一個目的是提供一種用于處理音頻信號的設(shè)備及其方法,通過所述設(shè) 備及其方法,可以以與控制常規(guī)對象的失真不同的方式來控制歸因于在卡拉OK模式或獨 奏模式等中過度抑制特定對象中的過度渲染導(dǎo)致的失真。
[0012] 本發(fā)明的另一個目的是提供一種用于處理音頻信號的設(shè)備及其方法,通過所述設(shè) 備及其方法,可以在修改控制以防止由于用戶的控制導(dǎo)致失真中、經(jīng)由要由用戶識別的接 口輸出修改的渲染結(jié)果。
[0013] 本發(fā)明的另一個目的是提供一種用于處理音頻信號的設(shè)備及其方法,通過所述設(shè) 備及其方法,可以根據(jù)用戶的意圖來禁止用于防止失真的控制。
[0014] 有益效果
[0015] 因此,本發(fā)明提供了下面的效果或優(yōu)點。
[0016] 首先,在控制對象的增益和平移中,本發(fā)明限制過度渲染,由此增強聲音質(zhì)量。
[0017] 其次,當(dāng)在卡拉OK模式或獨奏模式的情況下需要過度控制對象信號時,本發(fā)明能 夠使用獨立的控制限制信息來有效率地對控制執(zhí)行限制。
[0018] 第三,在對于由用戶輸入的控制施加限制的情況下,本發(fā)明經(jīng)由接口來輸出被限 制的控制,由此通過向用戶通知修改或改變了用戶特定的控制來更有效率地執(zhí)行控制。
[0019] 第四,在用戶試圖100%地應(yīng)用用戶控制而不管聲音質(zhì)量劣化存在或不存在的情 況下,本發(fā)明關(guān)斷用于失真防止的控制,并且跳過控制限制信息,由此使得用戶能夠執(zhí)行用 戶特定的渲染。
【附圖說明】
[0020] 附圖被包括來提供本發(fā)明的進一步的理解并且被包含到本說明書中并且構(gòu)成其 一部分,附圖圖示本發(fā)明的實施例,并且與說明書一起用于解釋本發(fā)明的原理。
[0021] 在附圖中:
[0022] 圖1是根據(jù)本發(fā)明的一個實施例的音頻信號處理設(shè)備的配置的框圖;
[0023] 圖2是根據(jù)本發(fā)明的第一實施例的在音頻信號處理設(shè)備中的解碼器的配置的框 圖;
[0024] 圖3是根據(jù)本發(fā)明的一個實施例的在圖2中所示的提取單元220的配置的詳細框 圖;
[0025] 圖4是在圖2中所示的控制限制單元230的、根據(jù)第一實施例230A的配置的詳細 框圖;
[0026] 圖5是在圖2中所示的控制限制單元230的、根據(jù)第二實施例230B的配置的詳細 框圖;
[0027] 圖6是用于在圖2中所示的用戶界面250的屏幕配置的一個示例的圖;
[0028] 圖7是用于在圖2中所示的用戶界面250上顯示的屏幕中的修改的控制信息的一 個示例的圖;
[0029] 圖8是根據(jù)本發(fā)明的第二實施例的在音頻信號處理設(shè)備中的解碼器的配置的框 圖;
[0030] 圖9是在圖8中所示的控制限制單元330的、根據(jù)第一實施例330A的配置的詳細 框圖;
[0031] 圖10是在圖8中所示的控制限制單元330的、根據(jù)第二實施例330B的配置的詳 細框圖;
[0032] 圖11是在圖8中所示的控制限制單元330的、根據(jù)第三實施例330B的配置的詳 細框圖;
[0033] 圖12是用于在圖8中所示的用戶界面340上顯示的屏幕上控制限制模式關(guān)斷命 令的輸入的屏幕配置的一個示例的圖;
[0034] 圖13是用于在圖8中所示的用戶界面340上顯示的屏幕中顯示的用戶輸入屏幕 和修改的控制信息顯示屏幕的一個示例的圖;
[0035] 圖14是其中實現(xiàn)根據(jù)本發(fā)明的一個實施例的音頻信號處理設(shè)備的產(chǎn)品的示意框 圖;以及
[0036] 圖15是用于描述在其中實現(xiàn)了根據(jù)本發(fā)明的一個實施例的音頻信號處理設(shè)備的 產(chǎn)品之間的關(guān)系的圖。
【具體實施方式】
[0037] 本發(fā)明的其他特征和優(yōu)點將在隨后的說明書中闡述,并且,將從說明書中部分地 顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在所撰寫的說明 書、其權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
[0038] 為了實現(xiàn)這些和其他優(yōu)點并且根據(jù)本發(fā)明的目的,如體現(xiàn)和廣泛描述的,提供了 一種用于處理音頻信號的方法,包括:接收下混合信號和邊信息;提取擴展類型標(biāo)識符,所 述擴展類型標(biāo)識符用于指示擴展區(qū)域是否包括來自所述邊信息的殘余信號;當(dāng)所述擴展類 型標(biāo)識符指示所述擴展區(qū)域包括所述殘余信號時,從所述邊信息提取用于殘余使用模式的 控制限制信息;接收用于控制至少一個對象信號的增益或平移的控制信息;基于所述控制 信息和所述控制限制信息來估計修改的控制信息;使用所述殘余信號從所述下混合信號獲 得增強的對象信號和一個或多個常規(guī)對象信號中的至少一個;以及,使用所述修改的控制 信息與增強的對象信號和一個或多個常規(guī)對象信號中的至少一個來產(chǎn)生輸出信號,其中, 在所述殘余使用模式的情況下,用于殘余使用模式的所述控制限制信息與用于指示所述控 制信息的限制程度的參數(shù)相關(guān)。
[0039] 根據(jù)本發(fā)明,產(chǎn)生所述輸出信號包括:基于所述修改的控制信息和對象信息來產(chǎn) 生下混合處理信息;以及,通過向所述增強的對象信號和一個或多個常規(guī)對象信號中的至 少一個應(yīng)用所述修改的控制信息來產(chǎn)生所述輸出信號。
[0040] 根據(jù)本發(fā)明,所述輸出信號的聲道的數(shù)量等于所述下混合信號的聲道的數(shù)量。
[0041] 根據(jù)本發(fā)明,所述至少一個對象信號包括所述增強的對象信號和一個或多個常規(guī) 對象信號。
[0042] 根據(jù)本發(fā)明,所述控制信息包括用于控制整個一個或多個常規(guī)對象信號的增益的 一個參數(shù)。
[0043] 根據(jù)本發(fā)明,當(dāng)所述擴展類型標(biāo)識符指示所述擴展區(qū)域包括所述殘余信號時,所 述控制信息包括用于指示卡拉OK模式和獨奏模式之一的模式選擇信息。
[0044] 為了進一步實現(xiàn)這些和其他優(yōu)點并且根據(jù)本發(fā)明的目的,提供了一種用于處理音 頻信號的設(shè)備,包括:解復(fù)用器,其用于接收下混合信號和邊信息;提取單元,其用于提取 擴展類型標(biāo)識符,所述擴展類型標(biāo)識符用于指示擴展區(qū)域是否包括來自所述邊信息的殘余 信號,并且當(dāng)所述擴展類型標(biāo)識符指示所述擴展區(qū)域包括所述殘余信號時,所述提取單元 從所述邊信息提取用于殘余使用模式的控制限制信息;控制限制單元,其用于接收用于控 制至少一個對象信號的增益或平移的控制信息,并且基于所述控制信息和所述控制限制信 息來估計修改的控制信息;殘余處理單元,其用于使用所述殘余信號從所述下混合信號獲 得增強的對象信號和一個或多個常規(guī)對象信號中的至少一個;以及,對象解碼器,其用于使 用所述修改的控制信息與增強的對象信號以及一個或多個常規(guī)對象信號中的至少一個來 產(chǎn)生輸出信號,其中,在所述殘余使用模式的情況下,用于殘余使用模式的所述控制限制信 息與用于指示所述控制信息的限制程度的參數(shù)相關(guān)。
[0045] 根據(jù)本發(fā)明,所述對象解碼器包括:信息產(chǎn)生單元,其用于基于所述修改的控制信 息和對象信息來產(chǎn)生下混合處理信息;以及,下混合處理單元,其用于通過向所述增強的對 象信號以及一個或多個常規(guī)對象信號中的至少一個應(yīng)用所述修改的控制信息來產(chǎn)生所述 輸出信號。
[0046] 根據(jù)本發(fā)明,所述輸出信號的聲道的數(shù)量等于所述下混合信號的聲道的數(shù)量。
[0047] 根據(jù)本發(fā)明,所述至少一個對象信號包括所述增強的對象信號和一個或多個常規(guī) 對象信號。
[0048] 根據(jù)本發(fā)明,所述控制信息包括用于控制整個一個或多個常規(guī)對象信號的增益的 一個參數(shù)。
[0049] 根據(jù)本發(fā)明,當(dāng)所述擴展類型標(biāo)識符指示所述擴展區(qū)域包括所述殘余信號時,所 述控制信息包括用于指示卡拉OK模式和獨奏模式之一的模式選擇信息。
[0050] 為了進一步實現(xiàn)這些和其他優(yōu)點并且根據(jù)本發(fā)明的目的,提供了一種用于處理音 頻信號的方法,包括:接收下混合信號和邊信息;從所述邊信息提取控制限制信息;接收用 于控制至少一個對象信號的增益或平移的控制信息;基于所述控制信息和對象信息而不使 用所述控制限制信息來產(chǎn)生第一多聲道信息和第一下混合處理信息中的至少一個;以及, 通過向所述下混合信號應(yīng)用所述第一多聲道信息和所述第一下混合處理信息中的至少一 個來產(chǎn)生輸出信號,其中,提供與用于指示所述控制信息的限制程度的參數(shù)相關(guān)的所述控 制限制信息。
[0051] 根據(jù)本發(fā)明,所述方法進一步包括從所述邊信息提取關(guān)斷使能信息,其中,所述關(guān) 斷使能信息指示是否必須使用或可以選擇性地使用所述控制限制信息。
[0052] 根據(jù)本發(fā)明,當(dāng)所述關(guān)斷使能信息指示可以選擇性地使用所述控制限制信息時, 在不使用所述控制限制信息的情況下,產(chǎn)生所述第一多聲道信息和所述第一下混合處理信 息。<