專利名稱:用于處理音頻信號的方法和設備的制作方法
技術領域:
本發(fā)明涉及一種用于獨立地控制從音頻信號提取的語音信號的音量的設備及其 方法,更具體地涉及一種用于通過將與相位被反轉的、左右信道中的一個信道對應的增益 值的相位反轉來獨立地控制語音信號的音量的設備及其方法。
背景技術:
通常,使用音頻放大技術來在家庭娛樂系統(tǒng)、立體聲系統(tǒng)、和其他消費電子裝置中 放大低頻信號,并且實現(xiàn)各種收聽環(huán)境(例如,音樂廳等)。例如,獨立的對話音量(SDV)表 示如下一種技術,其用于從立體聲/多信道音頻信號提取語音信號(例如,對話),然后獨立 地控制所提取的語音信號的音量,以便解決難于在觀看電視或電影時提供語音的問題。
發(fā)明內(nèi)容
通常,一種用于控制在音頻/視頻信號中包括的語音信號的音量的方法和設備能 夠在諸如電視接收機、數(shù)字多媒體廣播(DMB)播放機和個人媒體播放機(PMP)等的、用于回 放音頻信號的各種裝置中,根據(jù)由用戶發(fā)出的請求來有效地控制語音信號。然而,當左右信道信號的相位由于諸如在傳輸中的誤差的原因或者被有意地被反 轉時,盡管在單信道信號的情況下如果在左右信道信號之間的相關性具有負值,例如,如果 輸入信號被較寬地擴展而不是集中在聲音上的特定點,則因為SDV算法的特性,所述對應 的信號不被識別為語音信號。因此,不能控制對應的音量。同時,需要根據(jù)由用戶發(fā)出的請求來人為地控制SDV算法的操作,對于使用電視 接收機等的用戶而言可能造成不便。技術方案因此,本發(fā)明涉及一種用于獨立地控制從音頻信號提取的語音信號的音量的設備 及其方法,該設備及其方法基本上消除了由于現(xiàn)有技術的限制和缺點導致的問題中的一個 或多個。本發(fā)明的目的是提供一種用于獨立地控制反相音頻信號的語音信號的音量的設 備及其方法,在其中,通過用于確定輸入信號是否是相位被反轉的、包括左右信道的反相單 信道信號的處理,與所述音頻信號的一個信道對應的最后增益值的符號被改變,或與所述 音頻信號的一個信道對應的最后增益的值被調(diào)整。本發(fā)明的另一個目的是提供一種用于通過自動地控制啟動SDV的定時點來獨立 地控制語音信號的音量的設備。有益效果因此,本發(fā)明提供了下面的效果或優(yōu)點。首先,在反相輸入音頻信號中,能夠通過改變最后增益的符號或調(diào)整與所述音頻 信號的左右信道中的一個信道對應的所述最后增益的值來控制語音信號的音量。其次,在反相輸入音頻信號中,能夠通過反轉所述音頻信號的左信道或右信道的相位來控制語音信號的音量。第三,通過確定輸入的音頻信號的信道間相關性,能夠查看所述輸入音頻信號的 相位是否被反轉。第四,通過自動地控制啟動SDV的定時點,能夠獨立地控制語音信號的音量。
附圖被包括來進一步理解本發(fā)明,并且被包含在本說明書中并且構成本說明書的 一部分,附示本發(fā)明的實施例,并且與描述一起用于解釋本發(fā)明的原理。在附圖中圖1是用于經(jīng)由TV等來回放音頻信號的處理的圖;圖2是用于在一般的單信道信號環(huán)境或反相單信道信號環(huán)境中經(jīng)由TV等來回放 音頻信號的處理的圖;圖3是用于音頻信號控制技術的混合模型的圖;圖4是使用時間-頻率網(wǎng)格的立體聲信號的分析的圖;圖5是根據(jù)本發(fā)明的實施例的、包括反相檢測單元的語音信號控制系統(tǒng)的框圖;圖6是根據(jù)本發(fā)明的實施例的、包括自動SDV檢測單元的語音信號控制系統(tǒng)的框 圖;圖7是根據(jù)本發(fā)明的實施例的、由于所檢測的聲音的特性而導致的語音信號處理 設備的框圖;圖8是根據(jù)本發(fā)明的實施例的、包括ICLD檢測單元的語音信號控制系統(tǒng)的框圖;圖9是遙控器的部分視圖,該遙控器包括遙控器音量按鈕,該遙控器音量按鈕具 有用于控制對話音量的SDV控制器;圖10和圖11是用于經(jīng)由電視接收機的OSD (在屏顯示)來通知對話音量控制信 息的方法的圖;以及圖12是執(zhí)行對話放大技術的數(shù)字電視機系統(tǒng)1200的示例的框圖。
具體實施例方式本發(fā)明的另外的特征和優(yōu)點將在隨后的描述中被給出,并且根據(jù)該描述,部分的 特征和優(yōu)點將變得顯而易見,或可以通過本發(fā)明的實施來學習本發(fā)明的另外的特征和優(yōu) 點。將通過在書面描述及其權利要求以及附圖中具體指出的結構來實現(xiàn)和獲得本發(fā)明的目 的和其他優(yōu)點。為了實現(xiàn)這些和其他優(yōu)點并且根據(jù)本發(fā)明的目的,如具體表達和寬泛地描述,一 種用于處理音頻信號的方法包括獲得多信道音頻信號,所述多信道音頻信號包括語音分 量信號和其他分量信號;獲得所述音頻信號的增益;獲得修改強度參數(shù),所述修改強度參 數(shù)確定所述語音分量信號的修改的強度;基于所述修改強度參數(shù)來修改所述增益;以及, 基于所述修改的增益來修改所述語音分量信號。優(yōu)選的是,所述方法進一步包括修改所述獲得的增益。優(yōu)選的是,基于所述語音分量信號和其他分量信號的功率來確定所述修改強度參 數(shù)。
更優(yōu)選的是,基于在所述語音分量信號的功率和其他分量信號的功率之間的差來 修改所述增益。優(yōu)選的是,基于外部噪聲的值來確定所述修改強度參數(shù)。更優(yōu)選的是,基于外部噪聲的所述值來修改所述增益。為了進一步實現(xiàn)這些和其他優(yōu)點,并且根據(jù)本發(fā)明的目的,一種用于處理音頻信 號的設備包括增益獲得單元,用于獲得多信道音頻信號,并且獲得所述音頻信號的增益, 其中,所述多信道音頻信號包括語音分量信號和其他分量信號;自動SDV檢測單元,用于獲 得修改強度參數(shù),所述修改強度參數(shù)確定所述語音分量信號的修改的強度;增益修改單元, 用于基于所述修改強度參數(shù)來修改所述增益;以及,信號修改單元,用于基于所述修改的增 益來修改所述語音分量信號。應當明白,上述的一般描述和下面的詳細描述兩者是示例性和解釋性的,并且意 欲提供所要求保護的本發(fā)明的進一步的描述。本發(fā)明的模式現(xiàn)在詳細參考本發(fā)明的優(yōu)選實施例,在附圖中示出該優(yōu)選實施例的示例。首先,在 本說明書和權利要求中使用的術語或詞匯不應當被解釋為限于一般或詞典的含義,并且應 當被解釋為基于以下原理的與本發(fā)明的技術思想匹配的含義和概念即,發(fā)明人能夠適當 地限定該術語的概念以便以最佳的方式來描述發(fā)明人的發(fā)明。在本公開中公開的實施例和 在附圖中所述的配置僅是一個優(yōu)選實施例,并且不表示本發(fā)明的所有的技術思想。因此,可 以明白,本發(fā)明涵蓋本發(fā)明的修改和變型,只要該修改和變型處于提交本申請時的所附的 權利要求及其等同內(nèi)容的范圍內(nèi)。優(yōu)選的是,在本公開中的“信息”是一般包括值、參數(shù)、系數(shù)、和元素等的術語,并且 其含義偶爾可以被解釋為不同,本發(fā)明不限于此。根據(jù)本發(fā)明的語音信號(特別是對話分量)音量控制技術可以涉及如下的音頻信 號處理設備和方法,其用于在由于傳輸上的誤差而導致或有意地反轉左右信道的相位的反 相單信道信號環(huán)境中修改語音信號。首先,在下面的描述中,將描述如下的音頻信號處理設 備和方法,其用于在一般環(huán)境中而不是反相單信道信號環(huán)境中修改語音信號。圖1是用于經(jīng)由TV等來回放音頻信號的處理的圖。參見圖1,語音信號C被作為等價的信號施加到左右揚聲器,然后通過觀眾所位于 的收聽空間被提供到收聽者的兩耳。由此,SDV提取作為相同的信號被施加到左右信道的語 音信號C,然后控制所提取的語音信號的音量,以使其被收聽者清楚地或不清楚地聽到。在 諸如新聞的單信道信號的情況下,當SDV從左右信道信號提取相同的信號時,提取了整個 信號。當SDV控制語音信號時,更具體地,當控制對話音量時,帶來控制整個音量的效果。圖2是用于在一般的單信道信號環(huán)境或反相單信道信號環(huán)境中經(jīng)由TV等來回放 音頻信號的處理的圖。參見圖2,在一般的單信道信號環(huán)境中,左右信道信號的功率和相位相等。但是,為 了向特定廣播的單信道信號環(huán)境提供輕微的立體聲效果,可以以被反轉的左右信道信號的 相位的方式來發(fā)送正確的左右信道信號(right left and right channel signal) 0這被 稱為反相單信道信號環(huán)境。在該情況下,如果發(fā)送由廣播站有意反轉的信號,如果發(fā)送由于 在傳輸中的誤差而導致的錯誤信號,或如果原始信號具有這種特性,則可以建立反相單信道信號環(huán)境。在反相單信道信號環(huán)境中,雖然左右信道信號構造相同的信號,但是因為左右 信道信號的相位被反轉,所以一般的SDV不能發(fā)現(xiàn)左右信道信號的相同分量。因此,根本不 能提取任何語音分量。圖3是用于對話增強技術的混合模型300的框圖。在模型100中,收聽者從左右 信道接收音頻信號。音頻信號s對應于來自由因子a確定的方向的本地化聲音(localized sound)。獨立的音頻信號Ii1和n2對應于橫向反射或反響的聲音,其經(jīng)常被稱為環(huán)境聲音或 周圍環(huán)境。立體聲信號可以被記錄或混合,以便對于給定的音源,源音頻信號以特定的方向 提示(例如,電平差、時間差)來連貫地進入左右音頻信號信道,并且,橫向反射或反響的獨 立信號Ii1和n2進入信道內(nèi)以確定收聽事件寬度和收聽者的包圍提示。模型300可以被數(shù) 學地表示為具有一個音源的立體聲信號的感知刺激的分解,以捕獲該音源和周圍環(huán)境的定 位。[數(shù)學式1]X1 (n) = s (η) +Ii1 (η)χ2 (η) = as (η) +η2 (η)為了獲得在具有多個同時活動的音源的非穩(wěn)定情況中有效的分解,可以在多個頻 帶中獨立地并且在時間上自適應地執(zhí)行[1]的分解。[數(shù)學式2]X1 (i,k) = S (i,k) +N1 (i,k)X2(i, k) = A(i, k)S(i, k)+N2(i, k)其中,i是子帶指數(shù),并且k是子帶時間指數(shù)。圖4是圖示使用時間-頻率網(wǎng)格的立體聲信號的分解的圖。在具有指數(shù)i和k的 每一個時間-頻率網(wǎng)格200中,可以獨立地估計信號Sj1A2和分解增益系數(shù)A。為了表示 的簡潔,在下面的描述中忽略子帶和時間指數(shù)i和k。當使用具有感知刺激的子帶寬度的子帶分解時,子帶的寬度可以被選擇得等于一 個臨界帶??梢栽诿恳粋€子帶中,每t毫秒(例如,20毫秒)地近似估計S、Ni、&和A。對 于低計算復雜度,可以使用短時間傅立葉變換(STFT)來實現(xiàn)快速傅立葉變換(FFT)。在給 出立體聲子帶信號&和)(2的情況下,可以確定估計值S、A、N”N2??梢匀缦卤硎?amp;的功率 的短時間估計值[數(shù)學式3]P· (|9 k) ^ E{Xf (Z9 k) }其中,E{.}是短時間平均運算。對于其他信號,可以使用相同的協(xié)定,即,PX2、PS和 Pn = Pni = Pn2是對應的短時間功率估計值。假定N1和N2的功率是相同的,即,假定橫向獨 立聲音的數(shù)量對于左右信道是相同的。在給定立體聲信號的子帶表示的情況下,可以確定功率(Pxl,Px2)以及標準化的互 相關性。在左右信道之間的標準化的互相關性是[數(shù)學式4]
權利要求
1.一種用于處理音頻信號的方法,所述方法包括獲得多信道音頻信號,所述多信道音頻信號包括語音分量信號和其他分量信號; 獲得所述音頻信號的增益;獲得修改強度參數(shù),所述修改強度參數(shù)確定所述語音分量信號的修改的強度; 基于所述修改強度參數(shù)來修改所述增益;以及, 基于所述修改的增益來修改所述語音分量信號。
2.根據(jù)權利要求1所述的方法,進一步包括修改所述獲得的增益。
3.根據(jù)權利要求1或2所述的方法,其中,基于所述語音分量信號和其他分量信號的功 率來確定所述修改強度參數(shù)。
4.根據(jù)權利要求3所述的方法,其中,基于在所述語音分量信號的功率和其他分量信 號的功率之間的差來修改所述增益。
5.根據(jù)權利要求1或2所述的方法,其中,基于外部噪聲的值來確定所述修改強度參數(shù)。
6.根據(jù)權利要求5所述的方法,其中,基于外部噪聲的值來修改所述增益。
7.一種用于處理音頻信號的設備,所述設備包括增益獲得單元,用于獲得多信道音頻信號,并且獲得音頻信號的增益,所述多信道音頻 信號包括語音分量信號和其他分量信號;自動SDV檢測單元,用于獲得修改強度參數(shù),所述修改強度參數(shù)確定所述語音分量信 號的修改的強度;增益修改單元,用于基于所述修改強度參數(shù)來修改所述增益;以及, 信號修改單元,用于基于所述修改的增益來修改所述語音分量信號。
8.根據(jù)權利要求7所述的設備,其中,所述增益獲得單元修改所述獲得的增益。
9.根據(jù)權利要求7或8所述的設備,其中,基于所述語音分量信號和其他分量信號的功 率來確定所述修改強度參數(shù)。
10.根據(jù)權利要求9所述的設備,其中,基于在所述語音分量信號的功率和其他分量信 號的功率之間的差來修改所述增益。
11.根據(jù)權利要求7或8所述的設備,其中,基于外部噪聲的值來確定所述修改強度參數(shù)。
12.根據(jù)權利要求11所述的設備,其中,基于外部噪聲的值來修改所述增益。
全文摘要
公開了一種用于處理音頻信號的方法。本發(fā)明包括獲得多信道音頻信號,所述多信道音頻信號包括語音分量信號和其他分量信號;獲得所述音頻信號的增益;獲得修改強度參數(shù),所述修改強度參數(shù)確定所述語音分量信號的修改的強度;基于所述修改強度參數(shù)來修改所述增益;以及,基于所述修改的增益來修改所述語音分量信號。
文檔編號H04N5/60GK102113314SQ200980129785
公開日2011年6月29日 申請日期2009年7月29日 優(yōu)先權日2008年7月29日
發(fā)明者吳賢午, 文種何, 李凖一, 李銘勛, 鄭亮源 申請人:Lg電子株式會社