具有語音增強(qiáng)功能的媒體播放裝置的制造方法
【專利摘要】媒體播放裝置,包含:第一信號迭加模塊,迭加第一與第二聲道信號產(chǎn)生聲道迭加信號;第一盲源分離模塊,對第一聲道信號與聲道迭加信號做盲源分離產(chǎn)生帶少量背景聲音的第一語音信號與帶少量語音的第一背景聲音信號;第二盲源分離模塊,對第二聲道信號與聲道迭加信號做盲源分離產(chǎn)生帶少量背景聲音的第二語音信號與帶少量語音的第二背景聲音信號;第二信號迭加模塊,迭加第一與第二語音信號產(chǎn)生語音迭加信號;語音增益調(diào)整模塊,增益語音迭加信號產(chǎn)生語音增強(qiáng)信號;第三信號迭加模塊,迭加第一背景聲音信號與語音增強(qiáng)信號產(chǎn)生具語音增強(qiáng)的第一聲道輸出信號;第四信號迭加模塊,迭加第二背景聲音信號與語音增強(qiáng)信號產(chǎn)生具語音增強(qiáng)的第二聲道輸出信號。
【專利說明】
具有語音増強(qiáng)功能的媒體播放裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及一種媒體播放裝置,特別是涉及一種具有語音增強(qiáng)功能的媒體播放裝置。
【背景技術(shù)】
[0002]媒體播放裝置,例如電視機(jī),其播放的節(jié)目的音軌(soundtrack)中一般具有人類語音、音樂、環(huán)境聲響等聲源。有時(shí),因?yàn)楣?jié)目中其它聲音音量過大,或者只是因?yàn)樵诠?jié)目聲音制作階段沒做好混音,導(dǎo)致人類語音難以聽清楚。為了可以更清楚聽到人類語音,電視機(jī)提供有各種聲音模式,例如新聞模式、戲劇模式等。這些聲音模式的實(shí)現(xiàn)方式通常是使用固定的低通、高通、帶通濾波器或其組合,對一般人類語音所在的頻率范圍500~3500 Hz的信號進(jìn)行放大。
[0003]然而,上述使用固定濾波器放大語音的技術(shù)會遭遇一些問題。第一,由于無法知道原來的語音音量是非常小還是已經(jīng)很大,不容易決定對信號放大多少,使得語音音量改善有限。第二,在頻率范圍500~3500 Hz的信號不僅包含人類語音,也包含其它非語音的聲音,例如噪聲,當(dāng)沒有語音時(shí),反而會放大這個(gè)頻率范圍的噪聲。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的是提供一種具有語音增強(qiáng)功能的媒體播放裝置,可以主要針對人類語音進(jìn)行放大,同時(shí)根據(jù)其音量大小決定放大多少。
[0005]為實(shí)現(xiàn)上述目的,本發(fā)明提供一種具有語音增強(qiáng)功能的媒體播放裝置,其接收帶有語音與背景聲音的第一聲道信號與第二聲道信號。媒體播放裝置包含第一信號迭加(signal addit1n)模塊、第一盲源分離(blind source separat1n,BSS)模塊、第二盲源分離模塊、第二信號迭加模塊、語音增益調(diào)整(speech gain adjustment)模塊、第三信號迭加模塊以及第四信號迭加模塊。第一信號迭加模塊迭加第一聲道信號與第二聲道信號,以產(chǎn)生聲道迭加信號。第一盲源分離模塊接收第一聲道信號與聲道迭加信號進(jìn)行盲源分離,以產(chǎn)生帶有少量背景聲音的第一語音信號與帶有少量語音的第一背景聲音信號。第二盲源分離模塊接收第二聲道信號與聲道迭加信號進(jìn)行盲源分離,以產(chǎn)生帶有少量背景聲音的第二語音信號與帶有少量語音的第二背景聲音信號。第二信號迭加模塊迭加第一語音信號與第二語音信號,以產(chǎn)生語音迭加信號。語音增益調(diào)整模塊調(diào)整增益值并據(jù)以對語音迭加信號進(jìn)行增益,以產(chǎn)生語音增強(qiáng)信號。第三信號迭加模塊迭加第一背景聲音信號與語音增強(qiáng)信號,以產(chǎn)生具有語音增強(qiáng)效果的第一聲道輸出信號。第四信號迭加模塊迭加第二背景聲音信號與語音增強(qiáng)信號,以產(chǎn)生具有語音增強(qiáng)效果的第二聲道輸出信號。
[0006]在本發(fā)明的一實(shí)施例中,第一盲源分離模塊或第二盲源分離模塊包含第一輸入端、第二輸入端、第一濾波器、第二濾波器、第一加法器(adder)、第二加法器、第三濾波器、第四濾波器、第一輸出端、第二輸出端以及調(diào)整單元,其中,第一輸入端接收第一混音信號,第二輸入端接收第二混音信號,第一輸出端輸出第一解混信號,第二輸出端輸出第二解混信號。其中,第一輸入端親接第一濾波器的輸入端。第二輸入端親接第二濾波器的輸入端。第一加法器的兩輸入端分別親接第一濾波器與第四濾波器的輸出端,第一加法器的輸出端耦接第三濾波器的輸入端與第一輸出端。第二加法器的兩輸入端分別耦接第二濾波器與第三濾波器的輸出端,第二加法器的輸出端耦接第四濾波器的輸入端與第二輸出端。調(diào)整單元接收第一解混信號與第二解混信號,并據(jù)以使用最小互信息(minimum mutualinformat1n, MMI)或最大熵(maximum entropy, ME)算法來調(diào)整第三濾波器與第四濾波器的轉(zhuǎn)移函數(shù)(transfer funct1ns)。
[0007]在本發(fā)明的一實(shí)施例中,調(diào)整單元還調(diào)整第一濾波器與第二濾波器的轉(zhuǎn)移函數(shù)。
[0008]在本發(fā)明的一實(shí)施例中,第一聲道信號與第二聲道信號分別為左聲道信號與右聲道信號。
[0009]在本發(fā)明的一實(shí)施例中,媒體播放裝置為電視、音響、隨身聽、手機(jī)、光盤影音播放器或計(jì)算機(jī)。
[0010]上述一個(gè)實(shí)施例中描述的技術(shù)手段可應(yīng)用于上述另一個(gè)實(shí)施例中,以得到一個(gè)新的實(shí)施例,只要這些技術(shù)手段不相互矛盾。
[0011]本發(fā)明因采用第一、第二盲源分離模塊將帶有語音與背景聲音的第一、第二聲道信號進(jìn)行盲源分離,分離出帶有少量背景聲音的第一、第二語音信號與帶有少量語音的第一、第二背景聲音信號,然后將第一、第二語音信號進(jìn)行放大后,再與第一、第二背景聲音信號進(jìn)行迭加,因此可以產(chǎn)生具有語音增強(qiáng)效果的第一、第二聲道輸出信號。
[0012]此外,本發(fā)明因采用的第一、第二盲源分離模塊可根據(jù)其分離出的第一、第二語音信號與第一、第二背景聲音信號進(jìn)行反饋控制,即調(diào)整其中的第三與第四濾波器的轉(zhuǎn)移函數(shù),使分離出的第一、第二語音信號帶有更加少量的背景聲音,且分離出的第一、第二背景聲音信號帶有更加少量的語音;而且,第一、第二盲源分離模塊還可以根據(jù)分離出的第一、第二語音信號中語音的音量大小進(jìn)行反饋控制,即調(diào)整其中的第一與第二濾波器的轉(zhuǎn)移函數(shù),然后再配合媒體播放裝置后端的語音增益調(diào)整模塊使分離出的第一、第二語音信號中語音的音量調(diào)整至合適的大小,因此可以使媒體播放裝置最后輸出的第一、第二聲道輸出信號中語音的音量調(diào)整至合適的大小。
【附圖說明】
[0013]下面結(jié)合附圖和【具體實(shí)施方式】對本發(fā)明作進(jìn)一步詳細(xì)的說明。
[0014]圖1為根據(jù)本發(fā)明一實(shí)施例的具有語音增強(qiáng)功能的媒體播放裝置的方塊圖。
[0015]圖2為根據(jù)本發(fā)明一實(shí)施例的盲源分離模塊的方塊圖。
[0016]標(biāo)記說明:
10媒體播放裝置 11第一信號迭加模塊 12第一盲源分離模塊 13第二盲源分離模塊 14第二信號迭加模塊 15語音增益調(diào)整模塊 16第三信號迭加模塊 17第四信號迭加模塊
20盲源分離模塊
201第一輸入端
202第二輸入端
203第一濾波器
204第二濾波器
205第一加法器
206第二加法器
207第三濾波器
208第四濾波器
209第一輸出端
210第二輸出端
211調(diào)整單元
Lin 第一聲道信號
Rin第二聲道信號
Min聲道迭加信號
Lbg第一背景聲音信號
Lsp第一語音信號
Rbg第二背景聲音信號
Rsp第二語音信號
Msp語音迭加信號
Msp’語音增強(qiáng)信號
Lout第一聲道輸出信號
Rout第二聲道輸出信號
Xl第一混音信號
X2第二混音信號
Ul第一解混信號
U2第二解混信號
Wll第一濾波器的轉(zhuǎn)移函數(shù)
W22第二濾波器的轉(zhuǎn)移函數(shù)
W21第三濾波器的轉(zhuǎn)移函數(shù)
W12第四濾波器的轉(zhuǎn)移函數(shù)。
【具體實(shí)施方式】
[0017]圖1為根據(jù)本發(fā)明一實(shí)施例的具有語音增強(qiáng)功能的媒體播放裝置的方塊圖。請參見圖1,媒體播放裝置10可以為電視、音響、隨身聽、手機(jī)、光盤影音播放器或計(jì)算機(jī)(例如臺式計(jì)算機(jī)或平板計(jì)算機(jī)),但并不僅限于此。媒體播放裝置10接收第一聲道信號Lin與第二聲道信號Rin,而且第一聲道信號Lin與第二聲道信號Rin均帶有語音與背景聲音,其中,背景聲音包含音樂、環(huán)境聲響、噪聲等非語音的聲音。第一聲道信號Lin與第二聲道信號Rin可以分別為左聲道信號與右聲道信號,但并不僅限于此。
[0018]媒體播放裝置10包含第一信號迭加模塊11、第一盲源分離模塊12、第二盲源分離模塊13、第二信號迭加模塊14、語音增益調(diào)整模塊15、第三信號迭加模塊16以及第四信號迭加模塊17。
[0019]第一信號迭加模塊11迭加第一聲道信號Lin與第二聲道信號Rin,以產(chǎn)生聲道迭加信號Min。
[0020]第一盲源分離模塊12接收第一聲道信號Lin與聲道迭加信號Min進(jìn)行盲源分離,以帶有少量背景聲音的第一語音信號Lsp與產(chǎn)生帶有少量語音的第一背景聲音信號Lbg。盲源分離是一種特別的數(shù)字信號處理(digital signal processing,DSP)技術(shù),其可以在不知道獨(dú)立信號特性信息的情況下,從數(shù)個(gè)具有獨(dú)立信號的混合信號中將這些獨(dú)立信號一定程度上分離出來。如最小互信息算法、最大熵算法等不同的盲源分離算法,具有不同的計(jì)算量、計(jì)算收斂速度與分離效果。因此,第一聲道信號Lin與聲道迭加信號Min經(jīng)過第一盲源分離模塊12后,只能一定程度上分離出第一語音信號Lsp與第一背景聲音信號Lbg,即,第一語音信號Lsp主要包含語音但還會帶有少量背景聲音,而第一背景聲音信號Lbg主要包含背景聲音但還會帶有少量語音。
[0021]第二盲源分離模塊13接收第二聲道信號Rin與聲道迭加信號Min進(jìn)行盲源分離,以產(chǎn)生帶有少量背景聲音的第二語音信號Rsp與帶有少量語音的第二背景聲音信號Rbg。與第一盲源分離模塊的情形相同,因?yàn)榈诙暤佬盘朢in與聲道迭加信號Min經(jīng)過第二盲源分離模塊13后,只能一定程度上分離出第二語音信號Rsp與第二背景聲音信號Rbg,即,第二語音信號Rsp主要包含語音但還會帶有少量背景聲音,而第二背景聲音信號Rbg主要包含背景聲音但還會帶有少量語音。
[0022]第二信號迭加模塊14迭加第一語音信號Lsp與第二語音信號RSP,以產(chǎn)生語音迭加信號Msp。
[0023]語音增益調(diào)整模塊15調(diào)整增益值并據(jù)以對語音迭加信號Msp進(jìn)行增益,以產(chǎn)生語音增強(qiáng)信號Msp’。
[0024]第三信號迭加模塊16迭加第一背景聲音信號Lbg與語音增強(qiáng)信號Msp’,以產(chǎn)生具有語音增強(qiáng)效果的第一聲道輸出信號Lout,即第一聲道輸出信號Lout帶有的語音的音量相對于背景聲音的音量已被放大,因此可以在其它聲源中更清楚聽到人類語音。
[0025]第四信號迭加模塊17迭加第二背景聲音信號Rbg與語音增強(qiáng)信號Msp’,以產(chǎn)生具有語音增強(qiáng)效果的第二聲道輸出信號Rout,即第二聲道輸出信號Rout帶有的語音的音量相對于背景聲音的音量已被放大,因此可以在其它聲源中更清楚聽到人類語音。
[0026]第一聲道輸出信號Lout與第二聲道輸出信號Rout可以分別輸出到外部的揚(yáng)聲器(未繪示)進(jìn)行播放。
[0027]本發(fā)明因采用第一、第二盲源分離模塊12、13將帶有語音與背景聲音的第一、第二聲道信號Lin、Rin進(jìn)行盲源分離,分離出帶有少量背景聲音的第一、第二語音信號Lsp、Rsp與帶有少量語音的第一、第二背景聲音信號Lbg、Rbg,然后將帶有少量背景聲音的第一、第二語音信號Lsp、Rsp進(jìn)行放大后,再與帶有少量語音的第一、第二背景聲音信號Lbg、Rbg進(jìn)行迭加,因此可以產(chǎn)生具有語音增強(qiáng)效果的第一、第二聲道輸出信號Lout、Rout。
[0028]圖2為根據(jù)本發(fā)明一實(shí)施例的盲源分離模塊的方塊圖。請參見圖2,盲源分離模塊20包含第一輸入端201、第二輸入端202、第一濾波器203、第二濾波器204、第一加法器205、第二加法器206、第三濾波器207、第四濾波器208、第一輸出端209、第二輸出端210以及調(diào)整單元211。其中,第一輸入端201與第二輸入端202分別接收第一混音信號Xl與第二混音信號X2,而第一輸出端209與第二輸出端210分別輸出第一解混信號Ul與第二解混信號U2。
[0029]第一輸入端201耦接第一濾波器203的輸入端。第二輸入端202耦接第二濾波器204的輸入端。第一加法器205的兩輸入端分別親接第一濾波器203與第四濾波器208的輸出端,第一加法器205的輸出端耦接第三濾波器207的輸入端與第一輸出端209。第二加法器206的兩輸入端分別耦接第二濾波器204與第三濾波器207的輸出端,第二加法器206的輸出端耦接第四濾波器208的輸入端與第二輸出端210。
[0030]調(diào)整單元211耦接第一輸出端209與第二輸出端210,以接收第一解混信號Ul與第二解混信號U2,并據(jù)以使用最小互信息或最大熵算法來調(diào)整第三濾波器207的轉(zhuǎn)移函數(shù)W21與第四濾波器208的轉(zhuǎn)移函數(shù)W12,和/或調(diào)整第一濾波器203的轉(zhuǎn)移函數(shù)Wll與第二濾波器204的轉(zhuǎn)移函數(shù)W22。
[0031]在本實(shí)施例中,圖1所示的第一盲源分離模塊12可以使用圖2所示的盲源分離模塊20,此時(shí)盲源分離模塊20的第一混音信號Xl與第二混音信號X2可以分別是第一聲道信號Lin與聲道迭加信號Min,而第一解混信號Ul與第二解混信號U2可以分別是第一語音信號Lsp與第一背景聲音信號Lbg。另外,圖1所示的第二盲源分離模塊13可以使用圖2所不的盲源分離模塊20,此時(shí)盲源分離模塊20的第一混音信號Xl與第二混音信號X2可以分別是第二聲道信號Rin與聲道迭加信號Min,而第一解混信號Ul與第二解混信號U2可以分別是第二語音信號Rsp與第二背景聲音信號Rbg。
[0032]本發(fā)明因采用的第一、第二盲源分離模塊12、13可根據(jù)其分離出的帶有少量背景聲音的第一、第二語音信號Lsp、Rsp與帶有少量語音的第一、第二背景聲音信號Lbg、Rbg進(jìn)行反饋控制,即調(diào)整其中的第三濾波器207的轉(zhuǎn)移函數(shù)W21與第四濾波器208的轉(zhuǎn)移函數(shù)W12,使分離出的第一、第二語音信號Lsp、Rsp帶有更加少量的背景聲音,且分離出的第一、第二背景聲音信號Lbg、Rbg帶有更加少量的語音。而且,第一、第二盲源分離模塊12、13還可以根據(jù)分離出的第一、第二語音信號Lsp、Rsp中語音的音量大小進(jìn)行反饋控制,即調(diào)整其中的第一濾波器203的轉(zhuǎn)移函數(shù)Wll與第二濾波器204的轉(zhuǎn)移函數(shù)W22,然后再配合媒體播放裝置10后端的語音增益調(diào)整模塊15使分離出的第一、第二語音信號Lsp、Rsp中語音的音量調(diào)整至合適的大小,因此可以使媒體播放裝置10最后輸出的第一、第二聲道輸出信號Lout、Rout中語音的音量調(diào)整至合適的大小。
[0033]此外,需要特別說明的是,媒體播放裝置10包含的第一信號迭加模塊11、第一盲源分離模塊12、第二盲源分離模塊13、第二信號迭加模塊14、語音增益調(diào)整模塊15、第三信號迭加模塊16以及第四信號迭加模塊17,盲源分離模塊20包含的第一濾波器203、第二濾波器204、第一加法器205、第二加法器206、第三濾波器207、第四濾波器208以及調(diào)整單元211,這些模塊、器件或單元均可以使用硬件或軟件方式實(shí)現(xiàn)。
[0034]以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.具有語音增強(qiáng)功能的媒體播放裝置,接收帶有語音與背景聲音的第一聲道信號與第二聲道信號,其特征在于,其包含: 第一信號迭加模塊,迭加所述第一聲道信號與所述第二聲道信號,以產(chǎn)生聲道迭加信號; 第一盲源分離模塊,接收所述第一聲道信號與所述聲道迭加信號進(jìn)行盲源分離,以產(chǎn)生帶有少量背景聲音的第一語音信號與帶有少量語音的第一背景聲音信號; 第二盲源分離模塊,接收所述第二聲道信號與所述聲道迭加信號進(jìn)行盲源分離,以產(chǎn)生帶有少量背景聲音的第二語音信號與帶有少量語音的第二背景聲音信號; 第二信號迭加模塊,迭加所述第一語音信號與所述第二語音信號,以產(chǎn)生語音迭加信號; 語音增益調(diào)整模塊,調(diào)整增益值并據(jù)以對所述語音迭加信號進(jìn)行增益,以產(chǎn)生語音增強(qiáng)信號; 第三信號迭加模塊,迭加所述第一背景聲音信號與所述語音增強(qiáng)信號,以產(chǎn)生具有語音增強(qiáng)效果的第一聲道輸出信號;以及 第四信號迭加模塊,迭加所述第二背景聲音信號與所述語音增強(qiáng)信號,以產(chǎn)生具有語音增強(qiáng)效果的第二聲道輸出信號。2.根據(jù)權(quán)利要求1所述的具有語音增強(qiáng)功能的媒體播放裝置,其中,所述第一盲源分離模塊或第二盲源分離模塊包含第一輸入端、第二輸入端、第一濾波器、第二濾波器、第一加法器、第二加法器、第三濾波器、第四濾波器、第一輸出端、第二輸出端以及調(diào)整單元,其中,所述第一輸入端接收第一混音信號,所述第二輸入端接收第二混音信號,所述第一輸出端輸出第一解混信號,所述第二輸出端輸出第二解混信號;其中, 所述第一輸入端耦接所述第一濾波器的輸入端; 所述第二輸入端耦接所述第二濾波器的輸入端; 所述第一加法器的兩輸入端分別耦接所述第一濾波器與所述第四濾波器的輸出端,所述第一加法器的輸出端耦接所述第三濾波器的輸入端與所述第一輸出端; 所述第二加法器的兩輸入端分別耦接所述第二濾波器與所述第三濾波器的輸出端,所述第二加法器的輸出端耦接所述第四濾波器的輸入端與所述第二輸出端; 所述調(diào)整單元接收所述第一解混信號與所述第二解混信號,并據(jù)以使用最小互信息或最大熵算法來調(diào)整所述第三濾波器與所述第四濾波器的轉(zhuǎn)移函數(shù)。3.根據(jù)權(quán)利要求2所述的具有語音增強(qiáng)功能的媒體播放裝置,其中,所述調(diào)整單元還調(diào)整所述第一濾波器與所述第二濾波器的轉(zhuǎn)移函數(shù)。4.根據(jù)權(quán)利要求1所述的具有語音增強(qiáng)功能的媒體播放裝置,其中,所述第一聲道信號與所述第二聲道信號分別為左聲道信號與右聲道信號。5.根據(jù)權(quán)利要求1所述的具有語音增強(qiáng)功能的媒體播放裝置,其中,所述媒體播放裝置為電視、音響、隨身聽、手機(jī)、光盤影音播放器或計(jì)算機(jī)。
【文檔編號】H03G3/20GK105991102SQ201510071342
【公開日】2016年10月5日
【申請日】2015年2月11日
【發(fā)明人】周雅泛, 李程越
【申請人】冠捷投資有限公司