應(yīng)用于音頻裝置的控制器與相關(guān)的操作方法
【專利摘要】本發(fā)明涉及一種應(yīng)用于一音頻裝置的控制器與相關(guān)操作方法;控制器可接收兩麥克風(fēng)分別提供的第一收音頻號(hào)與第二收音頻號(hào),并包括一回音消除模塊與一波束成型模塊?;匾粝K可對(duì)第一收音頻號(hào)進(jìn)行回音消除并據(jù)以提供一中介信號(hào),波束成型模塊則可利用回音消除后的中介信號(hào)與未經(jīng)回音消除處理的第二收音頻號(hào)進(jìn)行波束成型處理。
【專利說(shuō)明】應(yīng)用于音頻裝置的控制器與相關(guān)的操作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明有關(guān)于一種應(yīng)用于音頻裝置的控制器與相關(guān)的操作方法,尤指一種能以低運(yùn)算量有效改善收音效果的音頻裝置控制器與相關(guān)操作方法。
【背景技術(shù)】
[0002]能收集及/或播放聲音的音頻裝置已在現(xiàn)代資訊生活中扮演重要的角色;再者,具有聲控功能的裝置也可視為音頻裝置。舉例而言,音頻裝置可以涵蓋手機(jī)、數(shù)位相機(jī)/攝影機(jī)、可發(fā)音并接受聲控的導(dǎo)航/定位裝置、穿戴式/手持式/可攜式的計(jì)算機(jī)/電子書/電子字典/電腦、具有聲控功能的電視、音響、多媒體播放器、玩具乃至于互動(dòng)藝術(shù)作品等坐寸ο
[0003]請(qǐng)參考圖1,其所示意的是一已知的音頻裝置10,其可播放聲音,并可接受聲控。音頻裝置10包括有麥克風(fēng)12a與12b,揚(yáng)聲器14a與14b,一控制器20,一音頻輸出模塊23與一播放模塊24。麥克風(fēng)12a與12b用以收音,并將收集到的聲音轉(zhuǎn)換為信號(hào)Si_L與Si_R0信號(hào)Si_L與Si_R會(huì)被傳輸至控制器20。
[0004]控制器20包括一波束成型(beam forming)模塊16、一回音消除(echocancellat1n)模塊18與一語(yǔ)音辨識(shí)模塊22。音頻輸出模塊23可提供信號(hào)Sp_L與Sp_R作為音源信號(hào),播放模塊24可依據(jù)信號(hào)Sp_L與Sp_R進(jìn)行播放,例如說(shuō)是依據(jù)信號(hào)Sp_L與Sp_R分別驅(qū)動(dòng)揚(yáng)聲器14a與14b,以將信號(hào)Sp_L與Sp_R播放為聲音。
[0005]為了實(shí)現(xiàn)聲控的功能,音頻裝置10必須聚焦于使用者的位置以集中收集使用者發(fā)出的聲控命令,并避免揚(yáng)聲器14a與14b的播音影響收音,因?yàn)閾P(yáng)聲器14a與14b播出的聲音會(huì)形成回音,并被麥克風(fēng)12a與12b接收。在習(xí)知音頻裝置10的控制器20中,波束成型模塊16便是要利用信號(hào)Si_L與Si_R進(jìn)行波束成型處理,并據(jù)以提供信號(hào)Sml ;波束成型的目的是在信號(hào)Sml中加強(qiáng)某一聚焦區(qū)域內(nèi)的聲音,并減抑其他非聚焦區(qū)域的聲音干擾。回音消除模塊18則依據(jù)信號(hào)對(duì)信號(hào)Sml進(jìn)行回音消除,據(jù)以提供信號(hào)Sm2。然后,語(yǔ)音辨識(shí)模塊22便可利用信號(hào)Sm2來(lái)進(jìn)行語(yǔ)音辨識(shí),由信號(hào)Sm2中辨識(shí)出是否有聲控命令及命令的內(nèi)容,使控制器20能據(jù)以控制音頻裝置10。
[0006]由圖1可知,已知音頻裝置10是在進(jìn)行波束成型之后進(jìn)行回音消除。在此已知架構(gòu)下,雖然控制器20僅需單一回音消除模塊18而降低運(yùn)算量,但波束成型會(huì)破壞回音的線性特性,產(chǎn)生非線性的信號(hào),使回音消除模塊18無(wú)法完全消除回音,連帶影響語(yǔ)音辨識(shí)的正確性與辨識(shí)率。
【發(fā)明內(nèi)容】
[0007]為克服已知技術(shù)的缺點(diǎn),本發(fā)明的目的之一是提供一種可運(yùn)用于一音頻裝置的控制器。本發(fā)明控制器可接收由兩麥克風(fēng)分別提供的一第一收音頻號(hào)與一第二收音頻號(hào),并包括一回音消除模塊與一波束成型模塊?;匾粝K對(duì)第一收音頻號(hào)進(jìn)行回音消除并據(jù)以提供一中介信號(hào)。波束成型模塊耦接回音消除模塊與第二收音頻號(hào),以中介信號(hào)與第二收音頻號(hào)進(jìn)行波束成型(beam forming)處理,據(jù)以提供一輸出信號(hào);其中,第二收音頻號(hào)不經(jīng)回音消除處理??刂破鬟€可包括一語(yǔ)音辨識(shí)模塊,耦接該波束成型模塊,對(duì)輸出信號(hào)進(jìn)行語(yǔ)音辨識(shí),并依據(jù)語(yǔ)音辨識(shí)的結(jié)果控制音頻裝置。
[0008]本發(fā)明音頻裝置可以包括一或多個(gè)揚(yáng)聲器、一音頻輸出模塊與一播放模塊。音頻輸出模塊用以為各揚(yáng)聲器提供一音源信號(hào),播放模塊依據(jù)各音頻信號(hào)來(lái)使各揚(yáng)聲器播放對(duì)應(yīng)的聲音,而回音消除模塊則可依據(jù)音源信號(hào)來(lái)對(duì)第一收音頻號(hào)進(jìn)行回音消除。
[0009]本發(fā)明的目的之一是提供一種應(yīng)用于一音頻裝置的操作方法,包括:分別自一第一麥克風(fēng)與一第二麥克風(fēng)接收一第一收音頻號(hào)與一第二收音頻號(hào),對(duì)第一收音頻號(hào)進(jìn)行一回音消除處理并據(jù)以提供一中介信號(hào),以及,依據(jù)中介信號(hào)與第二收音頻號(hào)進(jìn)行一波束成型處理并據(jù)以提供一輸出信號(hào);其中,第二收音頻號(hào)是未經(jīng)回音消除處理。
[0010]為了對(duì)本發(fā)明的上述及其他方面有更佳的了解,下文特舉較佳實(shí)施例,并配合附圖,作詳細(xì)說(shuō)明如下:
【專利附圖】
【附圖說(shuō)明】
[0011]圖1示出了一已知音頻裝置的控制器架構(gòu)。
[0012]圖2示出了一音頻裝置及其控制器。
[0013]圖3示出了依據(jù)本發(fā)明一實(shí)施例的音頻裝置及其控制器。
[0014]圖4舉例比較圖1至圖3的回音消除效果與運(yùn)算量。
[0015]圖5示出了依據(jù)本發(fā)明一實(shí)施例的操作方法流程。
[0016]符號(hào)說(shuō)明
[0017]10、30、50:音頻裝置
[0018]12a-12b、32a-32b、52a_52b:麥克風(fēng)
[0019]14a_14b、34a-34b、54a_54b:揚(yáng)聲器
[0020]16、36、56:波束成型模塊
[0021]18、38a_38b、58:回音消除模塊
[0022]20,40,60:控制器
[0023]22、42、62:語(yǔ)音辨識(shí)模塊
[0024]23、43、63:音頻輸出模塊
[0025]24、44、64:播放模塊
[0026]Si_L/Si_R、Sml、Sm2、Sp_L/Sp_R、Sm_R/Sm_L、Si_a/Si_b、Sp_a/Sp_b、S1、S2:信號(hào)
[0027]100:流程
[0028]102-108:步驟
【具體實(shí)施方式】
[0029]請(qǐng)參考圖2,其所示意的是一音頻裝置30。音頻裝置30亦可播放聲音并接受聲控,其包括有麥克風(fēng)32a與32b,揚(yáng)聲器34a與34b, —控制器40, —音頻輸出模塊43與一播放模塊44。麥克風(fēng)32a與32b用以收音,據(jù)以提供電子信號(hào)Si_L與Si_R,并傳輸至控制器40。
[0030]控制器40包括兩回音消除模塊38a與38b、一波束成型模塊36與一語(yǔ)音辨識(shí)模塊42。音頻輸出模塊43可提供信號(hào)Sp_L與Sp_R作為音源信號(hào),播放模塊44依據(jù)信號(hào)Sp_L與Sp_R控制揚(yáng)聲器34a與34b,以將信號(hào)Sp_L與Sp_R播放為聲音。
[0031]為了實(shí)現(xiàn)聲控的功能,音頻裝置30同樣必須聚焦收音,并避免揚(yáng)聲器34a與34b的播放回音干擾收音。在音頻裝置30的控制器40中,回音消除模塊38a與38b會(huì)先依據(jù)信號(hào)Sp_L與Sp_R而分別從信號(hào)Si_L與Si_R中消除回音,并產(chǎn)生信號(hào)Sm_L與Sm_R。然后,由波束成型模塊36利用信號(hào)Sm_L與Sm_R進(jìn)行波束成型處理,并據(jù)以產(chǎn)生信號(hào)Sm2,作為一輸出信號(hào)。如此,語(yǔ)音辨識(shí)模塊42便可利用信號(hào)Sm2來(lái)進(jìn)行語(yǔ)音辨識(shí),以使控制器40能據(jù)以控制音頻裝置30。
[0032]不同于圖1的已知技術(shù),圖2的控制器架構(gòu)是先進(jìn)行兩路的均衡回音消除,再進(jìn)行波束成型,以避免回音特性被波束成型破壞。不過(guò),圖2兩路均衡回音消除可能需耗費(fèi)較多運(yùn)算量。
[0033]請(qǐng)參考圖3,其所示意的是依據(jù)本發(fā)明一實(shí)施例的音頻裝置50。舉例而言,音頻裝置50可以是一個(gè)可播放聲音且可接受聲控的裝置,例如一聲控電視或一聲控的多媒體播放器。音頻裝置50可以包括一或多個(gè)麥克風(fēng)(例如麥克風(fēng)52a與52b), —或多個(gè)揚(yáng)聲器(例如揚(yáng)聲器54a與54b), —音頻輸出模塊63, —播放模塊64以及一控制器60。麥克風(fēng)52a與52b用以收音,并分別將收集到的聲音轉(zhuǎn)換為電子信號(hào)Si_a與Si_b (可視為第一與第二收音頻號(hào)),傳輸至控制器60。
[0034]控制器60可以是一處理器或控制器芯片,也可以包括控制器芯片的周邊支持電路及/或硬件,如揮發(fā)性及/或非揮發(fā)性存儲(chǔ)器等等??刂破?0可包括單一回音消除模塊58、一波束成型模塊56與一語(yǔ)音辨識(shí)模塊62。在音頻裝置50中,音頻輸出模塊63可提供信號(hào)Sp_a與Sp_b (可視為音源信號(hào)),播放模塊64則依據(jù)信號(hào)Sp_a與Sp_b驅(qū)動(dòng)揚(yáng)聲器54a與54b,以將信號(hào)Sp_a與Sp_b播放為對(duì)應(yīng)的聲音。舉例而言,音頻輸出模塊63可以包括音頻編解碼(aud1 codec)模塊,用以從一立體聲的音源串流(未繪示)中提取出不同聲道的信號(hào)以分別作為不同揚(yáng)聲器的音源信號(hào),例如揚(yáng)聲器54a與54b的信號(hào)Sp_a與Sp_b。
[0035]音頻裝置50可聚焦收音,并抑制揚(yáng)聲器播音所導(dǎo)致的回音。舉例而言,為了實(shí)現(xiàn)聲控的功能,音頻裝置50可聚焦于使用者的位置以集中收集使用者發(fā)出的聲控命令,并避免揚(yáng)聲器54a與54b的播音影響收音。在控制器60中,回音消除模塊58稱接于麥克風(fēng)52a、波束成型模塊56與音頻輸出模塊63,接收信號(hào)Sp_a,以參考信號(hào)Sp_a來(lái)對(duì)信號(hào)Si_a進(jìn)行回音消除,并據(jù)以提供信號(hào)SI作為一中介信號(hào)。波束成型模塊56耦接回音消除模塊58、麥克風(fēng)52b與語(yǔ)音辨識(shí)模塊62,可利用信號(hào)SI與麥克風(fēng)52b的信號(hào)Si_b進(jìn)行波束成型處理,據(jù)以提供一信號(hào)S2作為一輸出信號(hào)。語(yǔ)音辨識(shí)模塊62 I禹接波束成型模塊56,對(duì)信號(hào)S2進(jìn)行語(yǔ)音辨識(shí),使控制器60得以依據(jù)語(yǔ)音辨識(shí)的結(jié)果控制音頻裝置50。
[0036]由圖3可知,本發(fā)明控制器60是將回音消除安排在波束成型之前,如此,便可避免波束成型的非線性信號(hào)影響回音消除的效果,也進(jìn)一步防止波束成型干擾語(yǔ)音辨識(shí)率與正確性。舉例而言,回音消除可利用正規(guī)化最小平方誤差(NLMS, Normalized Least MeanSquare)演算法來(lái)進(jìn)行,但在對(duì)某一輸入的音源信號(hào)進(jìn)行回音消除時(shí),若該信號(hào)經(jīng)過(guò)越多的處理(例如空間反射、非線性共振及/或波束成型等等),便越難以利用處理后的音源信號(hào)經(jīng)由NLMS演算法去逼近輸入回音的適應(yīng)性濾波器系數(shù)。所以,若將波束成型置于回音消除之前,會(huì)讓回音消除模塊更難學(xué)習(xí)到消除回音的濾波器系數(shù),而使回音更難消除。相較之下,本發(fā)明的控制器架構(gòu)是將波束成型安排在回音消除之后,因此能有效防止波束成型破壞回音消除的效果。
[0037]再者,本發(fā)明控制器60可以實(shí)現(xiàn)單一回音消除模塊58,因此,控制器60的運(yùn)算量可以縮減,避免圖2中多個(gè)回音消除所需的額外運(yùn)算量。雖然控制器60只對(duì)麥克風(fēng)52a提供的信號(hào)Si_a進(jìn)行回音消除,并未對(duì)麥克風(fēng)52b的信號(hào)Si_b進(jìn)行回音消除,但依據(jù)本發(fā)明實(shí)施例,信號(hào)Si_b中的回音仍會(huì)被波束成型模塊56的波束成型處理抑制、消除,因此,整體而言,信號(hào)Si_a與Si_b中的回音均不會(huì)干擾語(yǔ)音辨識(shí)的辨識(shí)率。
[0038]波束成型的目的之一是增強(qiáng)聚焦區(qū)的聲音并相對(duì)地抑制非聚焦區(qū)的聲音;舉例而言,聚焦區(qū)可以位在麥克風(fēng)54a與54b的幾何中心線上。也就是說(shuō),聚焦區(qū)距離麥克風(fēng)54a與54b的距離是相近的,因此在聚焦區(qū)發(fā)出的聲音表現(xiàn)在信號(hào)中也是類似的,若一聲音在信號(hào)Si_a與Si_b中有不同的表現(xiàn),或者只表現(xiàn)在信號(hào)Si_a與Si_b其中之一,則可判斷其并非聚焦區(qū)發(fā)出的聲音。在本發(fā)明實(shí)施例中,雖然麥克風(fēng)52b的信號(hào)Si_b未經(jīng)回音消除,但因信號(hào)Si_b的回音只出現(xiàn)在麥克風(fēng)54b傳入的信號(hào)Si_b內(nèi),而沒(méi)有出現(xiàn)在回音消除模塊58傳送的信號(hào)SI內(nèi),故會(huì)被波束成型模塊56認(rèn)定為非聚焦區(qū)的聲音;如此,波束成型模塊56的波束成型處理便會(huì)將信號(hào)Si_b的回音濾除。
[0039]請(qǐng)參考圖4,其舉例比較圖1至圖3控制器的回音消除效果與運(yùn)算量。圖4中,回音消除效果是以回音往返損耗的增強(qiáng)(ERLE, Echo Return Loss Enhancement)來(lái)量化;數(shù)值越高者,回音消除的效果越好。運(yùn)算量則以回音消除所需的時(shí)脈來(lái)表示;數(shù)值越低者,所需消耗的運(yùn)算量越少。由圖4可知,本發(fā)明(圖3)的控制器架構(gòu)可兼顧回音消除效果與低運(yùn)算量,不僅回音消除效果優(yōu)良,且使用的運(yùn)算量也很低。
[0040]在圖3實(shí)施例中,語(yǔ)音辨識(shí)模塊62也可以是其他功能的模塊,例如說(shuō)是錄音模塊(用以將信號(hào)S2記錄至非揮發(fā)性存儲(chǔ)器)、傳輸模塊(將信號(hào)S2傳輸至網(wǎng)絡(luò))及/或音頻處理模塊,例如編碼模塊(將信號(hào)S2編碼為串流)或頻譜轉(zhuǎn)換模塊(將信號(hào)S2轉(zhuǎn)換至頻域)等等??刂破?0的各模塊可以用專屬硬件實(shí)現(xiàn),以及/或者,用硬件處理器執(zhí)行軟件及/或固件程序來(lái)實(shí)現(xiàn)。
[0041]請(qǐng)參考圖5,其所示意的是依據(jù)本發(fā)明一實(shí)施例的流程100,其可運(yùn)用于圖3音頻裝置。流程100的主要步驟可說(shuō)明如下。
[0042]步驟102:由多麥克風(fēng)接收多個(gè)收音頻號(hào),例如說(shuō)是由麥克風(fēng)52a與52b (圖3)分別取得信號(hào)Si_a與Si_b。
[0043]步驟104:于多個(gè)收音頻號(hào)中,對(duì)部份的一或多個(gè)收音頻號(hào)進(jìn)行回音消除處理,對(duì)剩下的一或多個(gè)收音頻號(hào)則不經(jīng)回音消除處理。舉例而言,于圖3的例子中,便是依據(jù)信號(hào)3?_&來(lái)對(duì)信號(hào)51_&進(jìn)行回音消除處理以形成信號(hào)SI (中介信號(hào)),信號(hào)Si_b則不經(jīng)回音消除處理。
[0044]步驟106:并用回音消除后的信號(hào)(如信號(hào)SI)與未經(jīng)回音消除的信號(hào)(如信號(hào)Si_b)進(jìn)行波束成型處理,據(jù)以提供一輸出信號(hào),如圖3中的信號(hào)S2。
[0045]步驟108:運(yùn)用步驟106所提供的輸出信號(hào)。舉例而言,可對(duì)輸出信號(hào)S2進(jìn)行語(yǔ)音辨識(shí),并依據(jù)語(yǔ)音辨識(shí)結(jié)果控制音頻裝置50。
[0046]總結(jié)來(lái)說(shuō),本發(fā)明可推廣如下:本發(fā)明控制器可接收一麥克風(fēng)陣列(可包括多個(gè)麥克風(fēng))所提供的多個(gè)收音頻號(hào),對(duì)其中的部份(一或多個(gè))收音頻號(hào)進(jìn)行回音消除處理,其余的(一或多個(gè))收音頻號(hào)則不需經(jīng)由回音消除處理;再者,利用回音消除后的收音頻號(hào)與未經(jīng)回音消除的收音頻號(hào)整合進(jìn)行波束成型處理,以達(dá)成聚焦收音與回音消除。換言之,本發(fā)明是對(duì)不同麥克風(fēng)提供的信號(hào)采用不均衡的回音消除,再搭配波束成型來(lái)整合實(shí)現(xiàn)聚焦收音與回音消除。相較于已知技術(shù),本發(fā)明可避免回音消除受到波束成型影響,且不需對(duì)所有聲道的麥克風(fēng)進(jìn)行回音消除,故可兼顧優(yōu)秀的回音消除效果與精簡(jiǎn)的運(yùn)算量。
[0047] 綜上所述,雖然本發(fā)明已以較佳實(shí)施例揭示如上,然其并非用以限定本發(fā)明。本發(fā)明所屬【技術(shù)領(lǐng)域】中具有通常知識(shí)者,在不脫離本發(fā)明的精神和范圍內(nèi),當(dāng)可作各種的更動(dòng)與潤(rùn)飾。因此,本發(fā)明的保護(hù)范圍當(dāng)由權(quán)利要求書所界定為準(zhǔn)。
【權(quán)利要求】
1.一種應(yīng)用于一音頻裝置的控制器,該控制器接收兩麥克風(fēng)分別提供的一第一收音頻號(hào)與一第二收音頻號(hào),并包含: 一回音消除模塊,對(duì)該第一收音頻號(hào)進(jìn)行一回音消除處理并據(jù)以提供一中介信號(hào);以及 一波束成型模塊,依據(jù)該中介信號(hào)與該第二收音頻號(hào)進(jìn)行一波束成型處理并據(jù)以提供一輸出信號(hào),其中該第二收音頻號(hào)不經(jīng)該回音消除處理。
2.如權(quán)利要求1所述的控制器,其特征在于,該音頻裝置包含一音頻輸出模塊與一播放模塊,該播放模塊依據(jù)該音頻輸出模塊輸出的一音源信號(hào)進(jìn)行播放,其中,該回音消除模塊依據(jù)該音源信號(hào)對(duì)該第一收音頻號(hào)進(jìn)行該回音消除處理。
3.如權(quán)利要求1所述的控制器,其特征在于,還包含: 一語(yǔ)音辨識(shí)模塊,對(duì)該輸出信號(hào)進(jìn)行一語(yǔ)音辨識(shí)。
4.如權(quán)利要求3所述的控制器,其特征在于,依據(jù)該語(yǔ)音辨識(shí)的結(jié)果控制該音頻裝置。
5.一種應(yīng)用于一音頻裝置的操作方法,包含: 分別自一第一麥克風(fēng)與一第二麥克風(fēng)接收一第一收音頻號(hào)與一第二收音頻號(hào); 對(duì)該第一收音頻號(hào)進(jìn)行一回音消除處理并據(jù)以提供一中介信號(hào);以及依據(jù)該中介信號(hào)與該第二收音頻號(hào)進(jìn)行一波束成型處理并據(jù)以提供一輸出信號(hào),其中該第二收音頻號(hào)不經(jīng)該回音消除處理。
6.如權(quán)利要求5所述的操作方法,其特征在于,該音頻裝置包含一音頻輸出模塊與一播放模塊,該播放模塊依據(jù)該音頻輸出模塊輸出的一音源信號(hào)進(jìn)行播放,其中,對(duì)該第一收音頻號(hào)進(jìn)行該回音消除處理并據(jù)以提供該中介信號(hào)的步驟,依據(jù)該音源信號(hào)進(jìn)行。
7.如權(quán)利要求5所述的操作方法,其特征在于,還包含:對(duì)該輸出信號(hào)進(jìn)行一語(yǔ)音辨識(shí)。
8.如權(quán)利要求7所述的操作方法,其特垂下在于,還包含:依據(jù)該語(yǔ)音辨識(shí)的結(jié)果控制該音頻裝置。
【文檔編號(hào)】H04R3/02GK104469619SQ201310414628
【公開日】2015年3月25日 申請(qǐng)日期:2013年9月12日 優(yōu)先權(quán)日:2013年9月12日
【發(fā)明者】黃宏吉, 胡正倫 申請(qǐng)人:晨星半導(dǎo)體股份有限公司