專利名稱:一種可抑制移動噪聲的麥克風(fēng)陣列語音增強(qiáng)裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種麥克風(fēng)語音增強(qiáng)裝置,尤其是涉及一種可抑制移動噪聲的麥克風(fēng)陣列語音增強(qiáng)裝置。
背景技術(shù):
在眾多語音相關(guān)應(yīng)用領(lǐng)域,如舞臺、遠(yuǎn)程會議、聲紋識別、語音識別以及語音通信中,普遍用單個的孤立麥克風(fēng)進(jìn)行語音信號采集。但在實(shí)際使用環(huán)境中,麥克風(fēng)可以拾取拾音范圍內(nèi)的任何聲音,因此不可避免地引入背景噪音,從而影響對語音信號的處理性能。利用多個麥克風(fēng)排成線形或環(huán)形等陣列,可以通過結(jié)合陣列信號處理而達(dá)到智能的語音信號處理。陣列式麥克風(fēng)在時域和頻域的基礎(chǔ)上增加一個空間域,對接收到的來自空間不同方向的空時信號進(jìn)行處理,能夠采用自適應(yīng)算法自動跟蹤說話人的方向和位置變 化并提高信噪比。例如可通過傳統(tǒng)時延差算法或超分辨方位估計算法獲取語音聲源方位之后,利用波束形成技術(shù)(beam forming)形成一個指向感興趣的說話人的波束來增強(qiáng)該方向的接收信號。因此,麥克風(fēng)陣列技術(shù)可廣泛利用于具有嘈雜背景的語音處理場合,例如會場、多媒體教室、車載免提電話和助聽器等。陣列麥克風(fēng)技術(shù)已成為語音信號處理研究的一個熱點(diǎn)。獲取聲源的位置或者方位是麥克風(fēng)陣列語音增強(qiáng)技術(shù)的前提條件,因此,基于麥克風(fēng)陣列的聲源定位和語音增強(qiáng)技術(shù)是密切相關(guān)的,位置估計是進(jìn)行波束形成的依據(jù),是麥克風(fēng)陣列語音增強(qiáng)的基礎(chǔ),也直接影響其語音增強(qiáng)性能。如麥克風(fēng)陣列語音增強(qiáng)中常用的“廣義旁瓣對消器”(GSC, Generalized sidelobe canceller)(參見文獻(xiàn)I),利用一個對準(zhǔn)聲源方向的固定波束通路和具有阻塞矩陣和對消器的自適應(yīng)通路實(shí)現(xiàn)信號中的干擾抵消,其使用前提是必須首先獲取說話人的方位。對于以固定系數(shù)阻塞矩陣輸出噪聲參考信號的經(jīng)典GSC算計結(jié)構(gòu),由于存在時延估計等因素帶來的語音信號方向估計誤差,使得噪聲參考信號中不可避免地含有與語音相關(guān)的信號成分,從而導(dǎo)致自適應(yīng)波束形成輸出端的語音信號抵消現(xiàn)象,降低了語音增強(qiáng)效果。中國專利ZL 200510105526. 7提出一種使用噪聲降低的多通道自適應(yīng)語音信號處理方法,該方法通過對GSC的固定波束通路增加一個自適應(yīng)處理器改善信號通道的信噪t匕。該方法借助頻域時延估計來補(bǔ)償各通道時延,以使得波束對準(zhǔn)聲源方向。該方法在獲取了聲源方向后,按照聲源方向通過阻塞矩陣形成參考噪聲通路,因此當(dāng)部分語音信號成分泄漏到參考噪聲通路時將影響GSC算法的語音增強(qiáng)性能。針對經(jīng)典GSC算法的上述缺點(diǎn),涌現(xiàn)了幾種可抑制語音信號泄漏到噪聲通路的改進(jìn)算法,包括1996年Hoshuyama等在經(jīng)典GSC算法基礎(chǔ)上提出一種具有魯棒性的自適應(yīng)約束波束形成方法(參見文獻(xiàn)3),用一個自適應(yīng)阻塞濾波器取代固定系數(shù)的阻塞矩陣來產(chǎn)生噪聲參考信號,從而可降低噪聲參考信號中含有的語音相關(guān)成分。2004年,Gannot等人以GSC結(jié)構(gòu)為基礎(chǔ),提出了一種基于聲學(xué)轉(zhuǎn)移函數(shù)的廣義旁瓣抵消器(TF-GSC)算法(參見文獻(xiàn)4),該算法采用聲學(xué)通道轉(zhuǎn)移函數(shù)比率組成自適應(yīng)阻塞矩陣,由于通過語音信號傳遞函數(shù)比率而不是通過傳遞函數(shù)本身來構(gòu)造阻塞矩陣的,因此該算法從一定程度上能夠減小了語音信號泄漏到噪聲參考信號通道的可能,從而可減弱了語音信號的內(nèi)部抵消。但是,由于上述改進(jìn)算法在GSC結(jié)構(gòu)中引入了第二個自適應(yīng)濾波器用于產(chǎn)生參考噪聲信號,使得算法中兩個自適應(yīng)濾波器同時收斂的速度減慢、算法性能受參數(shù)設(shè)置的影響也比較明顯。同時,對于語音識別、聲紋識別、遠(yuǎn)程會議等應(yīng)用中背景噪聲源為移動說話人、移動車輛的場合,說話過程中背景噪聲源的位置將發(fā)生變化。此時,由于上述改進(jìn)算法中引入用于替代固定阻塞矩陣的自適應(yīng)濾波器、自適應(yīng)阻塞矩陣中的輸入信號均來自對準(zhǔn)的語音方向,無法處理背景噪聲方向變化對語音信號泄漏造成的影響,其抑制語音信號泄漏到參考噪聲通道的性能下降,因此也將影響到算法的語音增強(qiáng)效果。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對傳統(tǒng)的GSC類型麥克風(fēng)陣列語音增強(qiáng)算法在背景噪聲移 動時的性能下降等不足,提供一種可抑制移動噪聲的麥克風(fēng)陣列語音增強(qiáng)裝置。本發(fā)明設(shè)有5元麥克風(fēng)組成的等間距線陣、端點(diǎn)檢測模塊、語音波束形成器模塊、固定系數(shù)濾波器模塊、噪聲波束形成器模塊、語音信號段波束掃描模塊、噪聲信號段波束掃描模塊、和自適應(yīng)噪聲對消器模塊;所述5元麥克風(fēng)組成的等間距線陣的輸出端分別與端點(diǎn)檢測模塊、語音波束形成器模塊和噪聲波束形成器模塊的輸入端連接,端點(diǎn)檢測模塊的語音信號段輸出端接語音信號段波束掃描模塊的輸入端,端點(diǎn)檢測模塊的噪聲信號段輸出端接噪聲信號段波束掃描模塊的輸入端,語音信號段波束掃描模塊的語音聲源方位信息輸出端接語音波束形成器模塊的輸入端,噪聲信號段波束掃描模塊的噪聲源方位信息輸出端接噪聲波束形成器模塊的輸入端;語音波束形成器模塊的增強(qiáng)后語音信號輸出端接固定系數(shù)濾波器模塊的輸入端,固定系數(shù)濾波器模塊的語音信號輸出端和噪聲波束形成器模塊的噪聲信號輸出端分別接自適應(yīng)噪聲對消器模塊的輸入端,經(jīng)過自適應(yīng)噪聲對消器模塊的噪聲對消處理后的增強(qiáng)語音信號由自適應(yīng)噪聲對消器模塊的輸出端輸出。5元麥克風(fēng)陣列用于進(jìn)行語音信號多通道采集,麥克風(fēng)陣列采集的語音信號經(jīng)前置放大、模數(shù)轉(zhuǎn)換后通過數(shù)據(jù)線直接輸入端點(diǎn)檢測模塊、波束掃描模塊(包括語音信號段波束掃描模塊和噪聲信號段波束掃描模塊)、語音波束形成模塊和噪聲波束形成模塊;端點(diǎn)檢測模塊根據(jù)能量、過零率參數(shù)對輸入信號進(jìn)行語音信號段、背景噪聲段(即無語音信號部分)的分割;方位掃描模塊根據(jù)端點(diǎn)檢測結(jié)果分別對噪聲信號段、語音信號段進(jìn)行波束掃描,獲取語音聲源方向信息及語音開始前、結(jié)束后的噪聲方向信息;獲取的聲源方位信息輸入語音波束形成模塊,根據(jù)聲源方向信息計算各通道時延補(bǔ)償值,并據(jù)此對麥克風(fēng)陣列各通道接收信號進(jìn)行時延補(bǔ)償、疊加以增強(qiáng)聲源方向語音信號;固定系數(shù)濾波器模塊對增強(qiáng)后的語音信號進(jìn)行濾波獲取希望的頻率響應(yīng);獲取的噪聲方位信息輸入噪聲波束形成模塊,根據(jù)噪聲方向信息計算各通道時延補(bǔ)償值,并據(jù)此對麥克風(fēng)陣列各通道接收信號進(jìn)行時延補(bǔ)償、疊加以增強(qiáng)聲源方向語音信號;自適應(yīng)噪聲消除器模塊則利用輸入的語音信號、噪聲信號進(jìn)行自適應(yīng)噪聲對消處理,并輸出增強(qiáng)語音信號。本發(fā)明實(shí)現(xiàn)語音增強(qiáng)功能的步驟包括端點(diǎn)檢測、波束掃描、語音波束形成、噪聲波束形成和噪聲消除等步驟。在端點(diǎn)檢測步驟對輸入信號進(jìn)行語音段、背景噪聲段檢測;在波束掃描步驟對背景噪聲段、語音段信號分別進(jìn)行波束掃描獲取噪聲、語音聲源方向;通過掃描獲得噪聲、語音聲源方向后,噪聲波束形成器模塊、語音波束形成器模塊根據(jù)幾何關(guān)系分別計算麥克風(fēng)陣列信號各通道的時延補(bǔ)償值以形成對準(zhǔn)噪聲源、語音聲源的波束;自適應(yīng)噪聲消除模塊根據(jù)語音通路和 噪聲通路的輸出進(jìn)行自適應(yīng)噪聲對消處理。本發(fā)明簡單方便,可抑制移動噪聲。針對聲紋識別、語音識別等麥克風(fēng)陣列語音增強(qiáng)的情況,本發(fā)明提出采用技術(shù)成熟、使用簡單方便的波束掃描手段來獲取目標(biāo)聲源和噪聲的方向信息,并將聲源及噪聲方向信息用于麥克風(fēng)陣列語音增強(qiáng)算法實(shí)現(xiàn)語音增強(qiáng)。本發(fā)明實(shí)現(xiàn)抑制移動噪聲的麥克風(fēng)陣列語音增強(qiáng)的具體思路為首先基于端點(diǎn)檢測結(jié)果分別對語音段、噪聲段信號進(jìn)行波束掃描,獲取噪聲源、語音聲源方向信息;在獲得噪聲源、語音聲源方向信息后可換算出每個通道的時延補(bǔ)償指并據(jù)此進(jìn)行噪聲方向、語音聲源方向的時延補(bǔ)償疊加形成分別對準(zhǔn)噪聲源、語音聲源的波束;最后通過語音通路、噪聲通路進(jìn)行噪聲自適應(yīng)噪聲消除處理,實(shí)現(xiàn)語音增強(qiáng)。與現(xiàn)有的傳統(tǒng)麥克風(fēng)陣列定位與語音增強(qiáng)方法相比,本發(fā)明的突出優(yōu)點(diǎn)在于由于采用波束掃描方式在靜音段(無語音信號的時間段)對背景噪聲聲源進(jìn)行方向估計,可獲取說話人發(fā)出語音過程中背景噪聲源的方向變化信息,與傳統(tǒng)GSC算法采用固定阻塞矩陣得到參考噪聲相比,根據(jù)波束掃描獲取的噪聲源方向信息進(jìn)行噪聲源波束形成可提供移動條件下的參考噪聲信息,從而可在抑制移動噪聲的同時實(shí)現(xiàn)麥克風(fēng)陣列語音增強(qiáng)。
圖I為本發(fā)明實(shí)施例的結(jié)構(gòu)組成示意圖。圖2為本發(fā)明實(shí)施例的5元麥克風(fēng)陣列及其與微處理器連接電路原理圖。圖3為本發(fā)明實(shí)施例的波束掃描原理圖。
具體實(shí)施例方式為了使本發(fā)明的技術(shù)內(nèi)容、特征、優(yōu)點(diǎn)更加明顯易懂,下文以本發(fā)明可抑制移動噪聲的麥克風(fēng)陣列語音增強(qiáng)裝置實(shí)施例并結(jié)合附圖具體說明如下。參見圖1,本發(fā)明實(shí)施例設(shè)有5元麥克風(fēng)組成的等間距線陣I、端點(diǎn)檢測模塊2、語音波束形成器模塊3、固定系數(shù)濾波器模塊4、噪聲波束形成器模塊5、語音信號段波束掃描模塊61、噪聲信號段波束掃描模塊62和自適應(yīng)噪聲對消器模塊7。所述5兀麥克風(fēng)M組成的等間距線陣I的模數(shù)轉(zhuǎn)換器D輸出端分別與端點(diǎn)檢測模塊2、語音波束形成器模塊3和噪聲波束形成器模塊5的輸入端連接,端點(diǎn)檢測模塊2的語音信號段輸出端接語音信號段波束掃描模塊61的輸入端,端點(diǎn)檢測模塊2的噪聲信號段輸出端接噪聲信號段波束掃描模塊62的輸入端,語音信號段波束掃描模塊61的語音聲源方位信息31輸出端接語音波束形成器模塊3的輸入端,噪聲信號段波束掃描模塊62的噪聲源方位信息51輸出端接噪聲波束形成器模塊5的輸入端;語音波束形成器模塊3的增強(qiáng)后語音信號輸出端接固定系數(shù)濾波器模塊4的輸入端,固定系數(shù)濾波器模塊4的語音信號輸出端和噪聲波束形成器模塊5的噪聲信號輸出端分別接自適應(yīng)噪聲對消器模塊7的輸入端,經(jīng)過自適應(yīng)噪聲對消器模塊7的噪聲對消處理后的增強(qiáng)語音信號由自適應(yīng)噪聲對消器模塊7的輸出端輸出。本發(fā)明實(shí)施例中麥克風(fēng)陣列由5個等間距排列的麥克風(fēng)(m0,ml,…m4)組成線陣,通過陣列波束掃描獲取噪聲源、語音聲源方向猴,陣列中各麥克風(fēng)采集的語音信號進(jìn)時延補(bǔ)償后加權(quán)疊加可分別形成對準(zhǔn)噪聲源和語音聲源方向的信號波束,并用于作為自適應(yīng)噪聲消除器的輸入進(jìn)行語音增強(qiáng)處理。具體地,5元麥克風(fēng)線陣由體積小、結(jié)構(gòu)簡單、電聲性能好的壓強(qiáng)式駐極體麥克風(fēng)micO,…,mic4,NJM2100運(yùn)算放大器芯片構(gòu)成的前置放大電路及MAX118模數(shù)轉(zhuǎn)換芯片構(gòu)成,在本實(shí)施例中麥克風(fēng)間距d = 0. lm。本實(shí)施例中端點(diǎn)檢測、語音波束形成器模塊、固定系數(shù)濾波器模塊、噪聲波束形成器模塊、波束掃描模塊、自適應(yīng)噪聲對消器模塊均屬于數(shù)字信號處理模塊,在本實(shí)施例中采用ARM9S3C2440微處理器進(jìn)行軟件編程實(shí)現(xiàn)。
該麥克風(fēng)陣列語音增強(qiáng)裝置中5元麥克風(fēng)線陣與微處理器的連接方式為5元麥克風(fēng)線陣中5個麥克風(fēng)輸出信號經(jīng)過圖2所示運(yùn)算放大器構(gòu)成的2級前置放大電路放大后輸入多通道模數(shù)轉(zhuǎn)換芯片MAXl 18,S3C2440微處理器通過IO 口 GPB2,3,4控制MAXl 18的輸入通道端Al、A2、A3,通過定時器輸出腳TOUTO、TOUTl控制MAXl 18的讀出/寫入端口 WR、RD進(jìn)行采樣頻率16ksps的模數(shù)轉(zhuǎn)換,通過數(shù)據(jù)線DATAO至DATA7進(jìn)行8bit模數(shù)轉(zhuǎn)換結(jié)果到S3C2440微處理器的傳送。該麥克風(fēng)陣列語音增強(qiáng)裝置中多通道語音信號模數(shù)轉(zhuǎn)換進(jìn)入微處理器后,以軟件形式運(yùn)行的各數(shù)字信號處理模塊間的數(shù)據(jù)、控制流連接方式如圖3所示,具體說明如下本發(fā)明實(shí)施例的端點(diǎn)檢測模塊采用本領(lǐng)域公知的信號能量、過零率參數(shù)檢測算法對輸入信號中語音信號的起始點(diǎn)和結(jié)束點(diǎn),并根據(jù)語音信號的起始點(diǎn)和結(jié)束點(diǎn)將輸入信號分為語音端和背景噪聲段。波束掃描模塊通過對麥克風(fēng)陣列各通道信號時延進(jìn)行逐次時延調(diào)整后疊加以獲得不同的波束對應(yīng)的波束成形信號。波束掃描原理結(jié)合圖3具體說明如下在本發(fā)明實(shí)施例中,以5元麥克風(fēng)線陣所在水平線為X軸,以5元麥克風(fēng)線陣中間的麥克風(fēng)m2位置為坐標(biāo)原點(diǎn)建立定位坐標(biāo)系,線陣各陣元間距為d??紤]實(shí)施例中聲源處于遠(yuǎn)場范圍,其發(fā)出的語音信號到達(dá)麥克風(fēng)線陣時可以認(rèn)為是平面入射波。以本實(shí)施例線陣的中心陣元麥克風(fēng)m2作為基準(zhǔn)進(jìn)行波束掃描即,m2接收的語音信號不作時延補(bǔ)償,線陣中其余通道麥克風(fēng)接收的語音信號Xi進(jìn)行如下時延補(bǔ)償計算后得到x’ i (如圖3所示)X,J (k) = Xi (k,)k' = k + roiiiuf[j —~—]. / = 0,1,2.3.4
2
r(^) /I 「 1
f }/c./6, - arccos Js A , - arc cos -:~
/2dId ■ fs其中i為線陣中各通道的編號,j=0, ±1,±2,±3,…代表波束掃描序號,0 j為每次時延調(diào)整后形成的掃描波束,C為空氣中的聲速(本實(shí)施例中取340m/s),fs為麥克風(fēng)陣列語音信號的采樣頻率(單位為Hz,在本實(shí)施例中取16000Hz),round()代表取整運(yùn)算。則逐次時延補(bǔ)償后對各通道語音信號x’ i進(jìn)行疊加即可實(shí)現(xiàn)正、負(fù)90度范圍(本實(shí)施例中對麥克風(fēng)線陣前方180度范圍進(jìn)行波束掃描)的波束掃描,從掃描中各角度波束得到的波束形成信號中求出具有最大能量的信號對應(yīng)波束即可獲得語音聲源、噪聲源的方位角。本實(shí)施例中,考慮到多數(shù)使用場合中說話人有較好的合作度而背景噪聲則無(SP背景噪聲較有可能發(fā)生移動),為了降低算法的運(yùn)算量,在端點(diǎn)檢測模塊進(jìn)行端點(diǎn)檢測完成語音段、噪聲段分割后,對語音信號只進(jìn)行一次波束掃描以確定語音聲源的方位角,對噪聲段信號則在每段噪聲均進(jìn)行波束掃描以獲取由于噪聲源移動發(fā)生變化的噪聲源方位角。通過波束掃描模塊獲取語音聲源、噪聲源方位信息后,噪聲波束形成模塊、語音波束形成模塊分別根據(jù)獲得的語音聲源、噪聲源方位角度對麥克風(fēng)陣列各通道信號進(jìn)行時延補(bǔ)償,時延補(bǔ)償原理同波束掃描原理,即直接利用形成該掃描波束時用到的各通道時延補(bǔ)償值。其中噪聲波束形成模塊由于采用每個噪聲段進(jìn)行波束掃描獲取的噪聲源方位角,當(dāng)噪聲源移動導(dǎo)致噪聲方位角變化時,噪聲波束形成模塊可保證以對準(zhǔn)噪聲源的波束輸出參考噪聲。 在本實(shí)施例中,語音波束形成模塊輸出的語音信號輸入固定系數(shù)FIR濾波器模塊用于形成理想的頻率響應(yīng),固定系數(shù)濾波器模塊可根據(jù)預(yù)期的理想頻率響應(yīng)采用本領(lǐng)域公知的濾波器系數(shù)計算方法產(chǎn)生FIR濾波器的固定系數(shù)。自適應(yīng)噪聲消除器模塊有參考噪聲、含噪信號兩個輸入端,以噪聲波束形成模塊的輸出信號作為參考噪聲輸入信號,固定系數(shù)FIR濾波器的輸出信號作為含噪輸入信號,本實(shí)施例中采用本領(lǐng)域公知的LMS (最小均方誤差算法)自適應(yīng)算法調(diào)整自適應(yīng)噪聲消除器的權(quán)系數(shù)進(jìn)行自適應(yīng)噪聲消除處理。則經(jīng)過自適應(yīng)噪聲消除處理后,系統(tǒng)語音增強(qiáng)輸出為固定系數(shù)FIR濾波器輸出與自適應(yīng)噪聲消除器的輸出之差。本發(fā)明最大的特點(diǎn)在于借助波束掃描獲取噪聲源方位,以替代傳統(tǒng)GSC算法中的阻塞矩陣產(chǎn)生噪聲參考信號,從而改善語音信號的泄漏、增強(qiáng)對移動噪聲源的抑制效果,改善移動背景噪聲條件下的麥克風(fēng)陣列語音增強(qiáng)性能。
權(quán)利要求
1.一種可抑制移動噪聲的麥克風(fēng)陣列語音增強(qiáng)裝置,其特征在于設(shè)有5元麥克風(fēng)組成的等間距線陣、端點(diǎn)檢測模塊、語音波束形成器模塊、固定系數(shù)濾波器模塊、噪聲波束形成器模塊、語音信號段波束掃描模塊、噪聲信號段波束掃描模塊和自適應(yīng)噪聲對消器模塊;所述5元麥克風(fēng)組成的等間距線陣的輸出端分別與端點(diǎn)檢測模塊、語音波束形成器模塊和噪聲波束形成器模塊的輸入端連接,端點(diǎn)檢測模塊的語音信號段輸出端接語音信號段波束掃描模塊的輸入端,端點(diǎn)檢測模塊的噪聲信號段輸出端接噪聲信號段波束掃描模塊的輸入端,語音信號段波束掃描模塊的語音聲源方位信息輸出端接語音波束形成器模塊的輸入端,噪聲信號段波束掃描模塊的噪聲源方位信息輸出端接噪聲波束形成器模塊的輸入端;語音波束形成器模塊的增強(qiáng)后語音信號輸出端接固定系數(shù)濾波器模塊的輸入端,固定系數(shù)濾波器模塊的語音信號輸出端和噪聲波束形成器模塊的噪聲信號輸出端分別接自適應(yīng)噪聲對消器模塊的輸入端,經(jīng)過自適應(yīng)噪聲對消器模塊的噪聲對消處理后的增強(qiáng)語音信號由自適應(yīng)噪聲對消器模塊的輸出端輸出。
全文摘要
一種可抑制移動噪聲的麥克風(fēng)陣列語音增強(qiáng)裝置,涉及一種麥克風(fēng)語音增強(qiáng)裝置。設(shè)有5元麥克風(fēng)組成的等間距線陣、端點(diǎn)檢測模塊、語音波束形成器模塊、固定系數(shù)濾波器模塊、噪聲波束形成器模塊、語音信號段波束掃描模塊、噪聲信號段波束掃描模塊和自適應(yīng)噪聲對消器模塊。等間距線陣輸出端分別與端點(diǎn)檢測模塊、語音波束形成器模塊和噪聲波束形成器模塊輸入端連接,端點(diǎn)檢測模塊輸出端一路經(jīng)語音信號段波束掃描模塊、語音波束形成器模塊和固定系數(shù)濾波器模塊接自適應(yīng)噪聲對消器模塊;端點(diǎn)檢測模塊輸出端另一路經(jīng)噪聲信號段波束掃描模塊、噪聲波束形成器模塊接自適應(yīng)噪聲對消器模塊。
文檔編號G10L21/0332GK102969002SQ20121049701
公開日2013年3月13日 申請日期2012年11月28日 優(yōu)先權(quán)日2012年11月28日
發(fā)明者童峰, 洪青陽, 周躍海, 李芳蘭 申請人:廈門大學(xué)