信號(hào)處理裝置、方法以及程序的制作方法
【專利摘要】以提供比以往提高了噪音抑制性能的信號(hào)處理技術(shù)作為目的。第一分量提取部(14)根據(jù)目標(biāo)區(qū)的功率譜密度通過時(shí)間平均處理,提取由從目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量以及由不相干的噪音派生的穩(wěn)定分量第二分量提取部(15)根據(jù)噪音區(qū)的功率譜密度提取由干擾噪音派生的非穩(wěn)定分量以及由不相干的噪音派生的穩(wěn)定分量。
【專利說明】
信號(hào)處理裝置、方法以及程序
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及利用多個(gè)話筒清楚地接收從目標(biāo)方向到來(lái)的聲源信號(hào)的技術(shù)。
【背景技術(shù)】
[0002] 首先,說明信號(hào)處理的基本框架。
[0003] 設(shè)想利用由Μ個(gè)話筒構(gòu)成的陣列。Μ是2以上的整數(shù)。例如,將Μ設(shè)為2至4左右。也可 以將Μ設(shè)為100左右。在頻率ω且?guī)瑫r(shí)間τ的觀測(cè)信號(hào)X m( ω,τ) (m = 1,2,…,Μ)中,包含相干 且具有不穩(wěn)定性的一個(gè)目標(biāo)音3〇(?,1)、1(個(gè)干擾噪音51{(?,1)仏=1,2,~,1〇、不相干的穩(wěn) 定性噪音仏(《,τ)。將Κ設(shè)為規(guī)定的正整數(shù)。m是各話筒的編號(hào),觀測(cè)信號(hào)Χ η(ω,τ)是將通過 話筒m接收的時(shí)域的信號(hào)變換為頻域的信號(hào)。
[0004]目標(biāo)音是從規(guī)定的目標(biāo)區(qū)到來(lái)的聲音。目標(biāo)區(qū)是包含想要接收的聲源的區(qū)域。想 要接收的聲源的數(shù)目以及想要接收的聲源在目標(biāo)區(qū)內(nèi)的位置可以是未知的。例如,如圖6所 例示,設(shè)配置有6個(gè)揚(yáng)聲器以及3個(gè)話筒的區(qū)域被分割為3個(gè)區(qū)(區(qū)1、區(qū)2、以及區(qū)3)。當(dāng)想要 接收的聲源包含于區(qū)1的情況下,區(qū)1成為目標(biāo)區(qū)。
[0005] 另外,目標(biāo)音中也可以包含來(lái)自目標(biāo)區(qū)外的聲源的反射音。例如,當(dāng)目標(biāo)區(qū)為區(qū)1 的情況下,目標(biāo)音也可以包含,在從區(qū)2以及區(qū)3中包含的聲源產(chǎn)生的聲音中通過反射而從 區(qū)1的方向來(lái)到話筒的聲音。
[0006] 目標(biāo)區(qū)可以是離話筒規(guī)定的距離以內(nèi)的區(qū)。換言之,也可以是具有有限的面積的 區(qū)。進(jìn)而,目標(biāo)區(qū)也可以有多個(gè)。圖7是表示目標(biāo)區(qū)有2個(gè)的情況下的例子的圖。
[0007] 另外,也將包含發(fā)出噪音的聲源的區(qū)稱為噪音區(qū)。在圖6的例子中,當(dāng)發(fā)出噪音的 聲源分別包含于區(qū)2以及區(qū)3中的情況下,區(qū)2以及區(qū)3分別成為噪音區(qū)。在本例中,將區(qū)2以 及區(qū)3分別設(shè)為噪音區(qū),但也可以將整合了區(qū)2以及區(qū)3的區(qū)設(shè)為噪音區(qū)。也將包含發(fā)出干擾 噪音的聲源的噪音區(qū)特別稱為干擾噪音區(qū)。進(jìn)行設(shè)定,使得噪音區(qū)不同于目標(biāo)區(qū)。
[0008] 在將第m個(gè)話筒至目標(biāo)音S〇( ω,τ)的傳遞特性記為Am,〇( ω ),將第m個(gè)話筒至第k個(gè) 干擾噪音的傳遞特性記為Am,k( ω )時(shí),觀測(cè)信號(hào)Xm( ω,τ)如以下那樣建模。
[0009] 【數(shù)1】
[0011]當(dāng)話筒數(shù)目少的情況下,即例如Μ〈Κ的情況下,結(jié)合了基于最小方差無(wú)失真響應(yīng) (MVDR)的波束成形與后置濾波器的框架可有效抑制噪音(例如,參照非專利文獻(xiàn)1)。圖1表 示后置濾波器型陣列的處理流程。被設(shè)計(jì)為強(qiáng)調(diào)目標(biāo)音的濾波器系數(shù)《〇( ω ) = [W0>1 (ω),…,W0,M(co)]T可如以下計(jì)算。
[0012]【數(shù)2】
[0014] 在此,將x設(shè)為任意的向量或矩陣,xT表示x的轉(zhuǎn)置,xH表示x的共輒轉(zhuǎn)置。ho( ω )= [Ηο,ι( ω ),…,Hq,m( ω )]τ是目標(biāo)音方向的陣列流形向量。陣列流形向量是將從聲源至話筒 的傳遞特性Ho,m( ω )設(shè)為向量ho( ω )的向量,從聲源至話筒的傳遞特性Ho,m( ω )是根據(jù)聲源 和話筒位置而理論上能夠算出的僅假設(shè)了直接音的傳遞特性、或?qū)崪y(cè)的傳遞特性、通過鏡 像法和有限元素法等計(jì)算機(jī)仿真來(lái)估計(jì)的傳遞特性。若假設(shè)為源信號(hào)互相不相干,則能夠 將空間相關(guān)矩陣R( ω )如以下那樣建模。
[0015] 【數(shù)3】
[0017] 在此,hk( ω )是第k個(gè)干擾噪音的陣列流形向量。波束成形的輸出信號(hào)Υ〇( ω,τ)可 通過以下的式來(lái)獲得。
[0018] 【數(shù)4】
[0020] 在此,χ( ω = ω,τ),···,ΧΜ( ω,τ)]τ。為了抑制在 Υ〇( ω,τ)中包含的噪音信 號(hào),乘以后置濾波器6(ω,τ)。
[0021] 【數(shù)5】
[0022] Ζ( ω ,τ)=6( ω ,τ)Υ〇( ω ,τ)···(5)
[0023]最后,通過對(duì)Ζ( ω,τ)進(jìn)行快速傅里葉反變換(IFFT),獲得輸出信號(hào)。
[0024] 接著,說明基于非專利文獻(xiàn)2的后置濾波器設(shè)計(jì)法。
[0025] 在非專利文獻(xiàn)2中,提出了基于利用多個(gè)波束成形而估計(jì)的各區(qū)的功率譜密度 (PSD)而設(shè)計(jì)后置濾波器的方式(例如,參照非專利文獻(xiàn)2)。以下,將該方式稱為L(zhǎng)PSD法(基 于本地PSD的后置濾波器設(shè)計(jì)(Local PSD-based post-filter design))。利用圖2,說明 LPSD法的處理流程。
[0026]當(dāng)基于Wiener法設(shè)計(jì)后置濾波器的情況下,如以下那樣計(jì)算G( ω,τ)。
[0027]【數(shù)6】
[0029] 在此,φ5(ω,τ)表示目標(biāo)區(qū)的功率譜密度,φΝ(ω,τ)表示噪音區(qū)的功率譜密度。 在此,當(dāng)稱為某區(qū)的功率譜密度的情況下,意味著從該區(qū)到來(lái)的聲音的功率譜密度。即,例 如,目標(biāo)區(qū)的功率譜密度是指從目標(biāo)區(qū)到來(lái)的聲音的功率譜密度,噪音區(qū)的功率譜密度是 指從噪音區(qū)到來(lái)的聲音的功率譜密度。用于根據(jù)Χ Β(ω,τ)而估計(jì)φ5(ω,τ)、φΝ(ω,τΜ9* 法有多種,但假設(shè)在觀測(cè)信號(hào)中包含干擾噪音,因此利用LPSD法。
[0030] 在LPSD法中,假設(shè)在觀測(cè)信號(hào)中包含有目標(biāo)音與干擾噪音,且這些在時(shí)間頻率區(qū) 域中稀疏。為了分析位于各方向的各區(qū)的功率譜密度,設(shè)計(jì)L+1個(gè)波束成形濾波器w u( ω )(u =0,1,…,L)。濾波器wu( ω )對(duì)第k個(gè)區(qū)方向的靈敏度I Du,k( ω ) 12、第u個(gè)輸出信號(hào)的功率I Yu (?,1)|2、各區(qū)的功率譜密度卜1<(〇,1)|2之間的關(guān)系能夠如以下那樣建模。在此,|〇 11,1<(〇) 2例如是 |〇11,1{(?)|2=|¥1/1(?)1 11{(?)|2。作為|〇11,1{(?)|2,也可以利用實(shí)測(cè)值。
[0033] 在此,省略了各符號(hào)的索引。即,¥11 = 丫11(〇,1),且〇11,1{ = 011,1{(〇〇,311 = 311((〇,1)。此 外,設(shè)Φγ( ω,τ) = [ |Υ0( ω,τ) I2, |Yi( ω,τ) I2,···,|YL( ω,τ) |2]Τ、Φ5( ω,τ) = [ |S0( ω,τ) 2, |Si( ω,τ) |2,···,|Sk( ω,τ) |2]Τ。
[0034] 例如,通過解式(7)的反問題,算出各區(qū)的功率譜密度。
[0035] 【數(shù)8】
[0037] 在此,將b設(shè)為任意的矩陣,b+表示對(duì)b的偽逆矩陣運(yùn)算。局部PSD估計(jì)部11將觀測(cè) 信號(hào)Xm( ω,τ)(ηι=1,2,···,M)作為輸入,從而輸出例如通過式(8)而定義的局部功率譜密度 'ΦΚω,τΚ?!贡硎臼潜还烙?jì)的。
[0038] 局部是指區(qū)。在圖6的例中,區(qū)1、區(qū)2、以及區(qū)3分別是局部。局部PSD估計(jì)部估計(jì)并 輸出各區(qū)的功率譜密度~Φ5(ω,τ)。
[0039] 目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12以針對(duì)每個(gè)頻率ω以及幀τ基于式(8)而估計(jì)的局部 功率譜密度~Φ5( ω,τ)作為輸入,算出通過以下的式定義的~ φ5( ω,τ)以及~ φΝ( ω,τ)。
[0040] 【數(shù)9】
[0043] 最后,維納增益計(jì)算部13以~Φ5(ω,τ)以及~φΝ(ω,τ)作為輸入,計(jì)算并輸出通過 式(6)定義的后置濾波器6(ω,τ)。具體來(lái)說,維納增益計(jì)算部13分別輸入~Φ 5(ω,τ)以及~ Φν( ω,τ)作為式(6)的<i>s( ω,τ)以及φΝ( ω,τ),從而計(jì)算并輸出G( ω,τ)。
[0044] LPSD法的主要的優(yōu)點(diǎn)有以下兩點(diǎn)。(i)在功率譜區(qū)域定義波束成形的輸出與各聲 源的關(guān)系,能夠獲得超過麥克風(fēng)的數(shù)量的控制自由度,因此能夠有效地抑制噪音;以及(ii) 只要事先計(jì)算L個(gè)波束成形wu( ω )(ιι = 0,1,···,υ與式(7)的D( ω ),就能夠以較低運(yùn)算量實(shí) 現(xiàn)(i)的優(yōu)點(diǎn)。
[0045] 現(xiàn)有技術(shù)文獻(xiàn)
[0046] 【非專利文獻(xiàn)】
[0047] 【非專利文獻(xiàn) 1 】C · Marro et al ·,"Analys i s of no i se reduct ion and dereverberation techniques based on microphone arrays with postfiltering,', IEEE Trans.Speech,Audio Proc.,6,240-259,1998.
[0048] 【非專利文獻(xiàn)2】Y.Hioka et al ·,"Underdetermined sound source separation using power spectrum density estimated by combination of directivity gain,', IEEE Trans.Audio,Speech,Language Proc.,21,1240-1250,2013.
【發(fā)明內(nèi)容】
[0049] 發(fā)明要解決的課題
[0050] 在LPSD法中,假定目標(biāo)音與干擾音混合存在的情況而定義了問題,但在實(shí)用上的 問題中,不僅是具有相干性的干擾噪音,多數(shù)情況是不相干性強(qiáng)的穩(wěn)定噪音(空調(diào)的噪音、 麥克的內(nèi)部噪音等)混合存在。此時(shí),Φ 5(ω,τ)以及φΝ(ω,τ)的估計(jì)誤差變大,有時(shí)導(dǎo)致噪 音抑制性能降低。
[0051] 本發(fā)明的目的在于,提供比以往提高噪音抑制性能的信號(hào)處理裝置、方法以及程 序。
[0052] 用于解決課題的手段
[0053]本發(fā)明的一方式的信號(hào)處理裝置具有:局部PSD估計(jì)部,基于根據(jù)通過構(gòu)成話筒陣 列的Μ個(gè)話筒接收到的信號(hào)而獲得的頻域的觀測(cè)信號(hào),估計(jì)目標(biāo)區(qū)以及不同于上述目標(biāo)區(qū) 的至少一個(gè)噪音區(qū)各自的局部功率譜密度;目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部,將ω設(shè)為頻率,將τ 設(shè)為幀的索引,基于估計(jì)到的局部功率譜密度,估計(jì)目標(biāo)區(qū)的功率譜密度~Φ5(ω,τ)以及 噪音區(qū)的功率譜密度~Φ Ν(ω,τ);第一分量提取部,根據(jù)目標(biāo)區(qū)的功率譜密度~φ5(ω,τ), 提取由從目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~Φ 5(Α)(ω,τ)以及由不相干的噪音派生的 穩(wěn)定分量~Φ5(Β)(ω,τ);第二分量提取部,根據(jù)噪音區(qū)的功率譜密度~φ Ν(ω,τ),提取由干 擾噪音派生的非穩(wěn)定分量~ΦΝ(Α)(ω,τ);以及各種噪音應(yīng)對(duì)型增益計(jì)算部,至少利用由從 目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~Φ 5(Α)(ω,τ)、由不相干的噪音派生的穩(wěn)定分量~ Φ5(Β)(ω,τ)、以及由干擾噪音派生的非穩(wěn)定分量~φΝ(Α)(ω, τ),計(jì)算用于強(qiáng)調(diào)從目標(biāo)區(qū)到 來(lái)的聲音的非穩(wěn)定分量的后置濾波器~G( ω,τ)。
[0054] 發(fā)明效果
[0055] 能夠比以往提尚卩栄首抑制性能。
【附圖說明】
[0056] 圖1是表示后置濾波器型陣列的處理流程的圖。
[0057] 圖2是以往的后置濾波器估計(jì)部的模塊圖。
[0058] 圖3是本發(fā)明所涉及的后置濾波器估計(jì)裝置的例的模塊圖。
[0059] 圖4是本發(fā)明所涉及的后置濾波器估計(jì)方法的例的模塊圖。
[0060] 圖5是用于說明實(shí)驗(yàn)結(jié)果的圖。
[00611圖6是用于說明目標(biāo)區(qū)以及噪音區(qū)的例的圖。
[0062]圖7是用于說明目標(biāo)區(qū)的例的圖。
[0063]圖8是用于說明增益成形的例的圖。
【具體實(shí)施方式】
[0064]在以下說明的信號(hào)處理裝置以及方法中,通過將LPSD法擴(kuò)展,從而對(duì)各種噪音環(huán) 境穩(wěn)健地估計(jì)后置濾波器。具體來(lái)說,按噪音的每個(gè)種類進(jìn)行分割而估計(jì)功率譜密度,從而 減少目標(biāo)音的功率與其他噪音的功率之比的估計(jì)誤差。
[0065]圖3表示本發(fā)明的一實(shí)施方式所涉及的信號(hào)處理裝置即后置濾波器估計(jì)部1的例 的模塊圖。
[0066]如圖3所示,信號(hào)處理裝置例如具有局部PSD估計(jì)部11、目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部 12、第一分量提取部14、第二分量提取部15、各種噪音應(yīng)對(duì)型增益計(jì)算部16、時(shí)間頻率平均 化部17、以及增益成形部18。
[0067] 例如,圖4表示通過該信號(hào)處理裝置實(shí)現(xiàn)的信號(hào)處理的各步驟。
[0068]以下,說明信號(hào)處理裝置以及方法的實(shí)施方式的細(xì)節(jié)。另外,關(guān)于基本信號(hào)處理的 框架、語(yǔ)言的定義等,與在【背景技術(shù)】的欄中記載的一樣。從而,省略這些重復(fù)說明。
[0069]〈局部PSD估計(jì)部11>
[0070] 局部PSD估計(jì)部11與現(xiàn)有的局部PSD估計(jì)部11 一樣。
[0071]即,局部PSD估計(jì)部11基于根據(jù)由構(gòu)成話筒陣列的Μ個(gè)話筒接收的信號(hào)獲得的頻域 的觀測(cè)信號(hào)1(?,1)(!11=1,2,~,1〇,估計(jì)目標(biāo)區(qū)以及噪音區(qū)各自的局部功率譜密度~〇5 (ω,τ)(步驟S1)。ω是頻率,τ是幀的索引。Μ是2以上的整數(shù)。例如,將Μ設(shè)為2至4左右。也可 以將Μ設(shè)為100左右。
[0072]所估計(jì)的局部功率譜密度~Φ5(ω,τ)被輸出到目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12。
[0073]估計(jì)局所功率譜密度的具體的處理例與在【背景技術(shù)】欄中記載的一樣,因此這里省 略說明。
[0074]另外,設(shè)波束成形濾波器wu( ω )以及靈敏度|Du,k( ω ) |2在局部PSD估計(jì)部11的處理 之前預(yù)先設(shè)定。此外,在目標(biāo)區(qū)的方向在一定程度上變化的情況下,局部PSD估計(jì)部11也可 以預(yù)先準(zhǔn)備多個(gè)濾波器組,選擇采用最大的功率的濾波器。
[0075]另外,局部PSD估計(jì)部11并非基于通過波束成形獲得的Yu( co,T)(u = 0,lr",L), 而是基于由在各區(qū)的方向具有指向性的各一個(gè)話筒接收到的Yu(?,τ)(ιι = 0,1,···,υ而估 計(jì)局部功率譜密度~Φ5(ω,τ)。
[0076]〈目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12>
[0077]目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12與以往的目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12同樣。
[0078] 即,目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12基于所估計(jì)的局部功率譜密度,估計(jì)目標(biāo)區(qū)的功 率譜密度~Φ5(ω,τ)以及噪音區(qū)的功率譜密度~φ Ν(ω,τ)(步驟S2)。
[0079] 所估計(jì)的目標(biāo)區(qū)的功率譜密度~ φ5( ω,τ)被輸出到第一分量提取部14。所估計(jì)的 噪音區(qū)的功率譜密度~ Φν( ω,τ)被輸出到第二分量提取部15。
[0080] 關(guān)于估計(jì)目標(biāo)區(qū)的功率譜密度~φ5(ω,τ)以及噪音區(qū)的功率譜密度~φΝ(ω,τ)的 具體的處理例,與在【背景技術(shù)】欄中記載的同樣,因此這里省略說明。
[0081 ]〈第一分量提取部14>
[0082] 例如在通過式(9)定義的~Φ5(ω,τ)中,包含由從目標(biāo)區(qū)接收到的聲音派生的非 穩(wěn)定分量~Φ5 (Α)(ω,τ)以及由不相干的噪音派生的穩(wěn)定分量·'巾,)(〇,〇。這里,穩(wěn)定分量 是時(shí)間上變化少的分量,非穩(wěn)定分量是時(shí)間上變化多的分量。
[0083] 這里,噪音有干擾噪音和不相干的噪音兩種噪音。干擾噪音是從在噪音區(qū)配置的 噪音聲源發(fā)出的噪音。不相干的噪音并非從目標(biāo)區(qū)和噪音區(qū)發(fā)出的,而是從這些區(qū)以外的 場(chǎng)所發(fā)出,是穩(wěn)定存在的噪音。
[0084]因此,第一分量提取部14根據(jù)目標(biāo)區(qū)的功率譜密度~Φ5(ω,τ),通過平滑處理,提 取由從目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~Φ5(Α)(ω,τ)以及由不相干的噪音派生的穩(wěn) 定分量~φ5(Β)(ω,τ)(步驟S3)。例如,平滑處理通過式(11)以及式(12)那樣的指數(shù)移動(dòng)平 均處理、時(shí)間平均處理或加權(quán)平均處理實(shí)現(xiàn)。
[0085]由從所提取的目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~φ5(Α)(ω,τ)以及由不相干 的噪音派生的穩(wěn)定分量~ Φ s(B)( ω,τ)被輸出到各種噪音應(yīng)對(duì)型增益計(jì)算部16。
[0086] 例如,第一分量提取部14如式(11)以及式(12)那樣,通過進(jìn)行指數(shù)移動(dòng)平均處理, 根據(jù) ~Φ5(ω,τ)計(jì)算 ~φ5(Β)(ω,τ)。
[0087]【數(shù)10】
[0090] 在此,as是平滑系數(shù),是規(guī)定的正實(shí)數(shù)。例如,設(shè)0〈<^〈1。此外,可以設(shè)為(^ =幀的時(shí) 間長(zhǎng)/時(shí)間常數(shù),從而將as設(shè)定為使時(shí)間常數(shù)成為150ms左右。TS是特定區(qū)間的幀的索引的 集合。例如,設(shè)定為使特定區(qū)間成為3至4秒左右。min是輸出最小值的函數(shù)。
[0091] 如此,~Φ5(Β)(ω,τ)是例如通過式(11)以及式(12)對(duì)~φ 5(ω,τ)進(jìn)行了平滑的分 量。更具體來(lái)說,~Φ5(Β)(ω,τ)是例如通過式(11)對(duì)~φ 5(ω,τ)進(jìn)行了平滑的值在規(guī)定的時(shí) 間區(qū)間中的最小值。
[0092] 然后,第一分量提取部14如式(13)那樣,從~Φ5(ω,τ)減去~φ5(Β)(ω,τ)從而計(jì)算 ~ φ5⑷(ω,τ)。
[0093] 【數(shù)11】
[0095] 在此,&( ω )是權(quán)重系數(shù),是規(guī)定的正實(shí)數(shù)。β5( ω )例如被設(shè)定為1至3左右的實(shí)數(shù)。
[0096] 如此,<i>s(A)( ω,τ)是從 ~ (J)S( ω,τ)去除了 ~ (J)S(B)( ω,τ)的分量。
[0097] 另外,~Φ5(Α)(ω,τ)也可以以滿足、^(?,1)_的條件的方式被進(jìn)行向下取整 處理(Flooring processing)。該向下取整處理例如由第一分量提取部14進(jìn)行。
[0098] 〈第二分量提取部15>
[0099] 例如通過式(10)定義的~φΝ(ω,τ)中,包含由干擾噪音派生的非穩(wěn)定分量~φΝ(Α) (ω,τ)以及由不相干的噪音派生的穩(wěn)定分量~ φ ν(β)( ω,τ)。
[0100] 因此,第二分量提取部15根據(jù)噪音區(qū)的功率譜密度~ΦΝ(ω,τ),通過平滑處理,提 取由干擾噪音派生的非穩(wěn)定分量~ Φ ν(Α) ( ω,τ)以及由不相干的噪音派生的穩(wěn)定分量~ φ ν(β) (ω,τ)(步驟S4)。例如,平滑處理通過如式(14)以及式(15)那樣的指數(shù)移動(dòng)平均處理、時(shí)間 平均處理或加權(quán)平均處理實(shí)現(xiàn)。
[0101] 由提取的干擾噪音派生的非穩(wěn)定分量~φΝ(Α)(ω,τ)以及由不相干的噪音派生的 穩(wěn)定分量~Φ Ν(Β)(ω,τ)被輸出到各種噪音應(yīng)對(duì)型增益計(jì)算部16。
[0102] 例如,第二分量提取部15通過如式(14)以及式(15)那樣進(jìn)行指數(shù)移動(dòng)平均處理, 根據(jù) ~ΦΝ(ω,τ)計(jì)算 ~φΝ⑶(ω,τ)。
[0103] 【數(shù)I2】
[0106]這里,αΝ是平滑系數(shù),是規(guī)定的正實(shí)數(shù)。例如,設(shè)〇〈<^〈1。此外,也可以設(shè)為如=幀的 時(shí)間長(zhǎng)/時(shí)間常數(shù),從而將αΝ設(shè)定為時(shí)間常數(shù)成為150ms左右。ΤΝ是特定區(qū)間的幀的索引的 集合。例如,被設(shè)定為特定區(qū)間成為3至4秒左右。
[0107] 如此,~ΦΝ(Β)(ω,τ)是例如通過式(14)以及式(15)對(duì)~ΦΝ(ω,τ)進(jìn)行了平滑的分 量。更具體來(lái)說,~ Φν(Β)( ω,τ)是例如通過式(14)對(duì)~ Φν( ω,τ)進(jìn)行了平滑的值在規(guī)定的時(shí) 間區(qū)間中的最小值。
[0108]然后,第二分量提取部15通過如式(16)那樣從~φΝ(ω,τ)減去、^(?,1),從而 計(jì)算~ φΝ(Α)( ω,τ)。
[0109]【數(shù)13】
[0111] 在此,βΝ( ω )是權(quán)重系數(shù),是規(guī)定的正實(shí)數(shù)。βΝ( ω )被設(shè)定為例如1至3左右的實(shí)數(shù)。
[0112] 如此,φΝ(Α)(ω,τ)是從 ~φΝ(ω,τ)去除了 ~φΝ⑶(ω,τ)的分量。
[0113] 另外,~ΦΝ(Α)(ω,τ)也可以以滿足蘭〇的條件的方式被進(jìn)行向下取整 處理。該向下取整處理例如可以在第二分量提取部15中進(jìn)行。
[0114] αΝ可以與as相同也可以不同。Τ ν可以與T s相同也可以不同。βΝ( ω )可以與β5( ω ) 相同也可以不同。
[0115] 另外,在各種噪音應(yīng)對(duì)型增益計(jì)算部16中不利用~ΦΝ(Β)(ω,τ)的情況下,第二分 量提取部15也可以不求出~巾, )(《,1)。換言之,此時(shí),第二分量提取部15也可以根據(jù)~(^ (ω,τ)僅求出~ Φν(Α)( ω,τ)。
[0116] 〈各種噪音應(yīng)對(duì)型增益計(jì)算部16>
[0117] 各種噪音應(yīng)對(duì)型計(jì)算部16至少利用由從目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量·' 小5(4)(?,1)、由不相干的噪音派生的穩(wěn)定分量~(^%(?,1)、以及由干擾噪聲派生的非穩(wěn) 定分量~巾一 4)(?,1),計(jì)算用于強(qiáng)調(diào)從目標(biāo)區(qū)到來(lái)的聲音的非穩(wěn)定分量的后置濾波器~6 (ω,τ)(步驟S5)。
[0118] 所計(jì)算的后置濾波器~G( ω,τ)被輸出到時(shí)間頻率平均部17。
[0119] 由于按照噪音的種類(換言之,不相干的噪音、相干的噪音這樣的噪音種類)估計(jì) 了功率譜密度,因此各種噪音應(yīng)對(duì)型增益計(jì)算部16例如計(jì)算通過以下的式(17)定義的后置 濾波器~G( ω,τ)。
[0120] 【數(shù)14】
[0122]當(dāng)~ <i>s(B)( ω,τ)的值的特性(behavior)與~ Φν(β)( ω,τ)的值的特性之間存在差 異,不相干性的假定被破壞的情況下,各種噪音應(yīng)對(duì)型增益計(jì)算部16也可以計(jì)算通過以下 的式(18)定義的后置濾波器~G( ω,τ)。
[0123]【數(shù)15】
[0125] 〈時(shí)間頻率平均部17>
[0126] 時(shí)間頻率平均部17針對(duì)后置濾波器~G(co,τ),進(jìn)行向時(shí)間方向與頻率方向的至 少一個(gè)方向的平滑處理(步驟S6)。
[0127] 被平滑處理后的后置濾波器~G( ω,τ)被輸出到增益成形部18。
[0128] 當(dāng)在時(shí)間方向上進(jìn)行平滑的情況下,將以及^設(shè)為0以上的整數(shù),從而時(shí)間頻率 平均部17只要針對(duì)例如后置濾波器~G(co,τ)的時(shí)間方向附近的后置濾波器即~G(co,τ-τ〇),…~G( ω ,τ+η)進(jìn)行加法平均即可。時(shí)間頻率平均部17也可以對(duì)~G( ω,τ-τ〇),···~G (ω ,τ+η)進(jìn)行加權(quán)求和。
[0129] 此外,當(dāng)在頻率方向上進(jìn)行平滑的情況下,只要將ω Q以及ω :設(shè)為〇以上的實(shí)數(shù),從 而時(shí)間頻率平均部17只要針對(duì)例如后置濾波器~G( ω,τ)的頻率方向附近的后置濾波器即 ~G( ω - ω 〇,τ),…~G( ω + ω 1,τ)進(jìn)彳丁平均即可。時(shí)間頻率平均部17也可以對(duì)~G( ω - ω 〇, τ),…~G( ω + ω^τ)進(jìn)行加權(quán)求和。
[0130]〈增益成形部18>
[0131] 增益成形部18通過對(duì)進(jìn)行了平滑處理的后置濾波器~6(ω,τ)進(jìn)行增益成形,從 而生成后置濾波器6(ω,τ)(步驟S7)。增益成形部18例如生成通過以下的式(19)定義的后 置濾波器6(ω,τ)。
[0132] 【數(shù)16】
[0133] ??οχτ) = '/{〇{(0,Γ) - 0.5) + 0.5 …(19)
[0134] 在此,γ是權(quán)重系數(shù),是正實(shí)數(shù),例如,將γ設(shè)定為1至1.3左右即可。
[0135] 增益成形部18可以對(duì)后置濾波器G(co,τ)進(jìn)行向下取整處理,以便滿足A = G(co, τ) 5 1 j是0至0.3的實(shí)數(shù),通常設(shè)定為0.1左右。若6(ω,τ)比1大則存在過強(qiáng)調(diào)的可能性,此 外,若G( ω,τ)過小則存在發(fā)生音樂噪聲(Musical noise)的可能性。通過進(jìn)行適當(dāng)?shù)南蛳?取整處理,能夠防止發(fā)生該強(qiáng)調(diào)以及音樂噪聲。
[0136] 考慮定義域以及值域是實(shí)數(shù)的函數(shù)f。函數(shù)f例如設(shè)為非降函數(shù)。增益成形意味著 求出將增益成形前的~6(ω,τ)輸入到函數(shù)f時(shí)的輸出值的操作。換言之,對(duì)函數(shù)f輸入了~ G(?,τ)時(shí)的輸出值為G(co,τ)。函數(shù)f的例是式(19)。式(19)的函數(shù)f是f(x)= γ (x-0.5) + 0.5〇
[0137] 利用圖8說明其他函數(shù)f的其他例。在圖8中,省略了索引。即,圖8的G表示G( ω,τ), ~G表示~G(co,τ)。首先,在該例中,如圖8(A)至圖8(B)所示,改變了函數(shù)f的圖表的坡度。 此外,如圖8(B)至圖8(C)所示,進(jìn)行向下取整處理以便滿足0 5G(c〇,τ) 5 1。通過由該圖8 (C)的粗線表示的圖表確定的函數(shù)是函數(shù)f的其他例。
[0138] 函數(shù)f的圖表并不限定于圖8(C)表示的圖表。例如,在圖8(C)中,函數(shù)f的圖表由直 線構(gòu)成,但函數(shù)f的圖表也可以由曲線構(gòu)成。例如,函數(shù)f也可以是對(duì)雙曲正切函數(shù)施加了向 下取整處理的函數(shù)。
[0139] 根據(jù)該信號(hào)處理裝置以及方法,能夠?qū)哂懈鞣N性質(zhì)的噪音存在的環(huán)境穩(wěn)健地設(shè) 計(jì)用于噪音抑制的后置濾波器。此外,通過具有實(shí)時(shí)性的處理,能夠設(shè)計(jì)這樣的后置濾波 器。
[0140][實(shí)施例與實(shí)驗(yàn)結(jié)果]
[0141]以LPSD法為現(xiàn)有方式,進(jìn)行了用于驗(yàn)證所提方式的效果的實(shí)驗(yàn)。如圖5所示,在混 響時(shí)間110mS(1.0kHZ)的室內(nèi)配置了聲源或陣列。在有目標(biāo)音(男女發(fā)聲)、K = 3個(gè)干擾噪音 (#1:男女發(fā)聲、#2,3:音樂)、從室內(nèi)的四個(gè)角落的揚(yáng)聲器發(fā)出白噪聲而再現(xiàn)的背景噪音時(shí), 利用Μ = 4個(gè)全向話筒進(jìn)行了錄音。觀測(cè)時(shí)的SN比平均為-ldB。此外,將采樣頻率設(shè)為 16.0kHz,將FFT分析長(zhǎng)度設(shè)為512pt,將FFT偏移長(zhǎng)度設(shè)為256pt。
[0142] 在該條件下,根據(jù)通過以下的式定義的譜失真(SD),評(píng)價(jià)了噪音抑制性能。
[0143] 【數(shù)17】
[0145] 這里,Ψ和|Ψ分別表示幀的索引集合以及其總數(shù)。Ω與| Ω |分別表示頻率區(qū)間的 索引以及其總數(shù)。SD的值越小噪音抑制性能越高。對(duì)男女發(fā)聲的650句計(jì)算SD,以往方式中 是14.0,在所提方式中成為11.5,SD降低。尤其提高了對(duì)發(fā)聲區(qū)間外的背景噪音的抑制效 果。
[0146] [變形例等]
[0147] 時(shí)間頻率平均部17以及增益成形部18的處理為了抑制所謂的音樂噪聲而進(jìn)行。時(shí) 間頻率平均部17以及增益成形部18的處理也可以不進(jìn)行。
[0148] 基于指數(shù)移動(dòng)平均處理的~ Φ S(B) ( ω,τ)以及~ φ S(A) ( ω,τ)的計(jì)算是第一分量提取 部14的處理的一例。第一分量提取部14也可以通過其他的處理而提取~Φ5 (Β)(ω,τ)以及~ WA)(w,t)。
[0149] 同樣地,基于指數(shù)移動(dòng)平均處理的~ΦΝ(Β)(ω,τ)以及~φΝω(ω,τ)的計(jì)算是第二 分量提取部15的處理的一例。第二分量提取部15也可以通過其他的處理而提取~ Φν(β)( ω, τ)以及 ~ Φν(Α)( ω,τ)。
[0150] 在上述信號(hào)處理裝置以及方法中說明的處理不僅按照記載的順序時(shí)序地執(zhí)行,也 可以根據(jù)執(zhí)行處理的裝置的處理能力或需要,并列地或者單獨(dú)執(zhí)行。
[0151 ]此外,當(dāng)通過計(jì)算機(jī)實(shí)現(xiàn)在信號(hào)處理裝置中的各部的情況下,通過程序來(lái)記述信 號(hào)處理裝置的各部應(yīng)具有的功能的處理內(nèi)容。并且,通過計(jì)算機(jī)來(lái)執(zhí)行該程序,從而在計(jì)算 機(jī)上實(shí)現(xiàn)該各部。
[0152] 記述了該處理內(nèi)容的程序能夠預(yù)先記錄在計(jì)算機(jī)中能夠讀取的記錄介質(zhì)中。作為 計(jì)算機(jī)中能夠讀取的記錄介質(zhì),例如可以是磁記錄裝置、光盤、光磁記錄介質(zhì)、半導(dǎo)體存儲(chǔ) 器等的任意的介質(zhì)。
[0153] 此外,各處理部件通過在計(jì)算機(jī)上執(zhí)行規(guī)定的程序而構(gòu)成,也可以通過硬件實(shí)現(xiàn) 這些處理內(nèi)容的至少一部分。
[0154] 除此之外,在不脫離本發(fā)明的宗旨的范圍內(nèi)當(dāng)然能夠適當(dāng)進(jìn)行變更。
[0155] 產(chǎn)業(yè)上的可利用性
[0156] 作為智能手機(jī)的命令輸入,一般利用了聲音識(shí)別。認(rèn)為在車內(nèi)或工廠內(nèi)的噪音下, 通過免提操作設(shè)備或者遠(yuǎn)程進(jìn)行通話的需要較高。
[0157]本發(fā)明能夠例如在這樣的情況下利用。
【主權(quán)項(xiàng)】
1. 一種信號(hào)處理裝置,包含: 局部PSD估計(jì)部,基于根據(jù)通過構(gòu)成話筒陣列的M個(gè)話筒接收到的信號(hào)而獲得的頻域的 觀測(cè)信號(hào),估計(jì)規(guī)定的目標(biāo)區(qū)以及不同于上述目標(biāo)區(qū)的至少一個(gè)噪音區(qū)各自的局部功率譜 密度; 目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部,將ω設(shè)為頻率,將τ設(shè)為幀的索引,基于上述估計(jì)到的局部 功率譜密度,估計(jì)目標(biāo)區(qū)的功率譜密度~ φ5( ω,τ)以及噪音區(qū)的功率譜密度~ φΝ( ω,τ); 第一分量提取部,根據(jù)上述目標(biāo)區(qū)的功率譜密度~ Φ s( ω,τ),提取由從目標(biāo)區(qū)到來(lái)的聲 音派生的非穩(wěn)定分量~Φ5(Α)(ω,τ)以及由不相干的噪音派生的穩(wěn)定分量~φ5 (Β)(ω,τ); 第二分量提取部,根據(jù)上述噪音區(qū)的功率譜密度~ΦΝ(ω,τ),提取由干擾噪音派生的非 穩(wěn)定分量~ΦΝ(Α)(ω,τ);以及 各種噪音應(yīng)對(duì)型增益計(jì)算部,至少利用由從上述目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量 ~ Φ s(A)( ω,τ)、由上述不相干的噪音派生的穩(wěn)定分量~ φ S(B)( ω,τ)、以及由上述干擾噪音派 生的非穩(wěn)定分量~巾/4)(?,1),計(jì)算用于強(qiáng)調(diào)從上述目標(biāo)區(qū)到來(lái)的聲音的非穩(wěn)定分量的后 置濾波器~6(ω,τ)。2. 如權(quán)利要求1所述的信號(hào)處理裝置,其中, 由上述不相干的噪音派生的穩(wěn)定分量~ Φ s(B)( ω,τ)是對(duì)上述目標(biāo)區(qū)的功率譜密度~ Φ s (ω,τ)進(jìn)行了平滑的分量, 由從上述目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~ Φ s(A)( ω,τ)是從上述目標(biāo)區(qū)的功率譜 密度~φ5(ω,τ)去除了由上述不相干的噪音派生的穩(wěn)定分量~φ5(Β)(ω,τ)的分量, 由上述干擾噪音派生的非穩(wěn)定分量~ Φν(Α)( ω,τ)是從上述噪音區(qū)的功率譜密度~ φΝ (ω,τ)去除了對(duì)上述噪音區(qū)的功率譜密度~φΝ(ω,τ)進(jìn)行了平滑的分量的分量。3. 如權(quán)利要求1所述的信號(hào)處理裝置,其中, 上述第二分量提取部從上述噪音區(qū)的功率譜密度~ Φν( ω,τ)進(jìn)一步提取由干擾噪音派 生的非穩(wěn)定分量~ΦΝ(Α)(ω,τ), 上述第一分量提取部將as設(shè)為規(guī)定的實(shí)數(shù),將T s設(shè)為特定區(qū)間的幀的索引的集合,將 &( ω )設(shè)為規(guī)定的實(shí)數(shù),計(jì)算通過以下的式定義的~ Φ S(A)( ω,τ)以及~ φ^( ω,τ),將所計(jì) 算的~Φ5(Α)(ω,τ)作為由從上述目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~(})^(。,1),并將 所計(jì)算的~Φ 5(Β)(ω,τ)作為由上述不相干的噪音派生的穩(wěn)定分量~φ5(Β)(ω,τ),上述第二分量提取部將αΝ設(shè)為規(guī)定的實(shí)數(shù),將Tn設(shè)為特定區(qū)間的幀的索引的集合,將 βΝ( ω )設(shè)為規(guī)定的實(shí)數(shù),計(jì)算通過以下的式定義的~ φΝ(Α)( ω,τ)以及~ φΝ(Β)( ω,τ),并將所 計(jì)算的~ Φν(Α)( ω,τ)作為由上述干擾噪音派生的非穩(wěn)定分量~ φΝ(Α)( ω,τ),將~ φΝ(Β)( ω, τ)設(shè)為由上述不相干的噪音派生的穩(wěn)定分量~ΦΝ(Β)(ω,τ), 【數(shù)19】上述各種噪音應(yīng)對(duì)型增益計(jì)算部進(jìn)一步利用由上述不相干的噪音派生的穩(wěn)定分量~ φ Ν(Β)( ω,τ),計(jì)算用于強(qiáng)調(diào)從上述目標(biāo)區(qū)到來(lái)的聲音的非穩(wěn)定分量的后置濾波器~G( ω, τ)〇4. 如權(quán)利要求1至3的任一項(xiàng)所述的信號(hào)處理裝置,進(jìn)一步包含: 時(shí)間頻率平均部,針對(duì)上述后置濾波器~G(co,τ)進(jìn)行向時(shí)間方向和頻率方向的至少 一個(gè)方向的平滑處理;以及 增益成形部,針對(duì)進(jìn)行了上述平滑處理的后置濾波器~G( ω,τ)進(jìn)行增益成形。5. -種信號(hào)處理方法,包含: 局部PSD估計(jì)步驟,基于根據(jù)通過構(gòu)成話筒陣列的M個(gè)話筒接收到的信號(hào)而獲得的頻域 的觀測(cè)信號(hào),估計(jì)目標(biāo)區(qū)以及不同于上述目標(biāo)區(qū)的至少一個(gè)噪音區(qū)各自的局部功率譜密 度; 目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部,將ω設(shè)為頻率,將τ設(shè)為幀的索引,基于上述估計(jì)到的局部 功率譜密度,估計(jì)目標(biāo)區(qū)的功率譜密度~ φ5( ω,τ)以及噪音區(qū)的功率譜密度~ φΝ( ω,τ); 第一分量提取步驟,根據(jù)上述目標(biāo)區(qū)的功率譜密度~ Φ s( ω,τ),提取由從目標(biāo)區(qū)到來(lái)的 聲音派生的非穩(wěn)定分量~Φ5(Α)(ω,τ)以及由不相干的噪音派生的穩(wěn)定分量~φ^(ω,τ); 第二分量提取步驟,根據(jù)上述噪音的功率譜密度~ Φν( ω,τ),提取由干擾噪音派生的非 穩(wěn)定分量<^(4)(?,1:);以及 各種噪音應(yīng)對(duì)型增益計(jì)算步驟,至少利用由從上述目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分 量、^?(?,。、由上述不相干的噪音派生的穩(wěn)定分量^一墳^^^八以及由上述干擾噪音 派生的非穩(wěn)定分量~巾/4)(?,1),計(jì)算用于強(qiáng)調(diào)從上述目標(biāo)區(qū)到來(lái)的聲音的非穩(wěn)定分量的 后置濾波器~G(co,T)。6. -種程序,使計(jì)算機(jī)起到權(quán)利要求1至4的任一項(xiàng)所述的信號(hào)處理裝置的各部的作 用。
【文檔編號(hào)】H04R1/40GK106031196SQ201580009993
【公開日】2016年10月12日
【申請(qǐng)日】2015年2月25日
【發(fā)明人】丹羽健太, 小林和則
【申請(qǐng)人】日本電信電話株式會(huì)社