信號(hào)處理裝置、方法以及程序的制作方法

文檔序號(hào)：10664090閱讀：329來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

信號(hào)處理裝置、方法以及程序的制作方法
【專利摘要】以提供比以往提高了噪音抑制性能的信號(hào)處理技術(shù)作為目的。第一分量提取部(14)根據(jù)目標(biāo)區(qū)的功率譜密度通過時(shí)間平均處理，提取由從目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量以及由不相干的噪音派生的穩(wěn)定分量第二分量提取部(15)根據(jù)噪音區(qū)的功率譜密度提取由干擾噪音派生的非穩(wěn)定分量以及由不相干的噪音派生的穩(wěn)定分量。
【專利說明】
信號(hào)處理裝置、方法以及程序
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及利用多個(gè)話筒清楚地接收從目標(biāo)方向到來(lái)的聲源信號(hào)的技術(shù)。
【背景技術(shù)】
[0002] 首先，說明信號(hào)處理的基本框架。
[0003] 設(shè)想利用由Μ個(gè)話筒構(gòu)成的陣列。Μ是2以上的整數(shù)。例如，將Μ設(shè)為2至4左右。也可以將Μ設(shè)為100左右。在頻率ω且?guī)瑫r(shí)間τ的觀測(cè)信號(hào)X m( ω，τ) (m = 1，2，…，Μ)中，包含相干且具有不穩(wěn)定性的一個(gè)目標(biāo)音3〇(?，1)、1(個(gè)干擾噪音51{(?，1)仏=1，2，~，1〇、不相干的穩(wěn) 定性噪音仏（《，τ)。將Κ設(shè)為規(guī)定的正整數(shù)。m是各話筒的編號(hào)，觀測(cè)信號(hào)Χ η(ω，τ)是將通過話筒m接收的時(shí)域的信號(hào)變換為頻域的信號(hào)。
[0004]目標(biāo)音是從規(guī)定的目標(biāo)區(qū)到來(lái)的聲音。目標(biāo)區(qū)是包含想要接收的聲源的區(qū)域。想要接收的聲源的數(shù)目以及想要接收的聲源在目標(biāo)區(qū)內(nèi)的位置可以是未知的。例如，如圖6所例示，設(shè)配置有6個(gè)揚(yáng)聲器以及3個(gè)話筒的區(qū)域被分割為3個(gè)區(qū)（區(qū)1、區(qū)2、以及區(qū)3)。當(dāng)想要接收的聲源包含于區(qū)1的情況下，區(qū)1成為目標(biāo)區(qū)。
[0005] 另外，目標(biāo)音中也可以包含來(lái)自目標(biāo)區(qū)外的聲源的反射音。例如，當(dāng)目標(biāo)區(qū)為區(qū)1 的情況下，目標(biāo)音也可以包含，在從區(qū)2以及區(qū)3中包含的聲源產(chǎn)生的聲音中通過反射而從區(qū)1的方向來(lái)到話筒的聲音。
[0006] 目標(biāo)區(qū)可以是離話筒規(guī)定的距離以內(nèi)的區(qū)。換言之，也可以是具有有限的面積的區(qū)。進(jìn)而，目標(biāo)區(qū)也可以有多個(gè)。圖7是表示目標(biāo)區(qū)有2個(gè)的情況下的例子的圖。
[0007] 另外，也將包含發(fā)出噪音的聲源的區(qū)稱為噪音區(qū)。在圖6的例子中，當(dāng)發(fā)出噪音的聲源分別包含于區(qū)2以及區(qū)3中的情況下，區(qū)2以及區(qū)3分別成為噪音區(qū)。在本例中，將區(qū)2以及區(qū)3分別設(shè)為噪音區(qū)，但也可以將整合了區(qū)2以及區(qū)3的區(qū)設(shè)為噪音區(qū)。也將包含發(fā)出干擾噪音的聲源的噪音區(qū)特別稱為干擾噪音區(qū)。進(jìn)行設(shè)定，使得噪音區(qū)不同于目標(biāo)區(qū)。
[0008] 在將第m個(gè)話筒至目標(biāo)音S〇( ω，τ)的傳遞特性記為Am,〇( ω )，將第m個(gè)話筒至第k個(gè) 干擾噪音的傳遞特性記為Am,k( ω )時(shí)，觀測(cè)信號(hào)Xm( ω，τ)如以下那樣建模。
[0009] 【數(shù)1】
[0011]當(dāng)話筒數(shù)目少的情況下，即例如Μ〈Κ的情況下，結(jié)合了基于最小方差無(wú)失真響應(yīng) (MVDR)的波束成形與后置濾波器的框架可有效抑制噪音(例如，參照非專利文獻(xiàn)1)。圖1表示后置濾波器型陣列的處理流程。被設(shè)計(jì)為強(qiáng)調(diào)目標(biāo)音的濾波器系數(shù)《〇( ω ) = [W0>1 (ω)，…，W0,M(co)]T可如以下計(jì)算。
[0012]【數(shù)2】
[0014] 在此，將x設(shè)為任意的向量或矩陣，xT表示x的轉(zhuǎn)置，xH表示x的共輒轉(zhuǎn)置。ho( ω )= [Ηο,ι( ω )，…，Hq,m( ω )]τ是目標(biāo)音方向的陣列流形向量。陣列流形向量是將從聲源至話筒的傳遞特性Ho,m( ω )設(shè)為向量ho( ω )的向量，從聲源至話筒的傳遞特性Ho,m( ω )是根據(jù)聲源和話筒位置而理論上能夠算出的僅假設(shè)了直接音的傳遞特性、或?qū)崪y(cè)的傳遞特性、通過鏡像法和有限元素法等計(jì)算機(jī)仿真來(lái)估計(jì)的傳遞特性。若假設(shè)為源信號(hào)互相不相干，則能夠將空間相關(guān)矩陣R( ω )如以下那樣建模。
[0015] 【數(shù)3】
[0017] 在此，hk( ω )是第k個(gè)干擾噪音的陣列流形向量。波束成形的輸出信號(hào)Υ〇( ω，τ)可通過以下的式來(lái)獲得。
[0018] 【數(shù)4】
[0020] 在此，χ( ω = ω，τ)，···，ΧΜ( ω，τ)]τ。為了抑制在 Υ〇( ω，τ)中包含的噪音信號(hào)，乘以后置濾波器6(ω，τ)。
[0021] 【數(shù)5】
[0022] Ζ( ω ,τ)=6( ω ,τ)Υ〇( ω ,τ)···(5)
[0023]最后，通過對(duì)Ζ( ω，τ)進(jìn)行快速傅里葉反變換（IFFT)，獲得輸出信號(hào)。
[0024] 接著，說明基于非專利文獻(xiàn)2的后置濾波器設(shè)計(jì)法。
[0025] 在非專利文獻(xiàn)2中，提出了基于利用多個(gè)波束成形而估計(jì)的各區(qū)的功率譜密度 (PSD)而設(shè)計(jì)后置濾波器的方式(例如，參照非專利文獻(xiàn)2)。以下，將該方式稱為L(zhǎng)PSD法(基于本地PSD的后置濾波器設(shè)計(jì)(Local PSD-based post-filter design))。利用圖2,說明 LPSD法的處理流程。
[0026]當(dāng)基于Wiener法設(shè)計(jì)后置濾波器的情況下，如以下那樣計(jì)算G( ω，τ)。
[0027]【數(shù)6】
[0029] 在此，φ5(ω，τ)表示目標(biāo)區(qū)的功率譜密度，φΝ(ω，τ)表示噪音區(qū)的功率譜密度。在此，當(dāng)稱為某區(qū)的功率譜密度的情況下，意味著從該區(qū)到來(lái)的聲音的功率譜密度。即，例如，目標(biāo)區(qū)的功率譜密度是指從目標(biāo)區(qū)到來(lái)的聲音的功率譜密度，噪音區(qū)的功率譜密度是指從噪音區(qū)到來(lái)的聲音的功率譜密度。用于根據(jù)Χ Β(ω，τ)而估計(jì)φ5(ω，τ)、φΝ(ω，τΜ9* 法有多種，但假設(shè)在觀測(cè)信號(hào)中包含干擾噪音，因此利用LPSD法。
[0030] 在LPSD法中，假設(shè)在觀測(cè)信號(hào)中包含有目標(biāo)音與干擾噪音，且這些在時(shí)間頻率區(qū) 域中稀疏。為了分析位于各方向的各區(qū)的功率譜密度，設(shè)計(jì)L+1個(gè)波束成形濾波器w u( ω )(u =0，1，…，L)。濾波器wu( ω )對(duì)第k個(gè)區(qū)方向的靈敏度I Du,k( ω ) 12、第u個(gè)輸出信號(hào)的功率I Yu (?，1)|2、各區(qū)的功率譜密度卜1<(〇，1)|2之間的關(guān)系能夠如以下那樣建模。在此，|〇 11,1<(〇) 2例如是 |〇11,1{(?)|2=|￥1/1(?)1 11{(?)|2。作為|〇11,1{(?)|2，也可以利用實(shí)測(cè)值。
[0033] 在此，省略了各符號(hào)的索引。即，￥11 = 丫11(〇，1)，且〇11,1{ = 011,1{(〇〇,311 = 311((〇，1)。此外，設(shè)Φγ( ω，τ) = [ |Υ0( ω，τ) I2, |Yi( ω，τ) I2，···，|YL( ω，τ) |2]Τ、Φ5( ω，τ) = [ |S0( ω，τ) 2, |Si( ω，τ) |2，···，|Sk( ω，τ) |2]Τ。
[0034] 例如，通過解式(7)的反問題，算出各區(qū)的功率譜密度。
[0035] 【數(shù)8】
[0037] 在此，將b設(shè)為任意的矩陣，b+表示對(duì)b的偽逆矩陣運(yùn)算。局部PSD估計(jì)部11將觀測(cè) 信號(hào)Xm( ω，τ)(ηι=1，2，···，M)作為輸入，從而輸出例如通過式(8)而定義的局部功率譜密度 'ΦΚω,τΚ?！贡硎臼潜还烙?jì)的。
[0038] 局部是指區(qū)。在圖6的例中，區(qū)1、區(qū)2、以及區(qū)3分別是局部。局部PSD估計(jì)部估計(jì)并輸出各區(qū)的功率譜密度~Φ5(ω，τ)。
[0039] 目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12以針對(duì)每個(gè)頻率ω以及幀τ基于式(8)而估計(jì)的局部功率譜密度~Φ5( ω，τ)作為輸入，算出通過以下的式定義的~ φ5( ω，τ)以及~ φΝ( ω，τ)。
[0040] 【數(shù)9】
[0043] 最后，維納增益計(jì)算部13以~Φ5(ω，τ)以及~φΝ(ω，τ)作為輸入，計(jì)算并輸出通過式(6)定義的后置濾波器6(ω，τ)。具體來(lái)說，維納增益計(jì)算部13分別輸入~Φ 5(ω，τ)以及~ Φν( ω，τ)作為式(6)的<i>s( ω，τ)以及φΝ( ω，τ)，從而計(jì)算并輸出G( ω，τ)。
[0044] LPSD法的主要的優(yōu)點(diǎn)有以下兩點(diǎn)。（i)在功率譜區(qū)域定義波束成形的輸出與各聲源的關(guān)系，能夠獲得超過麥克風(fēng)的數(shù)量的控制自由度，因此能夠有效地抑制噪音；以及(ii) 只要事先計(jì)算L個(gè)波束成形wu( ω )(ιι = 0，1，···，υ與式(7)的D( ω )，就能夠以較低運(yùn)算量實(shí) 現(xiàn)(i)的優(yōu)點(diǎn)。
[0045] 現(xiàn)有技術(shù)文獻(xiàn)
[0046] 【非專利文獻(xiàn)】
[0047] 【非專利文獻(xiàn) 1 】C · Marro et al ·，"Analys i s of no i se reduct ion and dereverberation techniques based on microphone arrays with postfiltering，'， IEEE Trans.Speech,Audio Proc.,6,240-259,1998.
[0048] 【非專利文獻(xiàn)2】Y.Hioka et al ·，"Underdetermined sound source separation using power spectrum density estimated by combination of directivity gain，'， IEEE Trans.Audio,Speech,Language Proc.,21,1240-1250,2013.

【發(fā)明內(nèi)容】

[0049] 發(fā)明要解決的課題
[0050] 在LPSD法中，假定目標(biāo)音與干擾音混合存在的情況而定義了問題，但在實(shí)用上的問題中，不僅是具有相干性的干擾噪音，多數(shù)情況是不相干性強(qiáng)的穩(wěn)定噪音（空調(diào)的噪音、麥克的內(nèi)部噪音等)混合存在。此時(shí)，Φ 5(ω，τ)以及φΝ(ω，τ)的估計(jì)誤差變大，有時(shí)導(dǎo)致噪音抑制性能降低。
[0051] 本發(fā)明的目的在于，提供比以往提高噪音抑制性能的信號(hào)處理裝置、方法以及程序。
[0052] 用于解決課題的手段
[0053]本發(fā)明的一方式的信號(hào)處理裝置具有：局部PSD估計(jì)部，基于根據(jù)通過構(gòu)成話筒陣列的Μ個(gè)話筒接收到的信號(hào)而獲得的頻域的觀測(cè)信號(hào)，估計(jì)目標(biāo)區(qū)以及不同于上述目標(biāo)區(qū) 的至少一個(gè)噪音區(qū)各自的局部功率譜密度；目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部，將ω設(shè)為頻率，將τ 設(shè)為幀的索引，基于估計(jì)到的局部功率譜密度，估計(jì)目標(biāo)區(qū)的功率譜密度~Φ5(ω，τ)以及噪音區(qū)的功率譜密度~Φ Ν(ω，τ);第一分量提取部，根據(jù)目標(biāo)區(qū)的功率譜密度~φ5(ω，τ)，提取由從目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~Φ 5(Α)(ω，τ)以及由不相干的噪音派生的穩(wěn)定分量~Φ5(Β)(ω，τ);第二分量提取部，根據(jù)噪音區(qū)的功率譜密度~φ Ν(ω，τ)，提取由干擾噪音派生的非穩(wěn)定分量~ΦΝ(Α)(ω，τ);以及各種噪音應(yīng)對(duì)型增益計(jì)算部，至少利用由從目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~Φ 5(Α)(ω，τ)、由不相干的噪音派生的穩(wěn)定分量~ Φ5(Β)(ω，τ)、以及由干擾噪音派生的非穩(wěn)定分量~φΝ(Α)(ω， τ)，計(jì)算用于強(qiáng)調(diào)從目標(biāo)區(qū)到來(lái)的聲音的非穩(wěn)定分量的后置濾波器~G( ω，τ)。
[0054] 發(fā)明效果
[0055] 能夠比以往提尚卩栄首抑制性能。
【附圖說明】
[0056] 圖1是表示后置濾波器型陣列的處理流程的圖。
[0057] 圖2是以往的后置濾波器估計(jì)部的模塊圖。
[0058] 圖3是本發(fā)明所涉及的后置濾波器估計(jì)裝置的例的模塊圖。
[0059] 圖4是本發(fā)明所涉及的后置濾波器估計(jì)方法的例的模塊圖。
[0060] 圖5是用于說明實(shí)驗(yàn)結(jié)果的圖。
[00611圖6是用于說明目標(biāo)區(qū)以及噪音區(qū)的例的圖。
[0062]圖7是用于說明目標(biāo)區(qū)的例的圖。
[0063]圖8是用于說明增益成形的例的圖。
【具體實(shí)施方式】
[0064]在以下說明的信號(hào)處理裝置以及方法中，通過將LPSD法擴(kuò)展，從而對(duì)各種噪音環(huán) 境穩(wěn)健地估計(jì)后置濾波器。具體來(lái)說，按噪音的每個(gè)種類進(jìn)行分割而估計(jì)功率譜密度，從而減少目標(biāo)音的功率與其他噪音的功率之比的估計(jì)誤差。
[0065]圖3表示本發(fā)明的一實(shí)施方式所涉及的信號(hào)處理裝置即后置濾波器估計(jì)部1的例的模塊圖。
[0066]如圖3所示，信號(hào)處理裝置例如具有局部PSD估計(jì)部11、目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部 12、第一分量提取部14、第二分量提取部15、各種噪音應(yīng)對(duì)型增益計(jì)算部16、時(shí)間頻率平均化部17、以及增益成形部18。
[0067] 例如，圖4表示通過該信號(hào)處理裝置實(shí)現(xiàn)的信號(hào)處理的各步驟。
[0068]以下，說明信號(hào)處理裝置以及方法的實(shí)施方式的細(xì)節(jié)。另外，關(guān)于基本信號(hào)處理的框架、語(yǔ)言的定義等，與在【背景技術(shù)】的欄中記載的一樣。從而，省略這些重復(fù)說明。
[0069]〈局部PSD估計(jì)部11>
[0070] 局部PSD估計(jì)部11與現(xiàn)有的局部PSD估計(jì)部11 一樣。
[0071]即，局部PSD估計(jì)部11基于根據(jù)由構(gòu)成話筒陣列的Μ個(gè)話筒接收的信號(hào)獲得的頻域的觀測(cè)信號(hào)1(?，1)(!11=1，2，~，1〇，估計(jì)目標(biāo)區(qū)以及噪音區(qū)各自的局部功率譜密度~〇5 (ω，τ)(步驟S1)。ω是頻率，τ是幀的索引。Μ是2以上的整數(shù)。例如，將Μ設(shè)為2至4左右。也可以將Μ設(shè)為100左右。
[0072]所估計(jì)的局部功率譜密度~Φ5(ω，τ)被輸出到目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12。
[0073]估計(jì)局所功率譜密度的具體的處理例與在【背景技術(shù)】欄中記載的一樣，因此這里省略說明。
[0074]另外，設(shè)波束成形濾波器wu( ω )以及靈敏度|Du,k( ω ) |2在局部PSD估計(jì)部11的處理之前預(yù)先設(shè)定。此外，在目標(biāo)區(qū)的方向在一定程度上變化的情況下，局部PSD估計(jì)部11也可以預(yù)先準(zhǔn)備多個(gè)濾波器組，選擇采用最大的功率的濾波器。
[0075]另外，局部PSD估計(jì)部11并非基于通過波束成形獲得的Yu( co，T)(u = 0，lr"，L)，而是基于由在各區(qū)的方向具有指向性的各一個(gè)話筒接收到的Yu(?，τ)(ιι = 0，1，···，υ而估計(jì)局部功率譜密度~Φ5(ω，τ)。
[0076]〈目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12>
[0077]目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12與以往的目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12同樣。
[0078] 即，目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部12基于所估計(jì)的局部功率譜密度，估計(jì)目標(biāo)區(qū)的功率譜密度~Φ5(ω，τ)以及噪音區(qū)的功率譜密度~φ Ν(ω，τ)(步驟S2)。
[0079] 所估計(jì)的目標(biāo)區(qū)的功率譜密度~ φ5( ω，τ)被輸出到第一分量提取部14。所估計(jì)的噪音區(qū)的功率譜密度~ Φν( ω，τ)被輸出到第二分量提取部15。
[0080] 關(guān)于估計(jì)目標(biāo)區(qū)的功率譜密度~φ5(ω，τ)以及噪音區(qū)的功率譜密度~φΝ(ω，τ)的具體的處理例，與在【背景技術(shù)】欄中記載的同樣，因此這里省略說明。
[0081 ]〈第一分量提取部14>
[0082] 例如在通過式(9)定義的~Φ5(ω，τ)中，包含由從目標(biāo)區(qū)接收到的聲音派生的非穩(wěn)定分量~Φ5 (Α)(ω，τ)以及由不相干的噪音派生的穩(wěn)定分量·'巾，)（〇,〇。這里，穩(wěn)定分量是時(shí)間上變化少的分量，非穩(wěn)定分量是時(shí)間上變化多的分量。
[0083] 這里，噪音有干擾噪音和不相干的噪音兩種噪音。干擾噪音是從在噪音區(qū)配置的噪音聲源發(fā)出的噪音。不相干的噪音并非從目標(biāo)區(qū)和噪音區(qū)發(fā)出的，而是從這些區(qū)以外的場(chǎng)所發(fā)出，是穩(wěn)定存在的噪音。
[0084]因此，第一分量提取部14根據(jù)目標(biāo)區(qū)的功率譜密度~Φ5(ω，τ)，通過平滑處理，提取由從目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~Φ5(Α)(ω，τ)以及由不相干的噪音派生的穩(wěn) 定分量~φ5(Β)(ω，τ)(步驟S3)。例如，平滑處理通過式（11)以及式（12)那樣的指數(shù)移動(dòng)平均處理、時(shí)間平均處理或加權(quán)平均處理實(shí)現(xiàn)。
[0085]由從所提取的目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~φ5(Α)(ω，τ)以及由不相干的噪音派生的穩(wěn)定分量~ Φ s(B)( ω，τ)被輸出到各種噪音應(yīng)對(duì)型增益計(jì)算部16。
[0086] 例如，第一分量提取部14如式（11)以及式（12)那樣，通過進(jìn)行指數(shù)移動(dòng)平均處理，根據(jù) ~Φ5(ω，τ)計(jì)算 ~φ5(Β)(ω，τ)。
[0087]【數(shù)10】
[0090] 在此，as是平滑系數(shù)，是規(guī)定的正實(shí)數(shù)。例如，設(shè)0〈<^〈1。此外，可以設(shè)為(^ =幀的時(shí) 間長(zhǎng)/時(shí)間常數(shù)，從而將as設(shè)定為使時(shí)間常數(shù)成為150ms左右。TS是特定區(qū)間的幀的索引的集合。例如，設(shè)定為使特定區(qū)間成為3至4秒左右。min是輸出最小值的函數(shù)。
[0091] 如此，~Φ5(Β)(ω，τ)是例如通過式（11)以及式（12)對(duì)~φ 5(ω，τ)進(jìn)行了平滑的分量。更具體來(lái)說，~Φ5(Β)(ω，τ)是例如通過式(11)對(duì)~φ 5(ω，τ)進(jìn)行了平滑的值在規(guī)定的時(shí) 間區(qū)間中的最小值。
[0092] 然后，第一分量提取部14如式(13)那樣，從~Φ5(ω，τ)減去~φ5(Β)(ω，τ)從而計(jì)算 ~ φ5⑷（ω，τ)。
[0093] 【數(shù)11】
[0095] 在此，&( ω )是權(quán)重系數(shù)，是規(guī)定的正實(shí)數(shù)。β5( ω )例如被設(shè)定為1至3左右的實(shí)數(shù)。
[0096] 如此，<i>s(A)( ω，τ)是從 ~ (J)S( ω，τ)去除了 ~ (J)S(B)( ω，τ)的分量。
[0097] 另外，~Φ5(Α)(ω，τ)也可以以滿足、^(?，1)_的條件的方式被進(jìn)行向下取整處理(Flooring processing)。該向下取整處理例如由第一分量提取部14進(jìn)行。
[0098] 〈第二分量提取部15>
[0099] 例如通過式（10)定義的~φΝ(ω，τ)中，包含由干擾噪音派生的非穩(wěn)定分量~φΝ(Α) (ω，τ)以及由不相干的噪音派生的穩(wěn)定分量~ φ ν(β)( ω，τ)。
[0100] 因此，第二分量提取部15根據(jù)噪音區(qū)的功率譜密度~ΦΝ(ω，τ)，通過平滑處理，提取由干擾噪音派生的非穩(wěn)定分量~ Φ ν(Α) ( ω，τ)以及由不相干的噪音派生的穩(wěn)定分量~ φ ν(β) (ω，τ)(步驟S4)。例如，平滑處理通過如式（14)以及式（15)那樣的指數(shù)移動(dòng)平均處理、時(shí)間平均處理或加權(quán)平均處理實(shí)現(xiàn)。
[0101] 由提取的干擾噪音派生的非穩(wěn)定分量~φΝ(Α)(ω，τ)以及由不相干的噪音派生的穩(wěn)定分量~Φ Ν(Β)(ω，τ)被輸出到各種噪音應(yīng)對(duì)型增益計(jì)算部16。
[0102] 例如，第二分量提取部15通過如式（14)以及式（15)那樣進(jìn)行指數(shù)移動(dòng)平均處理，根據(jù) ~ΦΝ(ω，τ)計(jì)算 ~φΝ⑶（ω，τ)。
[0103] 【數(shù)I2】
[0106]這里，αΝ是平滑系數(shù)，是規(guī)定的正實(shí)數(shù)。例如，設(shè)〇〈<^〈1。此外，也可以設(shè)為如=幀的時(shí)間長(zhǎng)/時(shí)間常數(shù)，從而將αΝ設(shè)定為時(shí)間常數(shù)成為150ms左右。ΤΝ是特定區(qū)間的幀的索引的集合。例如，被設(shè)定為特定區(qū)間成為3至4秒左右。
[0107] 如此，~ΦΝ(Β)(ω，τ)是例如通過式（14)以及式（15)對(duì)~ΦΝ(ω，τ)進(jìn)行了平滑的分量。更具體來(lái)說，~ Φν(Β)( ω，τ)是例如通過式(14)對(duì)~ Φν( ω，τ)進(jìn)行了平滑的值在規(guī)定的時(shí) 間區(qū)間中的最小值。
[0108]然后，第二分量提取部15通過如式（16)那樣從~φΝ(ω，τ)減去、^(?，1)，從而計(jì)算~ φΝ(Α)( ω，τ)。
[0109]【數(shù)13】
[0111] 在此，βΝ( ω )是權(quán)重系數(shù)，是規(guī)定的正實(shí)數(shù)。βΝ( ω )被設(shè)定為例如1至3左右的實(shí)數(shù)。
[0112] 如此，φΝ(Α)(ω，τ)是從 ~φΝ(ω，τ)去除了 ~φΝ⑶（ω，τ)的分量。
[0113] 另外，~ΦΝ(Α)(ω，τ)也可以以滿足蘭〇的條件的方式被進(jìn)行向下取整處理。該向下取整處理例如可以在第二分量提取部15中進(jìn)行。
[0114] αΝ可以與as相同也可以不同。Τ ν可以與T s相同也可以不同。βΝ( ω )可以與β5( ω ) 相同也可以不同。
[0115] 另外，在各種噪音應(yīng)對(duì)型增益計(jì)算部16中不利用~ΦΝ(Β)(ω，τ)的情況下，第二分量提取部15也可以不求出~巾， )（《，1)。換言之，此時(shí)，第二分量提取部15也可以根據(jù)~(^ (ω，τ)僅求出~ Φν(Α)( ω，τ)。
[0116] 〈各種噪音應(yīng)對(duì)型增益計(jì)算部16>
[0117] 各種噪音應(yīng)對(duì)型計(jì)算部16至少利用由從目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量·' 小5(4)(?，1)、由不相干的噪音派生的穩(wěn)定分量~(^%(?，1)、以及由干擾噪聲派生的非穩(wěn) 定分量~巾一 4)(?，1)，計(jì)算用于強(qiáng)調(diào)從目標(biāo)區(qū)到來(lái)的聲音的非穩(wěn)定分量的后置濾波器~6 (ω，τ)(步驟S5)。
[0118] 所計(jì)算的后置濾波器~G( ω，τ)被輸出到時(shí)間頻率平均部17。
[0119] 由于按照噪音的種類(換言之，不相干的噪音、相干的噪音這樣的噪音種類)估計(jì) 了功率譜密度，因此各種噪音應(yīng)對(duì)型增益計(jì)算部16例如計(jì)算通過以下的式（17)定義的后置濾波器~G( ω，τ)。
[0120] 【數(shù)14】
[0122]當(dāng)~ <i>s(B)( ω，τ)的值的特性(behavior)與~ Φν(β)( ω，τ)的值的特性之間存在差異，不相干性的假定被破壞的情況下，各種噪音應(yīng)對(duì)型增益計(jì)算部16也可以計(jì)算通過以下的式（18)定義的后置濾波器~G( ω，τ)。
[0123]【數(shù)15】
[0125] 〈時(shí)間頻率平均部17>
[0126] 時(shí)間頻率平均部17針對(duì)后置濾波器~G(co，τ)，進(jìn)行向時(shí)間方向與頻率方向的至少一個(gè)方向的平滑處理(步驟S6)。
[0127] 被平滑處理后的后置濾波器~G( ω，τ)被輸出到增益成形部18。
[0128] 當(dāng)在時(shí)間方向上進(jìn)行平滑的情況下，將以及^設(shè)為0以上的整數(shù)，從而時(shí)間頻率平均部17只要針對(duì)例如后置濾波器~G(co，τ)的時(shí)間方向附近的后置濾波器即~G(co，τ-τ〇)，…~G( ω ,τ+η)進(jìn)行加法平均即可。時(shí)間頻率平均部17也可以對(duì)~G( ω，τ-τ〇)，···~G (ω ,τ+η)進(jìn)行加權(quán)求和。
[0129] 此外，當(dāng)在頻率方向上進(jìn)行平滑的情況下，只要將ω Q以及ω :設(shè)為〇以上的實(shí)數(shù)，從而時(shí)間頻率平均部17只要針對(duì)例如后置濾波器~G( ω，τ)的頻率方向附近的后置濾波器即 ~G( ω - ω 〇，τ)，…~G( ω + ω 1，τ)進(jìn)彳丁平均即可。時(shí)間頻率平均部17也可以對(duì)~G( ω - ω 〇， τ)，…~G( ω + ω^τ)進(jìn)行加權(quán)求和。
[0130]〈增益成形部18>
[0131] 增益成形部18通過對(duì)進(jìn)行了平滑處理的后置濾波器~6(ω，τ)進(jìn)行增益成形，從而生成后置濾波器6(ω，τ)(步驟S7)。增益成形部18例如生成通過以下的式（19)定義的后置濾波器6(ω，τ)。
[0132] 【數(shù)16】
[0133] ??οχτ) = '/{〇{(0,Γ) - 0.5) + 0.5 …（19)
[0134] 在此，γ是權(quán)重系數(shù)，是正實(shí)數(shù)，例如，將γ設(shè)定為1至1.3左右即可。
[0135] 增益成形部18可以對(duì)后置濾波器G(co，τ)進(jìn)行向下取整處理，以便滿足A = G(co， τ) 5 1 j是0至0.3的實(shí)數(shù)，通常設(shè)定為0.1左右。若6(ω，τ)比1大則存在過強(qiáng)調(diào)的可能性，此外，若G( ω，τ)過小則存在發(fā)生音樂噪聲(Musical noise)的可能性。通過進(jìn)行適當(dāng)?shù)南蛳?取整處理，能夠防止發(fā)生該強(qiáng)調(diào)以及音樂噪聲。
[0136] 考慮定義域以及值域是實(shí)數(shù)的函數(shù)f。函數(shù)f例如設(shè)為非降函數(shù)。增益成形意味著求出將增益成形前的~6(ω，τ)輸入到函數(shù)f時(shí)的輸出值的操作。換言之，對(duì)函數(shù)f輸入了~ G(?，τ)時(shí)的輸出值為G(co，τ)。函數(shù)f的例是式（19)。式（19)的函數(shù)f是f(x)= γ (x-0.5) + 0.5〇
[0137] 利用圖8說明其他函數(shù)f的其他例。在圖8中，省略了索引。即，圖8的G表示G( ω，τ)， ~G表示~G(co，τ)。首先，在該例中，如圖8(A)至圖8(B)所示，改變了函數(shù)f的圖表的坡度。此外，如圖8(B)至圖8(C)所示，進(jìn)行向下取整處理以便滿足0 5G(c〇，τ) 5 1。通過由該圖8 (C)的粗線表示的圖表確定的函數(shù)是函數(shù)f的其他例。
[0138] 函數(shù)f的圖表并不限定于圖8(C)表示的圖表。例如，在圖8(C)中，函數(shù)f的圖表由直線構(gòu)成，但函數(shù)f的圖表也可以由曲線構(gòu)成。例如，函數(shù)f也可以是對(duì)雙曲正切函數(shù)施加了向下取整處理的函數(shù)。
[0139] 根據(jù)該信號(hào)處理裝置以及方法，能夠?qū)哂懈鞣N性質(zhì)的噪音存在的環(huán)境穩(wěn)健地設(shè) 計(jì)用于噪音抑制的后置濾波器。此外，通過具有實(shí)時(shí)性的處理，能夠設(shè)計(jì)這樣的后置濾波器。
[0140][實(shí)施例與實(shí)驗(yàn)結(jié)果]
[0141]以LPSD法為現(xiàn)有方式，進(jìn)行了用于驗(yàn)證所提方式的效果的實(shí)驗(yàn)。如圖5所示，在混響時(shí)間110mS(1.0kHZ)的室內(nèi)配置了聲源或陣列。在有目標(biāo)音(男女發(fā)聲）、K = 3個(gè)干擾噪音 (#1:男女發(fā)聲、#2,3:音樂）、從室內(nèi)的四個(gè)角落的揚(yáng)聲器發(fā)出白噪聲而再現(xiàn)的背景噪音時(shí)，利用Μ = 4個(gè)全向話筒進(jìn)行了錄音。觀測(cè)時(shí)的SN比平均為-ldB。此外，將采樣頻率設(shè)為 16.0kHz，將FFT分析長(zhǎng)度設(shè)為512pt，將FFT偏移長(zhǎng)度設(shè)為256pt。
[0142] 在該條件下，根據(jù)通過以下的式定義的譜失真(SD)，評(píng)價(jià)了噪音抑制性能。
[0143] 【數(shù)17】
[0145] 這里，Ψ和|Ψ分別表示幀的索引集合以及其總數(shù)。Ω與| Ω |分別表示頻率區(qū)間的索引以及其總數(shù)。SD的值越小噪音抑制性能越高。對(duì)男女發(fā)聲的650句計(jì)算SD，以往方式中是14.0,在所提方式中成為11.5，SD降低。尤其提高了對(duì)發(fā)聲區(qū)間外的背景噪音的抑制效果。
[0146] [變形例等]
[0147] 時(shí)間頻率平均部17以及增益成形部18的處理為了抑制所謂的音樂噪聲而進(jìn)行。時(shí) 間頻率平均部17以及增益成形部18的處理也可以不進(jìn)行。
[0148] 基于指數(shù)移動(dòng)平均處理的~ Φ S(B) ( ω，τ)以及~ φ S(A) ( ω，τ)的計(jì)算是第一分量提取部14的處理的一例。第一分量提取部14也可以通過其他的處理而提取~Φ5 (Β)(ω，τ)以及~ WA)(w，t)。
[0149] 同樣地，基于指數(shù)移動(dòng)平均處理的~ΦΝ(Β)(ω，τ)以及~φΝω(ω，τ)的計(jì)算是第二分量提取部15的處理的一例。第二分量提取部15也可以通過其他的處理而提取~ Φν(β)( ω， τ)以及 ~ Φν(Α)( ω，τ)。
[0150] 在上述信號(hào)處理裝置以及方法中說明的處理不僅按照記載的順序時(shí)序地執(zhí)行，也可以根據(jù)執(zhí)行處理的裝置的處理能力或需要，并列地或者單獨(dú)執(zhí)行。
[0151 ]此外，當(dāng)通過計(jì)算機(jī)實(shí)現(xiàn)在信號(hào)處理裝置中的各部的情況下，通過程序來(lái)記述信號(hào)處理裝置的各部應(yīng)具有的功能的處理內(nèi)容。并且，通過計(jì)算機(jī)來(lái)執(zhí)行該程序，從而在計(jì)算機(jī)上實(shí)現(xiàn)該各部。
[0152] 記述了該處理內(nèi)容的程序能夠預(yù)先記錄在計(jì)算機(jī)中能夠讀取的記錄介質(zhì)中。作為計(jì)算機(jī)中能夠讀取的記錄介質(zhì)，例如可以是磁記錄裝置、光盤、光磁記錄介質(zhì)、半導(dǎo)體存儲(chǔ) 器等的任意的介質(zhì)。
[0153] 此外，各處理部件通過在計(jì)算機(jī)上執(zhí)行規(guī)定的程序而構(gòu)成，也可以通過硬件實(shí)現(xiàn) 這些處理內(nèi)容的至少一部分。
[0154] 除此之外，在不脫離本發(fā)明的宗旨的范圍內(nèi)當(dāng)然能夠適當(dāng)進(jìn)行變更。
[0155] 產(chǎn)業(yè)上的可利用性
[0156] 作為智能手機(jī)的命令輸入，一般利用了聲音識(shí)別。認(rèn)為在車內(nèi)或工廠內(nèi)的噪音下，通過免提操作設(shè)備或者遠(yuǎn)程進(jìn)行通話的需要較高。
[0157]本發(fā)明能夠例如在這樣的情況下利用。
【主權(quán)項(xiàng)】
1. 一種信號(hào)處理裝置，包含：局部PSD估計(jì)部，基于根據(jù)通過構(gòu)成話筒陣列的M個(gè)話筒接收到的信號(hào)而獲得的頻域的觀測(cè)信號(hào)，估計(jì)規(guī)定的目標(biāo)區(qū)以及不同于上述目標(biāo)區(qū)的至少一個(gè)噪音區(qū)各自的局部功率譜密度；目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部，將ω設(shè)為頻率，將τ設(shè)為幀的索引，基于上述估計(jì)到的局部功率譜密度，估計(jì)目標(biāo)區(qū)的功率譜密度~ φ5( ω，τ)以及噪音區(qū)的功率譜密度~ φΝ( ω，τ); 第一分量提取部，根據(jù)上述目標(biāo)區(qū)的功率譜密度~ Φ s( ω，τ)，提取由從目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~Φ5(Α)(ω，τ)以及由不相干的噪音派生的穩(wěn)定分量~φ5 (Β)(ω，τ); 第二分量提取部，根據(jù)上述噪音區(qū)的功率譜密度~ΦΝ(ω，τ)，提取由干擾噪音派生的非穩(wěn)定分量~ΦΝ(Α)(ω，τ);以及各種噪音應(yīng)對(duì)型增益計(jì)算部，至少利用由從上述目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量 ~ Φ s(A)( ω，τ)、由上述不相干的噪音派生的穩(wěn)定分量~ φ S(B)( ω，τ)、以及由上述干擾噪音派生的非穩(wěn)定分量~巾/4)(?，1)，計(jì)算用于強(qiáng)調(diào)從上述目標(biāo)區(qū)到來(lái)的聲音的非穩(wěn)定分量的后置濾波器~6(ω，τ)。2. 如權(quán)利要求1所述的信號(hào)處理裝置，其中，由上述不相干的噪音派生的穩(wěn)定分量~ Φ s(B)( ω，τ)是對(duì)上述目標(biāo)區(qū)的功率譜密度~ Φ s (ω，τ)進(jìn)行了平滑的分量，由從上述目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~ Φ s(A)( ω，τ)是從上述目標(biāo)區(qū)的功率譜密度~φ5(ω，τ)去除了由上述不相干的噪音派生的穩(wěn)定分量~φ5(Β)(ω，τ)的分量，由上述干擾噪音派生的非穩(wěn)定分量~ Φν(Α)( ω，τ)是從上述噪音區(qū)的功率譜密度~ φΝ (ω，τ)去除了對(duì)上述噪音區(qū)的功率譜密度~φΝ(ω，τ)進(jìn)行了平滑的分量的分量。3. 如權(quán)利要求1所述的信號(hào)處理裝置，其中，上述第二分量提取部從上述噪音區(qū)的功率譜密度~ Φν( ω，τ)進(jìn)一步提取由干擾噪音派生的非穩(wěn)定分量~ΦΝ(Α)(ω，τ)，上述第一分量提取部將as設(shè)為規(guī)定的實(shí)數(shù)，將T s設(shè)為特定區(qū)間的幀的索引的集合，將 &( ω )設(shè)為規(guī)定的實(shí)數(shù)，計(jì)算通過以下的式定義的~ Φ S(A)( ω，τ)以及~ φ^( ω，τ)，將所計(jì) 算的~Φ5(Α)(ω，τ)作為由從上述目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~(})^(。，1)，并將所計(jì)算的~Φ 5(Β)(ω，τ)作為由上述不相干的噪音派生的穩(wěn)定分量~φ5(Β)(ω，τ)，上述第二分量提取部將αΝ設(shè)為規(guī)定的實(shí)數(shù)，將Tn設(shè)為特定區(qū)間的幀的索引的集合，將 βΝ( ω )設(shè)為規(guī)定的實(shí)數(shù)，計(jì)算通過以下的式定義的~ φΝ(Α)( ω，τ)以及~ φΝ(Β)( ω，τ)，并將所計(jì)算的~ Φν(Α)( ω，τ)作為由上述干擾噪音派生的非穩(wěn)定分量~ φΝ(Α)( ω，τ)，將~ φΝ(Β)( ω， τ)設(shè)為由上述不相干的噪音派生的穩(wěn)定分量~ΦΝ(Β)(ω，τ)，【數(shù)19】上述各種噪音應(yīng)對(duì)型增益計(jì)算部進(jìn)一步利用由上述不相干的噪音派生的穩(wěn)定分量~ φ Ν(Β)( ω，τ)，計(jì)算用于強(qiáng)調(diào)從上述目標(biāo)區(qū)到來(lái)的聲音的非穩(wěn)定分量的后置濾波器~G( ω， τ)〇4. 如權(quán)利要求1至3的任一項(xiàng)所述的信號(hào)處理裝置，進(jìn)一步包含：時(shí)間頻率平均部，針對(duì)上述后置濾波器~G(co，τ)進(jìn)行向時(shí)間方向和頻率方向的至少一個(gè)方向的平滑處理；以及增益成形部，針對(duì)進(jìn)行了上述平滑處理的后置濾波器~G( ω，τ)進(jìn)行增益成形。5. -種信號(hào)處理方法，包含：局部PSD估計(jì)步驟，基于根據(jù)通過構(gòu)成話筒陣列的M個(gè)話筒接收到的信號(hào)而獲得的頻域的觀測(cè)信號(hào)，估計(jì)目標(biāo)區(qū)以及不同于上述目標(biāo)區(qū)的至少一個(gè)噪音區(qū)各自的局部功率譜密度；目標(biāo)區(qū)/噪音區(qū)PSD估計(jì)部，將ω設(shè)為頻率，將τ設(shè)為幀的索引，基于上述估計(jì)到的局部功率譜密度，估計(jì)目標(biāo)區(qū)的功率譜密度~ φ5( ω，τ)以及噪音區(qū)的功率譜密度~ φΝ( ω，τ); 第一分量提取步驟，根據(jù)上述目標(biāo)區(qū)的功率譜密度~ Φ s( ω，τ)，提取由從目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量~Φ5(Α)(ω，τ)以及由不相干的噪音派生的穩(wěn)定分量~φ^(ω，τ); 第二分量提取步驟，根據(jù)上述噪音的功率譜密度~ Φν( ω，τ)，提取由干擾噪音派生的非穩(wěn)定分量<^(4)(?，1：);以及各種噪音應(yīng)對(duì)型增益計(jì)算步驟，至少利用由從上述目標(biāo)區(qū)到來(lái)的聲音派生的非穩(wěn)定分量、^?(?，。、由上述不相干的噪音派生的穩(wěn)定分量^一墳^^^八以及由上述干擾噪音派生的非穩(wěn)定分量~巾/4)(?，1)，計(jì)算用于強(qiáng)調(diào)從上述目標(biāo)區(qū)到來(lái)的聲音的非穩(wěn)定分量的后置濾波器~G(co，T)。6. -種程序，使計(jì)算機(jī)起到權(quán)利要求1至4的任一項(xiàng)所述的信號(hào)處理裝置的各部的作用。
【文檔編號(hào)】H04R1/40GK106031196SQ201580009993
【公開日】2016年10月12日
【申請(qǐng)日】2015年2月25日
【發(fā)明人】丹羽健太, 小林和則
【申請(qǐng)人】日本電信電話株式會(huì)社

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：丹羽健太;小林和則;
技術(shù)所有人：日本電信電話株式會(huì)社;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無(wú)線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

信號(hào)處理程序相關(guān)技術(shù)

數(shù)字信號(hào)處理實(shí)踐方法相關(guān)技術(shù)

信號(hào)處理方法相關(guān)技術(shù)

信號(hào)處理的方法相關(guān)技術(shù)

數(shù)字信號(hào)處理方法相關(guān)技術(shù)

t01信號(hào)中斷處理方法相關(guān)技術(shù)

信號(hào)處理的數(shù)學(xué)方法相關(guān)技術(shù)

信號(hào)預(yù)處理方法相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

信號(hào)處理裝置、方法以及程序的制作方法

信號(hào)處理裝置、方法以及程序的制作方法