專利名稱:信號(hào)處理設(shè)備、信號(hào)處理方法及其程序的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信號(hào)處理設(shè)備、信號(hào)處理方法及其程序。更具體地說,本發(fā)明涉及執(zhí)行 下述處理的信號(hào)處理設(shè)備、信號(hào)處理方法和程序通過使用獨(dú)立分量分析(ICA)來分離混 合有多種信號(hào)的信號(hào)。特別地,該處理是實(shí)時(shí)處理,即,將連續(xù)地輸入的觀測(cè)信號(hào)分離為具 有少量延遲的獨(dú)立分量并連續(xù)地輸出它們的處理。
背景技術(shù):
首先,作為本發(fā)明的背景技術(shù),將給出對(duì)獨(dú)立分量分析(ICA)和獨(dú)立分量分析 (ICA)的實(shí)時(shí)實(shí)現(xiàn)方法的描述。Al. ICA 的描述ICA是一種多變量分析,S卩,通過使用信號(hào)的統(tǒng)計(jì)性質(zhì)來分離多維信號(hào)的技術(shù)。 關(guān)于 ICA 自身的細(xì)節(jié),例如,請(qǐng)參考"Introduction to the Independent Component Analysis"(Noboru Murata7Tokyo Denki University Press)(《獨(dú)立分量分析的人門》(村 田昇著,東京電械大學(xué)出版社))。在下文中,將給出對(duì)用于聲音信號(hào)的ICA(特別地,時(shí)間頻率域中的ICA)的描述。如
圖1所示,考慮這樣的情況即,其中,正從N個(gè)聲源播放不同的聲音,并且,在 η個(gè)傳聲器(microphone)處觀測(cè)這些聲音。從所述聲源產(chǎn)生的聲音(聲音信號(hào))在到達(dá) 傳聲器之前經(jīng)過時(shí)間延遲、反射等。因此,在傳聲器k處觀測(cè)到的信號(hào)(觀測(cè)信號(hào))可以 被表示為由表達(dá)式[1. 1]表示的表達(dá)式,該表達(dá)式針對(duì)所有的聲源將聲音信號(hào)和傳遞函數(shù) (transfer function)之間的卷積求和。在下文中,這些混合將被稱為“卷積混合”。另外,假設(shè)傳聲器η的觀測(cè)信號(hào)為。傳聲器1和傳聲器2的觀測(cè)信號(hào)是X1 (t) 和 X2 (t)。對(duì)于所有的傳聲器的觀測(cè)信號(hào)可以由如下面表達(dá)式[1. 2]的一個(gè)表達(dá)式表示數(shù)式1
N L ^(0 = ΣΣav(0sj(卜O=Σ{ *^
y=i I=O
Mx(t) = A
s(t)+...+A[L]s(t-L)其中,
P
冰)=I,x{t) =
y
Λν A
\l/ O
ζΓ
Π.3]
_ο ι(0 ·■· αΛ )_
O這里,X(t)和s(t)分別是具有作為元素的xk(t)和%(t)的列向量。A[1]是具有 作為元素的a[1]w的nXN矩陣。在下面的描述中,假設(shè)η = N。公知的是,時(shí)間域中的卷積混合被表示為時(shí)間頻率域中的瞬時(shí)混合。使用該特性 的分析是時(shí)間頻率域中的ICA。關(guān)于時(shí)間頻率域ICA自身,例如,請(qǐng)參考“Explanation of Independent
4Component Analysis” ( “獨(dú)立分量分析的解釋,,)的 “ 19. 2. 4Fourier Transform Methods'^ "19. 2. 4傅里葉變換方法”)和日本未審專利申請(qǐng)公開No. 2006-238409 ("Audio Signal Separating Apparatus/Noise Removal Apparatus and Method,,(“音步頁(yè)信號(hào)分離 設(shè)備/噪聲去除設(shè)備和方法”))。在下文中,將主要描述與本發(fā)明有關(guān)的特征。在上述的表達(dá)式[1. 2]的兩邊應(yīng)用短時(shí)傅里葉變換得到下面的表達(dá)式[2. 1]。數(shù)式2 Χ(ω , t) = A(co)S(co,t)
權(quán)利要求
1.一種信號(hào)處理設(shè)備,包括分離處理單元,該分離處理單元通過對(duì)由多個(gè)傳感器從多個(gè)聲源獲取的作為輸出的混 合信號(hào)執(zhí)行短時(shí)傅里葉變換(STFT)來產(chǎn)生時(shí)間頻率域中的觀測(cè)信號(hào),并且通過對(duì)所述觀 測(cè)信號(hào)執(zhí)行線性濾波處理來產(chǎn)生與各個(gè)聲源相對(duì)應(yīng)的聲源分離結(jié)果, 其中,分離處理單元具有線性濾波處理部分,該線性濾波處理部分對(duì)所述觀測(cè)信號(hào)執(zhí)行線性濾波處理,以產(chǎn)生 與各個(gè)聲源相對(duì)應(yīng)的分離信號(hào);全死角空間濾波部分,該全死角空間濾波部分應(yīng)用朝向由所述多個(gè)傳感器獲取的觀測(cè) 信號(hào)中所包含的所有聲源形成死角波束的全死角空間濾波器,以產(chǎn)生應(yīng)用全死角空間濾波 器濾波的、去除了死角方向上的獲取的聲音的信號(hào),即空間濾波信號(hào);以及頻率濾波部分,該頻率濾波部分通過輸入所述分離信號(hào)和空間濾波信號(hào)來執(zhí)行去除所 述分離信號(hào)中包含的對(duì)應(yīng)于空間濾波信號(hào)的信號(hào)分量的濾波處理, 從而產(chǎn)生頻率濾波部分的處理結(jié)果,作為聲源分離結(jié)果。
2.根據(jù)權(quán)利要求1所述的信號(hào)處理設(shè)備,還包括學(xué)習(xí)處理單元,該學(xué)習(xí)處理單元通過學(xué)習(xí)處理求解用于分離混合信號(hào)的分離矩陣,并 且產(chǎn)生全死角空間濾波器,在所述混合信號(hào)中混合有來自所述多個(gè)聲源的輸出,所述學(xué)習(xí) 處理對(duì)從所述混合信號(hào)產(chǎn)生的觀測(cè)信號(hào)應(yīng)用獨(dú)立分量分析(ICA),所述全死角空間濾波器 朝向從觀測(cè)信號(hào)獲取的所有聲源形成死角波束,其中,線性濾波處理部分對(duì)觀測(cè)信號(hào)應(yīng)用由學(xué)習(xí)處理單元產(chǎn)生的分離矩陣,以分離所 述混合信號(hào)并產(chǎn)生與各個(gè)聲源相對(duì)應(yīng)的分離信號(hào),并且全死角空間濾波部分對(duì)觀測(cè)信號(hào)應(yīng)用由學(xué)習(xí)處理單元產(chǎn)生的全死角空間濾波器,以產(chǎn) 生去除了死角方向上的獲取的聲音的空間濾波信號(hào)。
3.根據(jù)權(quán)利要求1或2所述的信號(hào)處理設(shè)備,其中,頻率濾波部分通過從所述分離信號(hào)減去所述空間濾波信號(hào)的處理執(zhí)行去除所述 分離信號(hào)中包含的與所述空間濾波信號(hào)相對(duì)應(yīng)的信號(hào)分量的濾波處理。
4.根據(jù)權(quán)利要求1或2所述的信號(hào)處理設(shè)備,其中,頻率濾波部分通過基于將所述空間濾波信號(hào)視為噪聲分量的譜減法的頻率濾波 處理來執(zhí)行去除所述分離信號(hào)中包含的與空間濾波信號(hào)相對(duì)應(yīng)的信號(hào)分量的濾波處理。
5.根據(jù)權(quán)利要求2所述的信號(hào)處理設(shè)備,其中,學(xué)習(xí)處理單元執(zhí)行下述處理通過以分割觀測(cè)信號(hào)的塊單位執(zhí)行學(xué)習(xí)處理,基于 塊單位的學(xué)習(xí)結(jié)果,產(chǎn)生所述分離矩陣和所述全死角空間濾波器,并且分離處理單元執(zhí)行使用由學(xué)習(xí)處理單元產(chǎn)生的最新的分離矩陣和全死角空間濾波器 的處理。
6.根據(jù)權(quán)利要求1或2所述的信號(hào)處理設(shè)備,其中,頻率濾波部分執(zhí)行下述處理根據(jù)所述分離信號(hào)的信道,改變從所述分離信號(hào)去 除與所述空間濾波信號(hào)相對(duì)應(yīng)的分量的水平。
7.根據(jù)權(quán)利要求6所述的信號(hào)處理設(shè)備,其中,頻率濾波部分執(zhí)行下述處理根據(jù)所述分離信號(hào)的信道的功率比,改變從所述分 離信號(hào)去除與所述空間濾波信號(hào)相對(duì)應(yīng)的分量的水平。
8.根據(jù)權(quán)利要求2所述的信號(hào)處理設(shè)備,其中,分離處理單元產(chǎn)生分離矩陣和全死角空間濾波器,所述分離矩陣和全死角空間 濾波器經(jīng)受使用包括與當(dāng)前觀測(cè)信號(hào)相對(duì)應(yīng)的幀的多個(gè)幀的作為標(biāo)度調(diào)整的重新標(biāo)度處 理,并且執(zhí)行將經(jīng)過所述重新標(biāo)度處理的分離矩陣和全死角空間濾波器應(yīng)用于所述觀測(cè)信 號(hào)的處理,所述多個(gè)幀是從所述觀測(cè)信號(hào)切出的數(shù)據(jù)單位。
9.一種在信號(hào)處理設(shè)備上執(zhí)行聲源分離處理的信號(hào)處理方法,該信號(hào)處理方法包括下 述步驟在分離處理單元中,通過對(duì)由多個(gè)傳感器從多個(gè)聲源獲取的作為輸出的混合信號(hào)執(zhí)行 短時(shí)傅里葉變換(STFT)來產(chǎn)生時(shí)間頻率域中的觀測(cè)信號(hào),并且通過對(duì)所述觀測(cè)信號(hào)執(zhí)行 線性濾波處理來產(chǎn)生與各個(gè)聲源相對(duì)應(yīng)的聲源分離結(jié)果, 其中,產(chǎn)生聲源分離結(jié)果的步驟包括下述步驟 對(duì)觀測(cè)信號(hào)執(zhí)行線性濾波處理,以產(chǎn)生與各個(gè)聲源相對(duì)應(yīng)的分離信號(hào), 應(yīng)用朝向由所述多個(gè)傳感器獲取的觀測(cè)信號(hào)中包含的所有聲源形成死角波束的全死 角空間濾波器,以產(chǎn)生應(yīng)用全死角空間濾波器濾波的、去除了死角方向上的獲取的聲音的 信號(hào),即空間濾波信號(hào);以及通過輸入所述分離信號(hào)和所述空間濾波信號(hào)來執(zhí)行去除所述分離信號(hào)中包含的與所 述空間濾波信號(hào)相對(duì)應(yīng)的信號(hào)分量的濾波處理,從而產(chǎn)生執(zhí)行頻率濾波處理的處理結(jié)果,作為聲源分離結(jié)果。
10.一種在信號(hào)處理設(shè)備上執(zhí)行聲源分離處理的程序,該程序執(zhí)行分離處理步驟,在分離處理單元中,通過對(duì)由多個(gè)傳感器從多個(gè)聲源獲取的作為輸出 的混合信號(hào)執(zhí)行短時(shí)傅里葉變換(STFT)來產(chǎn)生時(shí)間頻率域中的觀測(cè)信號(hào),并且通過對(duì)所 述觀測(cè)信號(hào)執(zhí)行線性濾波處理來產(chǎn)生與各個(gè)聲源相對(duì)應(yīng)的聲源分離結(jié)果, 其中,分離處理步驟包括線性濾波處理步驟,對(duì)觀測(cè)信號(hào)執(zhí)行線性濾波處理,以產(chǎn)生與各個(gè)聲源相對(duì)應(yīng)的分離 信號(hào);全死角空間濾波步驟,應(yīng)用朝向由所述多個(gè)傳感器獲取的觀測(cè)信號(hào)中所包含的所有聲 源形成死角波束的全死角空間濾波器,以產(chǎn)生去除了死角方向上的獲取的聲音的、用全死 角空間濾波器濾波的信號(hào),即空間濾波的信號(hào);以及頻率濾波步驟,通過輸入分離信號(hào)和空間濾波信號(hào)來執(zhí)行去除分離信號(hào)中包含的對(duì)應(yīng) 于空間濾波信號(hào)的信號(hào)分量的濾波處理,從而產(chǎn)生頻率濾波步驟的處理結(jié)果,作為聲源分離結(jié)果。
全文摘要
本發(fā)明涉及信號(hào)處理設(shè)備、信號(hào)處理方法及其程序。該信號(hào)處理設(shè)備包括分離處理單元,該分離處理單元通過對(duì)由多個(gè)傳聲器從多個(gè)聲源獲取的作為輸出的混合信號(hào)執(zhí)行短時(shí)傅里葉變換(STFT)來產(chǎn)生時(shí)間頻率域中的觀測(cè)信號(hào),并且通過對(duì)所述觀測(cè)信號(hào)執(zhí)行線性濾波處理來產(chǎn)生與所述聲源相對(duì)應(yīng)的聲源分離結(jié)果。其中,分離處理單元具有線性濾波處理部分,該線性濾波處理部分對(duì)觀測(cè)信號(hào)執(zhí)行線性濾波處理,以產(chǎn)生與各個(gè)聲源相對(duì)應(yīng)的分離信號(hào);全死角空間濾波處理部分,該全死角空間濾波處理部分應(yīng)用全死角空間濾波器,以產(chǎn)生去除了死角方向上的獲取的聲音的、用全死角空間濾波器濾波的信號(hào)(空間濾波信號(hào));以及頻率濾波部分,該頻率濾波部分通過輸入分離信號(hào)和空間濾波信號(hào)執(zhí)行濾波處理。
文檔編號(hào)H04R3/00GK102075831SQ20101055398
公開日2011年5月25日 申請(qǐng)日期2010年11月19日 優(yōu)先權(quán)日2009年11月20日
發(fā)明者廣江厚夫 申請(qǐng)人:索尼公司