專利名稱::信號處理裝置、信號處理方法以及程序的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及一種信號處理裝置、信號處理方法以及程序。更具體地J兌,本發(fā)明涉及通過4吏用獨立分量分析(IndependentComponentAnalysis,ICA)來分離混合了多個信號的信號并進一步估計聲源方向的信號處理裝置、信號處理方法和程序。
背景技術(shù):
:本發(fā)明涉及一種用于估計聲源方向(從麥克風觀看的聲音到達的方向;也稱作到達方向(DOA))的技術(shù)。具體地說,本發(fā)明涉及一種用于通過使用獨立分量分析(ICA)來實時估計聲源方向的技術(shù)。由于本發(fā)明涉及聲源方向估計和ICA,因此兩者將作為相關(guān)技術(shù)按以下順序被描述。然后,描述與將聲源方向估計結(jié)合到實時ICA相關(guān)聯(lián)的問題。以下將以A和B的順序給出描述。A.相關(guān)技術(shù)的描述B.相關(guān)技術(shù)的問題[A.相關(guān)技術(shù)的描述]首先,下面將給出Al至A4的描述作為相關(guān)技術(shù)。Al.使用麥克風之間的相位差的聲源方向估計A2.關(guān)于ICA的描述A3.使用ICA的聲源方向估計A4.關(guān)于ICA的實時實現(xiàn)成比例的量。在圖1中,在與連接兩個麥克風的直線(麥克風對的方向)正交的方向被^t為0的情況下定義角度9。然而,當使用由麥克風對的方向和聲波傳播方向所形成的角度[e'時,可以將兩個麥克風到聲源的距離之差表示為[d'cos9,]。令在麥克風1和麥克風2處的觀測信號分別是A(t)和x2(t),并且從聲源11到麥克風1和2的路徑差是[d.sine,則由以下等式[l.l]來表示得到的關(guān)系表達式。"…、cJt:樣本索引d:麥克風間距C:聲速F:采樣頻率在上述等式中,t表示離散時間,并且指示樣本索引.由于在麥克風2處的觀測信號x"t)在相位上比x"t)滯后與到聲源的多出距離相對應(yīng)的量,忽略衰減,X2(t)可以表示為等式1.11。因此,如果可以基于在各個麥克風處的觀測信號來檢測相位滯后,則可以根據(jù)上述等式來計算確定聲源方向的角度向。下面,將給出對通過將觀測信號變換到時-頻域來計算聲源方向的方法的描述。令X,(叫t)和X2(叫t)分別表示將隨后描述的短時傅立葉變換(STFT)應(yīng)用于多個觀測信號A和x2的結(jié)果,其中,和t分別表示頻率窗口(frequencybin)索引和幀索引。經(jīng)歷變換之前的觀測信號[x"xj稱作時域信號,而經(jīng)歷短時傅立葉變換之后的信號[X"X2稱作時-頻域(或STFT域)信號.由于時域中的相位滯后與時-頻域中的復(fù)數(shù)倍數(shù)相對應(yīng),所以時域中的關(guān)系表達式[1.1可以表示為以下等式[1.2。=exp-氣,,^F……[1.2]VM-1C,t:幀索引co:頻率窗口索引M:頻率窗口的總數(shù)j:虛數(shù)單位為了提取包含指示聲源方向的角度e的項,可以執(zhí)行表示為等式[1.3的運算<angle-angle(Z加)^^))="^i^^F……[1.3]在上述等式中,angle()表示用于求解復(fù)數(shù)在-7t至+7t范圍內(nèi)的輻角的函數(shù),帶上劃線的X2表示X2的復(fù)共軛。最后,可以根據(jù)以下等式[1,4]估計聲源方向,asinf(M—0Cangle(^f)Z2(w,……[1.4〗^3T(tO_1)0F、在該等式中,asin表示sin的反函數(shù).此外,hat(e(幼))表示在頻率窗口中的角度e是根據(jù)觀測值估計的值。應(yīng)該注意,此處所使用的hat表示符號(八)。雖然上述等式[1.41針對給定的具體(頻率窗口索引)和t(幀索引),但通過針對多個cd和t來計算聲源方向然后取均值,可以獲得穩(wěn)定的她。此外,還可以準備n(n>2)個麥克風,并針對n(n+l)/2對麥克風中的每對來計算聲源方向。8以下等式[L5至1.7是用于其中使用多個麥克風和多個幀的情況的等式,丑,[X(也1r'■[1.6]■[1.7]其元素是在各個麥克風處的觀測信號的矢量被定義為等式[1.5,并且該矢量的均值由等式[1.6來定義。應(yīng)該注意,該等式中的Et[I表示基于給定分段中的幀的均值,并且由等式[1.71來定義。在等式[1.4中,通過4吏用等式1.61中的Et[Xj(叫t)I和Et[Xm(0),t)1,而不是使用X"(o,t)和X2(叫t),求解出從第i麥克風和第m麥克風的一對麥克風計算出的與第t0至第tl幀相對應(yīng)的源方向的均值.由于這種使用相位差的聲源估計方法涉及比使用稍后描述的ICA的方案的情況更少的處理代價,因此可以實時(具有小于一楨的延遲)并且在高頻(逐幀)的情況下計算聲源方向。另一方面,在其中多個聲源同時播放的環(huán)境中,不可能求解聲源方向。此外,即使當存在單個聲源時,在存在大的及^射和混響的環(huán)境中,方向的準確度也降低'所示。下文中,將這些混合稱作"巻積混合"。所有麥克風的觀測信號可以由如以下等式[2.2中的單個等式來表示。x(f)-A叫sW十…+A"s("I;),.….[2.2]其中<formula>formulaseeoriginaldocumentpage10</formula>此處,x(t)和s(t)分別是將Xk(t)和Sk(t)作為元素的列矢量。A"是將a[1ki作為元素的nxN矩陣。在下面的描述中,個J殳n-N。時域中的巻積混合a示為時-頻域中的瞬時混合是公知常識。采用這種特性的分析是在時-頻域中的ICA。關(guān)于時-頻域ICA本身,應(yīng)該參照例如日本未審查的專利申請^HfNo.2005-49153"ExplanationofIndependentComponentAnalysis"的"19.2.4FourierTransformMethods"以及日本未審查的專利申請公開No.2006-238409"AUDIOSIGNALSEPARATINGAPPARATUS/NOISEREMOVALAPPARATUSANDMETHOD"。下面,將主要描述與本發(fā)明有關(guān)的特征。在上述等式2.2的兩側(cè)應(yīng)用短時傅立葉變換得到以下等式3.1.<formula>formulaseeoriginaldocumentpage11</formula><formula>formulaseeoriginaldocumentpage11</formula>.[3.7]在等式[3.11中,Q)是頻率窗口索引,t是幀索引。如果固定(D,則可以將該等式看作瞬時混合(沒有時間滯后的混合)。因此,為了分離觀測信號,準備用于計算分離結(jié)果[Y的等式[3.5,然后確定分離矩陣W((D),使得分離結(jié)果的各個分量Y(叫t)是最大程度獨立的。在根據(jù)相關(guān)技術(shù)的時-頻域ICA的情況下,出現(xiàn)所謂的置換(permutation)問題,其中,"哪個分量分離到哪個通道"對于每個頻率窗口是不同的。通過在日本未審查的專利申請4^開No.2006-238409"AUDIOSIGNALSEPARATINGAPPARATUS/NOISEREMOVALAPPARATUSANDMETHOD"中公開的配置幾乎完全解決了該置換問題,No.2006-238409是由與本申請相同的發(fā)明人在先提交的專利申請。由于在本發(fā)明實施例中也采用了這種方法,所以將給出在日本未審查的專利申請公開No.2006-238409中公開的用于解決置換問題的技術(shù)的簡要描述。在曰本未審查的專利申請^S開No.2006-238409中,為了求解分離矩陣W((O),對以下等式4.1至[4.3進行迭代直到分離矩陣W(ro)收斂(或者迭代預(yù)定次數(shù))。W(fi)—蜂)+T7AW^(必)—[43〗.局.[4.1].[4.2],丄)環(huán)柳.柳.[4.4]"柳■[4.5]"柳=kfc(,))」3log尸(柳尸(r力))yk(t)的概率密度函數(shù)(pdf;戶fc(O)Kexp(-Hft(i)……[4.7],4夂〖4.8]郝=_微-'[4.9]下面,這種迭代將被稱作"學(xué)習(xí)"。然而,應(yīng)該注意,對所有頻率窗口執(zhí)行等式[4.1至4.3,此夕卜,對變化的觀測信號的所有幀執(zhí)行等式[4.1。此外,在等式[4,2中,Et[.表示針對所有幀的均值。附于Y(叫t)右上方的上標H表示厄密(Hermitian)轉(zhuǎn)置(取矢量或矩陣的轉(zhuǎn)置,并JLii將其元素變換為共軛復(fù)數(shù))。分離結(jié)果Y(t)由等式[4.41表示。此外,等式[4.5表示(|0¥(0),(lOY(t))代表其中排列分離結(jié)果的所有通道和所有頻率窗口的元素的矢量。每個元素?、?Yk(t))稱作記分函數(shù),并且是Y"t)的多維(多變量)概率密度函數(shù)(PDF)的對數(shù)導(dǎo)數(shù)(等式4.6)。作為多維PDF,例如,可以使用由等式[4.7所表示的函數(shù),在此情況下,記分函數(shù)(IOYk(t))可以表示為等式[4.9,然而,應(yīng)該注意,llYk(t)IL是(通過求解所有元素的平方和然后取得到的和的平方根而獲得的)L-2范數(shù)。作為L-2范數(shù)一般形式的L-m由等式4,8來定義。在等式[4.7和等式4.9中,y表示用于調(diào)整Yk(叫t)的大小(scale)的項,對于該項,代入適當?shù)恼龜?shù)常數(shù)(例如sqrt(M)(頻率窗口的數(shù)量的平方根)。在等式[4.3中,n是稱作學(xué)習(xí)比率或?qū)W習(xí)系數(shù)的正數(shù)小值(例如,約0.1)。這用于將在等式[4.21中計算出的厶界()逐漸反映到分離矩陣W((O)上。雖然等式[4.1表示一個頻率窗口中的分離(見圖3A),但也可以通過單個等式來表示所有頻率窗口中的分離(見圖3B)。這可以通過使用由上述等式4.41所表示的所有頻率窗口中的分離結(jié)果Y(t)、由以下等式[4.11表示的觀測信號X(t)、以及此外由等式[4.10所表示的用于所有頻率窗口的分離矩陣來完成。通過使用這些矢量和矩陣,可以由等式[4.12表示分離。根據(jù)本發(fā)明的實施例,按照需要而選擇性地使用等式4.1和等式4.U。<formula>formulaseeoriginaldocumentpage14</formula>圖3A和圖3B所示的Xi至Xn和^至Yn的圖稱作聲譜圖,其中,短時傅立葉變換(STFT)的結(jié)果被排列在頻率窗口方向和幀方向上。垂直方向表示頻率窗口,而水平方向表示幀。雖然在等式4.4和等式[4.11中在頂部畫出較低頻率,但在聲譜圖中在底部畫出較低頻率。ICA是一類盲源分離(BSS),并且具有這樣的特性在分離處理中,無需關(guān)于信號源的知識(聲源的頻率分布、到達方向等等),并且甚至可以在沒有關(guān)于聲速、麥克風間距、麥克風增益、傳遞函數(shù)等等的任何先驗知識的情況下執(zhí)行分離.此外,除了獨立性(例如稀疏性等等)之外的假設(shè)也是不必要的,并且甚至當多個聲源##播放以^頻域中出現(xiàn)-^時(也就是說,甚至當稀疏性的假設(shè)不成立時),分離也是可能的。這些特性證明稍后描述的涉及"在方向估計之后的聲源分離"的方案另_有利的.asm.[5.4]此處,關(guān)注分離矩陣W(co)的第k行(水平數(shù)組)以及逆矩陣B((o)的笫k列(垂直數(shù)組)(見圖4A),分離矩陣W(ca)的第k行是產(chǎn)生用于來自觀測信號的矢量X(叫t)的第k通道的分離結(jié)果古計的聲源)Y"叫t)的矢量,而作為其逆矩陣B(co)的估計的傳遞函數(shù)矩陣B((D)的第k列表示從估計的聲源Yk(叫t)到各個麥克風的傳遞函數(shù)(見圖4B),也就是說,在第m個麥克風處觀測到的觀測信號Xm(O),t)中,令從聲源Y"叫t)推導(dǎo)出的分量寫為分量信號Xw(叫t),分量信號Xmk((D,t)可以表示為以下等式5.3。Xmk輔=Bmk((D)Yk(CM)…5.3通過使用分離矩陣W((D)的逆矩陣B(CD),可以求解出^w各個聲源推導(dǎo)出的觀測信號的分量。因此,可以通過與在該說明書開始處所描述的"Al.使用麥克風之間的相位差的聲源估計"的情況中相同的方法來計算聲源方向。例如,為了通過使用第i麥克風和第m麥克風來求解作為分離結(jié)果Yk(o,t)的聲源方向的hat(eimk()),可以將從上述等式[5,3I計算出的分量信號Xik(叫t)和Xmk(CD,t)帶入與在上述等式[1.4中在兩個麥克風處的觀測信號相對應(yīng)的短時傅立葉變換后的觀測信號Xi(叫t)和X2((D,t)。結(jié)果,獲得以下等式[5.4。在該等式中,dim表示第i麥克風與第m麥克風之間的距離.應(yīng)該注意,在上述等式[5.4]中,幀索引[t消失了。也就是說,只凍嫂用相同的分離矩陣W(co)來計算分離結(jié)果Y(叫t)=W()X(,t),就可對任何幀t計算出相同的^源方向。與"A1.使用麥克風之間的相位差的聲源估計"的情況中不同的是,#>據(jù)ICA的分離矩陣的逆矩陣來計算聲源方向的上述方法的優(yōu)點在于即使當多個聲源同時播放時,也可以求解出各個聲源的方向'此外,優(yōu)點還在于,由于分離結(jié)果和聲源方向都祁JI分離矩陣W((D)被計算出,因此在分離結(jié)果的哪個通道與哪個方向相關(guān)聯(lián)的方面的對應(yīng)性從開始就被建立。也就是說,在與ICA不同的聲源分離手段和聲源方向估計手段被組合使用作為多源方向估計手段的情況下,取決于方案的組合,必須在后續(xù)階段分離地建立通道之間的對應(yīng)性,并且那時存在產(chǎn)生誤差的可能性.然而,在使用ICA的方案中,在后續(xù)階段無需建立這種對應(yīng)性。至于等式[5.4中出現(xiàn)的聲速C、麥克風間距dim等等,在某些情況下,它們在等式中的值不同于在實際環(huán)境中的值。在這些情況下,在使用ICA的方案中,雖然在聲源方向本身中出現(xiàn)估計誤差,但方向的誤差不影響聲源分離的準確度。此外,麥克風增益易受麥克風之間的個體差異的影響,并且取決于聲源分離或方向估計方案,在某些情況下,增益的這種變化不利地影響分離或估計的準確度。然而,在4吏用ICA的方案中,麥克風增益的變化既不影響分離性能,也不影響方向估計。當采用"交替應(yīng)用"時,如果聲源在用于分離矩陣學(xué)習(xí)的分段(例如,學(xué)習(xí)數(shù)據(jù)塊61)與在當前時間的觀測信號62之間已經(jīng)改變(如果聲源已經(jīng)移動或者突然開始播放),則臨時產(chǎn)生失配。此后,由于通過學(xué)習(xí)而獲得與變化的聲源相對應(yīng)的分離矩陣,這種失配最終消失。這種現(xiàn)象在此將被稱作"跟蹤滯后"。雖然跟蹤滯后不一定對聲源分離的性能施加不利影響,但即使在此情況下,滯后有時對方向估計的性能施加不利影響。以下,將給出關(guān)于這點的描述。圖8是跟蹤滯后的概念圖。假設(shè)一個聲源在給定時間(t)開始播放(例如,當某人突然開始說話時)。在該聲源開始播放的時間之前以及之后,其它聲源可以要么保持播放,要么^#靜止。對于在播放開始之前以及之后的分段,在(a)圖解l中示出學(xué)習(xí)的收斂程度。在(b)圖解2中示出觀測信號與分離矩陣之間的失配程度。20首先,將描述(a)圖解l。假設(shè)其中所討論的聲源不工作(靜音)的不工作分段繼續(xù)了一段時間,在該分段中的觀測信號(例如AUSL測分段81a學(xué)習(xí)到的分離矩陣)已經(jīng)充分收斂。這種收斂程度與(a)圖解1中的收斂程度數(shù)據(jù)85a相對應(yīng).即使當在時間(t)聲源開始播放時,由于"交錯應(yīng)用",所以在一段時間內(nèi)使用在"不工作"分段中學(xué)習(xí)到的分離矩陣。例如,在"不工作"分段中學(xué)習(xí)到的分離矩陣也被用于(a)圖解l中的數(shù)據(jù)分段85b中。數(shù)據(jù)分段85b的長度大于學(xué)習(xí)時間(例如,在圖7中在77處指示的時間長度),并且小于或等于塊偏移寬度(例如,在圖7中在76處指示的時間長度)與學(xué)習(xí)時間的總和,并且通過兼顧學(xué)習(xí)開始的定時與聲音開始^f放的定時兩者而被確定。此后,開始使用從包括"聲源工作"分段的觀測分段學(xué)習(xí)到的分離矩陣。例如,在(a)圖解1的收斂程度數(shù)據(jù)的數(shù)據(jù)分段85c中,使用^JC測分段81b學(xué)習(xí)到的分離矩陣。然而,應(yīng)該注意,如果學(xué)習(xí)循環(huán)的數(shù)量被設(shè)置得較小(例如,如果即使學(xué)習(xí)在100次循環(huán)中收斂,也在20次循環(huán)中中止學(xué)習(xí)以縮短學(xué)習(xí)時間),則分離矩陣尚未完全收斂。因此,(a)圖解1中的數(shù)據(jù)分段85c中的收斂程度較低。此后,隨著在線程之間重復(fù)"分離矩陣的繼承"(見上述"A4.關(guān)于ICA的實時實現(xiàn)"),分離矩陣收斂。逸發(fā)生在(a)圖解l中的收斂程度數(shù)據(jù)的數(shù)據(jù)分段85c、85d、85e和85f的序列中。假i^fr數(shù)據(jù)分段85f中以及此后分離矩陣充分收斂。接下來,將給出(b)圖解2的描述,(b)圖解2示出在觀測信號與分離矩陣之間的失配程度。這是指示在當前時間分離矩陣與觀測信號之間存在多少失配的概念性圖解。在以下兩種情況之一中,失配程度變得較高。(1)在用于分離矩陣學(xué)習(xí)的分段與當前時間之間,存在聲源的改變。(2)分離矩陣尚未完全收斂。雖然在失配程度數(shù)據(jù)的數(shù)據(jù)分段88b中分離矩陣已經(jīng)收斂,但由于原因(1)而導(dǎo)致失配程度變得較高。隨著在數(shù)據(jù)分段88c至88f中分離矩陣逐漸收A失配程度也降低。即使當失配出現(xiàn)時,這也不一定對聲源分離施加不利影響。例如,當僅有一個主要聲源播放時,也就是說,當僅有大約背景噪聲出現(xiàn)在作為聲源不工作分段的觀測分段81中時,首先沒有聲音的混合,因此即使在分離矩陣出現(xiàn)失配,這也不影響聲源分離。此外,在觀測信號被分離為目標聲音和干擾聲音并且僅使用目標聲音的情況下,如果干擾聲音是連續(xù)播放的聲音而目標聲音是間斷的聲音(突然開始播放的聲音),則對目標聲音的分離結(jié)果沒有影響。具體地說,連續(xù)聲音保持僅被輸出到通道之一,無論另一聲音的存在/不存在。另一方面,當另一聲源突然開始播放時,雖然在分段88d中聲音被輸出到所有輸出通道,但由于失配程度變得較低,因此聲音僅被輸出到與連續(xù)聲音的通道不同的一個通道。因此,如果干擾聲音是連續(xù)的,則貫穿目標聲音播放之前以及之后的時間都存在抑制了干擾聲音的輸出通道,并且如果選擇這樣的通道,則成功消除干擾聲音。另一方面,對于聲源方向估計,分離矩陣與觀測信號之間的失配施加不利影響。例如,在圖8所示的數(shù)據(jù)分段88b中,如果執(zhí)行在"B2.M滯后"中描述的"時間點的偏移",則給出不準確的方向(不;l從聲源工作分段而是從聲源不工作分段計算出的方向)。此外,由于在數(shù)據(jù)分段88c和88d中分離矩陣尚未收斂,因此存在從這些分段計算出的分離矩陣也是不準確的可能性。如果僅考慮其中存在單個聲源的那些情況,則可以在上述"A1.使用麥克風之間的相位差的聲源估計"的情況下計算聲源,而沒有g(shù)滯后。也就是說,在僅有單個聲源的環(huán)境中,采用"實時ICA加上根據(jù)分離矩陣進行聲源估計"比采用"A1.使用麥克風之間的相位差的聲源估計"有更多問題。B3.分離矩陣的奇異性和零元素在[A3."使用ICA的聲源估計"中描述的日本專利No.3881367中公開的系統(tǒng)中,使用分離矩陣的逆矩陣.因此,如果分離矩P^近于奇異的,也就是說,分離矩陣的行列式是接近于O的值,則不正確地獲得逆矩陣,并且有發(fā)散的可能性。此外,即使逆矩陣存在,如果矩陣的任何一個元素為0,則在上述等式5.4I中函數(shù)[angle()l不可能返回有效值。例如,假設(shè)在系統(tǒng)啟動時,用單位矩陣代替分離矩陣(也就是說,在圖7所示的分段71中使用單位矩陣)。雖然單位矩陣存在逆矩陣(單位矩陣本身),但逆矩陣除了對角線元素之外的所有元素為O。因此,才艮據(jù)上述等式[5.4無法求解出聲源方向。因此,在根據(jù)分離矩陣的逆矩陣求解聲源方向的方案的情況下,對于其中用單位矩陣代替分離矩陣的分段71而言未求解出聲源方向。此外在除了緊接啟動之后以外的時間,如果分離矩陣變得接近于奇異,或者如果其逆矩陣包^^零元素,則不再可以求解出正確的聲源方向。此外,如果通道數(shù)量(U風數(shù)量)增大,則逆矩陣的復(fù)雜度也增加。因此,如果可以在不使用逆矩陣的情況下執(zhí)行類似的運算,則是值得期待的。B4.目的的差別l在以上的[A3.使用ICA的聲源估計"中描述的日本專利No.3881367中,從ICA的分離矩陣求解出方向。這種處理的主要目的在于克服頻率窗口之間的置換問題。也就是說,對于各個頻率窗口計算聲源方向,并且根據(jù)這些聲源方向,在頻率窗口之間對具有^S4^目同的聲源方向的通道進行分組,由此對準在頻率窗口之間的置換。在日本專利No.3881367之后,例如在日本未審查的專利申請>^開No.2006-238409中,介紹了相對而言無置換的方案。然而,將這種方案與日本專利No.3881367結(jié)合沒有改進方向估計的準確度。而生成的矢量Dk,并且通過應(yīng)用計算出的矩陣[Pk和計算出的矢量[Dk來計算聲源方向的角度或計算指示從麥克風對中的每一個看見的聲源方向的矢量。此外,根據(jù)本發(fā)明實施例,提供一種在信號處理裝置中執(zhí)行的信號處理方法,包括以下步驟學(xué)習(xí)處理單元通過學(xué)習(xí)處理來求解用于分離混合了來自多個聲源的輸出的混M號的分離矩陣,所述學(xué)習(xí)處理將ICA(獨立分量分析)應(yīng)用于包括混合信號的觀測信號;分離處理單元將分離矩陣應(yīng)用于觀測信號以分離混合信號并且生成與聲源中的每一個相對應(yīng)的分離信號;以及聲源方向估計單元計算生成的分離信號中的每一個的聲源方向,其中聲源方向的計算包括在時-頻域中計算在對應(yīng)時間分段中的觀測信號與分離信號之間的互協(xié)方差矩陣,計算互協(xié)方差矩陣的元素之間的相位差,并且通過應(yīng)用計算出的相位差來計算與分離信號中的每一個相對應(yīng)的聲源方向a此外,根據(jù)本發(fā)明實施例,提供一種用于使信號處理裝置執(zhí)行信號處理的程序,所述信號處理包括以下步驟學(xué)習(xí)處理單元通過學(xué)習(xí)處理來求解用于分離混合了來自多個聲源的輸出的混M號的分離矩陣,所述學(xué)習(xí)處理將ICA(獨立分量分析)應(yīng)用于包括混合信號的觀測信號;分離處理單元將分離矩陣應(yīng)用于觀測信號以分離混合信號并且生成與聲源中的每一個相對應(yīng)的分離信號;以及聲源方向估計單元計算生成的分離信號中的每一個的聲源方向,其中聲源方向的計算包括在時-頻域中計算在對應(yīng)時間分段中的觀測信號與分離信號之間的互協(xié)方差矩陣,計算互協(xié)方差矩陣的元素之間的相位差,并且通過應(yīng)用計算出的相位差來計算與分離信號中的每一個相對應(yīng)的聲源方向。使用根據(jù)本發(fā)明實施例的配置,通過學(xué)習(xí)處理求解出用于分離混合了來自多個聲源的輸出的混合信號的分離矩陣,所述學(xué)習(xí)處理將獨立分量分析(ICA)應(yīng)用于包括混合信號的觀測信號,分離矩陣被應(yīng)用于觀測信號以生成分離信號,并執(zhí)行計算每個分離信號的聲源方向的聲源方向估計處理。在聲源方向估計處理中,在時-頻域中計算出在對應(yīng)時間分段中的觀測信號與分離信號之間的互協(xié)方差矩陣,在互協(xié)方差矩陣的元素之間計算出相位差,并且通過應(yīng)用計算出的相位差計算出與分離信號中的每一個相對應(yīng)的聲源方向。具體地說,通過使用與互協(xié)方差矩陣的元素之間的相位差相關(guān)的信息計算出相位角與頻率之間的比例常數(shù)(直線的斜率),并且通過使用該比例常數(shù)計算出與分離信號中的每一個相對應(yīng)的聲源方向。通過該處理,實現(xiàn)了高準確JL信號分離和聲源估計處理。應(yīng)該注意,根據(jù)本發(fā)明實施例的程序是可以經(jīng)由記錄介質(zhì)或通信介質(zhì)序。通過以計算機可讀格式提供這樣的程序,在計算機系統(tǒng)上實現(xiàn)了與該程序?qū)?yīng)的處理。根據(jù)本發(fā)明實施例的以下詳細描述以及附圖,本發(fā)明的其它目的、特征和優(yōu)點將變得清楚。應(yīng)該注意,在本說明書中所使用的術(shù)語"系統(tǒng)"指的是多個設(shè)備的邏輯組合,并不限于其中組成設(shè)備位于同一殼體內(nèi)的系統(tǒng)。圖l是示出聲源方向的基本估計方案的示圖2是示出其中正從N個聲源播放不同聲音并且在n個麥克風處觀測那些聲音的情況的示圖3A和圖3B是分別示出在一個頻率窗口中的分離以及在所有頻率窗口中的分離的示圖4A和圖4B是示出作為分離矩陣W((O)的逆矩陣的估計的傳遞函數(shù)矩陣的示圖5是示出處理示例的示圖,其中觀測信號聲鐠圖被劃分為多個交疊塊1至N,針對每個塊執(zhí)行學(xué)習(xí)以求解分離矩陣;圖6是示出將從每個塊求解出的分離矩陣應(yīng)用于后續(xù)觀測信號的"交錯應(yīng)用"的示圖7是示出用于從交疊塊獲得分離矩陣的稱為線程的多個處理單位在交錯時間并行運行的方案的示圖;圖8是示出以線程為單位執(zhí)行的并行處理中出現(xiàn)的i^滯后的示圖9是示出在包含當前時間的分段中的互協(xié)方差矩陣的示圖IOA和圖IOB是示出通過取得在互協(xié)方差矩陣的第k列的第i行中的元素與第m行中的元素之間的比率并且進一步將它們的量值規(guī)范化為1所獲得的數(shù)據(jù)1^()的相位角(1^())、以及獲^ii過針對每個U風對進行直線近似處理和聲源方向計算處理所獲得的直線的斜率Kimk]的繪制數(shù)據(jù)的示圖UA至圖11D是示出使用r^k(ro)的實部和虛部的繪制數(shù)據(jù)進行直線擬合處理的示圖12是示出根據(jù)本發(fā)明實施例的信號處理裝置的配置示例的示圖13是示出通過根據(jù)觀測信號和分離結(jié)果計算互協(xié)方差矩陣來執(zhí)行聲源方向估計處理的聲源方向估計單元的配置示例的示圖14是示出根據(jù)觀測信號和分離矩陣來執(zhí)行聲源方向估計處理的聲源方向估計單元的配置示例的示圖15是示出學(xué)習(xí)處理單元的線程控制單元的詳細配置示例的示圖16是示出在線程計算單元中執(zhí)行的處理的示圖17是示出學(xué)習(xí)線程的狀態(tài)轉(zhuǎn)換的示圖18是示出學(xué)習(xí)線程的狀態(tài)轉(zhuǎn)換的示圖19是示出圖示實時分離/聲源方向估計處理的流程圖的示圖20是示出短時傅立葉變換的細節(jié)的示圖21是示出圖示了在圖19所示的流程圖的步驟S101中的初始化處理的細節(jié)的流程圖的示圖22是示出由線程控制單元針對多個學(xué)習(xí)線程1和2執(zhí)行的控制序列的示圖23是示出圖示了在圖19所示的流程圖的步驟S105中由線程控制單元執(zhí)行的線程控制處理的細節(jié)的流程圖的示圖24是示出圖示了在圖23所示的流程圖的步驟S203中執(zhí)行的等待狀態(tài)處理的流程圖的示圖25是示出圖示了在圖23所示的流程圖的步驟S204中執(zhí)行的加載狀態(tài)處理的流程圖的示圖26是示出圖示了在圖23所示的流程圖的步驟S205中執(zhí)行的學(xué)習(xí)狀態(tài)處理的流程圖的示圖27是示出圖示了在圖26所示的流程圖的步驟S239中執(zhí)行的分離矩陣更新處理的流程圖的示圖28是示出圖示了在圖26所示的流程圖的步驟S241中執(zhí)行的等待時間i殳置處理的流程圖的示圖29是示出圖示了學(xué)習(xí)線程中的處理的流程圖的示圖30是示出圖示了在圖29所示的流程圖的步驟S294中執(zhí)行的命令處理的流程圖的示圖31是示出圖示了作為在圖30所示的流程圖的步驟S305中執(zhí)行的處理的示例的分離矩陣學(xué)習(xí)處理的示例的流程圖的示圖32是示出圖示了在圖19所示的流程圖的步驟S109中執(zhí)行的聲源方向估計處理的流程圖的示圖33是示出圖示了在圖19所示的流程圖的步驟S109中執(zhí)行的聲源方向估計處理的流程圖的示圖34A和圖34B是分別示出圖示了在圖32的流艱圖的步驟S324中以及在圖33的流程圖的步驟S334中的"相位差計算"的細節(jié)的流程圖的示圖35是示出作為在圖34A和圖34B所示的流程的處理結(jié)果而生成的^t據(jù)的示例的示圖36是示出圖示了在圖32的流程困的步驟S325中以;S^圖33的流程圖的步驟S335中的"直線擬合"的細節(jié)的流程圖的示圖37是示出圖示了通過遞歸方法執(zhí)行的(直線)擬合處理的序列的流禾呈圖的示圖38是示出基于遞歸方法的(直線)擬合處理的示圖39是示出圖示了通過線性搜索執(zhí)行的(直線)擬合處理的序列的流程圖的示圖40是示出基于線性搜索的(直線)擬合處理的示圖41是示出通過使用圖35所示的繪圖數(shù)據(jù)執(zhí)行的直線擬合的結(jié)果的示例的示圖42是示出圖示了在圖32所示的流程圖的步驟S326中的聲源方向計算以及在圖33所示的流程圖的步驟S336中的聲源方向計算的流程圖的示圖43是示出在麥克風放置為非線性的情況下通過與;1^風對的角度相對應(yīng)的量M正等式8.7的值的處理示例的示圖44是示出對于給定通道的給定麥克風對的直線擬合的結(jié)果的示例的示圖45是示出被應(yīng)用以通過根據(jù)相位差v的絕對值抑制分離結(jié)果的頻率分量來改進分離準確度的函數(shù)的示例的示圖46是示出一個麥克風對與聲源方向矢量之間的關(guān)系的示圖47是示出圖示了聲源方向矢量估計算法的概要的流程圖的示圖48是示出圖示了矩陣[Pk和矢量Dk的生成處理的流程圖的示圖,其中,矩陣[Pk]是通過在將各個麥克風對的矢量pim的長度規(guī)范化為1之后水平排列它們而生成的,矢量Dk是通過水平排列在根據(jù)麥克風間距進行規(guī)范化之后的針對各個麥克風對的相位差Dimk而生成的;圖49是示出圖示了在圖47所示的流程圖的步驟S506中的"qk的估計"的流^呈圖的示圖50是示出其中在可以在某種程度上將存在聲源的方向局部化的情況下在初始值上反映方向的處理的示圖。具體實施例方式下文,將參照附圖詳細描述根據(jù)本發(fā)明實施例的信號處理裝置、信號處理方法以;5i程序。根據(jù)本發(fā)明實施例,通過使用獨立分量分析(ICA)來分離混合了多個信號的信號,以估計聲源方向。如上所述,雖然在相關(guān)技術(shù)中存在若干聲源方向估計方案,但不存在組合所有以下優(yōu)點的系統(tǒng),即,"使用麥克風之間的相位差的聲源估計"的優(yōu)點"跟蹤滯后和延遲都較小",以及"使用ICA的聲源估計"的優(yōu)點"允許盲分離";"適用于多聲源,,;以及"容易建立分離結(jié)果與聲源方31向之間的對應(yīng)性"。此外,還存在的一個問M,不存在以下系統(tǒng)其中,在"使用ICA的聲源估計"中,在假設(shè)在分離結(jié)果中的頻率窗口之間不存在置換的情況下,利用頻率窗口之間的關(guān)系來改進方向估計的準確度。為了克服上述問題,根據(jù)本發(fā)明實施例,介紹以下兩個新特征。1.互協(xié)方差矩陣在包含當前時間的分段中,在觀測信號與分離結(jié)果之間計算互協(xié)方差矩陣,并且通過使用互協(xié)方差矩陣而非分離矩陣來計算聲源方向。2.直線擬合當計算聲源方向時,通過直線來近似所有頻率中的相位差的圖線,并且根據(jù)直線的斜率來計算聲源方向。首先,給出以下幾點的描述。1.互協(xié)方差矩陣2.直線擬合[l.互協(xié)方差矩陣將參照圖9描述在包含當前時間的分段中的互協(xié)方差。圖9是將根據(jù)本發(fā)明實施例的新特征添加到以上描述的圖6的示圖。在(a)觀測信號和(b)分離結(jié)果兩者中設(shè)置包含當前時間的分段。例如,令當前的幀索引是〖t,分段的開始時間是第[t-L+l幀,而結(jié)束時間是第[t幀。包含當前時間的分段的數(shù)據(jù)包括在觀測信號側(cè)的觀測信號數(shù)據(jù)92以及在分離結(jié)果側(cè)的分離結(jié)果數(shù)據(jù)94。在該分段中在觀測信號與分離結(jié)果之間,對于每個頻率窗口計算由以下等式[6.1表示的互協(xié)方差矩陣ZxY(Q)。<formula>formulaseeoriginaldocumentpage33</formula>在該等式中,Et[I表示分段上的均值。具體地說,通過等式[6.2計算Et[。Hx((D)和HY((D)i示X(叫t)和Y(o,t)在分段上的均值,并且分別通過等式[6.3和等式[6.4被計算出。在可以期待信號的均值接近于0的情況下,可以省略減去Hx((D)和jiY(a))的運算。以此方式,根據(jù)本發(fā)明實施例的信號處理裝置的聲源方向估計單元在時-頻域中計算在對應(yīng)時間分段中的觀測信號聲譜圖與分離信號聲譜圖之間的互協(xié)方差矩陣。代替直接計算觀測信號與分離結(jié)果之間的互協(xié)方差矩陣,也可以根據(jù)觀測信號本身的協(xié)方差矩陣以及分離矩陣來計算互協(xié)方差矩陣。也就是說,還可以通過根據(jù)等式[6.6計算觀測信號的協(xié)方差矩陣(根據(jù)需要,從X(叫t)減去均值nx(ffl)),然后將協(xié)方差矩陣從右側(cè)乘以分離矩陣的厄密轉(zhuǎn)置W((O)h,來計算出基4^目同的值。(當在分段內(nèi)分離矩陣W((D)為常量時,等式[6.5的兩側(cè)變?yōu)橄嗤闹怠?可以按照與分離矩陣W(o)相同的方式通過這樣計算出的互協(xié)方差矩陣ZxY(co)來獲得聲源方向。此外,根據(jù)互協(xié)方差矩陣ZxY(m)估計出的聲源方向結(jié)合了由分離矩陣獲得的特性與由上述[A1.使用^JL風之間的相位差的聲源方向估計獲得的特性。下文中,將對此給出描述。通過使用用于計算上述分離結(jié)果的等式[3.5,即,Y((M)=W((0)X((M)的逆運算可以將等式[6.5的右手邊變換為等式6.8,也就是說,變換為其中分離矩陣的逆矩陣乘以分離結(jié)果本身的協(xié)方差矩陣的形式。等式[6.8表示用于說明性目的的變換,而在實際處理中不一定計算逆矩陣。如果已經(jīng)完全執(zhí)行了分離,也就是說,如果在分離矩陣與觀測信號之間不出現(xiàn)失配,并且進一步地,如果分離矩陣已經(jīng)充分收斂,則分離結(jié)果Y(叫t)的各個元素是統(tǒng)計上獨立的。因此,分離結(jié)果的協(xié)方差矩陣變?yōu)閮H對角線元素具有正數(shù)值(非對角線元素為0)的對角線矩陣。由于乘以對角線矩陣與復(fù)數(shù)元素比率的相位無關(guān),因此當分離完成時,對于聲源方向而言,等式[6,8等同于分離矩陣的逆矩陣。因此,當在互協(xié)方差矩陣ZxY(a))內(nèi)的元素表示為以下等式7.1時,通過等式[7.2(與等式[5.4]相似)來估計聲源方向。也就是說,即使不使用逆矩陣,也可以估計聲源方向。<formula>formulaseeoriginaldocumentpage34</formula>……[7.2]另一方面,即使當分離不充分時,如果同時播放的聲源的數(shù)量是l,則也可以估計聲源方向。根據(jù)等式[6.5,還可以將上述互協(xié)方差矩陣看作觀測信號的協(xié)方差矩陣與分離矩陣的厄密轉(zhuǎn)置的乘積?,F(xiàn)在,考慮分離矩陣是單位矩陣的情況。這種情況與信號被最少分離(觀測信號按原樣輸出)的狀態(tài)相對應(yīng)。在此情況下,由于上述互協(xié)方差矩陣變?yōu)榈韧谟^測信號的協(xié)方差矩陣,因此根據(jù)等式[7.2計算的聲源方向與根據(jù)等式[1.6和等式[1.4中的每個計算出的聲源方向("A1.使用麥克風之間的相位差的聲源方向估計")在值上是相同的。也就是說,觀測信號的協(xié)方差矩陣5:xY(G))具有nxn個元素,并且各個元素可以表示如在等式[6.7中那樣(根據(jù)需要減去均值)。雖然Zxv(a)具有n列,但基本上,無論使用哪列,都計算出與通過使用等式[1.6獲得的值相同的值?,F(xiàn)在總結(jié)上述兩種情況。當分離完成時,才艮據(jù)互協(xié)方差矩陣計算出的聲源方向取得與根據(jù)分離矩陣的逆矩陣計算出的聲源方向相同的值。在其它極端情況下,當根本未執(zhí)行分離時,根據(jù)互協(xié)方差矩陣計算出的聲源方向取得與根據(jù)麥克風之間的相位差計算出的聲源方向相同的值。也就是說,根據(jù)互協(xié)方差矩陣計算出的聲源方向結(jié)合了兩種情況的特性。在下面示出在使用根據(jù)相關(guān)技術(shù)的ICA的情況下的聲源方向估計處理與基于根據(jù)本發(fā)明實施例的使用互協(xié)方差矩陣的技術(shù)的聲源方向估計處理之間的比較表。表1<table>tableseeoriginaldocumentpage36</column></row><table>如上表所示,在使用根據(jù)相關(guān)技術(shù)的ICA的情況下的聲源方向估計處理中,當分離處理不充分時,聲源估計的準確度降低。然而,在基于根據(jù)本發(fā)明實施例的使用互協(xié)方差矩陣的技術(shù)的聲源估計處理中,在單聲源的情況下實現(xiàn)良好估計。當多個聲源同時播放,并且分離不充分時,即使通過應(yīng)用根據(jù)本發(fā)明實施例的使用互協(xié)方差矩陣的技術(shù),也不可能估計準確的聲源方向。然而,通過采用隨后描述的"直線擬合",可以以高準確度檢測其中存在多聲源并且分離處理不充分的情況的發(fā)生,因此可以使對方向估計的后續(xù)處理的影響最小。此外,與^^用分離矩陣的情況相比,^^用互協(xié)方差矩陣的方案具有以下優(yōu)點以高頻率更新(在逐幀的基礎(chǔ)上進行更新是可能的)低延遲(在一幀以內(nèi))滯后較小(或可以^L檢測到)可以通過每次幀索引t增加就計算用于計算上述互協(xié)方差矩陣SxY(O))的等式[6.10或等式[6.11來執(zhí)行協(xié)方差矩陣(或互協(xié)方差矩陣)的計算(根據(jù)需要,從X(叫t)和Y(叫t)減去均值)。與逆矩陣的計算相比,這種計算的復(fù)雜度較小。此外,即使在圖9所示的分離結(jié)果聲譜圖中設(shè)置的分段的長度L(見圖9)增加,復(fù)雜度也是恒定的.因此,在根據(jù)本發(fā)明實施例的方法中,可以按逐幀的頻率并且以低延遲來計算聲源方向。此外,可以與用于學(xué)習(xí)分離矩陣的分段(例如,學(xué)習(xí)數(shù)據(jù)塊分段91)分離地設(shè)置用于計算聲源方向的分段(圖9所示的在觀測信號聲鐠圖中設(shè)置的分段92以;ML分離結(jié)果聲譜圖中設(shè)置的分段94中的每個)。因此,可以設(shè)置既提供可跟蹤性又提供穩(wěn)定性的優(yōu)化長度.雖然在上述描述中計算了(互)協(xié)方差矩陣,但是可不使用協(xié)方差矩陣本身,而使用通過將各個元素乘以適當?shù)恼龜?shù)值來獲得的矩陣以計算聲源方向.(這是因為乘以正實數(shù)并不影響相位角。當各個元素乘以不同值時,同樣適用。)例如,在作為用于計算協(xié)方差矩陣的等式的上述等式[6.2、[6.10]和[6.11]中,即使省略系數(shù)1/(L-1),也計算出相同的值作為聲源方向。此外,即使使用相關(guān)矩陣(等式[6.12,其中巧k(ffl)表示協(xié)方差矩陣的各個元素并且由等式[7.1來表示)而不是協(xié)方差矩陣,也計算出相同的聲源方向。此外,即使乘lbi負值或復(fù)數(shù),只要協(xié)方差矩陣的每列內(nèi)的元素乘以相同值,就計算出相同的值作為聲源方向(由于在計算元素之間的比率時出現(xiàn)抵消)。例如,即使使用由等式[6.131表示的S,xv((D)而不是互協(xié)方差矩陣SxY(Q)),也計算出相同的聲源方向。(應(yīng)該注意,等式[6.13的右手邊的笫二項為非對角線元素是0而對角線元素&hn表示任意復(fù)數(shù)的矩陣。)由于這種特性,針對用于計算互協(xié)方差矩陣的分離結(jié)果Y(叫t)和分離矩陣W(o),即使當在重新調(diào)節(jié)(rescaling)之前使用它們,而非在重新調(diào)節(jié)之后使用它們時,也計算出相同的聲源方向。(重新調(diào)節(jié)指的是調(diào)整分離結(jié)果的每個頻率窗口的比例的處理,^將給出其細節(jié)。)2.直線擬合通過使用上述等式[7.2,可以對于各個頻率窗口和各個麥克風對來估計聲源方向,對那些聲源方向取平均以求解聲源方向.然而,對在各個頻率窗口中計算出的值取平均的方法具有以下問題。(問題1)如果給定的源信號不包含頻率窗口(D的分量(例如,如果源信號是帶寬受限的),則在頻率窗口CD中的聲源方向變?yōu)椴粶蚀_的值,這將在取均值時施加不利影響。(問題2)如果與頻率窗口tD^目對應(yīng)的波長變?yōu)樾∮邴溈孙L間距的兩倍(也就是說,如果(D滿足co》1+C/(2dF)),則聲源方向并不唯一地被確定。具體地說,由于除了與真實方向相對應(yīng)的e之外存在滿足上述等式[1.3的e,因此函數(shù)asin變得難以確定返回什么值。(這被稱為空間混疊。)因此,難以將高頻分量反映到聲源方向上。(問題3)由于未考慮頻率窗口等等之間的關(guān)系,因此即使采用相對而言無置換的ICA方案,也未改進方向估計的準確度。為了克服這些問題,根據(jù)本發(fā)明實施例,采用被稱作"直線擬合"的技術(shù)。這是通過直線來近似相位差相對于頻率窗口索引ffl的圖線,并且根據(jù)直線斜率估計聲源方向的方案.下文中,將給出所涉及的原理和方法的描述。關(guān)于表示互協(xié)方差矩陣的上述等式7.11的右手邊,首先注意互協(xié)方差矩陣的第k列.然后,通過取笫i行和笫m行中的元素之間的比率隨后將復(fù)數(shù)的量值規(guī)范化為1而獲得的值被定義為!^k(ffl),rimk((D)由以下等式[8.11來表示。<formula>formulaseeoriginaldocumentpage39</formula>應(yīng)該注意,sign(z)表示將復(fù)數(shù)z的量值規(guī)范化為l的運算,并且由等式[8,2來定義。此外,關(guān)于sign(),由于a/b和axconj(b);l相等的值(見等式[8.11),因此采用在以下描述中使用的"a與b之間的元素比率"的表述M示二者。(關(guān)于復(fù)數(shù)的乘法/除法與sign()之間的順序,無論首先執(zhí)行哪個都計算出相同的值。例如,在等式8.1的中間的表達式中,當在對分子和M取sign之后計算比率時,或者當^取得比率之后計算sign時,獲得相同的值.)根據(jù)上述等式[1.11至[1.7和等式[6.1至[6.13的檢查,可以由上面的等式[8.3來近似[1滅(0))]。也就是說,rimk(Q))的相位角與[G)-l]成比例,并且在其比例常數(shù)K融與聲源方向之間,等式[8.4的關(guān)系成立。換句話說,如果通過直線來近似rw((D)的繪制的相位角(rimk(0))),則直線斜率是Ki她,并且如果求解出Kimk,則也針對每個麥克風對求解出聲源方向。圖IOA和圖IOB示出具體示例。圖IOA和圖IOB是示出通過取得互協(xié)方差矩陣的第k列的第i行中的元素與第m行中的元素之間的比率并且還將其量值規(guī)范化為1所獲得的數(shù)據(jù)rimk()的相位角angle(rimk())、以及獲取通過對每個麥克風對進行直線近似處理和聲源方向計算處理所獲得的直線的斜率KiJ的繪制數(shù)據(jù)的圖。圖10A示出關(guān)于從實數(shù)數(shù)據(jù)計算出的r滅(w)的相位角的圖線,其中,垂直軸指示頻率窗口(d,而水平軸指示相位角??梢姡c基本上按直線排列。然而,由于M2tc(在該圖中,-兀到7i)的范圍內(nèi)可以標識相位角angle()的值,因此在-7c到7c之間存在值的"跳變"。與圖IOA相反,圖IOB示出通過考慮"跳變"而執(zhí)行的直線擬合的結(jié)果。在直線擬合時,為了使得"跳變"最小,對于每個頻率窗口執(zhí)行將2Ntu(N是適當?shù)恼麛?shù))加到相位角的值的展開運算。針對圖IOB所示的展開處理區(qū)域103執(zhí)行該處理'該運算被稱為"展開"。在這種展開之后,求解出通過各點的最佳擬合直線,即圖10B所示的擬合直線104。稍后將描述該處理的具體算法。也可以通過直接使用復(fù)數(shù)rimk(Q))而不使用iVk(ro)的相位角來估計比例系數(shù)Kimk。將參照圖IIA至圖IID描述這種方法。在下面的描述中,這種方法也被稱作"直線擬合"。圖IIA和圖IIB分別示出iVk(a))的實部和虛部的繪制數(shù)據(jù)??梢?,分別繪制出接近于余弦(cosine)和正弦(sine)的曲線.通過在上述等式[8.3中的exp(jKiml(-l))來對這些圖線進行的近似產(chǎn)生用于求解與實部和虛部二者的最佳擬合曲線(圖lie所示的曲線105和圖11D所示的曲線106)相對應(yīng)的Kimk的比例常數(shù).例如,由等式[8.5]來定義r^k(ffl)與expGKiml(—l))之間的誤差,并且可以求解使得該誤差最小的Ki她值。(見等式[8.6,argmin表示求解使得括號內(nèi)的值為最小的Kimk值的運算。)通過執(zhí)行上述直線擬合,可以按如下避免上述三個問題.(問題1)如果給定的源信號不包含頻率窗口①的分量(例如,如果源信號是帶寬受限的),則頻率窗口O)中的聲源方向變?yōu)椴粶蚀_的值,M取均值時將施加不利影響。關(guān)于該問題,即使在若干頻率窗口中rimk((o)的相位角偏離直線,如果在多數(shù)頻率窗口中相位角基本位于直線上,則基本正確地估計出斜率Kimk-(問題2)如果與頻率窗口(d對應(yīng)的波長變得小于麥克風間距的兩倍(也就是說,如果①滿足0)》l+C/(2dF)),則聲源方向不唯一地被確定。具體地說,由于除了與真實方向?qū)?yīng)的6之外存在滿足上述等式[1.3]的9,因此函數(shù)asin變得難以確定返回什么值。(這被稱為空間混疊。)因此,難以將更高頻率分量反映到聲源方向上。關(guān)于該問題,通過在直線擬合時執(zhí)行展開,消除了空間混疊。因此,與更高頻率對應(yīng)的窗口也可以反映到聲源方向上。(問題3)由于未考慮頻率窗口之間的關(guān)系等等,因此即使采用相對而言無置換的ICA方案,這也未改進方向估計的準確度。關(guān)于該問題,由于利用了"除非在分離結(jié)果中出現(xiàn)了置換,否則相位角與頻率窗口彼此成比例"的關(guān)系,因此與基于每頻率窗口求解方向的方案相比,可以期望在估計準確度方面的改進.換句話^L,在日本未審查的專利申請乂〉開No.2006-238409之前的方案中,由于在分離結(jié)果中的頻率窗口之間出現(xiàn)置換,因此圖IOA中的圖線并未變成線性,因此,不可能采用"直線擬合"。如上所述,通過執(zhí)行直線擬合,可以避免以上三個問題。此外,通過〗吏用擬合誤差(等式[8.5),可以確定估計的聲源方向準確到什么程度.例如,在上ili^滯后(以上參照圖8描述的數(shù)據(jù)88b至88e),并且此時存在多個同時播放的聲源的情況下,繪制的相位角并不在直線上排列.當此時強制執(zhí)行直線擬合時,所得到的擬M差變大。因此,如果等式[8.5]產(chǎn)生大于給定值(例如,l)的值,則可以將估計視為已經(jīng)失敗,并且丟棄估計的聲源方向。[實施例接下來,將給出根據(jù)本發(fā)明實施例的信號處理裝置的具體配置和處理示例的描述,該信號處理裝置執(zhí)行采用上述l.互協(xié)方差矩陣和2.直線擬合的聲源方向估計處理。(裝置的配置)圖12示出根據(jù)本發(fā)明實施例的信號處理裝置的配置。圖12所示的裝置配置基于由本申請人在先提交的日本專利申請No.2006-331823"REAL-TIMESOUNDSOURCESEPARATIONAPPARATUSANDMETHOD".聲源方向估計單元125被添加到在日本專利申請No.2006-331823中所/>開的配置。圖12所示的信號處理裝置可以由例如PC來具體地實現(xiàn)。也就是說,可以由例如根據(jù)預(yù)定程序執(zhí)行處理的CPU來執(zhí)行分離處理單元123、學(xué)習(xí)處理單元110、聲源方向估計單元以及后級處理單元124中的相應(yīng)處理.圖12的中央所示的分離處理單元123主JW行對觀測信號的分離。圖12的右手邊所示的學(xué)習(xí)處理單元110執(zhí)行分離矩陣的學(xué)習(xí)。分離處理單元123中的處理和學(xué)習(xí)處理單元110中的處理并行地執(zhí)行。分離處理單元123中的處理是前臺處理,而學(xué)習(xí)處理單元110中的處理是后臺處理。從整個系統(tǒng)的觀點來看,分離處理單元123執(zhí)行以下操作將分離矩陣應(yīng)用于從AD轉(zhuǎn)換單元122輸入的音頻信號以生成分離結(jié)果,并且還根據(jù)學(xué)習(xí)處理單元110中的處理iijl用最新的分離矩陣來替代該分離矩陣。在聲源方向估計單元125中,從分離處理單元123輸AJC測信號和分離結(jié)果(或等式[6.5的關(guān)系),并且根據(jù)觀測信號和分離矩陣計算聲源方向。下文中,將描述各個組件中的處理。由多個麥克風121記錄的聲音在AD轉(zhuǎn)換單元122中被轉(zhuǎn)換為數(shù)字數(shù)據(jù),然后被發(fā)送到分離處理單元123的傅立葉變換單元126。在傅立葉變換單元126中,通過加窗的短時傅立葉變換(隨后將給出其細節(jié))將數(shù)字數(shù)據(jù)變換為頻域數(shù)據(jù)。此時,生成預(yù)定數(shù)量的被稱為幀的數(shù)據(jù)片。以這些幀為單位來執(zhí)行后續(xù)的處理。傅立葉變換后的數(shù)據(jù)^JL送到聲源方向估計單元125、分離單元127和學(xué)習(xí)處理單元110的線程控制單元112中的每個。在分離單元127中,表示從傅立葉變換單元126輸入的觀測信號的傅立葉變換結(jié)果的一幀的X(t)、以及在該定時之前所獲得的分離矩陣W被從學(xué)習(xí)處理單元110的分離矩陣保持單元113輸入,這些輸A^目乘在一起以生成作為如下式給出的分離結(jié)果的Y(t):¥(t)=WX(t),其中,t表示幀索引,分離結(jié)果Y(t)被發(fā)送到逆傅立葉變換單元128和聲源方向估計單元125??梢詫⒎蛛x矩陣而非分離結(jié)果發(fā)送到聲源方向估計單元125.發(fā)ilU'J逆傅立葉變換單元128的分離結(jié)果[Y(t)被變換為時域信號,并且被發(fā)送到在后級執(zhí)行處理的后級處理單元a124a。在后級的處理的示例包括聲音識別和揚聲器識別。取決于后級處理,可以按原樣使用頻域數(shù)據(jù),在此情況下,可以省略逆傅立葉變換。另一方面,發(fā)送到學(xué)習(xí)處理單元110的線程控制單元112的觀測信號(從傅立葉變換單元126輸入的觀測信號的傅立葉變換結(jié)果)被發(fā)送到使用多個學(xué)習(xí)線程111-1至lll-N執(zhí)行計算的線程計算單元111。在加載祐二給予各個學(xué)習(xí)線程的預(yù)定量的觀測信號之后,線程計算單元ill通過^f吏用ICA批處理來根據(jù)觀測信號求解分離矩陣,這樣求解出的分離矩陣被經(jīng)由線程控制單元112發(fā)送到分離處理單元123的分離單元127。此外,^L送到聲源方向估計單元125的觀測信號(從傅立葉變換單元126輸入的觀測信號的傅立葉變換結(jié)果)用于連同在分離單元127中生成的分離結(jié)果一起(或連同分離矩陣一起)計算互協(xié)方差矩陣.因此,計算出聲源方向。(1^將給出細節(jié).)這樣求解出的聲源方向^JC送到后級處理單元b124b,后級處理單元b124b在后級執(zhí)行處理。由后級處理單元b124b執(zhí)行的在后級的處理的示例包M稱為寫日記的處理。也就是說,當與聲音識別、揚聲器識別等等的結(jié)^目結(jié)合時,可以生成指示"誰在何時以;su^什么方向(在什么位置)說了什么話"的信息集合。接下來,將參照圖13和圖14詳細描述聲源方向估計單元125。圖13是用于根據(jù)觀測信號和分離結(jié)果計算互協(xié)方差矩陣的情況(等式[6.U)的配置示圖,圖14是用于;^據(jù)觀測信號和分離矩陣計算互協(xié)方差矩陣的情況(等式[6.5])的配置示圖。首先,參照圖13,給出聲源方向估計單元125的配置示例的描述,聲源方向估計單元125通過根據(jù)觀測信號和分離結(jié)果計算互協(xié)方差矩陣來執(zhí)行聲源方向估計處理。圖13所示的聲源方向估計單元125的輸入是從如圖12所示被配置的傅立葉變換單元126提供的觀測信號X(t)的一幀5從如圖12所示被配置的分離單元127提供的分離結(jié)果Y(t)的一幀。從傅立葉變換單元126提供的觀測信號X(t)的一幀被存儲在觀測信號緩沖器133中。這對應(yīng)于觀測信號數(shù)據(jù)分段92,觀測信號數(shù)據(jù)分段92是圖9所示的在觀測信號側(cè)包含當前時間的分段。觀測信號緩沖器133是長度為L的環(huán)形緩沖器,從第(L十l)個輸入起向前的輸入改寫緩沖器內(nèi)的最早信號。例如,雖然從X(0)至X(L-1)的輸入照常存儲在觀測信號緩沖器133中,但在存儲X(L)時,X(L)改寫X(0)的區(qū)域.當然,根據(jù)需要,可以保存所有的過去的觀測信號。從分離單元127提供的分離結(jié)果Y(t)的一幀被存儲在分離結(jié)果緩沖器134中。it^應(yīng)于分離結(jié)果數(shù)據(jù)分段94,分離結(jié)果數(shù)據(jù)分段94是圖9所示的在分離結(jié)果側(cè)包含當前時間的分段。類似于觀測信號緩沖器133,分離結(jié)果緩沖器134是長度為L的環(huán)形緩沖器。計算單元132根據(jù)L幀觀測信號和分離結(jié)果針對每個頻率窗口計算互協(xié)方差矩陣,并且將結(jié)果存儲在互協(xié)方差矩陣緩沖器135中。如以上參照圖9所描述的,計算單元132在時-頻域中計算觀測信號聲譜圖和分離結(jié)果聲鐠圖的對應(yīng)時間分段之間的互協(xié)方差矩陣,并且將結(jié)果存儲在互協(xié)方差矩陣緩沖器135中。此外,計算單元132根據(jù)互協(xié)方差矩陣針對各個通道和麥克風對計算元素比率和相位差(例如等式[8,1中的rimk(w)和等式[8.91中的0Uk((D)),并且將計算結(jié)^"儲在相位差緩沖器136中.接下來,計算單元132求解對相位差緩沖器136中存儲的相位差進行最佳擬合的比例常數(shù)(直線斜率)Kimk,將結(jié)果存儲在直線斜率緩沖器137中,還將擬合誤差errimk存儲在擬合誤差緩沖器138中。最后,計算單元132根據(jù)擬合誤差eiTimk和在直線斜率緩沖器137中存儲的比例常數(shù)(直線斜率)計算聲源方向[ej,并且將聲源方向[ed作為計算結(jié)^#儲在聲源方向緩沖器139中.根據(jù)需要,還可以計算指示方向的三維(或者取決于預(yù)期應(yīng)用,二維)矢量、或指示每個聲源位置的三維(或者取決于預(yù)期應(yīng)用,二維)坐標,而不是計算聲源方向的角度。在計算單元132中執(zhí)行聲源方向估計單元125中的相應(yīng)計算。雖然在該圖中被省略,但在該圖中計算單元132連接到^h緩沖器,從而允許數(shù)據(jù)交換。接下來,參照圖14,將給出聲源方向估計單元125的配置示例的描述,聲源方向估計單元125根據(jù)觀測信號和分離矩陣執(zhí)行聲源方向估計處理。圖14所示的聲源方向估計單元125的輸入是從如圖12所示被配置的傅立葉變換單元126提供的觀測信號X(t)的一幀;同時正在圖12所示的分離單元127中使用的分離矩陣W。從傅立葉變換單元126提供的觀測信號X(t)的一幀被存儲在觀測信號緩沖器143中。it^應(yīng)于觀測信號數(shù)據(jù)分段92,觀測信號數(shù)據(jù)分段92是圖9所示的在觀測信號側(cè)包括當前時間的分段。觀測信號緩沖器143是長度為L的環(huán)形緩沖器.根據(jù)這種配置,計算單元142根據(jù)觀測信號緩沖器143中存儲的數(shù)據(jù)并非計算互協(xié)方差矩陣,而是計算觀測信號本身的協(xié)方差矩陣,并且將結(jié)M儲在協(xié)方差矩陣緩沖器144中。計算單元142接收同時正在圖12所示的分離單元127中使用的分離矩陣W的輸入,4艮據(jù)該分離矩陣的厄密轉(zhuǎn)置和在協(xié)方差矩陣緩沖器144中存儲的協(xié)方差矩陣,基于上述等式[6.5計算互協(xié)方差矩陣[1^1,以及將計算出的互協(xié)方差矩陣存儲在互協(xié)方差矩陣緩沖器145中。后續(xù)處理與以上參照圖13所描述的處理相同。也就^l:說,計算單元142根據(jù)互協(xié)方差矩陣針對各個通道和麥克風對計算元素比率和相位差(例如等式[8.1]中的rimk(co)和等式[8.9中的oimk(a))),并且將計算結(jié)果存儲在相位差緩沖器146中.接下來,計算單元142求解對在相位差緩沖器146中存儲的相位差進行最佳擬合的比例常數(shù)(直線斜率)Kimk,將結(jié)果存儲在直線斜率緩沖器147中,還將擬合誤差errimk存儲在擬合誤差緩沖器148中。最后,計算單元142根據(jù)擬合誤差eriw和在直線斜率緩沖器147中存儲的比例常數(shù)(直線斜率)計算聲源方向作為計算結(jié)果存儲在聲源方向緩沖器149中。與圖13所示的配置相比,圖14所示的配置在節(jié)省緩沖存儲器方面證明是有利的,這是由于必須針對分離結(jié)M儲L幀信號。接下來,參照圖15,將給出在圖12所示的裝置配置中的學(xué)習(xí)處理單元110的線程控制單元112的詳細配置的描述。每次提供觀測信號的一頓,當前幀索引M計數(shù)器151就增加1,并且在達到預(yù)定值時,返回到初始值??梢允褂嫈?shù)器的增加與時域信號的樣本索引同步,而不是與幀索引同步'當在每個線程中執(zhí)行學(xué)習(xí)處理時,學(xué)習(xí)初始值保存單元152保存分離矩陣W的初始值。雖然分離矩陣W的初始^1^本上與最新的分離矩陣的初始值相同,但還可以使用不同的值。例如,尚未應(yīng)用重新調(diào)節(jié)(調(diào)整頻率窗口之間的功率(power)的處理,1^將給出其細節(jié))的分離矩陣被用作學(xué)習(xí)初始值,應(yīng)用了重新調(diào)節(jié)的分離矩陣被用作最新的分離矩陣。規(guī)劃加栽開始定時指定信息保存單元153保存用于在多個線程之間將開始加載的定時保持在恒定間隔的信息。規(guī)劃加載開始定時可以使用相關(guān)時間M示,或者可以由幀索引或時域信號的樣本索引而非相關(guān)時間來管理。對用于管理其它類型"定時"的信息同樣適用。觀測信號加栽定時信息保存單元154M基于所獲取的觀測信號指示在什么定時學(xué)習(xí)到在分離單元127中當前正使用的分離矩陣X的信息(即與最新的分離矩陣相對應(yīng)的觀測信號的相關(guān)時間或幀索引)。雖然可以在和加載結(jié)束定時,但如果塊長度,也就是說,如果觀測信號的加載時間為常數(shù),則只需保存這些定時中的一個。線程控制單元112具有M鏈接到各個線程的指針的指針保存單元155,并且通過使用指針保存單元155來控制多個線程111-1至lll-N。接下來,參照圖16,將描述在線程計算單元111中執(zhí)行的處理。線程111-1至lll-N中的每個通過使用觀測信號緩沖器161、分離結(jié)果緩沖器162、學(xué)習(xí)計算單元163和分離矩陣保存單元164的相應(yīng)模塊的功能來執(zhí)行成批ICA.觀測信號緩沖器161保存從線程控制單元112提供的觀測信號,并且其容量等于或大于觀測信號與一個塊長度相對應(yīng)的容量。然而,應(yīng)該注意,如果JW行隨后描述的"觀測信號的幀稀疏化",則緩沖器的大小可以減少與稀疏化的量相對應(yīng)的量。分離結(jié)果緩沖器162保存由學(xué)習(xí)計算單元163所計算出的在分離矩陣收斂之前的分離結(jié)果。學(xué)習(xí)計算單元163執(zhí)行以下處理基于用于分離處理的保存在分離矩陣保存單元164中的分離矩陣W,分離在觀測信號緩沖器161中加栽的觀測信號,將分離結(jié)果加栽到分離結(jié)果緩沖器162中,并且還更新正通過使用在分離結(jié)果緩沖器162中加栽的分離結(jié)果而被學(xué)習(xí)的分離矩陣。線程是狀態(tài)轉(zhuǎn)換機,當前狀態(tài)存儲在狀態(tài)存儲單元165中。線程控制單元112基于計數(shù)器166的計數(shù)器值控制線程的狀態(tài)。計數(shù)器166的值與觀測信號的一幀的供給同步地改變,并且基于該值來轉(zhuǎn)換其狀態(tài)。隨后給出關(guān)于這點的細節(jié)。46觀測信號開始/結(jié)束定時保存單元167保存指示用于學(xué)習(xí)的觀測信號的開始定時和結(jié)束定時的至少一奈信息。如上所述,指示定時的信息可以是幀索引或樣本索引,或者可以是相關(guān)時間信息。另外在此情況下,雖然可以存儲開始定時和結(jié)束定時二者,但如果塊長度,也就;li兌,如^XSL測信號的加栽時間是常數(shù),則只需M這些定時中的一個。學(xué)習(xí)結(jié)束標志168是用于通知線程控制單元112學(xué)習(xí)結(jié)束的標志。在線程的激活期間,學(xué)習(xí)結(jié)束標志168被設(shè)置為OFF(標志;M^作用),而在學(xué)習(xí)結(jié)束的時刻,學(xué)習(xí)結(jié)束標志168被設(shè)置為ON。然后,在線程控制單元112識別出學(xué)習(xí)結(jié)束4L后,通過線程控制單元112的控制再次將學(xué)習(xí)結(jié)束標志168i殳置為OFF。預(yù)處理數(shù)據(jù)保存單元169是保存當應(yīng)用了預(yù)處理的觀測信號返回到原始狀態(tài)時變?yōu)楸匦璧臄?shù)據(jù)的區(qū)域。具體地說,例如,在預(yù)處理中執(zhí)行了觀測信號的規(guī)范化(將方差調(diào)整到1,而將均值調(diào)整到0)的情況下,由于例如方差(或標準差或其倒數(shù))和均值的值M在預(yù)處理數(shù)據(jù)M單元169中,所以可以通過使用這些值來恢復(fù)在規(guī)范化之前的原始信號。在例如執(zhí)行不相關(guān)(也稱作預(yù)白化)作為預(yù)處理的情況下,M觀測信號在不相關(guān)期間所乘以的矩陣。可以從例如線程控制單元112的外部模塊重寫存儲在狀態(tài)存儲單元165、計數(shù)器166和觀測信號開始/結(jié)束定時保存單元167中的值。例如,甚至在學(xué)習(xí)處理循環(huán)正在該線程中運行的同時,線程控制單元112也可以改變計數(shù)器166的值。對于狀態(tài)轉(zhuǎn)換的實現(xiàn)方式,規(guī)范可以是使得線程111-1至lll-N中的每個基于線程自身的計數(shù)器166的值而自發(fā)地改變其狀態(tài),或者規(guī)范可以是使得線程控制單元112根據(jù)計數(shù)器166的值或?qū)W習(xí)結(jié)束標志168的值向?qū)?yīng)的線程發(fā)出指示"轉(zhuǎn)換至指定狀態(tài)"的命令(下文中,稱作"狀態(tài)轉(zhuǎn)換命令"),并且響應(yīng)于所提供的命令,每個線程在狀態(tài)上進行轉(zhuǎn)換。接下來,將參照圖17和圖18描述學(xué)習(xí)線程111-1至lll-N的狀態(tài)轉(zhuǎn)換。對于其實現(xiàn),雖然規(guī)范可以是使得每個線程基于計數(shù)器166的值而自己改變其狀態(tài),但規(guī)范也可以是使得線程控制單元根據(jù)計數(shù)器166的值或"學(xué)習(xí)結(jié)束標志"168的值來發(fā)出狀態(tài)轉(zhuǎn)換命令,并且每個線程響應(yīng)于該命令而改變其狀態(tài)。在實施例的以下描述中,采用后面的規(guī)范,圖17示出以上參照圖7所描述的線程之一。在線程的每個中,當處于觀測信號的"加栽"狀態(tài)時,在指定時間期間的觀測信號,即一個塊長度,被加載到緩沖器中。在指定時間過去之后,狀態(tài)轉(zhuǎn)換到學(xué)習(xí)。在學(xué)習(xí)狀態(tài)中,執(zhí)行學(xué)習(xí)處理循環(huán)直到分離矩陣w收斂(或預(yù)定次數(shù)),并且求解出與在加載狀態(tài)中加載的觀測信號相對應(yīng)的分離矩陣。在分離矩陣收斂之后(或者在執(zhí)行學(xué)習(xí)處理循環(huán)預(yù)定次數(shù)之后),狀態(tài)轉(zhuǎn)換到等待。然后,在等待狀態(tài)中,在指定的時間期間不執(zhí)行觀測信號的加栽或?qū)W習(xí),并且線程處于等待狀態(tài)。由學(xué)習(xí)消耗的時間來確定維持等待狀態(tài)所持續(xù)的時間,也就是說,如圖17所示,將線程長度(也read一len)設(shè)置為"加栽"狀態(tài)、"學(xué)習(xí)"狀態(tài)和"等待"狀態(tài)的總時間寬度,并M本上,將從"學(xué)習(xí)"狀態(tài)結(jié)束到線程長度的末端的時間設(shè)置為"等待"狀態(tài)時間(等待時間)。在等待時間過去之后,狀態(tài)返回到觀測信號的"加載"狀態(tài)。雖然可以按毫秒等等為單位來管理這些時間,但也可以以由短時傅立葉變換所生成的幀為單位來測量時間.在下面的描述中,假設(shè)以幀為單位對這些時間進行測量(例如,向上計數(shù))。參照圖18,將給出線程的狀態(tài)轉(zhuǎn)換的進一步描述.雖然緊接系統(tǒng)啟動之后線程處于"初始狀態(tài)"181,但使線程之一轉(zhuǎn)換到"加栽"183,而使其它線程轉(zhuǎn)換到"等待"182(發(fā)出狀態(tài)轉(zhuǎn)換命令).在以上描述的圖7的示例中,線程l是轉(zhuǎn)換到"加栽"的線程,而其它線程是轉(zhuǎn)換到"等待"的線程。加栽觀測信號所必需的時間被稱作塊長度(block—len)(見圖17)。此外,加栽、學(xué)習(xí)和等待的一個周期所必需的時S被稱作線程長度(thread一len)。雖然可以按毫秒等等為單位管理這些時間,但由短時傅立葉變換所;成的幀可以作為管理單位.在下面的描述中,幀作為單位?;谟嫈?shù)器的值進行從"加載到學(xué)習(xí)"和"等待到加載"的狀態(tài)轉(zhuǎn)換。也就是說,在從"加載"(圖17中的加栽狀態(tài)171和圖18中的加栽狀態(tài)183)開始的線程內(nèi),每提供觀測信號的一幀,計數(shù)器就增加l,當計數(shù)器的值變?yōu)榈扔趬K長度(block_len)時,使狀態(tài)轉(zhuǎn)換到"學(xué)習(xí)"(圖17中的學(xué)習(xí)狀態(tài)172和圖18中的學(xué)習(xí)狀態(tài)184)。雖然與分離處理并行地在后臺執(zhí)行學(xué)習(xí),但也是在這種學(xué)習(xí)期間,計數(shù)器與觀測信號的幀同步地增加l。當學(xué)習(xí)結(jié)束時,使狀態(tài)轉(zhuǎn)換到"等待"(圖17中的等待狀態(tài)173和圖18中的等待狀態(tài)182)。如在學(xué)習(xí)狀態(tài)中那樣,當處于等待狀態(tài)時,計數(shù)器與觀測信號的幀同步地增加l。然后,當計數(shù)器的值變?yōu)榈扔诰€程長度(thread_len)時,使狀態(tài)轉(zhuǎn)換到"加載"(圖17中的加栽狀態(tài)171和圖18中的;載狀態(tài)183),并且計數(shù)器返回到0(或適當?shù)某跏贾?.另一方面,對于從"初始狀態(tài)"181轉(zhuǎn)換到"等待"(圖17中的等待狀態(tài)173和圖18中的等待狀態(tài)182)的線程,將計數(shù)器設(shè)置為與線程要處于等待狀態(tài)的時間相對應(yīng)的值。例如,在等待等于塊偏移寬度(block—shift)的時間之后,圖7中的線程2轉(zhuǎn)換到"加載"。類似地,使線程3^"待等于塊偏移寬度的兩倍(block_shiftx2)的時間。為了實現(xiàn)這些操作,將線程2的計數(shù)器設(shè)置為(線程長度)-(塊偏移寬度)(threadjen)-(block_shift).此外,將線程3的計數(shù)器設(shè)置為(線程長度)■(2x塊偏移)(他read一len)-(block一shiftx2)。通過這些設(shè)置,在計數(shù)器的值達到線程長度(threadjen)之后,狀態(tài)轉(zhuǎn)換到"加栽",此后,如在線程1中,重復(fù)"加載、學(xué)習(xí)和等待"的周期'由線程長度和塊偏移寬度來確定待準備的學(xué)習(xí)線程的數(shù)量。令線程長JL^示為thread一len,塊偏移寬JL^示為block一shift,則通過以下等式求解出必需的學(xué)習(xí)^程的數(shù)量(線程長度)/(塊偏移寬度),即thread一length/block一sWft。上舍入分數(shù)部分。例如,在圖7中,由于設(shè)置使得-1.5x[塊長度(block—len),下文中,將描述由根據(jù)本發(fā)明實施例的裝置執(zhí)行的實時分離/聲源方向估計處理。在圖12所示的裝置配置中,可以與幀同步地執(zhí)行聲源方向估計單元125中的處理以及分離處理單元123中的"前臺處理(分離)"。因此,將49參照圖19所示的流程圖共同描述這兩個處理。由于在學(xué)習(xí)處理單元110中的"后臺處理(學(xué)習(xí))"運行在與聲源方向估計和分離處理相分離的處理單元(例如分離的線程、分離的處理或分離的處理器)中,因此將參照分離的流程圖^Mt其進行描述。此外,將在圖22所示的序列圖中描i^兩個處理之間交換的命令等等。首先,參照圖19中的流程圖,給出聲源方向估計單元125中的處理和分離處理單元123中的處理的描述。在系統(tǒng)啟動時,在步驟S101中,執(zhí)行各種初始化。1^將描述初始化的細節(jié)。重復(fù)從步驟S103中的聲音輸入到步驟SllO中的傳送的處理,直到系統(tǒng)上的處理結(jié)束(步驟S102中的"是")。步驟S103中的聲音輸入是從音頻設(shè)備(或網(wǎng)絡(luò)、文件等等,取決于實施例)(該處理將被稱作"記錄")記錄預(yù)定數(shù)量的樣本并且將記錄的樣本加栽在緩沖器中的處理.根據(jù)麥克風的數(shù)量執(zhí)行該操作.下文中,記錄的數(shù)據(jù)將被稱作觀測信號。接下來,在步驟S104中,將觀測信號分為各個預(yù)定長度,并且執(zhí)行短時傅立葉變換(STFT)。將參照圖20描述短時傅立葉變換的細節(jié)。例如,圖20(a)示出如在圖2所示的環(huán)境中使用第k麥克風記錄的觀測信號xk。窗函數(shù)(例如漢寧窗或正弦窗)^t應(yīng)用于幀191至193,幀193至193是通i^Ul測信號切^g定長度而獲得的分片數(shù)據(jù)。分片單位被稱作幀。通過將離散傅立葉變換(有限分段上的傅立葉變換,縮寫為DFT)或快速傅立葉變換(FFT)應(yīng)用于數(shù)據(jù)的一幀,獲得作為頻域數(shù)據(jù)的譜X"t)(t是幀索引)。待分片的幀(比如圖中所示的幀191至193)可以是交疊的,這使得連續(xù)幀的譜Xk(t-l)至Xk(t+1)可以平滑改變.栘^據(jù)幀索引而并排布置的鐠被稱作聲諉圖。圖20(b)示出聲譜圖的示例。當短時傅立葉變換(STFT)中待分片的幀交疊時,在逆傅立葉變換(FT)中,逐幀逆變換結(jié)果(波形)也被交疊地布置在一起。這種情況被稱為交疊相加。在交疊相加之前,可以將例如正弦窗的窗函數(shù)應(yīng)用于逆變換結(jié)果。這被稱作加權(quán)交疊相加(WOLA)。可以通過WOLA來減少由幀中的不連續(xù)性而導(dǎo)致的噪聲。由于根據(jù)本發(fā)明實施例存在多個輸入通道(等于麥克風數(shù)量),所以也根據(jù)通道數(shù)量執(zhí)行傅立葉變換。下文中,由矢量X(t)來表示用于所有通道和一幀的傅立葉變換結(jié)果(上述等式[4.11)。在等式[4.11中,n表示通道數(shù)量(-麥克風數(shù)量).M表示頻率窗口的總數(shù),并且令T表示短時傅立葉變換中的點數(shù),M=t/2+l。返回到圖19中的流程,繼續(xù)描述。在步驟S104中,在將觀測信號分為各個預(yù)定長度,并且執(zhí)行短時傅立葉變換(STFT)之后,在步驟S105中,針對每個學(xué)習(xí)線程執(zhí)行控制。1^給出關(guān)于這點的細節(jié)。接下來,對于在步驟S105中生成的觀測信號X(t),在步驟S106中執(zhí)行分離。令分離矩陣是W(等式[4.10),則通過以下等式求解出分離結(jié)果Y(t)(等式[4.4)Y(t)-WX(t)(等式4.12)。接下來,在步驟S107中,逆傅立葉變換(逆FT)被應(yīng)用于分離結(jié)果Y(t),由此將信號恢復(fù)回到時域信號。此后,在步驟S108中,分離結(jié)果被傳送到后級處理。接下來,在步猓S109中,通過使用觀測信號的一幀和分離結(jié)果(或者通過使用觀測信號的一幀和最新的分離矩陣)來更新聲源方向。隨后給出關(guān)于這點的細節(jié)。在步驟SllO中,將這樣求解出的聲源方向傳送到后級處理。重復(fù)上述步驟S103至S110,直到結(jié)束。將參照圖21中的流程圖來描述圖19所示的流程圖的步驟S101中的初始化處理的細節(jié)。在步猓S151中,圖12和圖15所示的線程控制單元112對自身進行初始化。具體地說,在線程控制單元112中,將當前幀索引M計數(shù)器151(見圖15)初始化為0,并且將適當?shù)某跏贾祹雽W(xué)習(xí)初始值^M!"單元152(見圖15)中。例如,所述初始值可以是單位矩陣,或者如果保存了在最近系統(tǒng)終止時的分離矩陣W,則可以使用在最近系統(tǒng)終止時的分離矩陣W或該分離矩陣的適當變換的形式。此外,例如,在可以根據(jù)信息(例如圖像或先驗知識)以某種準確度估計聲源方向的情況下,可以基于聲源方向來計算并設(shè)置初始值。在規(guī)劃加載開始定時指定信息保存單元153中設(shè)置(必需的線程數(shù)量-l)x[塊偏移寬度(block—shift)的值。該值指示具有最大線程索引的線程中的加栽開始的定時(^索引)。然后,由于在觀測信號加栽定時信息保存單元154中保存指示與最新的分離矩陣相對應(yīng)的觀測信號的定時信息(幀索引或相關(guān)時間信息),所以在此時執(zhí)行初始化,并且保存0。51此外在分離矩陣保存單元U3(見圖12)中,如在初始化時的學(xué)習(xí)初始值保存單元152的情況那樣,保存適當?shù)某跏贾?。也就是說,要被M在分離矩陣保存單元113中的初始值可以是單位矩陣,或者如果保存了在最近系統(tǒng)終止時的分離矩陣W,則可以使用在最近系統(tǒng)終止時的分離矩陣W或該分離矩陣的適當變換的形式,此外,例如,在可以棉^據(jù)信息(例如圖像或先驗知識)以某種準確度估計聲源方向的情況下,可以基于聲源方向來計算并設(shè)置初始值。在步驟S152中,錢程控制單元112確保要在線程計算單元111中執(zhí)行的必需的線程的數(shù)量i,并且將它們的狀態(tài)設(shè)置為"初始"狀態(tài)。此時,通過對線程長JL/塊偏移寬度(也read—len/block—shift)的小數(shù)部分進行上舍入來求解必需線程的數(shù)量i(即大手并且接近于thread—length/block一shift的值的整數(shù)),在步驟S153中,線程控制單元112開始線程控制循環(huán),線程控制單元112檢測未初始化的線程并且執(zhí)行從步驟S154到步驟S159的處理,直到所有線程的初始化結(jié)束。在步驟S154中,線程控制單元112確定線程索引是否為1。如果在步驟S154中確定線程索引為1,則在步驟S155中,線程控制單元112控制線程索引為1的線程(例如,線程111-1),并且初始化其計數(shù)器166(見圖16)(例如,將計數(shù)器166設(shè)置為0).在步驟S156中,線程控制單元112向線程索引為1的線程(例如線程111-1)發(fā)出用于使狀態(tài)轉(zhuǎn)換到"加栽"狀態(tài)的狀態(tài)轉(zhuǎn)換命令,并且處理i4/v步棵S159。如果在步驟S154中確定線程索引不為1,則在步驟S157中,線程控制單元112將相應(yīng)線程(線程111-2至lll-i中之一)的計數(shù)器166的值設(shè)置為thread—len-block—shiftx(線程索引-1)。在步驟S158中,線程控制單元112發(fā)出用于使狀態(tài)轉(zhuǎn)換到"等待"狀態(tài)的狀態(tài)轉(zhuǎn)換命令。在步驟S156或步驟S158中的處理之后,在步驟S159中,線程控制單元112初始化尚未初始化的線程內(nèi)的信息,即,指示狀態(tài)存儲單元165(見圖16)中存儲的狀態(tài)的信息,以及除了計數(shù)器166的計數(shù)器值之夕卜的信息.具體地說,例如,線程控制單元112將學(xué)習(xí)結(jié)束標志168(見圖16)設(shè)置為"OFF",并且對觀測信號開始/結(jié)束定時保存單元167和預(yù)處理數(shù)據(jù)保存單元169中的值進行初始化(例如將值設(shè)置為0)。當初始化了被確保在線程計算單元111中的所有線程(即,初始化了線程111-1至lll-i)時,線程循環(huán)結(jié)束,并且初始化結(jié)束.通過這種處理,線程控制單元112對被確保在線程計算單元111中的所有多個線程進行初始化。雖然以上描述了從步驟S153至步驟S160的處理循環(huán)重復(fù)了啟動的線程的數(shù)量i次,但可以執(zhí)行等于線程的數(shù)量i的并行處理,而并非重復(fù)該處理循環(huán)。類似地,在處理循環(huán)也重復(fù)的后續(xù)部分中,可以執(zhí)行并行處理,而不是重復(fù)該處理循環(huán)。在圖21的步驟S154至S158中的處理與開始時的"初始化"處理以及緊接在圖22所示的序列圖中的初始化處理之后的狀態(tài)轉(zhuǎn)換命令的傳送相對應(yīng)。圖22示出由線程控制單元112針對多個學(xué)習(xí)線程1和2所執(zhí)行的控制序列.每個線程重復(fù)地執(zhí)行等待、加載和學(xué)習(xí)的處理。在線程控制單元將觀測信號提供給爭個線程并且每個線程加栽觀測數(shù)據(jù)之后,執(zhí)行學(xué)習(xí)處理以生成分離矩陣,分離矩陣^L提供給線程控制單元。接下來,參照圖23中的流程圖,給出由線程控制單元112在圖19所示的流程圖的步驟S105中所執(zhí)行的線程控制處理的描述。應(yīng)注意,該流程圖表示如從線程控制單元112而不是從學(xué)習(xí)線程111-1至lll-N所見的流程。例如,"學(xué)習(xí)狀態(tài)處理"表示當學(xué)習(xí)線程的狀態(tài)是"學(xué)習(xí)"時(對于學(xué)習(xí)線程本身的處理,應(yīng)該參照圖30)由線程控制單元U2執(zhí)行的處理。步驟S201至S206表示關(guān)于學(xué)習(xí)線程的循環(huán),并且循環(huán)運行在圖21所示的流程的步驟S152中生成的線程的數(shù)量(也可以執(zhí)行并行處理)。在步驟S202中,從狀態(tài)存儲單元165(見圖16)讀取學(xué)習(xí)線程的當前狀態(tài),并且根據(jù)讀取的值來執(zhí)行"等待狀態(tài)處理"、"加栽狀態(tài)處理"以及"學(xué)習(xí)狀態(tài)處理"之一。隨后將詳細描W目應(yīng)處理的細節(jié)。將給出對流程中的各個步驟的描述。在步驟S201中,線程控制單元112開始線程循環(huán),在將變量"s"(指示對其執(zhí)行控制的線程的線程索引)設(shè)置為8=1的情況下,每當完成一個線程的處理,線程控制單元112就使變量"s"增加1,并JU^步驟S202至S207重復(fù)線程循環(huán)處理,直到s=i。在步驟S202中,線程控制單元112獲取指示具有由變量"s"指示的線程索引的線程的內(nèi)部狀態(tài)的信息,該信息^LM在用于該線程的狀態(tài)存儲單元165中。如果檢測到具有由變量"s"指示的線程索引的線程的狀態(tài)是"等待",則在步猓S203中,線程控制單元112執(zhí)行等待狀態(tài)處理(隨后將參照圖24中的流程圖描述等待狀態(tài)處理),并且處理ii^步驟S206.如果在步驟S202中檢測到具有由變量"s"指示的線程索引的線程的狀態(tài)是"加載",則在步驟S204中,線程控制單元112執(zhí)行加載狀態(tài)處理(隨后將參照圖25中的流程圖描述加載狀態(tài)處理),并且處理進入步驟S206。如果在步驟S202中檢測到具有由變量"s"指示的線程索引的線程的狀態(tài)是"學(xué)習(xí)",則在步驟S205中,線程控制單元112執(zhí)行學(xué)習(xí)狀態(tài)處理,隨后將參照圖26中的流程圖描述學(xué)習(xí)狀態(tài)處理。在完成步驟S203、步驟S204或步驟S205中的處理之后,在步驟S206中,線程控制單元112將變量"s"增加l。然后,當指示對其執(zhí)行控制的線程的線程索引的變量"s"變?yōu)閟=i時,線程控制單元112結(jié)束線程循環(huán)。在步驟S207中,線程控制單元112將在當前幀索引M計數(shù)器151(見圖15)中保存的幀索引增加l,并且結(jié)束線程控制處理,通過這種處理,線程控制單元112可以根據(jù)所有多個線程的狀態(tài)來控制它們。雖然以上描述了線程循環(huán)重復(fù)啟動的線程的數(shù)量i次,但可以執(zhí)行等于線程的數(shù)量i的并行處理,而并非重復(fù)該線程循環(huán).接下來,參照圖24中的$綠圖,給出在23所示的流程圖的步驟S203中執(zhí)行的等待狀態(tài)處理的描述.等待狀態(tài)處理是當在以上參照圖23描述的線程控制處理中與變量"s"相對應(yīng)的線程的狀態(tài)是"等待"時,由線程控制單元112執(zhí)行的處理。在步驟S211中,線程控制單元112將對應(yīng)的線程111的計數(shù)器166(見圖16)增加1。在步驟S212中,線程控制單元112確定對應(yīng)的線程111的計數(shù)器166的值是否小于線程長度(thread一len)。如果在步驟S212中確定計數(shù)器166的值小于線程長度,則等待狀態(tài)處理結(jié)束,并且處理進入到圖23中的步驟S206。如果在步驟S212中確定計數(shù)器166的值不小于線程長度,則在步驟S213中,線程控制單元112向相應(yīng)線程111發(fā)出用于使線程111的狀態(tài)轉(zhuǎn)換到"加載"狀態(tài)的狀態(tài)轉(zhuǎn)換命令.也就是說,線程控制單元112發(fā)出用于使處于以上參照圖18所描述的狀態(tài)轉(zhuǎn)換圖中的"等待"狀態(tài)的線程到"加載"的狀態(tài)轉(zhuǎn)換命令。在步驟S214中,線程控制單元112初始化相應(yīng)線程111的計數(shù)器166(見圖16)(例如,將計數(shù)器166設(shè)置為0),并且在觀測信號開始/結(jié)束定時保存單元167(見圖16)中設(shè)置觀測信號加載開始定時信息(即,在線程控制單元112的當前幀索引M計數(shù)器151(見圖15)中M的當前幀索引),或等同的相關(guān)時間信息等等。然后,線程控制單元112結(jié)束等待狀態(tài)處理,并且進入圖23中的步驟S206.通過這樣的處理,線程控制單元112可以控制處于"等待"狀態(tài)的線程,并且基于線程的計數(shù)器166的值,使線程的狀態(tài)轉(zhuǎn)換到"加載"。接下來,參照圖25中的流程圖,給出在圖23所示的流程圖的步驟S204中執(zhí)行的加栽狀態(tài)處理的描述。該加載狀態(tài)處理是當在以上參照圖23描述的線程控制處理中與變量"s"相對應(yīng)的線程的狀態(tài)是"加栽"時,由線程控制單元112執(zhí)行的處理,在步驟S221中,線程控制單元112將觀測幀X(t)的一幀提供給相應(yīng)線程lll以用于學(xué)習(xí)。該處理對應(yīng)于將觀測信號從線程控制單元提供給各個線程。在步驟S222中,線程控制單元112將相應(yīng)線程111的計數(shù)器166增加l'在步驟S223中,線程控制單元112確定相應(yīng)線程111的計數(shù)器166的值是否小于塊長度(block一len),換句話說,相應(yīng)線程的觀測信號緩沖器161(見圖16)是否已滿。如果在步驟S223中確定相應(yīng)線程111的計數(shù)器166的值小于塊長度,換句話說,相應(yīng)線程的觀測信號緩沖器161未滿,則加載狀態(tài)處理結(jié)束,并且處理進入圖23中的步驟S206。如果在步驟S223中確定計數(shù)器166的值不小于塊長度,換句話說,相應(yīng)線程的觀測信號緩沖器161已滿,則在步驟S224中,線程控制單元112向相應(yīng)線程111發(fā)出用于使線程111的狀態(tài)轉(zhuǎn)換到"學(xué)習(xí)"狀態(tài)的狀態(tài)轉(zhuǎn)換命令,結(jié)束加載狀態(tài)處理,并且進入圖23中的步驟S206。也就是說,線程控制單元112發(fā)出用于使處于以上參照圖18所描述的狀態(tài)轉(zhuǎn)換圖中的"加栽"狀態(tài)的線程到"學(xué)習(xí)"的狀態(tài)轉(zhuǎn)換命令。通過這樣的處理,線程控制單元112可以將觀測信號提供給處于"加載"狀態(tài)的線程,以控制觀測信號的加載,并且基于線程的計數(shù)器166的值,使線程的狀態(tài)從"加載"轉(zhuǎn)換到"學(xué)習(xí)"。接下來,參照圖26中的流程圖,將給出在圖23所示的流程圖的步驟S205中執(zhí)行的學(xué)習(xí)狀態(tài)處理的描述。學(xué)習(xí)狀態(tài)處理是當在以上參照圖23所描述的線程控制處理中與變量"s"相對應(yīng)的線程的狀態(tài)是"學(xué)習(xí),,時,由線程控制單元112執(zhí)行的處理。在步驟S231中,線程控制單元112確定相應(yīng)線程111的學(xué)習(xí)結(jié)^#志168(見圖16)是否為"ON"。如果在步驟S231中確定學(xué)習(xí)結(jié)束標志是"ON",則處理iS^隨后描述的步驟S237。如果在步驟S231中確定學(xué)習(xí)結(jié)束標志不是"ON",也就是說,在相應(yīng)線程中正執(zhí)行學(xué)習(xí)處理,則處理進入步驟S232,在步驟S232中執(zhí)行比較時間的處理。"時間的比較"措的是對學(xué)習(xí)線程111內(nèi)記錄的觀測信號開始時間167(見圖16)與在線程控制單元112中M的和當前分離矩陣相對應(yīng)的加載開始時間154(見圖15)進行比較的處理。如果線程lll中記錄的觀測信號開始時間167(見圖16)早于在線程控制單元112中M的和當前分離矩陣相對應(yīng)的加栽開始時間154,則跳過后續(xù)處理。另一方面,如果線程lll中記錄的觀測信號開始時間167(見圖16)晚于或等于在線程控制單元112中保存的和當前分離矩陣相對應(yīng)的加栽開始時間154,則處理進入步驟S233。在步驟S233中,線程控制單元112將相應(yīng)線程111的計數(shù)器166增加1。接下來,在步驟S234中,線程控制單元112確定相應(yīng)線程111的計數(shù)器166的值是否小于線程長度(仇readjen),如果在步驟S234中確定計數(shù)器166的值小于線程長度,則線程控^單元112結(jié)^^學(xué)習(xí)狀態(tài)處理,并且iiA^圖23中的步驟S206。如果在步驟S234中確定計數(shù)器166的值不小于線程長度,則在步猓S235中,線程控制單元112從計數(shù)器166的值減去預(yù)定值,結(jié)束學(xué)習(xí)狀態(tài)處理,并且i^圖23中的步驟S206。在學(xué)習(xí)期間計數(shù)器的值達到線程長度的情況對應(yīng)于學(xué)習(xí)花費太長時間以致"等待"狀態(tài)的時段不存在的情況。在此情況下,由于學(xué)習(xí)仍然繼續(xù)進行,并且正使用觀測信號緩沖器161,所以不可能開始下一個加栽。因此,直到學(xué)習(xí)結(jié)束,線程控制單元112推遲下一個加載的開始,也就是說,推遲發(fā)出用于使狀態(tài)轉(zhuǎn)換到"加載"狀態(tài)的狀態(tài)轉(zhuǎn)換命令。因此,線程控制單元112從計數(shù)器166的值減去預(yù)定值。雖然待減去的值可以例如是l,但該值可以大于l,例如,如線程長度的10%的值.當?shù)?加載"狀態(tài)的轉(zhuǎn)換被推遲時,加載開始時間的間隔在線程之間變?yōu)闊o規(guī)則的,在最差的情況下,甚至存在在多個線程之間加載基本上相同分段的觀測信號的可能性。當發(fā)生這種情況時,不僅若千線程變得無意義,而且取決于由CPU21執(zhí)行的OS(^Mt系統(tǒng))的多線程實現(xiàn),存在以下可能性隨著多個學(xué)習(xí)處理運行在單個CPU21上,學(xué)習(xí)時間進一步增加,并且間隔變得更加不規(guī)則.為了M這樣的情況,可以調(diào)整其它線程中的等待時間使得加載開始定時的間隔再次變得規(guī)則。該處理在步驟S241中執(zhí)行。1^將描述該等待時間調(diào)整處理的細節(jié)。將給出在當在步驟S231中確定學(xué)習(xí)結(jié)束標志為"ON"時的情況下的處理的描述。每當學(xué)習(xí)線程內(nèi)的學(xué)習(xí)循環(huán)結(jié)束,就執(zhí)行一次該處理.如果在步驟S231中確定學(xué)習(xí)結(jié)束標志為"ON",并且在相應(yīng)線程中學(xué)習(xí)處理已經(jīng)結(jié)束,則在步驟S237中,線程控制單元112將相應(yīng)線程111的學(xué)習(xí)結(jié)束標志168設(shè)置為"OFF",該處理表示用于防止連續(xù)執(zhí)行該分支的操作。此后,線程控制單元112檢查線程的中止標志170(見圖16)是"ON"還是"OFF"。如果中止標志170是"ON",則線程控制單元112在步猓S239中執(zhí)行分離矩陣更新處理,并且在步驟S241中執(zhí)行等待時間設(shè)置處理.另一方面,如果線程的中止標志170(見圖16)是"OFF",則省略步驟S239中的分離矩陣更新處理,并且在步驟S241中執(zhí)行等待時間設(shè)置處理。1^將描述步驟S239中的分離矩陣更新處理和步驟S241中的等待時間i更置處理的細節(jié)。通過這樣的處理,線程控制單元112可以通過參照相應(yīng)線程的學(xué)習(xí)結(jié)束標志168來確定在處于"學(xué)習(xí)"狀態(tài)的線程中學(xué)習(xí)是否結(jié)束。如果學(xué)習(xí)結(jié)束,則線程控制單元112更新分離矩陣W并且設(shè)置等待時間,并且還使線程的狀態(tài)從"學(xué)習(xí)"轉(zhuǎn)換到"等待"或"加載"。接下來,參照圖27中的'M圖,將給出在26所示的流程圖的步驟S239中執(zhí)行的分離矩陣更新處理的描述。這是用于將通過學(xué)習(xí)而求解出的分離矩陣反映在其它模塊上的處理.在步驟S251中,線程控制單元112確定在線程的觀測信號開始/結(jié)束定時保存單元167(見圖16)中保存的觀測信號的開始定時是否早于在觀測信號加栽定時信息保存單元154(見圖15)中保存的與當前分離矩陣相對應(yīng)的加栽開始定時.也就^l^說,如圖7所示,線程l中的學(xué)習(xí)和線程2中的學(xué)習(xí)在時間上部分交疊,在該圖中,學(xué)習(xí)分段77早于學(xué)習(xí)分段78而結(jié)束。然而,例如,取決于每一個學(xué)習(xí)所必需的時間,可能出現(xiàn)學(xué)習(xí)分段78早于學(xué)習(xí)分段77結(jié)束的情況。關(guān)于這點,如果未執(zhí)行步驟S251中的確定,并JL^學(xué)習(xí)結(jié)束較晚的線程推導(dǎo)出的分離矩陣M作最新的分離矩陣,則由通過使用在較早定時從線程2推導(dǎo)出的分離矩陣W2。因此,為了確保使用在較晚定時獲取的觀測信號而獲得的分離矩陣被看作最新的分離矩陣,對在觀測信號開始/結(jié)束定時保存單元167中保存的觀測信號的開始定時和在觀測信號加載定時信息保存單元154中保存的與當前分離矩陣相對應(yīng)的加載開始定時進行比較.如果在步驟S251中確定觀測信號的開始定時早于與當前分離矩陣相對應(yīng)的加載開始定時,換句話說,如果確定基于在比觀測信號加載定時信息M單元154中當前保存的與分離矩陣W相對應(yīng)的定時更早的定時所觀測到的信號,學(xué)習(xí)到作為該線程中的學(xué)習(xí)的結(jié)果而獲得的分離矩陣W,則不使用作為該線程中的學(xué)習(xí)的結(jié)果而獲得的分離矩陣,因此,分離矩陣更新處理結(jié)束。如果在步驟S251中確定觀測信號的開始定時不早于與當前分離矩陣相對應(yīng)的加栽開始定時,也就是說,如果確定基于在比觀測信號加載定時信息保存單元154中當前保存的與分離矩陣W相對應(yīng)的定時更晚的定時所觀測到的信號,學(xué)習(xí)到作為該線程中的學(xué)習(xí)的結(jié)果而獲得的分離矩陣W,則在步驟S252中,線程控制單元112獲取通it^相應(yīng)線程中學(xué)習(xí)而獲得的分離矩陣W,將分離矩陣W提供給分離矩陣保存單元113(見圖12),并且i殳置分離矩陣W。58在步驟S253中,線程控制單元112設(shè)置在學(xué)習(xí)初始值保存單元152中M的在線程的每一個中的學(xué)習(xí)的初始值。具體地說,作為學(xué)習(xí)初始值,線程控制單元112可以設(shè)置通it^相應(yīng)線程中學(xué)習(xí)而獲得的分離矩陣W,或者可以設(shè)置與分離矩陣W不同的值,該值是通過使用由在相應(yīng)線程中學(xué)習(xí)而獲得的分離矩陣W來計算出的.例如,在應(yīng)用重新調(diào)節(jié)之后獲得的值(在隨后描述的圖32的流程的步驟S320中的"后處理"之后所獲得的值)被代入分離矩陣保存單元113(見圖12),而在應(yīng)用重新調(diào)節(jié)之前的值被代入學(xué)習(xí)初始值保存單元152。隨后將在修改部分中描述其它示例。在步驟S254中,線程控制單元112將在相應(yīng)線程的觀測信號開始/結(jié)束定時保存單元167(見圖16)中保存的定時信息設(shè)置在加栽定時信息保存單元154(見圖15)中,并且結(jié)束分離矩陣更新處理.通過步驟S254中的處理,提供有關(guān)如下情況的指示祁4t什么時間分段中的觀測信號學(xué)習(xí)到了當前正使用的分離矩陣W,即,在分離矩陣保存單元113中所保存的分離矩陣W。通過這樣的處理,將從在較晚定時獲取的觀測信號所獲得的分離矩陣設(shè)置為最新的分離矩陣。接下來,參照圖28中的流程圖,將給出在26所示的流程圖的步驟S241中執(zhí)行的等待時間設(shè)置處理的描述。在步驟S281中,線程控制單元112計算剩余等待時間。具體地說,令rest表示剩余等待時間(幀數(shù)量),Ct表示在規(guī)劃加載開始定時指定信息保存單元153(見圖15)中保存的規(guī)劃的加載開始定時(幀索引或?qū)?yīng)的相關(guān)時間),F(xiàn)t表示在當前幀索引M計數(shù)器151中保存的當前幀索引,并且block一shift表示塊偏移寬度.然后,線程控制單元112如下計算剩余等待時間rest=Ct+block一shift-Ft,也就是說,由于Ct+blocl^shift意味著規(guī)劃的下一加載開始時間,因此通itA其減去Ft,求解出"直到規(guī)劃的下一加栽開始時間的剩余時間"。在步驟S282中,線程控制單元112確定計算出的剩余等待時間rest是否為正數(shù)值。如果在步驟S282中確定計算出的剩余等待時間rest不是正數(shù)值,也就是驟S286。如果在步驟S282中確定計算出的剩余等待時間rest是正數(shù)值,則在步驟S283中,線程控制單元112向相應(yīng)線程發(fā)出用于使線程的狀態(tài)轉(zhuǎn)換到"等待"狀態(tài)的狀態(tài)轉(zhuǎn)換命令。在步驟S284中,線程控制單元112將相應(yīng)線程的計數(shù)器166(見圖16)的值設(shè)置為threadjen-rest。因此,"等待"狀態(tài)繼續(xù)直到計數(shù)器的值達到thread-len。在步驟S285中,線程控制單元112將block—shift的值與在規(guī)劃加載開始定時指定信息保存單元153(見圖15)中保;的值Ct相加,也就是說,將Ct+block—shift的值設(shè)置為在規(guī)劃加載開始定時指定信息保存單元153中的下一個;栽開始定時,并且結(jié)束剩余等待時間計算處理。如果在步驟S282中確定計算出的剩余等待時間rest不是正數(shù)值,也就是說,計算出的值是零或負數(shù)值,則這意味著即^^劃加栽開始定時已過去也未開始加載,從而必須立即開始加載.因此,在步驟S286中,線程控制單元112向相應(yīng)線程發(fā)出用于使線程的狀態(tài)轉(zhuǎn)換到"加載"狀態(tài)的狀態(tài)轉(zhuǎn)換命令。在步驟S287中,線程控制單元112對計數(shù)器的值進行初始化(例如,將計數(shù)器設(shè)置為0)。在步驟S288中,線程控制單元112在加載開始時間指定信息保存單元153中i殳置下一個加載開始定時(即,指示當前幀索引的Ft),并且結(jié)束剩余等待時間計算處理。通itil樣的處理,根據(jù)每個線程中的"學(xué)習(xí)狀態(tài)"所必需的時間,可以設(shè)置每個線程要處于"等待"狀態(tài)中的時間,根據(jù)本發(fā)明的實施例,線程控制單元和每個學(xué)習(xí)線程并行地操作,并且學(xué)習(xí)線程基于與用于線程控制單元的流程圖不同的流程圖來運行。下面,將參照圖29中的流程圖描述學(xué)習(xí)線程中的處理。在步驟S291中對線程lll進行初始化。然后,在步驟S292中,線程111等待直到事件發(fā)生(塊處理)。(這種"等待"與表示學(xué)習(xí)線程的一種狀態(tài)的"等待,,不同)。當執(zhí)行了以下動作之一時,事件發(fā)生。.發(fā)出了狀態(tài)轉(zhuǎn)換命令。,傳遞了幀數(shù)據(jù)。,發(fā)出了結(jié)束^^令。根據(jù)發(fā)生哪個事件對后續(xù)處理進行分支(步驟S293)。也就是說,根據(jù)從線程控制單元112輸入的事件,對后續(xù)處理進行分支。如果在步驟S293中確定輸入了狀態(tài)轉(zhuǎn)換命令,則在步驟S294中執(zhí)行相應(yīng)的命令處理。如果在步驟S293中確定接收到幀數(shù)據(jù)傳遞事件的輸入,則在步驟S295中,線程111獲取傳遞數(shù)據(jù)。接下來,在步驟S296中,線程111將獲取的幀數(shù)據(jù)加載到觀測信號緩沖器161(見圖16)中,返回到步驟S292,并且等待下一個事件.觀測信號緩沖器161(見圖16)具有數(shù)組或堆棧結(jié)構(gòu),并且觀測信號將被存儲在與計數(shù)器相同索引的位置中.如果在步驟S293中確定輸入了結(jié)束命令,則在步驟S297中,線程lll執(zhí)行例如適當?shù)念A(yù)終止處理(例如存儲器的清空),并且結(jié)束處理。通過這樣的處理,基于線程控制單元112進行的控制在每個線程中執(zhí)行處理'接下來,參照圖30中的$綠圖,給出在圖29所示的流程圖的步驟S294中執(zhí)行的命令處理的描述。在步猓S301中,根據(jù)所提供的狀態(tài)轉(zhuǎn)換命令,線程111對后續(xù)處理處理進行分支。在下面的描述中,指示"轉(zhuǎn)換到XX狀態(tài)"的命令將M示為"狀態(tài)轉(zhuǎn)換命令4XX'"。在步驟S301中,如果所提供的狀態(tài)轉(zhuǎn)換命令是指示轉(zhuǎn)換到"等待"狀態(tài)的"狀態(tài)轉(zhuǎn)換命令'等待,",則在步猓S302中,線程lll將指示當前狀態(tài)是"等待"的信息存儲在狀態(tài)存儲單元165(見圖16)中,即狀態(tài)轉(zhuǎn)換到"等待",并且結(jié)束命令處理。在步驟S301中,如果所提供的狀態(tài)轉(zhuǎn)換命令是指示轉(zhuǎn)換到"加載"狀態(tài)的"狀態(tài)轉(zhuǎn)換命令'加載,",則在步驟S303中,線程lll將指示當前狀態(tài)是"加載"的信息存儲在狀態(tài)存儲單元165中,即狀態(tài)轉(zhuǎn)換到"加載",并且結(jié)束命令處理。在步猓S301中,如果所提供的狀態(tài)轉(zhuǎn)換命令是指示轉(zhuǎn)換到"學(xué)習(xí)"狀態(tài)的"狀態(tài)轉(zhuǎn)換命令"學(xué)習(xí)"",則在步驟S304中,線程lll將指示當前狀態(tài)是"學(xué)習(xí)"的信息存儲在狀態(tài)存儲單元165中,即狀態(tài)轉(zhuǎn)換到"學(xué)習(xí)"。此外,在步猓S305中,線程111執(zhí)行分離矩陣學(xué)習(xí)處理。隨后將給出該處理的細節(jié)。在步驟S306中,為了向線程控制單元112通知學(xué)習(xí)結(jié)束,線程111將學(xué)習(xí)結(jié)束標志168設(shè)置為"ON",并且結(jié)束處理。通過設(shè)置該標志,線程111向線程控制單元112通知學(xué)習(xí)剛結(jié)束。通過這樣的處理,基于從線程控制單元112提供的狀態(tài)轉(zhuǎn)換命令,使每個線程的狀態(tài)轉(zhuǎn)換。接下來,參照圖31中的流程圖,將給出作為在圖30所示的流程圖的步驟S305中執(zhí)行的處理的示例的分離矩陣學(xué)習(xí)處理的示例的描述。這是一種求解分離矩陣的成批處理,并且適用于批處理形式的任何算法。然而,必須采用相對而言無置換的方案。下面,給出采用在日本專利申請No.2005-018822"AUDIOSIGNALSEPARATINGAPPARATUS/NOISEREMOVALAPPARATUSANDMETHOD"中公開的配置的示例的描述.在步驟S311中,根據(jù)需要,線程111的學(xué)習(xí)計算單元163(見圖16)對在觀測信號緩沖器161中加栽的觀測信號執(zhí)行預(yù)處理.具體地說,學(xué)習(xí)計算單元163對在觀測信號緩沖器161中加載的觀測信號執(zhí)g如規(guī)范化或不相關(guān)(或預(yù)白化)等的處理。例如,當執(zhí)行規(guī)范化時,學(xué)習(xí)計算單元163求解觀測信號緩沖器161內(nèi)的觀測信號對于每個頻率窗口的標準差,并且在由標準差的倒數(shù)所形成的對角線矩陣被定義為S的情況下,學(xué)習(xí)計算單元163推^據(jù)以下等式[9.1]計算X,=SX。對)=鄉(xiāng))[9.1],=^'(0……[9.2]4(w):argminfel^(份,f)-4(w)^^M〗2]1……[9,4]—[951/=diag(ft(l)...A(r)l…l義"(1).........[9.6]在等式X,=SX中示出的X表示由觀測信號緩沖器161內(nèi)的所有幀的62觀測信號所形成的矩陣。這被表述為通it^橫向方向上針對t=l至N排列在等式[9.1中示出的X(t)而獲得的矩陣,即X=[X(l),...,X(T)I(T是頓的總數(shù),即塊長度block一len)。在后續(xù)等式中出現(xiàn)的X也可以表示X',對X,執(zhí)行了預(yù)處理。等式[9.21是乂,、分離矩陣W以及分離結(jié)果Y的關(guān)系表達式.在對隨后描述的步驟S320的后處理中的重新調(diào)節(jié)處理進行描述期間將描述等式[9.31及以下的等式。在步驟S312中,學(xué)習(xí)計算單元163從線程控制單元112獲取在線程控制單元112的學(xué)習(xí)初始值保存單元152中保存的學(xué)習(xí)初始值W,作為分離矩陣的初始值。從步驟S313至S319的處理表示學(xué)習(xí)循環(huán),這些處理被重復(fù)直到W收斂或者直到中止標志變?yōu)?ON"。中止標志是在上述圖26的學(xué)習(xí)狀態(tài)處理流程的步驟S236中被設(shè)置為"ON"的標志。當較晚開始的學(xué)習(xí)比較早開始的學(xué)習(xí)結(jié)束更早時,中止標志變?yōu)?ON"。如果在步驟S313中確定中止標志為"ON",則處理結(jié)束。如果在步驟S313中確定中止標志為"OFF",則處理進入步驟S314。在步驟S314中,學(xué)習(xí)計算單元163確定分離矩陣W的值是否已收斂。通過使用例如矩陣范數(shù)來確定分離矩陣W的值是否已收斂.計算作為分離矩陣W的范數(shù)(所有矩陣元素的平方和)的IIWH以及作為AW的范數(shù)的||AW||,如果這兩個范數(shù)之間的比率IIAW固WII小于預(yù)定值(例如1/1000),則確定W已收斂?;蛘撸梢曰谘h(huán)是否運行了預(yù)定次數(shù)(例如50次)來簡單地進行確定。如果在步驟S314中確定分離矩陣W的值已收斂,則處理i^隨后描述的步寐S320(其中執(zhí)行后處理),并且處理結(jié)束。也就是說,執(zhí)行學(xué)習(xí)處理循環(huán)直到分離矩陣W收斂。如果在步驟S314中確定分離矩陣W的值未收斂(或者如果執(zhí)行循環(huán)的次數(shù)未達到預(yù)定值),則處理進入步驟S315至步驟S319中的學(xué)習(xí)循環(huán)。對于所有頻率窗口,學(xué)習(xí)被執(zhí)行作為迭代上述等式[4.1]至[4.3的處理。也就《」說,為了求解分離矩陣W,對等式[4.11至[4.3]進行迭代直到分離矩陣W收斂(或迭代預(yù)定次數(shù))。這種迭代被稱作"學(xué)習(xí)"。由等式[4.41來表示分離結(jié)果Y(t)。步驟S316與等式[4.1對應(yīng)。步驟S317與等式[4.2對應(yīng)。步驟S318與等式[4.3對應(yīng)。由于要對每個頻率窗口計算等式[4.1至[4.3,所以通過在步驟S315和S319中針對頻率窗口運行循環(huán),求解出所有頻率窗口的AW,在上述循環(huán)處理結(jié)束之后,處理返回步驟S313以執(zhí)行關(guān)于中止標志的確定,并且在步驟S314中確定分離矩陣的收斂性。如果中止標志為"ON",則處理結(jié)束。如果在步驟S314中確認了分離矩陣的收斂性(或達到了循環(huán)的指定數(shù)量),則處理ii^步驟S320。在步驟S320中,以下處理祐^執(zhí)行作為后處理。(1)使分離矩陣與在規(guī)范化之前的觀測信號相對應(yīng)。(2)調(diào)整頻率窗口之間的平衡(balance)(重新調(diào)節(jié))。首先,將給出(1)使分離矩陣與在規(guī)范化之前的觀測信號相對應(yīng)的處理的描述。在執(zhí)行了規(guī)范化作為預(yù)處理的情況下,通過上述處理(圖31中的步驟S315至S319)求解出的分離矩陣W不等同于通過分離在規(guī)范化之前的觀測信號X所獲得的分離矩陣,而是通過分離在規(guī)范化之后所獲得的觀測信號X,來獲得的分離矩陣。因此,通過上述處理求解出的分離矩陣W被校正以便變換為等同于通過分離在規(guī)范化之前的觀測信號X所獲得的分離矩陣。具體地說,通過使用在規(guī)范化時應(yīng)用的矩陣S,可以執(zhí)行校正使得W仨WS。接下來,將給出(2)調(diào)整頻率窗口之間的平衡(balance)(重新調(diào)節(jié))的處理的描述。取決于ICA算法,在某些情況下,分離結(jié)果Y的頻率窗口之間的平衡(比例)不同于源信號的期望平衡。在此情況下,在后處理中校正頻率窗口的比例。因此,校正被稱為重新調(diào)節(jié).通過以下處理來執(zhí)行重新調(diào)節(jié)求解在等式[9.3中包含的校正矩陣R,等式[9.3表示為以上參照預(yù)處理(步驟S311)(例如對觀測信號X的規(guī)范化)描述的等式[9.1]的擴展形式,使月等式[9.61,然后將分離矩陣W乘以校正矩陣R(等式[9.6]中的diag(O表示在其對角線上具有給定矢量的對角線矩陣)。也就是通過等式[9.5來計算。(Et[表示塊內(nèi)所有幀的均值。)可以如在等式[9J中那樣概括以上兩個校正。因此,作為組合這兩個校正的后處理,可以執(zhí)行校正W<~RWS。通過這種處理,分離矩陣學(xué)習(xí)處理結(jié)束(28-11)。在步驟S317中,雖然等式4.2被用作基于自然梯度方法的等式,替選地,也可以使用代表基于被稱為"通過獨立性的等變自適應(yīng)分離"(EASI)的算法的學(xué)習(xí)規(guī)則的等式[4.13。EASI算法的等式具有組合梯度方法和不相關(guān)的形式,并且特征在于,收斂比基于自然梯度方法的等式[4.2更快。關(guān)于EASI算法本身的細節(jié),應(yīng)該參照"ExplanationofIndependentComponentAnalysis"(TokyoDenkiUniversityPress)中的部分"12.5Equi-variantAdaptiveSeparationviaIndependence"等等。雖然在等式[4.13中出現(xiàn)包含Et[的三項,但可以通過下面的等式變換來減少復(fù)雜度,作為笫一項的Et[Y(叫t)Y(叫t)H]可以變換為等式[4.14。在開始時僅計算一次等式[4.14中的Et[X(叫t)X(叫t)H](例如,在步驟S311中計算),這是由于等式[4.14]中的Et[X(叫t)X(叫t)H在循環(huán)內(nèi)是不變的,并且在循環(huán)內(nèi),只需執(zhí)行從左邊和右邊將EtX(幼,t)X((D,t)H乘以W((D)和W((D)H的運算。另一方面,第三項Et[Y(叫t)(KY(t))H可以變換為等式4.15。這說明,也可以通過在計算第二項之后執(zhí)行厄密轉(zhuǎn)置來獲得第三項.此外,EASI算法的特性使得在收斂時Et[Y(叫t)Y(叫t)H]=1成立。也就是說,Et[IYk(叫t)l2=1對于Et[Y(叫t)Y(叫t)H的正交元素成立,而Et[IYk(叫t)f]^對于其它元素成立,通過利用這種特性,當在循環(huán)內(nèi)調(diào)整W(o)的比例以便滿足Et[IYk(叫t)l"-l時,可以使收^UUL更快。具體地說,在執(zhí)行步驟S316之后,針對Y(ffl,t)執(zhí)行等式[4.16的運算,并且針對W((D)執(zhí)行等式[4.17的運算。應(yīng)該注意,diag()表示正交矩陣,括號中給出其對角線分量。通過執(zhí)行這些運算,在較小數(shù)量的循環(huán)內(nèi)Et[Y(叫t)Y(cM)111=1就成立。接下來,將參照圖32和圖33中的流程圖給出在圖19所示的流程圖的步驟S109中執(zhí)行的聲源方向估計處理的描述'這種聲源方向估計處理在圖12所示的聲源方向估計單元125中執(zhí)行。如上所述,在本發(fā)明實施例中,執(zhí)行以下處理在包含當前時間的分段中,在觀測信號與分離結(jié)果之間計算互協(xié)方差矩陣,并且通過使用該互協(xié)方差矩陣而不是分離矩陣來計算聲源方向.互協(xié)方差矩陣Sxv(O))由上述65等式[6.1來表示。圖32所示的流程圖與上述圖13中的處理相對應(yīng)。也就是說,該流程圖表示在當根據(jù)觀測信號X和分離結(jié)果Y計算互協(xié)方差矩陣(等式[6.1)時的情況下的處理流程.圖33所示的流程圖與上述圖14中的處理相對應(yīng)。也就是說,該流程圖表示在當根據(jù)觀測信號X和分離矩陣W計算互協(xié)方差矩陣(等式[6.51)時的情況下的處理流程。首先,參照圖32中的流程圖,給出在采用根據(jù)觀測信號和分離結(jié)果來計算互協(xié)方差矩陣的方案的情況下聲源方向估計處理序列的描述.該處理表示與以上參照圖13所描述的配置相對應(yīng)的處理序列。首先,在步驟S321中,更新觀測信號與分離結(jié)果之間的互協(xié)方差矩陣。具體地說,通過使用以下四個矢量從傅立葉變換單元126(見圖12)接收到的觀測信號X(叫t)、從分離單元127接收到的分離結(jié)果Y(叫t)、從觀測信號緩沖器133(見圖13)接收到的觀測信號X(o,t-L)、以及從分離結(jié)果緩沖器134接收到的分離結(jié)果Y(叫t-L),根據(jù)上述等式[6.10來計算互協(xié)方差矩陣ZxY(o).對于所有頻率窗口(co=l,...,M)執(zhí)行該處理。接下來,在步驟S322中,將觀測信號X(t)存儲在觀測信號緩沖器133(見圖13)中.此時,X(t)改寫存儲了X(t-L)的區(qū)域。接下來,在步驟S323中,類似地,將分離結(jié)M儲在分離結(jié)果緩沖器134中,接下來,執(zhí)行以下處理步稞S324中的相位差計算;步驟S325中的直線擬合處理;和步猓S326中的聲源方向計算.雖然可以以逐幀為^來執(zhí)行從步驟S324到S326的這些處理,^決于預(yù)期的應(yīng)用,執(zhí)行這些處理的頻率可以;l每若千幀一次。當跳過這些處理時,聲源方向估計處理結(jié)束。步猓S324中的相位差計算是針對所有通道和所有麥克風對生成圖IOA和圖IOB所示的圖線的處理。隨后將給出該處理的細節(jié)。例如,步驟S325中的直線擬合處理《_針對圖IOA和圖IOB所示的圖線在每一點對相位角進行展開的同時求解最佳擬合直線的處理?;蛘?,如圖11C和圖11D所示,直線擬合處理也是針對該圖線求解最佳擬合的余弦和正弦曲線的處理。隨后將給出該處理的細節(jié)。作為直線擬合的結(jié)果,例如,從圖35所示的相位角的圖線獲得圖41所示的直線.在圖41中,由虛線表示由直線擬合而獲得的每條直線。在圖中,為了清楚M示直線,每條直線M制為伸出圖線示意圖的左右或上下。作為直線擬合的結(jié)果,估計上述等式[8.3中的hat(Kirak)作為直線的斜率。最后,在步驟S326中,根據(jù)hat(K^k)計算每個聲源的聲源方向,隨后也將給出該處理的細節(jié),接下來,將參照圖33中的流程圖描述聲源方向估計處理的另一處理示例。圖33中的流程表示用于根據(jù)觀測信號的協(xié)方差矩陣和分離矩陣的厄密轉(zhuǎn)置來計算互協(xié)方差矩陣的方案。該處理與以上描述的圖14中的配置相對應(yīng)。首先,在步驟S331中,更新觀測信號的協(xié)方差矩陣。具體地說,通過使用從傅立葉變換單元126(見圖12)接收到的觀測信號x(叫t)以;s^觀測信號緩沖器133(見圖13)提取的時間上超前的觀測信號X(叫t-L),根據(jù)上述等式[6.11的運算來計算協(xié)方差矩陣5:xY(a))。針對所有頻率窗口(to=l,…,M)執(zhí)行該處理。接下來,在步驟S332中,將觀測信號X(t)存儲在觀測信號緩沖器143(見圖14)中。那時,X(t)改寫存儲了X(t-L)的區(qū)域。接下來,在步驟S333中,計算互協(xié)方差矩陣.具體地說,通過4吏用在步驟S331中更新的協(xié)方差矩陣2xv(co)以及在學(xué)習(xí)處理單元110的分離矩陣保存單元113中保存的最新分離矩陣W((O),根據(jù)上述等式[6,5I的運算來計算互協(xié)方差矩陣SxY(O))。針對所有頻率窗口(=1,.",M)執(zhí)行該處理。接下來,執(zhí)行以下處理步驟中S334的相位差計算;步驟中S335的直線擬合處理;和步驟中S336中的聲源方向計算.雖然可以以逐幀為^Rll來執(zhí)行從步驟S334到S336的這些處理,決于預(yù)期的應(yīng)用,執(zhí)行這些處理的頻率可以^1每若干幀一次。當跳過這些處理時,聲源方向估計處理結(jié)束。接下來,參照圖34A和圖34B中的流程圖,給出在圖32的$綠圖的步驟S324中以及在圖33的流程圖的步驟S334中的"相位差計算"的詳細描述。在步驟S341中,根據(jù)需要確保用于存儲結(jié)果的區(qū)域。步驟S342至S348表示針對頻率窗口的循環(huán)。在使頻率窗口cd^1變化到M的同時,重復(fù)步驟S343至S347。(然而,應(yīng)該注意,當所H吏用的系統(tǒng)能夠并行處理時,可以執(zhí)行并行處理。這對以下描述中的通道循環(huán)或麥克風對循環(huán)同樣適用)。步驟S343至S347表示針對通道(估計的聲源,即分離結(jié)果)的循環(huán).例如,如M在四個通道,則針對從通道l至通道4的所有通道重復(fù)循環(huán)。步驟S344至S346表示針對麥克風對的循環(huán)。如果兩個麥克風的索引是i和m,則從(i,m)=(1,2)到(i,m)=(n國l,n),循環(huán)執(zhí)行n(n國1)/2次。該循環(huán)也可以表示為如i圖34B所示的步驟S351至354中的雙循環(huán)。在循環(huán)內(nèi)部,根據(jù)上述等式8.1計算互協(xié)方差矩陣2xv的元素CTik(Q))與amk(eo)之間的比率,并且將計算出的元素比率存儲在步驟S341中確保的區(qū)域中。根據(jù)需要,除了元素比率之外,還根據(jù)等式[8.9計算元素比率的相位角。當針對所有麥克風對、所有通道和所有頻率窗口執(zhí)行了這些運算時,相位差的計算完成。雖然在圖34A和圖34B的流程圖中針對所有:l^風組合執(zhí)行麥克風對循環(huán),但替選地,可以僅針對有限的麥克風對執(zhí)行麥克風對循環(huán).例如,可以僅針對n國l對((i,m)=(1,2),(2,3),""(n國l,n))或((1,2),(1,3),…,(l,n))執(zhí)行麥克風對循環(huán),如果在多個麥克風之中混合了具有標識和未標識的位置或間距的麥克風,則可以僅針對具有標識的麥克風間距的那些麥克風對;fM^行循環(huán)。此外在出現(xiàn)在以下描述的流程圖中的"麥克風對循環(huán)"情況下,可以針對有限對的麥克風執(zhí)行循環(huán)。在該流程中描述的相位差計算例如是針對所有通道和所有麥克風對生成圖IOA和圖IOB所示的圖線的處理.例如,如果麥克風數(shù)量是四,并且通道數(shù)量是四,則作為圖34A和圖34B所示的流程的處理結(jié)果,生成圖35所示的數(shù)據(jù)。圖35所示的數(shù)據(jù)表示24個圖,其中,設(shè)置了作為多個估計聲源的通道1至4相對于從四個麥克風(麥克風1至4)中選擇的兩個麥克風的六種組合(麥克風l和2、l和3、l和4、2和3、2和4、以及3和4)的圖線。在這些圖中,針對從互協(xié)方差矩陣計算出的ri她((D)繪制相位角.垂直軸表示頻率窗口(D,而水平軸表示相位角。點基本上線性排列。如以上參照圖IOA和圖IOB所述,由于^2tc的范圃內(nèi)(在該圖中,-Tt到TC)可以標識相位角angle(),所以在-7cf!]7i之間存在值的"跳變"。接下來,參照圖36中的流程圖,將給出在圖32的流程圖的步驟S325中以及在圖33的流程圖的步驟S335中的"直線擬合"的詳細描述。圖36所示的流程圖是示意圖,并JL^示在步驟S363至S365中針對所有麥克風對(與圖35中的垂直方向相對應(yīng)),并JJ^在步驟S362至S366中針對所有通道(與圖35中的水平方向相對應(yīng)),執(zhí)行在步驟S364中針對單個圖線(例如,圖35所示的單塊圖線數(shù)據(jù)351)的擬合處理。雖然可想到作為用于在步驟S364中執(zhí)行擬合處理的算法的各種算法,但此處,將給出以下三種的描述。(1)遞歸方法(2)線性搜索方法(3)混合方法以下提供相應(yīng)技術(shù)的描述。(1)遞歸方法遞歸方法是這樣的方案從低頻率窗口開始按順序地在對由上述等式[8.9表示的相位角Otak(ra)進行展開的同時求解斜率Ktok,將參照圖37和圖38描述遞歸的細節(jié)。圖37是示出按照遞歸方法執(zhí)行的(直線)擬合處理的序列的流程圖.在圖37所示的流程中,Kimk是不僅存儲最^h率而且還^斜率的中間處理值的變量。在步驟S371中,預(yù)先將適當?shù)某跏贾荡胄甭蔏imk.初始值可以是0,這與在圖IOA和圖10B以及圖35的情況下的垂直定向的直線相對應(yīng)。如果保存了在前一幀中獲得的斜率,則也可以使用該斜率。步驟S372至S376表示頻率窗口循環(huán)。然而,由于作為直流分量的在=1處的相位角被固定為0,所以循環(huán)從=2開始。步驟S373至S375是遞歸處理。也就是說,在通過使用頻率窗口2至0^1中的相位角求解Ktak的值(中間處理階段的值)的狀態(tài)下,在展開第69Q)頻率窗口中的相位角的同時更新Kimk的值。步驟S373表示通過頻率窗口2至(O"l擬合出的直線(圖38中的直線401)延伸到笫co頻率窗口(圖38中的點P402)。直線所延伸到的點由大寫字母P表示,而其相位角由小寫字母p表示.步驟S374中的展開是以上參照圖IOA和圖IOB描述的從圖IOA到圖10B的變換處理。也就是說,展開^:在頻率窗口#2Ntc(N是整數(shù))加到相位角O^k((0)以使得相位角變得最大程度地接近于點P的處理.具體地說,可以在求解滿足以下等式[10.1的N值之后執(zhí)行等式[1(U的運算?!?argminl^(必)+2漸-(<-……[10.1]在圖38中,在展開之前的相位角Oi她(ro)^^示為點[Oimk(a))(舊)I403,而在展開之后的相位角^^示為點[Otak((0)(新)404。接下來,在步驟S375中,斜率K滅被更新,同時反映在展開之后獲得的相位角Otak((D)的值(圖38中的直線405)。對于該更新,例如,使用上述等式[10.3至[10.5]之一。等式[10.3表示針對展開后的相位角Oimk(2)至aimk(幼)分別計算斜率,然后取均值.然而,應(yīng)該注意,如果=2,則S的部分為0。通過使用在更新之前的斜率Kimk,還可以通過下式來近似等式[10.3中的i:的部分(■2)xKimk.結(jié)果,獲得了等式[10.4。由于在等式[10.4的實現(xiàn)中sigma的循環(huán)(總和)是不必要的,因此等式10.4的復(fù)雜度小于等式[10.3的復(fù)雜度。等式[10.3和等式[10.4]的特征在于,當co^小時,Ki她的值變化很大,而隨著co變得越大,K她變化越小,因此,在步築S371中代入的初始值沒有很大程度地反映在Kimk的最終值上'因此,在期望初始值顯著反映在最終值上的情況下(例如,在遞歸方法被用作(3)中的混合方案的一部分的情況下,或者在前一幀中求解出的斜率被用作初始值的情況下),使用等式[10.5,而非等式10.4.在等式[10,5中,P是大于l的值,P的值越大,斜率Ktak離初始值的變化M小.當重復(fù)步驟S372至S376直到co=M(M是頻率窗口的總數(shù))時,相位角的展開完成,并且當時斜率Ktak的值是擬合出的直線的斜率.頻率窗口循環(huán)可以是中止的中間處理,在此情況下,可以實現(xiàn)復(fù)雜度的相應(yīng)減少.例如,在已知聲源全是人類語音的情況下,循環(huán)可以M行在與語音頻帶相對應(yīng)的頻率范圍內(nèi)。在退出循環(huán)時,在步驟S377中,根據(jù)上述等式8.5來計算擬合誤差,該值用于上述圖33的流程的步驟S336中的聲源方向計算等等。遞歸方法具有以下優(yōu)點。1)在最大M次迭代中完成處理。2)有效地利用了"在低頻率窗口處相位角中不出現(xiàn)'跳變,"的特性。然而,另一方面,在例如當在低頻率窗口處相位角中存在很多誤差(存在很多偏離直線的點)時,或者當斜率的最終值顯著地偏離初始值時的情況下,存在直線擬合失敗(直線被沿無關(guān)方向繪制)的可能性.(2)線性搜索方法接下來,將參照圖39所示的流程圖描述作為另一直線擬合算法的線性搜索,在該處理中,在將斜率Ki她的值從在步驟S381中設(shè)置的最小值K曲逐漸變化到預(yù)設(shè)的最大值Km^的同時,根據(jù)上述等式[8.51來計算擬合誤差,并且求解出使誤差最小的斜率K^k的值以及所述誤差最小值。根據(jù)以下等式[11.1求解出作為斜率設(shè)置范圍最大值的Ktoax。在當聲音從麥克風對的一側(cè)橫向垂直地(e=w2)到達時的情況下,該值等于頻率窗口(D=2中的相位差。雖然可以使d的值與麥克風i和麥克風m之間的距離dta—致,但通??梢允褂名溈孙L間距的最大值。此外,代替使用麥克風間距本身,也可以使用稍微更大的值(例如乘以1.1倍的值)??梢詫⒆鳛樾甭试O(shè)置范圍最小值的Kmin設(shè)置為Kmin—"Kmax該值對應(yīng)于在當聲音從e=-ji/2的方向到達時的情況下的相位差。作為Kimk的增量的AK(見步驟S386)是相對較小的正數(shù)值。例如,使用以下值(Kmax畫K咖)/1000首先,在步驟S381中,如下設(shè)置作為變量的初始值。擬^^誤差errimk-無窮斜率K=Kmin在步驟S382中,檢查K是否超過最大值(Kmax),如果K超過最大值,則處理結(jié)束。如果在步驟S382中,K;^過最大值(Kmax),則在步驟S383中,計算在設(shè)置的角度檢測到的擬合誤差err。通過上述等式[8.5來計算擬合誤差.在步驟S384中,對計算出的擬合誤差err與所保存的擬合誤差errimk互相比較,如果計算出的擬合誤差err大于所M的擬合溪差errimk,則處理進入步驟S386,并且更新角度。如果計算出的擬M差err不大于所M的擬合溪差errimk,則處理進入步驟S385,在步驟S385中由^Hit后的角度K更新作為變量的角度Kimk,并且由計算出的誤差err更新擬合誤差err滅。此后,處理ii^步驟S386,并且更新mt后的角度。此外,針對更新后的角度K重復(fù)從步驟S382向前的處理,在這種線性搜索方法中,在最優(yōu)解的復(fù)雜度與準確度之間存在折衷。也就是說,雖然Ktak的準確度隨著AK的值變得更接近O而得以改進,但復(fù)雜度增加。(3)混合方法72接下來,將給出基于結(jié)合遞歸方法和線性搜索方法的混合方法的直線擬合處理的描述。^IL據(jù)這種混合處理,首先,通過使用相對較大的AK值來執(zhí)行粗線性搜索,然后通過使用由該線性搜索獲得的比例因子作為初始值來執(zhí)行遞歸。在該混合方法中,圖36的流程的步驟S364中的擬合處理被粗略劃分為兩個步驟。首先,執(zhí)行以上參照圖39描述的線性搜索,然后通過使用由該線性搜索求解出的斜率Kimk作為初始值來執(zhí)行在圖37的流程中所示的遞歸.下文中,將給出該混合方法如何不同于獨立執(zhí)行線性搜索方法和遞歸方法的描述。在該混合方法中,通過以下等式[12.1和等式12.2]來求解出斜率設(shè)置范圍的最大值K咖x的值。<formula>formulaseeoriginaldocumentpage73</formula>在以上等式[12.11中,floor()表示舍去小數(shù)(取整).由于在加上I/2之后完成舍去,所以這等同于對dF/C的小數(shù)進行四舍五入,在以下設(shè)置的情況下最大麥克風間距-0.15[m,采樣頻率F-16000[Hz,以及聲速C-340[m/sl,獲得的解為N-7。對于K,wn,如在上述(2)線性搜索方法的情況下那樣,K,被,沒置為接下來,通過上述等式[12.3來計M在圖39的步驟S386(其被描述為線性搜索方法的流程)中被采用的斜率增量[AKI。也就是說,在包括-tcN/(M—1),-tu(N—1)/(M—1),"0,.."兀(N-1)/(M—1)和tcN/(M—l)的2N+1種斜率之中搜索最優(yōu)值。例如,要被設(shè)置的2N+1種斜率與圖40所示的各直線411至417對應(yīng).用于斜率增量的計算等式被給出如下。AK=tc/(M-1)該值是重要的。如果AK大于該值,則后續(xù)的遞歸處理可能無法求解出真正最優(yōu)值.如果AK小于該值,則在線性搜索中出現(xiàn)冗余處理。以下描^于該情況的原因。基于等式[10.1和等式10.2執(zhí)行相位差圖線的展開,由于等式[10.1中的N是整數(shù),因此即使斜率Kimk的值在:bc/((D-1)的范圍內(nèi)改變,N的值也變?yōu)橄嗤?,并且獲得相同的展開結(jié)果。也就是說,即使Kimk的值在小于7t/(M-l)的范圍內(nèi)改變,對于所有頻率窗口也僅可以獲得與在該值改變之前的展開結(jié)^目同的結(jié)果。換句話說,第一階段搜索中的值A(chǔ)K-7i/(M-l)是用于在第二階段搜索(遞歸)中產(chǎn)生展開結(jié)果的差別所必需的最小值。在設(shè)置上述斜率增量[AK=ti/(M—l)]之后,執(zhí)行以上參照圖39所描述的線性搜索,然后通過使用由線性搜索求解出的斜率Ki她作為初始值來執(zhí)行圖37的流程中所示的遞歸。在該遞歸處理中,在圖37所示的步驟S371中,通過將從上述2N+1種斜率中求解出的最優(yōu)值設(shè)置作為初始值[K^k],執(zhí)行從步驟S372向前的處理。在步驟S375中,為了防止Kimk的值顯著地偏離初始值,使用等式[10.5,而不是使用用于上述斜率[Kimk]的計算等式的等式[10,3和等式[10.4].然而,應(yīng)該注意,作為等式[10.5中的卩的值,使用大約等于頻率窗口的數(shù)量M的值.或者,還可以使用上述等式[12.41。通過基于結(jié)合遞歸方法和線性搜索方法的混合方法的這種直線擬合處理,實現(xiàn)了高效和高準確度的直線擬合。圖41示出這種直線擬合的結(jié)果。圖41示出通過使用上述圖35所示的圖線凝:據(jù)而執(zhí)行的直線擬合的結(jié)果。圖41所示的數(shù)據(jù)針對24個圖示出直線擬合的結(jié)果,其中設(shè)置了作為多個估計聲源的通道1至4相對于從四個麥克風(麥克風1至4)中選擇的兩個麥克風的六種組合(麥克風1和2、l和3、l和4、2和3、2和4、以及3和4)的圖線。通it^制與從互協(xié)方差矩陣計算出的rtok(o)相關(guān)的相位角來獲得每個圖線。垂直軸表示頻率窗口,而水平軸表示相位角。在圖41中,通過虛線表示由直線擬合而獲得的每條直線。在圖中,為了清楚地表示直線,每條直線被繪制為伸出圖線示意圖的左右或上下。接下來,參照圖42所示的流程圖,將給出在圖32所示的$錄圖的步驟S326中的聲源方向計算以及在圖33所示的流程圖的步驟S336中的聲源方向計算的描述,圖42所示的流程圖表示計算針對各個麥克;M"求解出的斜率Ki她的值的總和以便計算聲源方向9k的處理。然而,應(yīng)該注意,處理被如此設(shè)計,使得在聲源方向上未反映出針對不與任何聲源對應(yīng)的輸出通道或針對其中直線擬合失敗了的麥克風對而獲得的值。此處,在描述該處理之前,將給出"不與任何聲源對應(yīng)的輸出通道"以及"其中直線擬合失敗了的:^1風對"的描述.在同時播放的聲源的數(shù)量小于麥克風的數(shù)量的情況下,不與任何聲源對應(yīng)的信號被輸出到某些輸出通道。(具體地說,輸出僅具有混響分量的聲音)。這樣的輸出通道是可容易辨別的,這是由于相位角的圖線不落在直線上。例如,以上描述作為示出直線擬合的結(jié)果的圖41示出在麥克風數(shù)量是四并且通道數(shù)量(估計的聲源的數(shù)量)是四的情況下所生成的圖線和直線擬合結(jié)果。然而,從圖中可以理解,通道3的圖線數(shù)據(jù)包含4艮多偏離直線的點。這種數(shù)據(jù)表示實際上不存在這樣的估計的聲源(通道3).也就是說,i^示所述結(jié)果與同時的聲源數(shù)量是三的情,;U目對應(yīng)。也就是說,通道3的這一列表示不與任何聲源對應(yīng)的輸出。由于對于這樣的輸出通道計算聲源方向是無意義的,因此必須檢測并且丟棄這樣的通道.此外,如果直線擬^針對特定通道而言失敗了,則應(yīng)該通過移除該對然后求解聲源方向的均值來獲得更準確的值.在圖42所示的聲源方向計算處理流程中,使用根據(jù)上述等式[8.5求解出的擬合誤差,使得具有大誤差的麥克風對未故良映在聲源方向上。因此,排除了從不與任何聲源對應(yīng)的通道、其中直線擬合失敗了的麥克風對等等推導(dǎo)出的聲源方向的值。例如,圖42所示的聲源方向計算處理流程中的步驟S401至S410表75示通道循環(huán),并且表示針對圖41中的每一列(通道)執(zhí)行以下處理。在步驟S402中,將初始值代入存儲結(jié)果的以下變量中N表示存儲有效的麥克風對的數(shù)量的變量;6k表示存儲聲源方向(角度)的總和或者均值的變量。它們的初始值都是O,步驟S403至S406表示麥克風對循環(huán),il^示針對圖41的每列中的六個相位角圖線來執(zhí)行處理.也就是說,根據(jù)相應(yīng)的六個圖線來計算聲源方向,并JLXt計算出的值取平均.步驟S404中的擬合誤差errimk是針對在上述圖36的步驟S364的擬合處理中的麥克風對i、m和通道k的組合而計算出的擬合誤差。將該值與預(yù)定閾值進行比較,如果該值超過閾值,則跳過步驟S405的處理。在等式[8.5被用于計算擬M差enw的情況下,將從0到4中的值之一(例如l)設(shè)置為閾值.通過適當?shù)卦O(shè)置閾值,僅有其中直線擬合成功了(其中相位差的點從開始M本按直線排列,并且還適當?shù)厍蠼獬鰯M合這些點的直線)的那些圖線被反映在聲源方向上,而不采用其它圖線(例如,圖41中的通道3(通道-3)的列中的圖線)。如果在步驟S404中確定擬合誤差errimk的值等于或小于閾值,則處理it^步驟S405。在步驟S405中,基于等式[8.7來計算9tak,并且將計算出的值加到0k上。此外,數(shù)量N增遞,也就^1說,增加l。在某些情況下,更好的是進行以下校正,而不是按原樣應(yīng)用等式[8.7?,F(xiàn)將對此給出描述《在等式[8.7的運算中,存在當asin的括號中的值超過-1至1的范圍時的情況。在這樣的情況下,asin擴展為等式[8.8,從而可以處理超過范圍的輸入。例如,對于稍,過l的輸入,返回稍M過7C/2的值.在非線性地布置麥克風的情況下,通過與麥克風對的角度相對應(yīng)的量來校正等式[8.7]的值。將參照圖43描述這種角度校正。在圖43中,在從麥克風1(421)至麥克風2(422)的方向被取作角度的基準的情況下,從麥克風1到麥克風3(423)的方向被定義為相對于基準旋%(麥克風對旋轉(zhuǎn)角度427)。在這種情況下,將麥克風對旋轉(zhuǎn)角度Y加到通過在等式[8.刀中設(shè)置i=1和m=3而求解出的9m的值上,以調(diào)整角度的基準。也就是說,在通過等式[8.7]求解e孤之后,執(zhí)行以下fct:7013k=Ql3k+Y并且在步驟S405中將校正后的值加到0k上。在針對所有^JL風對執(zhí)行了步驟S404和S405的處理之后,角度的總和被存儲在6k中。因此,通過除以數(shù)量N來將總和轉(zhuǎn)換為均值(步驟S408)。然而,應(yīng)該注意,當N是0時,指示無效的值^c代入ek。例如,在圖41中的通道3(通道-3)的列的情況下,忽略所有這六個圖線,其結(jié)果是,對于03設(shè)置無效值。通過針對所有通道執(zhí)行步驟S401至S410,完成聲源方向的計算。上述完成了圖19中的流程圖所示的所有處理的描述.[修改方案]在本發(fā)明實施例中使用的"直線擬合"的結(jié)果可以用于除了聲源方向估計之外的各種應(yīng)用。此處,將描述以下三點作為修改方案。1.頻率掩蔽2.學(xué)習(xí)初始值的重構(gòu)3.麥克風布置不是線性的情況[l.頻率掩蔽作為聲源分離技術(shù)之一,存在被稱為頻率掩蔽的方法.在這種方法中,通過利用多種聲音在時-頻域中是稀疏的特性,對非目標聲音分量執(zhí)行掩蔽,以僅留下目標聲音。還存在獨立分量分析與頻率掩蔽的結(jié)合,其示例是在日本未審查的專利申請公開No.2007-219479中/>開的配置。頻率掩蔽包m稱為硬掩蔽(將非目標聲音信號設(shè)置為0)的方法和被稱為軟掩蔽(根據(jù)給定措施來弱化非目標聲音信號)的方法.在日本未審查的專利申請公開No.2007-219479中公開的配置表示硬掩蔽的示例。雖然在移除除了目標聲音之外的聲音的性能方面,軟掩蔽不如硬掩蔽,但軟掩蔽可以在一定程度上防止由特定頻率分量的損耗而引起的問題(例如產(chǎn)生音樂噪聲或?qū)φZ音識別的不利干擾)。通過利用上述直線擬合的結(jié)果,可以確定軟掩蔽的系數(shù),允許進一步移除除了目標聲音之外的聲音.圖44示出對于給定通道、對于給定麥克風對的直線擬合的結(jié)果,并且是與上述圖10B所示的直線擬合結(jié)果的圖相同的圖。垂直軸表示頻率窗口,而水平軸表示相位角??梢?,各點基本上按直線排列。在該圖中的第O)個頻率窗口,相位角是Oimk(ffl)501,并且在直線上的點是((D-l)Kimk502。兩者之間的相位差表示為y503。如果i(f的絕對值僅在某個頻率窗口較大,則可以認為存在分離在該頻率窗口失敗的高概率。因此,通過^L據(jù)相位差v的絕對值抑制分離結(jié)果的頻率分量,可以改進分離的準確度。具體地說,準備如圖45所示的函數(shù),函數(shù)的值隨相位差vif的絕對值變得越小而變M小.例如,該函數(shù)^^示為以下等式[13.1。uW"+(l-如'f……[13.1]=/2+(1—/0cos,』t1)^……[13.2]二Ai〖1Re[^(份)exP(一J(份_0《滅)]+1〗盧_^2J&W=^S1)……[13.4][13.3]/=1m=Z+l[13.5]在該等式中,h是用于調(diào)整要應(yīng)用多少掩蔽的項,取不小于0并且不大于1的值(當h=l時,這意味著不執(zhí)行頻率掩蔽)。p取不小于0的值,表示掩蔽的銳度。(圖45示出p=2的情況.)隨著p的值被設(shè)置為越大,可以表示越尖銳的掩蔽,也就是說,被形成為使得相位差vto巨離從o增加而陡峭地被抑制的掩蔽。另一方面,當p-0時,這意味4不執(zhí)行頻率掩蔽,在通過遞歸方法(或混合方法)來執(zhí)行直線擬合的情況下,可以如等式13.2]那樣通過使用展開的0^())和(0)-l)Kimk來計算等式[13.1]的值。另一方面,在通過線性搜索方法來執(zhí)行直線擬合的情況下,可以替代地通過等式[13.3來計算該值。(Re[表示從括號之間的復(fù)數(shù)提取實部的運算。)針對通過等式[13.1I獲得的值,對所有麥克風對取均值(等式[13.4)??梢詢H對直線擬合成功了的那些麥克風對取均值,而不是對所有麥克風對取均值。也就是說,如同在圖43的流程圖的步驟S403至S406的處理中那樣,僅當擬合誤差eiTimk等于或小于閾值時執(zhí)行加法,并且在循環(huán)結(jié)束78之后所得到的值除以麥克風對的數(shù)量。一旦求解出等式[13.4的值(或?qū)τ跀M合溪差errimk等于或小于閾值的U風對取得的均值),該值就乘以針對通道k、頻率窗口以及幀索引t的分離結(jié)果Yk(o,t)(等式13.5),從而生成作為軟掩蔽后的結(jié)果的Y'k(琳在上述圖19的流程的步驟S107中的"逆傅立葉變換"中,通過使用作為軟掩蔽后的結(jié)果的Y,k(叫t)而不使用分離結(jié)果Yk(o,t),生成了在軟掩蔽的情況下的分離結(jié)果波形。然后,在圖19的流程的步驟S108中,傳送在軟掩蔽的情況下的分離結(jié)果波形。雖然在圖45和等式[13.1中,僅當相位差\|/=士兀時掩蔽值變?yōu)樽钚?,但替換地,還有可能使用掩蔽,以使得當相位差\|/偏離預(yù)定范圍時掩蔽的值被強制設(shè)置為最小值。具體地說,準備滿足0<\|/。《71的\|/。,并且當-\|/0《xi/《vi/o時,可以根據(jù)等式[13.1來計算gimk(VI/),否則可以將&她(\|/)設(shè)置為gimk(V)=h。如上所述,根據(jù)本發(fā)明實施例的信號處理裝置可以被配置以便通過使用由于直線擬合處理而獲取的比例常數(shù)(直線斜率),執(zhí)行用于抑制信號分離結(jié)果的頻率分量(具有顯著地偏離直線的相位角爽:據(jù))的頻率掩蔽,該處理使得能夠進一步改進信號分離性能。2.學(xué)習(xí)初始值的重構(gòu)在以上作為學(xué)習(xí)處理單元中的線程處理的描述而給出的圖7的描述中,作為在學(xué)習(xí)開始時的初始值,按原樣使用在該點處的最新分離矩陣(或在重新調(diào)節(jié)之前的分離矩陣)。例如,由在圖7所示的線程1中執(zhí)行的笫一學(xué)習(xí)所生成的分離矩陣72被用作線程3中的學(xué)習(xí)開始處75的初始值。類似地,在線程3中生成的分離矩陣被用作線程5中的學(xué)習(xí)開始處的初始值。通過多個學(xué)習(xí)線程的中間作用,收^L程度提高,如圖8(a)中的圖1所示'如果根據(jù)直線擬合的結(jié)果重構(gòu)分離矩陣,而不是按原樣使用分離矩陣作為初始值,則可以4吏收^tit度更快。下面將描述用于實現(xiàn)該重構(gòu)的具體方法。根據(jù)分離矩陣\¥(),通過上述的從等式6.5至等式[7.1]以及等式8.1然后等式[8.3的處理來估計作為直線擬合結(jié)果的Kimk.因此,通過執(zhí)行這些運算的逆運算*可以計算分離矩陣。下面的等式[14.1是用于計算與等式[8.11中的sign(cii"w))相對應(yīng)的元素的等式。<formula>formulaseeoriginaldocumentpage80</formula>然而,應(yīng)該注意,如同在等式[14.2]和等式[14.3]中那樣定義當i<m時K她的值。(例如,Kllk=0和K21k--K12k。)雖然在等式14.1中對n項取均值,但如同在圖43所示的流程的步驟S403至S406中那樣,可以僅對擬合誤差errimk變?yōu)榈扔诨蛐∮陂撝档?i,m)組合取均值.(然而,應(yīng)該注意,err威-eiTimk。)或者,不是針對多個m取均值,而是僅使用針對特定m的值以減少復(fù)雜度。例如,僅使用m-l意味著通過僅使用笫一麥克風和另一麥克風之間的相位差來重構(gòu)分離矩陣'接下來,如同在等式[14.4中那樣,生成用等式[14.1中的qik((D)作為其元素的矩陣Q(co)。Q((D)是與互協(xié)方差矩陣2xY(ro)相對應(yīng)的矩陣.為了從Q((D)獲得W(co),可以使用上述等式[6.5中的關(guān)系,結(jié)果獲得等式[14.5]。替選地,可以使用等式[6.8中的關(guān)系,或者可以筒單地使用Q(ffl)的逆矩陣,等式[14.5的計算結(jié)果被給出作為U(ro),該U(co)被設(shè)置為充當要被保存在圖15所示的線程控制單元112的學(xué)習(xí)初始值保存單元152中的學(xué)習(xí)初始值的初始值。代替直接使用U(w)作為初始值,如果使用其標度(scale)被形成為更接近在學(xué)習(xí)初始值保存單元152中保存的矩陣的標度的矩陣,則可以期望收^ti4度方面的進一步改進。為此,可以執(zhí)行等式[14.6的運算。在該等式中,Wik(ro)表示在學(xué)習(xí)初始值^^單元152中^Mf的學(xué)習(xí)初始值的各個元素,diag()表示對角線矩陣,括號中的元素位于其對角線上。由于U((D)從左邊乘以該對角線矩陣,所以該等式意味著U(ffl)的列的標度與在學(xué)習(xí)初始值保存單元152中保存的學(xué)習(xí)初始值的列的標度相一致。通過應(yīng)用這種修改,改進了收g變。例如,雖然在圖8中的(a)圖1中,在當聲源的狀態(tài)改變時與當分離矩陣再次收斂時之間存在轉(zhuǎn)換階段85c至85f,但這些階段的數(shù)量可能減小。如上所述,M本發(fā)明實施例的信號處理裝置可以被配置以便通過使用由直線擬合處理而獲得的比例常數(shù)(直線斜率)來生成分離矩陣,并且在學(xué)習(xí)處理單元中使用所生成的分離矩陣.這種配置使得可以加快學(xué)習(xí)處理中的收斂性。[3.麥克風布置不是線性的情況接下來,將給出在麥克風不是放置在同一直線上而是以二維方式(在同一平面上)或三維方式放置的情況下的處理示例的描述.在麥克風不是故置在同一直線上而是以二維方式(在同一平面上)或三維方式放置的情況下,作為聲源方向,還可以估計聲源方向矢量而不是角度9k。下文中,將給出所涉及的原理和方法的描述。圖46是示出在一個U;RU寸與聲源方向矢量之間的關(guān)系的圖。聲源601是與第k通道相對應(yīng)的聲源,從每個麥克風對看見的聲源k的方向由單位矢量(長度為l的矢量)qk(聲源方向矢量602)M示。聲源方向矢量qk602是由以下等式15.1表示三維列矢量。P加一一&—(M-l)C……[15.1].[15.2]……[15.3]U……[15.4]尸fWA、一ifftfe"A".[15.5]&…化—w/K.'i力.[15.6]i..[15.9][15.7]...[15,8]1.[15.10].[15.11]圖46中出現(xiàn)的矢量全部以相同形式(三維列矢量)表示。圖46所示的絲差[Diwl606是從聲源k601到麥克風i603的距離與從聲源k601到U風m604的距離之間的差,并且這是與圖1所示的絲差d'sine相對應(yīng)的量,通過由等式分別表示5^差[Dtakl606與方向矢量qk602之間的關(guān)系以及Dimk與直線擬合結(jié)果Kimk之間的關(guān)系,可以估計qk。直線擬合結(jié)果Kimk與相位差D滅之間的關(guān)系可以表示為等式[15.4,其中,F(xiàn)表示采樣頻率,M表示頻率窗口的數(shù)量,C表示聲速。該等式等同于由Dimk替代等式[8.4中的項dtaSineimk,1^變換為形式"Dimk=",另一方面,如果假設(shè)平面波,則可以將路徑差Dfank看作麥克風對方向的矢量(從麥克風i指向麥克風m的矢量)到qk上的投影。也就是說,如果麥克風對方向由矢量Pim(麥克風對矢量605)表示,則Dimk、Pto與qk之間的關(guān)系可以由等式[15,5來表示.(上標T表示矢量或矩陣的轉(zhuǎn)置。令x,y是列矢量,xTy是矢量的點積。此外,在等式15.5中,通過麥克風間距IPiml來對該點積的值進行規(guī)范化。)通過等式[15.3來計算麥克風矢量pim,麥克風i和麥克風m的位置矢量(=坐標)分別表示為Zj和zm。如果^fgi殳平面波,則可以i人為無論從哪個麥克風對看qk,qk都是相同的(例如,另一麥克風對611的聲源方向矢量qk指向與聲源方向矢量602相同的方向)。因此,對于麥克風對的數(shù)量獲得表示關(guān)于聲源方向矢量qk的^Hf的等式[15.51。最佳近似那些多個條件表達式的qk的值可以被設(shè)置為聲源方向矢量的估計值hat(qk)。作為求解這樣的hat(qk)的方法,日本專利No.3881367提出了與等式15.6相對應(yīng)的運算。應(yīng)該注意,附加到該等式的右手邊的第一項的上標"+"表示偽逆矩陣(更精確地i兌,Moore-Penrose廣義逆矩陣)。此外,右手邊的第一項是通i^t目對于所有麥克風對垂直列出TPim/|Pim|而生成的矩陣(其行數(shù)等于麥克風對的數(shù)量,其列數(shù)量等于3).類似地,右手邊的第二項是通i^目對于所有麥克風對垂直列出Dimk/|Pim|而生成的列矢量。(然而,應(yīng)該注意,由于日本專利No.3881367中的聲源方向矢量計算的目的是消除置換,因此對于每個頻率窗口執(zhí)行與等式15.6]相對應(yīng)的運算.此外,對于每個頻率窗口,不是根據(jù)直線斜率而是根據(jù)分離矩陣的逆矩陣來計算與路徑差Dimk相對應(yīng)的量。)然而,在通過使用Moore-Penrose廣義逆矩陣推導(dǎo)出的等式15.61上,并未反映出qk為單位矢量(等式[15.2)的約束關(guān)系。因此,存在這樣的情況計算出的方向不同于與通過還考慮了等式[15,21的約束關(guān)系而估計出的最佳hat(qt)相對應(yīng)的方向。因此,在本發(fā)明實施例中,通過使用基于固定點方法的迭代算法來估計最佳聲源方向矢量。在描述該算法之前,將描述所涉及的原理。除了作為用于每個麥克風對的聲源方向矢量qk的約束條件的等式83[15.5之外,當qk是單位矢量(等式[15.2)的條件也由單個等式來表示時,可以將其寫為等式[15.9。在該等式中,Pk和Dk分別是由等式[15.7和等式[15.8表示的矩陣和矢量。Pk是通it4將各個U風對的矢量pim的長^i范4fc為1之后水平排列它們而生成的矩陣??梢圆槐亓谐鏊宣溈孙L對矢量,具有大直線擬合誤差errimk的麥克風對可被省略。取決于麥克風對方向與聲源方向之間的關(guān)系,可能存在不可能以非常高的準確度來計算直線斜率的情況。也可以排除這種位置關(guān)系中的麥克風對(隨后將給出這點的更多細節(jié))。類似地,Dk是通過水平排列在根據(jù)麥克風間距進行規(guī)范化之后的針對各個麥克風對的路徑差D醎而生成的矢量,如在Pk的情況下,同樣對于Dk,可以排除具有大擬合誤差eriVk的麥克風對'令Nk是對于Pk和Dk所采用的:^風對的數(shù)量,等式[15.9的左手邊的第一項是(Nk+1)x3矩陣(形式是"垂直元素的數(shù)量x水平元素的數(shù)量"),而右手邊是垂直元素的數(shù)量為Nk+l的矢量。固定點方法是一種準備通過將等式[15.9變換為形式"qk="(等式15.101)而獲得的等式并JL^于該等式來重復(fù)更新qk的方法。由于更新是重復(fù)的,因此qk最終收斂到最佳近似等式[15.9]的值。然而,應(yīng)該注意,a本發(fā)明實施例,為了確保更強烈地反映等式[15.21的徊中,等式15.10和等式[15.11被交替地重復(fù)。圖47所示的流程圖示出聲源方向矢量估計算法的^t要,步驟S501至S507表示針對通道的循環(huán),并且與圖42的流程中的"通道循環(huán)"相同。在步驟S502中,生成等式15.7中的Pk和等式[15.8中的Dk。也就是說,生成矩陣[PlJ,其通^t^將各個麥克風對的矢量Pbn的長^L范化為l之后水平排列它們而生成,以及矢量[Dkl,其通過水平排列在根據(jù)麥克風間距進行規(guī)范化之后的針對各個麥克風對的路徑差Dimk而生成.f^將給出更多細節(jié)。在生成Pk和Dk之后,"所采用的:IJL風對的數(shù)量"已經(jīng)祐^代入變量Nk。如在以上參照圖42中的流程所描述的理中那樣,如果直線擬合失敗了,則在Pk或Dk上不反映這種麥克風對。此外,由于聲源方向矢量qk是三維矢量,因此Nk必須是3或更大以便估計聲源方向矢量qk。因此,在步驟S503中,根據(jù)"所采用的麥克風對的數(shù)量"Nk的值,處理被分支為三路。如果"所采用的麥克風對的數(shù)量"Nk=0,則處理進入步驟S504.在此情況下,由于這大概意味著方向估計失敗了或者通道不與任何聲源相對應(yīng),所以表示"無效"的值被^聲源方向矢量qk。當Nk^:3時,處理進入步驟S506,在步驟S506中,基于固定點方法來估計聲源方向矢量qk。隨后將給出更多細節(jié)。如果0〈Nk〈3,則不可能估計作為三維矢量的聲源方向矢量qk,但可以估計作為聲源方向的角度的9k,因此,在此情況下,處理進入步驟S505,在步驟S505中,通過根據(jù)上述圖42中的處理流程的方法來計算ek。接下來,將參照圖48所示的流程來描述在步驟S502中對等式[15.7中的Pk和等式[15.8中的Dk的生成處理的細節(jié),即用于生成以下兩項的處理矩陣[Pk],其通^4將各個麥克風對的矢量Pim的長度規(guī)范化為l之后水平排列它們而生成;以及矢量[DkI,其通過水平排列在根據(jù)麥克風間距進行規(guī)范化之后的針對各個麥克風對的路徑差Dimk而生成。在步驟S5U中,執(zhí)行初始值設(shè)置以使得指示在Pk和Dk上反映的麥克風對的數(shù)量的變量Nk被設(shè)置為0。步驟S512至S517表示對于麥克風對的循環(huán),該循環(huán)與圖42的5jW中的"麥克jm"循環(huán)"相同。步驟S513是與圖42的流程中的步驟S404的處理相同的處理,其中,處理才Mt與通道k和麥克風對(i,m)相對應(yīng)的擬合誤差errimk是否超過預(yù)定閾值而被分支。如果擬合誤差errimk超過閾值,則跳過后續(xù)步驟S514至S516。如果擬合誤差envk小于閾值,則在將pta和Di她分別加到Pk和Dk上(步驟S514和S515)之后,在步驟S516中,Nk增加1。步驟S514是在Pk的右側(cè)將Pim作為新的列加到當時的Pk上的處理。以基^目同的方式,步驟S515是在Dk的右側(cè)將Dimk作為新的元素加到當時的Dk上的處理。85通過執(zhí)行步驟S513至S516的循環(huán)等于麥克風數(shù)量的次數(shù),最終,達到這樣的狀態(tài)生成了Pk和Dk,并且Pk和Dk的水平元素的數(shù)量已經(jīng)被代入Nko接下來,將參照圖49所示的流程給出在圖47所示的流程圖的步驟S506中的"qk的估計"的描述。在步驟S521中,聲源方向矢量的初始值被代入qk。存在使用先前估計的qk值作為初始值的方法?;蛘?,在聲源存在的方向在某種程度上可被局部化的情況下,方向可以反映在初始值上。例如,如圖50所示,在以下情況下預(yù)先發(fā)現(xiàn)可能存在聲源的范圍701被定位在從所有麥克風702的重心703看見的在Y軸方向上大致距離L(也就是說,在圖中所示的麥克風重心與聲源之間的距離L704)、此外從麥克風的重心703看見的在z軸方向上(垂直于xy平面的方向)大致高度H的位置,在0,L,HlT代替qk之后,其長度可以根據(jù)等式15.11而,范化為1。在可以從除了聲音之外的形式(即傳感器等等(例如相機圖像、超聲波傳感器或紅外線傳感器))來預(yù)測可能變?yōu)槁曉吹膶ο蟮姆较虻那闆r下,可以將通過這樣的單元求解出的方向設(shè)置為qk的初始值.接下來,重復(fù)步驟S523中的"更新qj的處理,直到qk收斂,如果確定qk已收斂(步驟S522中的"是"),則處理結(jié)束。為了確定qk是否已收斂,可以預(yù)先在變量q'k中保存先前更新的值,并且可以確定與當前更新結(jié)果之間的差lqk畫q,kl是否已經(jīng)變得小于給定值(例如0.00001)?;蛘?,處理的循環(huán)可以被簡本地執(zhí)行預(yù)定次數(shù)(例如5次或10次)。步驟S523中的"qk的更新"用于在執(zhí)行等式[15.10]之后執(zhí)行等式[15.11。通過交替迭代等式15.10和等式[15.11],qk最終收斂到最佳近似等式[15.8的值。在圖48的步驟S513中,根據(jù)擬合誤差eiTi她的值來執(zhí)行麥克風對選擇。除了這種4Hf之外,還可以添加條件分支使得如果Kimk的值超過預(yù)定閾值,則拒絕使用對應(yīng)的:ijt風對。在下面,將描述這種條件分支的理由和方法,對于麥克風對,存在其中可以在高分辨率情況下估計斜率K滅的方向以及其中僅在低分辨率情況下估計斜率Ktak的方向。參照圖l,雖然當角e接近o對可以在高分辨率情況下計算聲源方向,但當e接近于士7i弧度(±90°)時僅可以在低分辨率情況下計算聲源方向。因此,在存在相對于聲源以各種位置關(guān)系布置的麥克風對的情況下,并非通過使用所有U風對來計算聲源方向,而是通過選#^認為是在高分辨率情況下估計聲源方向的麥克風對并且計算那些麥克風對之間的聲源方向來提高方向估計的準確度,選擇麥克風對的具體方法如下.預(yù)先確定對于位于什么角度范圍內(nèi)的聲源,對應(yīng)的麥克風對被采用以用于方向檢測,該范圍的上限被設(shè)置為9咖x。例如,在圖1中,如果當聲源方向的角e落入-2/37t(-60。)至+2/3tc(+60°)的范圍內(nèi)時要采用麥克風對,則上fH^L設(shè)置為e咖一2/3兀。接下來,根據(jù)以下等式[16.1]來計算與角的最大值相對應(yīng)的直線斜率,1《J〉m祖J......[16-2]這是由emax替代等式[8.4中的估計聲源角hat(9tak)的等式,根據(jù)該等式所計算出的斜率的最大值被設(shè)置為Kmaxim.Kmaxim的值對于每個麥克風對被確定,并且可以被預(yù)先計算??梢曰贙i她的絕對值是否超過K皿im(等式[16.21)來確定對于給定的麥克風對,聲源方向是否超過預(yù)定范i。也就是說,在圖48的步驟S513中不是確定"err滅〉閾值",而是確定是否"errimk>閾值或IKimkl>Kmaxim",如果滿足該條件,則可以使處理分支到右邊(拒絕使用該麥克風對),而如果不滿足該務(wù)ff,則處理可以向下分支。以上參照具體實施例詳細描述了本發(fā)明。然而,顯然在不脫離本發(fā)明范圍的情況下,本領(lǐng)域技術(shù)人員可以對實施例進行各種修改和替換。也就是說,本發(fā)明通過示例的方式被公開了,而不應(yīng)該被限制性地解釋。應(yīng)參照所附權(quán)利要求來確定本發(fā)明的范圍??梢酝ㄟ^硬件、軟件或二者的組合配置來執(zhí)行在本說明書中所描述的處理序列。如果要通過軟件來執(zhí)行處理序列,則可以通過將記錄處理序列的程序安裝到嵌入在專用硬件中的計算機的存儲器中或者通過將程序安裝到能夠執(zhí)行各種處理的通用計算機中來執(zhí)行該處理序列.例如,可以將程序預(yù)先記錄在記錄介質(zhì)上'除了從記錄介質(zhì)被安裝到計算機中之外,程序可以經(jīng)由網(wǎng)絡(luò)(例如LAN(局域網(wǎng))或互聯(lián)網(wǎng))被接收,并被安裝到內(nèi)置的記錄介質(zhì)(例如M)中。本說明書中所描述的各種處理不僅可以按各種處理在描述中出現(xiàn)的順序被依次執(zhí)行,而且可以取決于執(zhí)行處理的設(shè)備的吞吐量被并行地或獨立地執(zhí)行。此外,在本說明書中所使用的術(shù)語"系統(tǒng)"指的是多個設(shè)備的邏輯組合,并且不限于其中組成設(shè)備位于同一殼體內(nèi)的系統(tǒng)。本發(fā)明包含與在2008年6月11日提交到日本專利局的日本優(yōu)先權(quán)專利申請JP2008-153483中公開的主題內(nèi)^EI關(guān)的主題內(nèi)容,該專利申請的全部內(nèi)M過引用合并到此。本領(lǐng)域技術(shù)人員應(yīng)該理解,取決于設(shè)計需求以及其它因素可以出現(xiàn)各種修改、組合、子組合和改變,只要它們在所附權(quán)利要求及其等同內(nèi)容的范圍內(nèi)。權(quán)利要求1.一種信號處理裝置,包括學(xué)習(xí)處理單元,其通過學(xué)習(xí)處理來求解用于分離混合了來自多個聲源的輸出的混合信號的分離矩陣,所述學(xué)習(xí)處理將獨立分量分析(ICA)應(yīng)用于包括所述混合信號的觀測信號;分離處理單元,其將所述分離矩陣應(yīng)用于所述觀測信號以分離所述混合信號并且生成與所述聲源中的每一個相對應(yīng)的分離信號;以及聲源方向估計單元,其計算在所述分離處理單元中生成的分離信號中的每一個的聲源方向,其中,所述聲源方向估計單元在時-頻域中計算在對應(yīng)時間分段中的所述觀測信號與分離信號之間的互協(xié)方差矩陣,計算所述互協(xié)方差矩陣的元素之間的相位差,并且通過應(yīng)用計算出的相位差來計算與所述分離信號中的每一個相對應(yīng)的聲源方向。2.根據(jù)權(quán)利要求1所述的信號處理裝置,其中所述分離處理單元用于對混合了來自多個聲源的輸出的混合信號執(zhí)行短時傅立葉變換(STFT),以在時-頻域中生成觀測信號聲鐠圖,以及將所述分離矩陣應(yīng)用于所述觀測信號聲鐠圖以在時-頻域中生成分離信號聲譜圖;以及所述聲源方向估計單元在時-頻域中計算在對應(yīng)時間分段中的所i^測信號聲諮圖與分離信號聲譜圖之間的互協(xié)方差矩陣,計算所述互協(xié)方差矩陣的元素之間的相位差,并且通過應(yīng)用計算出的相位差來計算與所述分離信號中的每一個相對應(yīng)的聲源方向。3.根據(jù)權(quán)利要求1所述的信號處理裝置,其中所述聲源方向估計單元在時-頻域中計算所述觀測信號的協(xié)方差矩陣,并且通過應(yīng)用計算出的協(xié)方差矩陣以及由所述學(xué)習(xí)處理單元計算出的分離矩陣的厄密轉(zhuǎn)置矩陣來計算所述觀測信號與所述分離信號之間的互協(xié)方差矩陣。4.根據(jù)權(quán)利要求1所述的信號處理裝置,其中在計算所勤目位差的處理中,所述聲源方向估計單元分別針對作為通道的所述聲源中的每一個計算與麥克風對相對應(yīng)的相位差,所述U風對是在不同位置放置的信號輸入設(shè)備。5.根據(jù)權(quán)利要求l所述的信號處理裝置,其中所述聲源方向估計單元通過使用與所述互協(xié)方差矩陣的元素之間的相位差相關(guān)的信息來執(zhí)行計算相位角與頻率之間的比例常數(shù)的直線擬合處理,并且通過使用所述比例常數(shù)來計算與所述分離信號中的每一個相對應(yīng)的聲源方向,其中所述比例常lbl直線的斜率。6.根據(jù)權(quán)利要求5所述的信號處理裝置,其中所述聲源方向估計單元通過執(zhí)行作為所述直線擬合處理的遞歸方法來計算所述比例常數(shù),所述遞歸方法包括從最低頻率按順序執(zhí)行相位角與頻率之間的對應(yīng)性信息的展開處理,以執(zhí)行所述比例常數(shù)的更新處理,其中所述比例常lbl直線的斜率。7.根據(jù)權(quán)利要求5所述的信號處理裝置,其中所述聲源方向估計單元通過執(zhí)行作為所述直線擬合處理的線性搜索方法來計算所述比例常數(shù),所述線性搜索方法包括將比例常數(shù)的值從預(yù)設(shè)最小值逐漸改變到預(yù)設(shè)最大值,針對與所勤目位差相關(guān)的信息計算誤差,并且選擇具有小誤差的比例常數(shù),其中所述比例常ltA直線的斜率。8.根據(jù)權(quán)利要求5所述的信號處理裝置,其中所述聲源方向估計單元通過執(zhí)行作為所述直線擬合處理的以下方法來計算所述比例常數(shù),其中所述比例常fcl直線的斜率線性搜索方法,包括將所述比例常數(shù)的值從預(yù)設(shè)最小值逐漸改變到預(yù)設(shè)最大值,針對與所i^目位差相關(guān)的信息計算誤差,并且選擇具有小誤差的比例常數(shù),以及遞歸方法,包括通過使用由所述線性搜索方法獲得的比例常數(shù)作為初始值,從最低頻率按順序執(zhí)行相位角與頻率之間的對應(yīng)性信息的展開處理,以執(zhí)行所述比例常數(shù)的更新處理。9.根據(jù)權(quán)利要求5所述的信號處理裝置,其中所述聲源方向估計單元計算與每個:^風對相對應(yīng)的多個比例常數(shù),從計算出的多個比例常數(shù)選擇具有小擬合溪差的數(shù)據(jù)片,并且計算所選擇的數(shù)據(jù)片的均值,以計算所述比例常數(shù)的最終值,其中所述麥克風對是在不同位置放置的信號輸入設(shè)備,所述比例常ibi直線的斜率。10.根據(jù)權(quán)利要求5所述的信號處理裝置,其中所述信號處理裝置還通過使用作為所述直線擬合處理的結(jié)果而獲取的所述比例常數(shù)來執(zhí)行頻率掩蔽,所述頻率掩蔽抑制信號分離結(jié)果的具有顯著地偏離所述直線的相位角數(shù)據(jù)的頻率分量,其中所述比例常IUJl線的斜率。11.根據(jù)權(quán)利要求5所述的信號處理裝置,其中所述信號處理裝置還通過使用作為所述直線擬合處理的結(jié)果而獲取的所述比例常數(shù)來生成所述分離矩陣,并且在所述學(xué)習(xí)處理單元中使用生成的分離矩陣,其中所述比例常ibl:直線的斜率.12.根據(jù)權(quán)利要求l所述的信號處理裝置,其中所述聲源方向估計單元計算在通過將連接各個麥克風對內(nèi)的麥克風的矢量[Pim的長^W范化為l之后水平排列它們而生成的矩陣[Pk],以及計算通過水平排列在根據(jù)麥克風間距進行規(guī)范化之后的針對所述各個麥克風對的路徑差[Dtok而生成的矢量[Dk,并且通過應(yīng)用計算出的矩陣[Pk和計算出的矢量[Dk來計算聲源方向的角度或計算指示從所述麥克風對中的每一個看見的聲源方向的矢量.13.—種在信號處理裝置中執(zhí)行的信號處理方法,包括以下步驟學(xué)習(xí)處理單元通過學(xué)習(xí)處理來求解用于分離混合了來自多個聲源的輸出的混^ff號的分離矩陣,所述學(xué)習(xí)處理將獨立分量分析應(yīng)用于包括所述混合信號的觀測信號;分離處理單元將所述分離矩陣應(yīng)用于所述觀測信號以分離所述混合信號并且生成與所述聲源中的每一個相對應(yīng)的分離信號;以及聲源方向估計單元計算所生成的分離信號中的每一個的聲源方向,其中,所述聲源方向的計算包括在時-頻域中計算在對應(yīng)時間分段中的所述觀測信號與分離信號之間的互協(xié)方差矩陣,計算所述互協(xié)方差矩陣的元素之間的相位差,并且通過應(yīng)用計算出的相位差來計算與所述分離信號中的每一個相對應(yīng)的聲源方向。14.一種用于使信號處理裝置執(zhí)行信號處理的程序,所述信號處理包括以下步驟學(xué)習(xí)處理單元通過學(xué)習(xí)處理來求解用于分離混合了來自多個聲源的輸出的混^fT號的分離矩陣,所述學(xué)習(xí)處理將獨立分量分析應(yīng)用于包括所述混合信號的觀測信號;分離處理單元將所述分離矩陣應(yīng)用于所述觀測信號以分離所述混合信號并且生成與所述聲源中的每一個相對應(yīng)的分離信號;以及聲源方向估計單元計算所生成的分離信號中的每一個的聲源方向,其中,所述聲源方向的計算包括在時-頻域中計算在對應(yīng)時間分段中的所述觀測信號與分離信號之間的互協(xié)方差矩陣,計算所述互協(xié)方差矩陣的元素之間的相位差,并且通過應(yīng)用計算出的相位差來計算與所述分離信號中的每一個相對應(yīng)的聲源方向。全文摘要一種信號處理裝置、信號處理方法以及程序,該裝置包括學(xué)習(xí)處理單元,其通過學(xué)習(xí)處理來求解用于分離混合了來自多個聲源的輸出的混合信號的分離矩陣,所述學(xué)習(xí)處理將ICA(獨立分量分析)應(yīng)用于包括混合信號的觀測信號;分離處理單元,其將分離矩陣應(yīng)用于觀測信號以分離混合信號并且生成與聲源中的每一個相對應(yīng)的分離信號;以及聲源方向估計單元,其計算所生成的分離信號中的每一個的聲源方向。聲源方向估計單元在時-頻域中計算在對應(yīng)時間分段中的觀測信號與分離信號之間的互協(xié)方差矩陣,計算互協(xié)方差矩陣的元素之間的相位差,并且通過應(yīng)用計算出的相位差來計算與分離信號中的每一個相對應(yīng)的聲源方向。文檔編號G01S3/808GK101604012SQ20091014666公開日2009年12月16日申請日期2009年6月11日優(yōu)先權(quán)日2008年6月11日發(fā)明者廣江厚夫申請人:索尼株式會社