專利名稱:聲音識別裝置以及聲音識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及聲音識別裝置,該聲音識別裝置對發(fā)動機(jī)聲或語音等的周期聲音、以及風(fēng)噪聲、雨聲、暗噪聲等的非周期聲音進(jìn)行區(qū)別來判斷周期聲音(或非周期聲音)的頻率信號。
背景技術(shù):
以往,作為聲音判別的技術(shù)具有如下的技術(shù)。作為第一以往技術(shù),存在通過檢測車輛聲音來檢測本車輛的周邊存在的其他車輛的技術(shù)(例如,參照專利文獻(xiàn)1)。在專利文獻(xiàn)1中的現(xiàn)有技術(shù)中,首先使用光譜差減法(SS 法)來去除本車輛的引擎聲音和周圍噪聲。接著,從去除噪聲后的聲音信號的能量中檢測其他車輛聲音。并且,基于在多個麥克間到達(dá)的時間差,來檢測其他車輛的存在方位。另外,作為涉及風(fēng)噪聲等噪聲的去除技術(shù)涉及的第二以往技術(shù)著眼于聲音信號的相位的時間變化的不同,來判別聲音等的周期聲音和風(fēng)噪聲等的非周期聲音的技術(shù)(例如,參照專利文獻(xiàn)2)。專利文獻(xiàn)專利文獻(xiàn)1 日本實(shí)開平5-92767號公報專利文獻(xiàn)2 日本專利第4310371號公報在第一方面的現(xiàn)有技術(shù)中,通過光譜差減法(SS法)來去除噪音。SS法是通過對一定時間的聲音進(jìn)行頻率分析,將所得到的每個頻率的能量作為噪音而減去,從而提取確定的時間的聲音的方法。因此,需要事前推斷噪音。在具有穩(wěn)定的能量的聲音存在于周圍的噪聲下的情況下,因?yàn)槟軌蛲茢嘣肼暎阅軌蛉コ肼?。但是,風(fēng)噪聲等(非穩(wěn)定噪聲) 因?yàn)楣β孰S時間變化,所以對于這樣的非穩(wěn)定噪聲,SS法的可靠性低,無法通過精準(zhǔn)地判斷風(fēng)噪音和車輛的聲音來檢測車輛聲音。在第二方面的現(xiàn)有技術(shù)中發(fā)動機(jī)聲音等的聲音是周期聲音(頻率大體固定),是利用相位相對時間為固定值的性質(zhì)來對周期聲音進(jìn)行識別的技術(shù)。在車輛穩(wěn)定運(yùn)行(以相同速度行駛)、且發(fā)動機(jī)的轉(zhuǎn)速固定(發(fā)動機(jī)聲音的頻率相對時刻是固定的值)的情況下,能夠識別周期聲音。另一方面,在因車輛的加速或者減速發(fā)動機(jī)的轉(zhuǎn)速變化的情況下,為了提高識別的精度,需要對頻率隨時間變化進(jìn)一步施行對策。特別是,在對存在于本車輛的死角位置的車輛(死角車輛)進(jìn)行檢測的應(yīng)用等中,為了有助于更加安全地運(yùn)行,對一碰撞就容易成為重大事故的正在加速的車輛進(jìn)行正確地檢測成為重要的課題。
發(fā)明內(nèi)容
本發(fā)明解決了以往的課題,其目的是涉及對發(fā)動機(jī)聲音和語音等的周期聲音,與風(fēng)噪聲、雨聲、暗噪聲等的非周期聲音進(jìn)行區(qū)別,來判斷周期聲音(或者非周期聲音)的頻率信號的聲音識別裝置,尤其提供能夠?qū)Πl(fā)動機(jī)聲音和語音等這樣的頻率隨時間變化的周期聲音進(jìn)行正確判斷的聲音識別裝置。為了達(dá)到上述目的,本發(fā)明某些方面所涉及的聲音識別裝置具備頻率分析單元, 分析聲音信號的頻率信號;相位曲線計(jì)算單元,計(jì)算對所述頻率信號的相位的時間變化進(jìn)行近似的相位曲線;誤差計(jì)算單元,對所述相位曲線與所述頻率信號的相位之間的誤差進(jìn)行計(jì)算;以及聲音信號識別單元,基于所述誤差對所述聲音信號是否是周期聲音的信號進(jìn)行識別。在頻率隨著時間變化的情況下相位也隨著時間變化。將這樣的相位的時間變化表示為相位曲線,通過基于與相位曲線的誤差識別是否是周期聲音的信號,從而對發(fā)動機(jī)聲音和語音等的周期聲音以及風(fēng)噪音、雨聲、暗噪音等的非周期聲音進(jìn)行區(qū)別,能夠判斷周期聲音(或者非周期聲音)的頻率信號。特別是能夠正確判斷像發(fā)動機(jī)聲音和語音這樣頻率隨著時間變化的周期聲音。優(yōu)選的是上述聲音識別裝置還具備相位校正單元,在與規(guī)定數(shù)量的上述相位不同的其他上述相位上加上士2 π Xm弧度,以使與上述規(guī)定數(shù)量的上述相位之間的差變小,從而對其他上述相位進(jìn)行校正,其中,m是自然數(shù)。由此,能夠?qū)εc其他時刻的相位存在較大偏差的相位進(jìn)行校正,而精準(zhǔn)地進(jìn)行周期聲音的識別。另外,上述聲音識別裝置,還具有相位校正單元,按照每個相互不同的角度范圍, 通過對所述相位加上士 Xm弧度,以使所述相位處于該角度范圍內(nèi),由此對所述相位進(jìn)行校正,其中,m是自然數(shù),所述相位曲線計(jì)算單元按照每個所述角度范圍計(jì)算出所述相位曲線,所述誤差計(jì)算單元按照每個所述角度范圍計(jì)算出所述誤差,所述相位校正單元進(jìn)一步選擇所述誤差最小時的角度范圍,所述聲音信號識別單元,基于在所選擇的所述角度范圍的所述誤差,對所述聲音信號是否是周期聲音的信號進(jìn)行識別。由此,能夠?qū)εc其他時候的相位存在較大偏差的相位進(jìn)行校正,從而能夠精準(zhǔn)地進(jìn)行聲音的識別。進(jìn)一步優(yōu)選的是上述頻率分析單元對于多個麥克風(fēng)所接受的多個聲音信號分別進(jìn)行頻率信號分析,上述多個麥克風(fēng)各自接受聲音信號的輸入且相互分開配置,上述聲音識別裝置還具備方向檢測部,在通過所述聲音信號識別單元將由至少一個麥克風(fēng)輸入的聲音信號識別為周期聲音的信號的情況下,基于由上述多個麥克風(fēng)所接受的多個所述聲音信號的到達(dá)時間差,來檢測所述周期聲音的聲源方向。在識別了周期聲音的情況下,基于聲音信號的到達(dá)時間來檢測車輛的方向。因此, 能夠不接受噪音的影響而正確檢測車輛的方向。更加優(yōu)選的是所述相位曲線是由將相位的值作為變量的二次多項(xiàng)式表示的曲線。在聲音信號的頻率變化能夠以一次方程式表示的情況下,相位的變化能夠以二次方程式表示。因此,通過將相位曲線設(shè)定為由二次多項(xiàng)式表示的曲線,從而能夠精準(zhǔn)地表示相位變化。另外,本發(fā)明不僅能夠?qū)崿F(xiàn)具有這樣特征的單元聲音識別裝置,還能夠?qū)崿F(xiàn)將聲音識別裝置所包含的特征的單元作為步驟的聲音識別方法,以及實(shí)現(xiàn)將聲音識別方法所包含的特征的步驟作為計(jì)算機(jī)執(zhí)行的程序。并且,像這樣的程序,當(dāng)然可以通過 CD-ROM (Compact Disc-Read Only Memory)等的存儲介質(zhì)或因特網(wǎng)等的通信網(wǎng)絡(luò)來進(jìn)行流通。發(fā)明的效果根據(jù)本發(fā)明的聲音識別裝置能夠?qū)Πl(fā)動機(jī)聲音和語音等的周期聲音以及風(fēng)噪音、 雨聲、暗噪聲等的非周期聲音進(jìn)行區(qū)別,并對周期聲音(或者非周期聲音)的頻率的周期信號進(jìn)行判斷。
圖1是對本發(fā)明的相位進(jìn)行說明的圖。圖2是對本發(fā)明的相位進(jìn)行說明的圖。圖3是對發(fā)動機(jī)聲音進(jìn)行說明的圖。圖4是對發(fā)動機(jī)轉(zhuǎn)速固定時的發(fā)動機(jī)聲音的相位進(jìn)行說明的圖。圖5是對發(fā)動機(jī)轉(zhuǎn)速增加來使車輛加速時的發(fā)動機(jī)聲音的相位進(jìn)行說明的圖。圖6是對發(fā)動機(jī)轉(zhuǎn)速減少來使車輛減速時的發(fā)動機(jī)聲音的相位進(jìn)行說明的圖。圖7是示出在本發(fā)明的實(shí)施方式1中的噪聲去除裝置的整體結(jié)構(gòu)的框圖。圖8是示出在本發(fā)明的實(shí)施方式1中的噪聲去除裝置的提取聲音判斷部的結(jié)構(gòu)的框圖。圖9是示出在本發(fā)明的實(shí)施方式1中的噪聲去除裝置的動作順序的流程圖。圖10是示出對在本發(fā)明的實(shí)施方式1中的提取聲音的頻率信號進(jìn)行判斷處理的動作順序的流程圖。圖11是對頻率分析進(jìn)行說明的圖。圖12是對發(fā)動機(jī)聲音和風(fēng)噪聲進(jìn)行說明的圖。圖13是對相位的校正處理進(jìn)行說明的圖。圖14是對相位的校正處理進(jìn)行說明的圖。圖15是對相位曲線的計(jì)算處理進(jìn)行說明的圖。圖16是對相位距離的計(jì)算處理進(jìn)行說明的圖。圖17是對發(fā)動機(jī)聲音的相位曲線進(jìn)行說明的圖。圖18是對來自相位曲線的誤差進(jìn)行說明的圖。圖19是對發(fā)動機(jī)聲音的校正處理進(jìn)行說明的圖。圖20是對相位的校正處理進(jìn)行說明的圖。圖21是對相位的校正處理進(jìn)行說明的圖。圖22是示出在本發(fā)明實(shí)施方式2的車輛檢測裝置的整體結(jié)構(gòu)的框圖。圖23是示出在本發(fā)明實(shí)施方式2的車輛檢測裝置的提取聲音判斷部結(jié)構(gòu)的框圖。圖M是示出在本發(fā)明實(shí)施方式2的車輛檢測裝置的動作順序的流程圖。圖25是示出對在本發(fā)明的實(shí)施方式2中的提取聲音的頻率信號進(jìn)行判斷處理的動作順序的流程圖。
具體實(shí)施例方式本發(fā)明的特征是著眼于發(fā)動機(jī)聲音和語音等的周期聲音的頻率的時間變化的特征。本發(fā)明人對聲音的產(chǎn)生機(jī)理和實(shí)際收集的聲音數(shù)據(jù)進(jìn)行分析。其結(jié)果,發(fā)現(xiàn)以下新的見解在發(fā)動機(jī)聲音和語音等的周期聲音的時間-頻率空間中的頻率的時間變化能夠以線性分段函數(shù)近似。通過該見解能夠以曲線對分段函數(shù)近似的聲音的相位的時間變化模型化。 由此,即使在頻率時間變化的情況下,也能夠正確地識別周期聲音。另外,本發(fā)明中的周期聲音是指示出相位固定的聲音或者相位的變化連續(xù)的聲音。在這里,使用圖1對本發(fā)明所使用的相位進(jìn)行定義。在圖1(a)中,概要地示出了輸入的發(fā)動機(jī)聲音的例子。橫軸表示時間,縱軸表示振幅。在此,示出發(fā)動機(jī)的轉(zhuǎn)速相對時間固定,發(fā)動機(jī)聲音的頻率沒有變化的情況的例子。另外,在圖1(b)中示出了使用傅里葉變換來進(jìn)行頻率分析時的作為基礎(chǔ)波形的頻率f的正弦波(在這里將與發(fā)動機(jī)聲音頻率相同的值作為規(guī)定的頻率f)。橫軸和縱軸與圖1(a)相同。通過將該基礎(chǔ)波形和輸入了的混合聲音進(jìn)行疊加處理,從而求出頻率信號 (相位)。在該例子中將基礎(chǔ)波形進(jìn)行固定而不在時間軸方向上移動,來進(jìn)行與輸入的發(fā)動機(jī)聲音的疊加處理,從而求出每個時刻的頻率信號(相位)。在圖1(c)示出了通過該處理求出的結(jié)果。橫軸表示時間,縱軸表示相位。在該例子中發(fā)動機(jī)的轉(zhuǎn)速相對于時刻是固定的,輸入了的發(fā)動機(jī)聲音的頻率相對于時刻固定。因此,在規(guī)定的頻率f的相位不是加速地增加或者減少。在該例子中,將與轉(zhuǎn)速固定的發(fā)動機(jī)聲音的頻率相同的值作為規(guī)定的頻率f,在將比發(fā)動機(jī)聲音頻率小的值作為規(guī)定的頻率f 的情況下相位按照一次函數(shù)增加。另外,在將比發(fā)動機(jī)聲音頻率大的值作為規(guī)定的頻率f 的情況下相位按照一次函數(shù)減少。在哪一種情況下,在規(guī)定的頻率f的相位都不是加速地增加或者減少。另外,在音頻信號領(lǐng)域或快速傅里葉變換(FFT)等中通常將基礎(chǔ)波形在時間軸方向上移動并進(jìn)行疊加。將該基礎(chǔ)波形在時間軸方向上移動并進(jìn)行疊加的情況下,通過之后對相位進(jìn)行校正從而能夠變換為在本發(fā)明中定義的相位。下面使用附圖來進(jìn)行說明。圖2是對相位進(jìn)行說明的圖。在圖2(a)中概要地示出輸入的發(fā)動機(jī)聲音的例子。 橫軸表示時間,縱軸表示振幅。另外,在圖2(b)中示出了使用傅里葉變換來進(jìn)行頻率分析的情況下的作為基礎(chǔ)波形的頻率f的正弦波(在這里將與發(fā)動機(jī)聲音頻率相同的值作為規(guī)定的頻率f)。橫軸和縱軸與圖2(a)相同。通過將該基礎(chǔ)波形與輸入了的混合聲音進(jìn)行疊加處理從而求出頻率信號(相位)。在該例子中通過使基礎(chǔ)波形在時間軸方向上移動并與輸入了的發(fā)動機(jī)聲音進(jìn)行疊加處理,從而求出每個時刻的頻率信號(相位)。在圖2(c)示出了通過該處理求出的結(jié)果。橫軸表示時間,縱軸表示相位。由于輸入了的發(fā)動機(jī)聲音的頻率為f,因此成為以Ι/f的時間的周期規(guī)則地重復(fù)在頻率f的相位的模式。因此,通過將由計(jì)算出的相位Ψ (t)得到的規(guī)則地重復(fù)的相位進(jìn)行校正(Ψ ‘ (t)= mod (Ψ (t)-2 π ft) (f是分析頻率)),從而得到如圖2(d)所示的相位。即,通過進(jìn)行相位校正能夠變換為圖1(c)所示的在本發(fā)明中所定義的相位。接下來,對頻率變化進(jìn)行說明,該頻率針對伴隨著發(fā)動機(jī)轉(zhuǎn)速的發(fā)動機(jī)聲音的時刻。圖3是對本實(shí)施方式的特征進(jìn)行說明的概念圖。圖3是在后述的DFT分析部M02對汽車的發(fā)動機(jī)聲音進(jìn)行分析的譜圖??v軸表示頻率,橫軸表示時間,顏色的濃度表示頻率信號的能量的大小。深色(黑色)表示能量較大。圖3是盡量去除了風(fēng)等的噪聲的數(shù)據(jù),顏色深的部分(較黑的部分)大體表示發(fā)動機(jī)聲音。通常像這樣發(fā)動機(jī)聲音是隨著時間轉(zhuǎn)速變化的數(shù)據(jù),根據(jù)譜圖可知頻率隨著時間的經(jīng)過而變化。發(fā)動機(jī)是通過規(guī)定數(shù)量的氣缸進(jìn)行活塞運(yùn)動從而使驅(qū)動系統(tǒng)運(yùn)轉(zhuǎn)。并且由車輛所發(fā)出的發(fā)動機(jī)聲音包括依存于該發(fā)動機(jī)轉(zhuǎn)動的聲音和不依存于發(fā)動機(jī)轉(zhuǎn)動的固定振動聲音或非周期聲音。特別是從車輛外部能夠檢測的主要的聲音是依存于發(fā)動機(jī)運(yùn)轉(zhuǎn)的周期聲音。在本實(shí)施方式中,將依存于該發(fā)動機(jī)運(yùn)轉(zhuǎn)的周期聲音作為發(fā)動機(jī)聲音來進(jìn)行提取。如圖3中的虛線的圓501、502以及503所示,發(fā)動機(jī)聲音因轉(zhuǎn)速的變化,頻率根據(jù)時間部分地變化。在此,關(guān)注頻率變化時,可知幾乎不存在頻率隨機(jī)的變化或者離散地跳躍這樣的情況,在以規(guī)定的時間間隔來看時,能以線性模型來近似。從而,可知發(fā)動機(jī)聲音能夠以下式(式子1)所示的分段函數(shù)來進(jìn)行近似。算式1f(t) = At+f0(公式 1)具體的說,在規(guī)定的時間區(qū)間進(jìn)行觀察的情況下,能夠認(rèn)為時刻t的頻率f以從初始值f0開始在時間t內(nèi)比例(比例系數(shù)A)地進(jìn)行增減的線段來進(jìn)行線性近似。例如,力口速時的車輛通常情況下發(fā)動機(jī)的轉(zhuǎn)速大體線性地增加??芍谑境黾铀贂r的頻率變化的區(qū)間B中越向右頻率越增加。在該區(qū)間中,發(fā)動機(jī)轉(zhuǎn)速增加,車輛正在加速。即,該發(fā)動機(jī)聲音的頻率的斜率A能夠以正的線性分段函數(shù)近似。另外,在減速時的車輛發(fā)動機(jī)的轉(zhuǎn)速線性地減速??芍诒硎緶p速時的頻率變化的區(qū)間A中越向右頻率越減少。由此,該發(fā)動機(jī)聲音的頻率的斜率A能夠以負(fù)的線性分段函數(shù)近似。進(jìn)而,穩(wěn)定行駛時的車輛發(fā)動機(jī)的轉(zhuǎn)速沒有變化??芍谑境龇€(wěn)定運(yùn)行時的頻率變化的區(qū)間C正在以大體固定的頻率推移。在該區(qū)間中,發(fā)動機(jī)轉(zhuǎn)速固定,車輛正在穩(wěn)定行駛。即,在該發(fā)動機(jī)聲音的頻率能夠以斜率A 為0的線性分段函數(shù)近似。并且,以上述(公式1)表示頻率f的情況下,時刻t的相位Ψ能夠表示為公式2。算式2ψ (t) = 2 π / f (t)dt = 2 π f (At+f0) dt = π At2+2 π f0t+Ψ0 (公式 2)在這里右邊的第3項(xiàng)Ψ。是初始相位,第2項(xiàng)O π f0t)表示在時間t內(nèi)相位按比例前進(jìn)角頻率2π ^。并且根據(jù)第一項(xiàng)(JiAt2)可知,相位能夠以二次曲線進(jìn)行近似。如上所述,在發(fā)動機(jī)聲音等的周期聲音中能夠以曲線對相位的時間變化進(jìn)行模型化。另一方面,在風(fēng)噪聲等的非周期音中,相位的時間變化不具有周期性是隨機(jī)的,無法用二次曲線進(jìn)行近似。本發(fā)明人著眼于該相位的時間變化的不同,對發(fā)動機(jī)聲音等的周期聲音和像發(fā)動機(jī)聲音等的聲音周期變化的語音,以及風(fēng)噪聲、雨聲、暗噪音等的非周期聲音進(jìn)行區(qū)別,能夠判斷周期聲音(或者非周期聲音)的頻率信號。尤其,在檢測死角車輛等的應(yīng)用中能夠瞬間檢測加速時的車輛。在此,對發(fā)動機(jī)轉(zhuǎn)速的增減和發(fā)動機(jī)聲音的相位的關(guān)系進(jìn)行分析。圖4(a)是概要地示出在區(qū)間C發(fā)動機(jī)轉(zhuǎn)速一定時的發(fā)動機(jī)聲音的圖。在此,將發(fā)動機(jī)聲音的頻率設(shè)為f。圖4(b)是示出基礎(chǔ)波形的圖。在此,將基礎(chǔ)波形的頻率設(shè)為與發(fā)動機(jī)聲音的頻率f相同的值。圖4(c)是示出針對基礎(chǔ)波形的相位的圖。作為發(fā)動機(jī)轉(zhuǎn)速一定的發(fā)動機(jī)聲音如圖1(a)所示的正弦波具有一定的周期。因此,如圖4(c)所示,在規(guī)定的頻率f的相位相對時間變化未加速地增加或減少。另外,作為對象的聲音是固定的頻率,在基礎(chǔ)波形的頻率較低的情況下,相位慢慢變遲。但是,因?yàn)闇p少量固定,所以相位的形狀線性地減少。另一方面,設(shè)為對象的聲音是固定的頻率,基礎(chǔ)波形的頻率較高的情況下,相位漸漸變快。但是,因?yàn)樵撛黾恿抗潭ㄋ韵辔坏男螤罹€性地增加。圖5(a)是概要地示出在區(qū)間B發(fā)動機(jī)轉(zhuǎn)速增加、車輛加速時發(fā)動機(jī)聲音的圖。此時發(fā)動機(jī)聲音的頻率與時間一起增加。圖5(b)是表示基礎(chǔ)波形的圖。例如基礎(chǔ)波形的頻率設(shè)為f。圖5(c)是表示相位相對于基礎(chǔ)波形的圖。發(fā)動機(jī)聲音具有如正弦波的周期性, 并且具有頻率漸漸變快的波形,因此如圖5(c)所示,針對于基礎(chǔ)波形的相位隨著時間變化加速地增加。圖6(a)是概要地示出在區(qū)間A發(fā)動機(jī)轉(zhuǎn)速降低、車輛減速時的發(fā)動機(jī)聲音的圖。 此時發(fā)動機(jī)聲音的頻率與時間一起減少。圖6(b)是表示基礎(chǔ)波形的圖。例如基礎(chǔ)波形的頻率設(shè)為f。圖6(c)是表示相位相對于基礎(chǔ)波形的圖。發(fā)動機(jī)聲音具有如正弦波的周期性, 并且具有頻率漸漸變慢的波形,因此如圖6(c)所示,針對于基礎(chǔ)波形的相位隨著時間變化加速地減少。下面對于本發(fā)明的實(shí)施方式參照附圖來進(jìn)行說明。(實(shí)施方式1)對實(shí)施方式1涉及的噪聲去除裝置進(jìn)行說明。圖7以及圖8是表示本發(fā)明實(shí)施方式1的噪聲去除裝置的結(jié)構(gòu)的框圖。在圖7中,雜音去除裝置1500具有麥克風(fēng)2400、DFT分析部2402、以及雜音去除處理部1504。DFT分析部M02與權(quán)利要求中示出的頻率分析單元對應(yīng)。麥克風(fēng)MOO收集來自外部的混合聲音M01。該混合聲音由車輛的發(fā)動機(jī)聲音和風(fēng)噪聲構(gòu)成。DFT分析部M02對所輸入的混合聲音MOl實(shí)施傅里葉變換處理,分別對多個頻帶求出混合聲音MOl的頻率信號。另外,也可以使用快速傅里葉變換、離散余弦變換、或者小波變換等其他的頻率變換方法的頻率變換來代替DFT分析部M02進(jìn)行的傅里葉變換處理。由DFT分析部M02所求的的頻率信號具有M個頻帶。以符號j (j = 1 Μ)表示對該M個頻帶進(jìn)行指定的號碼。噪聲去除處理部1504具有相位校正部1501 (j) (j = 1 Μ)、提取聲音判斷部 1502 (j) (j = 1 Μ)、以及聲音提取部1503 (j) (j = 1 Μ)。即、按照頻帶來設(shè)計(jì)相位校正部、提取聲音判斷部以及聲音提取部。相位校正部1501 (j) (j = 1 Μ)與權(quán)利要求中所示的相位校正單元對應(yīng)。聲音提取部1503 (j) (j = 1 Μ)與權(quán)利要求中所示的聲音信號識別單元對應(yīng)。相位校正部1501(j) (j = 1 Μ)由M個相位校正部構(gòu)成,第j個相位校正部 1501 (j)執(zhí)行對頻帶j的處理。在本說明書中,以相同的參照符號進(jìn)行記載的處理部是相同的。相位校正部1501 (j) (j = 1 Μ)在對DFT分析部Μ02求出的頻帶j的頻率信號將時刻t的頻率信號的相位設(shè)定為ψα)(弧度)時,將相位校正為ψ' (t)=mod2 π (Ψ (t) -2nft) (f 是分析頻率)。提取聲音判斷部1502(j) (j = 1 Μ)在規(guī)定的時間寬度內(nèi),根據(jù)對在作為分析對象的時刻進(jìn)行了相位校正的頻率信號,來對相位隨時間變化近似的相位曲線(近似曲線) 進(jìn)行計(jì)算,并對計(jì)算出的相位曲線和作為分析對象的時刻的相位之間的誤差進(jìn)行計(jì)算。此時相位距離(相位曲線和設(shè)為分析對象的時刻的相位之間的誤差)使用校正后的相位 Ψ'⑴來計(jì)算。最后,聲音提取部1503 (j) (j = 1 Μ)以提取聲音判斷部1502 (j) (j = 1 Μ) 計(jì)算出的誤差(相位距離)為基礎(chǔ),將誤差在第二閾值以下的頻率信號作為提取聲音來進(jìn)行提取。通過一邊在時間方向上移動規(guī)定的時間寬度一邊進(jìn)行這些處理,從而能夠按照每個時間-頻率區(qū)域提取出提取聲音的頻率信號Μ08。圖8是示出提取聲音判斷部1502 (j) (j = 1 Μ)的結(jié)構(gòu)的框圖。提取聲音判斷部1502 (j) (j = 1 Μ)具有頻率信號選擇部1600 (j) (j = 1 Μ)、 相位距離判斷部1601 (j) (j = 1 Μ)、以及相位曲線計(jì)算部1602 (j) (j = 1 Μ)。相位距離判斷部1602 (j) (j = 1 Μ)與權(quán)利要求中示出的誤差計(jì)算單元對應(yīng)。頻率信號選擇部1600(j) (j = 1 Μ)在規(guī)定的時間寬度上,從相位校正部 1501 (j) (j = 1 Μ)進(jìn)行了相位校正的頻率信號中,選擇用于計(jì)算相位曲線以及計(jì)算相位距離的頻率信號。相位曲線計(jì)算部1602 (j) (j = 1 Μ)使用對頻率信號選擇部1600 (j) (j = 1 Μ)選擇的頻率信號進(jìn)行相位校正后的相位Ψ ‘ (t),將隨著時間的經(jīng)過相位變化的相位形狀作為二次曲線來進(jìn)行計(jì)算。并且相位距離判斷部1601 (j) (j = 1 Μ)對相位曲線計(jì)算部1602(j) (j = 1 Μ)計(jì)算出的相位曲線和作為分析對象的時刻的校正后的相位Ψ' (t) 的相位距離進(jìn)行判斷。另外,本發(fā)明必須的結(jié)構(gòu)要件是圖7示出的DFT分析部M02、聲音提取部1503、圖 8示出的相位距離判斷部1601 (j)、以及相位曲線計(jì)算部1602 (j)。DFT分析部M02如果能夠直接導(dǎo)出圖1(c)示出的本發(fā)明中定義的相位,則不需要相位校正部1501 (j)。另外,麥克風(fēng)MOO是不是必需的結(jié)構(gòu)元件。接著,對如上構(gòu)成的噪音去除裝置1500的動作進(jìn)行說明。下面,對第j個頻帶進(jìn)行說明,對于其他的頻帶也進(jìn)行同樣的處理。在這里以頻帶的中心頻率和分析頻率一致的情況為例進(jìn)行說明。分析頻率是指在用于求出相位距離的Ψ ‘ (t) = mod 2 π ( ψ (t)_2 π f t)中的頻率f。噪音去除裝置1500判斷在該頻率f是否存在提取聲音。作為其他方法,也可以將在頻帶中包含的多個頻率作為分析頻率來進(jìn)行提取聲音的判斷。這種情況下,能夠判斷在中心頻率的周邊頻率是否存在提取聲音。圖9以及圖10是表示雜音去除裝置1500的動作順序的流程圖。麥克風(fēng)MOO收集來自外部的混合聲音MOl,將收集的混合聲音輸出到DFT分析部 2402 (S200)。DFT分析部M02接受混合聲音MO1,對混合聲音MOl實(shí)施傅里葉變換處理,并按照每個頻帶j求出混合聲音2401的頻率信號(步驟S300)。
接著,相位校正部1501 (j)對DFT分析部M02求出的頻帶j的頻率信號按照每個頻帶j,通過將相位Ψ變換為相位Ψ ‘ (t) = mod2 π (Ψ (t)-2 π ft) (f為分析頻率),來進(jìn)行相位校正(步驟S1700(j))。在此,將時刻t的頻率信號的相位設(shè)為Ψ (t)(弧度)。在此,對在本發(fā)明中使用相位的理由以及進(jìn)行相位校正的方法進(jìn)行說明。圖3是在DFT分析部M02對汽車發(fā)動機(jī)聲音進(jìn)行DFT分析后的譜圖??v軸表示頻率,橫軸表示時間,顏色的濃度表示頻率信號能量的大小。深的顏色表示能量的大小。圖 3是盡量去除了風(fēng)等的噪聲的數(shù)據(jù),顏色深的部分大體表示發(fā)動機(jī)聲音。在分析中使用了的發(fā)動機(jī)聲音是隨著時間轉(zhuǎn)速變化的數(shù)據(jù),根據(jù)譜圖可知頻率隨著時間的經(jīng)過而變化。圖11是對DFT分析的能量和相位進(jìn)行說明的圖。圖11(a)與圖3相同,是對汽車的發(fā)動機(jī)聲音進(jìn)行DFT分析的譜圖。圖11(b)是示出從時刻tl開始使用規(guī)定的時間窗寬度的海因窗來在多個空間上表示頻率信號601的圖。算出頻率fl、f2、f3等各頻率的能量和相位。頻率信號601的長度表示能量,頻率信號601和實(shí)軸所成的角度表示相位。并且,如圖11(a)中的tl、t2、t3所示,一邊進(jìn)行時間偏移一邊求出在各時刻的頻率信號。另外,通常情況下,譜圖僅表示在各時刻的各頻率的能量,對相位進(jìn)行省略。圖3 和圖11(a)所示的譜圖同樣,僅表示DFT分析后的能量的大小。在圖11(c)中示出在圖11(a)中規(guī)定的頻率(例如頻率f4)在時間方向上的相位的變動。橫軸表示時間,縱軸表示頻率信號的相位,是以0 (弧度)間的值進(jìn)行表示。在圖11(d)表示在圖11(a)中的、規(guī)定頻率(例如頻率f4)的能量隨時間的變化。 橫軸是時間軸,縱軸表示頻率信號的大小(能量)。頻率信號的相位Ψα)以及大小(能量)P(t)在將頻率信號的實(shí)部表示為x(t)、 頻率信號的虛部表示為y(t)時,分別為算式3ψ (t) = mod 2 π (arctan (y (t) /χ (t)))(公式 3)算式4P (t) = -yjx(t)2 + ( ) 2 (公式 4)在這里的符號t表示頻率信號的時刻。使用圖12對存在風(fēng)等噪聲的情況下的汽車發(fā)動機(jī)聲音進(jìn)行說明。圖12(a)與圖3 相同,是對汽車發(fā)動機(jī)聲音進(jìn)行DFT分析后的譜圖??v軸表示頻率,橫軸表示時間,顏色的濃度表示頻率信號能量的大小。但是與圖3不同,因?yàn)榘L(fēng)等雜音,所以在發(fā)動機(jī)聲音以外的頻率也存在顏色深的部分(時刻tl、t2等),因此成為僅以能量完全不清楚是發(fā)動機(jī)聲音還是風(fēng)噪音的狀態(tài)。圖12(b)是表示在時刻t2的發(fā)動機(jī)聲音部分頻率f4在規(guī)定時間的能量推移的圖表??芍蝻L(fēng)等噪音的影響能量不穩(wěn)定。圖12(c)是表示在時刻t3的不存在發(fā)動機(jī)聲音的部分的頻率f4在規(guī)定時間的能量推移的圖表??芍嬖诜欠€(wěn)定的能量。另外,可知即使對圖12(b)以及圖12(c)進(jìn)行比較,僅以能量也完全不能區(qū)別是存在風(fēng)噪音還是存在發(fā)動
機(jī)聲音。因此,在本發(fā)明中為了提取發(fā)動機(jī)聲音使用相位隨時間的變化。首先,對發(fā)動機(jī)聲音的相位特性進(jìn)行說明。
發(fā)動機(jī)通過規(guī)定數(shù)量的汽缸進(jìn)行活塞運(yùn)動從而使驅(qū)動系統(tǒng)運(yùn)轉(zhuǎn)。并且車輛所發(fā)出的發(fā)動機(jī)聲音包括依靠該發(fā)動機(jī)運(yùn)行的聲音、和不依靠發(fā)動機(jī)運(yùn)行的固定振動聲音或非周期聲音。特別是從車輛外部能夠檢測到的主要的聲音是依賴于發(fā)動機(jī)運(yùn)行的周期聲音,在本發(fā)明中將依賴于發(fā)動機(jī)運(yùn)行的周期聲音作為發(fā)動機(jī)聲音來進(jìn)行提取。如圖3中的虛線的圓501、502以及503所示,可知發(fā)動機(jī)聲音因轉(zhuǎn)速的變化頻率變化。在此,關(guān)注頻率變化時,可知幾乎不存在頻率隨機(jī)的變化或者離散地跳躍這樣的情況,在以規(guī)定的時間間隔來看時,頻率大體與時刻成比例地變化。因此,發(fā)動機(jī)聲音能夠以上述公式1示出的線性分段函數(shù)近似。具體地說,在以規(guī)定的時間區(qū)間來看的情況下,可以認(rèn)為在時刻t的頻率f能夠以從初始值f0開始在時間t內(nèi)比例地(比例系數(shù)A)增減的線段來進(jìn)行線性近似。并且,以上公式1表示頻率f的情況下,時刻t的相位Ψ能夠表示為公式2。接下來,對相位校正處理進(jìn)行說明,該相位校正處理易于進(jìn)行相位的時間變化的近似處理。通過將在圖11(c)中示出的頻率信號的相位叫⑴變換為相位Ψ ‘ (t)= mod2 π (Ψ (t) -2 π f t) (f是分析頻率),從而進(jìn)行相位校正。最初相位校正部1501(j)決定基準(zhǔn)的時刻。圖13(a)是表示與圖11(a)相同內(nèi)容的圖,在該例子中,將圖13(a)的黑圓標(biāo)記的時刻t0決定為基準(zhǔn)的時刻。接下來,相位校正部1501 (j)決定進(jìn)行相位校正的頻率信號的多個時刻。在這個例子中,將圖13(a)的5個白圓標(biāo)記的時刻(tl、t2、t3、t4、t5)決定為頻率信號的校正相位的時刻。在此將基準(zhǔn)的時刻t0的頻率信號的相位表示為公式5。算式5ψ (t0) = mod 2 π (arctan (y (t0) /χ (t0)))(公式 5)將對相位進(jìn)行校正的5個時刻的頻率信號的相位表示為公式6。算式6ψ (tj) = mod 2 π (arctan (y (、)/χ (、)))(i = 1,2,3,4,5)(公式 6)將這些修改之前的相位用在圖13(a)中的X表示。另外對應(yīng)時刻的頻率信號的大小可用算式7表示。算式7P(ti) = ^Xiti)2+y(ti)2 (/ = 1,13,4,5)(公式 7)接著,在圖14中示出對在時刻t2的頻率信號的相位進(jìn)行校正的方法。圖14(a) 和圖13(a)是相同內(nèi)容的圖。另外,圖14(b)是以l/f(f是分析頻率)的時間間隔、以等角速度用實(shí)線表示在0 2Π (弧度)之間規(guī)則地變化的相位。在此,將校正之后的相位表示為算式8。算式8Ψ Ui) (i = 0,1,2,3,4,5)在圖14(b)中對基準(zhǔn)的時刻t0的相位和時刻t2的相位進(jìn)行比較。時刻t2的相位比時刻t0的相位大公式8所示的量。
Δ ψ = 2 π f (t2_t0)(公式 8)因此,在圖14(a)中,為了校正與基準(zhǔn)的時刻t0的相位Ψ (t0)之間的時間差引起的相位的偏差,從時刻t2的相位Ψ (t 2)減去Δ Ψ來求出Ψ ‘ (t 2)。這是相位校正后的時刻t2的相位。此時,時刻t0的相位因?yàn)槭腔鶞?zhǔn)的時刻的相位,所以相位校正后也是相同的值。具體地說,通過公式9與公式10求出相位校正后的相位。算式10Ψ (t0) = Ψ (t0) (公式 9)算式11ψ ‘ (、)= mod 2ji (ψ (、)-2 3^(、-、))(i = 1,2,3,4,5)(公式 10)將相位校正后的頻率信號的相位在圖13(b)中用符號X表示。圖13(b)的顯示的方法與圖13(a)相同,因此省略說明。再一次參照圖9,提取聲音判斷部1502(j)使用相位校正部1501 (j)求出的校正后的相位信息來計(jì)算相位的形狀。然后,求出作為分析對象的時刻的頻率信號與在與作為分析對象時刻不同的多個時刻的頻率信號之間的相位距離(誤差)(步驟S1701 (j))。圖10是表示對提取聲音的頻率信號進(jìn)行判斷處理(步驟S1701 (j))的動作順序的流程圖。最初頻率信號選擇部1600 (j)根據(jù)相位校正部1501 (j)求出的、在規(guī)定時間寬度的相位校正的頻率信號來對相位曲線計(jì)算部1602 (j)計(jì)算相位形狀時使用的頻率信號進(jìn)行選擇(步驟1800( j))。在這里將作為分析對象的時刻設(shè)為t0,根據(jù)在時刻t0和時刻tl、 t2、t3、t4、t5的頻率信號的相位計(jì)算相位的形狀。此時,在求出相位曲線時使用的頻率信號(時刻t0 t5的6個頻率信號)由規(guī)定值以上的數(shù)量構(gòu)成。這是因?yàn)樵谟糜谇蟪鱿辔痪嚯x所選擇的頻率信號的數(shù)量少的情況下難以判斷相位隨時間變化的規(guī)則性。在這里規(guī)定的時間寬度的時長也可以基于提取聲音的相位隨時間變化的性質(zhì)決定。接著,相位曲線計(jì)算部1602(j)計(jì)算出相位曲線(步驟S1801(j))。假設(shè)相位曲線例如由以下的二次多項(xiàng)式(公式11)近似地計(jì)算出。算式12Ψ (t) = Α^'+Α^+Αο (公式 11)圖15是用于說明相位曲線的計(jì)算處理的圖。如圖15所示,根據(jù)規(guī)定的數(shù)量的點(diǎn)能夠計(jì)算出二次曲線。在本發(fā)明中將二次曲線作為再回歸曲線來進(jìn)行計(jì)算。具體地說,在將各時刻ti(i =0,1,2,3,4,5)的校正后的相位設(shè)為Ψ' (t i)的情況下,二次曲線Ψ (t) 的各系數(shù)A 2、A1、A0分別表示為算式1權(quán)利要求
1.一種聲音識別裝置,具備頻率分析單元,分析聲音信號的頻率信號;相位曲線計(jì)算單元,計(jì)算與所述頻率信號的相位的時間變化進(jìn)行近似的相位曲線; 誤差計(jì)算單元,對所述相位曲線與所述頻率信號的相位之間的誤差進(jìn)行計(jì)算;以及聲音信號識別單元,基于所述誤差對所述聲音信號是否是周期聲音的信號進(jìn)行識別。
2.如權(quán)利要求1所述的聲音識別裝置,所述聲音信號識別單元在所述誤差為規(guī)定的閾值以上的情況下,將與用于計(jì)算所述誤差的所述頻率信號的相位對應(yīng)的聲音信號識別為非周期聲音的信號;在所述誤差不足所述規(guī)定的閾值的情況下,將與用于計(jì)算所述誤差的所述頻率信號的相位對應(yīng)的聲音信號識別為周期聲音的信號。
3.如權(quán)利要求1所述的聲音識別裝置,所述聲音信號識別單元在規(guī)定的時間寬度所包含的所述誤差的和或者平均值為規(guī)定的閾值以上的情況下,將與在該規(guī)定的時間寬度所包含的用于計(jì)算所述誤差的所述頻率信號的相位對應(yīng)的聲音信號識別為非周期聲音的信號;在該規(guī)定的時間寬度所包含的所述誤差的和或者平均值不足所述規(guī)定的閾值的情況下,將與在該規(guī)定的時間寬度所包含的用于計(jì)算所述誤差的所述頻率信號的相位對應(yīng)的聲音信號識別為周期聲音的信號。
4.如權(quán)利要求1所述的聲音識別裝置,還具備相位校正單元,通過對與規(guī)定數(shù)量的所述相位不同的其他所述相位加上士 Xm弧度,以使與所述規(guī)定數(shù)量的所述相位之間的差變小,從而對其他所述相位進(jìn)行校正,其中,m是自然數(shù)。
5.如權(quán)利要求1所述的聲音識別裝置,還具備相位校正單元,按照每個相互不同的角度范圍,通過對所述相位加上士Xm 弧度,以使所述相位處于該角度范圍內(nèi),從而對所述相位進(jìn)行校正,其中,m是自然數(shù), 所述相位曲線計(jì)算單元按照每個所述角度范圍計(jì)算所述相位曲線, 所述誤差計(jì)算單元按照每個所述角度范圍計(jì)算所述誤差, 所述相位校正單元進(jìn)一步選擇所述誤差最小時的角度范圍,所述聲音信號識別單元基于被選擇的所述角度范圍內(nèi)的所述誤差,對所述聲音信號是否是周期聲音的信號進(jìn)行識別。
6.如權(quán)利要求1所述的聲音識別裝置, 所述聲音信號是混合聲音的聲音信號,所述聲音信號識別單元在所述誤差不足規(guī)定的閾值的情況下,將與用于計(jì)算所述誤差的所述頻率信號的相位對應(yīng)的聲音信號識別為發(fā)動機(jī)聲音的信號。
7.如權(quán)利要求1所述的聲音識別裝置,所述頻率分析單元對于多個麥克風(fēng)所接受的多個聲音信號分別進(jìn)行頻率信號分析,所述多個麥克風(fēng)各自接受聲音信號的輸入且相互分開配置,所述聲音識別裝置還具備方向檢測部,在通過所述聲音信號識別單元將由至少一個麥克風(fēng)輸入的聲音信號識別為周期聲音的信號的情況下,基于由所述多個麥克風(fēng)所接受的多個所述聲音信號的到達(dá)時間差,來檢測所述周期聲音的聲源方向。
8.如權(quán)利要求1所述的聲音識別裝置,所述相位曲線是由將相位的值作為變量的二次多項(xiàng)式表示的曲線。
9.如權(quán)利要求1所述的聲音識別裝置,所述誤差計(jì)算單元,將所述頻率信號的相位與同該頻率信號的時刻同時刻的所述相位曲線的值之間的差計(jì)算為所述誤差。
10.一種聲音識別方法,具有 分析聲音信號的頻率信號的步驟;計(jì)算與所述頻率信號的相位的時間變化進(jìn)行近似的相位曲線的步驟; 對所述相位曲線與所述頻率信號的相位之間的誤差進(jìn)行計(jì)算的步驟;以及基于所述誤差,對所述聲音信號是否是周期聲音的信號進(jìn)行識別的步驟。
11.一種程序,用于計(jì)算機(jī)執(zhí)行以下步驟 分析聲音信號的頻率信號的步驟;計(jì)算與所述頻率信號的相位的時間變化進(jìn)行近似的相位曲線的步驟; 對所述相位曲線與所述頻率信號的相位之間的誤差進(jìn)行計(jì)算的步驟;以及基于所述誤差,對所述聲音信號是否是周期聲音的信號進(jìn)行識別的步驟。
全文摘要
噪音去除裝置(1500)具有麥克風(fēng)(2400),接受輸入的聲音信號;DFT分析部(2402),分析所述聲音信號的頻率信號;相位曲線計(jì)算部(1602(j)),計(jì)算相位曲線,該相位曲線與所述頻率信號的相位的時間變化進(jìn)行近似;相位距離判斷部(1601(j)),對所述相位曲線與所述頻率信號的相位之間的誤差進(jìn)行計(jì)算;以及聲音提取部(1503(j)),基于所述誤差對所述聲音信號是否是周期聲音的信號進(jìn)行識別。
文檔編號G10L11/00GK102473410SQ201180002629
公開日2012年5月23日 申請日期2011年1月7日 優(yōu)先權(quán)日2010年2月8日
發(fā)明者吉岡元貴, 芳澤伸一 申請人:松下電器產(chǎn)業(yè)株式會社