專利名稱:輔音區(qū)間檢測(cè)裝置及輔音區(qū)間檢測(cè)方法
技術(shù)領(lǐng)域:
本發(fā)明涉及ー種檢測(cè)輸入信號(hào)的輔音區(qū)間的輔音區(qū)間檢測(cè)裝置及輔音區(qū)間檢測(cè)方法。
背景技術(shù):
人的聲音可分類為元音和輔音、或濁音和清音等。因此,利用元音、輔音、濁音及清音等各自的特征,開發(fā)出了進(jìn)行聲音檢測(cè)、識(shí)別的技木。具體而言,提出了以下技術(shù)方案對(duì)于濁音和清音,根據(jù)對(duì)輸入信號(hào)的幀的零交叉數(shù)進(jìn)行計(jì)數(shù)的零交叉法,比較幀間的零交叉數(shù),識(shí)別濁音和清音(例如專利文獻(xiàn)I)。專利文獻(xiàn)I :特開2007-292940號(hào)公報(bào)
發(fā)明內(nèi)容
而在檢測(cè)輸入信號(hào)中含有的聲音時(shí),兀音和輔音相比能量較大,因此在噪聲電平較大的環(huán)境下,元音區(qū)間(含有元音的區(qū)間)的檢測(cè)較為容易,但輔音區(qū)間(含有輔音的區(qū)間)的檢測(cè)容易產(chǎn)生輔音特征淹沒于噪聲的誤測(cè)。并且,將上述專利文獻(xiàn)I的零交叉法應(yīng)用于輔音區(qū)間的檢測(cè)時(shí),當(dāng)噪聲振幅偏向吋,因振幅偏向的影響而產(chǎn)生偏移,產(chǎn)生輸入信號(hào)不與O交叉而振動(dòng)的區(qū)間,出現(xiàn)無法檢測(cè)出輔音區(qū)間的情況。因此,本發(fā)明鑒于以上問題而出現(xiàn),其目的在于提供一種在較高的噪聲電平的環(huán)境下也可高精度檢測(cè)出輔音區(qū)間的輔音區(qū)間檢測(cè)裝置及輔音區(qū)間檢測(cè)方法。為解決上述課題,本發(fā)明的輔音區(qū)間檢測(cè)裝置的特征在于具有幀化部,以預(yù)先確定的幀単位截取輸入信號(hào),生成幀化輸入信號(hào);頻譜生成部,將上述幀化輸入信號(hào)從時(shí)間區(qū)域變換為頻率區(qū)域,生成集中了每個(gè)頻率的頻譜的頻譜圖;平均導(dǎo)出部,導(dǎo)出上述頻譜圖中的、連續(xù)的預(yù)先確定的每個(gè)帶寬的平均能量即各頻帶平均能量;輔音判斷部,將導(dǎo)出的上述各頻帶平均能量之間進(jìn)行比較,越高頻帶的各頻帶平均能量成為越高的能量時(shí),判斷上述中貞化輸入信號(hào)中含有輔音。也可以是,輔音判斷部對(duì)于在頻譜圖的相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合進(jìn)行計(jì)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第I閾值以上時(shí),判斷為含有輔音。也可以是,輔音判斷部,對(duì)于在頻譜圖的相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合,在上述大的組合跨過頻帶連續(xù)的情況下進(jìn)行加權(quán)并進(jìn)行計(jì)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第2閾值以上時(shí),判斷為含有輔音。 也可以是,輔音判斷部,提取在相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合,將提取的上述組合之間進(jìn)行比較,對(duì)高頻的頻帶的各頻帶平均能量大的組合的個(gè)數(shù)進(jìn)行計(jì)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第3閾值以上時(shí),判斷為含有輔音。也可以是,輔音判斷部包括第I判斷単元,對(duì)于相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合進(jìn)行計(jì)數(shù),在計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第I閾值以上時(shí),判斷為含有輔音;以及第2判斷単元,對(duì)于相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合,在上述大的組合跨過頻帶連續(xù)的情況下進(jìn)行加權(quán)并進(jìn)行計(jì)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第2閾值以上時(shí),判斷為含有輔音,輔音判斷部還具有噪聲電平導(dǎo)出部,導(dǎo)出上述幀化輸入信號(hào)的噪聲電平;以及判斷選擇部,當(dāng)導(dǎo)出的上述噪聲電平小于第4閾值時(shí),選擇第I判斷単元,當(dāng)導(dǎo)出的上述噪聲電平為上述第4閾值以上吋,選擇第2判斷単元。
也可以是,輔音判斷部還包括第3判斷単元,提取上述相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合,將提取的上述組合之間進(jìn)行比較,對(duì)高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合的個(gè)數(shù)進(jìn)行計(jì)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第3閾值以上時(shí),判斷為含有輔音,判斷選擇部在通過上述第2判斷単元未判斷輔音時(shí),選擇上述第3判斷單元。為解決上述課題,本發(fā)明的輔音區(qū)間檢測(cè)方法的特征在于,以預(yù)先確定的幀單位截取輸入信號(hào),生成幀化輸入信號(hào),將幀化輸入信號(hào)從時(shí)間區(qū)域變換為頻率區(qū)域,生成集中了每個(gè)頻率的頻譜的頻譜圖,導(dǎo)出上述頻譜圖中的、連續(xù)的預(yù)先確定的每個(gè)帶寬的平均能量即各頻帶平均能量,將導(dǎo)出的各頻帶平均能量之間進(jìn)行比較,越高頻帶的各頻帶平均能量成為越高的能量時(shí),判斷幀化輸入信號(hào)中含有輔音。如上所述,在本發(fā)明中,在較高的噪聲電平的環(huán)境下也可高精度地檢測(cè)出輔音區(qū)間。
圖I是用于說明輔音區(qū)間的說明圖。圖2是用于說明輔音區(qū)間的說明圖。圖3是輸入信號(hào)中重疊收錄了鬧市十字路口中的噪聲的收錄時(shí)間波形圖。圖4是用于說明通過零交叉法無法檢測(cè)的輔音區(qū)間的說明圖。圖5是用于說明通過零交叉法可檢測(cè)的輔音區(qū)間的說明圖。圖6是對(duì)不含有噪聲的輸入信號(hào)的聲音區(qū)間的判斷結(jié)果。圖7是對(duì)含有噪聲的輸入信號(hào)的聲音區(qū)間的判斷結(jié)果。圖8是表示輔音區(qū)間檢測(cè)裝置的概要功能的功能框圖。圖9是表示輸入信號(hào)的輔音區(qū)間的頻譜圖的頻譜形的一例。圖10是表示輸入信號(hào)的輔音區(qū)間的頻譜圖的頻譜形的一例。圖11是表示輸入信號(hào)的輔音區(qū)間的頻譜圖的頻譜形的一例。圖12是輸入信號(hào)的時(shí)間波形圖的一例。圖13是頻譜圖的一例。圖14是表示各頻帶平均能量的柱狀圖的一例。
圖15是表示輔音區(qū)間檢測(cè)方法的處理流程的流程圖。圖16是用于說明第I判斷単元判斷步驟的流程圖。圖17是用于說明第2判斷単元判斷步驟的流程圖。圖18是用于說明第3判斷単元判斷步驟的流程圖。
具體實(shí)施例方式以下參照附圖詳細(xì)說明本發(fā)明的優(yōu)選實(shí)施方式。該實(shí)施方式所示的尺寸、材料、其他具體數(shù)值等僅是為了易于理解發(fā)明的示例,除了特別情況外,不用于限定本發(fā)明。此外,在本說明書及附圖中,對(duì)實(shí)質(zhì)上具有同一功能、構(gòu)造的要素,通過附加相同的標(biāo)記省略重復(fù)說明,并省略和本發(fā)明沒有直接關(guān)系的要素的圖示。圖1、2是用于說明輔音區(qū)間的說明圖。其中,圖1(a)是含有聲音的輸入信號(hào)的時(shí) 間波形圖,圖1(b)是同一輸入信號(hào)同一時(shí)間下的共振峰顯示圖。如圖1(b)所示,元音區(qū)間較強(qiáng)地顯示出共振峰,因此可清晰地看到條紋形狀,但輔音區(qū)間和元音區(qū)間特性不同,所以即使觀察共振峰顯示圖,也無法判斷出輔音區(qū)間。圖2(a)表不放大了圖1(a)中的輔音區(qū)間的時(shí)間波形圖,圖2(b)表不該輔音區(qū)間的頻譜圖。輔音和元音相比,頻率成分到達(dá)高頻帶,是接近白噪聲的頻率成分的構(gòu)成。因此如圖2(b)所示,其頻譜圖具有頻帶越高、能量就越高的傾向。因此,輔音區(qū)間內(nèi)含有較多高頻成分,所以其時(shí)間波形圖中的振幅值具有頻繁在正值和負(fù)值之間移動(dòng)的特征。注意到這一點(diǎn),作為判斷輔音區(qū)間的方法,提出了零交叉法的方案。圖3是輸入信號(hào)中重疊收錄了鬧市十字路口中的噪聲的收錄時(shí)間波形圖,圖4是放大了該輔音區(qū)間的時(shí)間波形圖。圖3、4是和圖I (a)、圖2(a)所示的時(shí)間波形圖相同的輸入信號(hào)。在圖3、4所示的較高噪聲環(huán)境下,零交叉法中的誤測(cè)非常多。對(duì)其原因,通過比較輸入信號(hào)中不含有噪聲時(shí)和含有噪聲時(shí)的輔音區(qū)間來進(jìn)行說明。圖5是對(duì)比了輸入信號(hào)中不含有噪聲時(shí)和含有噪聲時(shí)的時(shí)間波形圖。其中,圖5(a)表示不含有噪聲的情況,圖5(b)表示含有噪聲的情況,圖5(c)、(d)分別放大表示圖5(a)、(b)中的輔音區(qū)間。零交叉法是,測(cè)定交叉零值(用圖5中的“-C ”表示)的次數(shù)的多少,檢測(cè)出以高頻成分為主體的輔音區(qū)間。如圖5(c)所示,在不含有噪聲的輸入信號(hào)的輔音區(qū)間的時(shí)間波形圖中,交叉零值,并頻繁在正值和負(fù)值的區(qū)間內(nèi)移動(dòng)。但是,含有噪聲的聲音信號(hào)尤其在低頻區(qū)域噪聲增大時(shí),如圖5(d)所示,發(fā)生偏移,不再交叉零值。因此零交叉法在噪聲環(huán)境下,存在無法檢測(cè)出原本不交叉零值的輔音區(qū)間的情況。圖6是對(duì)不含有噪聲的輸入信號(hào)的聲音區(qū)間的判斷結(jié)果。其中,圖6(a) (b)表示基于現(xiàn)有的濁音分析的聲音區(qū)間判斷単元的判斷結(jié)果,圖6(c) (d)表示現(xiàn)有的聲音區(qū)間判斷単元中附加了基于零交叉法的輔音區(qū)間判斷單元時(shí)的判斷結(jié)果。在圖6(a) (b)及(c) (d)中,上段表示時(shí)間波形圖,下段表示聲音區(qū)間的判斷結(jié)果。判斷結(jié)果在判斷為聲音區(qū)間時(shí)設(shè)為1,其以外設(shè)為O。從圖6可知,通過使用零交叉法,對(duì)基于現(xiàn)有的濁音分析的聲音區(qū)間判斷単元未檢測(cè)出的框線100所示的部分,可判斷為聲音區(qū)間。因此可知,在不含有噪聲的輸入信號(hào)中,可進(jìn)行零交叉法下的聲音區(qū)間的檢測(cè)。圖7是對(duì)含有噪聲的輸入信號(hào)的聲音區(qū)間的判斷結(jié)果。圖7(a) (b)表示對(duì)現(xiàn)有的聲音區(qū)間判斷單元附加了基于零交叉法的聲音區(qū)間判斷單元時(shí)的判斷結(jié)果,圖7(c) (d)是對(duì)現(xiàn)有的聲音區(qū)間判斷單元附加了本實(shí)施方式的輔音區(qū)間檢測(cè)裝置中的輔音區(qū)間判斷單元的判斷結(jié)果。在圖7(a) (b)及(c) (d)中,上段表示時(shí)間波形圖,下段表示聲音區(qū)間的判斷結(jié)果。判斷結(jié)果在通過零交叉法或本實(shí)施方式的輔音區(qū)間檢測(cè)裝置判斷為聲音區(qū)間時(shí)設(shè)為2,通過現(xiàn)有的聲音區(qū)間判斷単元判斷為聲音區(qū)間時(shí)設(shè)為1,其以外的情況設(shè)為O。參照?qǐng)D7可知,通過使用本實(shí)施方式的輔音區(qū)間檢測(cè)裝置中的輔音區(qū)間判斷単元,可將使用零交叉法也無法測(cè)出的框線102所示的部分判斷為聲音區(qū)間。 因此,在以下實(shí)施方式中,詳述在較高的噪聲電平環(huán)境下也可高精度檢測(cè)出輔音區(qū)間的輔音區(qū)間檢測(cè)裝置,說明使用了該輔音檢測(cè)裝置的輔音區(qū)間檢測(cè)方法。(輔音區(qū)間檢測(cè)裝置110)圖8是用于說明輔音區(qū)間檢測(cè)裝置110的概要構(gòu)成的功能框圖。輔音區(qū)間檢測(cè)裝置110的構(gòu)成包括幀化部120、頻譜生成部122、頻帶分割部124、平均導(dǎo)出部126、輔音判斷部128、噪聲電平導(dǎo)出部130、判斷選擇部132。幀化部120對(duì)收音裝置200收錄了聲音的輸入信號(hào),以具有預(yù)先確定的時(shí)間寬度的幀單位(規(guī)定采樣數(shù)長度)依次截取,生成幀單位的輸入信號(hào)(以下稱為“幀化輸入信號(hào)”)。并且,當(dāng)從收音裝置200輸入的輸入信號(hào)是模擬信號(hào)時(shí),可在幀化部120的前段配置AD轉(zhuǎn)換器,變換為數(shù)字信號(hào)。并且,幀化部120將生成的幀化輸入信號(hào)依次發(fā)送到頻譜生成部 122。頻譜生成部122進(jìn)行從幀化部120接收的幀化輸入信號(hào)的頻率分析,將時(shí)間區(qū)域的幀化輸入信號(hào)變換為頻率區(qū)域的幀化輸入信號(hào),生成集中了頻譜的頻譜圖。頻譜圖是,在規(guī)定的頻帶中,頻率和該頻率下的能量建立了對(duì)應(yīng)的、集中了每個(gè)頻率的頻譜的圖案。這里使用的頻率變換法不限定為特定的方法,但需要用于確認(rèn)聲音的頻譜的必要的頻率分解能力,因此可使用分解能力較高的FFT(Fast FourierTransform :快速傅里葉變換)、DCT (Discrete Cosine Transform :離散余弦變換)等正交變換法。頻帶分割部124將頻譜生成部122生成的頻譜圖的各頻譜,分割為預(yù)先確定的各帶寬,生成多個(gè)分割頻帶。在本實(shí)施方式中,頻帶分割部124例如對(duì)800Hz 3. 5kHz的頻率范圍分割為例如IOOHz 300Hz左右的各帶寬。平均導(dǎo)出部126導(dǎo)出頻譜圖中的連續(xù)的、頻帶分割部124分割的每個(gè)分割頻帶(band)的平均能量,即各頻帶平均能量。輔音判斷部128比較平均導(dǎo)出部126導(dǎo)出的各頻帶平均能量之間,越高頻頻帶的各頻帶平均能量成為能量越高時(shí),判斷該幀化輸入信號(hào)中含有輔音。一般情況下,輔音具有頻譜圖朝向右上的傾向。因此,本實(shí)施方式的輔音區(qū)間檢測(cè)裝置110通過導(dǎo)出頻譜圖中的各頻帶平均能量、比較該各頻帶能量之間,從而檢測(cè)出輔音中的特征性的、頻譜圖中的朝向右上的傾向。因此,輔音區(qū)間檢測(cè)裝置Iio可高精度地檢測(cè)出輸入信號(hào)中含有輔音的輔音區(qū)間。輔音判斷部128具體而言包括 第I判斷単元,對(duì)于相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合進(jìn)行計(jì)數(shù),在計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第I閾值以上時(shí),判斷為含有輔音;以及第2判斷單元,對(duì)于相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合,在上述大的組合跨過頻帶連續(xù)的情況下進(jìn)行加權(quán)并進(jìn)行計(jì)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第2閾值以上時(shí),判斷為含有輔音,這ニ個(gè)単元分別對(duì)應(yīng)噪聲電平分開使用。圖9 11分別是表示輸入信號(hào)的輔音區(qū)間的頻譜圖的頻譜形的一例。當(dāng)噪聲電平較小時(shí),如圖9所示,輔音區(qū)間的頻譜圖朝右上的傾向變得明顯。輔音判斷部128通過具有第I判斷単元的構(gòu)造,基于在頻譜圖的相鄰的頻帶間的各頻帶平均能量中,高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合的個(gè)數(shù),可高精度地檢測(cè)出輔音區(qū)間。另外,當(dāng)噪聲電平較大時(shí),如圖10所示,輔音區(qū)間的頻譜圖僅在相鄰的頻帶的比較中,整體朝右上的傾向也淹沒在噪聲中。輔音判斷部128通過具有第2判斷単元,在頻譜圖的相鄰的頻帶間的各頻帶平均能量中,對(duì)于高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合,尤其在這種組合在相鄰的頻帶間連續(xù)時(shí),以比I大的乘數(shù)進(jìn)行加權(quán)計(jì)數(shù)。通過進(jìn)行加權(quán),易于檢測(cè)出淹沒在噪聲中的輔音的朝右上的傾向。因 此,輔音區(qū)間檢測(cè)裝置110在噪聲電平較大時(shí),也可根據(jù)計(jì)數(shù)的值高精度地檢測(cè)出輔音區(qū)間。其中,為適當(dāng)選擇第I判斷単元和第2判斷単元,噪聲電平導(dǎo)出部130導(dǎo)出幀化輸入信號(hào)的噪聲電平。在本實(shí)施方式中,噪聲電平是幀化輸入信號(hào)的所有頻帶的各頻帶平均能量的平均值。并且,噪聲電平導(dǎo)出部130可按照每個(gè)幀化輸入信號(hào)導(dǎo)出噪聲電平,也可使用規(guī)定時(shí)間的幀化輸入信號(hào)的噪聲電平的平均值。判斷選擇部132在導(dǎo)出的噪聲電平小于第4閾值時(shí),選擇第I判斷単元,在第4閾值以上時(shí),選擇第2判斷単元。第4閾值例如是-50 -40dB。輔音區(qū)間檢測(cè)裝置110在噪聲電平小于第4閾值時(shí),選擇當(dāng)噪聲電平較低時(shí)可高精度檢測(cè)出輔音區(qū)間的第I判斷単元,在噪聲電平為第4閾值以上時(shí),選擇即使噪聲電平較高也可高精度檢測(cè)出輔音區(qū)間的第2判斷単元。因此,輔音區(qū)間檢測(cè)裝置110通過和噪聲電平對(duì)應(yīng)的適當(dāng)単元可檢測(cè)出輔音區(qū)間。并且,輔音判斷部128可進(jìn)ー步包括第3判斷単元,對(duì)于相鄰的頻帶(分割頻帶)間的各頻帶平均能量,提取高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合,比較提取的組合之間,計(jì)數(shù)高頻的頻帶的各頻帶平均能量比低頻的頻帶的各頻帶平均能量大的組合的個(gè)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第3閾值以上吋,判斷為含有輔音。當(dāng)噪聲電平較大時(shí),輔音區(qū)間的頻譜圖僅在相鄰的頻帶的比較中,存在朝右上的傾向淹沒在噪聲的情況。并且,如圖11所示,部分在多處能量下降(變?yōu)榈凸?的頻譜圖中,朝右上的傾向沒有連續(xù)性,如第2判斷単元那樣對(duì)連續(xù)性加權(quán)也無法判斷輔音。因此,輔音區(qū)間檢測(cè)裝置110對(duì)于頻譜圖的相鄰的頻帶間的各頻帶平均能量,提取高頻的頻帶的各頻帶平均能量比低頻的頻帶的各頻帶平均能量大的組合,在提取的組合之間,高頻的頻帶的各頻帶平均能量較大時(shí),即比較提取的組合之間時(shí)、高頻的頻帶的組合和低頻的頻帶的組合相比、各頻帶平均能量較大時(shí),以比I大的乘數(shù)進(jìn)行加權(quán)計(jì)數(shù)。因此,通過橫跨寬頻帶比較各頻帶平均能量,即使噪聲影響較大,也可從頻譜圖整體計(jì)數(shù)朝右上的傾向并使之?dāng)?shù)值化。因此,輔音區(qū)間檢測(cè)裝置110可根據(jù)計(jì)數(shù)的值高精度地檢測(cè)輔音區(qū)間。
并且,判斷選擇部132在通過第2判斷単元未判斷出輔音時(shí),選擇第3判斷単元。輔音判斷部128即使使用第2判斷単元也未判斷出輔音的情況下,也有可能漏測(cè)輔音區(qū)間。因此,通過第2判斷単元未判斷出輔音時(shí),輔音判斷部128進(jìn)ー步使用不易受到噪聲影響的第3判斷単元嘗試進(jìn)行輔音的檢測(cè)。通過這ー構(gòu)成,輔音區(qū)間檢測(cè)裝置110可更切實(shí)地檢測(cè)出輔音區(qū)間。圖12是輸入信號(hào)的時(shí)間波形圖的一例,圖13是該輸入信號(hào)的頻譜圖的一例,圖14是表示該頻譜圖的各頻帶平均能量的柱狀圖的一例。對(duì)于圖12所示的輸入信號(hào)的區(qū)間210,當(dāng)生成了頻譜圖時(shí),如圖13所示,難以直接檢測(cè)出朝右上的傾向。但將作為每個(gè)適當(dāng)頻帶的能量的平均值的各頻帶平均能量用柱狀圖表示時(shí),可知部分具有朝右上的傾向。在第2判斷単元中,通過該部分性朝右上的傾向的強(qiáng)度,判斷是否是輔音區(qū)間。并且,即使通過第2判斷単元未判斷出是輔音區(qū)間時(shí),也通過第3判斷単元判斷輔音區(qū)間,因此無論怎樣均可提高輔音區(qū)間的檢測(cè)精度。如上所述,根據(jù)本實(shí)施方式的輔音區(qū)間檢測(cè)裝置110,在較高的噪聲電平環(huán)境下,也可高精度地檢測(cè)出輔音區(qū)間。(輔音區(qū)間檢測(cè)方法)接著說明使用上述輔音區(qū)間檢測(cè)裝置110分析輸入信號(hào)、判斷是否是輔音區(qū)間的輔音區(qū)間檢測(cè)方法。圖15是表示輔音區(qū)間檢測(cè)方法的處理流程的流程圖。當(dāng)有輸入信號(hào)的輸入時(shí)(S300中“是”),幀化部120將輔音區(qū)間檢測(cè)裝置110取得的輸入信號(hào)以規(guī)定的幀單位依次截取,生成幀化輸入信號(hào)(S302)。并且,頻譜生成部122進(jìn)行從幀化部120接收的幀化輸入信號(hào)的頻率分析,將時(shí)間區(qū)域的幀化輸入信號(hào)變換為頻率區(qū)域的幀化輸入信號(hào),生成頻譜圖(S304)ο頻帶分割部124將頻譜圖的各頻譜分割為多個(gè)分割頻帶,對(duì)各分割頻帶從O開始按照升序添加代碼(S306)。平均導(dǎo)出部126導(dǎo)出頻譜圖中的、作為連續(xù)的每個(gè)分割頻帶的各頻帶平均能量的各頻帶平均能量(S308)。噪聲電平導(dǎo)出部130導(dǎo)出幀化輸入信號(hào)的噪聲電平(S310)。輔音判斷部128判斷噪聲電平導(dǎo)出部130導(dǎo)出的噪聲電平是否小于第4閾值(S312)。當(dāng)小于第4閾值時(shí)(S312中“是”),輔音判斷部128通過第I判斷単元進(jìn)行輔音區(qū)間的判斷(S314)。當(dāng)是第4閾值以上時(shí)(S312中“否”),輔音判斷部128通過第2判斷単元進(jìn)行輔音區(qū)間的判斷(S316)。在第2判斷単元判斷步驟S316中,判斷是否判斷為輔音區(qū)間(S318),當(dāng)未判斷是輔音區(qū)間時(shí)(S318中“否”),輔音判斷部128通過第3判斷単元進(jìn)行輔音區(qū)間的判斷(S320)。并且,輔音判斷部128將輔音區(qū)間的判斷結(jié)果(在任意ー個(gè)判斷単元中判斷為輔音區(qū)間時(shí),判斷結(jié)果變?yōu)檩o音區(qū)間)輸出到外部裝置(S322),返回到輸入信號(hào)判斷步驟S300。接著參照?qǐng)D16說明第I判斷単元。圖16是用于說明第I判斷単元判斷步驟S314的流程圖。在第I判斷単元判斷步驟S314中,對(duì)頻帶從頻率低的頻帶開始依次添加從O開始的整數(shù)代碼。輔音判斷部128將O代入到變量n、count中,進(jìn)行初始化(S350),判斷添加了代碼n+1的頻帶的各頻帶平均能量,是否大于添加了代碼η的頻帶的各頻帶平均能量(S352)。大于時(shí)(S352中“是”),即和關(guān)注的頻帶相比高頻的頻帶的各頻帶平均能量較高時(shí),對(duì)變量count加I (S354)。添加了代碼n+1的頻帶的各頻帶平均能量為添加了代碼η的頻帶的各頻帶平均能量以下時(shí)(S352中“否”),變量count保持不變。并且,輔音判斷部128判斷是否存在添加了代碼n+2的頻帶(S356)。當(dāng)存在添加了代碼n+2的頻帶時(shí)(S356中“是”),輔音判斷部128對(duì)變量η加I (S358),返回到能量判斷步驟S352。當(dāng)不存在添加了代碼n+2的頻帶時(shí)(S356中“否”),所有頻帶的各頻帶平均能量的比較結(jié)束,因此輔音判斷部128判斷變量count是否是預(yù)先確定的第I閾值以上(S360)。當(dāng)是第I閾值以 上時(shí)(S360中“是”),輔音判斷部128判斷為含有輔音(S362)。并且,當(dāng)小于第I閾值時(shí)(S360中“否”),輔音判斷部128判斷不含有輔音(S364)。接著參照?qǐng)D17說明第2判斷単元。圖17是用于說明第2判斷単元判斷步驟S316的流程圖。在第2判斷単元判斷步驟S316中,和第I判斷単元判斷步驟S314 —祥,對(duì)頻帶從頻率低的頻帶開始依次添加從O開始的整數(shù)的代碼。輔音判斷部128將O代入到變量n、count,將I代入到P,進(jìn)行初始化(S400),判斷添加了代碼n+1的頻帶的各頻帶平均能量是否大于添加了代碼η的頻帶的各頻帶平均能量(S402)。大于時(shí)(S402中“是”),對(duì)變量count添加變量p(S404)。并且,輔音判斷部128向變量P加I (S406)。當(dāng)添加了代碼n+1的頻帶的各頻帶平均能量是添加了代碼η的頻帶的各頻帶平均能量以下時(shí)(S402中“否”),變量count保持不變,將I代入到變量P,重置變量 P (S408)。并且,輔音判斷部128判斷是否存在添加了代碼n+2的頻帶(S410)。當(dāng)存在添加了代碼n+2的頻帶時(shí)(S410中“是”),輔音判斷部128向變量η加I (S412),返回到能量判斷步驟S402。當(dāng)不存在添加了代碼n+2的頻帶時(shí)(S310中“否”),所有頻帶的各頻帶平均能量的比較結(jié)束,因此輔音判斷部128判斷變量count是否是預(yù)先確定的第2閾值以上(S414)。當(dāng)是第2閾值以上時(shí)(S414中“是”),輔音判斷部128判斷為含有輔音(S416)。并且,當(dāng)小于第2閾值時(shí)(S414中“否,,),輔音判斷部128判斷不含有輔音(S418)。相鄰的頻帶間連續(xù)地、高頻的頻帶的各頻帶平均能量比較低的頻率的頻帶的各頻帶平均能量高,是輔音區(qū)間的特征。如上所述,輔音判斷部128連續(xù)性地加權(quán)進(jìn)行輔音區(qū)間的判斷,從而可避免因噪聲影響無法判斷為輔音區(qū)間的頻帶增加、作為判斷指標(biāo)的變量count的值變低的情況,輔音區(qū)間檢測(cè)裝置110在較高的噪聲電平環(huán)境下,可抑制輔音區(qū)間的漏測(cè)。并且,當(dāng)噪聲電平低于第4閾值時(shí),第2判斷単元不執(zhí)行,因此在噪聲電平較低的環(huán)境下,可避免將不是輔音區(qū)間的區(qū)間誤判為輔音區(qū)間。接著參照?qǐng)D18說明第3判斷単元。圖18是用于說明第3判斷単元判斷步驟S320的流程圖。在第3判斷単元判斷步驟S320中,也和第I判斷単元判斷步驟S314 —祥,對(duì)頻帶從頻率低的頻帶開始依次添加從O開始的整數(shù)代碼。輔音判斷部128將O代入到變量n、m、k、count,進(jìn)行初始化(S450),判斷添加了代碼n+1的頻帶的各頻帶平均能量是否大于添加了代碼η的頻帶的各頻帶平均能量(S452)。大于時(shí)(S452中“是”),向組合(m)代入添加了代碼n+1的頻帶的各頻帶平均能量,為確保各頻帶平均能量連續(xù)變大,對(duì)變量k設(shè)定I (S454)。當(dāng)添加了代碼n+1的頻帶的各頻帶平均能量為添加了代碼η的頻帶的各頻帶平均能量以下時(shí)(S452中“否”),判斷變量k是否是1(S456),如變量k是1(S456中“是”),則向變量m加1,對(duì)k設(shè)定為O (S458)。如變量k不是I、即,如果是O (S456中“否”),則變量m不變,轉(zhuǎn)換到頻帶判斷步驟S460。并且,輔音判斷部128判斷是否存在添加了代碼n+2的頻帶(S460)。當(dāng)存在添加了代碼n+2的頻帶時(shí)(S460中“是”),輔音判斷部128向變量η加I (S462),返回到能量判斷步驟S452。當(dāng)不存在添加了代碼n+2的頻帶時(shí)(S460中“否”),所有頻帶的各頻帶平均能量的比較結(jié)束,因此對(duì)變量m代入O并重置(S464),判斷組合(m+1)的各頻帶平均能量是否大于組合(m)的各頻帶平均能量(S466)。大于時(shí)(S466中“是”),即和關(guān)注的頻帶相比高頻的頻帶的各頻帶平均能量較高時(shí),向變量count加1(S468)。組合(m+1)的各頻帶平均能量為組合(m)的各頻帶平均能量以下時(shí)(S466中“否”),變量count不變。并且,輔音判斷部128判斷是否存在組合(m+2) (S470)。當(dāng)存在組合(m+2)時(shí)(S470中“是,,),輔音判斷部128對(duì)變量m加I (S472),返回到能量判斷步驟S466。當(dāng)不存在組合(m+2)時(shí)(S470中“否”),所有組合的各頻帶平均能量的比較結(jié)束,因此輔音判斷部128判斷變量count是否是預(yù)先確定的第3閾值以上(S474)。當(dāng)是第3閾值以上時(shí)(S474中“是”),輔音判斷部128判斷為含有輔音(S476)。并且,當(dāng)小于第3閾值時(shí)(S474中“否,,),輔音判斷部128判斷不含有輔音(S478)。在噪聲電平較高的環(huán)境下,在相鄰的頻帶之間,存在因噪聲的影響而使輔音的特征部分喪失的情況。在第3判斷単元中,不比較相鄰的頻帶間的各頻帶平均能量,而比較高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合的最大值之間,從而使頻率軸上的橫跨較大頻帶的輔音特征數(shù)值化(模型化),判斷是否是輔音區(qū)間。因此,在噪聲電平較高的環(huán)境下,可對(duì)較大頻帶的能量推移加值,將輔音區(qū)間的特征反映到計(jì)數(shù)值中。如上所述,在第2判斷単元中,連續(xù)性地進(jìn)行加權(quán)時(shí),能量平均值以相同次數(shù)増加的情況下,相對(duì)斷續(xù)地增加時(shí),連續(xù)増加時(shí)的變量P的值變大。通過這ー構(gòu)成,可進(jìn)行捕捉到輔音區(qū)間的頻譜圖特征的輔音區(qū)間的檢測(cè)。并且在本實(shí)施方式中,對(duì)變量P加上的值是1,但不限于1,也可是I以上的值。進(jìn)ー步,在上述實(shí)施方式中,對(duì)比較各頻帶平均能量的頻帶沒有設(shè)定限制,但例如為了避免噪聲影響,根據(jù)使用情況也可限定比較的頻帶的頻率范圍。具體而言,一般情況下噪聲形成的能量成分高、低的頻帶(約IkHz以下)、頻率解析(頻譜圖生成)處理中的易含有折返應(yīng)變的較高頻帶(約3. 5kHz以上)可排除。因此,通過限定比較的頻帶的頻率范圍,輔音區(qū)間檢測(cè)裝置110在噪聲電平較高的環(huán)境下,也可抑制輔音區(qū)間的誤測(cè)。通過以上說明的輔音區(qū)間檢測(cè)方法,無論噪聲電平如何均可檢測(cè)出輸入信號(hào)的聲音區(qū)間。以上參照
了本發(fā)明的優(yōu)選實(shí)施方式,但本發(fā)明當(dāng)然不限于上述實(shí)施方式。對(duì)本領(lǐng)域技術(shù)人員而言,在權(quán)利要求范圍所述范疇內(nèi),當(dāng)然可想到各種變形例或修正例,這些當(dāng)然也屬于本發(fā)明的技術(shù)范圍內(nèi)。此外,本說明書中的輔音區(qū)間檢測(cè)方法中的各步驟無需根據(jù)作為流程圖所述的順序按照時(shí)間序列進(jìn)行處理,也可包括并列的或子程序下的處理。本發(fā)明可應(yīng)用于檢測(cè)輸入信號(hào)的輔音區(qū)間的輔音區(qū)間檢測(cè)裝置及輔音區(qū)間檢測(cè)方法。
權(quán)利要求
1.一種輔音區(qū)間檢測(cè)裝置,其特征在于,具有 幀化部,以預(yù)先確定的幀單位截取輸入信號(hào),生成幀化輸入信號(hào); 頻譜生成部,將上述幀化輸入信號(hào)從時(shí)間區(qū)域變換為頻率區(qū)域,生成集中了每個(gè)頻率的頻譜的頻譜圖; 平均導(dǎo)出部,導(dǎo)出上述頻譜圖中的、連續(xù)的預(yù)先確定的每個(gè)帶寬的平均能量即各頻帶平均能量; 輔音判斷部,將導(dǎo)出的上述各頻帶平均能量之間進(jìn)行比較,越高頻帶的各頻帶平均能量成為越高的能量時(shí),判斷上述幀化輸入信號(hào)中含有輔音。
2.根據(jù)權(quán)利要求I所述的輔音區(qū)間檢測(cè)裝置,其特征在于, 上述輔音判斷部對(duì)于在上述頻譜圖的相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合進(jìn)行計(jì)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第I閾值以上時(shí),判斷為含有輔音。
3.根據(jù)權(quán)利要求I所述的輔音區(qū)間檢測(cè)裝置,其特征在于, 上述輔音判斷部,對(duì)于在上述頻譜圖的相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合,在上述大的組合跨過頻帶連續(xù)的情況下進(jìn)行加權(quán)并進(jìn)行計(jì)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第2閾值以上時(shí),判斷為含有輔音。
4.根據(jù)權(quán)利要求I所述的輔音區(qū)間檢測(cè)裝置,其特征在于, 上述輔音判斷部,提取在相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合,將提取的上述組合之間進(jìn)行比較,對(duì)高頻的頻帶的各頻帶平均能量大的組合的個(gè)數(shù)進(jìn)行計(jì)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第3閾值以上時(shí),判斷為含有輔音。
5.根據(jù)權(quán)利要求I所述的輔音區(qū)間檢測(cè)裝置,其特征在于, 上述輔音判斷部包括 第I判斷單元,對(duì)于相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合進(jìn)行計(jì)數(shù),在計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第I閾值以上時(shí),判斷為含有輔音;以及 第2判斷單元,對(duì)于相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合,在上述大的組合跨過頻帶連續(xù)的情況下進(jìn)行加權(quán)并進(jìn)行計(jì)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第2閾值以上時(shí),判斷為含有輔音, 上述輔音判斷部還具有 噪聲電平導(dǎo)出部,導(dǎo)出上述幀化輸入信號(hào)的噪聲電平;以及 判斷選擇部,當(dāng)導(dǎo)出的上述噪聲電平小于第4閾值時(shí),選擇第I判斷單元,當(dāng)導(dǎo)出的上述噪聲電平為上述第4閾值以上時(shí),選擇第2判斷單元。
6.根據(jù)權(quán)利要求5所述的輔音區(qū)間檢測(cè)裝置,其特征在于, 上述輔音判斷部還包括第3判斷單元,提取上述相鄰的頻帶間的各頻帶平均能量中高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合,將提取的上述組合之間進(jìn)行比較,對(duì)高頻的頻帶的各頻帶平均能量比相鄰的低頻的頻帶的各頻帶平均能量大的組合的個(gè)數(shù)進(jìn)行計(jì)數(shù),當(dāng)計(jì)數(shù)的計(jì)數(shù)值為預(yù)先確定的第3閾值以上時(shí),判斷為含有輔音, 上述判斷選擇部在通過上述第2判斷單元未判斷輔音時(shí),選擇上述第3判斷單元。
7.一種輔音區(qū)間檢測(cè)方法,其特征在于, 以預(yù)先確定的幀單位截取輸入信號(hào),生成幀化輸入信號(hào), 將上述幀化輸入信號(hào)從時(shí)間區(qū)域變換為頻率區(qū)域,生成集中了每個(gè)頻率的頻譜的頻譜圖, 導(dǎo)出上述頻譜圖中的、連續(xù)的預(yù)先確定的每個(gè)帶寬的平均能量即各頻帶平均能量, 將導(dǎo)出的上述各頻帶平均能量之間進(jìn)行比較,越高頻帶的各頻帶平均能量成為越高的能量時(shí),判斷上述幀化輸入信號(hào)中含有輔音。
全文摘要
本發(fā)明提供一種輔音區(qū)間檢測(cè)裝置及輔音區(qū)間檢測(cè)方法,在較高的噪聲電平環(huán)境下也可高精度地檢測(cè)輔音區(qū)間,輔音區(qū)間檢測(cè)裝置(110)具有幀化部(120),以預(yù)先確定的幀單位截取輸入信號(hào),生成幀化輸入信號(hào);頻譜生成部(122),將幀化輸入信號(hào)從時(shí)間區(qū)域變換為頻率區(qū)域,生成集中了每個(gè)頻率的頻譜的頻譜圖;平均導(dǎo)出部(126),導(dǎo)出頻譜圖中的、連續(xù)的預(yù)先確定的每個(gè)帶寬的平均能量即各頻帶平均能量;輔音判斷部(128),將導(dǎo)出的各頻帶平均能量之間進(jìn)行比較,越高頻帶的各頻帶平均能量成為越高的能量時(shí),判斷幀化輸入信號(hào)中含有輔音。
文檔編號(hào)G10L11/00GK102629470SQ20121002230
公開日2012年8月8日 申請(qǐng)日期2012年2月1日 優(yōu)先權(quán)日2011年2月2日
發(fā)明者山邊孝朗, 明智明子 申請(qǐng)人:Jvc建伍株式會(huì)社