信號(hào)處理裝置、信號(hào)處理方法和信號(hào)處理程序的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及一種抑制具有非穩(wěn)定分量的噪聲的技術(shù)。
【背景技術(shù)】
[0002] 在W上技術(shù)領(lǐng)域中,專利文獻(xiàn)1公開(kāi)一種通過(guò)將輸入聲信號(hào)分離成低、中和高頻 帶來(lái)減少風(fēng)噪聲的技術(shù)。在專利文獻(xiàn)1中,從中頻帶分量生成低頻帶中的恢復(fù)信號(hào),通過(guò)對(duì) 恢復(fù)信號(hào)和原有低頻帶信號(hào)的加權(quán)和來(lái)生成用于低頻帶的校正的聲信號(hào),并且通過(guò)減少中 頻帶分量的信號(hào)電平來(lái)生成用于中頻帶的校正的聲信號(hào)。最后,組合原有高頻帶信號(hào)W及 用于低和中頻帶的校正的聲信號(hào)中的每個(gè)校正的聲信號(hào)W生成增強(qiáng)的信號(hào)。
[0003] 專利文獻(xiàn)2公開(kāi)一種將輸入聲音分離成低和高頻帶并且根據(jù)風(fēng)噪聲的概率抑制 低頻帶有噪語(yǔ)音信號(hào)中所包括的風(fēng)噪聲的技術(shù)。
[0004] 引用列表 [000引專利文獻(xiàn)
[0006] 專利文獻(xiàn)1 :日本專利特開(kāi)號(hào)2009-55583
[0007] 專利文獻(xiàn)2 :日本專利特開(kāi)號(hào)2012-239017 [000引專利文獻(xiàn)3 :國(guó)際公開(kāi)號(hào)2012/070668
[0009] 非專利文獻(xiàn)
[0010] 非專利文獻(xiàn) 1 :M.Kato,A.Sugiyama,和M.Serizawa,"NoiseSU卵ressionwith highspeechqualitybasedonweightednoiseestimationandMMSESTSA,"IEICE Trans.F^mdamentals(日本版),vol.J87-A,no. 7,pp. 851-860, 2004 年 7 月
[0011] 非專矛U文南犬2 :R.Martin,"Spectralsubtractionbasedonminimumstatistic s,"EUSPICO-94,pp. 1182-1185, 1994 年 9 月
[0012] 非專利文獻(xiàn) 3 ::IE邸TRANSACTIONSONACOUSTICS,SP邸CH,ANDSIGNALPROCESS ING,VOL. 32,NO. 6,PP. 1109-1121,1984 年 12 月
[0013] 非專利文獻(xiàn) 4 :3GPPTechnicalSpecification26. 094,vol. 5. 0. 0, 2002 年 6 月
[0014] 非專利文獻(xiàn) 5 :3GPPTechnicalSpecification26. 194,vol. 5. 0. 0, 2001 年 3 月
[0015] 非專利文獻(xiàn) 6 :A.Davis,S.Nor化olm,R.To即eri,"StatisticalVoice ActivityDetectionUsingLow-VarianceSpectrumEstimationandanAdaptive T虹eshold, "IE邸TRANSACTIONSONAUDIO,SP邸CH,ANDLANGUAGEPROCESSING,vol. 14,no .2,pp.412-424,2006年 3 月
[0016] 非專利文獻(xiàn) 7 :K.Li,M.N.S.Swamy,M. 0.Ahmad,"AnImprovedVoiceActivity DetectionUsingHi曲erOrderStatistics, "IE邸TRANSACTIONSONSP邸CHANDAUDIO PROCESSING,vol. 13,no. 5,pp. 965-974, 2005 年 9 月。
【發(fā)明內(nèi)容】
[0017] 技術(shù)問(wèn)題
[0018] 然而,在專利文獻(xiàn)I和2中描述的技術(shù)中的任一種技術(shù)簡(jiǎn)單地通過(guò)減少低頻帶中 的語(yǔ)音信號(hào)的信號(hào)電平來(lái)抑制風(fēng)噪聲,而不是作為抑制非穩(wěn)定噪聲、如風(fēng)噪聲的方法的一 種有效方法。因而,不可能將輸入聲音改變成易于聽(tīng)見(jiàn)的聲音。
[0019] 本發(fā)明使得能夠提供一種解決W上描述的問(wèn)題的技術(shù)。
[0020] 對(duì)問(wèn)題的解決方案
[0021] 本發(fā)明的一個(gè)方面提供一種信號(hào)處理裝置,該信號(hào)處理裝置包括:
[0022] 變換器,將輸入信號(hào)變換成頻域中的振幅分量信號(hào);
[0023] 穩(wěn)定分量估計(jì)器,其基于頻域中的振幅分量信號(hào)估計(jì)具有具備穩(wěn)定特性的頻率譜 的穩(wěn)定分量信號(hào);
[0024] 替換單元,其使用由變換器獲得的振幅分量信號(hào)和穩(wěn)定分量信號(hào)來(lái)生成新振幅分 量信號(hào)并且用新振幅分量信號(hào)替換振幅分量信號(hào);W及
[0025] 逆變換器,其將新振幅分量信號(hào)逆變換成增強(qiáng)的信號(hào)。
[0026] 本發(fā)明的另一方面提供一種信號(hào)處理方法,該信號(hào)處理方法包括:
[0027] 將輸入信號(hào)變換成頻域中的振幅分量信號(hào);
[0028] 基于頻域中的振幅分量信號(hào)估計(jì)具有具備穩(wěn)定特性的頻率譜的穩(wěn)定分量信號(hào);
[0029] 使用在變換中獲得的振幅分量信號(hào)和穩(wěn)定分量信號(hào)來(lái)生成新振幅分量信號(hào)并且 用新振幅分量信號(hào)替換振幅分量信號(hào);W及
[0030] 將新振幅分量信號(hào)逆變換成增強(qiáng)的信號(hào)。
[0031] 本發(fā)明的更多其它方面提供一種用于使計(jì)算機(jī)執(zhí)行方法的信號(hào)處理程序,該方法 包括:
[0032] 將輸入信號(hào)變換成頻域中的振幅分量信號(hào);
[0033] 基于頻域中的振幅分量信號(hào)估計(jì)具有具備穩(wěn)定特性的頻率譜的穩(wěn)定分量信號(hào);
[0034] 使用在變換中獲得的振幅分量信號(hào)和穩(wěn)定分量信號(hào)來(lái)生成新振幅分量信號(hào)并且 用新振幅分量信號(hào)替換振幅分量信號(hào);W及
[0035] 將新振幅分量信號(hào)逆變換成增強(qiáng)的信號(hào)。
[0036] 發(fā)明的有益效果
[0037] 根據(jù)本發(fā)明,有可能將輸入聲音改變成易于聽(tīng)見(jiàn)的聲音。
【附圖說(shuō)明】
[003引圖1是示出根據(jù)本發(fā)明的第一實(shí)施例的信號(hào)處理裝置的布置的框圖;
[0039] 圖2A是示出根據(jù)本發(fā)明的第二實(shí)施例的信號(hào)處理裝置的布置的框圖;
[0040] 圖2B是示出根據(jù)本發(fā)明的第二實(shí)施例的變換器的布置的框圖;
[0041] 圖2C是示出根據(jù)本發(fā)明的第二實(shí)施例的逆變換器的布置的框圖;
[0042] 圖3是示出根據(jù)本發(fā)明的第二實(shí)施例的信號(hào)處理裝置的信號(hào)處理結(jié)果的視圖;
[0043] 圖4是示出根據(jù)本發(fā)明的第二實(shí)施例的信號(hào)處理裝置的信號(hào)處理結(jié)果的視圖;
[0044] 圖5是示出根據(jù)本發(fā)明的第二實(shí)施例的信號(hào)處理裝置的信號(hào)處理結(jié)果的定時(shí)圖;
[0045] 圖6是示出根據(jù)本發(fā)明的第=實(shí)施例的替換單元的布置的框圖;
[0046] 圖7是示出根據(jù)本發(fā)明的第S實(shí)施例的信號(hào)處理裝置的信號(hào)處理結(jié)果的視圖;
[0047] 圖8是示出根據(jù)本發(fā)明的第S實(shí)施例的信號(hào)處理裝置的信號(hào)處理結(jié)果的視圖;
[004引圖9是示出根據(jù)本發(fā)明的第四實(shí)施例的替換單元的布置的框圖;
[0049]圖10是示出根據(jù)本發(fā)明的第四實(shí)施例的替換單元的信號(hào)處理結(jié)果的圖形;
[0050] 圖11是示出根據(jù)本發(fā)明的第四實(shí)施例的替換單元的信號(hào)處理結(jié)果的視圖;
[0051]圖12是示出根據(jù)本發(fā)明的第五實(shí)施例的替換單元的布置的框圖;
[0052] 圖13是示出根據(jù)本發(fā)明的第五實(shí)施例的替換單元的信號(hào)處理結(jié)果的視圖;
[0053]圖14是示出根據(jù)本發(fā)明的第六實(shí)施例的替換單元的布置的框圖;
[0054] 圖15是示出根據(jù)本發(fā)明的第六實(shí)施例的替換單元的信號(hào)處理結(jié)果的視圖;
[0055]圖16是示出根據(jù)本發(fā)明的第屯實(shí)施例的替換單元的布置的框圖;
[0056] 圖17是示出根據(jù)本發(fā)明的第八實(shí)施例的信號(hào)處理裝置的布置的框圖;
[0057] 圖18是示出根據(jù)本發(fā)明的第九實(shí)施例的信號(hào)處理裝置的布置的框圖;
[005引圖19是示出根據(jù)本發(fā)明的第九實(shí)施例的語(yǔ)音檢測(cè)器的布置的示例的框圖;
[0059] 圖20是示出根據(jù)本發(fā)明的第九實(shí)施例的語(yǔ)音檢測(cè)器的布置的另一示例的框圖;
[0060] 圖21是示出根據(jù)本發(fā)明的第九實(shí)施例的信號(hào)處理裝置的信號(hào)處理結(jié)果的視圖;
[0061]圖22是示出根據(jù)本發(fā)明的第十實(shí)施例的替換單元的布置的框圖;
[0062] 圖23是示出根據(jù)本發(fā)明的第十一實(shí)施例的替換單元的布置的框圖;
[0063]圖24是示出根據(jù)本發(fā)明的第十二實(shí)施例的替換單元的布置的框圖;
[0064] 圖25是示出根據(jù)本發(fā)明的第十S實(shí)施例的替換單元的布置的框圖;
[0065]圖26是示出根據(jù)本發(fā)明的第十四實(shí)施例的替換單元的布置的框圖;
[0066] 圖27是示出根據(jù)本發(fā)明的第十五實(shí)施例的信號(hào)處理裝置的布置的框圖;
[0067] 圖28是示出根據(jù)本發(fā)明的第十五實(shí)施例的噪聲抑制器的布置的框圖;
[006引圖29是示出根據(jù)本發(fā)明的第十六實(shí)施例的替換單元的布置的框圖;
[0069] 圖30是示出根據(jù)本發(fā)明的第十屯實(shí)施例的信號(hào)處理裝置的布置的框圖;W及
[0070] 圖31是示出在根據(jù)本發(fā)明的實(shí)施例的信號(hào)處理裝置由軟件實(shí)施時(shí)的布置的框 圖。
【具體實(shí)施方式】
[0071] 現(xiàn)在將參照附圖具體地描述本發(fā)明的優(yōu)選實(shí)施例。應(yīng)當(dāng)注意在運(yùn)些實(shí)施例中闡述 的部件的相對(duì)布置、數(shù)值表達(dá)式和數(shù)值除非具體地另外陳述,否則不限制本發(fā)明的范圍。注 意,在W下說(shuō)明中的"語(yǔ)音信號(hào)"指示根據(jù)語(yǔ)音或者另一聲音的影響而出現(xiàn)的直接電改變。 語(yǔ)音信號(hào)傳輸語(yǔ)音或者另一聲音,但不限于語(yǔ)音。
[007引[第一實(shí)施例]
[0073] 將參照?qǐng)D1描述根據(jù)本發(fā)明的第一實(shí)施例的信號(hào)處理裝置100。如圖1中所示,信 號(hào)處理裝置100包括變換器101、穩(wěn)定分量估計(jì)器102、替換單元103和逆變換器104。
[0074] 變換器101將輸入信號(hào)110變換成頻域中的振幅分量信號(hào)130。
[00巧]穩(wěn)定分量估計(jì)器102基于頻域中的振幅分量信號(hào)130估計(jì)具有具備穩(wěn)定特性的頻 率譜的穩(wěn)定分量信號(hào)140。替換單元103使用振幅分量信號(hào)130和穩(wěn)定分量信號(hào)140來(lái)生 成新振幅分量信號(hào)150并且用新振幅分量信號(hào)150替換振幅分量信號(hào)130。逆變換器104 將新振幅分量信號(hào)150逆變換成增強(qiáng)的信號(hào)160。
[0076]有了W上布置,有可能通過(guò)用穩(wěn)定、易于聽(tīng)見(jiàn)的噪聲替換在輸入聲音中包括的噪 聲來(lái)抑制令人不愉快的非穩(wěn)定噪聲。
[0077][第二實(shí)施例]
[007引 << 總體布置〉〉
[0079] 將參照附圖描述根據(jù)本發(fā)明的第二實(shí)施例的信號(hào)處理裝置。根據(jù)該實(shí)施例的信號(hào) 處理裝置例如適當(dāng)?shù)匾种品欠€(wěn)定噪聲、如風(fēng)噪聲。簡(jiǎn)而言之,在頻域中,估計(jì)輸入聲音中的 穩(wěn)定分量,并且用估計(jì)的穩(wěn)定分量替換輸入聲音的部分或者全部。輸入聲音不限于語(yǔ)音。例 如,環(huán)境聲音(街道上的噪聲、火車/汽車的行駛聲音、報(bào)警/警告聲音、拍手聲等)、人的語(yǔ) 音或者動(dòng)物的聲音(鳥(niǎo)兒的調(diào)嗽、狗的巧叫、貓的喃叫、笑聲、淚聲、歡呼等)、音樂(lè)等可W用 作輸入聲音。注意,W語(yǔ)音作為在該實(shí)施例中的輸入聲音的代表示例。
[0080] 圖2A是示出信號(hào)處理裝置200的總體布置的框圖。向輸入端子206提供有噪信 號(hào)(包括希望的信號(hào)和噪聲二者的信號(hào))為一系列采樣值。向輸入端子206提供的有噪信 號(hào)在變換器201中經(jīng)歷變換、諸如傅里葉變換并且被劃分成多個(gè)頻率分量。在頻率基礎(chǔ)上 獨(dú)立地處理多個(gè)頻率分量。運(yùn)里將通過(guò)關(guān)注特定頻率分量來(lái)繼續(xù)描述。從頻率分量之中, 向穩(wěn)定分量估計(jì)器202和替換單元203提供振幅譜(振幅分量)|X(k,n)I,并且向逆變換器 204提供相位譜(相位分量)220。注意,變換器201運(yùn)里向穩(wěn)定分量估計(jì)器202和替換單 元203提供有噪信號(hào)振幅譜IX化,n)I。然而,本發(fā)明不限于此,而可W提供與振幅譜的平方 對(duì)應(yīng)的功率譜。
[0081] 穩(wěn)定分量估計(jì)器202估計(jì)在從變換器201提供的有噪信號(hào)振幅譜Ix化,n)I中包 括的穩(wěn)定分量并且生成穩(wěn)定分量信號(hào)(穩(wěn)定分量譜)N化,n)。
[0082] 替換單元203使用生成的穩(wěn)定分量譜N(k,n)來(lái)替換從變換器201供應(yīng)的有噪信 號(hào)振幅譜Ix化,n)I并且向逆變換器204傳輸增強(qiáng)的信號(hào)振幅譜Iy化,n)I作為替換結(jié)果。
[0083] 逆變換器204通過(guò)合成從變換器201供應(yīng)的有噪信號(hào)相位譜220來(lái)將從替換單元 203供應(yīng)的增強(qiáng)的信號(hào)相位譜Iy化,n)I逆變換成結(jié)果信號(hào)并且向輸出端子2