本發(fā)明實施例涉及電子技術(shù),尤其涉及一種用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計方法、裝置及系統(tǒng)。
背景技術(shù):
語義識別可以分為特定人的語音識別和非特定人的語音識別,其目的在于理解話語中的單詞和句子,也就是對語音中的內(nèi)容進行識別。對于特定人語音識別模式,語音識別的對象主要是針對特定的一個人或者若干個人,通過對特定的人的語音樣本進行訓(xùn)練,對其中的語音特征參數(shù)進行提取,實現(xiàn)對該特定的人的有效識別;而對于非特定人的語音識別,針對的則是大眾人群,在產(chǎn)品出廠之前就已經(jīng)完成參數(shù)的訓(xùn)練,不需要由用戶進行訓(xùn)練,非特定人的語音識別理論上的目標是能夠?qū)θ我挥脩舻恼Z音輸入進行識別,由于以上更高的要求,非特定人的語音識別必須采集大量的語音樣本進行訓(xùn)練,才能夠?qū)θ我挥脩舻目赡茌斎氲恼Z音特性進行涵蓋,因此,難度高于特定人的語音識別。
在進行語音識別的過程中,需要由當(dāng)前的語音設(shè)備對用戶的輸入語音進行采集,對用戶的語音參數(shù)進行分析與處理,將以上的信息進行計算,最終得到語音識別的結(jié)果。通常進行計算的過程中,語音設(shè)備需要將輸入的語音信號轉(zhuǎn)換為數(shù)字信號,才能夠由語音識別模塊進行分析與處理。因此,語音設(shè)備是需要集成模擬數(shù)字轉(zhuǎn)換器(adc)模塊,將用戶的模擬信號轉(zhuǎn)換為數(shù)字信號。同時,模擬數(shù)字轉(zhuǎn)換器(adc)模塊的性能對語音識別的效果具有重要的影響,為了得到較為理想的語音識別效果,需要對模擬數(shù)字轉(zhuǎn)換器(adc)模塊進行有效合理地設(shè)計。
技術(shù)實現(xiàn)要素:
本發(fā)明實施例提供一種用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計方法和裝置,實現(xiàn)有效設(shè)計符合語音識別應(yīng)用需求的sigma-deltaadc,提升使用該sigma-deltaadc進行模數(shù)轉(zhuǎn)處理的語音識別模塊的性能。
第一方面,本發(fā)明實施例提供一種用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計方法,所述模數(shù)轉(zhuǎn)換器包括調(diào)制器、級聯(lián)積分梳狀cic濾波器和fir濾波器,所述設(shè)計方法包括:
將預(yù)設(shè)的模擬語音信號輸入利用初始參數(shù)設(shè)計的所述模數(shù)轉(zhuǎn)換器;
若所述模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號不符合預(yù)設(shè)條件,則根據(jù)優(yōu)化算法計算初始參數(shù)的最優(yōu)值;
其中,所述初始參數(shù)包括以下中的至少一種:所述調(diào)制器的階數(shù)、所述cic濾波器的抽取率和階數(shù)、所述fir濾波器的抽取率、通帶邊緣頻率、阻帶邊緣頻率、通帶波紋、阻帶波紋、fir濾波器的級聯(lián)級數(shù)、fir濾波器系數(shù)的量化位數(shù)。
第二方面,本發(fā)明實施例提供一種用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計裝置,所述模數(shù)轉(zhuǎn)換器包括調(diào)制器、級聯(lián)積分梳狀cic濾波器和fir濾波器,所述裝置包括;
輸入模塊,用于將預(yù)設(shè)的模擬語音信號輸入利用初始參數(shù)設(shè)計的所述模數(shù)轉(zhuǎn)換器;
計算模塊,用于當(dāng)所述模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號不符合預(yù)設(shè)條件時,根據(jù)優(yōu)化算法計算初始參數(shù)的最優(yōu)值;
其中,所述初始參數(shù)包括以下中的至少一種:所述調(diào)制器的階數(shù)、所述cic濾波器的抽取率和階數(shù)、所述fir濾波器的抽取率、通帶邊緣頻率、阻帶邊緣頻率、通帶波紋、阻帶波紋、fir濾波器的級聯(lián)級數(shù)、fir濾波器系數(shù)的量化位數(shù)。
第三方面,本發(fā)明實施例提供一種用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計系統(tǒng),所述系統(tǒng)包括;sigma-delta模數(shù)轉(zhuǎn)換器、語音識別模塊和sigma-delta參數(shù)調(diào)整模塊,所述sigma-delta模數(shù)轉(zhuǎn)換器包括調(diào)制器、級聯(lián)積分梳狀cic濾波器和fir濾波器;
所述sigma-delta模數(shù)轉(zhuǎn)換器,用于使用初始參數(shù)對預(yù)設(shè)的模擬語音信號進行模數(shù)轉(zhuǎn)換處理;
所述語音識別模塊,用于判斷所述sigma-delta模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號是否符合預(yù)設(shè)條件;
所述sigma-delta參數(shù)調(diào)整模塊,用于當(dāng)所述sigma-delta模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號不符合預(yù)設(shè)條件時,根據(jù)優(yōu)化算法計算初始參數(shù)的最優(yōu)值;
其中,所述初始參數(shù)包括以下中的至少一種:所述調(diào)制器的階數(shù)、所述cic濾波器的抽取率和階數(shù)、所述fir濾波器的抽取率、通帶邊緣頻率、阻帶邊緣頻率、通帶波紋、阻帶波紋、fir濾波器的級聯(lián)級數(shù)、fir濾波器系數(shù)的量化位數(shù)。
本發(fā)明實施例用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計方法和裝置,通過將預(yù)設(shè)的模擬語音信號輸入利用初始參數(shù)設(shè)計的用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器,若該sigma-delta模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號不符合預(yù)設(shè)條件,則根據(jù)優(yōu)化算法計算初始參數(shù)的最優(yōu)值,利用該最優(yōu)值設(shè)計用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器,實現(xiàn)有效設(shè)計符合語音識別應(yīng)用需求的sigma-deltaadc,提升使用該sigma-deltaadc進行模數(shù)轉(zhuǎn)換處理的語音識別模塊的語音識別性能。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計系統(tǒng)的結(jié)構(gòu)示意圖;
圖2為本發(fā)明用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計方法實施例一的流程圖;
圖3a為本發(fā)明sigma-deltaadc1實施例一的結(jié)構(gòu)示意圖;
圖3b為本發(fā)明一階sigma-delta調(diào)制器的結(jié)構(gòu)示意圖;
圖3c為本發(fā)明數(shù)字低通濾波器12和抽取器13的結(jié)構(gòu)示意圖;
圖4為本發(fā)明用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計方法實施例二的流程圖;
圖5為本發(fā)明用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計裝置實施例一的結(jié)構(gòu)示意圖。
具體實施方式
為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
本文所涉及的sigma-deltaadc工作于過采樣率下,可以實現(xiàn)將輸入信號及相對應(yīng)的量化噪聲分別經(jīng)過低通環(huán)路濾波器以及高階高通濾波器進行處理。因此,在輸出端,信號是由延遲的輸入信號以及經(jīng)過高階高通濾波器整形后的量化噪聲組成的,從而可以將量化噪聲從帶內(nèi)無限制的移到帶外,而轉(zhuǎn)換精度可以達到僅受器件熱噪聲在物理上限制的轉(zhuǎn)換精度。此外,在標準的cmos工藝下,sigma-deltaadc無需模擬元件的精確匹配來實現(xiàn)較高精度。sigma-deltaadc能夠獲得較好的采樣效果,可以將sigma-deltaadc應(yīng)用于語音識別模塊中,有效提升語音識別模塊的性能。設(shè)計sigma-deltaadc涉及多個參數(shù),例如濾波器的級聯(lián)級數(shù)等,利用不同的參數(shù)設(shè)計的sigma-deltaadc其應(yīng)用于語音識別處理的性能也不盡相同。本發(fā)明下述實施例提供的方法可以有效獲取滿足語音識別模塊性能需求的sigma-deltaadc的參數(shù),提升設(shè)置有利用該參數(shù)設(shè)計的sigma-deltaadc進行模數(shù)轉(zhuǎn)換處理的語音識別模塊的語音識別性能。
圖1為本發(fā)明實施例的一種用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計系統(tǒng)的結(jié)構(gòu)示意圖,如圖1所示,本發(fā)明實施例用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計系統(tǒng),具體可以包括:sigma-deltaadc1、語音識別模塊2和sigma-deltaadc參數(shù)調(diào)整模塊3。在實現(xiàn)sigma-deltaadc設(shè)計中,首先由sigma-deltaadc1利用初始參數(shù)生成最初版本的sigma-deltaadc,之后,由語音識別模塊2對當(dāng)前的sigma-deltaadc的語音識別效果進行分析,將得到的語音識別結(jié)果提供給sigma-deltaadc參數(shù)調(diào)整模塊3,sigma-deltaadc參數(shù)調(diào)整模塊3對語音識別結(jié)果進行分析,確定是否調(diào)整初始參數(shù),如果調(diào)整,則將調(diào)整后的參數(shù)提供給sigma-deltaadc1。sigma-deltaadc1利用調(diào)整后的參數(shù)生成下一版本的sigma-deltaadc,語音識別模塊2和sigma-deltaadc參數(shù)調(diào)整模塊3將繼續(xù)進行語音識別效果分析與參數(shù)調(diào)整過程,循環(huán)以上的過程,直至利用調(diào)整后的參數(shù)設(shè)計的sigma-deltaadc符合語音識別的性能要求。
圖2為本發(fā)明用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計方法實施例一的流程圖,本實施例的執(zhí)行主體可以為用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計裝置,該裝置可以通過軟件和/或硬件實現(xiàn),該用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計裝置可以實現(xiàn)圖1所示的語音識別模塊2和sigma-deltaadc參數(shù)調(diào)整模塊3的功能。其中,該sigma-delta模數(shù)轉(zhuǎn)換器可以包括調(diào)制器、級聯(lián)積分梳狀cic濾波器和fir濾波器。如圖2所示,本實施例的方法可以包括:
步驟101、將預(yù)設(shè)的模擬語音信號輸入利用初始參數(shù)設(shè)計的所述模數(shù)轉(zhuǎn)換器。
其中,預(yù)設(shè)的模擬語音信號具體可以是孤立詞(isolatedword)、連接詞(connectedword)或連續(xù)詞語(continuousspeech)的模擬信號。在步驟101中初始參數(shù)的具體取值可以是隨機設(shè)置,利用該初始參數(shù)設(shè)計得到一個用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器。將預(yù)設(shè)的模擬語音信號輸入至利用該初始參數(shù)設(shè)計的用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器。
步驟102、若所述模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號不符合預(yù)設(shè)條件,則根據(jù)優(yōu)化算法計算初始參數(shù)的最優(yōu)值。
其中,所述初始參數(shù)可以包括以下中的至少一種:所述調(diào)制器的階數(shù)、所述cic濾波器的抽取率和階數(shù)、所述fir濾波器的抽取率、通帶邊緣頻率、阻帶邊緣頻率、通帶波紋、阻帶波紋、fir濾波器的級聯(lián)級數(shù)、fir濾波器系數(shù)的量化位數(shù)。該初始參數(shù)包括的具體內(nèi)容可以根據(jù)設(shè)計sigma-deltaadc的具體結(jié)構(gòu)進行靈活調(diào)整。
具體的,利用該初始參數(shù)設(shè)計的用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器對預(yù)設(shè)的模擬語音信號進行模數(shù)轉(zhuǎn)換處理,輸出數(shù)字信號,如果輸出的數(shù)字信號不符合預(yù)設(shè)條件,則需要調(diào)整初始參數(shù)的具體取值,初始參數(shù)的不同取值對應(yīng)的用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的處理性能也不盡相同,步驟102可以根據(jù)優(yōu)化算法計算初始參數(shù)的最優(yōu)值,以利用該最優(yōu)值設(shè)計用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器,以獲取最優(yōu)處理性能。
其中,該預(yù)設(shè)條件具體可以是性能需求和/或成本需求。該預(yù)設(shè)設(shè)計需求可以根據(jù)需要進行靈活設(shè)置。如果滿足,則采用該初始參數(shù)設(shè)計sigma-deltaadc,如果不滿足預(yù)設(shè)條件,則根據(jù)優(yōu)化算法計算該初始參數(shù)的最優(yōu)值。
可選的,該預(yù)設(shè)條件可以包括:所述數(shù)字語音信號中孤立詞、連接詞或連續(xù)詞語相對于標準語音信號的準確率大于第一預(yù)設(shè)閾值,其中,所述標準語音信號為采用預(yù)設(shè)精度的模數(shù)轉(zhuǎn)換器對所述預(yù)設(shè)的模擬語音信號進行模數(shù)轉(zhuǎn)換仿真得到的數(shù)字信號;和/或,所述數(shù)字語音信號中孤立詞的區(qū)分度大于第二預(yù)設(shè)閾值。
其中,標準語音信號為使用預(yù)設(shè)精度的sigma-deltadc處理的結(jié)果,具體的該預(yù)設(shè)精度可以選取大于一定閾值的精度,該預(yù)設(shè)精度越高實現(xiàn)效果越好,當(dāng)預(yù)設(shè)精度較高時,實現(xiàn)起來需要花費較高的成本,在進行用于語音識別的sigma-deltadc的實際設(shè)計過程中通常是適當(dāng)?shù)貙Ω呔鹊腶dc的設(shè)計指標進行調(diào)整,以利于系統(tǒng)實現(xiàn)成本的降低。高精度的sigma-deltadc作為實驗階段進行使用當(dāng)前初始參數(shù)設(shè)計的sigma-deltadc的處理性能的評估。
上述第一預(yù)設(shè)閾值和第二預(yù)設(shè)閾值的具體取值可以根據(jù)需求進行靈活設(shè)置。
上述步驟102的一種可實現(xiàn)方式可以為:比較所述模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號中孤立詞、連接詞或連續(xù)詞語相對于標準語音信號的準確率與第一預(yù)設(shè)閾值,若所述模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號中孤立詞、連接詞或連續(xù)詞語相對于標準語音信號的準確率小于第一預(yù)設(shè)閾值,則根據(jù)優(yōu)化算法計算初始參數(shù)的最優(yōu)值。
即采用準確率的評判標準對利用初始參數(shù)設(shè)計的sigma-deltaadc進行評估。
具體的,可以對高精度adc模塊與當(dāng)前初始參數(shù)設(shè)計adc模塊的孤立詞、連接詞或連續(xù)詞的識別的準確率進行比較分析。即通過與實驗階段的高精度adc比對,根據(jù)比對結(jié)果調(diào)整初始參數(shù),直至獲取到滿足預(yù)設(shè)條件的初始參數(shù),該滿足預(yù)設(shè)條件的初始參數(shù)可以用于實際批量生產(chǎn),以在滿足語音識別性能需求的基礎(chǔ)上,有效降低成本。
上述步驟102的另一種可實現(xiàn)方式可以為:比較所述模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號中孤立詞的區(qū)分度與第二預(yù)設(shè)閾值,若所述模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號中孤立詞的區(qū)分度小于第二預(yù)設(shè)閾值,則根據(jù)優(yōu)化算法計算初始參數(shù)的最優(yōu)值。
即采用對對孤立詞識別的區(qū)分程度對利用初始參數(shù)設(shè)計的sigma-deltaadc進行評估。
本實施例,通過將預(yù)設(shè)的模擬語音信號輸入利用初始參數(shù)設(shè)計的用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器,若該sigma-delta模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號不符合預(yù)設(shè)條件,則根據(jù)優(yōu)化算法計算初始參數(shù)的最優(yōu)值,利用該最優(yōu)值設(shè)計用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器,實現(xiàn)有效設(shè)計符合語音識別應(yīng)用需求的sigma-deltaadc,可以有效提升使用該sigma-deltaadc進行模數(shù)轉(zhuǎn)處理的語音識別模塊的性能。
圖3a為本發(fā)明sigma-deltaadc1實施例一的結(jié)構(gòu)示意圖,圖3b為本發(fā)明一階sigma-delta調(diào)制器的結(jié)構(gòu)示意圖,圖3c為本發(fā)明sigma-deltaadc1的數(shù)字低通濾波器12和抽取器13的具體結(jié)構(gòu)示意圖。如圖3a所示,本實施例的sigma-deltaadc1具體可以包括:sigma-delta調(diào)制器11、數(shù)字低通濾波器12和抽取器13。其中,sigma-delta調(diào)整器11用于在過采樣率下對輸入的模擬信號進行噪聲整形,并將輸出的信號提供給數(shù)字低通濾波器12,數(shù)字低通濾波器12用于進行低通濾波,并將輸出的信號提供給抽取器13,由抽取器13輸出數(shù)字信號。
根據(jù)奈奎斯特采樣定律,要從抽樣信號中無失真地恢復(fù)原信號,抽樣頻率應(yīng)大于2倍信號最高頻率。兩倍信號最高頻率稱為奈奎斯特頻率,設(shè)為fs。而sigma-deltaadc1使用了過采樣處理,假設(shè)當(dāng)前信號的奈奎斯特頻率是fs,而sigma-deltaadc1的過采樣率設(shè)置為m,則有實際的采樣率為fs’=m*fs。在采樣的過程中,受到采樣精度的影響,將會引入量化噪聲,一般其功率在采樣頻段上是均勻分布的。如果提升采樣率,將會增加采樣頻段的范圍,相應(yīng)量化噪聲的分布范圍加寬,對應(yīng)的功率幅度值會下降。設(shè)采樣的精度是n比特(bit),過采樣率設(shè)置為m,則有,相應(yīng)的信噪比為:
snr=10×logm+6.02*n+1.76db(1)
由(1)式,單純使用提升采樣率的方法對信噪比的提升是有限的,因此,sigma-deltaadc1對經(jīng)過模擬抗混疊濾波器的模擬輸入信號使用了sigma-delta調(diào)制器11進行處理。sigma-delta調(diào)制器11的作用是對噪聲進行整形,將原先均勻分布的量化噪聲進行改變,將量化噪聲整形到基帶之外的高頻部分,再使用數(shù)字低通濾波器12將基帶之外高頻區(qū)域的量化噪聲進行濾除,因此在基帶中的量化噪聲將會得到有效抑制,有利于提升信噪比。
sigma-delta調(diào)制器11的傳輸函數(shù)的一般形式為:
其中x(z)和e(z)分別是輸入信號和量化誤差的z變換。當(dāng)a(z)是一個很大的直流增益時,信號的傳輸函數(shù)近似等于1,而對于基帶中的量化噪聲得到了抑制。
在具體的實現(xiàn)過程中,sigma-delta調(diào)制器12可以采用不同的階數(shù),一階sigma-delta調(diào)制器的框圖如圖3b所示的結(jié)構(gòu),其中包含了被延遲了一個采樣周期的輸入x(z)和一個經(jīng)過一階高通整形的量化噪聲e(z),其輸出為:
y(z)=z-1x(z)+(1-z-1)e(z)(3)
二階sigma-delta調(diào)制器是將一階sigma-delta調(diào)制器中的量化器用另一個一階sigma-delta調(diào)制器所代替,其輸出為:
y(z)=z-1x(z)+(1-z-1)2e(z)(4)
當(dāng)sigma-delta調(diào)制器的階數(shù)為l時,輸出為:
y(z)=z-1x(z)+(1-z-1)le(z)(5)
隨著階數(shù)的增加,可以有效地抑制帶內(nèi)量化噪聲,但調(diào)制器的階數(shù)并不能無限的增大。因為對于單bit調(diào)制器,當(dāng)階數(shù)達到三階或三階以上時,其穩(wěn)定性是很難保證的??梢酝ㄟ^穩(wěn)定的一階調(diào)制器和二階調(diào)制器級聯(lián)的方式來實現(xiàn)高階調(diào)制器。
數(shù)字低通濾波器12和抽取器13通常是聯(lián)合在一起進行實現(xiàn)的,數(shù)字低通濾波器12和抽取器13的結(jié)構(gòu)可以如圖3c所示。對于sigma-delta調(diào)制器輸出的信號,首先由cic濾波器進行濾波處理,實現(xiàn)m倍降采樣,隨后,由fir濾波器進行濾波處理,實現(xiàn)n倍降采樣。通過兩個模塊的處理,實現(xiàn)了m*n倍的降采樣。引入cic濾波器的原因是如果直接使用fir濾波器對sigma-delta調(diào)制器輸出的信號進行處理,則fir濾波器需要使用較高的階數(shù),同時,fir濾波器工作在較高的頻率下,以上將會導(dǎo)致整個系統(tǒng)的功耗和成本指標不理想。而級聯(lián)積分梳狀(cic)濾波器是一種結(jié)構(gòu)十分簡單的數(shù)字濾波器,不需要進行乘法運算,用作抗混疊濾波器,并實現(xiàn)采樣率的降低,使得后級濾波器可以工作在較低的頻率下,以便有效的降低功耗。同時,使后級的fir濾波器可以以較低的階數(shù)進行實現(xiàn),改善了整個系統(tǒng)的性能。
cic濾波器在絕大多數(shù)的應(yīng)用中抽取因子m等于梳狀結(jié)構(gòu)的延遲d。單階cic濾波器在z域的傳輸函數(shù)如公式(6)所示:
抽取濾波器需要考慮的一個關(guān)鍵問題就是在抽取后的頻譜混疊。對于單階的cic,高頻區(qū)域?qū)?yīng)通道的頻率段的衰減有限,因此在降采樣處理之后,對應(yīng)區(qū)域中的未有效抑制的頻率信息將會混疊到通帶b中。
為了改善cic濾波器抗混疊和去鏡像的效果,通常采用增加cic濾波器的階數(shù)的方式,對應(yīng)通道的高頻頻率段的阻帶衰減增加,進行有效的抑制,避免混疊到通帶b中。但是在增加cic濾波器的階數(shù)之后,cic濾波器的通帶中也將會引入衰減的問題。通??梢栽趕igma-deltaadc1中加入對cic濾波器通帶衰減問題的補償模塊。
在經(jīng)過cic濾波器處理之后,信號的采樣頻率得到有效降低。但是由于cic濾波器的頻率特性所限,它不可能非常有效的濾除帶外噪聲,并且由于cic濾波器存在帶內(nèi)衰減,因此,需要引入頻率特性更好的fir濾波器來更有效地濾除帶外噪聲并補償cic濾波器的通帶內(nèi)衰減。
對于一個fir濾波器來說,其基本的性能指標有通帶邊緣頻率,阻帶邊緣頻率,通帶波紋及阻帶波紋。同時,fir濾波器在實現(xiàn)的過程中,通常以半帶濾波器和二倍抽取因子組合的方法,進行多級的級聯(lián)實現(xiàn)。每經(jīng)過一級半帶濾波器,信號的采樣率將會減半。而半帶濾波器主要的特點是它的近一半的濾波器系數(shù)為零,因此也使計算量減少了一半,進而可以有效節(jié)省硬件資源。這一特性使得半帶濾波器在多速率信號處理中有著廣泛的應(yīng)用。
在fir濾波器的實際應(yīng)用中,濾波器的輸入、濾波器的系數(shù)以及濾波器運算的位數(shù)都是有限長的。從計算效率以及硬件成本等方面考慮,這些位數(shù)要盡可能的小,但同時這也將引起濾波器性能的下降,這種由于采用有限位數(shù)而帶來的問題稱為有限字長效應(yīng)。
由此可見,在sigma-deltaadc的設(shè)計過程中,需要進行確定的參數(shù)包括如圖2所示實施例所述的調(diào)制器的階數(shù)、cic濾波器的抽取率和階數(shù)、fir濾波器的抽取率、通帶邊緣頻率、阻帶邊緣頻率、通帶波紋、阻帶波紋、fir濾波器的級聯(lián)級數(shù)、fir濾波器系數(shù)的量化位數(shù)等等。即需要確定本發(fā)明實施例的初始參數(shù),以選取合適的初始參數(shù)對sigma-deltaadc進行實現(xiàn),從而提升使用該sigma-deltaadc進行模數(shù)轉(zhuǎn)處理的語音識別模塊的識別效果。
圖4為本發(fā)明用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計方法實施例二的流程圖,如圖4所示,本實施例的方法可以包括:
步驟201、隨機初始化初始參數(shù)。
具體的,對調(diào)制器的階數(shù)、cic濾波器的抽取率和階數(shù)、fir濾波器的抽取率、通帶邊緣頻率、阻帶邊緣頻率、通帶波紋、阻帶波紋、fir濾波器的級聯(lián)級數(shù)、fir濾波器系數(shù)的量化位數(shù)等參數(shù)隨機初始化取值。
步驟202、使用初始化的初始參數(shù)配置sigma-deltaadc,得到利用初始化的初始參數(shù)設(shè)計的模數(shù)轉(zhuǎn)換器,使用該初始化的初始參數(shù)設(shè)計的模數(shù)轉(zhuǎn)換器對輸入的預(yù)設(shè)的模擬語音信號進行模數(shù)轉(zhuǎn)換處理,輸出該初始化的初始參數(shù)對應(yīng)的數(shù)字語音信號。
步驟203、判斷該初始化的初始參數(shù)對應(yīng)的數(shù)字語音信號是否符合預(yù)設(shè)條件,若不符合,則執(zhí)行步驟204,若符合則使用該初始化的初始參數(shù)設(shè)計sigma-deltaadc。
步驟204、對初始參數(shù)進行編碼,利用優(yōu)化算法產(chǎn)生下一代的初始參數(shù)。
該初始參數(shù)具體可以包括的上述各個參數(shù),調(diào)制器的階數(shù)、cic濾波器的抽取率和階數(shù)、fir濾波器的抽取率、通帶邊緣頻率、阻帶邊緣頻率、通帶波紋、阻帶波紋、fir濾波器的級聯(lián)級數(shù)、fir濾波器系數(shù)的量化位數(shù)等。
其中,優(yōu)化算法具體可以包括遺傳算法、粒子群優(yōu)化算法、多目標優(yōu)化算法中任意一項。當(dāng)然還可以選擇其他優(yōu)化算法,本發(fā)明實施例不以此作為限制。
以遺傳算法做舉例說明,通過復(fù)制、交叉、變異以及其它算法的操作產(chǎn)生下一代的初始參數(shù)。
步驟205、使用下一代的初始參數(shù)設(shè)計sigma-deltaadc,得到利用下一代的初始參數(shù)設(shè)計的sigma-deltaadc,使用該下一代的初始參數(shù)設(shè)計的sigma-deltaadc進行模數(shù)轉(zhuǎn)換處理,輸出該下一代的初始參數(shù)對應(yīng)的數(shù)字語音信號。
步驟206、判斷該下一代的初始參數(shù)對應(yīng)的數(shù)字語音信號是否滿足預(yù)設(shè)條件,若不滿足,則執(zhí)行步驟204,若滿足則執(zhí)行步驟207。
步驟207、使用該下一代的初始參數(shù)設(shè)計sigma-deltaadc。
通過以上的優(yōu)化算法,能夠?qū)崿F(xiàn)對初始參數(shù)的最優(yōu)解的自動搜索,得到編碼后的初始參數(shù)的最優(yōu)解,并解碼該最優(yōu)解以得到初始參數(shù)的最優(yōu)值,有利于有效獲取到sigma-deltaadc設(shè)計的最優(yōu)參數(shù),改善人工手動調(diào)整參數(shù)時的低效問題。
通過本實施例的方法,能夠使設(shè)計的sigma-deltaadc符合語音識別的應(yīng)用要求。同時,在初始參數(shù)設(shè)計的過程中,采用遺傳算法等搜索方法,能夠?qū)igma-deltaadc方案設(shè)計實現(xiàn)效率進行提升。
圖5為本發(fā)明用于語音識別的sigma-delta模數(shù)轉(zhuǎn)換器的設(shè)計裝置實施例一的結(jié)構(gòu)示意圖,所述模數(shù)轉(zhuǎn)換器包括調(diào)制器、級聯(lián)積分梳狀cic濾波器和fir濾波器,如圖5所示,本實施例的裝置可以包括:輸入模塊11和計算模塊12,其中,輸入模塊11用于將預(yù)設(shè)的模擬語音信號輸入利用初始參數(shù)設(shè)計的所述模數(shù)轉(zhuǎn)換器,計算模塊12用于當(dāng)所述模數(shù)轉(zhuǎn)換器輸出的數(shù)字語音信號不符合預(yù)設(shè)條件時,根據(jù)優(yōu)化算法計算初始參數(shù)的最優(yōu)值,其中,所述初始參數(shù)包括以下中的至少一種:所述調(diào)制器的階數(shù)、所述cic濾波器的抽取率和階數(shù)、所述fir濾波器的抽取率、通帶邊緣頻率、阻帶邊緣頻率、通帶波紋、阻帶波紋、fir濾波器的級聯(lián)級數(shù)、fir濾波器系數(shù)的量化位數(shù)。
可選的,所述計算模塊12可以包括:編碼模塊121和搜索編碼單元122,其中,編碼單元121用于對所述初始參數(shù)進行編碼,搜索解碼單元122用于利用優(yōu)化算法循環(huán)迭代搜索編碼后的初始參數(shù)的最優(yōu)解,并解碼所述最優(yōu)解以得到所述初始參數(shù)的最優(yōu)值。
可選的,所述優(yōu)化算法包括遺傳算法、粒子群優(yōu)化算法或者多目標優(yōu)化算法。
可選的,所述預(yù)設(shè)條件包括:所述數(shù)字語音信號中孤立詞、連接詞或連續(xù)詞語相對于標準語音信號的準確率大于第一預(yù)設(shè)閾值,其中,所述標準語音信號為對所述預(yù)設(shè)的模擬語音信號采用高精度的模數(shù)轉(zhuǎn)換器進行模數(shù)轉(zhuǎn)換仿真得到的數(shù)字信號;和/或,所述數(shù)字語音信號中孤立詞的區(qū)分度大于第二預(yù)設(shè)閾值。
本實施例的裝置,可以用于執(zhí)行上述方法實施例的技術(shù)方案,其實現(xiàn)原理和技術(shù)效果類似,此處不再贅述。
本領(lǐng)域普通技術(shù)人員可以理解:實現(xiàn)上述各方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成。前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中。該程序在執(zhí)行時,執(zhí)行包括上述各方法實施例的步驟;而前述的存儲介質(zhì)包括:rom、ram、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
最后應(yīng)說明的是:以上各實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分或者全部技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的范圍。