專利名稱:一種快速構(gòu)造用于關(guān)鍵詞檢出任務(wù)的語音數(shù)據(jù)庫的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音數(shù)據(jù)庫的構(gòu)造方法,尤其是一種用于關(guān)鍵詞檢出任務(wù)的語音數(shù)據(jù)庫的構(gòu)造方法。
背景技術(shù):
語音識(shí)別研究的根本目的是實(shí)現(xiàn)人用自然語言與機(jī)器進(jìn)行交互,使機(jī)器具有類似人一樣的聽覺功能,能直接接受人的語音,理解人的意圖并作出相應(yīng)的反應(yīng)。語音是人類最自然,最方便,最常用的信息交流方式。關(guān)鍵詞檢出是從連續(xù)的、無限制的自然語音流中識(shí)別出一組給定的詞——稱為關(guān)鍵詞。關(guān)鍵詞識(shí)別是語音識(shí)別的一個(gè)分支和重要研究方向。關(guān)鍵詞檢出技術(shù)已經(jīng)在很多應(yīng)用系統(tǒng)中體現(xiàn)出巨大的價(jià)值,它使語音識(shí)別技術(shù)從實(shí)驗(yàn)室研究階段進(jìn)入實(shí)際應(yīng)用階段,其應(yīng)用領(lǐng)域已經(jīng)滲透到軍事,國(guó)防,電信,多媒體,交通等各個(gè)場(chǎng)合。
關(guān)鍵詞檢出系統(tǒng)的評(píng)價(jià)中語音數(shù)據(jù)庫的獲得是最重要的部分,只有有了一定規(guī)模的、符合一定的要求的語音數(shù)據(jù)庫,才能對(duì)關(guān)鍵詞檢出系統(tǒng)的性能作出較為全面有效的評(píng)價(jià),并具有可重復(fù)性。
現(xiàn)有的用于關(guān)鍵詞檢出系統(tǒng)的語音數(shù)據(jù)庫的建立中,存在以下不足(1)語音數(shù)據(jù)庫錄制和整理困難目前用于關(guān)鍵詞檢出系統(tǒng)的語音數(shù)據(jù)庫均是在特定的要求下實(shí)際錄制采集而來,每次錄制都需要涉及很多說話人、操作人員,語音數(shù)據(jù)庫的工作量非常巨大;加上還需要對(duì)數(shù)據(jù)庫進(jìn)行諸如標(biāo)注等后期處理處理,工作量是錄制過程本身的數(shù)倍之多;同時(shí)存在口音、口語、噪聲等因素的不確定、不可控,錄制工作難度大、效率低。
(2)語音數(shù)據(jù)庫靈活性差每一次采集語音數(shù)據(jù)庫之后,數(shù)據(jù)庫的一些特性,諸如句子長(zhǎng)度、關(guān)鍵詞出現(xiàn)的次數(shù)的分布都是較為固定的;即使可以通過挑選數(shù)據(jù)庫中的子集來實(shí)現(xiàn)一定的變化,但是這樣的變化都是十分有限的,并且數(shù)據(jù)庫的規(guī)模也變小了,因?yàn)檎Z音數(shù)據(jù)一旦采集完成,每個(gè)詞(無論是否定義為關(guān)鍵詞或者非關(guān)鍵詞)在數(shù)據(jù)庫中的都是固定了。
(3)數(shù)據(jù)庫的規(guī)模較小,對(duì)于檢驗(yàn)系統(tǒng)的性能尚不能全面由于實(shí)際采集語音數(shù)據(jù)庫的工作量巨大,因此用于關(guān)鍵詞檢出系統(tǒng)的語音數(shù)據(jù)庫的規(guī)模都較小;同時(shí)由于關(guān)鍵詞檢出系統(tǒng)測(cè)試的特殊性,在連續(xù)語音流中真正的“關(guān)鍵詞”出現(xiàn)的概率一般都較小,很多關(guān)鍵詞的出現(xiàn)并不能出現(xiàn)較多的次數(shù),從而影響對(duì)系統(tǒng)性能的有效測(cè)試。
(4)關(guān)鍵詞出現(xiàn)的特性不可控對(duì)于測(cè)試關(guān)鍵詞系統(tǒng)的語音數(shù)據(jù)庫,一般希望其特性諸如關(guān)鍵詞出現(xiàn)頻率、關(guān)鍵詞出現(xiàn)在句子中的位置、每句話中關(guān)鍵詞出現(xiàn)的次數(shù)的分布滿足一定的要求;這些在目前實(shí)際錄制關(guān)鍵詞語音數(shù)據(jù)庫中極難做到完全符合事先設(shè)定的,且一旦某一特定設(shè)定滿足了,就不可能更改。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對(duì)現(xiàn)有技術(shù)所存在的缺陷,提供一種用于關(guān)鍵詞檢出系統(tǒng)的語音數(shù)據(jù)庫的構(gòu)造方法,使得在關(guān)鍵詞檢出系統(tǒng)評(píng)測(cè)的時(shí)候能靈活的提供不同規(guī)模和特性語音數(shù)據(jù)庫,從而對(duì)關(guān)鍵詞檢出系統(tǒng)的性能作出全面系統(tǒng)的評(píng)價(jià)。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種構(gòu)造用語關(guān)鍵詞檢出任務(wù)的語音數(shù)據(jù)庫的構(gòu)造方法,該方法執(zhí)行以下步驟步驟1、錄制孤立詞語的語音數(shù)據(jù)庫。
步驟2、根據(jù)關(guān)鍵詞檢出系統(tǒng)的要求,明確關(guān)鍵詞和非關(guān)鍵詞,關(guān)鍵詞和非關(guān)鍵詞均出現(xiàn)在孤立詞語的語音數(shù)據(jù)庫中。
步驟3、根據(jù)關(guān)鍵詞檢出系統(tǒng)的的要求,確定測(cè)試數(shù)據(jù)庫的參數(shù),諸如句子總數(shù)、平均的句子長(zhǎng)度、關(guān)鍵詞出現(xiàn)次數(shù)、數(shù)據(jù)庫總的持續(xù)時(shí)間。
步驟4、按照任務(wù)的要求,使用波形拼接的方法將符合關(guān)鍵詞檢出任務(wù)的關(guān)鍵詞和非關(guān)鍵詞語音連接成句子,進(jìn)而生成滿足要求的關(guān)鍵詞檢出任務(wù)用數(shù)據(jù)庫。
在上述技術(shù)方案中,步驟1的具體要求為為了后繼步驟的執(zhí)行,對(duì)孤立詞語音數(shù)據(jù)庫作如下的處理A、數(shù)據(jù)庫中語音文件,每個(gè)語音文件只包含一個(gè)孤立詞;根據(jù)具體的要求,這個(gè)孤立詞,是作為在關(guān)鍵詞檢出任務(wù)中的一個(gè)整體,從語言學(xué)的角度來看可能不是“詞”而是更長(zhǎng)的語言學(xué)單位,例如“張三和李四到了北京”;B、數(shù)據(jù)庫中的語音文件,去除每個(gè)語音文件中孤立詞語音前后的靜默段,但應(yīng)保證孤立詞本身的發(fā)音完整;C、數(shù)據(jù)庫中的語音文件,每個(gè)語音文件有對(duì)應(yīng)的正確的標(biāo)注;這些標(biāo)注應(yīng)至少包含孤立詞發(fā)音的音標(biāo)(如果是漢語,應(yīng)為漢語拼音或其他發(fā)音的標(biāo)記)和語義(如果是漢語,應(yīng)為此孤立詞對(duì)應(yīng)的漢字),以及這些標(biāo)注符號(hào)對(duì)應(yīng)的語音波形的起始時(shí)刻;注意一個(gè)語音文件的孤立詞發(fā)音對(duì)應(yīng)的音標(biāo)序列的整體為一個(gè)發(fā)音標(biāo)注,一個(gè)語音文件的孤立詞語義對(duì)應(yīng)的語義序列的整體為一個(gè)語義標(biāo)注;D、根據(jù)數(shù)據(jù)庫中每個(gè)語音文件的標(biāo)注信息,建立孤立詞語音數(shù)據(jù)庫的詞表,為發(fā)音詞表和語義詞表,或者其中之一;發(fā)音詞表中均是孤立詞的發(fā)音標(biāo)注,其中每個(gè)條目均在語音數(shù)據(jù)庫中出現(xiàn),并且語音數(shù)據(jù)庫中任意的發(fā)音標(biāo)注都在發(fā)音詞表中出現(xiàn)且僅出現(xiàn)一次;語義詞表中的每個(gè)條目均在語音數(shù)據(jù)庫中出現(xiàn),并且語音數(shù)據(jù)庫中任意的語義標(biāo)注都在發(fā)音詞表中出現(xiàn)且僅出現(xiàn)一次;利用上述的語音數(shù)據(jù)庫構(gòu)造的用于關(guān)鍵詞檢出任務(wù)的語音數(shù)據(jù)庫的基本單位是句子(定義為包含多于一個(gè)詞的詞序列)。
在上述技術(shù)方案中,步驟2具體為在步驟2中,關(guān)鍵詞總數(shù)和非關(guān)鍵詞總數(shù)之和不超過步驟1種所有的孤立詞語音數(shù)據(jù)庫的詞表中詞語的數(shù)量。
步驟21、根據(jù)關(guān)鍵詞檢出系統(tǒng)的任務(wù)要求,確定關(guān)鍵詞的數(shù)量和詞表,這些詞表中的詞均在步驟1種的孤立詞語語音數(shù)據(jù)庫中出現(xiàn);步驟22、在孤立詞語語音數(shù)據(jù)庫中出現(xiàn)而沒有被確定為關(guān)鍵詞的詞語中,挑選確定非關(guān)鍵詞;在上述技術(shù)方案中,步驟3具體為步驟31、根據(jù)關(guān)鍵詞檢出系統(tǒng)的任務(wù)要求,確定每個(gè)關(guān)鍵詞出現(xiàn)的次數(shù),句子的平均長(zhǎng)度,句子的總數(shù)或者數(shù)據(jù)庫語音總的持續(xù)時(shí)間。
步驟32、若步驟31中確定了句子的總數(shù),則用隨機(jī)方法產(chǎn)生一系列句子,這些句子的總數(shù)符合步驟31的要求,且滿足如下的要求A所有的句子均由步驟2中確定的關(guān)鍵詞和非關(guān)鍵詞組成;B其中有些句子中沒有出現(xiàn)任何的關(guān)鍵詞(根據(jù)任務(wù)的要求這樣的句子可以不出現(xiàn));C其中有些句子中有且僅有一個(gè)關(guān)鍵詞,有些句子有且僅有兩個(gè)關(guān)鍵詞等等(含有N個(gè)關(guān)鍵詞的句子的數(shù)量根據(jù)任務(wù)的要求確定);這樣得到了一個(gè)句子列表,并執(zhí)行步驟4。
步驟33、若步驟31中確定的是數(shù)據(jù)庫的語音總的持續(xù)時(shí)間,則用隨機(jī)方法產(chǎn)生一系列句子,這些句子滿足如下的要求A所有的句子均由步驟2中確定的關(guān)鍵詞和非關(guān)鍵詞組成;B其中有些句子中沒有出現(xiàn)任何的關(guān)鍵詞(根據(jù)任務(wù)的要求這樣的句子可以不出現(xiàn));C其中有些句子中有且僅有一個(gè)關(guān)鍵詞,有些句子有且僅有兩個(gè)關(guān)鍵詞等等(含有N個(gè)關(guān)鍵詞的句子的數(shù)量根據(jù)任務(wù)的要求確定);D每個(gè)句子的長(zhǎng)度按照下式來計(jì)算靜默長(zhǎng)度+所有關(guān)鍵詞長(zhǎng)度+所有非關(guān)鍵詞長(zhǎng)度其中關(guān)鍵詞和非關(guān)鍵詞的長(zhǎng)度根據(jù)孤立詞語音數(shù)據(jù)中的標(biāo)注信息計(jì)算詞長(zhǎng)度=終止時(shí)刻-起始時(shí)刻所有的句子的總長(zhǎng)度為要求的數(shù)據(jù)庫語音持續(xù)的總時(shí)間;這樣得到一個(gè)句子列表,并執(zhí)行步驟4。
在上述技術(shù)方案中,步驟4具體為步驟41、根據(jù)步驟3所確定的句子列表以及句子列表中每個(gè)句子的關(guān)鍵詞和非關(guān)鍵詞,確定最終用于關(guān)鍵詞檢出系統(tǒng)語音數(shù)據(jù)庫中每個(gè)句子所需要的來自步驟1所述孤立詞語語音數(shù)據(jù)庫的語音文件;其中,根據(jù)孤立詞語音數(shù)據(jù)庫的結(jié)構(gòu),有些詞表中的詞對(duì)應(yīng)著多個(gè)語音文件,這時(shí)可以根據(jù)數(shù)據(jù)庫的需要進(jìn)行挑選,如無特別要求則隨機(jī)選取。
步驟42、根據(jù)步驟41所確定的每個(gè)句子的所有語音內(nèi)容,以及要求的靜默,將各個(gè)語音拼接起來得到每個(gè)句子的完整語音文件;所以在所得用于關(guān)鍵詞檢出任務(wù)的語音數(shù)據(jù)庫是包含一系列句子的集合,每個(gè)句子對(duì)應(yīng)于一個(gè)語音文件;但是也可以根據(jù)實(shí)際的需要將這些句子(文件)進(jìn)行進(jìn)一步的組合。
步驟43、根據(jù)步驟41和步驟42所確定的語音數(shù)據(jù),以及步驟1中確定的每個(gè)語音文件的標(biāo)注內(nèi)容,得到構(gòu)造而成的語音數(shù)據(jù)庫每條語音的標(biāo)注內(nèi)容,并作適當(dāng)?shù)谋硎?,作為測(cè)試關(guān)鍵詞系統(tǒng)的參考答案。
在上述基本方案中,步驟32和步驟33中隨機(jī)方法產(chǎn)生序列,或稱為句子,其具體步驟是A產(chǎn)生一個(gè)空的序列;B產(chǎn)生一個(gè)根據(jù)要求符合特定分布,并在要求范圍內(nèi)的隨機(jī)數(shù),作為序列的第一個(gè)元素;C重新產(chǎn)生一個(gè)同分布的隨機(jī)數(shù),這個(gè)隨機(jī)數(shù)和以前產(chǎn)生的隨機(jī)數(shù)無關(guān),作為序列的下一個(gè)元素;D檢查序列的長(zhǎng)度是否符合要求,符合則可以停止,輸出此序列,如何長(zhǎng)度小于要求,則重復(fù)C。
本發(fā)明的特點(diǎn)1利用孤立詞語音數(shù)據(jù)庫構(gòu)造關(guān)鍵詞檢出數(shù)據(jù)庫,規(guī)模小、控制簡(jiǎn)單、錄制質(zhì)量好、整理數(shù)據(jù)庫特別是標(biāo)注簡(jiǎn)單;一次錄制完成之后,構(gòu)造出的數(shù)據(jù)庫可以具有相當(dāng)大的規(guī)模,并且其質(zhì)量和孤立詞語音數(shù)據(jù)庫本身一致、標(biāo)注極易。
2靈活性好;根據(jù)不同的關(guān)鍵詞檢出任務(wù)要求,可以方便快速的構(gòu)造不同的數(shù)據(jù)庫。關(guān)鍵詞數(shù)量、數(shù)據(jù)庫規(guī)模都是可以改變的,以適應(yīng)不同的關(guān)鍵詞檢出系統(tǒng)。
3能構(gòu)造規(guī)模較大的語音數(shù)據(jù)庫;在本方法中,基本的數(shù)據(jù)庫是以詞為單位的,構(gòu)造而成的數(shù)據(jù)庫是以句子,其可能的排列組合情況是原始詞的數(shù)量的冪,而即使在特定的任務(wù)中,僅僅選用了其中很小的一部分,這個(gè)可能的序列的個(gè)數(shù)也是十分巨大的,因此可以構(gòu)造非常大規(guī)模的數(shù)據(jù)庫。
4關(guān)鍵詞特性可控;由于方法中利用了特定分布的且可以根據(jù)要求改變的隨機(jī)數(shù),并且對(duì)句子進(jìn)行了挑選,可以得到一些理想的特性,這些特性包括關(guān)鍵詞出現(xiàn)的次數(shù)、關(guān)鍵詞在句子中的位置的分布、每個(gè)句子中關(guān)鍵詞個(gè)數(shù)的分布、句子長(zhǎng)度的分布、出現(xiàn)關(guān)鍵詞句子和沒有出現(xiàn)關(guān)鍵詞句子的比例、句子的總數(shù);這些特性,除非若干個(gè)特性本身是相互關(guān)聯(lián)的,否則均可以通過預(yù)先的設(shè)定滿足任意給定的條件。
5可以通過計(jì)算機(jī)程序自動(dòng)完成,效率極高;本方法在構(gòu)造用于關(guān)鍵詞檢出數(shù)據(jù)庫的時(shí)候,一旦數(shù)據(jù)庫的特性確定,均可以通過計(jì)算機(jī)程序自動(dòng)完成,而不需要涉及錄音等人工工作;因此可以十分高效的完成特定要求,而且一旦任務(wù)要求改變,也可以迅速形成新的符合要求的數(shù)據(jù)庫。
圖1本發(fā)明中方法的步驟流程圖;圖2孤立詞語音數(shù)據(jù)庫組成;圖3用于關(guān)鍵詞檢出任務(wù)的語音數(shù)據(jù)庫組成;圖4關(guān)鍵詞檢出任務(wù)語音數(shù)據(jù)庫中句子的結(jié)構(gòu)句子由詞組成,其中詞可以為關(guān)鍵詞、非關(guān)鍵詞或者是靜默,各個(gè)位置(位置1,位置2,位置P,位置L等)均可以為關(guān)鍵詞、非關(guān)鍵詞或者是靜默,但是只能居其一;圖5本發(fā)明中構(gòu)造數(shù)據(jù)庫的詳細(xì)流程圖。
具體實(shí)施例方式
對(duì)于已經(jīng)存在的關(guān)鍵詞檢出系統(tǒng),我們希望對(duì)它的系統(tǒng)性能作出評(píng)測(cè)時(shí),可以依照如下方法構(gòu)造一個(gè)關(guān)鍵詞檢出任務(wù)的語音數(shù)據(jù)庫假設(shè)有關(guān)鍵詞檢出系統(tǒng)X,可以處理最多100關(guān)鍵詞,對(duì)其進(jìn)行系統(tǒng)性能的測(cè)試,希望數(shù)據(jù)庫滿足以下條件關(guān)鍵詞100個(gè),每個(gè)關(guān)鍵詞出現(xiàn)20次;句子總數(shù)10000個(gè),其中關(guān)鍵詞出現(xiàn)一次的1000句,出現(xiàn)兩次的200句,出現(xiàn)三次的200句;句子的平均長(zhǎng)度為15個(gè)詞。
如圖1所示,為本發(fā)明的快速構(gòu)造用于關(guān)鍵詞檢出系統(tǒng)的語音數(shù)據(jù)庫方法流程圖,包括如下步驟步驟1、利用或者錄制孤立詞語音數(shù)據(jù)庫例如,現(xiàn)有孤立詞語音數(shù)據(jù)庫D,其中包含300個(gè)詞,每個(gè)詞重復(fù)50遍。由于錄制的內(nèi)容為孤立語音數(shù)據(jù)庫,相對(duì)連續(xù)語音的數(shù)據(jù)庫,其難度和成本都是較小的,以每個(gè)詞長(zhǎng)度約1秒計(jì)算,這個(gè)語音數(shù)據(jù)總長(zhǎng)度為300*50*1=15000秒(大約4個(gè)小時(shí)長(zhǎng)度),而符合測(cè)試任務(wù)要求的語音數(shù)據(jù)庫大約有10000*15*1=150000秒(大約40個(gè)小時(shí))錄制和標(biāo)注的工作量十分巨大。
步驟2、根據(jù)系統(tǒng)測(cè)試的要求確定關(guān)鍵詞表和非關(guān)鍵詞表。
步驟21、首先從孤立詞語音數(shù)據(jù)庫D的300個(gè)詞中隨機(jī)選取100個(gè)詞作為待測(cè)關(guān)鍵詞,記關(guān)鍵詞表為KW,其中的第i個(gè)關(guān)鍵詞記為KW(i)。
步驟22、從孤立詞語音數(shù)據(jù)庫D的300個(gè)詞中剩余的200個(gè)詞語中挑選出一些詞語作為非關(guān)鍵詞,例如可以選取所有的200個(gè)詞作為非關(guān)鍵詞,記非關(guān)鍵詞表為NKW,其中的第i個(gè)非關(guān)鍵詞記為NKW(i)。
步驟3、根據(jù)關(guān)鍵詞檢出系統(tǒng)的性能,以及測(cè)試的要求,確定測(cè)試數(shù)據(jù)庫的參數(shù),諸如句子總數(shù)、平均的句子長(zhǎng)度、關(guān)鍵詞出現(xiàn)次數(shù)、數(shù)據(jù)庫總的持續(xù)時(shí)間等等。
步驟31、根據(jù)關(guān)鍵詞檢出系統(tǒng)的測(cè)試要求,每個(gè)關(guān)鍵詞出現(xiàn)20次,句子總數(shù)10000個(gè),其中關(guān)鍵詞出現(xiàn)一次的1000句,出現(xiàn)兩次的200句,出現(xiàn)三次的200句;句子的平均長(zhǎng)度沒有指定,可以確定為15個(gè)詞,句子長(zhǎng)度的分布為10~20之間均勻分布。
步驟32、用隨機(jī)方法產(chǎn)生一系列句子例如可以用一個(gè)1到200之間的隨機(jī)變量W1,產(chǎn)生如下的一個(gè)長(zhǎng)度為10000*15=150000的序列,分割成長(zhǎng)度為10~20的序列10000個(gè),每個(gè)序列表示將代表一個(gè)句子(每個(gè)序列中,每個(gè)位置的取值i對(duì)應(yīng)于NKW中一個(gè)詞,記為NKW(i)),記為集合{S0};將S0分成四個(gè)互不相交的子集S01,S02,S03和S04,均使用隨機(jī)挑選的方法,其中S01有8600個(gè)句子,S02有1000個(gè)句子,S03有200個(gè)句子,S04有200個(gè)序列;
對(duì)S02作如下的處理,對(duì)其中的每個(gè)句子,隨機(jī)挑選一個(gè)位置P,用關(guān)鍵詞表KW中的關(guān)鍵詞KW(i)代替,并保證在處理之后的集合S0每個(gè)關(guān)鍵詞出現(xiàn)10次;對(duì)S03作如下的處理,對(duì)其中的每個(gè)句子,隨機(jī)挑選兩個(gè)個(gè)位置P1,P2,且P1≠P2,分別用用關(guān)鍵詞表KW中的關(guān)鍵詞KW(i),KW(j)代替,(i可以等于j),并保證在處理之后的集合S03每個(gè)關(guān)鍵詞出現(xiàn)2次;對(duì)S04作如下的處理,對(duì)其中的每個(gè)句子s,隨機(jī)挑選三個(gè)位置P1,P2,P3,且P1、P2和P3種任意兩個(gè)都不相等,分別用關(guān)鍵詞表KW中的關(guān)鍵詞KW(i),KW(j),KW(k)代替,(i j k可以相等),并保證在處理之后的集合S04中每個(gè)關(guān)鍵詞出現(xiàn)3次;這樣經(jīng)過處理后的集合S01,S02,S03和S04中所有的關(guān)鍵詞一共出現(xiàn)2000次并且分布符合測(cè)試數(shù)據(jù)庫的要求。
步驟4、按照測(cè)試的要求,使用波形拼接的方法將符合關(guān)鍵詞檢出測(cè)試數(shù)據(jù)要求的關(guān)鍵詞和非關(guān)鍵詞語音連接成句子,進(jìn)而生成滿足要求的關(guān)鍵詞檢出測(cè)試用數(shù)據(jù)庫。
步驟41、根據(jù)集合S01,S02,S03和S04確定每個(gè)的句子需要的語音文件(來自數(shù)據(jù)庫D)。
步驟42、根據(jù)步驟41,每個(gè)句子的內(nèi)容(指某個(gè)句子由哪些來自數(shù)據(jù)庫D的語音文件組成)都已經(jīng)確定,一般還需要在句子的前后加入一定長(zhǎng)度的靜默語音段;將每個(gè)句子涉及的語音(文件)按照其對(duì)應(yīng)的序列的順序采用波形拼接的方法連接起來;這些波形拼接的方法見諸于發(fā)表的文獻(xiàn)。
步驟43、根據(jù)步驟41和步驟42所確定的語音數(shù)據(jù),對(duì)集合S01,S02,S03和S04中每個(gè)序列(句子)構(gòu)造完成之后,可以得到每條語音的文字標(biāo)注內(nèi)容,并作適當(dāng)?shù)谋硎?,作為測(cè)試關(guān)鍵詞系統(tǒng)的參考答案。
以上構(gòu)造所得數(shù)據(jù)庫就可用于對(duì)關(guān)鍵詞檢出系統(tǒng)性能進(jìn)行測(cè)試,以上步驟均可以通過計(jì)算機(jī)程序在較短時(shí)間內(nèi)自動(dòng)完成,相對(duì)實(shí)際采集語音數(shù)據(jù)而言效率極高;并且如果測(cè)試要求的數(shù)據(jù)庫特性有所改變,可以迅速構(gòu)造另一個(gè)數(shù)據(jù)庫,這是實(shí)際采集的數(shù)據(jù)庫無法比擬的。
最后應(yīng)當(dāng)說明的是以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非對(duì)其限制;盡管參照較佳實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,所屬領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,依然可以對(duì)本發(fā)明的具體實(shí)施方式
進(jìn)行修改或者對(duì)部分技術(shù)特征進(jìn)行等同替換;而不脫離本發(fā)明技術(shù)方案的精神,其均應(yīng)涵蓋在本發(fā)明請(qǐng)求保護(hù)的技術(shù)方案范圍當(dāng)中。
權(quán)利要求
1.快速構(gòu)造關(guān)鍵詞檢出任務(wù)語音數(shù)據(jù)庫的方法,其中執(zhí)行以下步驟步驟1、錄制孤立詞的語音數(shù)據(jù)庫。步驟2、根據(jù)關(guān)鍵詞檢出系統(tǒng)的要求,明確關(guān)鍵詞和非關(guān)鍵詞,關(guān)鍵詞和非關(guān)鍵詞均出現(xiàn)在孤立詞語音數(shù)據(jù)庫中。步驟3、根據(jù)關(guān)鍵詞檢出系統(tǒng)的要求,確定所需數(shù)據(jù)庫的參數(shù),諸如句子總數(shù)、平均的句子長(zhǎng)度、關(guān)鍵詞出現(xiàn)次數(shù)、數(shù)據(jù)庫總的持續(xù)時(shí)間等。步驟4、按照任務(wù)的要求,使用波形拼接的方法將符合關(guān)鍵詞檢出任務(wù)的關(guān)鍵詞和非關(guān)鍵詞語音連接成句子,進(jìn)而生成滿足要求的關(guān)鍵詞檢出任務(wù)數(shù)據(jù)庫。
2.根據(jù)要求1所述的方法,步驟2具體為步驟21、根據(jù)關(guān)鍵詞檢出系統(tǒng)任務(wù)的要求,確定所需中關(guān)鍵詞的數(shù)量和詞表,這些詞表中的詞均在步驟1種的孤立詞語語音數(shù)據(jù)庫中出現(xiàn)。步驟22、在孤立詞語語音數(shù)據(jù)庫中出現(xiàn)而沒有被確定為關(guān)鍵詞的詞語中,挑選確定非關(guān)鍵詞。
3.根據(jù)要求1所述的方法,步驟3具體為步驟31、根據(jù)關(guān)鍵詞檢出系統(tǒng)的的要求,確定每個(gè)關(guān)鍵詞出現(xiàn)的次數(shù),句子的平均長(zhǎng)度,句子的總數(shù)或者數(shù)據(jù)庫語音總的持續(xù)時(shí)間。步驟32、若步驟31中確定了句子的總數(shù),則用隨機(jī)方法產(chǎn)生一系列句子,這些句子的總數(shù)符合步驟31的要求,且滿足如下的要求A所有的句子均由步驟2中確定的關(guān)鍵詞和非關(guān)鍵詞組成;B其中有些句子中沒有出現(xiàn)任何的關(guān)鍵詞(根據(jù)任務(wù)的要求這樣的句子可以不出現(xiàn));C其中有些句子中有且僅有一個(gè)關(guān)鍵詞,有些句子有且僅有兩個(gè)關(guān)鍵詞等等(含有N個(gè)關(guān)鍵詞的句子的數(shù)量根據(jù)任務(wù)的要求確定);這樣得到了一個(gè)句子列表,并執(zhí)行步驟4。步驟33、若步驟31中確定的是數(shù)據(jù)庫的語音總的持續(xù)時(shí)間,則用隨機(jī)方法產(chǎn)生一系列句子,這些句子滿足如下的要求A所有的句子均由步驟2中確定的關(guān)鍵詞和非關(guān)鍵詞組成;B其中有些句子中沒有出現(xiàn)任何的關(guān)鍵詞(根據(jù)任務(wù)的要求這樣的句子可以不出現(xiàn));C其中有些句子中有且僅有一個(gè)關(guān)鍵詞,有些句子有且僅有兩個(gè)關(guān)鍵詞等等(含有N個(gè)關(guān)鍵詞的句子的數(shù)量根據(jù)任務(wù)的要求確定);D每個(gè)句子的長(zhǎng)度按照下式來計(jì)算靜默長(zhǎng)度+所有關(guān)鍵詞長(zhǎng)度+所有非關(guān)鍵詞長(zhǎng)度其中關(guān)鍵詞和非關(guān)鍵詞的長(zhǎng)度根據(jù)孤立詞語音數(shù)據(jù)中的標(biāo)注信息計(jì)算詞長(zhǎng)度=終止時(shí)刻-起始時(shí)刻所有的句子的總長(zhǎng)度為要求的數(shù)據(jù)庫語音持續(xù)的總時(shí)間;這樣得到一個(gè)句子列表,并執(zhí)行步驟4。
4.根據(jù)要求1所述的方法,步驟4具體為;步驟41、根據(jù)步驟3所確定的句子列表以及句子列表中每個(gè)句子的關(guān)鍵詞和非關(guān)鍵詞,確定最終用于關(guān)鍵詞檢出系統(tǒng)語音數(shù)據(jù)庫中每個(gè)句子所需要的來自步驟1所述孤立詞語語音數(shù)據(jù)庫的語音文件。步驟42、根據(jù)步驟41所確定的每個(gè)句子的所有語音內(nèi)容,以及要求的靜默,將各個(gè)語音拼接起來得到每個(gè)句子的完整語音文件;所以在所得用于關(guān)鍵詞檢出任務(wù)的語音數(shù)據(jù)庫是包含一系列句子的集合,每個(gè)句子對(duì)應(yīng)于一個(gè)語音文件;但是也可以根據(jù)實(shí)際的需要將這些句子(文件)進(jìn)行進(jìn)一步的組合。步驟43、根據(jù)步驟41和步驟42所確定的語音數(shù)據(jù),可以得到每條語音的文字標(biāo)注內(nèi)容,并作適當(dāng)?shù)谋硎?,作為測(cè)試關(guān)鍵詞系統(tǒng)的參考答案。
全文摘要
本發(fā)明涉及一種快速構(gòu)造用于關(guān)鍵詞檢出任務(wù)的語音數(shù)據(jù)庫的方法。其中執(zhí)行以下步驟步驟1.錄制孤立詞語音數(shù)據(jù)庫;步驟2.根據(jù)關(guān)鍵詞檢出系統(tǒng)的要求確定關(guān)鍵詞表和非關(guān)鍵詞表;步驟3.確定關(guān)鍵詞檢出測(cè)試數(shù)據(jù)的參數(shù)如總的句子數(shù),時(shí)間長(zhǎng)度,關(guān)鍵詞出現(xiàn)次數(shù)等;步驟4.使用波形拼接的方法將符合關(guān)鍵詞檢出系統(tǒng)要求的關(guān)鍵詞和非關(guān)鍵詞語音連接成句子,進(jìn)而生成滿足要求的用于關(guān)鍵詞檢出任務(wù)的數(shù)據(jù)庫。本發(fā)明實(shí)現(xiàn)了利用已有的孤立詞語音數(shù)據(jù)庫快速構(gòu)造用于關(guān)鍵詞檢出任務(wù)的語音數(shù)據(jù)庫的方法,能靈活的根據(jù)不同的要求提供相應(yīng)的語音數(shù)據(jù)庫。
文檔編號(hào)G06F17/30GK1831829SQ20061007677
公開日2006年9月13日 申請(qǐng)日期2006年4月20日 優(yōu)先權(quán)日2006年4月20日
發(fā)明者黃石磊, 謝湘, 匡鏡明 申請(qǐng)人:北京理工大學(xué)