專利名稱:全能語(yǔ)音音序識(shí)別技術(shù)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計(jì)算機(jī)語(yǔ)音識(shí)別領(lǐng)域,尤其涉及一種能使計(jì)算機(jī)或語(yǔ)音識(shí)別設(shè)備對(duì)自然語(yǔ)音作出可靠準(zhǔn)確音序識(shí)別的全能語(yǔ)音音序識(shí)別技術(shù)。
在現(xiàn)有技術(shù)計(jì)算機(jī)語(yǔ)音識(shí)別技術(shù)中,人們對(duì)語(yǔ)音的識(shí)別一般都基于特定的語(yǔ)言環(huán)境才能識(shí)別,一但離開(kāi)特定的語(yǔ)言環(huán)境,這種語(yǔ)音識(shí)別算法就可能失效,因此目前現(xiàn)有技術(shù)語(yǔ)音識(shí)別算法是有真對(duì)性的算法,使之在應(yīng)用上存在局限性的缺陷如,語(yǔ)音的文字錄入方面,由于存在語(yǔ)言的特定環(huán)境不定問(wèn)題,因此難以將語(yǔ)音的文字錄入普及化;再如,語(yǔ)音的低速化數(shù)字通訊、語(yǔ)音的數(shù)字化存儲(chǔ)、口令化操作的家電產(chǎn)品開(kāi)發(fā)等等眾多領(lǐng)域的語(yǔ)音識(shí)別實(shí)施問(wèn)題亟待解決。目前較為成熟的一款語(yǔ)音識(shí)別產(chǎn)品是IBM的Via Voice,雖然它實(shí)現(xiàn)了語(yǔ)音識(shí)別產(chǎn)品的商品化,但在使用上還存在許多不足;需要語(yǔ)音訓(xùn)練,不能自動(dòng)區(qū)分語(yǔ)種,需要具有一定專業(yè)知識(shí)的人士才能從容使用,總之,你把它買(mǎi)回家,使用上還會(huì)有許多麻煩等著你,其主要原因是把語(yǔ)音轉(zhuǎn)變?yōu)橛?jì)算機(jī)能夠識(shí)別的語(yǔ)音編碼上沒(méi)有較為徹底的解決方案。
本發(fā)明的目的在于提供一種改進(jìn)的全能語(yǔ)音音序識(shí)別技術(shù),它能利用現(xiàn)代計(jì)算機(jī)技術(shù),使計(jì)算機(jī)或?qū)S谜Z(yǔ)音識(shí)別設(shè)備可以不分客體,不限語(yǔ)音速度,不分語(yǔ)種、語(yǔ)系,只要符合該語(yǔ)種、語(yǔ)系的發(fā)音標(biāo)準(zhǔn)的自然語(yǔ)音作出可靠準(zhǔn)確的音序識(shí)別,以此為基礎(chǔ)人們就可以對(duì)各種語(yǔ)言環(huán)境的語(yǔ)音作出各種應(yīng)用設(shè)計(jì)。如文字錄入,口令化操作,數(shù)字錄音,低速語(yǔ)音通信。
本發(fā)明的目的是這樣實(shí)現(xiàn)的一種全能語(yǔ)音音序識(shí)別技術(shù),用于對(duì)自然語(yǔ)音作出可靠準(zhǔn)確的音序識(shí)別,其特征在于包括以下步驟第一,以相對(duì)獨(dú)立的肌體運(yùn)動(dòng)過(guò)程為最小編碼碼元,以語(yǔ)音中含有語(yǔ)音器官相對(duì)獨(dú)立肌體運(yùn)動(dòng)過(guò)程為最小編碼碼元,把語(yǔ)音編碼確定為幾種相對(duì)對(duì)立肌體運(yùn)動(dòng)過(guò)程的時(shí)空組合,這種時(shí)空組合表現(xiàn)為最小編碼碼元在時(shí)間上的關(guān)系既有重疊性又有先后性,使體現(xiàn)語(yǔ)音信號(hào)的肌體的運(yùn)動(dòng)過(guò)程在編碼中都能得到體現(xiàn)和在時(shí)間保持一致;第二,對(duì)基本發(fā)音進(jìn)行音序編碼,采用以上最小編碼碼元完成一個(gè)單音的編碼過(guò)程即為語(yǔ)音音序編碼,這種編碼可以進(jìn)行特征提煉后編碼,對(duì)漢語(yǔ)來(lái)說(shuō)可能就是一個(gè)漢字的字音,對(duì)其他語(yǔ)言也是如此;第三,采用音序編碼完成語(yǔ)音流到音序編碼流的轉(zhuǎn)換,以基本音序編碼為基礎(chǔ)組成的語(yǔ)音音序碼元流,即為語(yǔ)音音序識(shí)別編碼,此語(yǔ)音音序碼元流可以應(yīng)用在各種語(yǔ)音產(chǎn)品中,如口令化操作、文字入錄、語(yǔ)音通信。
在上述的全能語(yǔ)音音序識(shí)別技術(shù)中,其中,在所述的第一步驟中,所述的語(yǔ)音音序其基本碼元(BC)的編碼格式如下
基本碼元標(biāo)識(shí)單個(gè)肌體運(yùn)動(dòng)過(guò)程編碼值;所述的時(shí)空組合中的時(shí)空編碼幀(FTC)格式如下
時(shí)空編碼標(biāo)識(shí)幾個(gè)基本碼元在時(shí)間上的相互關(guān)系;所述的語(yǔ)音音序其完整語(yǔ)音音序碼流格式如下
所述的肌體運(yùn)動(dòng)的肌體代碼表述內(nèi)容為與發(fā)音有關(guān)的相對(duì)獨(dú)立的肌體,包括咽喉、口舌、嘴唇。
所述的肌體運(yùn)動(dòng)過(guò)程編碼值編碼表述如下
在上述的全能語(yǔ)音音序識(shí)別技術(shù)中,其中,在所述的第一步驟中,所述的區(qū)分相對(duì)獨(dú)立的肌體運(yùn)動(dòng)過(guò)程中先確定肌體運(yùn)動(dòng)過(guò)程與發(fā)音有關(guān)的相對(duì)獨(dú)立的肌體運(yùn)動(dòng)過(guò)程的編碼。
在上述的全能語(yǔ)音音序識(shí)別技術(shù)中,其中,在所述的第二步驟中,在所述的音序編碼中對(duì)自然語(yǔ)音的字音分解是根據(jù)字音的特定肌體運(yùn)動(dòng)過(guò)程進(jìn)行分解。
本發(fā)明全能語(yǔ)音音序識(shí)別技術(shù)由于采用了上述的技術(shù)方案,使之與現(xiàn)有技術(shù)相比,具有以下的優(yōu)點(diǎn)和積極效果
(1)解決了計(jì)算機(jī)識(shí)別不同語(yǔ)種的語(yǔ)音,語(yǔ)音編碼的統(tǒng)一性、正確性與唯一性。
本發(fā)明以語(yǔ)音器官的肌體運(yùn)動(dòng)過(guò)程為研究對(duì)象,把語(yǔ)音器官看作是一個(gè)受肌體運(yùn)動(dòng)控制的語(yǔ)音音序編碼調(diào)制器,把特定的肌體運(yùn)動(dòng)過(guò)程組合看作是音序編碼,把語(yǔ)音的語(yǔ)系、語(yǔ)種之分看作是語(yǔ)音交流的音序組合編碼協(xié)議---音序時(shí)空編碼,解決了計(jì)算機(jī)識(shí)別不同語(yǔ)種的語(yǔ)音,語(yǔ)音音序編碼的統(tǒng)一、正確性與唯一性。它把識(shí)別不同語(yǔ)言的語(yǔ)音歸結(jié)為音序編碼問(wèn)題,而不必其改變音序識(shí)別算法,使識(shí)別方法的更具有廣泛性。
(2)采用計(jì)算機(jī)對(duì)自然語(yǔ)音信號(hào)進(jìn)行處理能夠準(zhǔn)確識(shí)別肌體的運(yùn)動(dòng)過(guò)程。
本發(fā)明把語(yǔ)音識(shí)別優(yōu)化為計(jì)算機(jī)對(duì)自然語(yǔ)音中包含的特定的肌體運(yùn)動(dòng)過(guò)程進(jìn)行識(shí)別,而不是對(duì)特定語(yǔ)種,通過(guò)語(yǔ)音信號(hào)波形研究,人為把語(yǔ)音區(qū)分為元音、輔音等,然后對(duì)信號(hào)進(jìn)行統(tǒng)計(jì)分析、研究一種特殊算法,近似計(jì)算出單位時(shí)間內(nèi)某語(yǔ)音信號(hào)的編碼值。事實(shí)證明這種識(shí)別方法具有相當(dāng)?shù)木窒扌?,不能勝任語(yǔ)音識(shí)別。原因是,語(yǔ)音信號(hào)是多個(gè)語(yǔ)音肌體運(yùn)動(dòng)過(guò)程共同相互作用的結(jié)果,語(yǔ)音信號(hào)是一個(gè)響應(yīng)表現(xiàn),并非激勵(lì)源,而在單位時(shí)間內(nèi)計(jì)算出值可能是幾個(gè)語(yǔ)音肌體共同運(yùn)動(dòng)作用的結(jié)果,因此計(jì)算出的編碼值具有很大的離散性,用它作為語(yǔ)音識(shí)別的語(yǔ)音編碼,不能滿足語(yǔ)音識(shí)別中的語(yǔ)音編碼的唯一性要求。本發(fā)明把語(yǔ)音識(shí)別中的語(yǔ)音音序識(shí)別與語(yǔ)音學(xué)徹底脫離開(kāi)來(lái),把語(yǔ)音識(shí)別與語(yǔ)音的特定肌體運(yùn)動(dòng)過(guò)程,即語(yǔ)音的激勵(lì)過(guò)程結(jié)合起來(lái),以保證語(yǔ)音音序編碼的正確性和唯一性要求。以特定的語(yǔ)音肌體運(yùn)動(dòng)過(guò)程為語(yǔ)音音序的最小編碼碼元,以特定的字音、詞、詞組、簡(jiǎn)單句子為語(yǔ)音幀編碼,大大降低了計(jì)算機(jī)語(yǔ)音識(shí)別的難度,從而對(duì)自然語(yǔ)音作出準(zhǔn)確的音序編碼識(shí)別。
通過(guò)以下對(duì)本發(fā)明全能語(yǔ)音音序識(shí)別技術(shù)的一實(shí)施例結(jié)合其附圖的描述,可以進(jìn)一步理解本實(shí)用新型的目的、具體結(jié)構(gòu)特征和優(yōu)點(diǎn)。其中,附圖為
圖1是依據(jù)本發(fā)明提出的全能語(yǔ)音音序識(shí)別技術(shù)的原理方框圖;圖2是實(shí)現(xiàn)本發(fā)明全能語(yǔ)音音序識(shí)別技術(shù)的框圖;如圖1與圖2所示,它們分別是本發(fā)明全能語(yǔ)音音序識(shí)別技術(shù)的原理方框圖和框圖。本發(fā)明全能語(yǔ)音音序識(shí)別技術(shù),是以語(yǔ)音客體的語(yǔ)音器官的肌體運(yùn)動(dòng)過(guò)程為研究對(duì)象,把語(yǔ)音器官看作是一個(gè)受肌體運(yùn)動(dòng)控制的語(yǔ)音音序編碼調(diào)制器,把特定的肌體運(yùn)動(dòng)過(guò)程組合看作是音序編碼,把語(yǔ)音的語(yǔ)系、語(yǔ)種之分看作是語(yǔ)音交流傳輸?shù)奶厥饩幋a協(xié)議,這種編碼稱為語(yǔ)音時(shí)空編碼,以下簡(jiǎn)稱時(shí)空編碼。把語(yǔ)音通信視為模糊協(xié)議通信,運(yùn)用模糊調(diào)制與模糊解調(diào)的基本原理,使計(jì)算機(jī)能夠語(yǔ)識(shí)別語(yǔ)音的這種傳輸協(xié)議與編碼方式,從而對(duì)自然語(yǔ)音作出準(zhǔn)確的音序編碼識(shí)別。
所述的全能語(yǔ)音音序識(shí)別技術(shù),研究的理論基礎(chǔ)是在語(yǔ)音的客體發(fā)同語(yǔ)音(以同類客體能夠識(shí)別其音為準(zhǔn))時(shí),客體語(yǔ)音器官的各肌體運(yùn)動(dòng)過(guò)程必須相對(duì)一致,與客體在該音與對(duì)應(yīng)該音的器官各肌體運(yùn)動(dòng)過(guò)程存在一一對(duì)應(yīng)關(guān)系。語(yǔ)音器官是個(gè)特殊的音頻信號(hào)調(diào)制器,是該客體意識(shí)活動(dòng)語(yǔ)的音信息肌體編碼調(diào)制器。研究語(yǔ)音音序識(shí)別技術(shù)就是研究語(yǔ)音客體肌體運(yùn)動(dòng)的編碼調(diào)制過(guò)程,找出語(yǔ)音肌體調(diào)制過(guò)程與語(yǔ)音信號(hào)間的客觀規(guī)律,然后對(duì)語(yǔ)音音序進(jìn)行其調(diào)制過(guò)程的解調(diào),從而達(dá)到準(zhǔn)確識(shí)別語(yǔ)音音序的目的。
“相對(duì)一致”是“全能語(yǔ)音音序識(shí)別”基本理論之一、也是客體間同音語(yǔ)音可識(shí)別、信息可交流的理論基礎(chǔ)。語(yǔ)音中語(yǔ)系、語(yǔ)種的發(fā)音規(guī)范(音標(biāo))即為同音可識(shí)別的“相對(duì)一致”的概念,是語(yǔ)音客體間信息可識(shí)別交互的編碼協(xié)議規(guī)范?!跋鄬?duì)一致”引申于同語(yǔ)音肌體調(diào)制過(guò)程的肌體器官組織運(yùn)動(dòng)過(guò)程的相對(duì)一致,印驗(yàn)于語(yǔ)音的發(fā)音規(guī)范與調(diào)制解調(diào)器進(jìn)行數(shù)據(jù)通信的協(xié)議規(guī)范。語(yǔ)音發(fā)音規(guī)范決定了語(yǔ)音客體間信息的編碼交互規(guī)范,語(yǔ)音客體共同遵循這一編碼規(guī)范就是相對(duì)一致。
“一一對(duì)應(yīng)”又是“全能語(yǔ)音音序識(shí)別”基本理論之一、也是語(yǔ)音的可識(shí)別區(qū)分理論基礎(chǔ)。語(yǔ)系、語(yǔ)種中語(yǔ)音的可識(shí)別性決定了語(yǔ)音的特定性。語(yǔ)音來(lái)源于語(yǔ)音客體發(fā)音器官的肌體運(yùn)動(dòng)過(guò)程即肌體的語(yǔ)音編碼調(diào)制過(guò)程,從而決定了肌體運(yùn)動(dòng)過(guò)程組合的特定性,同時(shí)也決定了它們間的一一對(duì)應(yīng)關(guān)系?!耙灰粚?duì)應(yīng)”來(lái)源于肌體語(yǔ)音調(diào)制過(guò)程---語(yǔ)音編碼調(diào)制過(guò)程與調(diào)制信號(hào)的一一對(duì)應(yīng),印證于調(diào)制解調(diào)器的調(diào)制理論---調(diào)制與信號(hào)的一一對(duì)應(yīng)關(guān)系。
調(diào)制與解調(diào)器原理能夠很好地解釋人類在語(yǔ)音意識(shí)活動(dòng)中的所有復(fù)雜問(wèn)題。如語(yǔ)系、語(yǔ)種問(wèn)題好比是調(diào)制與解調(diào)器之間編碼組合協(xié)議問(wèn)題。人類具有多種不同的語(yǔ)言,調(diào)制解調(diào)器之間有不同的編碼協(xié)議。還有抗干擾問(wèn)題,語(yǔ)音快慢問(wèn)題,識(shí)別不同客體問(wèn)題,同一語(yǔ)音客體可以識(shí)別不同語(yǔ)言問(wèn)題,等等...。
所述的語(yǔ)音音序識(shí)別與編碼調(diào)制,即為語(yǔ)音信號(hào)的解調(diào)過(guò)程。計(jì)算機(jī)語(yǔ)音音序識(shí)別研究的主要目的是通過(guò)計(jì)算機(jī)對(duì)語(yǔ)音的分析處理使其能獲得準(zhǔn)確的語(yǔ)音客體意識(shí)活動(dòng)信息。計(jì)算機(jī)語(yǔ)音識(shí)別技術(shù)是以語(yǔ)音的電信號(hào)作為接口,通過(guò)計(jì)算機(jī)強(qiáng)大的數(shù)據(jù)處理能力,準(zhǔn)確識(shí)別不同的語(yǔ)音信號(hào)。語(yǔ)音音序識(shí)別研究的主體是語(yǔ)音信號(hào),但它的客體并不是語(yǔ)音客體的意識(shí)活動(dòng),而是語(yǔ)音客體的肌體調(diào)制過(guò)程。語(yǔ)音信號(hào)的表現(xiàn)形式具有特征性又有復(fù)雜性。特征性是指語(yǔ)音具有客體的離散性與肌體調(diào)制過(guò)程中肌體運(yùn)動(dòng)的規(guī)律性;復(fù)雜性是指肌體運(yùn)動(dòng)過(guò)程組合的復(fù)雜和語(yǔ)音信號(hào)表現(xiàn)形式的復(fù)雜。語(yǔ)音器官就是一個(gè)肌體語(yǔ)音信號(hào)編碼調(diào)制器,語(yǔ)音音序識(shí)別就是語(yǔ)音信號(hào)的肌體運(yùn)動(dòng)解調(diào)過(guò)程。
語(yǔ)音是肌體調(diào)制過(guò)程的表現(xiàn),即客體意識(shí)活動(dòng)這個(gè)特殊的信息編碼控制語(yǔ)音器官作一組含語(yǔ)系、語(yǔ)種規(guī)律的肌體運(yùn)動(dòng)調(diào)制過(guò)程。研究語(yǔ)音音序識(shí)別就是運(yùn)用信號(hào)調(diào)制解調(diào)的基本原理研究肌體調(diào)制過(guò)程與語(yǔ)音信號(hào)的關(guān)系。因此語(yǔ)音音序識(shí)別是依賴于語(yǔ)音器官各肌體運(yùn)動(dòng)過(guò)程組合的識(shí)別,借助語(yǔ)音的表現(xiàn)形式,但并不盲目,又不能離開(kāi)。
現(xiàn)有調(diào)制解調(diào)器的設(shè)計(jì)原理與應(yīng)用也不用多加說(shuō)明。研制調(diào)制解調(diào)器目的就是為傳遞數(shù)據(jù)信息,并且運(yùn)用編碼與糾錯(cuò)技術(shù)使計(jì)算機(jī)與計(jì)算機(jī)之間能夠進(jìn)行正確的數(shù)據(jù)傳輸。在它們之間能夠進(jìn)行數(shù)據(jù)交換前提是它們擁有共同的編碼與傳輸控制協(xié)議。同樣語(yǔ)音客體間能夠進(jìn)行信息交流也是因?yàn)樵谒鼈冎g存在著一種客體意識(shí)活動(dòng)信息的編碼傳輸協(xié)議。計(jì)算機(jī)要能夠識(shí)別語(yǔ)音同樣必須遵守語(yǔ)音信息的編碼傳輸協(xié)議與語(yǔ)音信號(hào)的調(diào)制規(guī)律,即肌體運(yùn)動(dòng)過(guò)程的組合編碼規(guī)范與語(yǔ)音信號(hào)的肌體調(diào)制變化規(guī)律。不同的語(yǔ)系、語(yǔ)種都有不同的語(yǔ)音信息傳輸編碼規(guī)范。調(diào)制解調(diào)器用信號(hào)頻率有無(wú)或相位特征來(lái)代表信息值,語(yǔ)音機(jī)體調(diào)制器同樣也用頻率特征的變化把這些編碼信息傳遞出去。電子器件調(diào)制器與肌體語(yǔ)音調(diào)制器在調(diào)制機(jī)理是相同的,但它們的調(diào)制過(guò)程確具有不同。用電子器件設(shè)計(jì)而成的調(diào)制器是用簡(jiǎn)單的固定頻率變化或者固定相位變化代表信息,為了抗干擾,達(dá)到數(shù)據(jù)的正確傳輸,對(duì)數(shù)據(jù)采用糾錯(cuò)編碼形式。而機(jī)體調(diào)制,一方面為了傳遞不同的信息,另一方面為了使信息能夠正確傳遞,不僅要有不同的編碼,而且還要使肌體器官能夠接受并且能夠區(qū)分它們,考慮到客體對(duì)語(yǔ)音的反應(yīng)接受能力與客體間的差異性。在語(yǔ)音的調(diào)制上,不同客體對(duì)同一語(yǔ)音的肌體調(diào)制在其語(yǔ)音信號(hào)的表現(xiàn)上即有相同性又有相異性。因此,肌體的調(diào)制過(guò)程在表現(xiàn)上是一種模糊調(diào)制過(guò)程,在實(shí)質(zhì)上他包含的肌體的運(yùn)動(dòng)過(guò)程是唯一的??腕w在對(duì)語(yǔ)音的識(shí)別過(guò)程中,即使有較大的聲音干擾也能作出準(zhǔn)確識(shí)別,說(shuō)明肌體調(diào)制信號(hào)有較強(qiáng)的抗干擾能力,說(shuō)明這種調(diào)制的優(yōu)越性。
由此,本發(fā)明,全能語(yǔ)音音序識(shí)別技術(shù),用于對(duì)自然語(yǔ)音作出可靠準(zhǔn)確的音序識(shí)別,包括以下步驟一.以相對(duì)獨(dú)立的肌體運(yùn)動(dòng)過(guò)程為最小編碼碼元。
以語(yǔ)音中含有語(yǔ)音器官相對(duì)獨(dú)立肌體運(yùn)動(dòng)過(guò)程為最小編碼碼元,把語(yǔ)音編碼確定為幾種相對(duì)對(duì)立肌體運(yùn)動(dòng)過(guò)程的時(shí)空組合,這種時(shí)空組合表現(xiàn)為最小編碼碼元在時(shí)間上的關(guān)系既有重疊性又有先后性,使體現(xiàn)語(yǔ)音信號(hào)的肌體的運(yùn)動(dòng)過(guò)程在編碼中都能得到體現(xiàn)和在時(shí)間保持一致。
二.對(duì)基本發(fā)音進(jìn)行音序編碼。
采用以上最小編碼碼元完成一個(gè)單音的編碼過(guò)程即為語(yǔ)音音序編碼,這種編碼可以進(jìn)行特征提煉后編碼,對(duì)漢語(yǔ)來(lái)說(shuō)可能就是一個(gè)漢字的字音,對(duì)其他語(yǔ)言也是如此。
三.采用音序編碼完成語(yǔ)音流到音序編碼流的轉(zhuǎn)換。
以基本音序編碼為基礎(chǔ)組成的語(yǔ)音音序碼元流,即為語(yǔ)音音序識(shí)別編碼,此語(yǔ)音音序碼元流可以應(yīng)用在各種語(yǔ)音產(chǎn)品中,如口令化操作、文字入錄、語(yǔ)音通信等。
在上述步驟中,語(yǔ)音音序基本碼元的編碼格式如下
基本碼元標(biāo)識(shí)單個(gè)肌體運(yùn)動(dòng)過(guò)程編碼值;時(shí)空編碼幀格式如下
時(shí)空編碼標(biāo)識(shí)幾個(gè)基本碼元在時(shí)間上的相互關(guān)系。
完整語(yǔ)音音序碼流格式如下
肌體代碼表述內(nèi)容與發(fā)音有關(guān)的相對(duì)獨(dú)立的肌體。如咽喉、口舌、嘴唇等肌體運(yùn)動(dòng)過(guò)程編碼值編碼表述如下
綜上所述,本發(fā)明全能語(yǔ)音音序識(shí)別技術(shù)由于采用了上述技術(shù)方案,因此它解決了計(jì)算機(jī)識(shí)別不同語(yǔ)種的語(yǔ)音,語(yǔ)音編碼的統(tǒng)一性、正確性與唯一性;同時(shí),采用計(jì)算機(jī)對(duì)自然語(yǔ)音信號(hào)進(jìn)行處理能夠準(zhǔn)確識(shí)別肌體的運(yùn)動(dòng)過(guò)程,由此可以特定的語(yǔ)音肌體運(yùn)動(dòng)過(guò)程為語(yǔ)音音序的最小編碼碼元,以特定的字音、詞、詞組、簡(jiǎn)單句子為語(yǔ)音幀編碼,大大降低了計(jì)算機(jī)語(yǔ)音識(shí)別的難度,從而對(duì)自然語(yǔ)音作出準(zhǔn)確的音序編碼識(shí)別。
權(quán)利要求
1.一種全能語(yǔ)音音序識(shí)別技術(shù),用于對(duì)自然語(yǔ)音作出可靠準(zhǔn)確的音序識(shí)別,其特征在于包括以下步驟第一,以相對(duì)獨(dú)立的肌體運(yùn)動(dòng)過(guò)程為最小編碼碼元,以語(yǔ)音中含有語(yǔ)音器官相對(duì)獨(dú)立肌體運(yùn)動(dòng)過(guò)程為最小編碼碼元,把語(yǔ)音編碼確定為幾種相對(duì)對(duì)立肌體運(yùn)動(dòng)過(guò)程的時(shí)空組合,這種時(shí)空組合表現(xiàn)為最小編碼碼元在時(shí)間上的關(guān)系既有重疊性又有先后性,使體現(xiàn)語(yǔ)音信號(hào)的肌體的運(yùn)動(dòng)過(guò)程在編碼中都能得到體現(xiàn)和在時(shí)間保持一致;第二,對(duì)基本發(fā)音進(jìn)行音序編碼,采用以上最小編碼碼元完成一個(gè)單音的編碼過(guò)程即為語(yǔ)音音序編碼,這種編碼可以進(jìn)行特征提煉后編碼,對(duì)漢語(yǔ)來(lái)說(shuō)可能就是一個(gè)漢字的字音,對(duì)其他語(yǔ)言也是如此;第三,采用音序編碼完成語(yǔ)音流到音序編碼流的轉(zhuǎn)換,以基本音序編碼為基礎(chǔ)組成的語(yǔ)音音序碼元流,即為語(yǔ)音音序識(shí)別編碼,此語(yǔ)音音序碼元流可以應(yīng)用在各種語(yǔ)音產(chǎn)品中,如口令化操作、文字入錄、語(yǔ)音通信。
2.如權(quán)利要求1所述的全能語(yǔ)音音序識(shí)別技術(shù),其特征在于在所述的第一步驟中,所述的語(yǔ)音音序其基本碼元(BC)的編碼格式如下
基本碼元標(biāo)識(shí)單個(gè)肌體運(yùn)動(dòng)過(guò)程編碼值;所述的時(shí)空組合中的時(shí)空編碼幀(FTC)格式如下
時(shí)空編碼標(biāo)識(shí)幾個(gè)基本碼元在時(shí)間上的相互關(guān)系;所述的語(yǔ)音音序其完整語(yǔ)音音序碼流格式如下
所述的肌體運(yùn)動(dòng)的肌體代碼表述內(nèi)容為與發(fā)音有關(guān)的相對(duì)獨(dú)立的肌體,包括咽喉、口舌、嘴唇。所述的肌體運(yùn)動(dòng)過(guò)程編碼值編碼表述如下
3.如權(quán)利要求1所述的全能語(yǔ)音音序識(shí)別技術(shù),其特征在于在所述的第一步驟中,所述的區(qū)分相對(duì)獨(dú)立的肌體運(yùn)動(dòng)過(guò)程中先確定肌體運(yùn)動(dòng)過(guò)程與發(fā)音有關(guān)的相對(duì)獨(dú)立的肌體運(yùn)動(dòng)過(guò)程的編碼。
4.如權(quán)利要求1所述的全能語(yǔ)音音序識(shí)別技術(shù),其特征在于在所述的第二步驟中,在所述的音序編碼中對(duì)自然語(yǔ)音的字音分解是根據(jù)字音的特定肌體運(yùn)動(dòng)過(guò)程進(jìn)行分解。
全文摘要
本發(fā)明涉及一種全能語(yǔ)音音序識(shí)別技術(shù),用于對(duì)自然語(yǔ)音作出音序識(shí)別,其特征在于包括以下步驟第一,以相對(duì)獨(dú)立的肌體運(yùn)動(dòng)過(guò)程為最小編碼碼元,以語(yǔ)音中含有語(yǔ)音器官相對(duì)獨(dú)立肌體運(yùn)動(dòng)過(guò)程為最小編碼碼元,并確定為幾種時(shí)空組合;第二,對(duì)基本發(fā)音進(jìn)行音序編碼,采用最小編碼碼元完成一個(gè)單音的編碼過(guò)程即為語(yǔ)音音序編碼;第三,用音序編碼完成語(yǔ)音流到音序編碼流的轉(zhuǎn)換,以基本音序編碼為基礎(chǔ)組成語(yǔ)音音序碼元流,即語(yǔ)音音序識(shí)別編碼。
文檔編號(hào)G10L15/00GK1316727SQ0110549
公開(kāi)日2001年10月10日 申請(qǐng)日期2001年2月28日 優(yōu)先權(quán)日2001年2月28日
發(fā)明者高振峰 申請(qǐng)人:高振峰