專利名稱:語(yǔ)音辨識(shí)裝置及其方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于—種語(yǔ)音
別是關(guān)于一種采用詞描述語(yǔ)
置及其方法
背景技術(shù):
隨著電子科技的進(jìn)步、
及化,輕薄短小的可攜式裝
取的平臺(tái)但是,不定每
或者鼠標(biāo)等人類慣用的輸出
與智能型設(shè)備之間的人機(jī)接
的溝通媒介語(yǔ)音來(lái)進(jìn)行
中,可以取得的多媒體影音
多媒體影音信息的同時(shí)將語(yǔ)
使用者更快速地了解中所
論是語(yǔ)音控制或者將語(yǔ)音轉(zhuǎn)
語(yǔ)首是相當(dāng)重要的
及其方法
辨識(shí)裝置及其方法,且特
的方式,來(lái)辨識(shí)漢詞的裝
無(wú)線通訊及網(wǎng)際網(wǎng)絡(luò)的普
置逐漸成為新—代信息存
種設(shè)備都具有屏幕、鍵盈:
入裝置因此,未來(lái)人類
□也將通過(guò)最白然且方便
控制另外,在曰常生活
信息越來(lái)越多倘若播放
音信息轉(zhuǎn)為文字,便能讓
傳達(dá)的主題及概念而無(wú)
為文字,如何正確地辨識(shí)傳統(tǒng)的漢字語(yǔ)音識(shí)別器主要包括前端處理器
(front- end processor)、 詞匯數(shù)據(jù)庫(kù)、聲學(xué)模型 (acoustic model) 及語(yǔ)言模型 (language model)。 當(dāng)接收到語(yǔ)音信號(hào)時(shí),由前端處理器擷取語(yǔ)音信號(hào)的 音框(voice frame),并找出音框中對(duì)語(yǔ)音辨識(shí)具有 幫助的特征,例如梅爾倒頻譜系數(shù)(Mel-frequency cepstral coefficient, MFCC)。 聲音模型一般為隱藏 式馬可夫模型(hidden Markov model, HMM), 以一個(gè) 音素、音節(jié)或者詞為單位,將上述特征與已建立的聲 音模型進(jìn)行比對(duì),以確定語(yǔ)音信號(hào)的音框是什么聲音。 接著,通過(guò)像查字典的方式,從詞匯數(shù)據(jù)庫(kù)中搜尋此 聲音可能對(duì)應(yīng)到的 一 些文字。而語(yǔ)言模型通過(guò)機(jī)率與 統(tǒng)計(jì)來(lái)判斷所搜尋的文字何者于文句中的組合較為適 當(dāng)。如此 一 來(lái),便能辨識(shí)出語(yǔ)音所對(duì)應(yīng)的文字了 。
美國(guó)第6 1 6 3 7 6 7號(hào)專利案提出 一 種用于識(shí) 別孤立或者非相關(guān)漢字的語(yǔ)音識(shí)別方法和系統(tǒng)。圖1 繪示為已知語(yǔ)音識(shí)別系統(tǒng)的示意圖。請(qǐng)參照?qǐng)D1 ,此 語(yǔ)音識(shí)別系統(tǒng)包括基于漢字描述語(yǔ)言的語(yǔ)音識(shí)別器1 1 0 、漢字描述語(yǔ)言的語(yǔ)法分析器1 2 0以及漢字產(chǎn) 生器1 3 0 。而此語(yǔ)音識(shí)別器1 1 0與上述傳統(tǒng)的語(yǔ) 音識(shí)別器的區(qū)別在于語(yǔ)音識(shí)別器1 1 0的語(yǔ)言模型更 加上了一個(gè)基于漢字描述語(yǔ)言的語(yǔ)言模型。此篇專利案先將漢字描述語(yǔ)言的語(yǔ)法規(guī)則建立于 語(yǔ)言模型之中。當(dāng)語(yǔ)音識(shí)別器110接收 一 漢字描述
語(yǔ),例如抬頭的抬"tai 2 tou 2de 5tai 2 ",
并逐字辨識(shí)出漢字描述語(yǔ)所包含的漢字時(shí),基于漢字
描述語(yǔ)言的語(yǔ)言模型對(duì)照所辨識(shí)的漢字描述語(yǔ)為屬于
何種語(yǔ)法規(guī)則,例如抬頭的抬"tai 2t o u 2de 5
tai 2 ,,為屬于"詞+的+漢字"的語(yǔ)法規(guī)則,從而辨識(shí)
出所輸入的漢字為抬。
在漢語(yǔ)的語(yǔ)法里,詞為一個(gè)以上的漢字所構(gòu)成,
句子為一個(gè)以上的詞所構(gòu)成,而段落為個(gè)以上的句
子所構(gòu)成。若采用上述專利案的方式,逐字辨識(shí)使用
者所輸入的漢詞或者文句時(shí),則辨識(shí)過(guò)程便會(huì)花費(fèi)過(guò)
于冗長(zhǎng)的時(shí)間。例如輸入陽(yáng)明山 一 漢詞時(shí),則可能要
以太陽(yáng)的陽(yáng)、明天的明、以及高山的山作為漢字描述
語(yǔ)來(lái)辨識(shí)出正確的漢字。
另外,在語(yǔ)音辨識(shí)技術(shù)的領(lǐng)域中,單詞的辨識(shí)是
相當(dāng)重要的?,F(xiàn)行的方法為將所有的詞匯集起來(lái)建立
詞匯數(shù)據(jù)庫(kù),但是所建立的詞匯數(shù)據(jù)庫(kù)愈龐大,混淆
度也會(huì)愈高。由于單詞的辨識(shí)未有上下文的參考,所
以如"大道"、"大盜"、"打倒"等相近音的單詞,
或者詞長(zhǎng)較短的單詞較易造成辨識(shí)錯(cuò)誤。
發(fā)明內(nèi)容
本發(fā)明的目的在于,提供 一 種語(yǔ)音辨識(shí)裝置及
方法,為采用詞描述語(yǔ)的方式來(lái)辨識(shí)漢詞,以增加
漢詞辨識(shí)的正確性及減少辨識(shí)過(guò)程所花費(fèi)的時(shí)間。
本發(fā)明提出 一 種適于辨識(shí)漢詞的語(yǔ)音辨識(shí)裝置,
其包括詞匯模型、語(yǔ)音辨識(shí)模組、語(yǔ)言模型以及語(yǔ)法
分析模組,中上述漢詞為由多個(gè)漢字所組成。詞匯
模型儲(chǔ)存多組詞匯,且各詞匯為至少 一 字符所組成
語(yǔ)音辨識(shí)模組將符合詞描述語(yǔ)語(yǔ)法結(jié)構(gòu)的語(yǔ)音信號(hào)進(jìn)
語(yǔ)音辨識(shí)處理,以產(chǎn)生數(shù)字形式的文字序列。此語(yǔ)
辨識(shí)處理為依據(jù)詞描述語(yǔ)的 一 特征,從詞匯模型中
搜尋相關(guān)于詞描述語(yǔ)的詞匯,并且參考語(yǔ)言模型所提
供的語(yǔ)法組合機(jī)率,產(chǎn)生適切的文字序列。在此過(guò)程
之中,語(yǔ)曰模型儲(chǔ)存所搜尋的詞匯之間的連接關(guān)系及
詞描述語(yǔ)的語(yǔ)法限制,提供上述的語(yǔ)法組合機(jī)率給語(yǔ)
音辨識(shí)模組而語(yǔ)法分析模組便分析文字序列的語(yǔ)法
結(jié)構(gòu),并擷取出漢詞。
本發(fā)明提出 一 種適于辨識(shí)漢詞的語(yǔ)音辨識(shí)方法,
而此漢詞為多個(gè)漢字所組成。首先,接收符合詞描述
語(yǔ)語(yǔ)法結(jié)構(gòu)的語(yǔ)音信號(hào),并將語(yǔ)音信號(hào)進(jìn)行語(yǔ)音辨識(shí)
處理。在此,語(yǔ)音辨識(shí)處理為依據(jù)詞描述語(yǔ)的 一 特征,
多組詞匯中搜尋相關(guān)于詞描述語(yǔ)的詞匯,并且參考所搜尋的詞匯之間的連接關(guān)系及詞描述語(yǔ)的語(yǔ)法限 制,而產(chǎn)生數(shù)字?jǐn)?shù)據(jù)形式的文字序列。其中,各詞匯
為至少 一 字符所組成。接著,分析文字序列的語(yǔ)法, 并擷取出漢詞。
本發(fā)明采用詞描述語(yǔ)的特征及語(yǔ)言模型所提供的 語(yǔ)法組合機(jī)率,作為語(yǔ)音辨識(shí)處理時(shí)搜尋詞匯的限制, 以減少辨識(shí)過(guò)程所花費(fèi)的時(shí)間,及提高辨識(shí)漢詞的正 確性。
為讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能更 明顯易懂,下文特舉本發(fā)明的較佳實(shí)施例,并配合附 圖,作詳細(xì)說(shuō)明如下,其中
圖1繪示為已知語(yǔ)音識(shí)別系統(tǒng)的示意圖。 圖2繪示為本發(fā)明的 一 實(shí)施例的語(yǔ)音辨識(shí)裝置的 方塊圖。
圖3繪示為本發(fā)明的 一 實(shí)施例的語(yǔ)音辨識(shí)方法的 流程圖。
g巾
110 :語(yǔ)音辨識(shí)器
12 0 :語(yǔ)法分析器1 3 0 :漢字產(chǎn)生器
2 0 Q :語(yǔ)音辨識(shí)裝置 2 1 0 :詞匯模型
2 2 0:語(yǔ)音辨識(shí)模組
2 3 0 :語(yǔ)言模型
2 4 0:語(yǔ)法分析模組
S3 0 1 — S 3 0 5 :本發(fā)明的 一 實(shí)施例的語(yǔ)音辨
識(shí)方法的步驟
具體實(shí)施例方式
圖2繪示為本發(fā)明的 一 實(shí)施例的語(yǔ)音辨識(shí)裝置的 方塊圖。請(qǐng)參照?qǐng)D2 ,語(yǔ)音辨識(shí)裝置2 0 0包括詞匯 模型(lexicon model ) 2 1 0 、語(yǔ)音辨識(shí)模組(s p e e c h recognition module) 2 2 0 、 語(yǔ)言模型 (language model) 2 3 0以及語(yǔ)法分析模組(parsing module) 2 4 Q 。語(yǔ)音辨識(shí)裝置2 0 0用以辨識(shí)由多個(gè)漢詞所 組成的句子。首先,語(yǔ)音辨識(shí)裝置2 0 0接收 一 語(yǔ)音 信號(hào),此語(yǔ)音信號(hào)符合詞描述語(yǔ)的語(yǔ)法結(jié)構(gòu)。在本實(shí) 施例中,詞描述語(yǔ)具有 一 特征,例如為對(duì)漢詞所包含 的漢字其中之一的形、音或者意三者的任一種的描述 語(yǔ),又或者為漢詞所包含的漢字的拼音前綴、聲調(diào)、詞長(zhǎng)或者詞性。
詞匯模型210儲(chǔ)存多組詞匯,其匯集了所有能 辨識(shí)漢詞的聲學(xué)模型,而各詞匯包含至少 一 字符。當(dāng)
語(yǔ)音辨識(shí)模組2 2 0對(duì)語(yǔ)音信號(hào)進(jìn)行語(yǔ)音辨識(shí)處理 時(shí),其依據(jù)詞描述語(yǔ)的特征,從詞匯模型2 1 0中搜 尋相關(guān)于詞描述語(yǔ)的詞匯。語(yǔ)言模型2 3 0儲(chǔ)存著搜 尋的詞匯之間的連接關(guān)系及詞描述語(yǔ)的語(yǔ)法限制 (constraints ),它提供語(yǔ)法組合的機(jī)率給語(yǔ)音辨識(shí) 模組2 2 0 。本實(shí)施例的語(yǔ)言模型2 3 0是由詞描述
語(yǔ)訓(xùn)練而得,其可提供詞匯之間相連接的強(qiáng)弱關(guān)系給
語(yǔ)音辨識(shí)模組2 2 0 。由此,語(yǔ)音辨識(shí)模組2 2 0能
參考語(yǔ)言模型2 3 0所提供的語(yǔ)法組合機(jī)率,于搜尋 時(shí)找出適切的文字序列。此文字序列為模擬語(yǔ)音信號(hào) 轉(zhuǎn)換為數(shù)字文字信號(hào)的結(jié)果,其亦符合詞描述語(yǔ)的語(yǔ) 法結(jié)構(gòu)。語(yǔ)法分析模組2 4 0分析此文字序列的語(yǔ)法 結(jié)構(gòu),并擷取出漢詞。
舉例來(lái)說(shuō),當(dāng)欲通過(guò)語(yǔ)音輸入漢詞為"國(guó)立"時(shí), 語(yǔ)音辨識(shí)模組2 2 0的輸出通常會(huì)有多種可能的辨識(shí) 結(jié)果,例如國(guó)立、國(guó)歷、果粒、國(guó)力等。假設(shè)對(duì)漢
詞所包含的漢字其中之 一 的形加以描述,則詞描述語(yǔ) 的語(yǔ)法結(jié)構(gòu)可以是(漢詞1 +的+漢字+漢詞2 )。當(dāng)通
過(guò)語(yǔ)音輸入符合詞描述語(yǔ)語(yǔ)法結(jié)構(gòu)的語(yǔ)音信號(hào)時(shí),例如"站立的立國(guó)立",則語(yǔ)音辨識(shí)模組220可能
會(huì)從詞匯模型2 1 0中搜尋到相關(guān)于詞描述語(yǔ)的多組
詞匯,例如站立、的、立、利、國(guó)、國(guó)歷、國(guó)力
等
在此同時(shí),語(yǔ)言模型2 3 0提供語(yǔ)音辨識(shí)模組2
20詞描述語(yǔ)的語(yǔ)法機(jī)率,使得符合詞描述語(yǔ)的候選
詞得到較高的權(quán)重分?jǐn)?shù),因而能搜尋出更相關(guān)于詞描
述語(yǔ)的詞匯,并且產(chǎn)生適切的文字序列,亦即"站
的—、,:國(guó)立"。語(yǔ)法分析模組2 40分析語(yǔ)音辨識(shí)模組
220所產(chǎn)生的文字序列的語(yǔ)法結(jié)構(gòu),從中擷取"國(guó)
■、,:"的漢詞。
為使本領(lǐng)域具有通常知識(shí)者能輕易施行本發(fā)明,
另舉一實(shí)施例加以說(shuō)明。當(dāng)對(duì)漢詞所包含的漢字其中
之的音加以描述時(shí),詞描述語(yǔ)的語(yǔ)法結(jié)構(gòu)也可以是
漢字拼音+漢字+漢詞)。以漢詞"陽(yáng)明山為例,通
過(guò)語(yǔ)音輸入" 一 允陽(yáng)陽(yáng)明山"或者n一明陽(yáng)
明山"等符合詞描述語(yǔ)語(yǔ)法結(jié)構(gòu)的語(yǔ)音信號(hào)時(shí),語(yǔ)音
辨識(shí)模組2 2 0便依據(jù)詞描述語(yǔ)的特征,從詞匯模型210中搜尋相關(guān)于詞描述語(yǔ)的詞匯,并參考k口 口模
23 0所提供的語(yǔ)法組合機(jī)率來(lái)產(chǎn)生文字序列。如
此來(lái),采用詞描述語(yǔ)的特征及語(yǔ)曰模型所提供的語(yǔ)法組合,作為語(yǔ)音辨識(shí)時(shí)搜尋詞匯的限制,便能減少辨識(shí)過(guò)程所花費(fèi)的時(shí)間,及提高辨識(shí)漢詞的正確性。
如上所述, 詞描述語(yǔ)的特征可以是對(duì)漢詞所包含
的漢字中之一的形、音或者思二者的任一種的描述
語(yǔ),又或者為漢詞所包含的漢字的拼音前綴、 聲調(diào)、
詞長(zhǎng)或者詞性。因此,在此以分類的方式逐一說(shuō)明,
并以辨識(shí)漢詞"陽(yáng)明山"為例
第類型:詞描述語(yǔ)的特征為對(duì)漢詞所包含的漢
字中之的形的描述語(yǔ),則詞描述語(yǔ)的語(yǔ)法結(jié)構(gòu)可
以 山是 "c特定詞+漢字+漢詞)。例如:"曰月明陽(yáng)明
山第一類型:詞描述語(yǔ)的特征為對(duì)漢詞所包含的漢
字中之的音的描述語(yǔ),則詞描述語(yǔ)的語(yǔ)法結(jié)構(gòu)可
以是(漢詞1 +的+漢字+漢詞2 )或者(漢字拼音+漢 字+漢詞)。例如"高山的山陽(yáng)明山"、"尸丐山陽(yáng) 明山"。
第三類型詞描述語(yǔ)的特征為對(duì)漢詞所包含的漢 字其中之 一 的意的描述語(yǔ),則詞描述語(yǔ)的語(yǔ)法結(jié)構(gòu)可 以是(特定詞+漢字+漢詞)。例如"朝曦陽(yáng)陽(yáng)明 山",其中朝曦為陽(yáng)的含義。
第四類型詞描述語(yǔ)的特征為漢詞所包含的漢字 的拼音前綴,則詞描述語(yǔ)的語(yǔ)法結(jié)構(gòu)可以是(拼音前 綴+拼音前綴+…+漢詞)。例如"Y M S陽(yáng)明山"。第五類型詞描述語(yǔ)的特征為漢詞所包含的漢字 的聲調(diào),則詞描述語(yǔ)的語(yǔ)法結(jié)構(gòu)可以是(聲調(diào)+聲調(diào)
+ +漢詞)。例如"2 2 1陽(yáng)明山"。
第六類型詞描述語(yǔ)的特征為漢詞所包含的漢字
的詞長(zhǎng),貝u詞描述語(yǔ)的語(yǔ)法結(jié)構(gòu)可以是(量詞+漢詞)。
例如《'三字詞陽(yáng)明山"。
第七類型詞描述語(yǔ)的特征為漢詞所包含的漢字
的詞性,貝u詞描述語(yǔ)的語(yǔ)法結(jié)構(gòu)可以是(詞性+漢詞)。
例如'名詞類陽(yáng)明山"。
由上述實(shí)施例的說(shuō)明,可以歸納為下列的方法流
程圖3繪示為本發(fā)明的 一 實(shí)施例的語(yǔ)音辨識(shí)方法的
流程圖。請(qǐng)參照?qǐng)D3,首先,接收符合詞描述語(yǔ)語(yǔ)法
結(jié)構(gòu)的語(yǔ)音信號(hào)步驟S 3 0 1 ),并將此語(yǔ)音信號(hào)進(jìn)
行語(yǔ)音辨識(shí)處理c步驟S 3 0 2 )。其中,語(yǔ)音辨識(shí)處
理為依據(jù)詞描述語(yǔ)的特征,從多組詞匯中搜尋出相關(guān)
詞描述語(yǔ)的詞匯,并且依據(jù)詞匯之間的連接關(guān)系及詞
描述語(yǔ)的語(yǔ)法限制,產(chǎn)生數(shù)字?jǐn)?shù)據(jù)形式的文字序列
在此,詞描述語(yǔ)的特征可以是對(duì)漢詞所包含的漢字之
一的形、 音或者思的描述語(yǔ),或者是漢詞所包含的漢
字的拼音前綴、聲調(diào)、詞長(zhǎng)或者詞性。接著,進(jìn)一步
分析此文字序列的語(yǔ)法結(jié)構(gòu),從中擷取出漢詞(步驟s綜上所述,本發(fā)明的實(shí)
程中采用詞描述語(yǔ)的方式
降低辨識(shí)過(guò)程所花費(fèi)的時(shí)間
本發(fā)明的實(shí)施例相較于以往
詞的方式,于脫離上下文文
辨識(shí)上,具有較高的正確性
與采用逐字辨識(shí)漢詞的方式
費(fèi)的時(shí)間。
雖然本發(fā)明已以較佳實(shí)
用以限定本發(fā)明,任何所屬
者,在不脫離本發(fā)明的精神
更動(dòng)與潤(rùn)飾,因此本發(fā)明的
利要求范圍所界定的為準(zhǔn)。
施例在語(yǔ)音辨識(shí)處理的過(guò) 來(lái)限制所搜尋的詞匯,以 以及提高辨識(shí)的正確性。
建詞匯數(shù)據(jù)庫(kù)來(lái)辨識(shí)漢
思的單詞(或稱漢詞)的
另外,本發(fā)明的實(shí)施例
,更能減少辨識(shí)過(guò)程所花
施例揭露如上,然并非
技術(shù)領(lǐng)域中員有通常知識(shí)
和范圍內(nèi),當(dāng)可作些許的
保護(hù)范圍當(dāng)視本發(fā)明的權(quán)
權(quán)利要求
1.一種語(yǔ)音辨識(shí)裝置,適于辨識(shí)一漢詞,且該漢詞為多個(gè)漢字所組成,其特征在于,包括一詞匯模型,儲(chǔ)存多組詞匯,其中各該詞匯為至少一字符所組成;一語(yǔ)音辨識(shí)模組,將一語(yǔ)音信號(hào)進(jìn)行一語(yǔ)音辨識(shí)處理,而該語(yǔ)音信號(hào)符合一詞描述語(yǔ)的語(yǔ)法結(jié)構(gòu),其中該語(yǔ)音辨識(shí)處理為依據(jù)該詞描述語(yǔ)的一特征,從該詞匯模型中搜尋相關(guān)于該詞描述語(yǔ)的該各詞匯,并參考一語(yǔ)法組合機(jī)率,產(chǎn)生數(shù)字?jǐn)?shù)據(jù)形式的一文字序列;一語(yǔ)言模型,儲(chǔ)存所搜尋的該各詞匯之間的連接關(guān)系及該詞描述語(yǔ)的語(yǔ)法限制,提供該語(yǔ)法組合機(jī)率;以及一語(yǔ)法分析模組,分析該文字序列的語(yǔ)法結(jié)構(gòu),并擷取出該漢詞。
2.如權(quán)利要求1所述的語(yǔ)音辨識(shí)裝置,其中該特征為對(duì)該漢詞所包含的任 一 漢字的形、音或者意三者的任種的描述語(yǔ)。
3.如權(quán)利要求1所述的語(yǔ)音辨識(shí)裝置,其中該特征為該漢詞所包含的該各漢字的拼音前綴。
4.如權(quán)利要求1所述的語(yǔ)音辨識(shí)裝置,g巾該特征為該漢詞所包含的該各漢字的聲調(diào)。
5.如權(quán)利要求1所述的語(yǔ)音辨識(shí)裝置,其中該特征為該漢詞的詞長(zhǎng)。
6.如權(quán)利要求1所述的語(yǔ)音辨識(shí)裝置,其中該特征為該漢詞的詞性。
7. 一種語(yǔ)音辨識(shí)方法,適于辨識(shí) 一 漢詞,且該漢詞為多個(gè)漢字所組成,其特征在于,包括接收 一 語(yǔ)音信號(hào),其中該語(yǔ)音信號(hào)符合一詞描述語(yǔ)的語(yǔ)法結(jié)構(gòu);將該語(yǔ)音信號(hào)進(jìn)行 一 語(yǔ)音辨識(shí)處理以產(chǎn)生數(shù)字?jǐn)?shù)據(jù)形式的 一 文字序列,其中該語(yǔ)音辨識(shí)處理為依據(jù)該詞描述語(yǔ)的 一 特征,從多組詞匯中搜尋相關(guān)于該詞描述語(yǔ)的該各詞匯,而各該詞匯為至少 一 字符所組成,并且參考所搜尋的該各詞匯之間的連接關(guān)系及該詞描述語(yǔ)的語(yǔ)法限制,產(chǎn)生該文字序列;以及分析該文字序列的語(yǔ)法結(jié)構(gòu),并擷取出該漢詞<
8.如權(quán)利要求7所述的語(yǔ)音辨識(shí)方法,g巾該特征為對(duì)該漢詞所包含的任 一 漢字的形、音或去音 百思二者的任種的描述語(yǔ)。
9.如權(quán)利要求7所述的語(yǔ)音辨識(shí)方法,g巾該特征為該漢詞所包含的該各漢字的拼音前綴。
10 .如權(quán)利要求7所述的語(yǔ)音辨識(shí)方法,其中該 特征為該漢詞所包含的該各漢字的聲調(diào)。
11 .如權(quán)利要求7所述的語(yǔ)音辨識(shí)方法,其中該 特征為該漢詞的詞長(zhǎng)。
12 .如權(quán)利要求7所述的語(yǔ)音辨識(shí)方法,其中該 特征為該漢詞的詞性。
全文摘要
一種語(yǔ)音辨識(shí)裝置及其方法,其為適于辨識(shí)由多個(gè)漢字所組成的漢詞。此語(yǔ)音辨識(shí)裝置包括詞匯模型、語(yǔ)言模型、語(yǔ)音辨識(shí)模組及語(yǔ)法分析模組。詞匯模型儲(chǔ)存多組詞匯,其中各詞匯為至少一字符所組成。語(yǔ)音辨識(shí)模組將符合詞描述語(yǔ)語(yǔ)法結(jié)構(gòu)的一語(yǔ)音信號(hào)進(jìn)行語(yǔ)音辨識(shí)處理,而此語(yǔ)音辨識(shí)處理為依據(jù)詞描述語(yǔ)的特征,從詞匯模型中搜尋相關(guān)于詞描述語(yǔ)的詞匯,并參考語(yǔ)法組合的幾率產(chǎn)生數(shù)字?jǐn)?shù)據(jù)形式的一文字序列。語(yǔ)言模型儲(chǔ)存詞匯之間語(yǔ)法連接的可能性,提供上述的語(yǔ)法組合幾率給語(yǔ)音辨識(shí)模組。語(yǔ)法分析模組分析文字序列的語(yǔ)法結(jié)構(gòu),以擷取出漢詞。
文檔編號(hào)G10L15/18GK101494050SQ200810005139
公開(kāi)日2009年7月29日 申請(qǐng)日期2008年1月22日 優(yōu)先權(quán)日2008年1月22日
發(fā)明者沈家麟, 黃昭仁, 黃良聲 申請(qǐng)人:臺(tái)達(dá)電子工業(yè)股份有限公司