專利名稱:語音服務(wù)器及語音控制的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音識別領(lǐng)域,特別是涉及一種語音服務(wù)器及語音控 制的方法。
背景技術(shù):
現(xiàn)有的家庭網(wǎng)絡(luò)設(shè)備的遠(yuǎn)程控制多通過因特網(wǎng)連接到家庭網(wǎng)絡(luò) 釆用瀏覽頁面對各個(gè)設(shè)備進(jìn)行控制,由于家庭網(wǎng)絡(luò)設(shè)備的逐漸增多 使得控制界面越來越復(fù)雜,不易操作。較為常用的方案還有采用電 話控制家庭網(wǎng)絡(luò)內(nèi)的設(shè)備,該技術(shù)通過電話設(shè)備的語音提示來按鍵 控制設(shè)備,人們必須等待電話的語音提示信號,當(dāng)有較多的設(shè)備需 要控制時(shí),就會使操作變得復(fù)雜,同樣不易操作。
而現(xiàn)有的語音控制技術(shù)多是只針對一種設(shè)備進(jìn)行語音控制,不能
滿足逐家庭網(wǎng)絡(luò)漸增多的終端設(shè)備的要求;同時(shí)由于終端設(shè)備硬件 的限制加之語音數(shù)據(jù)庫有限,導(dǎo)致只能按照固定模式辨別出幾個(gè)簡 單設(shè)備語音命令,并且受環(huán)境和人員發(fā)音方式的影響很大,容易導(dǎo) 致語音控制失敗。
發(fā)明名稱為語音識別方法、系統(tǒng)、語音識別服務(wù)器,申請?zhí)枮?200710027509.5的專利公開了 一種語音識別方法,包括接收至少 一個(gè)終端的語音信息;對所述每個(gè)語音信息進(jìn)行分析識別,并查找 與所述語音信息匹配的語音特征;根據(jù)所述語音特征獲取相應(yīng)的指 令信息,并執(zhí)行所述指令信息。還公開了一種語音識別系統(tǒng)及語音 識別服務(wù)器。但該發(fā)明不能識別復(fù)雜的語音信息,例如對于包含嘈 雜聲音的語音信息或是發(fā)音不標(biāo)準(zhǔn)的語音信息不能有效識別,導(dǎo)致 語音控制失敗。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明提供的語音服務(wù)器及語音控制的方法,提高了 語音識別正確率。
本發(fā)明提供的語音服務(wù)器,包括 語音接收單元,用于接收聲音信息;
語音分析單元,用于識別從語音接收單元101接收到的聲音信息 中的語音信息;
語音數(shù)據(jù)庫存儲單元,用于存儲發(fā)音模型數(shù)據(jù)庫;
語音匹配單元,用于對比語音分析單元識別出的語音信息與語音 數(shù)據(jù)庫存儲單元中的發(fā)音模型,得出可識別的信息;
關(guān)鍵詞判斷單元,用于提煉語音匹配單元得出的可識別的信息中 的關(guān)鍵詞及按標(biāo)準(zhǔn)語序進(jìn)行排列形成標(biāo)準(zhǔn)命令;
命令轉(zhuǎn)化單元,用于將關(guān)鍵詞判斷單元形成的標(biāo)準(zhǔn)命令轉(zhuǎn)化為設(shè)
備命令;
命令發(fā)送單元,用于發(fā)送命令轉(zhuǎn)化單元轉(zhuǎn)化的設(shè)備命令。 其中,所述關(guān)鍵詞判斷單元包括 關(guān)鍵詞提取單元,用于從可識別的信息中提取關(guān)鍵詞; 關(guān)鍵詞語序調(diào)整單元,用于將提取的關(guān)鍵詞按標(biāo)準(zhǔn)語序進(jìn)行排列 形成標(biāo)準(zhǔn)命令。
其中,所述命令發(fā)送單元包括
地址判斷單元,用于判斷出接收的設(shè)備命令中的設(shè)備地址; 發(fā)送單元,用于根據(jù)所述設(shè)備地址發(fā)送設(shè)備命令。 本發(fā)明提供的語音控制的方法,包括
A, 接收語音終端的聲音信息;
B, 將聲音信息識別、轉(zhuǎn)化成可識別的信息;
C, 從可識別的信息中提煉關(guān)鍵詞,并按標(biāo)準(zhǔn)語序進(jìn)行排列,形 成標(biāo)準(zhǔn)命令;
D, 將標(biāo)準(zhǔn)命令轉(zhuǎn)化為設(shè)備命令;
E, 發(fā)送設(shè)備命令至相應(yīng)的終端設(shè)備。
5其中,步驟B所述的聲音信息識別步驟包括根據(jù)不同的音調(diào)
和頻率將語音信息從背景聲音進(jìn)行分離。
其中,步驟B所述轉(zhuǎn)化成可識別的信息的步驟包括將語音信
息與存儲的發(fā)音模型進(jìn)行對比轉(zhuǎn)化為可識別的信息。
可選的,步驟B所述的可識別的信息為文本信息。 可選的,步驟B所述的可識別的信息為語音信息。 可選的,所述步驟E包括發(fā)送設(shè)備命令至目的智能終端,智
能終端將設(shè)備命令發(fā)送至相應(yīng)的終端設(shè)備。
由上可以看出,本發(fā)明提供的語音服務(wù)器,可以有效識別語音信
息,提高語音識別率;
并且,本發(fā)明采用存儲多個(gè)對應(yīng)表方法,可以將可識別的信息轉(zhuǎn)
化為標(biāo)準(zhǔn)命令,有助于提高語音命令識別率;
其中,本發(fā)明采用語音分析單元,將語音信息同其他背景聲音進(jìn) 行分離的方法識別出語音信息,有助于4^高語音命令識別率; 其中,本發(fā)明采用語音數(shù)據(jù)庫,可以將語音信息轉(zhuǎn)化為可識別的
信息,有助于提高語音命令識別率;
另外,本發(fā)明采用智能終端,智能終端可以將設(shè)備命令發(fā)送至相
應(yīng)的終端設(shè)備,由此可以實(shí)現(xiàn)對多個(gè)設(shè)備的控制。
圖1為本發(fā)明語音服務(wù)器的原理圖; 圖2為本發(fā)明語音控制方法的流程圖3為本發(fā)明通過語音服務(wù)器對設(shè)備進(jìn)行控制的系統(tǒng)的原理圖; 圖4為本發(fā)明語音命令關(guān)鍵詞與標(biāo)準(zhǔn)命令關(guān)鍵詞對應(yīng)表; 圖5為本發(fā)明提煉的語音命令與標(biāo)準(zhǔn)命令對應(yīng)表。
具體實(shí)施例方式
如圖1示出了本發(fā)明提供的語音服務(wù)器的原理圖,該語音服務(wù) 包括語音接收單元101,語音分析單元102,語音數(shù)據(jù)庫存儲單元103,語音匹配單元104,關(guān)鍵詞判斷單元105,命令轉(zhuǎn)化單元106,
命令發(fā)送單元107。其中,
語音接收單元101,用于接收語音終端傳送過來的聲音信息。 語音分析單元102,用于識別從語音接收單元101接收到的聲音
信息中的語音信息,將語音信息從背景聲音中分離出并將語音信息
進(jìn)行編碼。
語音數(shù)據(jù)庫存儲單元103,用于存儲發(fā)音模型數(shù)據(jù)庫。發(fā)音模型 由大量的發(fā)音取樣產(chǎn)生,采用現(xiàn)有技術(shù)制作成語音數(shù)據(jù)庫,比如"開" 的普通話語音對應(yīng)存儲四川話、湖南話、陜西話等不同語音發(fā)音。 同時(shí)設(shè)有更新功能,可通過USB接口進(jìn)行更新,根據(jù)需要擴(kuò)充數(shù)據(jù) 庫,例如增加英文數(shù)據(jù)庫。
語音匹配單元104,用于對比從語音分析單元102接收到的語音 信息與語音數(shù)據(jù)庫存儲單元103中的發(fā)音模型,搜尋數(shù)據(jù)庫中所有 的發(fā)音模型,找到與語音信息相匹配的發(fā)音模型,進(jìn)而根據(jù)對應(yīng)信 息得出所對應(yīng)的可識別的信息,該可識別的信息可以是語音形式, 也可以是文本形式。對于經(jīng)常調(diào)用的語音模型設(shè)置較高的搜索優(yōu)先 級別。
關(guān)鍵詞判斷單元105,用于將可識別的信息根據(jù)存儲在該單元上 的語音命令關(guān)鍵詞與標(biāo)準(zhǔn)命令關(guān)鍵詞的對應(yīng)表提煉出關(guān)鍵詞,然后 根據(jù)該單元存儲的提煉的語音命令與標(biāo)準(zhǔn)命令對應(yīng)表對提煉后的可 識別的信息進(jìn)行排列,形成標(biāo)準(zhǔn)命令。
命令轉(zhuǎn)化單元106,用于將從關(guān)鍵詞判斷單元105處接收到的標(biāo) 準(zhǔn)命令轉(zhuǎn)化為協(xié)議規(guī)定的設(shè)備命令。
命令發(fā)送單元107,用于將從命令轉(zhuǎn)化單元106處接收的設(shè)備命 令發(fā)送給指令接收終端。
下面參見圖2示出的語音控制方法的流程圖,對該語音服務(wù)器的 工作原理進(jìn)行說明,如圖2所示,該語音控制方法包括以下步驟
步驟201,語音服務(wù)器的語音接收單元IOI接收來自遠(yuǎn)程各個(gè)語 音終端傳輸過來的聲音信息;步驟202,語音分析單元102通過分析各種聲音獨(dú)特的音調(diào)和頻 率從所述聲音信息中識別出語音信息,以將語音信息與其他背景語 音進(jìn)行分離;
步驟203,語音匹配單元104查找出語音信息的語音特征,調(diào)用 語音數(shù)據(jù)庫存儲單元103內(nèi)存儲的發(fā)音模型數(shù)據(jù)庫,將所識別出的 語音信息與語音數(shù)據(jù)庫存儲單元103中的發(fā)音模型進(jìn)行對比,根據(jù) 對應(yīng)存儲的普通話發(fā)音模型數(shù)據(jù),得出可識別的信息,該可識別的 4呂,l 可以使語音形式也可以是文本形式;
步驟204,關(guān)鍵詞判斷單元105根據(jù)存儲在該單元上的語音命令 關(guān)鍵詞與標(biāo)準(zhǔn)命令關(guān)鍵詞的對應(yīng)表將從語音匹配單元104處接收到 的可識別的信息中提煉出關(guān)鍵詞,如設(shè)備的位置、設(shè)備名稱或區(qū)別 其他設(shè)備的唯一名稱、執(zhí)行的動作等,然后根據(jù)該單元存儲的提煉 的語音命令與標(biāo)準(zhǔn)命令對應(yīng)表對提煉后的可識別的信息進(jìn)行排列, 形成標(biāo)準(zhǔn)命令;
步驟205,命令轉(zhuǎn)化單元106將從關(guān)^:詞判斷單元105接收到的 標(biāo)準(zhǔn)命令按照特定的形式轉(zhuǎn)化為協(xié)議規(guī)定的設(shè)備命令;
步驟206,命令發(fā)送單元107調(diào)用該單元存儲的語音終端號碼與 發(fā)送目的地址對應(yīng)表,根據(jù)語音終端的號碼找到對應(yīng)表中智能終端 或終端設(shè)備的地址,將從命令轉(zhuǎn)化單元106接收的設(shè)備命令發(fā)送至 目的智能終端或終端設(shè)備。
圖3示出了一種應(yīng)用本發(fā)明語音服務(wù)器對設(shè)備進(jìn)行語音控制的 通訊系統(tǒng)原理圖,包括語音終端,語音服務(wù)器,智能終端和終端 設(shè)備。該通訊系統(tǒng)可以采用有線或無線的方式進(jìn)行通信。其中語音 終端可以是有線或無線的電話終端;智能終端用來轉(zhuǎn)發(fā)設(shè)備命令, 可以是交換機(jī)或服務(wù)器;終端設(shè)備即為被控設(shè)備。需要說明的是, 這里設(shè)置智能終端是用來轉(zhuǎn)發(fā)指令,也可以不設(shè)置該終端,而直接 將指令發(fā)送到終端設(shè)備。
其中,智能終端到終端設(shè)備之間也可以采用無線的通信方式,如 藍(lán)牙(bluetooth)、無線局域網(wǎng)絡(luò)(wireless LAN) 、 WiFi等通信方式。
應(yīng)用該語音服務(wù)器對設(shè)備進(jìn)行語音控制的工作原理是用戶通過 語音終端,可以是手機(jī)或者電話,發(fā)出語音命令,接收終端將接收 的語音傳送至語音服務(wù)器,語音服務(wù)器將語音轉(zhuǎn)化為標(biāo)準(zhǔn)命令并將 標(biāo)準(zhǔn)命令傳送至智能終端或終端設(shè)備,如果傳送給智能終端則再由 智能終端以有線或無線的方式發(fā)送至終端設(shè)備,終端設(shè)備的命令接 口單元負(fù)責(zé)接收屬于自己的命令,然后根據(jù)該命令進(jìn)行相應(yīng)的動作。
另外,當(dāng)終端設(shè)備執(zhí)行指令后發(fā)一回執(zhí)信號給語音服務(wù)器,經(jīng)由 語音服務(wù)器轉(zhuǎn)化為聲音信號,發(fā)送給語音終端,用戶就可得知語音
命令是否得到有效執(zhí)行。
下面以手機(jī)用戶對家中電器發(fā)出語音命令為例對本發(fā)明進(jìn)一步
詳細(xì)說明。
用戶在嘈雜的馬路上通過手機(jī)用成都方言發(fā)出"打開客廳里的空 調(diào)"的語音命令,
首先,語音服務(wù)器的語音接收單元101接收該聲音信息;
其次,語音分析單元102通過分析人的聲音,汽車的聲音等各種 聲音的音調(diào)和頻率將語音命令與其他背景語音進(jìn)行分離,減低噪音 并提煉出語音命令"打開客廳里的空調(diào)";
再次,語音匹配單元104查找語音命令的語音特征,調(diào)用語音數(shù) 據(jù)庫存儲單元103內(nèi)存儲的發(fā)音模型數(shù)據(jù)庫,將從語音分析單元102 接收到的以成都方言發(fā)出的語音命令與語音數(shù)據(jù)庫存儲單元103中 的成都發(fā)音模型進(jìn)行對比,根據(jù)對應(yīng)存儲的普通話發(fā)音模型數(shù)據(jù), 得出可識別的信息"打開客廳里的空調(diào)",該得到的可識別的信息 可以文本或是語音形式的"打開客廳里的空調(diào)";
接著,關(guān)^t詞判斷單元105根據(jù)存儲在該單元上的相關(guān)語音命令 關(guān)鍵詞與標(biāo)準(zhǔn)命令關(guān)鍵詞對應(yīng)表,如圖4所示,將從語音匹配單元
104接收到的可識別的信息"打開客廳里的空調(diào)"中提煉出關(guān)鍵詞 "開"、"客廳"和"空調(diào)";然后根據(jù)該單元存儲的提煉的語音 命令與標(biāo)準(zhǔn)命令對應(yīng)表,如圖5所示,對提煉后的可識別的信息進(jìn)行排列,形成標(biāo)準(zhǔn)命令"客廳空調(diào)開";
然后,命令轉(zhuǎn)化單元106將從關(guān)鍵詞判斷單元105接收到的標(biāo)準(zhǔn) 命令按照特定的形式轉(zhuǎn)化為協(xié)議規(guī)定的設(shè)備命令;
最后,命令發(fā)送單元107調(diào)用該單元存儲的語音終端號碼與發(fā)送 目的地址對應(yīng)表,根據(jù)語音終端的號碼找到對應(yīng)表中智能終端的地 址,將從命令轉(zhuǎn)化單元106接收的設(shè)備命令發(fā)送至目的智能終端。
智能終端的命令接口單元用于接收命令,再以無線的方式發(fā)送至 終端設(shè)備客廳里的空調(diào),該空調(diào)接到命令后進(jìn)行打開操作。
客廳空調(diào)打開后發(fā)一回執(zhí)信號給語音服務(wù)器,經(jīng)由語音服務(wù)器轉(zhuǎn) 化為聲音信號,發(fā)送給手機(jī),用戶就可得知語音命令得到了有效執(zhí) 行。
對于存儲有英文語音數(shù)據(jù)庫的語音服務(wù)器,用戶可通過手機(jī)用英 i吾發(fā)出 "open the air condition in living room ,, 的i吾音命令,i吾音月l 務(wù)器的語音接收單元101接收該聲音信息;接著,語音分析單元102 通過分析人的聲音,以及各種背景聲音的音調(diào)和頻率將語音命令與 其他背景語音進(jìn)行分離,減低噪音并提煉出語音命令"open the air condition in living room" ; 4妾著,i吾音匹配單元104查4戈i吾音命令的 語音特征,調(diào)用語音數(shù)據(jù)庫存儲單元103內(nèi)存儲的發(fā)音模型數(shù)據(jù)庫, 將從語音分析單元102接收到的以英語發(fā)出的語音命令與語音數(shù)據(jù) 庫存儲單元103中的英語發(fā)音模型進(jìn)行對比,根據(jù)對應(yīng)存儲的普通 話發(fā)音模型數(shù)據(jù),得出可識別的信息"打開 客廳里的空調(diào)";以后 步驟與第一實(shí)施例相同,因此不再贅述。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明, 凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn) 等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種語音服務(wù)器,包括語音接收單元(101),用于接收聲音信息;語音分析單元(102),用于識別從語音接收單元(101)接收到的聲音信息中的語音信息;語音數(shù)據(jù)庫存儲單元(103),用于存儲發(fā)音模型數(shù)據(jù)庫;語音匹配單元(104),用于對比語音分析單元(102)識別出的語音信息與語音數(shù)據(jù)庫存儲單元(103)中的發(fā)音模型,得出可識別的信息;關(guān)鍵詞判斷單元(105),用于提煉語音匹配單元(104)得出的可識別的信息中的關(guān)鍵詞及按標(biāo)準(zhǔn)語序進(jìn)行排列形成標(biāo)準(zhǔn)命令;命令轉(zhuǎn)化單元(106),用于將關(guān)鍵詞判斷單元(105)形成的標(biāo)準(zhǔn)命令轉(zhuǎn)化為設(shè)備命令;命令發(fā)送單元(107),用于發(fā)送命令轉(zhuǎn)化單元(106)轉(zhuǎn)化的設(shè)備命令。
2. 根據(jù)權(quán)利要求1所述的語音服務(wù)器,其特征在于所述關(guān)鍵 詞判斷單元(105)包括關(guān)鍵詞提取單元,用于從可識別的信息中提取關(guān)鍵詞; 關(guān)鍵詞語序調(diào)整單元,用于將提取的關(guān)鍵詞按標(biāo)準(zhǔn)語序進(jìn)行排列 形成標(biāo)準(zhǔn)命令。
3. 根據(jù)權(quán)利要求1或2所述的語音服務(wù)器,其特征在于所述 命令發(fā)送單元(107)包括地址判斷單元,用于判斷出接收的設(shè)備命令中的設(shè)備地址; 發(fā)送單元,用于根據(jù)所述設(shè)備地址發(fā)送設(shè)備命令。
4. 一種語音控制的方法,包括 A,接收語音終端的聲音信息;B, 將聲音信息識別、轉(zhuǎn)化成可識別的信息;C, 從可識別的信息中提煉關(guān)鍵詞,并按標(biāo)準(zhǔn)語序進(jìn)行排列,形 成標(biāo)準(zhǔn)命令;D,將標(biāo)準(zhǔn)命令轉(zhuǎn)化為設(shè)備命令;E,發(fā)送設(shè)備命令至相應(yīng)的終端設(shè)備。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于步驟B所述的聲 音信息識別步驟包括根據(jù)不同的音調(diào)和頻率將語音信息從背景聲 音進(jìn)行分離。
6. 根據(jù)權(quán)利要求4或5所述的方法,其特征在于步驟B所述 轉(zhuǎn)化成可識別的信息的步驟包括將語音信息與存儲的發(fā)音模型進(jìn) 行對比轉(zhuǎn)化為可識別的信息。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于步驟B所述的可 識別的信息為文本信息。
8. 根據(jù)權(quán)利要求6所述的方法,其特征在于步驟B所述的可 識別的信息為語音信息。
9. 根據(jù)權(quán)利要求4所述的方法,其特征在于所述步驟E包括 發(fā)送設(shè)備命令至目的智能終端,智能終端將設(shè)備命令發(fā)送至相應(yīng)的 終端設(shè)備。
全文摘要
本發(fā)明提供了一種語音服務(wù)器,包括語音接收單元、語音分析單元、語音數(shù)據(jù)庫存儲單元、語音匹配單元、關(guān)鍵詞判斷單元、命令轉(zhuǎn)化單元和命令發(fā)送單元。還提供了一種語音控制的方法,包括A,接收語音終端的聲音信息;B,將聲音信息識別、轉(zhuǎn)化成可識別的信息;C,從可識別的信息中提煉關(guān)鍵詞,并按標(biāo)準(zhǔn)語序進(jìn)行排列,形成標(biāo)準(zhǔn)命令;D,將標(biāo)準(zhǔn)命令轉(zhuǎn)化為設(shè)備命令;E,發(fā)送設(shè)備命令至相應(yīng)的終端設(shè)備。使用本發(fā)明,可以提高語音控制過程中的語音識別正確率。
文檔編號G06F17/30GK101599270SQ20081011053
公開日2009年12月9日 申請日期2008年6月2日 優(yōu)先權(quán)日2008年6月2日
發(fā)明者張雁玻 申請人:海爾集團(tuán)公司;青島海爾智能家電科技有限公司