国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種通過語音控制智能設(shè)備的方法及裝置的制造方法

      文檔序號(hào):10516302閱讀:197來源:國知局
      一種通過語音控制智能設(shè)備的方法及裝置的制造方法
      【專利摘要】本發(fā)明公開了一種通過語音控制智能設(shè)備的方法及裝置,屬于語音控制技術(shù)領(lǐng)域。所述方法包括:獲取用戶發(fā)出的控制語音;將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì);根據(jù)比對(duì)結(jié)果確定與所述控制語音對(duì)應(yīng)的控制指令,執(zhí)行所述控制指令對(duì)應(yīng)的操作,其中,所述語言系屬分類庫包括與智能設(shè)備控制指令關(guān)聯(lián)的普通話語音模板和方言語音模板。本發(fā)明實(shí)施例解決現(xiàn)有技術(shù)中智能設(shè)備的語音控制功能對(duì)方言的識(shí)別率不高,可能出現(xiàn)用戶喊出幾次控制指令,智能設(shè)備卻無法識(shí)別的問題,提供一種準(zhǔn)確迅速識(shí)別用戶語音控制指令的方式,達(dá)到了提升用戶的應(yīng)用體驗(yàn)的效果。
      【專利說明】
      一種通過語音控制智能設(shè)備的方法及裝置
      技術(shù)領(lǐng)域
      [0001]本發(fā)明實(shí)施例涉及語音控制技術(shù)領(lǐng)域,尤其涉及一種通過語音控制智能設(shè)備的方法及裝置。
      【背景技術(shù)】
      [0002]現(xiàn)有技術(shù)中,對(duì)智能電視的遙控方法主要包括兩種,一種為通過按鍵式遙控器與智能電視的紅外通信,控制智能電視;以及,另一種為通過語音控制智能電視。通過遙控器操作電視,如果遙控器出現(xiàn)故障,用戶無法使用電視機(jī),因此,通過語音控制電視機(jī)已經(jīng)逐漸取代遙控器控制。
      [0003]語音控制功能給用戶帶來諸多便利,簡化用戶的操作步驟,完美的實(shí)現(xiàn)人機(jī)交互。但是,目前智能電視的語音功能尚只支持普通話。然而,目前普通話的普及并不十分廣泛,各個(gè)地方的用戶普通話不是特別標(biāo)準(zhǔn)。家庭用戶也還是以地方方言交流為主,這樣就使得智能電視的語音識(shí)別率比較低,可能出現(xiàn)用戶喊出幾次語音命令,智能電視卻無法識(shí)別的情況,用戶得不到很好的交互體驗(yàn)。

      【發(fā)明內(nèi)容】

      [0004]本發(fā)明實(shí)施例提供一種通過語音控制智能設(shè)備的方法及裝置,以提供一種智能設(shè)備的新的語音控制方式,提高了語音識(shí)別準(zhǔn)確率,提升了用戶的交互體驗(yàn)。
      [0005]第一方面,本發(fā)明實(shí)施例提供了一種通過語音控制智能設(shè)備的方法,包括:
      [0006]獲取用戶發(fā)出的控制語音;
      [0007]將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì);
      [0008]根據(jù)比對(duì)結(jié)果確定與所述控制語音對(duì)應(yīng)的控制指令,執(zhí)行所述控制指令對(duì)應(yīng)的操作,其中,所述語言系屬分類庫包括與智能設(shè)備控制指令關(guān)聯(lián)的普通話語音模板和方言語音模板。
      [0009]優(yōu)選的,在獲取用戶發(fā)出的控制語音之前,還包括:
      [0010]通過智能設(shè)備的顯示屏顯示設(shè)定語句,以提示用戶讀所述設(shè)定語句;
      [0011]將對(duì)應(yīng)于設(shè)定語句的用戶語音與設(shè)定測試語音庫進(jìn)行匹配,以確定用戶的語言系屬分類;
      [0012]將所述語言系屬分類庫中對(duì)應(yīng)于所確定的語言系屬分類的語音模板的比對(duì)優(yōu)先級(jí)設(shè)為最尚;
      [0013]以及,將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì),包括:
      [0014]確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼;
      [0015]將音頻特征碼與所述語言系屬分類庫中比對(duì)優(yōu)先級(jí)最高的語音模板進(jìn)行比對(duì),獲得比對(duì)結(jié)果。
      [0016]優(yōu)選的,將所述用戶語音與對(duì)應(yīng)于所述設(shè)定語句的預(yù)設(shè)測試語音庫進(jìn)行匹配,以確定用戶的語言系屬分類,包括:
      [0017]確定所述用戶語音對(duì)應(yīng)的音頻特征碼;
      [0018]將所述音頻特征碼與所述測試語音庫中的音頻特征碼模板進(jìn)行匹配;
      [0019]根據(jù)匹配結(jié)果確定用戶對(duì)應(yīng)的語言系屬分類,其中,所述語言系屬分類包括普通話和方言。
      [0020]優(yōu)選的,將所述音頻特征碼與所述測試語音庫中的音頻特征碼模板進(jìn)行匹配,包括:
      [0021 ] 根據(jù)網(wǎng)際協(xié)議地址確定智能設(shè)備所處地區(qū);
      [0022]根據(jù)所確定的地區(qū)獲取所述測試語音庫中與所述地區(qū)對(duì)應(yīng)的音頻特征碼模塊;
      [0023]將所述音頻特征碼與所述音頻特征碼模板進(jìn)行匹配,確定匹配度;
      [0024]在匹配度未達(dá)到設(shè)定閾值時(shí),按照設(shè)定順序依次比對(duì)所述音頻特征碼與所述測試語音庫中剩余音頻特征碼模板。
      [0025]優(yōu)選的,將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì),包括:
      [0026]確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼;
      [0027]按照預(yù)設(shè)的比對(duì)優(yōu)先級(jí),依次將所述音頻特征碼與所述語言系屬分類庫包括的語音模板進(jìn)行匹配,以識(shí)別所述控制語音。
      [0028]第二方面,本發(fā)明實(shí)施例還提供了一種通過語音控制智能設(shè)備的裝置,該裝置包括:
      [0029]語音獲取模塊,用于獲取用戶發(fā)出的控制語音;
      [0030]語音識(shí)別模塊,用于將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì);
      [0031]指令確定模塊,用于根據(jù)比對(duì)結(jié)果確定與所述控制語音對(duì)應(yīng)的控制指令,執(zhí)行所述控制指令對(duì)應(yīng)的操作,其中,所述語言系屬分類庫包括與智能設(shè)備控制指令關(guān)聯(lián)的普通話語音模板和方言語音模板。
      [0032]優(yōu)選的,所述裝置還包括:
      [0033]設(shè)定語句顯示模塊,用于在獲取用戶發(fā)出的控制語音之前,通過智能設(shè)備的顯示屏顯示設(shè)定語句,以提示用戶讀所述設(shè)定語句;
      [0034]語系確定模塊,用于將對(duì)應(yīng)于設(shè)定語句的用戶語音與設(shè)定測試語音庫進(jìn)行匹配,以確定用戶的語言系屬分類;
      [0035]優(yōu)先級(jí)設(shè)置模塊,用于將所述語言系屬分類庫中對(duì)應(yīng)于所確定的語言系屬分類的語音模板的比對(duì)優(yōu)先級(jí)設(shè)為最高;
      [0036]以及,所述指令確定模塊具體用于:
      [0037]確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼;
      [0038]將音頻特征碼與所述語言系屬分類庫中比對(duì)優(yōu)先級(jí)最高的語音模板進(jìn)行比對(duì),以識(shí)別所述控制語音。
      [0039]優(yōu)選的,所述語系確定模塊包括:
      [0040]特征碼提取子模塊,用于確定所述用戶語音對(duì)應(yīng)的音頻特征碼;
      [0041]語音匹配子模塊,用于將所述音頻特征碼與所述測試語音庫中的音頻特征碼模板進(jìn)行匹配;
      [0042]語言系屬確定子模塊,根據(jù)匹配結(jié)果確定用戶對(duì)應(yīng)的語言系屬分類,其中,所述語言系屬分類包括普通話和方言。
      [0043]優(yōu)選的,所述語言系屬確定子模塊具體用于:
      [0044]根據(jù)網(wǎng)際協(xié)議地址確定智能設(shè)備所處地區(qū);
      [0045]根據(jù)所確定的地區(qū)獲取所述測試語音庫中與所述地區(qū)對(duì)應(yīng)的音頻特征碼模塊;
      [0046]將所述音頻特征碼與所述音頻特征碼模板進(jìn)行匹配,確定匹配度;
      [0047]在匹配度未達(dá)到設(shè)定閾值時(shí),將所述音頻特征碼與所述測試語音庫中剩余音頻特征碼模板進(jìn)行匹配。
      [0048]優(yōu)選的,所述指令確定模塊具體用于:
      [0049]確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼;
      [0050]按照預(yù)設(shè)的比對(duì)優(yōu)先級(jí)順序,將所述音頻特征碼與所述語言系屬分類庫包括的語音模板進(jìn)行匹配,以識(shí)別所述控制語音。
      [0051]本發(fā)明實(shí)施例通過獲取用戶發(fā)出的控制語音;將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì);根據(jù)比對(duì)結(jié)果確定與所述控制語音對(duì)應(yīng)的控制指令,執(zhí)行所述控制指令對(duì)應(yīng)的操作,解決現(xiàn)有技術(shù)中智能設(shè)備的語音控制功能對(duì)方言的識(shí)別率不高,可能出現(xiàn)用戶喊出幾次控制指令,智能設(shè)備卻無法識(shí)別的問題,提供一種準(zhǔn)確迅速識(shí)別用戶語音控制指令的方式,達(dá)到了提升用戶的應(yīng)用體驗(yàn)的效果。
      【附圖說明】
      [0052]圖1是本發(fā)明實(shí)施例一中的一種通過語音控制智能設(shè)備的方法的流程圖;
      [0053]圖2是本發(fā)明實(shí)施例二中的一種通過語音控制智能設(shè)備的方法中控制語音識(shí)別步驟的流程圖;
      [0054]圖3是本發(fā)明實(shí)施例三中的一種通過語音控制智能設(shè)備的裝置的結(jié)構(gòu)示意圖。
      【具體實(shí)施方式】
      [0055]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖牵颂幩枋龅木唧w實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
      [0056]實(shí)施例一
      [0057]圖1為本發(fā)明實(shí)施例一提供的一種通過語音控制智能設(shè)備的方法的流程圖,本實(shí)施例可適用于不使用普通話或普通話不標(biāo)準(zhǔn)的用戶使用智能設(shè)備的語音控制功能的情況,該方法可以由通過語音控制智能設(shè)備的裝置來執(zhí)行,該裝置被配置于具有數(shù)據(jù)處理功能的智能設(shè)備中。所述通過語音控制智能設(shè)備的方法具體包括如下步驟:
      [0058]步驟110、獲取用戶發(fā)出的控制語音。
      [0059]其中,所述控制語音為用戶想要下達(dá)到智能設(shè)備的語音指令,可以是普通話、可以是方言或其它任何語言。智能設(shè)備通過麥克風(fēng)獲取到用戶對(duì)智能設(shè)備發(fā)出的語音指令。對(duì)所述語音指令執(zhí)行濾波、降噪等預(yù)處理,將預(yù)處理后的語音指令轉(zhuǎn)換為數(shù)字信號(hào)輸入至智能設(shè)備的主控制器。其中,麥克風(fēng)可設(shè)置在智能設(shè)備內(nèi)(諸如智能電視機(jī)機(jī)體內(nèi)),也可是單獨(dú)的位于智能設(shè)備之外(諸如智能電視機(jī)機(jī)體外),麥克風(fēng)與智能設(shè)備為通信連接。若所述智能設(shè)備為智能電視,當(dāng)用戶說出想要看的電視頻道時(shí),通過麥克風(fēng)采集用戶的語音數(shù)據(jù),采集過程中通過濾波、降噪等預(yù)處理,實(shí)現(xiàn)將其它不需要的聲音數(shù)據(jù)當(dāng)作噪音進(jìn)行過濾而保留用戶的聲音數(shù)據(jù)的目的。
      [0060]步驟120、將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì)。
      [0061]其中,語言系屬分類庫為與普通話、方言或其它語言相關(guān)的音素的集合,并且,根據(jù)語言系屬不同,所述語言系屬分類庫包括若干個(gè)子庫。例如,所述語言系屬分類庫包括普通話子庫、上海話子庫、東北話子庫、重慶話子庫以及粵語子庫等。其中,音素是構(gòu)成音節(jié)的最小單位或最小的語音片段,是從音質(zhì)的角度劃分出來的最小的線性的語音單位。例如,漢語中的聲母和韻母,以及英語中的元音和輔音等。每一種語言中的音素都是不一樣的,即使是同種語言中,方言的音素也是不一樣的。
      [0062]在各個(gè)子庫中存儲(chǔ)有與智能設(shè)備控制指令關(guān)聯(lián)的音素的集合,所述音素的集合以詞組的形式構(gòu)成語音模板。其中,控制指令包括打開電視、關(guān)閉電視、打開空調(diào)、看北京衛(wèi)視及播放新聞聯(lián)播等智能設(shè)備的操作指令。并且由設(shè)定數(shù)目的連續(xù)發(fā)音的音素組成一個(gè)詞組。例如,在上海話子庫中存儲(chǔ)有與智能設(shè)備控制指令關(guān)聯(lián)的上海話語音模板。東北話子庫中存儲(chǔ)有與智能設(shè)備控制指令關(guān)聯(lián)的東北話語音模板。
      [0063]智能設(shè)備確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼。其中,音頻特征碼包括當(dāng)前用戶發(fā)出的控制語音對(duì)應(yīng)的音素。例如,智能設(shè)備的主控制器對(duì)所述控制語音進(jìn)行分幀,每一幀占有設(shè)定的時(shí)長(比如25ms)。再假設(shè)這樣的一幀既足夠長(可以蘊(yùn)含足以判斷它的音素屬性),又很平穩(wěn)(方便進(jìn)行短時(shí)傅里葉分析),這樣將每一幀轉(zhuǎn)換為一個(gè)特征向量,依次識(shí)別控制語音對(duì)應(yīng)的音素。
      [0064]按照預(yù)設(shè)的比對(duì)優(yōu)先級(jí),依次將所述音頻特征碼與所述語言系屬分類庫包括的語音模板進(jìn)行匹配,以識(shí)別所述控制語音。通過智能設(shè)備可以預(yù)先為語言系屬分類庫中的各個(gè)子庫指定優(yōu)先級(jí)。例如,可以在智能設(shè)備出廠前為語言系屬分類庫包括的各個(gè)子庫按照設(shè)定的規(guī)則指定優(yōu)先級(jí)。一種可能的順序是普通話子庫的優(yōu)先級(jí)最高,其余子庫根據(jù)各地區(qū)首字的首字母排列順序確定與地區(qū)對(duì)應(yīng)的子庫的優(yōu)先級(jí)。還可以由用戶為語言系屬分類庫包括的各個(gè)子庫指定優(yōu)先級(jí)。一種指定的情形可能是提示用戶根據(jù)家人所用的語言設(shè)置子庫的優(yōu)先級(jí)。還可以是智能設(shè)備記錄控制語音所屬的子庫,根據(jù)使用頻率自動(dòng)更新優(yōu)先級(jí)排名。智能設(shè)備在對(duì)控制語音執(zhí)行分幀處理,并識(shí)別出控制語音對(duì)應(yīng)的音素后,根據(jù)各個(gè)子庫的優(yōu)先級(jí)排名,將控制語音與各個(gè)子庫對(duì)應(yīng)的語音模板進(jìn)行比對(duì),執(zhí)行搜索解碼過程。解碼的原理通常是在給定了根據(jù)語法、字典對(duì)馬爾科夫模型進(jìn)行連接后的搜索的網(wǎng)絡(luò)(網(wǎng)絡(luò)的每個(gè)節(jié)點(diǎn)可以是一個(gè)詞組等)后,在所有可能的搜索路徑中選擇一條或多條最優(yōu)(通常是最大后驗(yàn)概率)路徑(字典中出現(xiàn)詞組的詞組串)作為識(shí)別結(jié)果。
      [0065]步驟130、根據(jù)比對(duì)結(jié)果確定與所述控制語音對(duì)應(yīng)的控制指令,執(zhí)行所述控制指令對(duì)應(yīng)的操作。
      [0066]由于所述語言系屬分類庫包括的語音模板與智能設(shè)備控制指令關(guān)聯(lián),即所述語音模塊與打開電視、關(guān)閉電視、打開空調(diào)、看北京衛(wèi)視以及播放新聞聯(lián)播等智能設(shè)備的控制指令存在設(shè)定對(duì)應(yīng)關(guān)系。若確定了控制語音與語音模塊的對(duì)應(yīng)關(guān)系,也就確定了控制語音與控制指令的對(duì)應(yīng)關(guān)系。智能設(shè)備根據(jù)所確定的控制指令執(zhí)行相應(yīng)的操作。
      [0067]本實(shí)施例的技術(shù)方案,通過獲取用戶發(fā)出的控制語音;將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì);根據(jù)比對(duì)結(jié)果確定與所述控制語音對(duì)應(yīng)的控制指令,執(zhí)行所述控制指令對(duì)應(yīng)的操作,解決現(xiàn)有技術(shù)中智能設(shè)備的語音控制功能對(duì)方言的識(shí)別率不高,可能出現(xiàn)用戶喊出幾次控制指令,智能設(shè)備卻無法識(shí)別的問題,提供一種準(zhǔn)確迅速識(shí)別用戶語音控制指令的方式,達(dá)到了提升用戶的應(yīng)用體驗(yàn)的效果。
      [0068]實(shí)施例二
      [0069]圖2是本發(fā)明實(shí)施例二中的一種通過語音控制智能設(shè)備的方法中控制語音識(shí)別步驟的流程圖。本實(shí)施例的技術(shù)方案進(jìn)一步對(duì)將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì)進(jìn)行說明,具體包括如下步驟:
      [0070]步驟210、通過智能設(shè)備的顯示屏顯示設(shè)定語句,以提示用戶讀所述設(shè)定語句。
      [0071]智能設(shè)備在檢測到語音輸入時(shí),在顯示屏上顯示設(shè)定語句,提示用戶讀所述設(shè)定語句。例如,在檢測到用戶向智能電視發(fā)出語音指令時(shí),在智能電視上顯示能夠區(qū)分各個(gè)地區(qū)的語言的一個(gè)短句。
      [0072]步驟220、將對(duì)應(yīng)于設(shè)定語句的用戶語音與設(shè)定測試語音庫進(jìn)行匹配,以確定用戶的語言系屬分類。
      [0073]智能設(shè)備確定所述用戶語音對(duì)應(yīng)的音頻特征碼,音頻特征碼的確定過程與實(shí)施例一的記載的方式相同,此處不再贅述。
      [0074]智能終端將所述音頻特征碼與所述測試語音庫中的音頻特征碼模板進(jìn)行匹配。其中,測試語音庫中包括對(duì)應(yīng)于所述設(shè)定語句的音頻特征碼模板。例如,所述測試語音庫包括普通話測試子庫、上海話測試子庫、東北話測試子庫、重慶話測試子庫以及粵語測試子庫等。在各個(gè)測試子庫中存儲(chǔ)有與所述設(shè)定語句對(duì)應(yīng)的音素的集合,所述音素的集合以詞組(設(shè)定數(shù)目的連續(xù)發(fā)音的音素組成一個(gè)詞組)的形式構(gòu)成音頻特征碼模板。例如,在重慶話測試子庫中存儲(chǔ)有與所述設(shè)定語句對(duì)應(yīng)的重慶話語音模板。在閩南語測試子庫中存儲(chǔ)有與所述設(shè)定語句對(duì)應(yīng)的閩南語語音模板。
      [0075]智能設(shè)備確定對(duì)應(yīng)于設(shè)定語句的用戶語音對(duì)應(yīng)的音頻特征碼。其中,音頻特征碼包括當(dāng)前用戶發(fā)出的用戶語音對(duì)應(yīng)的音素。例如,智能設(shè)備的主控制器對(duì)所述用戶語音進(jìn)行分幀,每一幀占有設(shè)定的時(shí)長(比如25ms)。再假設(shè)這樣的一幀既足夠長(可以蘊(yùn)含足以判斷它的音素屬性),又很平穩(wěn)(方便進(jìn)行短時(shí)傅里葉分析),這樣將每一幀轉(zhuǎn)換為一個(gè)特征向量,依次識(shí)別用戶語音對(duì)應(yīng)的音素。
      [0076]智能設(shè)備根據(jù)網(wǎng)際協(xié)議地址確定智能設(shè)備所處地區(qū),根據(jù)所確定的地區(qū)獲取所述測試語音庫中與所述地區(qū)對(duì)應(yīng)的音頻特征碼模塊。智能設(shè)備將所述音頻特征碼與所述音頻特征碼模板進(jìn)行匹配,確定匹配度;在匹配度超過設(shè)定的閾值時(shí),確定當(dāng)前測試子庫對(duì)應(yīng)的語言系屬分類為用戶使用的語言。在匹配度未達(dá)到設(shè)定閾值時(shí),按照設(shè)定順序依次比對(duì)所述音頻特征碼與所述測試語音庫中剩余音頻特征碼模板。根據(jù)匹配結(jié)果確定用戶對(duì)應(yīng)的語言系屬分類,其中,所述語言系屬分類包括普通話和方言。例如,智能設(shè)備的主控制器根據(jù)當(dāng)前的網(wǎng)際協(xié)議IP地址確定當(dāng)前智能設(shè)備處于天津,在測試語音庫中選擇天津話測試子庫包括的音頻特征碼模板。智能設(shè)備將對(duì)應(yīng)于設(shè)定語句的用戶語音的音頻特征碼與天津話測試子庫的音頻特征碼模板進(jìn)行匹配。如匹配度超過設(shè)定閾值,則確定當(dāng)前用戶使用天津話。若匹配度未達(dá)到設(shè)定閾值,則按照設(shè)定優(yōu)先級(jí)將對(duì)應(yīng)于設(shè)定語句的所述音頻特征碼與所述測試語音庫中剩余音頻特征碼模板進(jìn)行匹配,將匹配度超過設(shè)定閾值的音頻特征碼模板對(duì)應(yīng)的語言系屬分類作為用戶設(shè)有的語言系屬分類。其中,測試語音庫中各個(gè)測試子庫的優(yōu)先級(jí)的設(shè)定方式與實(shí)施例一中語言系屬分類庫中的各個(gè)子庫的優(yōu)先級(jí)設(shè)定方式相同,此處不再贅述。
      [0077]步驟230、將所述語言系屬分類庫中對(duì)應(yīng)于所確定的語言系屬分類的語音模板的比對(duì)優(yōu)先級(jí)設(shè)為最尚。
      [0078]智能設(shè)備將上述步驟中確定的用戶使用的語言系屬分類對(duì)應(yīng)的語音模板的比對(duì)優(yōu)先級(jí)設(shè)為最高。例如,通過上述步驟確定用戶使用天津話,那么,將語言系屬分類庫中天津話子庫包括的語音模板的優(yōu)先級(jí)設(shè)為最高。所述語言系屬分類庫中語音模板的優(yōu)先級(jí)對(duì)應(yīng)于包括所述語音模板的子庫的優(yōu)先級(jí)。所述語言系屬分類庫中剩余語音模板的優(yōu)先級(jí)按照實(shí)施例一中語言系屬分類庫中的各個(gè)子庫的優(yōu)先級(jí)排序,此處不再贅述。
      [0079]步驟240、獲取用戶發(fā)出的控制語音。
      [0080]智能設(shè)備通過麥克風(fēng)采集用戶的語音數(shù)據(jù),對(duì)所采集的語音數(shù)據(jù)的處理方式與實(shí)施例一相同,此處不再贅述。
      [0081]步驟250、確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼。
      [0082]智能設(shè)備確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼。音頻特征碼的確定過程與實(shí)施例一的記載的方式相同,此處不再贅述。
      [0083]步驟260、將音頻特征碼與所述語言系屬分類庫中比對(duì)優(yōu)先級(jí)最高的語音模板進(jìn)行比對(duì),獲得比對(duì)結(jié)果。
      [0084]智能設(shè)備將音頻特征碼與上述步驟中確定的優(yōu)先級(jí)最高的語音模板進(jìn)行比對(duì)。例如,根據(jù)上述步驟確定語言系屬分類庫中天津話子庫包括的語音模板的優(yōu)先級(jí)最高。在執(zhí)行比對(duì)操作時(shí),智能設(shè)備的主控制器首先將所述音頻特征碼與天津話子庫包括的語音模板進(jìn)行比對(duì),若存在匹配度超過設(shè)定閥值的詞組,則將該詞組或詞組串作為根據(jù)比對(duì)結(jié)果得到的控制語音的識(shí)別結(jié)果。
      [0085]本實(shí)施例的技術(shù)方案,通過使用戶讀設(shè)定語句,縮小了語音識(shí)別的范圍,提高了識(shí)別速度。并且首先對(duì)用戶使用的語言進(jìn)行確定,從而設(shè)定智能設(shè)備在獲得用戶的控制指令時(shí),優(yōu)先比對(duì)的語言系屬分類庫包括的語音模板,實(shí)現(xiàn)每次獲取控制指令后,智能設(shè)備可以有針對(duì)性的確定首選的比對(duì)模板,進(jìn)一步提高了語音識(shí)別速度和準(zhǔn)確度。
      [0086]實(shí)施例三
      [0087]圖3是本發(fā)明實(shí)施例三中的一種通過語音控制智能設(shè)備的裝置的結(jié)構(gòu)示意圖。所述裝置包括:
      [0088]語音獲取模塊310,用于獲取用戶發(fā)出的控制語音。
      [0089]語音識(shí)別模塊320,用于將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì)。
      [0090]指令確定模塊330,用于根據(jù)比對(duì)結(jié)果確定與所述控制語音對(duì)應(yīng)的控制指令,執(zhí)行所述控制指令對(duì)應(yīng)的操作,其中,所述語言系屬分類庫包括與智能設(shè)備控制指令關(guān)聯(lián)的普通話語音模板和方言語音模板。
      [0091]本實(shí)施例的技術(shù)方案,通過語音獲取模塊310獲取用戶發(fā)出的控制語音。采用語音識(shí)別模塊320將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì)。通過指令確定模塊330根據(jù)比對(duì)結(jié)果確定與所述控制語音對(duì)應(yīng)的控制指令,執(zhí)行所述控制指令對(duì)應(yīng)的操作,解決現(xiàn)有技術(shù)中智能設(shè)備的語音控制功能對(duì)方言的識(shí)別率不高,可能出現(xiàn)用戶喊出幾次控制指令,智能設(shè)備卻無法識(shí)別的問題,提供一種準(zhǔn)確迅速識(shí)別用戶語音控制指令的方式,達(dá)到了提升用戶的應(yīng)用體驗(yàn)的效果。
      [0092]進(jìn)一步的,所述裝置還包括:
      [0093]設(shè)定語句顯示模塊,用于在獲取用戶發(fā)出的控制語音之前,通過智能設(shè)備的顯示屏顯示設(shè)定語句,以提示用戶讀所述設(shè)定語句;
      [0094]語系確定模塊,用于將對(duì)應(yīng)于設(shè)定語句的用戶語音與設(shè)定測試語音庫進(jìn)行匹配,以確定用戶的語言系屬分類;
      [0095]優(yōu)先級(jí)設(shè)置模塊,用于將所述語言系屬分類庫中對(duì)應(yīng)于所確定的語言系屬分類的語音模板的比對(duì)優(yōu)先級(jí)設(shè)為最高;
      [0096]以及,所述指令確定模塊具體用于:
      [0097]確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼;
      [0098]將音頻特征碼與所述語言系屬分類庫中比對(duì)優(yōu)先級(jí)最高的語音模板進(jìn)行比對(duì),以識(shí)別所述控制語音。
      [0099]進(jìn)一步的,所述語系確定模塊包括:
      [0100]特征碼提取子模塊,用于確定所述用戶語音對(duì)應(yīng)的音頻特征碼;
      [0101]語音匹配子模塊,用于將所述音頻特征碼與所述測試語音庫中的音頻特征碼模板進(jìn)行匹配;
      [0102]語言系屬確定子模塊,根據(jù)匹配結(jié)果確定用戶對(duì)應(yīng)的語言系屬分類,其中,所述語言系屬分類包括普通話和方言。
      [0103]進(jìn)一步的,所述語言系屬確定子模塊具體用于:
      [0104]根據(jù)網(wǎng)際協(xié)議地址確定智能設(shè)備所處地區(qū);
      [0105]根據(jù)所確定的地區(qū)獲取所述測試語音庫中與所述地區(qū)對(duì)應(yīng)的音頻特征碼模塊;
      [0106]將所述音頻特征碼與所述音頻特征碼模板進(jìn)行匹配,確定匹配度;
      [0107]在匹配度未達(dá)到設(shè)定閾值時(shí),將所述音頻特征碼與所述測試語音庫中剩余音頻特征碼模板進(jìn)行匹配。
      [0108]進(jìn)一步的,所述指令確定模塊330具體用于:
      [0109]確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼;
      [0110]按照預(yù)設(shè)的比對(duì)優(yōu)先級(jí)順序,將所述音頻特征碼與所述語言系屬分類庫包括的語音模板進(jìn)行匹配,以識(shí)別所述控制語音。
      [0111]上述通過語音控制智能設(shè)備的裝置可執(zhí)行本發(fā)明任意實(shí)施例所提供的通過語音控制智能設(shè)備的方法,具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。
      [0112]本領(lǐng)域技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過程序來指令相關(guān)的硬件來完成,該程序存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一個(gè)設(shè)備(可以是單片機(jī),芯片等)或處理器(processor)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(R0M,Read-0nlyMemory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
      [0113]注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這里所述的特定實(shí)施例,對(duì)本領(lǐng)域技術(shù)人員來說能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會(huì)脫離本發(fā)明的保護(hù)范圍。因此,雖然通過以上實(shí)施例對(duì)本發(fā)明進(jìn)行了較為詳細(xì)的說明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。
      【主權(quán)項(xiàng)】
      1.一種通過語音控制智能設(shè)備的方法,其特征在于,包括: 獲取用戶發(fā)出的控制語音; 將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì); 根據(jù)比對(duì)結(jié)果確定與所述控制語音對(duì)應(yīng)的控制指令,執(zhí)行所述控制指令對(duì)應(yīng)的操作,其中,所述語言系屬分類庫包括與智能設(shè)備控制指令關(guān)聯(lián)的普通話語音模板和方言語音模板。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在獲取用戶發(fā)出的控制語音之前,還包括: 通過智能設(shè)備的顯示屏顯示設(shè)定語句,以提示用戶讀所述設(shè)定語句;將對(duì)應(yīng)于設(shè)定語句的用戶語音與設(shè)定測試語音庫進(jìn)行匹配,以確定用戶的語言系屬分類; 將所述語言系屬分類庫中對(duì)應(yīng)于所確定的語言系屬分類的語音模板的比對(duì)優(yōu)先級(jí)設(shè)為最筒; 以及,將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì),包括: 確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼; 將音頻特征碼與所述語言系屬分類庫中比對(duì)優(yōu)先級(jí)最高的語音模板進(jìn)行比對(duì),獲得比對(duì)結(jié)果。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,將所述用戶語音與對(duì)應(yīng)于所述設(shè)定語句的預(yù)設(shè)測試語音庫進(jìn)行匹配,以確定用戶的語言系屬分類,包括: 確定所述用戶語音對(duì)應(yīng)的音頻特征碼; 將所述音頻特征碼與所述測試語音庫中的音頻特征碼模板進(jìn)行匹配; 根據(jù)匹配結(jié)果確定用戶對(duì)應(yīng)的語言系屬分類,其中,所述語言系屬分類包括普通話和方言。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,將所述音頻特征碼與所述測試語音庫中的音頻特征碼模板進(jìn)行匹配,包括: 根據(jù)網(wǎng)際協(xié)議地址確定智能設(shè)備所處地區(qū); 根據(jù)所確定的地區(qū)獲取所述測試語音庫中與所述地區(qū)對(duì)應(yīng)的音頻特征碼模塊; 將所述音頻特征碼與所述音頻特征碼模板進(jìn)行匹配,確定匹配度; 在匹配度未達(dá)到設(shè)定閾值時(shí),按照設(shè)定順序依次比對(duì)所述音頻特征碼與所述測試語音庫中剩余音頻特征碼模板。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì),包括: 確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼; 按照預(yù)設(shè)的比對(duì)優(yōu)先級(jí),依次將所述音頻特征碼與所述語言系屬分類庫包括的語音模板進(jìn)行匹配,以識(shí)別所述控制語音。6.一種通過語音控制智能設(shè)備的裝置,其特征在于,包括: 語音獲取模塊,用于獲取用戶發(fā)出的控制語音; 語音識(shí)別模塊,用于將所述控制語音與預(yù)置的語言系屬分類庫包括的語音模板進(jìn)行比對(duì); 指令確定模塊,用于根據(jù)比對(duì)結(jié)果確定與所述控制語音對(duì)應(yīng)的控制指令,執(zhí)行所述控制指令對(duì)應(yīng)的操作,其中,所述語言系屬分類庫包括與智能設(shè)備控制指令關(guān)聯(lián)的普通話語音模板和方言語音模板。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括: 設(shè)定語句顯示模塊,用于在獲取用戶發(fā)出的控制語音之前,通過智能設(shè)備的顯示屏顯示設(shè)定語句,以提示用戶讀所述設(shè)定語句; 語系確定模塊,用于將對(duì)應(yīng)于設(shè)定語句的用戶語音與設(shè)定測試語音庫進(jìn)行匹配,以確定用戶的語言系屬分類; 優(yōu)先級(jí)設(shè)置模塊,用于將所述語言系屬分類庫中對(duì)應(yīng)于所確定的語言系屬分類的語音模板的比對(duì)優(yōu)先級(jí)設(shè)為最高; 以及,所述指令確定模塊具體用于: 確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼; 將音頻特征碼與所述語言系屬分類庫中比對(duì)優(yōu)先級(jí)最高的語音模板進(jìn)行比對(duì),以識(shí)別所述控制語音。8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述語系確定模塊包括: 特征碼提取子模塊,用于確定所述用戶語音對(duì)應(yīng)的音頻特征碼; 語音匹配子模塊,用于將所述音頻特征碼與所述測試語音庫中的音頻特征碼模板進(jìn)行匹配; 語言系屬確定子模塊,根據(jù)匹配結(jié)果確定用戶對(duì)應(yīng)的語言系屬分類,其中,所述語言系屬分類包括普通話和方言。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述語言系屬確定子模塊具體用于: 根據(jù)網(wǎng)際協(xié)議地址確定智能設(shè)備所處地區(qū); 根據(jù)所確定的地區(qū)獲取所述測試語音庫中與所述地區(qū)對(duì)應(yīng)的音頻特征碼模塊; 將所述音頻特征碼與所述音頻特征碼模板進(jìn)行匹配,確定匹配度; 在匹配度未達(dá)到設(shè)定閾值時(shí),將所述音頻特征碼與所述測試語音庫中剩余音頻特征碼模板進(jìn)行匹配。10.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述指令確定模塊具體用于: 確定當(dāng)前用戶發(fā)出的所述控制語音對(duì)應(yīng)的音頻特征碼; 按照預(yù)設(shè)的比對(duì)優(yōu)先級(jí)順序,將所述音頻特征碼與所述語言系屬分類庫包括的語音模板進(jìn)行匹配,以識(shí)別所述控制語音。
      【文檔編號(hào)】G10L15/26GK105872687SQ201610196676
      【公開日】2016年8月17日
      【申請(qǐng)日】2016年3月31日
      【發(fā)明人】張文
      【申請(qǐng)人】樂視控股(北京)有限公司, 樂視致新電子科技(天津)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1