国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種語(yǔ)音識(shí)別的方法及系統(tǒng)的制作方法

      文檔序號(hào):10513509閱讀:576來(lái)源:國(guó)知局
      一種語(yǔ)音識(shí)別的方法及系統(tǒng)的制作方法
      【專利摘要】本發(fā)明公開了一種語(yǔ)音識(shí)別的方法及系統(tǒng)。該方法,包括:一種語(yǔ)音識(shí)別的方法,其特征在于,包括:檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離;識(shí)別出用戶臉部的嘴型發(fā)生變化;對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。本發(fā)明能夠在用戶對(duì)著設(shè)備進(jìn)行語(yǔ)音時(shí),自動(dòng)開啟語(yǔ)音識(shí)別,對(duì)用戶的語(yǔ)音進(jìn)行識(shí)別,減少了開啟的操作,提高了用戶體驗(yàn)。
      【專利說明】
      一種語(yǔ)音識(shí)別的方法及系統(tǒng)
      技術(shù)領(lǐng)域
      [0001]本發(fā)明涉及數(shù)據(jù)存儲(chǔ)技術(shù)領(lǐng)域,尤其涉及一種語(yǔ)音識(shí)別的方法及系統(tǒng)。
      【背景技術(shù)】
      [0002]語(yǔ)音的開啟模塊對(duì)整個(gè)語(yǔ)音識(shí)別的體驗(yàn)是至關(guān)重要的,同時(shí)好的開啟模式還對(duì)避免噪音干擾起著很大的幫助?,F(xiàn)有的語(yǔ)音識(shí)別開啟模式主要有兩種:一種是觸摸操作之后開啟語(yǔ)音識(shí)別,如:按屏幕上的開啟按鈕,或是定義滑屏等操作來(lái)開啟,或是按實(shí)體鈕鍵來(lái)開啟一個(gè)功能的語(yǔ)音識(shí)別功能,但這種方式在開啟語(yǔ)音識(shí)別功能時(shí),需要用手操作,顯得不夠便捷、智能,影響了用戶的使用意愿,在有些場(chǎng)合,如開車時(shí)更顯得不方便;另一種是用戶講規(guī)定好的簡(jiǎn)單命令來(lái)開啟,如華為的智能手表,就是通過對(duì)手表說:“hello,安卓”這樣簡(jiǎn)單且規(guī)定好的命令來(lái)開啟它的語(yǔ)音識(shí)別模式。但是這種方式顯得不自然,智能感降低,并且在在語(yǔ)音識(shí)別之前都要有個(gè)命令識(shí)別過程,也會(huì)讓效率降低。
      [0003]如何在用戶對(duì)著設(shè)備進(jìn)行講話后,系統(tǒng)就能自動(dòng)識(shí)別,不需要用戶有一個(gè)語(yǔ)音的開啟動(dòng)作,能自動(dòng)在用戶開始講話時(shí)就自動(dòng)開啟,使語(yǔ)音識(shí)別更便捷、智能,提高用戶體驗(yàn)是急需解決的冋題。

      【發(fā)明內(nèi)容】

      [0004]本發(fā)明提供了一種語(yǔ)音識(shí)別的方法及系統(tǒng),通過根據(jù)與用戶臉部的距離和嘴型的變化來(lái)進(jìn)行語(yǔ)音識(shí)別,實(shí)現(xiàn)了在用戶對(duì)著設(shè)備進(jìn)行語(yǔ)音時(shí),自動(dòng)開啟語(yǔ)音識(shí)別,對(duì)用戶的語(yǔ)音進(jìn)行識(shí)別,減少了開啟的操作,提高了用戶體驗(yàn)。
      [0005]為實(shí)現(xiàn)上述設(shè)計(jì),本發(fā)明采用以下技術(shù)方案:
      [0006]—方面,提供了一種語(yǔ)音識(shí)別的方法,包括:
      [0007]檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離;
      [0008]識(shí)別出用戶臉部的嘴型發(fā)生變化;
      [0009]對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。
      [0010]優(yōu)選地,所述檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離,包括:通過攝像頭檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離;
      [0011]所述檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離之前,還包括:檢測(cè)出抬手動(dòng)作,開啟攝像頭。
      [0012]優(yōu)選地,所述檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離,包括:
      [0013]利用紅外傳感器檢測(cè)與物體的距離小于等于預(yù)置距離;
      [0014]通過攝像頭確定所述物體為用戶臉部。
      [0015]優(yōu)選地,所述檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離之后,還包括:開啟錄
      ■~>V.曰O
      [0016]優(yōu)選地,所述對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別,包括:去除識(shí)別出用戶臉部的嘴型發(fā)生變化之前的錄音,從識(shí)別出用戶臉部的嘴型發(fā)生變化時(shí)的錄音作為起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。
      [0017]優(yōu)選地,所述對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別之后,還包括:對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng)。
      [0018]另一方面,提供了一種語(yǔ)音識(shí)別的系統(tǒng),該系統(tǒng),包括:
      [0019]距離檢測(cè)模塊,用于檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離;
      [0020]嘴型識(shí)別模塊,用于識(shí)別出用戶臉部的嘴型發(fā)生變化;
      [0021 ]語(yǔ)音識(shí)別模塊,用于對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。
      [0022]優(yōu)選地:
      [0023]所述距離檢測(cè)模塊具體用于:通過攝像頭檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離;
      [0024]還包括:開啟模塊,用于檢測(cè)出抬手動(dòng)作,開啟攝像頭。
      [0025]優(yōu)選地,所述距離檢測(cè)模塊具體用于:
      [0026]利用紅外傳感器檢測(cè)出與物體的距離小于等于預(yù)置距離;
      [0027]通過攝像頭確定所述物體為用戶臉部。
      [0028]優(yōu)選地,還包括:
      [0029]錄音開啟模塊,用于在距離檢測(cè)模塊檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離之后開啟錄首;
      [0030]響應(yīng)模塊,用于對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng);
      [0031]所述語(yǔ)音識(shí)別模塊,具體用于:去除識(shí)別出用戶臉部的嘴型發(fā)生變化之前的錄音,從識(shí)別出用戶臉部的嘴型發(fā)生變化時(shí)的錄音作為起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。
      [0032]與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離;識(shí)別出用戶臉部的嘴型發(fā)生變化;對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。本發(fā)明通過根據(jù)與用戶臉部的距離和嘴型的變化來(lái)進(jìn)行語(yǔ)音識(shí)別,實(shí)現(xiàn)了在用戶對(duì)著設(shè)備進(jìn)行語(yǔ)音時(shí),自動(dòng)開啟語(yǔ)音識(shí)別,對(duì)用戶的語(yǔ)音進(jìn)行識(shí)別,減少了開啟的操作,提高了用戶體驗(yàn)。
      【附圖說明】
      [0033]為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)本發(fā)明實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單的介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)本發(fā)明實(shí)施例的內(nèi)容和這些附圖獲得其他的附圖。
      [0034]圖1是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的方法的第一實(shí)施例的方法流程圖。
      [0035]圖2是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的方法的第二實(shí)施例的方法流程圖。
      [0036]圖3是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的方法的第三實(shí)施例的方法流程圖。
      [0037]圖4是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的系統(tǒng)的第一實(shí)施例的結(jié)構(gòu)方框圖。
      [0038]圖5是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的系統(tǒng)的第二實(shí)施例的結(jié)構(gòu)方框圖。
      [0039]圖6是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的系統(tǒng)的第三實(shí)施例的結(jié)構(gòu)方框圖。
      【具體實(shí)施方式】
      [0040]為使本發(fā)明解決的技術(shù)問題、采用的技術(shù)方案和達(dá)到的技術(shù)效果更加清楚,下面將結(jié)合附圖對(duì)本發(fā)明實(shí)施例的技術(shù)方案作進(jìn)一步的詳細(xì)描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
      [0041]請(qǐng)參考圖1,其是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的方法的第一實(shí)施例的方法流程圖。如圖所示,該方法,包括:
      [0042]步驟SlOl:檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離。
      [0043]當(dāng)用戶需要對(duì)設(shè)備進(jìn)行語(yǔ)音控制時(shí),用戶會(huì)靠近設(shè)備進(jìn)行講話,也相當(dāng)于用戶臉部靠近設(shè)備,為提高語(yǔ)音的錄取質(zhì)量,需檢測(cè)設(shè)備與用戶臉部的距離是否小于等于預(yù)置距離,所述預(yù)置距離為5cm、10cm或15cm等,可根據(jù)不同設(shè)備和實(shí)際使用環(huán)境來(lái)進(jìn)行設(shè)置。所述設(shè)備包括:大型智能設(shè)備,如智能手表、智能手環(huán)等的穿戴便攜設(shè)備,如手機(jī)、平板等的非穿戴便攜設(shè)備等等。
      [0044]步驟S102:識(shí)別出用戶臉部的嘴型發(fā)生變化。
      [0045]為避免在臉部靠近但還沒發(fā)音時(shí),錄入環(huán)境噪音,影響識(shí)別率,需要進(jìn)行嘴型識(shí)另IJ,如果識(shí)別出用戶的嘴型有發(fā)音的變化與動(dòng)作,就以當(dāng)前時(shí)間點(diǎn)為控制語(yǔ)音的起始點(diǎn)。
      [0046]步驟S103:對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。
      [0047]所述對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別,包括:去除識(shí)別出用戶臉部的嘴型發(fā)生變化之前的錄音,從識(shí)別出用戶臉部的嘴型發(fā)生變化時(shí)的錄音作為起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。去除起始點(diǎn)之前的錄音,在一定程度上去除環(huán)境噪聲對(duì)語(yǔ)音識(shí)別的影響,提高識(shí)別率。
      [0048]綜上所述,本實(shí)施例通過根據(jù)與用戶臉部的距離和嘴型的變化來(lái)進(jìn)行語(yǔ)音識(shí)別,以識(shí)別出用戶臉部的嘴型發(fā)生變化時(shí)的錄音作為語(yǔ)音識(shí)別的起始點(diǎn),在一定程度上去除了環(huán)境噪聲對(duì)語(yǔ)音識(shí)別的影響,提高了識(shí)別率,本實(shí)施例實(shí)現(xiàn)了在用戶對(duì)著設(shè)備進(jìn)行語(yǔ)音時(shí),自動(dòng)開啟語(yǔ)音識(shí)別,對(duì)用戶的語(yǔ)音進(jìn)行識(shí)別,減少了開啟的操作,提高了用戶體驗(yàn)。
      [0049]請(qǐng)參考圖2,其是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的方法的第二實(shí)施例的方法流程圖。如圖所示,該方法,包括:
      [0050]步驟S201:檢測(cè)出抬手動(dòng)作,開啟攝像頭。
      [0051]對(duì)于智能手表、智能手環(huán)等的穿戴便攜設(shè)備來(lái)說,當(dāng)用戶需要語(yǔ)音控制時(shí),是需要抬手的,對(duì)應(yīng)的會(huì)有一個(gè)抬手動(dòng)作,但抬手不一定會(huì)進(jìn)行語(yǔ)音控制,因此,當(dāng)檢測(cè)出抬手動(dòng)作時(shí),還需要進(jìn)行臉部識(shí)別,檢測(cè)出有抬手動(dòng)作,也識(shí)別出臉部,則說明用戶需要進(jìn)行語(yǔ)音控制。本實(shí)施例利用攝像頭進(jìn)行臉部識(shí)別和距離的監(jiān)測(cè),所以當(dāng)檢測(cè)出抬手動(dòng)作時(shí),開啟攝像頭??梢岳眉铀俣葌鞲衅鳈z測(cè)出抬手動(dòng)作,這是現(xiàn)有技術(shù),此處不再贅述。
      [0052]步驟S202:通過攝像頭檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離。
      [0053]當(dāng)用戶臉部與設(shè)備的距離小于等于預(yù)置距離,說明用戶需要進(jìn)行語(yǔ)音控制。利用攝像頭進(jìn)行臉部識(shí)別和距離的檢測(cè),以檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離,所述預(yù)置距離為5cm、10cm或15cm等,可根據(jù)不同設(shè)備和實(shí)際使用環(huán)境來(lái)進(jìn)行設(shè)置。步驟S202為本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的方法的第一實(shí)施例中步驟S101:檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離的針對(duì)智能手表、智能手環(huán)等穿戴便攜設(shè)備的更具體的實(shí)施方案。
      [0054]步驟S203:開啟錄音。
      [0055]當(dāng)檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離之后,就開啟錄音。
      [0056]步驟S204:識(shí)別出用戶臉部的嘴型發(fā)生變化。
      [0057]為避免在臉部靠近但還沒發(fā)音時(shí),錄入環(huán)境噪音,影響識(shí)別率,需要進(jìn)行嘴型識(shí)另IJ,如果識(shí)別出用戶的嘴型有發(fā)音的變化與動(dòng)作,就以當(dāng)前時(shí)間點(diǎn)為控制語(yǔ)音的起始點(diǎn)。
      [0058]步驟S205:對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。
      [0059]所述對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別,包括:去除識(shí)別出用戶臉部的嘴型發(fā)生變化之前的錄音,從識(shí)別出用戶臉部的嘴型發(fā)生變化時(shí)的錄音作為起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。去除起始點(diǎn)之前的錄音,在一定程度上去除環(huán)境噪聲對(duì)語(yǔ)音識(shí)別的影響,提高識(shí)別率。
      [0060]步驟S206:對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng)。
      [0061]對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng),所述語(yǔ)音命令可以是打開某個(gè)應(yīng)用程序、關(guān)閉某個(gè)應(yīng)用程度、打電話、發(fā)信息等。
      [0062]本實(shí)施例當(dāng)檢測(cè)出抬手動(dòng)作時(shí)就開啟攝像頭,利用攝像頭來(lái)進(jìn)行臉部識(shí)別和距離的監(jiān)測(cè),當(dāng)攝像頭檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離時(shí),開啟錄音,去除識(shí)別出用戶臉部的嘴型發(fā)生變化之前的錄音,以識(shí)別出用戶的嘴型有發(fā)音的變化與動(dòng)作的時(shí)間點(diǎn)作為控制語(yǔ)音的起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別,并對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng)。本實(shí)施例在用戶有抬手動(dòng)作,靠近設(shè)備進(jìn)行發(fā)音后,能立即進(jìn)行語(yǔ)音命令的響應(yīng),不用事先做開啟的動(dòng)作,整個(gè)過程自然,操作效率高,在一定程度上去除環(huán)境噪聲對(duì)語(yǔ)音識(shí)別的影響,提高識(shí)別率。
      [0063]請(qǐng)參考圖3,其是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的方法的第三實(shí)施例的方法流程圖。如圖所示,該方法,包括:
      [0064]步驟S301:利用紅外傳感器檢測(cè)與物體的距離小于等于預(yù)置距離。
      [0065]當(dāng)用戶需要對(duì)設(shè)備進(jìn)行語(yǔ)音控制時(shí),用戶會(huì)靠近設(shè)備進(jìn)行講話,因此可利用紅外傳感器檢測(cè)在預(yù)置距離范圍內(nèi)是否有物體接近,也就相當(dāng)于利用紅外傳感器檢測(cè)設(shè)備與物體的距離是否小于等于預(yù)置距離。
      [0066]步驟S302:通過攝像頭確定所述物體為用戶臉部。
      [0067]當(dāng)紅外傳感器檢測(cè)設(shè)備與物體的距離小于等于預(yù)置距離,說明有物體接近,但不代表一定是需要進(jìn)行語(yǔ)音控制,還可能會(huì)是其他情況,例如剛好有個(gè)物體擺放在設(shè)備前面,或是設(shè)備放在了一個(gè)物體上面,因此還需要通過攝像頭確定所述物體為用戶臉部,說明是用戶在靠近設(shè)備,需要對(duì)設(shè)備進(jìn)行語(yǔ)音控制。步驟S301與步驟S302為本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的方法的第一實(shí)施例中步驟SlOl:檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離的更具體的實(shí)施方案。
      [0068]所述設(shè)備包括:大型智能設(shè)備,如智能手表、智能手環(huán)等的穿戴便攜設(shè)備,如手機(jī)、平板等的非穿戴便攜設(shè)備等等。所述預(yù)置距離為5cm、10cm或15cm等,可根據(jù)不同設(shè)備和實(shí)際使用環(huán)境來(lái)進(jìn)行設(shè)置。利用紅外傳感器檢測(cè)與物體的距離小于等于預(yù)置距離之后,開啟攝像頭,通過攝像頭確定所述物體為用戶臉部。
      [0069]步驟S303:開啟錄音。
      [0070]當(dāng)檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離之后,就開啟錄音。
      [0071]步驟S304:識(shí)別出用戶臉部的嘴型發(fā)生變化。
      [0072]為避免在臉部靠近但還沒發(fā)音時(shí),錄入環(huán)境噪音,影響識(shí)別率,需要進(jìn)行嘴型識(shí)另IJ,如果識(shí)別出用戶的嘴型有發(fā)音的變化與動(dòng)作,就以當(dāng)前時(shí)間點(diǎn)為控制語(yǔ)音的起始點(diǎn)。
      [0073]步驟S305:對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。
      [0074]所述對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別,包括:去除識(shí)別出用戶臉部的嘴型發(fā)生變化之前的錄音,從識(shí)別出用戶臉部的嘴型發(fā)生變化時(shí)的錄音作為起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。去除起始點(diǎn)之前的錄音,在一定程度上去除環(huán)境噪聲對(duì)語(yǔ)音識(shí)別的影響,提高識(shí)別率。
      [0075]步驟S306:對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng)。
      [0076]對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng),所述語(yǔ)音命令可以是打開某個(gè)應(yīng)用程序、關(guān)閉某個(gè)應(yīng)用程度、打電話、發(fā)信息等。
      [0077]本實(shí)施例利用紅外傳感器檢測(cè)與物體的距離小于等于預(yù)置距離,通過攝像頭確定所述物體為用戶臉部,利用紅外傳感器和攝像頭的結(jié)合來(lái)檢測(cè)出設(shè)備與用戶臉部的距離小于等于預(yù)置距離后,開啟錄音,去除識(shí)別出用戶臉部的嘴型發(fā)生變化之前的錄音,以識(shí)別出用戶的嘴型有發(fā)音的變化與動(dòng)作的時(shí)間點(diǎn)作為控制語(yǔ)音的起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)另IJ,并對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng)。本實(shí)施例在用戶靠近設(shè)備進(jìn)行發(fā)音后,能立即進(jìn)行語(yǔ)音命令的響應(yīng),不用事先做開啟的動(dòng)作,整個(gè)過程自然,操作效率高,在一定程度上去除環(huán)境噪聲對(duì)語(yǔ)音識(shí)別的影響,提高識(shí)別率。
      [0078]以下是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的系統(tǒng)的實(shí)施例,系統(tǒng)的實(shí)施例基于上述的方法的實(shí)施例實(shí)現(xiàn),在系統(tǒng)中未盡的描述,請(qǐng)參考前述方法的實(shí)施例。
      [0079]請(qǐng)參考圖4,其是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的系統(tǒng)的第一實(shí)施例的結(jié)構(gòu)方框圖。如圖所示,該系統(tǒng),包括:
      [0080]距離檢測(cè)模塊41,用于檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離。
      [0081]當(dāng)用戶需要對(duì)設(shè)備進(jìn)行語(yǔ)音控制時(shí),用戶會(huì)靠近設(shè)備進(jìn)行講話,也相當(dāng)于用戶臉部靠近設(shè)備,為提高語(yǔ)音的錄取質(zhì)量,需檢測(cè)設(shè)備與用戶臉部的距離是否小于等于預(yù)置距離,所述預(yù)置距離為5cm、10cm或15cm等,可根據(jù)不同設(shè)備和實(shí)際使用環(huán)境來(lái)進(jìn)行設(shè)置。所述設(shè)備包括:大型智能設(shè)備,如智能手表、智能手環(huán)等的穿戴便攜設(shè)備,如手機(jī)、平板等的非穿戴便攜設(shè)備等等。
      [0082]嘴型識(shí)別模塊42,用于識(shí)別出用戶臉部的嘴型發(fā)生變化。
      [0083]為避免在臉部靠近但還沒發(fā)音時(shí),錄入環(huán)境噪音,影響識(shí)別率,需要進(jìn)行嘴型識(shí)另IJ,如果識(shí)別出用戶的嘴型有發(fā)音的變化與動(dòng)作,就以當(dāng)前時(shí)間點(diǎn)為控制語(yǔ)音的起始點(diǎn)。
      [0084]語(yǔ)音識(shí)別模塊43,用于對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。
      [0085]所述語(yǔ)音識(shí)別模塊43,具體用于:去除識(shí)別出用戶臉部的嘴型發(fā)生變化之前的錄音,從識(shí)別出用戶臉部的嘴型發(fā)生變化時(shí)的錄音作為起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。去除起始點(diǎn)之前的錄音,在一定程度上去除環(huán)境噪聲對(duì)語(yǔ)音識(shí)別的影響,提高識(shí)別率。
      [0086]綜上所述,本實(shí)施例通過根據(jù)與用戶臉部的距離和嘴型的變化來(lái)進(jìn)行語(yǔ)音識(shí)別,以識(shí)別出用戶臉部的嘴型發(fā)生變化時(shí)的錄音作為語(yǔ)音識(shí)別的起始點(diǎn),在一定程度上去除了環(huán)境噪聲對(duì)語(yǔ)音識(shí)別的影響,提高了識(shí)別率,本實(shí)施例實(shí)現(xiàn)了在用戶對(duì)著設(shè)備進(jìn)行語(yǔ)音時(shí),自動(dòng)開啟語(yǔ)音識(shí)別,對(duì)用戶的語(yǔ)音進(jìn)行識(shí)別,減少了開啟的操作,提高了用戶體驗(yàn)。
      [0087]請(qǐng)參考圖5,其是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的系統(tǒng)的第二實(shí)施例的結(jié)構(gòu)方框圖。如圖所示,該系統(tǒng),包括:
      [0088]開啟模塊51,用于檢測(cè)出抬手動(dòng)作,開啟攝像頭。
      [0089]對(duì)于智能手表、智能手環(huán)等的穿戴便攜設(shè)備來(lái)說,當(dāng)用戶需要語(yǔ)音控制時(shí),是需要抬手的,對(duì)應(yīng)的會(huì)有一個(gè)抬手動(dòng)作,但抬手不一定會(huì)進(jìn)行語(yǔ)音控制,因此,當(dāng)檢測(cè)出抬手動(dòng)作時(shí),還需要進(jìn)行臉部識(shí)別,檢測(cè)出有抬手動(dòng)作,也識(shí)別出臉部,則說明用戶需要進(jìn)行語(yǔ)音控制。本實(shí)施例利用攝像頭進(jìn)行臉部識(shí)別和距離的監(jiān)測(cè),所以當(dāng)檢測(cè)出抬手動(dòng)作時(shí),開啟攝像頭??梢岳眉铀俣葌鞲衅鳈z測(cè)出抬手動(dòng)作,這是現(xiàn)有技術(shù),此處不再贅述。
      [0090]距離檢測(cè)模塊52,用于通過攝像頭檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離。
      [0091]當(dāng)用戶臉部與設(shè)備的距離小于等于預(yù)置距離,說明用戶需要進(jìn)行語(yǔ)音控制。利用攝像頭進(jìn)行臉部識(shí)別和距離的檢測(cè),以檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離,所述預(yù)置距離為5cm、10cm或15cm等,可根據(jù)不同設(shè)備和實(shí)際使用環(huán)境來(lái)進(jìn)行設(shè)置。
      [0092]錄音開啟模塊53,用于在距離檢測(cè)模塊52檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離之后開啟錄音。
      [0093]嘴型識(shí)別模塊54,用于識(shí)別出用戶臉部的嘴型發(fā)生變化。
      [0094]為避免在臉部靠近但還沒發(fā)音時(shí),錄入環(huán)境噪音,影響識(shí)別率,需要進(jìn)行嘴型識(shí)另IJ,如果識(shí)別出用戶的嘴型有發(fā)音的變化與動(dòng)作,就以當(dāng)前時(shí)間點(diǎn)為控制語(yǔ)音的起始點(diǎn)。
      [0095]語(yǔ)音識(shí)別模塊55,用于對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。
      [0096]所述語(yǔ)音識(shí)別模塊55,具體用于:去除識(shí)別出用戶臉部的嘴型發(fā)生變化之前的錄音,從識(shí)別出用戶臉部的嘴型發(fā)生變化時(shí)的錄音作為起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。去除起始點(diǎn)之前的錄音,在一定程度上去除環(huán)境噪聲對(duì)語(yǔ)音識(shí)別的影響,提高識(shí)別率。
      [0097]響應(yīng)模塊56,用于對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng)。
      [0098]本實(shí)施例利用攝像頭檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離,以識(shí)別出用戶的嘴型有發(fā)音的變化與動(dòng)作的時(shí)間點(diǎn)作為控制語(yǔ)音的起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別,并對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng)。本實(shí)施例在用戶有抬手動(dòng)作,靠近設(shè)備進(jìn)行發(fā)音后,能立即進(jìn)行語(yǔ)音命令的響應(yīng),不用事先做開啟的動(dòng)作,整個(gè)過程自然,操作效率高,在一定程度上去除環(huán)境噪聲對(duì)語(yǔ)音識(shí)別的影響,提高識(shí)別率。
      [0099]請(qǐng)參考圖6,其是本發(fā)明【具體實(shí)施方式】中提供的一種語(yǔ)音識(shí)別的系統(tǒng)的第三實(shí)施例的結(jié)構(gòu)方框圖。如圖所示,該系統(tǒng),包括:
      [0100]距離檢測(cè)模塊61,用于利用紅外傳感器檢測(cè)出與物體的距離小于等于預(yù)置距離;通過攝像頭確定所述物體為用戶臉部。
      [0101]當(dāng)用戶需要對(duì)設(shè)備進(jìn)行語(yǔ)音控制時(shí),用戶會(huì)靠近設(shè)備進(jìn)行講話,因此可利用紅外傳感器檢測(cè)在預(yù)置距離范圍內(nèi)是否有物體接近,也就相當(dāng)于利用紅外傳感器檢測(cè)設(shè)備與物體的距離是否小于等于預(yù)置距離。所述設(shè)備包括:大型智能設(shè)備,如智能手表、智能手環(huán)等的穿戴便攜設(shè)備,如手機(jī)、平板等的非穿戴便攜設(shè)備等等。所述預(yù)置距離為5cm、10cm或15cm等,可根據(jù)不同設(shè)備和實(shí)際使用環(huán)境來(lái)進(jìn)行設(shè)置。利用紅外傳感器檢測(cè)與物體的距離小于等于預(yù)置距離之后,開啟攝像頭,通過攝像頭確定所述物體為用戶臉部。
      [0102]錄音開啟模塊62,用于在距離檢測(cè)模塊檢測(cè)出與用戶臉部的距離小于等于預(yù)置距尚之后開啟錄首。
      [0103]嘴型識(shí)別模塊63,用于識(shí)別出用戶臉部的嘴型發(fā)生變化。
      [0104]為避免在臉部靠近但還沒發(fā)音時(shí),錄入環(huán)境噪音,影響識(shí)別率,需要進(jìn)行嘴型識(shí)另IJ,如果識(shí)別出用戶的嘴型有發(fā)音的變化與動(dòng)作,就以當(dāng)前時(shí)間點(diǎn)為控制語(yǔ)音的起始點(diǎn)。
      [0105]語(yǔ)音識(shí)別模塊64,用于對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。
      [0106]響應(yīng)模塊65,用于對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng)。
      [0107]對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng),所述語(yǔ)音命令可以是打開某個(gè)應(yīng)用程序、關(guān)閉某個(gè)應(yīng)用程度、打電話、發(fā)信息等。
      [0108]綜上所述,本實(shí)施例提供語(yǔ)音識(shí)別的系統(tǒng)在用戶靠近設(shè)備進(jìn)行發(fā)音后,能立即進(jìn)行語(yǔ)音命令的響應(yīng),不用事先做開啟的動(dòng)作,整個(gè)過程自然,操作效率高,在一定程度上去除環(huán)境噪聲對(duì)語(yǔ)音識(shí)別的影響,提高識(shí)別率。
      [0109]以上結(jié)合具體實(shí)施例描述了本發(fā)明的技術(shù)原理。這些描述只是為了解釋本發(fā)明的原理,而不能以任何方式解釋為對(duì)本發(fā)明保護(hù)范圍的限制?;诖颂幍慕忉?,本領(lǐng)域的技術(shù)人員不需要付出創(chuàng)造性的勞動(dòng)即可聯(lián)想到本發(fā)明的其它【具體實(shí)施方式】,這些方式都將落入本發(fā)明的保護(hù)范圍之內(nèi)。
      【主權(quán)項(xiàng)】
      1.一種語(yǔ)音識(shí)別的方法,其特征在于,包括: 檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離; 識(shí)別出用戶臉部的嘴型發(fā)生變化; 對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離,包括:通過攝像頭檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離; 所述檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離之前,還包括:檢測(cè)出抬手動(dòng)作,開啟攝像頭。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離,包括: 利用紅外傳感器檢測(cè)與物體的距離小于等于預(yù)置距離; 通過攝像頭確定所述物體為用戶臉部。4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離之后,還包括:開啟錄音。5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別,包括:去除識(shí)別出用戶臉部的嘴型發(fā)生變化之前的錄音,從識(shí)別出用戶臉部的嘴型發(fā)生變化時(shí)的錄音作為起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別之后,還包括:對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng)。7.一種語(yǔ)音識(shí)別的系統(tǒng),其特征在于,包括: 距離檢測(cè)模塊,用于檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離; 嘴型識(shí)別模塊,用于識(shí)別出用戶臉部的嘴型發(fā)生變化; 語(yǔ)音識(shí)別模塊,用于對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于: 所述距離檢測(cè)模塊具體用于:通過攝像頭檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離; 還包括:開啟模塊,用于檢測(cè)出抬手動(dòng)作,開啟攝像頭。9.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述距離檢測(cè)模塊具體用于: 利用紅外傳感器檢測(cè)出與物體的距離小于等于預(yù)置距離; 通過攝像頭確定所述物體為用戶臉部。10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,還包括: 錄音開啟模塊,用于在距離檢測(cè)模塊檢測(cè)出與用戶臉部的距離小于等于預(yù)置距離之后開啟錄首; 響應(yīng)模塊,用于對(duì)識(shí)別出的語(yǔ)音命令進(jìn)行響應(yīng); 所述語(yǔ)音識(shí)別模塊,具體用于:去除識(shí)別出用戶臉部的嘴型發(fā)生變化之前的錄音,從識(shí)別出用戶臉部的嘴型發(fā)生變化時(shí)的錄音作為起始點(diǎn),對(duì)錄取的語(yǔ)音進(jìn)行識(shí)別。
      【文檔編號(hào)】G10L15/25GK105869639SQ201610165978
      【公開日】2016年8月17日
      【申請(qǐng)日】2016年3月21日
      【發(fā)明人】房少杰
      【申請(qǐng)人】廣東小天才科技有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1