国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      語音命令識(shí)別方法及裝置與流程

      文檔序號(hào):12041705閱讀:179來源:國(guó)知局
      語音命令識(shí)別方法及裝置與流程
      本發(fā)明涉及聲控技術(shù)領(lǐng)域,尤其涉及一種語音命令識(shí)別方法及裝置。

      背景技術(shù):
      隨著聲控技術(shù)的發(fā)展,聲控技術(shù)被廣泛應(yīng)用到人們?nèi)粘I詈凸ぷ髦?。聲控技術(shù)是一種可以將人類語音作為輸入命令的控制技術(shù),使用時(shí)不可避免的會(huì)遇到使用者語音與周圍環(huán)境噪聲、其他人員語音等噪音的混疊,因此如何將非重要聲源發(fā)出的聲音過濾,并準(zhǔn)確識(shí)別重要聲源的語音命令,成為聲控設(shè)備需要解決的一個(gè)重要問題。相應(yīng)的,聲控設(shè)備對(duì)語音識(shí)別的準(zhǔn)確度和聲控設(shè)備的友好性成為業(yè)內(nèi)關(guān)注的重要課題?,F(xiàn)有技術(shù)中,聲控設(shè)備僅能識(shí)別預(yù)定的人聲。例如,聲控設(shè)備的操控者是主人A,則通過錄入大量的主人A的語音樣本后,將主人A的語音樣本存儲(chǔ)為標(biāo)準(zhǔn)命令數(shù)據(jù)庫,作為語音命令識(shí)別的依據(jù)。主人B在操控聲控設(shè)備時(shí),由于主人B與主人A的聲音頻率、音色等特征不同,即使發(fā)出同樣的語音命令,也不能被識(shí)別。因此,在實(shí)現(xiàn)上述語音命令識(shí)別的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下問題:由于根據(jù)預(yù)先錄入的操控者的語音樣本作為語音命令的識(shí)別依據(jù),聲控設(shè)備的操控人員受到限制,導(dǎo)致語音識(shí)別率低;并且,任何操控者在使用聲控設(shè)備前,必須進(jìn)行大量的標(biāo)準(zhǔn)命令庫的錄入,增加了操作難度,導(dǎo)致使用過程不友好。

      技術(shù)實(shí)現(xiàn)要素:
      本發(fā)明的實(shí)施例提供一種語音命令識(shí)別方法及裝置,可以提高語音識(shí)別率,并使得操作過程更便捷。為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:一種語音命令識(shí)別方法,包括:接收音頻信號(hào);根據(jù)有效語音命令特征對(duì)所述音頻信號(hào)進(jìn)行分解和過濾,得到語音樣本;對(duì)所述語音樣本進(jìn)行語義識(shí)別,確定對(duì)應(yīng)的語音命令。一種語音命令識(shí)別裝置,包括:音頻接收單元,用于接收音頻信號(hào);樣本提取單元,用于根據(jù)有效語音命令特征對(duì)所述音頻信號(hào)進(jìn)行分解和過濾,得到語音樣本;命令識(shí)別單元,用于對(duì)所述語音樣本進(jìn)行語義識(shí)別,確定對(duì)應(yīng)的語音命令。本發(fā)明實(shí)施例提供的語音命令識(shí)別方法及裝置,根據(jù)有效語音命令特征對(duì)接收到的音頻信號(hào)進(jìn)行分解和過濾,再進(jìn)行語義識(shí)別確定語音命令,與現(xiàn)有的將接收到的音頻信號(hào)與已錄入的主人語音樣本進(jìn)行匹配的技術(shù)相比,可以不限制語音命令識(shí)別裝置的使用者,提高對(duì)語音命令的識(shí)別率,并且無需預(yù)先錄入大量語音樣本,使得操作更便捷。附圖說明為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實(shí)施例1的語音命令識(shí)別方法流程圖;圖2為本發(fā)明實(shí)施例2中的一種語音命令識(shí)別方法流程圖;圖3為本發(fā)明實(shí)施例2中的另一種語音命令識(shí)別方法流程圖;圖4為本發(fā)明實(shí)施例3中的一種語音命令識(shí)別裝置組成示意圖;圖5為本發(fā)明實(shí)施例3中的另一種語音命令識(shí)別裝置組成示意圖;圖6為本發(fā)明實(shí)施例3中的另一種語音命令識(shí)別裝置組成示意圖。具體實(shí)施方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。實(shí)施例1本發(fā)明實(shí)施例提供一種語音命令識(shí)別方法,如圖1所示,該方法可以包括:101、接收音頻信號(hào)。其中,音頻信號(hào)的來源并不限定在特定的使用者,可以是成人或兒童、男性或女性等,本發(fā)明提供的語音命令識(shí)別方法可以接收并識(shí)別各種不同音色的人類語言的語音命令。在特殊情況下,例如語音命令識(shí)別裝置并不希望被兒童使用,或視兒童的聲音并不是特定的語音命令,則可以分解和過濾過程中,將不需要的聲音濾除。并且,在實(shí)際操作過程中,可以直接接收音頻信號(hào)進(jìn)行相關(guān)過濾和識(shí)別操作,可以不用預(yù)先錄入使用者的聲音樣本庫,使得語音命令識(shí)別裝置更簡(jiǎn)單易用,提高用戶體驗(yàn)。102、根據(jù)有效語音命令特征對(duì)所述音頻信號(hào)進(jìn)行分解和過濾,得到語音樣本。其中,有效語音命令特征可以根據(jù)實(shí)際應(yīng)用需要設(shè)定,例如,頻率較高而聲音短促的音頻信號(hào)可以視為是兒童的聲音,或者在整個(gè)音頻信號(hào)中持續(xù)存在的低頻聲音可以視為是環(huán)境噪音等,這些都不符合有效語音命令特征,因此可以將不關(guān)心的聲音成分濾除,得到符合要求的有效語音命令。103、對(duì)所述語音樣本進(jìn)行語義識(shí)別,確定對(duì)應(yīng)的語音命令。其中,在步驟102中得到語音樣本后,對(duì)所述語音樣本進(jìn)行語義識(shí)別,確定對(duì)應(yīng)的語音命令的方法具體可以為:將所述語音樣本的聲音特征點(diǎn)與語音命令素材庫中的語音命令對(duì)應(yīng)的聲音特征點(diǎn)進(jìn)行匹配;確定出匹配率最高且達(dá)到規(guī)定匹配率的語音命令。對(duì)所述語音樣本進(jìn)行語義識(shí)別,確定對(duì)應(yīng)的語音命令的方法具體也可以為:將所述語音樣本的聲音特征點(diǎn)與語音命令素材庫中的關(guān)鍵詞特征點(diǎn)進(jìn)行匹配,確定達(dá)到規(guī)定匹配率的關(guān)鍵詞;根據(jù)所述關(guān)鍵詞確定對(duì)應(yīng)的語音命令。本發(fā)明實(shí)施例提供的語音命令識(shí)別方法,根據(jù)有效語音命令特征對(duì)接收到的音頻信號(hào)進(jìn)行分解和過濾,再進(jìn)行語義識(shí)別確定語音命令,與現(xiàn)有的將接收到的音頻信號(hào)與已錄入的主人語音樣本進(jìn)行匹配的技術(shù)相比,可以不限制語音命令識(shí)別裝置的使用者,提高對(duì)語音命令的識(shí)別率,并且無需預(yù)先錄入大量語音樣本,使得操作更便捷。實(shí)施例2本發(fā)明實(shí)施例提供一種語音命令識(shí)別方法,如圖2所示,該方法可以包括:201、接收音頻信號(hào)。202、分析在音頻接收周期中接收的音頻信號(hào),甄別時(shí)域信號(hào)中人類語音的開始點(diǎn),截取有效人類語音的時(shí)域信號(hào)。其中,一個(gè)完整的音頻接收周期時(shí)長(zhǎng)與一個(gè)語音命令的語音時(shí)長(zhǎng)可能不相同,或者在一個(gè)完整的音頻接收周期中可能接收到多個(gè)人類語言,或多個(gè)語音命令。因此,可以分析在音頻接收周期中接收的音頻信號(hào),甄別時(shí)域信號(hào)中人類語音的開始點(diǎn),截取有效人類語音的時(shí)域信號(hào)。203、若在所述音頻接收周期中截取到至少兩個(gè)有效人類語音的時(shí)域信號(hào),則根據(jù)有效語音命令的時(shí)域特征篩選出符合時(shí)域要求的音頻信號(hào)。其中,若在一個(gè)音頻接收周期中截取到不止一個(gè)有效人類語音的時(shí)域信號(hào),即在所述音頻接收周期中接收的音頻信號(hào)中包含至少兩個(gè)時(shí)域信號(hào)??梢愿鶕?jù)有效語音命令的時(shí)域特征篩選出符合時(shí)域要求的時(shí)域信號(hào),作為后續(xù)處理所需的音頻信號(hào)。具體的,若將成人的語音作為有效語音命令,則可以根據(jù)兒童聲音高頻特性和說話時(shí)長(zhǎng)較成人稍短的特點(diǎn),初步篩選成人語音的時(shí)域信號(hào)。204、對(duì)所述音頻信號(hào)進(jìn)行頻域分解,濾除頻率過高和/或頻率過低的波段。其中,經(jīng)過步驟202-203對(duì)音頻信號(hào)的時(shí)域分析和過濾之后,可以進(jìn)一步的對(duì)過濾后的音頻信號(hào)進(jìn)行頻域分析和過濾。具體的,可以將頻率高于第一閾值的聲音作為兒童吵鬧的噪音濾除,也可以將頻率低于第二閾值的聲音作為環(huán)境噪音濾除,或者將頻率過高和過低的聲音均濾除。具體頻率的閾值和濾除的標(biāo)準(zhǔn)可以根據(jù)實(shí)際語音命令識(shí)別裝置的應(yīng)用環(huán)境進(jìn)行設(shè)定,本發(fā)明實(shí)施例對(duì)此不做限定。205、對(duì)經(jīng)過頻域過濾的音頻信號(hào)進(jìn)行獨(dú)立成分分解,濾除雜音,得到語音樣本。其中,通過步驟204的頻域過濾之后得到的音頻信號(hào)中可以包含多個(gè)聲源發(fā)出的聲音,可以進(jìn)一步的將音頻信號(hào)進(jìn)行獨(dú)立成分分解,濾除不符合有效語音命令特征的雜音。例如,雜音可以包括:背景音樂、寵物聲音、兒童聲音等。在本發(fā)明實(shí)施例的一種應(yīng)用場(chǎng)景中,可以將分解和過濾后得到的語音樣本直接匹配并確定語音命令,具體方法可以包括:206、將所述語音樣本的聲音特征點(diǎn)與語音命令素材庫中的語音命令對(duì)應(yīng)的聲音特征點(diǎn)進(jìn)行匹配。其中,預(yù)先配置所述語音命令素材庫,所述語音命令素材庫中可以包含語音命令以及語音命令對(duì)應(yīng)的聲音特征點(diǎn)。將所述語音樣本的聲音特征點(diǎn)與語音命令素材庫中的語音命令對(duì)應(yīng)的聲音特征點(diǎn)進(jìn)行匹配,若語音樣本的聲音特征點(diǎn)與語音命令素材庫中的語音命令對(duì)應(yīng)的聲音特征點(diǎn)的匹配率達(dá)到規(guī)定匹配率,例如75%,則可以確定出對(duì)應(yīng)的語音命令。若語音樣本的聲音特征點(diǎn)與語音命令素材庫中的語音命令對(duì)應(yīng)的聲音特征點(diǎn)的匹配率低于所述規(guī)定匹配率,則可以視為無效的語音樣本,退出語音命令識(shí)別流程,或提示用戶重新輸入??梢岳斫獾氖?,所述規(guī)定匹配率的具體數(shù)值可以根據(jù)實(shí)際應(yīng)用中對(duì)語音命令識(shí)別所需敏感度而調(diào)節(jié),本發(fā)明實(shí)施例對(duì)此不做限定。207、確定出匹配率最高且達(dá)到規(guī)定匹配率的語音命令。其中,若滿足規(guī)定匹配率的語音樣本有且僅有一個(gè),則可以直接確定對(duì)應(yīng)的語音命令;若滿足規(guī)定匹配率的語音樣本有至少兩個(gè),則可以選擇匹配率最高的語音樣本,并確定與該匹配率最高且達(dá)到規(guī)定匹配率的語音樣本對(duì)應(yīng)的語音命令。另外,也可以將達(dá)到規(guī)定匹配率的語音命令顯示,以便用戶選擇所需語音命令或重新輸入。具體的,若滿足規(guī)定匹配率的語音樣本有至少兩個(gè),可以確定出至少兩個(gè)對(duì)應(yīng)的語音命令,并將所述多個(gè)對(duì)應(yīng)的語音命令呈現(xiàn),以便用戶選擇所需語音命令對(duì)應(yīng)的操作,或者選擇重新輸入語音命令。208、執(zhí)行所述語音命令對(duì)應(yīng)的操作。其中,語音命令對(duì)應(yīng)的操作可以根據(jù)實(shí)際控制的設(shè)備具體設(shè)定,例如,“下一頁”對(duì)應(yīng)的操作可以為PPT或電子書的翻頁;“開始”、“暫?!薄ⅰ巴顺觥钡日Z音命令可以對(duì)應(yīng)于應(yīng)用程序的相關(guān)控制操作。在本發(fā)明實(shí)施例的另一種應(yīng)用場(chǎng)景中,可以將分解和過濾后得到的語音樣本中匹配得到對(duì)應(yīng)的關(guān)鍵詞,從而確定出對(duì)應(yīng)的語音命令。具體方法如圖3所示,以上步驟206和207也可以替換為以下步驟:209、將所述語音樣本的聲音特征點(diǎn)與語音命令素材庫中的關(guān)鍵詞特征點(diǎn)進(jìn)行匹配,確定達(dá)到規(guī)定匹配率的關(guān)鍵詞。其中,預(yù)先配置所述語音命令素材庫,所述語音命令素材庫中可以包括語音命令、語音命令對(duì)應(yīng)的關(guān)鍵詞以及關(guān)鍵詞特征點(diǎn)。將語音樣本的聲音特征點(diǎn)與語音命令素材庫中的關(guān)鍵詞特征點(diǎn)進(jìn)行匹配,若語音樣本的聲音特征點(diǎn)與語音命令素材庫中的關(guān)鍵詞特征點(diǎn)的匹配率達(dá)到規(guī)定匹配率,例如75%,則可以確定出對(duì)應(yīng)的關(guān)鍵詞。若沒有一個(gè)語音樣本的聲音特征點(diǎn)與語音命令素材庫中的關(guān)鍵詞特征點(diǎn)的匹配率達(dá)到所述規(guī)定匹配率,則可以視為無效的語音樣本,退出語音命令識(shí)別流程,或提示用戶重新輸入??梢岳斫獾氖牵鲆?guī)定匹配率的具體數(shù)值可以根據(jù)實(shí)際應(yīng)用中對(duì)語音命令識(shí)別所需敏感度而調(diào)節(jié),本發(fā)明實(shí)施例對(duì)此不做限定。210、根據(jù)所述關(guān)鍵詞確定對(duì)應(yīng)的語音命令。其中,若匹配得到一個(gè)符合規(guī)定匹配率要求的關(guān)鍵詞,則可以根據(jù)該匹配成功的關(guān)鍵詞確定語音命令。若匹配得到多個(gè)符合規(guī)定匹配率要求的關(guān)鍵詞,也可以根據(jù)匹配成功的關(guān)鍵詞綜合確定對(duì)應(yīng)的語音命令。另外,也可以將達(dá)與所述關(guān)鍵詞相關(guān)的語音命令顯示,以便用戶選擇所需語音命令或重新輸入。具體的,可以根據(jù)關(guān)鍵詞確定出多個(gè)對(duì)應(yīng)的語音命令,并將所述多個(gè)對(duì)應(yīng)的語音命令呈現(xiàn),以便用戶選擇所需語音命令對(duì)應(yīng)的操作,或者選擇重新輸入語音命令。本發(fā)明實(shí)施例提供的語音命令識(shí)別方法,根據(jù)有效語音命令特征對(duì)接收到的音頻信號(hào)進(jìn)行分解和過濾,再進(jìn)行語義識(shí)別確定語音命令,與現(xiàn)有的將接收到的音頻信號(hào)與已錄入的主人語音樣本進(jìn)行匹配的技術(shù)相比,可以不限制語音命令識(shí)別裝置的使用者,提高對(duì)語音命令的識(shí)別率,并且無需預(yù)先錄入大量語音樣本,使得操作更便捷。實(shí)施例3本發(fā)明實(shí)施例提供一種語音命令識(shí)別裝置,如圖4所示,該裝置可以包括:音頻接收單元31、樣本提取單元32、命令識(shí)別單元33。音頻接收單元31,用于接收音頻信號(hào)。樣本提取單元32,用于根據(jù)有效語音命令特征對(duì)所述音頻信號(hào)進(jìn)行分解和過濾,得到語音樣本。命令識(shí)別單元33,用于對(duì)所述語音樣本進(jìn)行語義識(shí)別,確定對(duì)應(yīng)的語音命令。進(jìn)一步的,如圖5所示,該語音命令識(shí)別裝置還可以包括:時(shí)域截取單元34。時(shí)域截取單元34,用于在所述音頻接收單元31接收到音頻信號(hào)之后,分析在接收周期中接收的音頻信號(hào),甄別時(shí)域信號(hào)中人類語音的開始點(diǎn),截取有效人類語音的時(shí)域信號(hào)。對(duì)應(yīng)的,所述樣本提取單元32還可以用于:根據(jù)有效語音命令特征對(duì)所述有效人類語音的時(shí)域信號(hào)進(jìn)行分解和過濾,得到語音樣本。進(jìn)一步的,該語音命令識(shí)別裝置還可以包括:時(shí)域篩選單元35。時(shí)域篩選單元35,用于在所述時(shí)域截取單元34截取有效人類語音的時(shí)域信號(hào)之后,在一次音頻接收周期中截取到至少兩個(gè)有效人類語音的時(shí)域信號(hào)時(shí),根據(jù)有效語音命令的時(shí)域特征篩選出符合時(shí)域要求的音頻信號(hào)。進(jìn)一步的,所述時(shí)域篩選單元35具體還用于:根據(jù)兒童聲音高頻特性和說話時(shí)長(zhǎng)較成人稍短的特點(diǎn),初步篩選成人語音的時(shí)域信號(hào)。進(jìn)一步的,所述樣本提取單元32可以包括:第一過濾模塊321、第二過濾模塊322。第一過濾模塊321,用于對(duì)所述音頻信號(hào)進(jìn)行頻域分解,濾除頻率過高和/或頻率過低的波段。第二過濾模塊322,用于對(duì)經(jīng)過頻域過濾的音頻信號(hào)進(jìn)行獨(dú)立成分分解,濾除雜音,得到語音樣本。其中,所述雜音包括:背景音樂、寵物聲音、兒童聲音。在本發(fā)明實(shí)施例的一種應(yīng)用場(chǎng)景中,所述命令識(shí)別單元33可以包括:第一匹配模塊331、第一確定模塊332。第一匹配模塊331,用于將所述語音樣本的聲音特征點(diǎn)與語音命令素材庫中的語音命令對(duì)應(yīng)的聲音特征點(diǎn)進(jìn)行匹配。第一確定模塊332,用于確定出匹配率最高且達(dá)到規(guī)定匹配率的語音命令,或者將達(dá)到規(guī)定匹配率的語音命令顯示,以便用戶選擇所需語音命令或重新輸入。如圖6所示,在本發(fā)明實(shí)施例的另一種應(yīng)用場(chǎng)景中,所述命令識(shí)別單元33可以包括:第二匹配模塊333、第二確定模塊334。第二匹配模塊333,用于將所述語音樣本的聲音特征點(diǎn)與語音命令素材庫中的關(guān)鍵詞特征點(diǎn)進(jìn)行匹配,確定達(dá)到規(guī)定匹配率的關(guān)鍵詞。第二確定模塊334,用于根據(jù)所述關(guān)鍵詞確定對(duì)應(yīng)的語音命令,或者將與所述關(guān)鍵詞相關(guān)的語音命令顯示,以便用戶選擇所需語音命令或重新輸入。進(jìn)一步的,該語音命令識(shí)別裝置還可以包括:執(zhí)行單元36執(zhí)行單元36,用于在所述命令識(shí)別單元33確定出對(duì)應(yīng)的語音命令之后,執(zhí)行所述語音命令對(duì)應(yīng)的操作。本發(fā)明實(shí)施例提供的語音命令識(shí)別裝置,根據(jù)有效語音命令特征對(duì)接收到的音頻信號(hào)進(jìn)行分解和過濾,再進(jìn)行語義識(shí)別確定語音命令,與現(xiàn)有的將接收到的音頻信號(hào)與已錄入的主人語音樣本進(jìn)行匹配的技術(shù)相比,可以不限制語音命令識(shí)別裝置的使用者,提高對(duì)語音命令的識(shí)別率,并且無需預(yù)先錄入大量語音樣本,使得操作更便捷。通過以上的實(shí)施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在可讀取的存儲(chǔ)介質(zhì)中,如計(jì)算機(jī)的軟盤,硬盤或光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。
      當(dāng)前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1