本發(fā)明涉及智能控制技術(shù)領(lǐng)域,尤其涉及一種語音控制方法及裝置。
背景技術(shù):
隨著技術(shù)的發(fā)展,利用miracast技術(shù),使用者不再需要尋找各種規(guī)格的線材與轉(zhuǎn)換器,亦毋須確認(rèn)用于連接設(shè)備的正確接頭,就能將傳送端設(shè)備(智能手機(jī)、平板電腦、筆記本電腦、臺(tái)式機(jī)等)的畫面內(nèi)容分享給其他接收端設(shè)備(電視機(jī)、投影儀等)。在將傳送端設(shè)備的畫面內(nèi)容分享給接收端設(shè)備時(shí),通過miracast協(xié)議的uibc(userinputbackchannel,用戶輸入反向信道)功能,接收端設(shè)備可以實(shí)現(xiàn)對(duì)傳送端設(shè)備分享的畫面內(nèi)容進(jìn)行控制,其中,uibc定義如何將接收端設(shè)備的控制信號(hào)回送到傳送端設(shè)備,且uibc定義的接收端設(shè)備信號(hào)的控制信號(hào)有兩種,一種是通用鼠標(biāo)、鍵盤信號(hào),另一種是外設(shè)信號(hào),外設(shè)信號(hào)由usb、wifi、藍(lán)牙等傳入。當(dāng)接收端設(shè)備對(duì)傳送端設(shè)備分享的畫面內(nèi)容進(jìn)行控制時(shí),接收端設(shè)備首先需要生成這些控制信號(hào),然后將它們傳送給傳送端設(shè)備,才能實(shí)現(xiàn)對(duì)傳送端設(shè)備的控制。然而上述控制信號(hào)都需要直接操作接收端設(shè)備或外設(shè)來生成,當(dāng)不方便直接操作接收端設(shè)備或外設(shè)時(shí),接收端設(shè)備就無法生成控制信號(hào),也就無法將控制信號(hào)傳送到傳送端設(shè)備并實(shí)現(xiàn)對(duì)傳送端設(shè)備的控制。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的主要目的在于提供一種語音控制方法及裝置,旨在解決當(dāng)不方便直接操作接收端設(shè)備或外設(shè)時(shí),而無法實(shí)現(xiàn)對(duì)傳送端設(shè)備的控制的問題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種語音控制方法,所述語音控制方法包括以下步驟:
接收端設(shè)備獲取用于控制傳送端設(shè)備的語音控制信號(hào);
接收端設(shè)備將獲取的所述語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配;
若匹配成功,則接收端設(shè)備根據(jù)uibc協(xié)議基于匹配成功的所述預(yù)設(shè)語音指令生成uibc報(bào)文,并將所述uibc報(bào)文傳送至傳送端設(shè)備,以供傳送端設(shè) 備根據(jù)接收到的所述uibc報(bào)文控制自身的行為。
可選地,所述預(yù)設(shè)語音指令的存儲(chǔ)形式為語音波形,所述接收端設(shè)備將獲取的所述語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配的步驟包括:
接收端設(shè)備將獲取的所述語音控制信號(hào)及所述預(yù)設(shè)語音指令進(jìn)行相應(yīng)變換,以得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖或特征向量;
接收端設(shè)備將所述語音控制信號(hào)的聲譜圖或特征向量與所述預(yù)設(shè)語音指令的聲譜圖或特征向量進(jìn)行匹配。
可選地,所述預(yù)設(shè)語音指令的存儲(chǔ)形式為聲譜圖或特征向量,所述接收端設(shè)備將獲取的所述語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配的步驟包括:
接收端設(shè)備將獲取的所述語音控制信號(hào)進(jìn)行相應(yīng)變換,以得到所述語音控制信號(hào)的聲譜圖或特征向量;
接收端設(shè)備將所述語音控制信號(hào)的聲譜圖或特征向量與所述預(yù)設(shè)語音指令進(jìn)行匹配。
可選地,所述接收端設(shè)備根據(jù)uibc協(xié)議基于匹配成功的所述預(yù)設(shè)語音指令生成uibc報(bào)文的步驟包括:
接收端設(shè)備獲取所述預(yù)設(shè)語音指令與所述uibc報(bào)文中控制信號(hào)段的映射關(guān)系;
接收端設(shè)備根據(jù)所述映射關(guān)系確定匹配成功的所述預(yù)設(shè)語音指令對(duì)應(yīng)的控制信號(hào)段;
接收端設(shè)備根據(jù)uibc協(xié)議將所述預(yù)設(shè)語音指令對(duì)應(yīng)的控制信號(hào)段生成uibc報(bào)文。
可選地,所述接收端設(shè)備將獲取的所述語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配的步驟之后,所述語音控制方法還包括:
若匹配失敗,則接收端設(shè)備提示用戶重新發(fā)出語音控制信號(hào)。
此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種語音控制裝置,所述語音控制裝置包括:
獲取模塊,用于獲取用于控制傳送端設(shè)備的語音控制信號(hào);
匹配模塊,用于將獲取的所述語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配;
生成模塊,用于若匹配成功,則根據(jù)uibc協(xié)議基于匹配成功的所述預(yù)設(shè) 語音指令生成uibc報(bào)文,并將所述uibc報(bào)文傳送至傳送端設(shè)備,以供傳送端設(shè)備根據(jù)接收到的所述uibc報(bào)文控制自身的行為。
可選地,所述預(yù)設(shè)語音指令的存儲(chǔ)形式為語音波形,所述匹配模塊包括:
處理單元,用于將獲取的所述語音控制信號(hào)及所述預(yù)設(shè)語音指令進(jìn)行相應(yīng)變換,以得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖或特征向量;
匹配單元,用于將所述語音控制信號(hào)的聲譜圖或特征向量與所述預(yù)設(shè)語音指令的聲譜圖或特征向量進(jìn)行匹配。
可選地,所述預(yù)設(shè)語音指令的存儲(chǔ)形式為聲譜圖或特征向量,所述處理單元,還用于將獲取的所述語音控制信號(hào)進(jìn)行相應(yīng)變換,以得到所述語音控制信號(hào)的聲譜圖或特征向量;
所述匹配單元,還用于將所述語音控制信號(hào)的聲譜圖或特征向量與所述預(yù)設(shè)語音指令進(jìn)行匹配。
可選地,所述生成模塊包括:
獲取單元,用于獲取所述預(yù)設(shè)語音指令與所述uibc報(bào)文中控制信號(hào)段的映射關(guān)系;
確定單元,用于根據(jù)所述映射關(guān)系確定匹配成功的所述預(yù)設(shè)語音指令對(duì)應(yīng)的控制信號(hào)段;
生成單元,用于根據(jù)uibc協(xié)議將所述預(yù)設(shè)語音指令對(duì)應(yīng)的控制信號(hào)段生成uibc報(bào)文。
可選地,所述語音控制裝置還包括:
提示模塊,用于若匹配失敗,則提示重新發(fā)出語音控制信號(hào)。
本發(fā)明例通過在用戶不方便操作接收端設(shè)備或與接收端設(shè)備連接的外設(shè)設(shè)備時(shí),發(fā)出語音控制信號(hào),接收端設(shè)備在接收到用戶發(fā)出的語音控制信號(hào)后,將該語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配,從而確定該語音控制信號(hào)對(duì)應(yīng)的預(yù)設(shè)語音指令,接收端設(shè)備在確定語音控制信號(hào)對(duì)應(yīng)的預(yù)設(shè)語音指令后,將所述預(yù)設(shè)語音指令生成uibc報(bào)文,并將所述uibc報(bào)文傳送至傳送端設(shè)備,從而實(shí)現(xiàn)對(duì)傳送端設(shè)備的控制,解決了當(dāng)不方便直接操作接收端設(shè)備或外設(shè)時(shí),而無法實(shí)現(xiàn)對(duì)傳送端設(shè)備的控制的問題,使得接收端設(shè)備對(duì)傳送端設(shè)備的控制更加方便。
附圖說明
圖1為本發(fā)明語音控制方法的第一實(shí)施例的流程示意圖;
圖2為圖1中將獲取的語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配的步驟細(xì)化流程示意圖;
圖3為圖1中將獲取的語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配的另一實(shí)施例的步驟流程示意圖;
圖4為圖1中根據(jù)uibc協(xié)議將匹配成功的預(yù)設(shè)語音指令生成uibc報(bào)文的步驟細(xì)化流程示意圖;
圖5為本發(fā)明語音控制裝置的第一實(shí)施例的功能模塊示意圖;
圖6為圖5中匹配模塊的細(xì)化功能模塊示意圖;
圖7為圖5中生成模塊的細(xì)化功能模塊示意圖。
本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說明。
具體實(shí)施方式
應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
基于上述問題,本發(fā)明提供一種語音控制方法。
本發(fā)明的應(yīng)用場(chǎng)景為用戶能把通過miracast認(rèn)證的手機(jī)、平板電腦或筆記本等接收端設(shè)備的顯示屏的內(nèi)容以無線方式投射到支持miracast技術(shù)的接收端設(shè)備上,用戶在接收端設(shè)備上看到的內(nèi)容與傳送端設(shè)備上的內(nèi)容將會(huì)是一模一樣的。本發(fā)明中接收端設(shè)備及傳送端設(shè)備都具有uibc功能。所述uibc功能指的是用戶可以通過接收端設(shè)備實(shí)現(xiàn)對(duì)傳送端設(shè)備的控制。該功能包括兩種類型,一種是硬件無關(guān)型,如鼠標(biāo)點(diǎn)擊、按鍵點(diǎn)擊、touch點(diǎn)擊、放大縮小等,另一種是hidc人機(jī)接口設(shè)備控制:包括紅外線、usb、藍(lán)牙、wifi、游戲桿、遙控器等。
參照?qǐng)D1,圖1為本發(fā)明語音控制方法的第一實(shí)施例的流程示意圖。
在本實(shí)施例中,所述語音控制方法包括:
步驟s10,接收端設(shè)備獲取用于控制傳送端設(shè)備的語音控制信號(hào);
本實(shí)施例中的接收端設(shè)備以支持miracast技術(shù)且具有uibc功能的無線投影系統(tǒng)為例進(jìn)行說明,所述無線投影系統(tǒng)同現(xiàn)有的無線投影系統(tǒng)相比增設(shè)了語音輸入模塊。具體實(shí)施中也可以根據(jù)本發(fā)明核心思想將本發(fā)明應(yīng)用到其他的支持miracast技術(shù)且具有uibc功能的接收端設(shè)備中。
無線投影系統(tǒng)在播放接收端設(shè)備的屏幕內(nèi)容時(shí),所述接收端設(shè)備以通過miracast認(rèn)證且具有uibc功能的筆記本為例,比如,筆記本當(dāng)前屏幕顯示的內(nèi)容為一個(gè)ppt文檔,則所述無線投影系統(tǒng)的屏幕顯示的內(nèi)容也為該ppt文檔,若用戶需要觀看下一頁ppt文檔,需要進(jìn)行翻頁操作,則用戶可以對(duì)著所述無線投影系統(tǒng)發(fā)出翻頁的語音控制信號(hào)。又如,筆記本當(dāng)前屏幕顯示的內(nèi)容為一個(gè)電影,則所述無線投影系統(tǒng)的屏幕顯示的內(nèi)容也為該電影,此時(shí),用戶需要對(duì)當(dāng)前播放的電影內(nèi)容進(jìn)行暫停,需要進(jìn)行暫停操作,則用戶可以對(duì)著所述無線投影系統(tǒng)發(fā)出暫停的語音控制信號(hào)。所述無線投影系統(tǒng)在獲取用于控制筆記本的語音控制信號(hào)時(shí),具體的,可以通過麥克風(fēng)或者其他語音接收裝置接收用戶或其他語音播放設(shè)備發(fā)出的語音控制信號(hào),然后將接收到的語音控制信號(hào)輸入至所述無線投影系統(tǒng)的語音輸入模塊,或者直接通過所述語音輸入模塊接收用戶或其他語音播放設(shè)備發(fā)出的語音控制信號(hào),以供所述語音輸入模塊對(duì)所述語音控制信號(hào)進(jìn)行相應(yīng)的處理,例如,濾波處理,匹配處理等。
步驟s20,接收端設(shè)備將獲取的所述語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配;
在本實(shí)施例中,所述無線投影系統(tǒng)預(yù)先存有所述預(yù)設(shè)語音指令,所述預(yù)設(shè)語音指令包括諸如“上滑”、“翻頁”、“暫?!钡日Z音指令,在獲取到用戶發(fā)出的語音控制信號(hào)后,將獲取的所述語音控制信號(hào)與所述預(yù)設(shè)語音指令一一進(jìn)行匹配,直到所述語音控制信號(hào)與所述預(yù)設(shè)語音指令中的某個(gè)指令匹配成功為止,或者直到所述語音控制信號(hào)與所述預(yù)設(shè)語音指令中的所有指令進(jìn)行匹配失敗為止。具體的,所述語音控制信號(hào)在與所述預(yù)設(shè)語音指令進(jìn)行匹配時(shí),按照各個(gè)預(yù)設(shè)語音指令的存儲(chǔ)順序依次與所述語音控制信號(hào)進(jìn)行匹配。例如,用戶發(fā)出的語音控制信號(hào)為“翻頁”信號(hào),無線投影系統(tǒng)中存儲(chǔ)的預(yù)設(shè)語音指令有“上滑”、“翻頁”、“暫停”語音指令,且各個(gè)所述預(yù)設(shè)語音指 令的存儲(chǔ)順序依次為“上滑”、“翻頁”、“暫停”語音指令,則在將所述“翻頁”信號(hào)與所述預(yù)設(shè)語音指令進(jìn)行匹配時(shí),首先將所述“翻頁”信號(hào)與“上滑”語音指令進(jìn)行匹配,若匹配失敗,則繼續(xù)將所述“翻頁”信號(hào)與“翻頁”語音指令進(jìn)行匹配,若匹配成功,則確定所述語音控制信號(hào)為所述“翻頁”語音指令,若匹配失敗,則繼續(xù)與所述預(yù)設(shè)語音指令的其他語音指令進(jìn)行匹配,直到匹配成功為止或者直到所述預(yù)設(shè)語音指令都匹配失敗為止。
步驟s30,若匹配成功,則接收端設(shè)備根據(jù)uibc協(xié)議基于匹配成功的所述預(yù)設(shè)語音指令生成uibc報(bào)文,并將所述uibc報(bào)文傳送至傳送端設(shè)備,以供傳送端設(shè)備根據(jù)接收到的所述uibc報(bào)文控制自身的行為。
在將所述語音控制信號(hào)與預(yù)設(shè)的語音指令匹配成功時(shí),根據(jù)uibc協(xié)議將匹配成功的所述預(yù)設(shè)語音指令生成uibc報(bào)文。所述uibc協(xié)議又也稱為wifi-display協(xié)議,該協(xié)議定義了各種控制指令對(duì)應(yīng)的uibc報(bào)文的格式。由于所述uibc協(xié)議只定義了通用輸入的信息和人機(jī)接口設(shè)備類(hidc)的信息對(duì)應(yīng)的uibc報(bào)文的格式,而所述通用輸入的信息和人機(jī)接口設(shè)備類(hidc)的信息都不包括語音信號(hào)輸入的信息,故在將所述預(yù)設(shè)語音指令生成uibc報(bào)文時(shí),首先應(yīng)將所述預(yù)設(shè)語音指令轉(zhuǎn)換為通用輸入的信息或者人機(jī)接口設(shè)備類的信息,然后根據(jù)所述通用輸入的信息或人機(jī)接口設(shè)備類(hidc)的信息對(duì)應(yīng)的參數(shù)生成uibc報(bào)文,并將所述uibc報(bào)文傳送至傳送端設(shè)備,傳送端設(shè)備在接收到所述uibc報(bào)文后,根據(jù)所述uibc報(bào)文中的內(nèi)容控制自身的行為,例如所述報(bào)文中的內(nèi)容為對(duì)所述傳送端設(shè)備當(dāng)前播放的視頻進(jìn)行暫停處理,則所述傳送端設(shè)備在接收到該報(bào)文后立即對(duì)當(dāng)前播放的視頻進(jìn)行暫停播放。在將所述語音控制信號(hào)與預(yù)設(shè)的語音指令匹配失敗時(shí),則提示重新發(fā)出語音控制信號(hào),用戶在收到該提示后,可知道發(fā)出的語音控制信號(hào)控制發(fā)送端的行為失敗,然后可以重新發(fā)出語音控制信號(hào),或重新使用語音播放設(shè)備發(fā)出語音控制信號(hào),所述語音播放設(shè)備中預(yù)先錄有所述語音控制信號(hào)。
本實(shí)施例通過在用戶不方便操作接收端設(shè)備或與接收端設(shè)備連接的外設(shè)設(shè)備時(shí),發(fā)出語音控制信號(hào),接收端設(shè)備在接收到用戶發(fā)出的語音控制信號(hào)后,將該語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配,從而確定該語音控制信號(hào)對(duì)應(yīng)的預(yù)設(shè)語音指令,接收端設(shè)備在確定語音控制信號(hào)對(duì)應(yīng)的預(yù)設(shè)語音指令后,將所述預(yù)設(shè)語音指令生成uibc報(bào)文,并將所述uibc報(bào)文傳送至傳送端 設(shè)備,從而實(shí)現(xiàn)對(duì)傳送端設(shè)備的控制,解決了當(dāng)不方便直接操作接收端設(shè)備或外設(shè)時(shí),而無法實(shí)現(xiàn)對(duì)傳送端設(shè)備的控制的問題,使得接收端設(shè)備對(duì)傳送端設(shè)備的控制更加方便。
進(jìn)一步地,基于第一實(shí)施例提出本發(fā)明語音控制方法的第二實(shí)施例,參照?qǐng)D2,在所述預(yù)設(shè)語音指令的存儲(chǔ)形式為語音波形時(shí),所述步驟s20包括:
步驟s21,接收端設(shè)備將獲取的所述語音控制信號(hào)及所述預(yù)設(shè)語音指令進(jìn)行相應(yīng)變換,以得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖或特征向量;
步驟s22,接收端設(shè)備將所述語音控制信號(hào)的聲譜圖或特征向量與所述預(yù)設(shè)語音指令的聲譜圖或特征向量進(jìn)行匹配。
當(dāng)所述預(yù)設(shè)語音指令的存儲(chǔ)形式為語音波形時(shí),由于不同的語音波形對(duì)應(yīng)的語音指令可能相同,而不同的用戶發(fā)出的相同的語音指令所對(duì)應(yīng)的語音波形的差別可能很大,故直接通過將用戶發(fā)出的語音控制信號(hào)所對(duì)應(yīng)的語音波形與預(yù)設(shè)語音指令對(duì)應(yīng)的語音波形進(jìn)行匹配時(shí),很難匹配成功,需要對(duì)所述預(yù)設(shè)語音指令及所述語音控制信號(hào)進(jìn)行相應(yīng)的處理。具體的,可以對(duì)獲取的所述語音控制信號(hào)及所述預(yù)設(shè)語音指令進(jìn)行相應(yīng)變換,以得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖或特征向量。當(dāng)需要得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖時(shí),所述相應(yīng)變換主要包括預(yù)加重處理、分幀處理、加窗處理、快速傅里葉變換處理及灰度級(jí)映射處理,經(jīng)過上述處理過程后,得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖。當(dāng)需要得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的特征向量時(shí),所述特征向量以所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的mfcc(melfrequencycepstrumcoefficient,梅爾頻率倒譜系數(shù))為例,所述相應(yīng)變換主要包括預(yù)加重處理、分幀處理、加窗處理、快速傅里葉變換處理、三角帶通濾波器進(jìn)行濾波處理、計(jì)算每個(gè)濾波器組輸出的對(duì)數(shù)能量、經(jīng)離散余弦變換(dct)得到mfcc系數(shù)、譜加權(quán)處理、cms(cepstrummeansubtraction,倒譜均值減)處理及動(dòng)態(tài)差分參數(shù)的提取(包括一階差分和二階差分)。在獲得所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖或者特征向量后,將所述語音控制信號(hào)的聲譜圖或者特征向量依次與所述預(yù)設(shè)語音指令的聲譜圖或者特征向量進(jìn)行匹配,直 到匹配成功為止或者與所有的預(yù)設(shè)語音指令都匹配失敗為止。
本實(shí)施例通過將語音控制信號(hào)及所述預(yù)設(shè)語音指令變換為相應(yīng)的聲譜圖或者特征向量,然后將得到的聲譜圖或者特征向量進(jìn)行匹配,從而提高了語音識(shí)別的準(zhǔn)確性。
進(jìn)一步地,基于第一實(shí)施例提出本發(fā)明語音控制方法的第三實(shí)施例,參照?qǐng)D3,在所述預(yù)設(shè)語音指令的存儲(chǔ)形式為聲譜圖或特征向量時(shí),所述步驟s20包括:
步驟s23,接收端設(shè)備將獲取的所述語音控制信號(hào)進(jìn)行相應(yīng)變換,以得到所述語音控制信號(hào)的聲譜圖或特征向量;
步驟s24,接收端設(shè)備將所述語音控制信號(hào)的聲譜圖或特征向量與所述預(yù)設(shè)語音指令進(jìn)行匹配。
當(dāng)所述預(yù)設(shè)語音指令的存儲(chǔ)形式為聲譜圖或特征向量時(shí),由于語音信號(hào)的聲譜圖或者特征向量能夠直接表征語音指令的特性,故在將獲取的所述語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配時(shí),只需要將獲取的所述語音控制信號(hào)進(jìn)行相應(yīng)的變換,從而得到所述語音控制信號(hào)的聲譜圖或特征向量,具體的變換過程在上述實(shí)施例中已描述,此處不再贅述。當(dāng)獲取到所述語音控制信號(hào)的聲譜圖或者特征向量時(shí),將所述聲譜圖或者特征向量與各個(gè)所述語音指令依次進(jìn)行匹配,直到匹配成功為止或者與所有的預(yù)設(shè)語音指令都匹配失敗為止。
本實(shí)施例通過將語音控制信號(hào)及所述預(yù)設(shè)語音指令變換為相應(yīng)的聲譜圖或者特征向量,然后將得到的聲譜圖或者特征向量進(jìn)行匹配,從而提高了語音識(shí)別的準(zhǔn)確性。
進(jìn)一步地,基于上述任一實(shí)施例提出本發(fā)明語音控制方法的第四實(shí)施例,參照?qǐng)D4,所述根據(jù)uibc協(xié)議將匹配成功的所述預(yù)設(shè)語音指令生成uibc報(bào)文的步驟包括:
步驟s31,接收端設(shè)備獲取所述預(yù)設(shè)語音指令與所述uibc報(bào)文中控制信號(hào)段的映射關(guān)系;
步驟s32,接收端設(shè)備根據(jù)所述映射關(guān)系確定匹配成功的所述預(yù)設(shè)語音指 令對(duì)應(yīng)的控制信號(hào)段;
步驟s33,接收端設(shè)備根據(jù)uibc協(xié)議將所述預(yù)設(shè)語音指令對(duì)應(yīng)的控制信號(hào)段生成uibc報(bào)文。
在本實(shí)施例中,所述預(yù)設(shè)語音指令與所述uibc報(bào)文中控制信號(hào)段存在一個(gè)映射表,即不同的預(yù)設(shè)語音指令對(duì)應(yīng)不同的控制信號(hào)段。所述控制信號(hào)段為控制傳送端設(shè)備行為對(duì)應(yīng)的數(shù)據(jù)段。所述映射關(guān)系可以為所述預(yù)設(shè)語音指令與通用輸入的信息的映射關(guān)系,或者所述預(yù)設(shè)語音指令與人機(jī)接口設(shè)備類(hidc)的信息的對(duì)應(yīng)關(guān)系,即將所述語音控制指令轉(zhuǎn)換為相應(yīng)的通用輸入控制信號(hào)或者人機(jī)接口設(shè)備類(hidc)控制信號(hào),然后根據(jù)uibc協(xié)議將所述通用輸入的信息或者人機(jī)接口設(shè)備類(hidc)的信息生成uibc報(bào)文,進(jìn)一步地,可以在所述uibc協(xié)議中定義所述預(yù)設(shè)控制指令的控制信號(hào)段內(nèi)容,在將所述預(yù)設(shè)語音指令生成uibc報(bào)文時(shí),則在將預(yù)設(shè)的語音指令生成uibc報(bào)文時(shí)即可直接根據(jù)所述uibc協(xié)議生成對(duì)應(yīng)的uibc報(bào)文。
本實(shí)施例通過將所述預(yù)設(shè)語音指令轉(zhuǎn)換為uibc協(xié)議中定義的指令,從而使得所述預(yù)設(shè)語音指令能控制所述傳送端設(shè)備的行為,增加了uibc功能的反饋形式。
本發(fā)明進(jìn)一步提供一種裝置語音控制裝置。
參照?qǐng)D5,圖5為本發(fā)明語音控制裝置的第一實(shí)施例的功能模塊示意圖。
在本實(shí)施例中,所述語音控制裝置包括:獲取模塊10、匹配模塊20、生成模塊30及提示模塊40。
所述獲取模塊10,用于獲取用于控制傳送端設(shè)備的語音控制信號(hào);
本實(shí)施例中的接收端設(shè)備以支持miracast技術(shù)且具有uibc功能的無線投影系統(tǒng)為例進(jìn)行說明,所述無線投影系統(tǒng)同現(xiàn)有的無線投影系統(tǒng)相比增設(shè)了語音輸入模塊。具體實(shí)施中也可以根據(jù)本發(fā)明核心思想將本發(fā)明應(yīng)用到其他的支持miracast技術(shù)且具有uibc功能的接收端設(shè)備中。
無線投影系統(tǒng)在播放接收端設(shè)備的屏幕內(nèi)容時(shí),所述接收端設(shè)備以通過miracast認(rèn)證且具有uibc功能的筆記本為例,比如,筆記本當(dāng)前屏幕顯示的內(nèi)容為一個(gè)ppt文檔,則所述無線投影系統(tǒng)的屏幕顯示的內(nèi)容也為該ppt文檔,此時(shí),用戶需要觀看下一頁ppt文檔,需要進(jìn)行翻頁操作,則用戶可以 對(duì)著所述無線投影系統(tǒng)發(fā)出翻頁的語音控制信號(hào)。又如,筆記本當(dāng)前屏幕顯示的內(nèi)容為一個(gè)電影,則所述無線投影系統(tǒng)的屏幕顯示的內(nèi)容也為該電影,此時(shí),用戶需要對(duì)當(dāng)前播放的電影內(nèi)容進(jìn)行暫停,需要進(jìn)行暫停操作,則用戶可以對(duì)著所述無線投影系統(tǒng)發(fā)出暫停的語音控制信號(hào)。所述無線投影系統(tǒng)在獲取用于控制筆記本語音控制信號(hào)時(shí),具體的,可以通過麥克風(fēng)或者其他語音接收裝置接收用戶或其他語音播放設(shè)備發(fā)出的語音控制信號(hào),然后將接收到的語音控制信號(hào)輸入至所述無線投影系統(tǒng)的語音輸入模塊,或者直接通過所述語音輸入模塊接收用戶或其他語音播放設(shè)備發(fā)出的語音控制信號(hào),以供所述語音輸入模塊對(duì)所述語音控制信號(hào)進(jìn)行相應(yīng)的處理,例如,濾波處理,匹配處理等。
所述匹配模塊20,用于將獲取的所述語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配;
在本實(shí)施例中,所述無線投影系統(tǒng)預(yù)先存有所述預(yù)設(shè)語音指令,所述預(yù)設(shè)語音指令包括諸如“上滑”、“翻頁”、“暫?!钡日Z音指令,在獲取到用戶發(fā)出的語音控制信號(hào)后,將獲取的所述語音控制信號(hào)與所述預(yù)設(shè)語音指令一一進(jìn)行匹配,直到所述語音控制信號(hào)與所述預(yù)設(shè)語音指令中的某個(gè)指令匹配成功為止,或者直到所述語音控制信號(hào)與所述預(yù)設(shè)語音指令中的所有指令進(jìn)行匹配失敗為止。具體的,所述語音控制信號(hào)在與所述預(yù)設(shè)語音指令進(jìn)行匹配時(shí),按照各個(gè)預(yù)設(shè)語音指令的存儲(chǔ)順序依次與所述語音控制信號(hào)進(jìn)行匹配。例如,用戶發(fā)出的語音控制信號(hào)為“翻頁”信號(hào),無線投影系統(tǒng)中存儲(chǔ)的預(yù)設(shè)語音指令有“上滑”、“翻頁”、“暫停”語音指令,且各個(gè)所述預(yù)設(shè)語音指令的存儲(chǔ)順序依次為“上滑”、“翻頁”、“暫?!闭Z音指令,則在將所述“翻頁”信號(hào)與所述預(yù)設(shè)語音指令進(jìn)行匹配時(shí),首先將所述“翻頁”信號(hào)與“上滑”語音指令進(jìn)行匹配,若匹配失敗,則繼續(xù)將所述“翻頁”信號(hào)與“翻頁”語音指令進(jìn)行匹配,若匹配成功,則確定所述語音控制信號(hào)為所述“翻頁”語音指令,若匹配失敗,則繼續(xù)與所述預(yù)設(shè)語音指令的其他語音指令進(jìn)行匹配,直到匹配成功為止或者直到所述預(yù)設(shè)語音指令都匹配失敗為止。
所述生成模塊30,用于若匹配成功,則根據(jù)uibc協(xié)議基于匹配成功的所述預(yù)設(shè)語音指令生成uibc報(bào)文,并將所述uibc報(bào)文傳送至傳送端設(shè)備,以供傳送端設(shè)備根據(jù)接收到的所述uibc報(bào)文控制自身的行為。
在將所述語音控制信號(hào)與預(yù)設(shè)的語音指令匹配成功時(shí),根據(jù)uibc協(xié)議將匹配成功的所述預(yù)設(shè)語音指令生成uibc報(bào)文。所述uibc協(xié)議協(xié)議又也稱為wifi-display協(xié)議,該協(xié)議定義了各個(gè)控制指令對(duì)應(yīng)的uibc報(bào)文的格式。由于所述uibc協(xié)議只定義了通用輸入的信息和人機(jī)接口設(shè)備類(hidc)的信息對(duì)應(yīng)的uibc報(bào)文的格式,而所述通用輸入的信息和人機(jī)接口設(shè)備類(hidc)的信息都不包括語音信號(hào)輸入的信息,故在將所述預(yù)設(shè)語音指令生成uibc報(bào)文時(shí),首先應(yīng)將所述預(yù)設(shè)語音指令轉(zhuǎn)換為通用輸入的信息或者人機(jī)接口設(shè)備類的信息,然后根據(jù)所述通用輸入的信息或人機(jī)接口設(shè)備類(hidc)的信息對(duì)應(yīng)的參數(shù)生成uibc報(bào)文,并將所述uibc報(bào)文傳送至傳送端設(shè)備,傳送端設(shè)備在接收到所述uibc報(bào)文后,根據(jù)所述uibc報(bào)文中的內(nèi)容控制自身的行為,例如所述報(bào)文中的內(nèi)容為對(duì)所述傳送端設(shè)備當(dāng)前播放的視頻進(jìn)行暫停處理,則所述傳送端設(shè)備在接收到該報(bào)文后立即對(duì)當(dāng)前播放的視頻進(jìn)行暫停播放。
所述提示模塊,用于若匹配失敗,則提示用戶重新發(fā)出語音控制信號(hào)。
在將所述語音控制信號(hào)與預(yù)設(shè)的語音指令匹配失敗時(shí),則提示用戶重新發(fā)出語音控制信號(hào),用戶在收到該提示后,即可知道發(fā)出的語音控制信號(hào)控制發(fā)送端的行為失敗,然后可以重新發(fā)出語音控制信號(hào),或重新使用語音播放設(shè)備發(fā)出語音控制信號(hào),所述語音播放設(shè)備中預(yù)先錄有所述語音控制信號(hào)。
本實(shí)施例通過在用戶不方便操作接收端設(shè)備或與接收端設(shè)備連接的外設(shè)設(shè)備時(shí),發(fā)出語音控制信號(hào),接收端設(shè)備在接收到用戶發(fā)出的語音控制信號(hào)后,將該語音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配,從而確定該語音控制信號(hào)對(duì)應(yīng)的預(yù)設(shè)語音指令,接收端設(shè)備在確定語音控制信號(hào)對(duì)應(yīng)的預(yù)設(shè)語音指令后,將所述預(yù)設(shè)語音指令生成uibc報(bào)文,并將所述uibc報(bào)文傳送至傳送端設(shè)備,從而實(shí)現(xiàn)對(duì)傳送端設(shè)備的控制,解決了當(dāng)不方便直接操作接收端設(shè)備或外設(shè)時(shí),而無法實(shí)現(xiàn)對(duì)傳送端設(shè)備的控制的問題,使得接收端設(shè)備對(duì)傳送端設(shè)備的控制更加方便。
進(jìn)一步地,基于第一實(shí)施例提出本發(fā)明語音控制裝置的第二實(shí)施例,參照?qǐng)D6,所述匹配模塊20包括處理單元21及匹配單元22。
所述處理單元21,用于將獲取的所述語音控制信號(hào)及所述預(yù)設(shè)語音指令 進(jìn)行相應(yīng)變換,以得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖或特征向量;
所述匹配單元22,用于將所述語音控制信號(hào)的聲譜圖或特征向量與所述預(yù)設(shè)語音指令的聲譜圖或特征向量進(jìn)行匹配。
當(dāng)所述預(yù)設(shè)語音指令的存儲(chǔ)形式為語音波形時(shí),由于不同的語音波形對(duì)應(yīng)的語音指令可能相同,而不同的用戶發(fā)出的相同的語音指令所對(duì)應(yīng)的語音波形的差別可能很大,故直接通過將用戶發(fā)出的語音控制信號(hào)所對(duì)應(yīng)的語音波形與預(yù)設(shè)語音指令對(duì)應(yīng)的語音波形進(jìn)行匹配時(shí),很難匹配成功,需要對(duì)所述預(yù)設(shè)語音指令及所述語音控制信號(hào)進(jìn)行相應(yīng)的處理。具體的,可以對(duì)獲取的所述語音控制信號(hào)及所述預(yù)設(shè)語音指令進(jìn)行相應(yīng)變換,以得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖或特征向量。當(dāng)需要得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖時(shí),所述相應(yīng)變換主要包括預(yù)加重處理、分幀處理、加窗處理、快速傅里葉變換處理及灰度級(jí)映射處理,經(jīng)過上述處理過程后,得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖。當(dāng)需要得到所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的特征向量時(shí),所述特征向量以所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的mfcc(melfrequencycepstrumcoefficient,梅爾頻率倒譜系數(shù))為例,所述相應(yīng)變換主要包括預(yù)加重處理、分幀處理、加窗處理、快速傅里葉變換處理、三角帶通濾波器進(jìn)行濾波處理、計(jì)算每個(gè)濾波器組輸出的對(duì)數(shù)能量、經(jīng)離散余弦變換(dct)得到mfcc系數(shù)、譜加權(quán)處理、cms(cepstrummeansubtraction,倒譜均值減)處理及動(dòng)態(tài)差分參數(shù)的提取(包括一階差分和二階差分)。在獲得所述語音控制信號(hào)及所述預(yù)設(shè)語音指令的聲譜圖或者特征向量后,將所述語音控制信號(hào)的聲譜圖或者特征向量依次與所述預(yù)設(shè)語音指令的聲譜圖或者特征向量進(jìn)行匹配,直到匹配成功為止或者與所有的預(yù)設(shè)語音指令都匹配失敗為止。
進(jìn)一步地,所述處理單元21,還用于將獲取的所述語音控制信號(hào)進(jìn)行相應(yīng)變換,以得到所述語音控制信號(hào)的聲譜圖或特征向量;
所述匹配單元22,還用于將所述語音控制信號(hào)的聲譜圖或特征向量與所述預(yù)設(shè)語音指令進(jìn)行匹配。
當(dāng)所述預(yù)設(shè)語音指令的存儲(chǔ)形式為聲譜圖或特征向量時(shí),由于語音信號(hào)的聲譜圖或者特征向量能夠直接表征語音指令的特性,故在將獲取的所述語 音控制信號(hào)與預(yù)設(shè)語音指令進(jìn)行匹配時(shí),只需要將獲取的所述語音控制信號(hào)進(jìn)行相應(yīng)的變換,從而得到所述語音控制信號(hào)的聲譜圖或特征向量,具體的變換過程在上述實(shí)施例中已描述,此處不再贅述。當(dāng)獲取到所述語音控制信號(hào)的聲譜圖或者特征向量時(shí),將所述聲譜圖或者特征向量與各個(gè)所述語音指令依次進(jìn)行匹配,直到匹配成功為止或者與所有的預(yù)設(shè)語音指令都匹配失敗為止。
本實(shí)施例通過將語音控制信號(hào)及所述預(yù)設(shè)語音指令變換為相應(yīng)的聲譜圖或者特征向量,然后將得到的聲譜圖或者特征向量進(jìn)行匹配,從而提高了語音識(shí)別的準(zhǔn)確性。
進(jìn)一步地,基于上述任一實(shí)施例提出本發(fā)明語音控制裝置的第三實(shí)施例,參照?qǐng)D7,所述生成模塊30包括:獲取單元31、確定單元32及生成單元33。
所述獲取單元31,用于獲取所述預(yù)設(shè)語音指令與所述uibc報(bào)文中控制信號(hào)段的映射關(guān)系;
所述確定單元32,用于根據(jù)所述映射關(guān)系確定匹配成功的所述預(yù)設(shè)語音指令對(duì)應(yīng)的控制信號(hào)段;
所述生成單元33,用于根據(jù)uibc協(xié)議將所述預(yù)設(shè)語音指令對(duì)應(yīng)的控制信號(hào)段生成uibc報(bào)文。
在本實(shí)施例中,所述預(yù)設(shè)語音指令與所述uibc報(bào)文中控制信號(hào)段存在一個(gè)映射表,即不同的預(yù)設(shè)語音指令對(duì)應(yīng)不同的控制信號(hào)段。所述控制信號(hào)段為控制傳送端設(shè)備行為對(duì)應(yīng)的數(shù)據(jù)段。所述映射關(guān)系可以為所述預(yù)設(shè)語音指令與通用輸入的信息的映射關(guān)系,或者所述預(yù)設(shè)語音指令與人機(jī)接口設(shè)備類(hidc)的信息的對(duì)應(yīng)關(guān)系,即將所述語音控制指令轉(zhuǎn)換為相應(yīng)的通用輸入控制信號(hào)或者人機(jī)接口設(shè)備類(hidc)控制信號(hào),然后根據(jù)uibc協(xié)議將所述通用輸入的信息或者人機(jī)接口設(shè)備類(hidc)的信息生成uibc報(bào)文,進(jìn)一步地,可以在所述uibc協(xié)議中定義所述預(yù)設(shè)控制指令的控制信號(hào)段內(nèi)容,在將所述預(yù)設(shè)語音指令生成uibc報(bào)文時(shí),則在將預(yù)設(shè)的語音指令生成uibc報(bào)文時(shí)即可直接根據(jù)所述uibc協(xié)議生成對(duì)應(yīng)的uibc報(bào)文。
本實(shí)施例通過將所述預(yù)設(shè)語音指令轉(zhuǎn)換為uibc協(xié)議中定義的指令,從而使得所述預(yù)設(shè)語音指令能控制所述傳送端設(shè)備的行為,增加了uibc功能的反 饋形式。
上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實(shí)施例方法可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如rom/ram、磁碟、光盤)中,包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī),計(jì)算機(jī),服務(wù)器,空調(diào)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。
以上僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。