本發(fā)明涉及音頻識別技術(shù)領(lǐng)域,尤其涉及一種增強現(xiàn)實的控制方法、裝置及移動終端。
背景技術(shù):
增強現(xiàn)實(Augmented Reality,AR)技術(shù)是通過計算機系統(tǒng)提供的信息增加用戶對現(xiàn)實世界感知的技術(shù),將虛擬的信息應(yīng)用到真實世界,并將計算機生成的虛擬物體、場景或系統(tǒng)提示信息疊加到真實場景中,從而實現(xiàn)對現(xiàn)實的增強。在增強現(xiàn)實的環(huán)境中,使用者可以在看到周圍真實環(huán)境的同時,看到計算機產(chǎn)生的增強信息。這種增強的信息可以是在真實環(huán)境中與真實環(huán)境共存的虛擬物體,也可以是關(guān)于存在的真實物體的信息。
目前,增強現(xiàn)實技術(shù)已經(jīng)被應(yīng)用于移動終端中。例如,在移動終端進行拍攝時,就可以利用增強現(xiàn)實技術(shù)對拍攝的照片進行增強。
用戶在使用增強現(xiàn)實技術(shù)時,通常需要手動發(fā)出控制指令,移動終端根據(jù)該控制指令控制增強現(xiàn)實技術(shù)的實現(xiàn)。若用戶的雙手不方便發(fā)出控制指令,則無法對增強現(xiàn)實技術(shù)的實現(xiàn)進行控制。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明實施例提供一種增強現(xiàn)實的控制方法、裝置及移動終端,以實現(xiàn)準(zhǔn)確獲取用戶語音信息進而根據(jù)用戶語音信息控制增強現(xiàn)實技術(shù)的目的。
第一方面,本發(fā)明實施例提供了一種增強現(xiàn)實的控制方法,包括:
接收外界音頻信息;
將所述外界音頻信息分成至少一類音頻子信息,其中,同一類音頻子信息為同一聲源發(fā)出的音頻信息;
識別所述至少一類音頻子信息中設(shè)定用戶發(fā)出的音頻子信息,并確定識別出的音頻子信息對應(yīng)的控制指令;
根據(jù)所述控制指令執(zhí)行對應(yīng)的增強現(xiàn)實控制操作。
第二方面,本發(fā)明實施例還提供了一種增強現(xiàn)實的控制裝置,包括:
接收模塊,用于接收外界音頻信息;
分類模塊,用于將所述外界音頻信息分成至少一類音頻子信息,其中,同一類音頻子信息為同一聲源發(fā)出的音頻信息;
識別模塊,用于識別所述至少一類音頻子信息中設(shè)定用戶發(fā)出的音頻子信息,并確定識別出的音頻子信息對應(yīng)的控制指令;
執(zhí)行模塊,用于根據(jù)所述控制指令執(zhí)行對應(yīng)的增強現(xiàn)實控制操作。
第三方面,本發(fā)明實施例還提供了一種移動終端,包括上述增強現(xiàn)實的控制裝置。
本發(fā)明實施例提供的一種增強現(xiàn)實的控制方法、裝置及移動終端,通過將接收的外界音頻信息分成至少一類音頻子信息,并在至少一類音頻子信息中識別出設(shè)定用戶發(fā)出的音頻子信息,進而確定對應(yīng)的控制指令,并根據(jù)該控制指令執(zhí)行對應(yīng)的增強現(xiàn)實控制操作,可以在用戶雙手不方便發(fā)出控制指令時,通過聲音實現(xiàn)對增強現(xiàn)實技術(shù)的控制,提升了用戶的使用體驗。
附圖說明
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯:
圖1為本發(fā)明實施例一提供的一種增強現(xiàn)實的控制方法的流程圖;
圖2為本發(fā)明實施例二提供的一種增強現(xiàn)實的控制方法的流程圖;
圖3為本發(fā)明實施例三提供的一種增強現(xiàn)實的控制方法的流程圖;
圖4為本發(fā)明實施例四提供的一種增強現(xiàn)實的控制方法的流程圖;
圖5為本發(fā)明實施例四提供的第一人機交互示意圖;
圖6為本發(fā)明實施例四提供的第二人機交互示意圖;
圖7為本發(fā)明實施例四提供的第三人機交互示意圖;
圖8為本發(fā)明實施例五提供的一種增強現(xiàn)實的控制裝置的結(jié)構(gòu)示意圖。
具體實施方式
下面結(jié)合附圖和實施例對本發(fā)明作進一步的詳細說明??梢岳斫獾氖?,此處所描述的具體實施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部內(nèi)容。
實施例一
圖1為本發(fā)明實施例一提供的一種增強現(xiàn)實的控制方法的流程圖。本實施例提供的增強現(xiàn)實的控制方法適用于用戶無法通過雙手發(fā)出增強現(xiàn)實控制指令的情況。本實施例提供的增強現(xiàn)實的控制方法可以由增強現(xiàn)實的控制裝置來執(zhí)行,該裝置可以由軟件和/或硬件來實現(xiàn),并集成在具有增強現(xiàn)實功能的移動終端中。其中,移動終端包括但不限定于手機、平板電腦等用戶持有的設(shè)備。
參考圖1,本實施例提供的增強現(xiàn)實的控制方法具體包括:
步驟110、接收外界音頻信息。
具體的,音頻獲取設(shè)備可以是移動終端的麥克風(fēng),也可以是與移動終端連接的其他音頻設(shè)備的麥克風(fēng)。
其中,接收外界音頻信息可以是實時接收外界音頻信息,也可以是在完成上一項操作后接收外界音頻信息。例如,可以是在開啟增強現(xiàn)實功能后接收外界音頻信息,或者完成增強現(xiàn)實內(nèi)容的顯示后接收外界音頻信息。
進一步的,音頻獲取設(shè)備接收其最大范圍內(nèi)的全部音頻信息。其中,最大范圍為音頻獲取設(shè)備獲取音頻的最大范圍,具體的范圍值與音頻獲取設(shè)備的型號有關(guān),本實施例不作具體的限定。
步驟120、將所述外界音頻信息分成至少一類音頻子信息,其中,同一類音頻子信息為同一聲源發(fā)出的音頻信息。
示例性的,解析接收的外界音頻信息,將外界音頻信息分成至少一類音頻子信息。
具體的,同一類的音頻子信息為同一聲源發(fā)出的音頻信息。其中,聲源可以是人類、動物或者機器等可發(fā)聲的對象。以人類為例,一個聲源發(fā)出的音頻信息即為一個人說話的聲音。
進一步的,由于每個聲源的音頻特征都不相同,因此,可以根據(jù)音頻特征區(qū)分出音頻信息屬于哪個聲源發(fā)出的聲音。其中,音頻特征可以包括音色和/或音調(diào)。其中,音色是由聲波的波形決定,音調(diào)是由聲波的頻率決定。據(jù)此,可以將外界音頻信息轉(zhuǎn)化成聲波信號,通過識別聲波信號中的波形和/或頻率將外界音頻信息分成至少一類音頻子信息。
步驟130、識別所述至少一類音頻子信息中設(shè)定用戶發(fā)出的音頻子信息,并確定識別出的音頻子信息對應(yīng)的控制指令。
示例性的,在至少一類音頻子信息中識別出設(shè)定用戶發(fā)出的音頻子信息。
其中,具體的識別方式可以是:設(shè)定音量最大的音頻子信息為設(shè)定用戶的音頻子信息。此時,在至少一類音頻子信息中識別出音量最大的音頻子信息作為設(shè)定用戶發(fā)出的音頻子信息。
具體的識別方式還可以是:可以預(yù)先存儲設(shè)定用戶的音頻信息。將至少一類音頻子信息與設(shè)定用戶的音頻信息進行比對,根據(jù)比對的結(jié)果在至少一類音頻子信息中識別出與設(shè)定用戶的音頻信息匹配的音頻子信息。此時,若沒有與設(shè)定用戶匹配的音頻子信息,可以重新獲取外界音頻信息,或者是選擇音量最大的音頻子信息。
需要說明的是,上述識別方式并不是對本實施例的限定,可以根據(jù)實際情況設(shè)定具體的識別方式。
進一步的,在識別出設(shè)定用戶的音頻子信息后,確定該音頻子信息對應(yīng)的控制指令。
其中,可以是通過識別音頻子信息的關(guān)鍵字確定音頻子信息中包含的控制指令,也可以通過語義識別確定音頻子信息中包含的控制指令。需要說明的是,其他的語音識別方式也可以應(yīng)用于本實施例中,這里不作限定。
其中,控制指令為控制增強現(xiàn)實操作的指令。例如,控制指令為拍攝目標(biāo)增強對象的指令,其中,目標(biāo)增強對象為需要根據(jù)與其對應(yīng)的增強現(xiàn)實內(nèi)容對其進行增強,以達到在該對象的基礎(chǔ)上實現(xiàn)增強現(xiàn)實效果的對象。目標(biāo)增強對象具體可以為人、動物、物品等。再如,識別目標(biāo)增強對象的指令。又如,顯示目標(biāo)增強對象關(guān)聯(lián)的增強現(xiàn)實內(nèi)容的指令。
步驟140、根據(jù)所述控制指令執(zhí)行對應(yīng)的增強現(xiàn)實控制操作。
例如,在用戶開啟移動終端的增強現(xiàn)實功能后,開始接收外界音頻信息,并從接收到的外界音頻信息中識別出設(shè)定用戶的音頻子信息,并確定該音頻子信息表達的是增強攝像頭獲取的目標(biāo)增強對象的指令。此時,利用攝像頭拍攝拍攝照片,并識別照片中的目標(biāo)增強對象,對識別出的目標(biāo)增強對象實現(xiàn)增強現(xiàn)實操作。具體的識別目標(biāo)增強對象的方法,這里不作限定。
可選的,在根據(jù)控制指令執(zhí)行對應(yīng)的增強現(xiàn)實控制操作后,可以返回執(zhí)行步驟110,以繼續(xù)通過外界音頻信息實現(xiàn)增強現(xiàn)實的控制操作。
本發(fā)明實施例一提供的一種增強現(xiàn)實的控制方法,通過接收外界音頻信息,并識別出其中設(shè)定用戶的音頻子信息,根據(jù)該音頻子信息確定對應(yīng)的控制指令并執(zhí)行相應(yīng)的增強現(xiàn)實控制操作,實現(xiàn)了通過音頻信息對增強現(xiàn)實技術(shù)的控制,即使用戶不通過雙手仍能實現(xiàn)對增強現(xiàn)實技術(shù)的控制,降低了增強現(xiàn)實技術(shù)使用的限制條件,提升了用戶的使用體驗。
在上述實施例的基礎(chǔ)上,所述將所述外界音頻信息分成至少一類音頻子信息,其中,同一類音頻子信息為同一聲源發(fā)出的音頻信息可以包括:對所述外界音頻信息進行去噪處理,將去噪后的外界音頻信息分成至少一類音頻子信息,其中,去噪后的外界音頻信息為至少一個用戶發(fā)出的音頻信息。
具體的,接收的外界音頻信息中可能還包括噪聲,比如寵物的叫聲、汽車的鳴笛聲或者是電器啟動聲音等無法發(fā)出語音控制指令的聲音。在對外界音頻信息進行分類時,這些噪聲會降低音頻識別的準(zhǔn)確性。
因此,對外界音頻信息分類前,先去除其中的噪聲,即對外界音頻信息進行去噪處理。其中,去噪方法可以是小波分析法等,具體的去噪方法可以根據(jù)實際情況進行設(shè)定,本實施例不作限定。
進一步的,去噪后的外界音頻信息中僅包含至少一個用戶發(fā)出的音頻信息。對至少一個用戶發(fā)出的音頻信息進行分類,得到至少一類音頻子信息,進而提高外界音頻信息分類的準(zhǔn)確性。
實施例二
圖2為本發(fā)明實施例二提供的一種增強現(xiàn)實的控制方法的流程圖。本實施例是在上述實施例的基礎(chǔ)上,對識別所述至少一類音頻子信息中設(shè)定用戶發(fā)出的音頻子信息,并確定識別出的音頻子信息對應(yīng)的控制指令的步驟作了進一步的限定。參考圖2,本實施例提供的方法具體包括:
步驟210、接收外界音頻信息。
步驟220、將所述外界音頻信息分成至少一類音頻子信息,其中,同一類音頻子信息為同一聲源發(fā)出的音頻信息。
步驟230、將所述至少一類音頻子信息的音頻特征與預(yù)設(shè)合法用戶的音頻特征進行匹配,根據(jù)匹配結(jié)果判斷是否存在與預(yù)設(shè)合法用戶的音頻特征相匹配的音頻特征。若存在,則執(zhí)行步驟240。若不存在,則執(zhí)行步驟250。
具體的,合法用戶為預(yù)先在移動終端中存儲音頻信息的用戶。合法用戶的音頻信息存入后,分析該音頻信息的音頻特征,存儲分析得到的音頻特征作為合法用戶的音頻特征。
其中,音頻特征可以是音色和/或音調(diào)。例如,對合法用戶音頻信息中的音色和音調(diào)分析,以確認該合法用戶的音頻特征。
進一步的,分析外界音頻信息中的至少一類音頻子信息的音頻特征。其中,分析至少一類音頻子信息的音頻特征種類與合法用戶的音頻特征種類相同。確定至少一類音頻子信息的音頻特征后,將至少一類音頻子信息中的各音頻子信息的音頻特征依次與預(yù)設(shè)合法用戶的音頻特征進行匹配,以確定至少一類音頻子信息中是否存在與預(yù)設(shè)合法用戶的音頻特征相匹配的音頻特征。
步驟240、若存在與預(yù)設(shè)合法用戶的音頻特征相匹配的音頻特征,則確定與預(yù)設(shè)合法用戶的音頻特征相匹配的音頻特征,并提取對應(yīng)的音頻子信息。跳轉(zhuǎn)執(zhí)行步驟260。
具體的,若至少一類音頻子信息中存在與預(yù)設(shè)合法用戶的音頻特征匹配的音頻特征,說明其中包含預(yù)設(shè)合法用戶的音頻子信息,此時,提取與預(yù)設(shè)合法用戶音頻特征匹配的音頻子信息。
進一步的,在至少一類音頻子信息中匹配到與預(yù)設(shè)合法用戶的音頻特征相匹配的音頻特征后,停止匹配。
例如,外界音頻信息共分為10類音頻子信息,并分別命名為第1類音頻子信息、第2類音頻子信息、……、以及第10類音頻子信息。依次將10類音頻子信息的音頻特征與預(yù)設(shè)合法用戶的音頻特征進行匹配,當(dāng)?shù)?類音頻子信息的音頻特征與預(yù)設(shè)合法用戶的音頻特征進行匹配時,匹配結(jié)果為第5類音頻子信息的音頻特征與預(yù)設(shè)合法用戶的音頻特征完全匹配。此時,確定并提取第5類音頻子信息,同時,停止將剩余的音頻子信息的音頻特征與預(yù)設(shè)合法用戶的音頻特征進行匹配。
步驟250、若不存在與預(yù)設(shè)合法用戶的音頻特征相匹配的音頻特征,則提取音量最大的音頻子信息。執(zhí)行步驟260。
具體的,至少一類音頻子信息中不存在與預(yù)設(shè)合法用戶的音頻特征相匹配的音頻特征,說明當(dāng)前發(fā)出指令的用戶不屬于預(yù)設(shè)的合法用戶,此時,分析至少一類音頻子信息的音量,并提取音量最大的音頻子信息。同時將音量最大的音頻子信息默認為發(fā)出指令的用戶的音頻子信息。
可選的,在提取音量最大的音頻子信息后,分析該音頻子信息的音頻特征,并將該音頻特征存儲為預(yù)設(shè)合法用戶的音頻特征。
步驟260、確定提取的音頻子信息對應(yīng)的控制指令。
步驟270、根據(jù)所述控制指令執(zhí)行對應(yīng)的增強現(xiàn)實控制操作。
本發(fā)明實施例二提供的一種增強現(xiàn)實的控制方法,通過接收外界音頻信息,并將外界音頻信息中識別出的至少一類音頻子信息的音頻特征與預(yù)設(shè)合法用戶的音頻特征進行匹配,并根據(jù)匹配結(jié)果確定對應(yīng)的音頻子信息,根據(jù)該音頻子信息確定對應(yīng)的控制指令并執(zhí)行相應(yīng)的增強現(xiàn)實控制操作,實現(xiàn)了通過音頻信息對增強現(xiàn)實技術(shù)的控制,即使用戶不通過雙手仍能實現(xiàn)對增強現(xiàn)實技術(shù)的控制,降低了增強現(xiàn)實技術(shù)使用的限制條件,提升了用戶的使用體驗。
實施例三
圖3為本發(fā)明實施例三提供的一種增強現(xiàn)實的控制方法的流程圖。本實施例是在上述各實施例的基礎(chǔ)上,增加了若預(yù)設(shè)至少兩個合法用戶的音頻特征,則對至少兩個合法用戶的音頻特征進行編號的步驟。參考圖3,本實施例提供的方法具體包括:
步驟310、若預(yù)設(shè)至少兩個合法用戶的音頻特征,則對至少兩個合法用戶的音頻特征進行編號。
示例性的,預(yù)先存儲至少兩個合法用戶的音頻信息,并確定對應(yīng)的音頻特性。其中,音頻特性可以是音色和/或音調(diào)。
具體的,對至少兩個合法用戶的音頻特征進行編號。其中,編號的規(guī)則可以是按照合法用戶的音頻信息的錄入順序進行編號。例如,錄入第一個用戶的音頻信息后,將第一個用戶的音頻特征記為第一合法用戶的音頻特征,錄入第二個用戶的音頻信息后,將第二個用戶的音頻特征記為第二合法用戶的音頻特征,依次類推。另外,編號的規(guī)則還可以通過人為設(shè)定。
步驟320、接收外界音頻信息。
步驟330、將所述外界音頻信息分成至少一類音頻子信息,其中,同一類音頻子信息為同一聲源發(fā)出的音頻信息。
步驟340、根據(jù)所述編號,將所述至少一類音頻子信息的音頻特征依次與至少兩個合法用戶的音頻特征進行匹配,直到確定與其中一個合法用戶的音頻特征相匹配的音頻特征,并提取對應(yīng)的音頻子信息。
進一步的,將至少一類音頻子信息的音頻特征依次與至少兩個合法用戶的音頻特征進行匹配。其中,至少一類音頻子信息音頻特征的類別與合法用戶的音頻特征的類別相同。
具體的匹配方式為:將至少一類音頻子信息的音頻特征與第一合法用戶的音頻特征進行匹配,若至少一類音頻子信息中存在與第一合法用戶的音頻特征相匹配的音頻特征,則提取匹配的音頻特征對應(yīng)的音頻子信息,并停止匹配。若至少一類音頻子信息中不存在與第一合法用戶的音頻特征匹配的音頻特征,則將至少一類音頻子信息的音頻特征與第二合法用戶的音頻特征進行匹配。若至少一類音頻子信息中存在與第二合法用戶的音頻特征匹配的音頻特征,則提取匹配的音頻特征對應(yīng)的音頻子信息,并停止匹配。若至少一類音頻子信息中不存在與第二合法用戶的音頻特征匹配的音頻特征,則將至少一類音頻子信息的音頻特征與第三合法用戶的音頻特征進行匹配,依次類推。
進一步的,若至少一類音頻子信息的音頻特征與全部合法用戶的音頻特征進行匹配后,未得到匹配的音頻特征,則在至少一類音頻子信息中提取音量最大的音頻子信息作為設(shè)定的音頻子信息。
例如,外界音頻信息共分為10類音頻子信息,并分別命名為第1類音頻子信息、第2類音頻子信息、……、以及第10類音頻子信息,且共有三個合法用戶,分別為第一合法用戶、第二合法用戶和第三合法用戶。依次將10類音頻子信息的音頻特征與第一合法用戶的音頻特征進行匹配,匹配結(jié)果為并未發(fā)現(xiàn)與第一合法用戶的音頻特征匹配的音頻特征,此時,將10類音頻子信息的音頻特征與第二合法用戶的音頻特征進行匹配,得到第4類音頻子信息的音頻特征與第二合法用戶的音頻特征相匹配,此時提取第4類音頻子信息,并停止匹配。
另外,還可以將至少一類音頻子信息的音頻特征與全部合法用戶的音頻特征進行匹配,并確定相匹配的音頻特征對應(yīng)的全部合法用戶。根據(jù)合法用戶的編號選擇編號最小的合法用戶對應(yīng)的音頻子信息。若全部匹配后,沒有匹配的音頻特征,則提取音量最大的音頻子信息作為設(shè)定的音頻子信息。
例如,外界音頻信息共分為10類音頻子信息,并分別命名為第1類音頻子信息、第2類音頻子信息、……、以及第10類音頻子信息,且共有三個合法用戶,分別為第一合法用戶、第二合法用戶和第三合法用戶。將10類音頻子信息的音頻特征與三個合法用戶的音頻特征進行匹配,匹配結(jié)果為第4類音頻子信息的音頻特征與第三合法用戶的音頻特征相匹配,第6類音頻子信息的音頻特征與第一合法用戶的音頻特征相匹配,此時,提取第6類音頻子信息作為認定的音頻子信息。
步驟350、確定提取的音頻子信息對應(yīng)的控制指令。
步驟360、根據(jù)所述控制指令執(zhí)行對應(yīng)的增強現(xiàn)實控制操作。
本發(fā)明實施例三提供的一種增強現(xiàn)實的控制方法,通過接收外界音頻信息,并將外界音頻信息中識別出的至少一類音頻子信息的音頻特征依次與至少兩個合法用戶的音頻特征進行匹配,直到確定與其中一個合法用戶的音頻特征相匹配的音頻特征,并提取對應(yīng)的音頻子信息,根據(jù)該音頻子信息確定對應(yīng)的控制指令并執(zhí)行相應(yīng)的增強現(xiàn)實控制操作,實現(xiàn)了通過音頻信息對增強現(xiàn)實技術(shù)的控制,即使用戶不通過雙手仍能實現(xiàn)對增強現(xiàn)實技術(shù)的控制,降低了增強現(xiàn)實技術(shù)使用的限制條件,提升了用戶的使用體驗。
實施例四
圖4為本發(fā)明實施例四提供的一種增強現(xiàn)實的控制方法的流程圖。本實施例為一優(yōu)選實例。
參考圖4,本實施例提供的增強現(xiàn)實的控制方法包括:
步驟410、開啟增強現(xiàn)實功能。
步驟420、接收外界音頻信息。
步驟430、分析外界音頻信息。
具體的,對外界音頻信息進行去噪處理后,將外界音頻信息分成至少一類音頻子信息,其中同一類音頻子信息為同一用戶發(fā)出的音頻信息。
步驟440、判斷外界音頻信息中是否存在合法用戶的音頻信息。若存在,則執(zhí)行步驟450,若不存在,則執(zhí)行步驟460。
具體的,可以將外界音頻信息中的至少一類音頻子信息的音頻特征和合法用戶的音頻特征進行對比。
步驟450、若外界音頻信息中存在合法用戶的音頻信息,則實現(xiàn)增強現(xiàn)實控制操作。跳轉(zhuǎn)執(zhí)行步驟470。
具體的,若外界音頻信息中存在合法用戶的音頻信息,則解析對應(yīng)的合法用戶的音頻信息,確定對應(yīng)的操作指令,并實現(xiàn)增強現(xiàn)實控制操作。
步驟460、若外界音頻信息中不存在合法用戶的音頻信息,則利用其它規(guī)則實現(xiàn)增強現(xiàn)實控制操作。執(zhí)行步驟470。
具體的,其它規(guī)則可以是在外界音頻信息中提取音量最大的音頻,確定對應(yīng)的操作指令并實現(xiàn)增強現(xiàn)實操作。
步驟470、結(jié)束。
具體的,圖5為本發(fā)明實施例四提供的第一人機交互示意圖。當(dāng)開啟增強現(xiàn)實功能后,移動終端顯示屏如圖5所示,顯示屏51中出現(xiàn)麥克風(fēng)標(biāo)識52,表明移動終端的麥克風(fēng)開啟。此時獲取外界音頻信息,并確定是否存在合法用戶的音頻,同時確認對應(yīng)的操作指令。例如,操作指令為對攝像頭獲取的內(nèi)容進行增強現(xiàn)實操作的指令。移動終端解析該指令后,先控制攝像頭拍攝照片并解析照片中目標(biāo)增強對象。具體的,圖6為本發(fā)明實施例四提供的第二人機交互示意圖,從圖6可知,解析照片中的目標(biāo)增強對象為足球。進一步的,對目標(biāo)增強對象進行增強現(xiàn)實操作。圖7為本發(fā)明實施例四提供的第三人機交互示意圖。圖7的顯示屏中的內(nèi)容為對目標(biāo)增強對象(足球)進行增強現(xiàn)實后的內(nèi)容。
本發(fā)明實施例四提供的一種增強現(xiàn)實的控制方法,通過對外界音頻信息的解析確定對應(yīng)的增強現(xiàn)實操作指令,進而執(zhí)行對應(yīng)的增強現(xiàn)實控制操作,實現(xiàn)了通過音頻信息對增強現(xiàn)實技術(shù)的控制,即使用戶不通過雙手仍能實現(xiàn)對增強現(xiàn)實操作的控制,降低了增強現(xiàn)實技術(shù)使用的限制條件,提升了用戶的使用體驗。
實施例五
圖8為本發(fā)明實施例五提供的一種增強現(xiàn)實的控制裝置的結(jié)構(gòu)示意圖。如圖8所示,所述增強現(xiàn)實的控制裝置包括:接收模塊801、分類模塊802、識別模塊803和執(zhí)行模塊804。
其中,接收模塊801,用于接收外界音頻信息;分類模塊802,用于將所述外界音頻信息分成至少一類音頻子信息,其中,同一類音頻子信息為同一聲源發(fā)出的音頻信息;識別模塊803,用于識別所述至少一類音頻子信息中設(shè)定用戶發(fā)出的音頻子信息,并確定識別出的音頻子信息對應(yīng)的控制指令;執(zhí)行模塊804,用于根據(jù)所述控制指令執(zhí)行對應(yīng)的增強現(xiàn)實控制操作。
本發(fā)明實施例五提供的一種增強現(xiàn)實的控制裝置,通過接收外界音頻信息,并識別出其中設(shè)定用戶的音頻子信息,根據(jù)該音頻子信息確定對應(yīng)的控制指令并執(zhí)行相應(yīng)的增強現(xiàn)實控制操作,實現(xiàn)了通過音頻信息對增強現(xiàn)實技術(shù)的控制,即使用戶不通過雙手仍能實現(xiàn)對增強現(xiàn)實技術(shù)的控制,降低了增強現(xiàn)實技術(shù)使用的限制條件,提升了用戶的使用體驗。
在上述實施例的基礎(chǔ)上,所述分類模塊802具體用于:對所述外界音頻信息進行去噪處理,將去噪后的外界音頻信息分成至少一類音頻子信息,其中,去噪后的外界音頻信息為至少一個用戶發(fā)出的音頻信息。
在上述實施例的基礎(chǔ)上,所述識別模塊803包括:特征確定單元,用于將所述至少一類音頻子信息的音頻特征與預(yù)設(shè)合法用戶的音頻特征進行匹配,確定與預(yù)設(shè)合法用戶的音頻特征相匹配的音頻特征,并提取對應(yīng)的音頻子信息;指令確定單元,用于確定提取的音頻子信息對應(yīng)的控制指令。
在上述實施例的基礎(chǔ)上,所述增強現(xiàn)實的控制裝置還包括:編號模塊,用于若預(yù)設(shè)至少兩個合法用戶的音頻特征,則對至少兩個合法用戶的音頻特征進行編號。
相應(yīng)的,所述特征確定單元具體用于:根據(jù)所述編號,將所述至少一類音頻子信息的音頻特征依次與至少兩個合法用戶的音頻特征進行匹配,直到確定與其中一個合法用戶的音頻特征相匹配的音頻特征,并提取對應(yīng)的音頻子信息。
在上述實施例的基礎(chǔ)上,所述增強現(xiàn)實的控制裝置還包括:最大音頻裝置,用于若不存在與預(yù)設(shè)合法用戶的音頻特征相匹配的音頻特征,則提取音量最大的音頻子信息。
本發(fā)明實施例五提供的增強現(xiàn)實的控制裝置可以用于執(zhí)行上述任意實施例提供的增強現(xiàn)實的控制方法,具備相應(yīng)的功能和有益效果。
本發(fā)明實施例五還提供了一種移動終端,該移動終端集成了上述任意實施例提供的增強現(xiàn)實的控制裝置,具備相應(yīng)的功能和有益效果。
注意,上述僅為本發(fā)明的較佳實施例及所運用技術(shù)原理。本領(lǐng)域技術(shù)人員會理解,本發(fā)明不限于這里所述的特定實施例,對本領(lǐng)域技術(shù)人員來說能夠進行各種明顯的變化、重新調(diào)整和替代而不會脫離本發(fā)明的保護范圍。因此,雖然通過以上實施例對本發(fā)明進行了較為詳細的說明,但是本發(fā)明不僅僅限于以上實施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。