語音交互服務(wù)處理方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本申請涉及通信技術(shù)領(lǐng)域,尤其涉及一種語音交互服務(wù)處理方法及裝置。
【背景技術(shù)】
[0002]語音是比文字更早、更自然的表達(dá)方式。在移動互聯(lián)網(wǎng)時代,用戶已習(xí)慣對著麥克風(fēng)說出搜索需求,搜索信息上傳至搜索引擎,搜索引擎將語音轉(zhuǎn)化為文字,返回相應(yīng)的搜索結(jié)果,來完成用戶對信息的渴求。
[0003]現(xiàn)有技術(shù)中,當(dāng)用戶進(jìn)行語音智能搜索時,點擊并開啟一個對話界面,在界面中完成搜索需求的語音或文字輸入,智能搜索根據(jù)關(guān)鍵詞人以文本、圖片或鏈接等形式反饋相應(yīng)結(jié)果信息,用戶從大量的文本、圖片或鏈接等信息中進(jìn)一步地選擇、查找、打開相應(yīng)內(nèi)容,從而獲取自己真正所需要的信息。
[0004]由此可見,現(xiàn)有技術(shù)的語音搜索服務(wù)僅僅是根據(jù)用戶的語音輸入進(jìn)行檢索,并返回海量的相關(guān)信息,用戶還要進(jìn)一步地進(jìn)行篩選獲取需要的信息,導(dǎo)致用戶的查詢效率低。
【發(fā)明內(nèi)容】
[0005]本申請旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0006]為此,本申請的第一個目的在于提出一種語音交互服務(wù)處理方法,該方法根據(jù)用戶輸入的語音信息對用戶行為進(jìn)行分析,向用戶提供便捷直達(dá)的語音服務(wù),減少了人機(jī)交互的處理次數(shù),提高了處理效率和用戶體驗度。
[0007]本申請的第二個目的在于提出一種語音交互服務(wù)處理裝置。
[0008]為達(dá)上述目的,本申請第一方面實施例提出了一種語音交互服務(wù)處理方法,包括:接收用戶發(fā)送的語音信息;根據(jù)所述語音信息獲取所述用戶的行為意圖和行為對象;獲取與所述行為意圖對應(yīng)的服務(wù)資源;根據(jù)所述服務(wù)資源向所述用戶提供與所述行為意圖和所述行為對象匹配的語音服務(wù)。
[0009]本申請實施例的語音交互服務(wù)處理方法,首先接收用戶發(fā)送的語音信息,然后根據(jù)所述語音信息獲取所述用戶的行為意圖和行為對象,進(jìn)而獲取與所述行為意圖對應(yīng)的服務(wù)資源,最后根據(jù)所述服務(wù)資源向所述用戶提供與所述行為意圖和所述行為對象匹配的語音服務(wù)。由此,根據(jù)用戶輸入的語音信息對用戶行為進(jìn)行分析,向用戶提供便捷直達(dá)的語音服務(wù),減少了人機(jī)交互的處理次數(shù),提高了處理效率和用戶體驗度。
[0010]為達(dá)上述目的,本申請第二方面實施例提出了一種語音交互服務(wù)處理裝置,包括:第一接收模塊,用于接收用戶發(fā)送的語音信息;第一獲取模塊,用于根據(jù)所述語音信息獲取所述用戶的行為意圖和行為對象;第二獲取模塊,用于獲取與所述行為意圖對應(yīng)的服務(wù)資源;處理模塊,用于根據(jù)所述服務(wù)資源向所述用戶提供與所述行為意圖和所述行為對象匹配的語音服務(wù)。
[0011]本申請實施例的語音交互服務(wù)處理裝置,通過第一接收模塊接收用戶發(fā)送的語音信息;通過第一獲取模塊根據(jù)所述語音信息獲取所述用戶的行為意圖和行為對象;通過第二獲取模塊獲取與所述行為意圖對應(yīng)的服務(wù)資源;通過處理模塊根據(jù)所述服務(wù)資源向所述用戶提供與所述行為意圖和所述行為對象匹配的語音服務(wù)。由此,根據(jù)用戶輸入的語音信息對用戶行為進(jìn)行分析,向用戶提供便捷直達(dá)的語音服務(wù),減少了人機(jī)交互的處理次數(shù),提高了處理效率和用戶體驗度。
【附圖說明】
[0012]本發(fā)明上述的和/或附加的方面和優(yōu)點從下面結(jié)合附圖對實施例的描述中將變得明顯和容易理解,其中:
[0013]圖1是本申請一個實施例的語音交互服務(wù)處理方法的流程圖;
[0014]圖2所示為卡通造型的虛擬三維立體模型;
[0015]圖3是本申請另一個實施例的語音交互服務(wù)處理方法的流程圖;
[0016]圖4為語音交互服務(wù)示意效果圖一;
[0017]圖5為語音交互服務(wù)示意效果圖二;
[0018]圖6是本申請另一個實施例的語音交互服務(wù)處理方法的流程圖;
[0019]圖7為語音交互服務(wù)示意效果圖三;
[0020]圖8為語音交互服務(wù)示意效果圖四;
[0021]圖9為語音交互服務(wù)示意效果圖五;
[0022]圖10是本申請一個實施例的語音交互服務(wù)處理裝置的結(jié)構(gòu)示意圖;
[0023]圖11是本申請一個實施例的語音交互服務(wù)處理裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0024]下面詳細(xì)描述本申請的實施例,所述實施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的,旨在用于解釋本申請,而不能理解為對本申請的限制。
[0025]下面參考附圖描述本申請實施例的語音交互服務(wù)處理方法及裝置。
[0026]圖1是本申請一個實施例的語音交互服務(wù)處理方法的流程圖。
[0027]如圖1所示,該語音交互服務(wù)處理方法包括:
[0028]步驟101,接收用戶發(fā)送的語音信息。
[0029]本發(fā)明實施例提供的語音交互服務(wù)處理方法應(yīng)用于具有語音輸入輸出功能的終端設(shè)備中,一般情況下,終端設(shè)備通過人機(jī)語音交互接口實現(xiàn)語音輸入輸出功能,具體的語音輸入接口可以為麥克風(fēng)等設(shè)備,語音輸出接口可以為音響等設(shè)備。
[0030]當(dāng)用戶需要獲取語音交互服務(wù)時,向人機(jī)語音交互接口輸入語音信息,人機(jī)語音交互接口用于接收用戶輸入的語音信息,通過相關(guān)應(yīng)用進(jìn)行處理后,向用戶輸出語音信息,以使用戶獲取相應(yīng)的語音交互服務(wù)。需要說明的是,終端設(shè)備可以通過能夠訪問人機(jī)語音交互接口的應(yīng)用來為用戶提供語音交互服務(wù),該應(yīng)用可以根據(jù)實際需要進(jìn)行選擇,例如:具有語音輸入輸出功能的搜索引擎等,本實施例對此不作限制。
[0031]進(jìn)一步地,為了提升用戶使用語音交互服務(wù)的體驗,增加趣味性,在另一個實施例中,在步驟101之前,所述方法還包括:
[0032]接收所述用戶發(fā)送的語音服務(wù)開啟指令;
[0033]配置與所述用戶對應(yīng)的虛擬三維立體模型,所述虛擬三維立體模型用于配合人機(jī)語音交互接口與所述用戶進(jìn)行語音交互服務(wù)。
[0034]具體地,當(dāng)用戶進(jìn)入提供語音服務(wù)的網(wǎng)絡(luò)應(yīng)用客戶端,發(fā)送語音服務(wù)開啟指令,根據(jù)語音服務(wù)開啟指令為用戶配置對應(yīng)的虛擬三維立體模型。虛擬三維立體模型是通過圖像處理等技術(shù)生成的,用于配合人機(jī)語音交互接口與用戶進(jìn)行語音交互服務(wù)??梢愿鶕?jù)用戶的語音服務(wù)開啟指令主動為用戶配置,也可以讓用戶根據(jù)自身的喜好選擇感興趣的虛擬三維立體模型,例如:圖2所示為卡通造型的虛擬三維立體模型,本實施例對具體的形象不作限制。從而用戶會在應(yīng)用中的相對平面內(nèi)看到自己所選的虛擬三維立體模型,虛擬三維立體模型配合人機(jī)語音交互接口與用戶進(jìn)行語音交互服務(wù)。
[0035]步驟102,根據(jù)所述語音信息獲取所述用戶的行為意圖和行為對象。
[0036]在獲取用戶輸入的語音信息之后,通過對該語音信息分析獲取用戶的行為意圖和行為對象。需要說明的是,本發(fā)明實施例中涉及的行為意圖指的是用戶要做的事件,行為對象指的是做的事件內(nèi)容,舉例說明如下:
[0037]I)當(dāng)用戶輸入的語音信息為:“帶我去附近的麥當(dāng)勞”時,用戶的行為意圖為“我去”,用戶的行為對象為“附近的麥當(dāng)勞”;
[0038]2)當(dāng)用戶輸入的語音信息為:“我要看熊出沒第二集”時,用戶的行為意圖為“我要看”,用戶的行為對象為“熊出沒第二集”;
[0039]3)當(dāng)用戶輸入的語音信息為:“我要給媽媽打電話”時,用戶的行為意圖為“打電話”,用戶的行為對象為“媽媽”;
[0040]4)當(dāng)用戶輸入的語音信息為:“天空為什么是藍(lán)色的”時,用戶的行為意圖為“為什么”,用戶的行為對象為“天空是藍(lán)色”。
[0041]根據(jù)語音信息獲取用戶的行為意圖和行為對象的實現(xiàn)方式有很多,根據(jù)實際需要進(jìn)行選擇,舉例說明如下:
[0042]方式一:直接通過語音特征值進(jìn)行匹配檢測,
[0043]具體來說,可以提取用戶輸入的語音信息的特征值,根據(jù)預(yù)先建立的語音特征庫對所提取的特征值進(jìn)行檢測,語音特征庫中存儲了大量描述用戶行為意圖和行為對象的語音樣本值,通過檢測語音樣本值與所提取的特征值的匹配度,從語音信息中獲取用戶的行為意圖和行為對象。
[0044]方式二,通