本發(fā)明涉及機器人技術(shù)領(lǐng)域,具體地說,涉及一種面向智能機器人的人機交互方法及裝置。
背景技術(shù):
隨著科學技術(shù)的不斷發(fā)展,信息技術(shù)、計算機技術(shù)以及人工智能技術(shù)的引入,機器人的研究已經(jīng)逐步走出工業(yè)領(lǐng)域,逐漸擴展到了醫(yī)療、保健、家庭、娛樂以及服務(wù)行業(yè)等領(lǐng)域。而人們對于機器人的要求也從簡單重復的機械動作提升為具有擬人問答、自主性及與其他機器人進行交互的智能機器人,人機交互也就成為決定智能機器人發(fā)展的重要因素。
用戶在與機器人進行交互的過程中,往往會暴露出用戶的很多愛好或興趣點。而如果能夠有效提取并利用這些用戶興趣點信息的話,無疑將能夠使得智能機器人有效引導并談?wù)撚脩舾信d趣的話題,從而提高產(chǎn)品的用戶粘度。
現(xiàn)有的用戶興趣點的提取方法往往需要大量的文本語料來進行相關(guān)分析,并且最終得到的興趣點信息往往比較寬泛,因此很難根據(jù)得到的興趣點信息來與用戶進行有效交互。
技術(shù)實現(xiàn)要素:
為解決上述問題,本發(fā)明提供了一種面向智能機器人的人機交互方法,其包括:
用戶識別步驟,獲取當前用戶輸入的多模態(tài)交互數(shù)據(jù),對所述多模態(tài)交互數(shù)據(jù)進行解析,確定出所述當前用戶的身份信息;
興趣分類確定步驟,根據(jù)所述當前用戶的身份信息獲取所述當前用戶的歷史交互數(shù)據(jù),利用知識圖譜結(jié)合所述歷史交互數(shù)據(jù)確定出所述當前用戶的興趣分類信息;
反饋信息生成步驟,根據(jù)所述當前用戶的興趣分類信息,生成反饋信息并輸出。
根據(jù)本發(fā)明的一個實施例,在所述興趣分類確定步驟中,將當前用戶的歷史交互數(shù)據(jù)中的興趣點詞匯投影到所述知識圖譜中,根據(jù)知識圖譜確定出所述當前用戶的興趣分類信息。
根據(jù)本發(fā)明的一個實施例,在所述興趣分類確定步驟中,
對所述歷史交互數(shù)據(jù)中的興趣點詞匯進行統(tǒng)計,并投影到知識圖譜中;
對所述知識圖譜中的各個興趣點進行聚類分析,確定出所述當前用戶的興趣分類信息。
根據(jù)本發(fā)明的一個實施例,在所述反饋信息生成步驟中,根據(jù)當前用戶的興趣分類信息,確定知識圖譜中與該興趣分類信息相對應的類別,提取所述類別中的最新信息,根據(jù)所述最新信息,生成反饋信息并輸出。
本發(fā)明還提供了一種面向智能機器人的人機交互裝置,其包括:
用戶識別模塊,其用于獲取當前用戶輸入的多模態(tài)交互數(shù)據(jù),對所述多模態(tài)交互數(shù)據(jù)進行解析,確定出所述當前用戶的身份信息;
興趣分類確定模塊,其用于根據(jù)所述當前用戶的身份信息獲取所述當前用戶的歷史交互數(shù)據(jù),利用知識圖譜結(jié)合所述歷史交互數(shù)據(jù)確定出所述當前用戶的興趣分類信息;
反饋信息生成模塊,其用于根據(jù)所述當前用戶的興趣分類信息,生成反饋信息并輸出。
根據(jù)本發(fā)明的一個實施例,所述興趣分類確定模塊配置為將當前用戶的歷史交互數(shù)據(jù)中的興趣點詞匯投影到所述知識圖譜中,根據(jù)知識圖譜確定出所述當前用戶的興趣分類信息。
根據(jù)本發(fā)明的一個實施例,所述興趣分類確定模塊配置為首先對所述歷史交互數(shù)據(jù)中的興趣點詞匯進行統(tǒng)計,并投影到知識圖譜中,隨后對所述知識圖譜中的各個興趣點進行聚類分析,確定出所述當前用戶的興趣分類信息。
根據(jù)本發(fā)明的一個實施例,所述反饋信息生成模塊配置為根據(jù)當前用戶的興趣分類信息,確定知識圖譜中與該興趣分類信息相對應的類別,提取所述類別中的最新信息,根據(jù)所述最新信息,生成反饋信息并輸出。
本發(fā)明所提供的面向智能機器人的人機交互方法不再需要像現(xiàn)有技術(shù)那樣對大量的文本語料進行分析來確定用戶的興趣點,而是利用知識圖譜來根據(jù)用戶與智能機器人直接的少量聊天內(nèi)容來獲取用戶的興趣點,從而根據(jù)用戶的興趣點來生成用戶感興趣的反饋信息,進而吸引用戶與智能機器人進行持續(xù)交互。該方法提高了確定出的用戶興趣點的準確性,從而使得智能機器人所生成的反饋信息更加符合用戶的行為習慣,提高了智能機器人的人性化水平,改善了機器人的用戶體驗。
本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要的附圖做簡單的介紹:
圖1是根據(jù)本發(fā)明一個實施例的面向智能機器人的人機交互方法的實現(xiàn)流程圖;
圖2是根據(jù)本發(fā)明另一個實施例的面向智能機器人的人機交互方法的實現(xiàn)流程圖;
圖3是根據(jù)本發(fā)明一個實施例的面向智能機器人的人機交互裝置的結(jié)構(gòu)示意圖。
具體實施方式
以下將結(jié)合附圖及實施例來詳細說明本發(fā)明的實施方式,借此對本發(fā)明如何應用技術(shù)手段來解決技術(shù)問題,并達成技術(shù)效果的實現(xiàn)過程能充分理解并據(jù)以實施。需要說明的是,只要不構(gòu)成沖突,本發(fā)明中的各個實施例以及各實施例中的各個特征可以相互結(jié)合,所形成的技術(shù)方案均在本發(fā)明的保護范圍之內(nèi)。
同時,在以下說明中,出于解釋的目的而闡述了許多具體細節(jié),以提供對本發(fā)明實施例的徹底理解。然而,對本領(lǐng)域的技術(shù)人員來說顯而易見的是,本發(fā)明可以不用這里的具體細節(jié)或者所描述的特定方式來實施。
另外,在附圖的流程圖示出的步驟可以在諸如一組計算機可執(zhí)行指令的計算機系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
現(xiàn)有的人機交互方法多是采用LDA(Latent Dirichlet Allocation)模型來確定用戶交互過程中的中心話題。LDA是一種文檔主體生成模型,也稱為一個三層貝葉斯概率模型,包含詞、主體和文檔三層結(jié)構(gòu)。通??梢哉J為一篇文章的每個詞都是通過“以一定概率選擇了某個主題,并從這個主題以一定概率選擇某個詞語”這樣一個過程得到的,這也就是所謂的生成模型。其中,文檔到主題服從多項式分布,主題到詞同樣服從多項式分布。
然而,傳統(tǒng)的LDA模型雖然可以提取出中心話題,但是其實現(xiàn)過程需要依賴大量的文本分析,而且最終得到的也是一系列孤立的詞,無法得到準確的中心話題。
針對現(xiàn)有技術(shù)中所存在的上述問題,本發(fā)明提供了一種新的面向智能機器人的人機交互方法。該方法利用知識圖譜來進行用戶興趣點的提取,并根據(jù)所提取出的興趣點來生成相應的反饋信息來輸出給用戶。
為了清楚地闡述本發(fā)明所提供的面向智能機器人的人機交互方法的實現(xiàn)原理、實現(xiàn)過程以及優(yōu)點,以下分別結(jié)合不同的實施例來對本發(fā)明所提供的人機交互方法作進一步地說明。
實施例一:
圖1示出了本實施例所提供的面向智能機器人的人機交互方法的實現(xiàn)流程圖。
如圖1所示,本實施例所提供的人機交互方法首先在步驟S101中獲取當前用戶輸入的多模態(tài)交互數(shù)據(jù)。需要指出的是,在本發(fā)明的不同實施例中,該方法在步驟S101中所獲取到的多模態(tài)交互數(shù)據(jù)既可以是語音數(shù)據(jù),也可以是文本數(shù)據(jù),還可以是語音數(shù)據(jù)和文本數(shù)據(jù)的結(jié)合,抑或是其他合理交互數(shù)據(jù)(例如圖像)與語音數(shù)據(jù)和文本數(shù)據(jù)的合理組合,本發(fā)明不限于此。
在得到當前用戶輸入的多模態(tài)交互數(shù)據(jù)后,該方法在步驟S102中對該多模態(tài)數(shù)據(jù)進行解析,從而得到當前用戶的身份信息。例如,如果用戶輸入的多模態(tài)交互信息中包含語音信息,那么該方法則可以在步驟S102中根據(jù)該語音信息提取出相應的聲紋信息,并將該聲紋信息與智能機器人自身或云端服務(wù)器存儲的是聲紋數(shù)據(jù)庫進行匹配,由于聲紋數(shù)據(jù)庫中各個聲紋信息是與特定的用戶相對應的,因此也就可以確定出當前用戶的身份信息。
需要指出的是,在本發(fā)明的其他實施例中,根據(jù)多模態(tài)交互數(shù)據(jù)中所包含的數(shù)據(jù)類型的不同,還可以采用其他合理的方式來根據(jù)所獲取到的多模態(tài)交互數(shù)據(jù)確定出當前用戶的身份信息,本發(fā)明不限于此。
如圖1所示,本實施例中,在得到當前用戶的身份信息后,該方法會在步驟S103中根據(jù)當前用戶的身份信息獲取當前用戶的歷史交互數(shù)據(jù)。具體地,本實施例中,智能機器人自身和/或云端服務(wù)器中存儲有一定時間段內(nèi)多個用戶的交互數(shù)據(jù)(即歷史交互數(shù)據(jù)),該方法在步驟S103中可以根據(jù)當前用戶的身份信息來對智能機器人自身和/或云端服務(wù)器中所存儲的交互數(shù)據(jù)進行檢索,從而得到當前用戶的歷史交互數(shù)據(jù)。
需要指出的是,在本發(fā)明的不同實施例中,該方法所獲取到的當前用戶的歷史交互數(shù)據(jù)的數(shù)據(jù)量(即時間段的長度)可以根據(jù)實際需要配置為不同的合理值,因此在此并不對該部分內(nèi)容進行限定。
在得到當前用戶的歷史交互數(shù)據(jù)后,該方法在步驟S104中利用知識圖譜結(jié)合歷史交互數(shù)據(jù)來確定出當前用戶的興趣分類信息。由于知識圖譜內(nèi)部已經(jīng)存在建立好的實體與實體之間的關(guān)系,其包含有大量的預定義信息,因此利用知識圖譜可以更加準確地從用戶與機器人的少量聊天內(nèi)容(例如歷史交互數(shù)據(jù))提取出用戶的關(guān)注點,即確定出用戶的興趣分類信息,從而更好地進行相關(guān)信息的推薦。
在得到當前用戶的分類信息后,該方法也就可以在步驟S105中根據(jù)該分類信息來生成相應的反饋信息并輸出。由于知識圖譜所得到的當前用戶的興趣分類信息能夠更加準確地反映出當前用戶的興趣點,因此根據(jù)該興趣點所生成的反饋信息顯然能夠更加符合當前用戶的交互預期,從而引起用戶與智能機器人進行持續(xù)的交互。
需要指出的是,在本發(fā)明的不同實施例中,該方法在步驟S105中所生成并的反饋信息可以是不同形式的多模態(tài)交互信息,本發(fā)明不限于此。例如,在本發(fā)明的一個實施例中,該方法在步驟S105中所生成并輸出的反饋信息既可以是語音信息,也可以是字符信息,還可以是圖像信息等其他合理信息,抑或是以上各類信息的合理組合。
從上述描述中可以看出,本實施例所提供的面向智能機器人的人機交互方法不再需要像現(xiàn)有技術(shù)那樣對大量的文本語料進行分析來確定用戶的興趣點,而是利用知識圖譜來根據(jù)用戶與智能機器人直接的少量聊天內(nèi)容來獲取用戶的興趣點,從而根據(jù)用戶的興趣點來生成用戶感興趣的反饋信息,進而吸引用戶與智能機器人進行持續(xù)交互。該方法提高了確定出的用戶興趣點的準確性,從而使得智能機器人所生成的反饋信息更加符合用戶的行為習慣,提高了智能機器人的人性化水平,改善了機器人的用戶體驗。
實施例二:
圖2示出了本實施例所提供的面向智能機器人的人機交互方法的實現(xiàn)流程圖。
如圖2所示,本實施例中,該人機交互方法首先在步驟S201中獲取當前用戶輸入的多模態(tài)交互數(shù)據(jù),并在步驟S202中對該多模態(tài)交互數(shù)據(jù)進行解析,從而確定出當前用戶的身份信息。在確定出當前用戶的身份信息后,該方法在步驟S203中根據(jù)當前用戶的身份信息來獲取當前用戶的歷史交互數(shù)據(jù)。
需要指出的是,本實施例中步驟S201至步驟S203的具體實現(xiàn)原理以及實現(xiàn)過程與上述實施例一中步驟S101至步驟S103所涉及的內(nèi)容類似,故在此不再對步驟S201至步驟S203的內(nèi)容進行贅述。
在得到當前用戶的歷史交互數(shù)據(jù)后,該方法會將當前用戶的歷史交互數(shù)據(jù)中的興趣點詞匯投影到知識圖譜中,并根據(jù)該知識譜圖來確定出當前用戶的興趣分類信息。
具體地,如圖2所示,本方法會在步驟S204中對該歷史交互數(shù)據(jù)中的興趣點詞匯進行統(tǒng)計,并將統(tǒng)計結(jié)果投影到知識圖譜中。例如,當前用戶的歷史交互數(shù)據(jù)中“籃球”出現(xiàn)了兩次,那么知識圖譜中“籃球”這個節(jié)點就可以得到兩分;當前用戶的歷史交互數(shù)據(jù)中五次聊到了與吃相關(guān)的內(nèi)容,那么知識圖譜中“美食”這個節(jié)點就可以得到五分。由于知識圖譜中各節(jié)點所對應的內(nèi)容是歷史交互數(shù)據(jù)中所提及的,因此這些節(jié)點必然包含當前用戶的興趣信息,而知識圖譜中各節(jié)點的得分也就表征了該節(jié)點的重要程度。通過這種方式,也就將當前用戶的歷史交互數(shù)據(jù)中的興趣點詞匯的統(tǒng)計結(jié)果投影到了知識圖譜中。
該方法隨后在步驟S205中對知識圖譜中各個興趣點進行聚類分析,從而確定出當前用戶的興趣分類信息。對于知識譜圖來說,其各個節(jié)點之間不再是孤立的,根據(jù)各節(jié)點之間的距離來進行聚類操作,從而可以得到用戶最感興趣的話題,這樣也就得到了當前用戶的興趣分類信息。
在得到當前用戶的興趣分類信息后,該方法在步驟S206中根據(jù)當前用戶的分類信息,確定出知識圖譜中與該興趣分類信息相對應的類別。在得到該類別后,該方法會在步驟S207中提取出該類別的相關(guān)信息(例如最新信息),并根據(jù)該相關(guān)信息來生成反饋信息并輸出給當前用戶。
例如,如果當前用戶的歷史交互數(shù)據(jù)中多次提及到“姚明”,而姚明是一名籃球運動員,因此該方法在步驟S206中可確定出知識圖譜中與當前用戶分類信息相對應的類別可以是“籃球”,因此該方法也就可以在步驟S207中根據(jù)該新聞信息來生成相應的反饋信息(例如美國籃球隊又奪得奧運冠軍啦)并輸出給當前用戶,而這顯然會吸引當前用戶與智能機器人進行聊天交互。
本發(fā)明還提供了一種面向智能機器人的人機交互裝置,圖3示出了本實施例中該裝置的結(jié)構(gòu)示意圖。
如圖3所示,本實施例所提供給的人機交互裝置優(yōu)選地包括:用戶識別模塊301、興趣分類確定模塊302以及反饋信息生成模塊303。其中,用戶識別模塊301用于獲取當前用戶輸入的多模態(tài)交互數(shù)據(jù)。需要指出的是,在本發(fā)明的不同實施例中,用戶識別模塊301所獲取到的多模態(tài)交互數(shù)據(jù)既可以是語音數(shù)據(jù),也可以是文本數(shù)據(jù),還可以是語音數(shù)據(jù)和文本數(shù)據(jù)的結(jié)合,抑或是其他合理交互數(shù)據(jù)(例如圖像)與語音數(shù)據(jù)和文本數(shù)據(jù)的合理組合,本發(fā)明不限于此。
在得到當前用戶輸入的多模態(tài)交互數(shù)據(jù)后,用戶識別模塊301會對該多模態(tài)交互數(shù)據(jù)進行解析來得到當前用戶的身份信息。具體地,本實施例中,優(yōu)選地,如果所獲取到的多模態(tài)交互信息中包含語音信息,用戶識別模塊301則可以通過提取語音信息中的聲紋信息并根據(jù)該聲紋信息來確定當前用戶的身份信息;如果所獲取到的多模態(tài)交互信息中包含圖像信息,用戶識別模塊301則可以通過人臉識別和/或手勢識別的方式來確定當前用戶的身份信息。
需要指出的是,在本發(fā)明的其他實施例中,根據(jù)多模態(tài)交互數(shù)據(jù)中所包含的數(shù)據(jù)類型的不同,用戶識別模塊301還可以采用其他合理的方式來根據(jù)所獲取到的多模態(tài)交互數(shù)據(jù)確定出當前用戶的身份信息,本發(fā)明不限于此。
在得到當前用戶的身份信息后,用戶識別模塊301會將當前用戶的身份信息傳輸給興趣分類確定模塊302。興趣分類確定模塊302在接收到該身份信息后,會根據(jù)當前用戶的身份信息獲取當前用戶的歷史交互數(shù)據(jù)。
具體地,本實施例中,智能機器人自身和/或云端服務(wù)器中存儲有一定時間段內(nèi)多個用戶的交互數(shù)據(jù)(即歷史交互數(shù)據(jù)),興趣分類確定模塊302可以根據(jù)當前用戶的身份信息來對智能機器人自身和/或云端服務(wù)器中所存儲的交互數(shù)據(jù)進行檢索,從而得到當前用戶的歷史交互數(shù)據(jù)。
在得到當前用戶的歷史交互數(shù)據(jù)后,興趣分類確定模塊302會利用知識圖譜結(jié)合歷史交互數(shù)據(jù)來確定出當前用戶的興趣分類信息。由于知識圖譜內(nèi)部已經(jīng)存在建立好的實體與實體之間的關(guān)系,其包含有大量的預定義信息,因此利用知識圖譜可以更加準確地從用戶與機器人的少量聊天內(nèi)容(例如歷史交互數(shù)據(jù))提取出用戶的關(guān)注點,即確定出用戶的興趣分類信息,從而更好地進行相關(guān)信息的推薦。
需要指出的是,本實施例中,興趣分類確定模塊302根據(jù)當前用戶的歷史交互數(shù)據(jù)確定當前用戶的興趣分類信息的具體原理以及過程還可以采用如實施例二中步驟S204和步驟S205所示的方式,本發(fā)明不限于此。
在得到當前用戶的分類信息后,興趣分類確定模塊302會將該分類信息傳輸給反饋信息生成模塊303,以由反饋信息生成模塊303根據(jù)該分類信息來生成相應的反饋信息并輸出。由于知識圖譜所得到的當前用戶的興趣分類信息能夠更加準確地反映出當前用戶的興趣點,因此根據(jù)該興趣點所生成的反饋信息顯然能夠更加符合當前用戶的交互預期,從而引起用戶與智能機器人進行持續(xù)的交互。
需要指出的是,本實施例中,反饋信息生成模塊303根據(jù)當前用戶的興趣分類信息生成反饋信息的原理以及過程優(yōu)選地與實施例二中步驟S206和步驟S207所涉及的內(nèi)容類似,不在此不再對反饋信息生成模塊303進行贅述。
應該理解的是,本發(fā)明所公開的實施例不限于這里所公開的特定結(jié)構(gòu)或處理步驟,而應當延伸到相關(guān)領(lǐng)域的普通技術(shù)人員所理解的這些特征的等同替代。還應當理解的是,在此使用的術(shù)語僅用于描述特定實施例的目的,而并不意味著限制。
說明書中提到的“一個實施例”或“實施例”意指結(jié)合實施例描述的特定特征、結(jié)構(gòu)或特性包括在本發(fā)明的至少一個實施例中。因此,說明書通篇各個地方出現(xiàn)的短語“一個實施例”或“實施例”并不一定均指同一個實施例。
雖然上述示例用于說明本發(fā)明在一個或多個應用中的原理,但對于本領(lǐng)域的技術(shù)人員來說,在不背離本發(fā)明的原理和思想的情況下,明顯可以在形式上、用法及實施的細節(jié)上作各種修改而不用付出創(chuàng)造性勞動。因此,本發(fā)明由所附的權(quán)利要求書來限定。