本發(fā)明涉及意圖識別技術(shù)領(lǐng)域,具體涉及一種基于多維度信息的意圖識別方法及系統(tǒng)。
背景技術(shù):
目前,現(xiàn)有的用戶意圖識別多是基于用戶使用的平臺、設(shè)備上的時間和地點等外部日常信息,例如:幾點幾分時在網(wǎng)頁上停留與點選,在APP上的點擊位置等,來預(yù)測用戶的意圖與偏好。但是,缺乏用戶語言文字上的信息,導(dǎo)致預(yù)測的結(jié)果失真,準(zhǔn)確度差。并且,現(xiàn)有的用戶意圖識別不具備個人化推論能力,用戶體驗差。
如何提高意圖識別的精準(zhǔn)度和數(shù)據(jù)處理效率,防止意圖預(yù)測失真,增強(qiáng)用戶體驗,是本領(lǐng)域技術(shù)人員亟需解決的問題。
技術(shù)實現(xiàn)要素:
針對現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供一種基于多維度信息的意圖識別方法及系統(tǒng),能夠提高意圖識別的精準(zhǔn)度和數(shù)據(jù)處理效率,防止意圖預(yù)測失真,增強(qiáng)用戶體驗。
第一方面,本發(fā)明提供一種基于多維度信息的意圖識別方法,該方法包括:獲取用戶的文本信息、用戶歷史操作信息和外部信息;
對文本信息進(jìn)行信息提取和/或識別,獲取特征信息;
根據(jù)特征信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別,獲取用戶預(yù)測意圖。
進(jìn)一步地,對文本信息進(jìn)行信息提取和/或識別,獲取特征信息,具體包括:對文本信息進(jìn)行信息提取,獲取提取信息;
對文本信息進(jìn)行話題識別,獲取話題識別信息;
對文本信息進(jìn)行情緒識別,獲取情緒狀態(tài)信息;
對文本信息進(jìn)行語言行為識別,獲取語言行為信息,特征信息包括提取信息、話題識別信息、情緒狀態(tài)信息和語言行為信息;
根據(jù)特征信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別,具體包括:
根據(jù)提取信息、話題識別信息、情緒狀態(tài)信息和語言行為信息,以及用戶歷史操作信息和外部信息,進(jìn)行意圖識別。
進(jìn)一步地,對文本信息進(jìn)行信息提取,獲取提取信息,具體包括:
對文本信息進(jìn)行詞語、語意提取,獲取提取信息;
在獲取提取信息之后,進(jìn)行意圖識別之前,該方法還包括:根據(jù)文本信息和提取信息,修正文本信息。
基于上述任意基于多維度信息的意圖識別方法實施例,進(jìn)一步地,對文本信息進(jìn)行信息提取和/或識別,獲取特征信息,具體包括:對當(dāng)前文本信息進(jìn)行話題識別,獲取當(dāng)前話題信息;
對歷史文本信息進(jìn)行話題識別,獲取歷史話題信息,文本信息包括當(dāng)前文本信息和歷史文本信息,特征信息包括當(dāng)前話題信息和歷史話題信息;
根據(jù)特征信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別,具體包括:
根據(jù)當(dāng)前話題信息、歷史話題信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別。
進(jìn)一步地,對文本信息進(jìn)行信息提取和/或識別,獲取特征信息,具體包括:對當(dāng)前文本信息進(jìn)行情緒識別,獲取當(dāng)前情緒信息;
對歷史文本信息進(jìn)行情緒識別,獲取歷史情緒信息,文本信息包括當(dāng)前文本信息和歷史文本信息,特征信息包括當(dāng)前情緒信息和歷史情緒信息;
根據(jù)特征信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別,具體包括:
根據(jù)當(dāng)前情緒信息、歷史情緒信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別。
第二方面,本發(fā)明提供一種基于多維度信息的意圖識別系統(tǒng),該系統(tǒng)包括信息獲取子系統(tǒng)、特征信息確定子系統(tǒng)和意圖預(yù)測子系統(tǒng),信息獲取子系統(tǒng)用于獲取用戶的文本信息、用戶歷史操作信息和外部信息;特征信息確定子系統(tǒng)用于對文本信息進(jìn)行信息提取和/或識別,獲取特征信息;意圖預(yù)測子系統(tǒng)用于根據(jù)特征信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別,獲取用戶預(yù)測意圖。
進(jìn)一步地,特征信息確定子系統(tǒng)具體用于:對文本信息進(jìn)行信息提取,獲取提取信息;對文本信息進(jìn)行話題識別,獲取話題識別信息;對文本信息進(jìn)行情緒識別,獲取情緒狀態(tài)信息;對文本信息進(jìn)行語言行為識別,獲取語言行為信息,特征信息包括提取信息、話題識別信息、情緒狀態(tài)信息和語言行為信息;
意圖預(yù)測子系統(tǒng)具體用于:根據(jù)提取信息、話題識別信息、情緒狀態(tài)信息和語言行為信息,以及用戶歷史操作信息和外部信息,進(jìn)行意圖識別。
進(jìn)一步地,特征信息確定子系統(tǒng)在對文本信息進(jìn)行信息提取,獲取提取信息時,具體用于:對文本信息進(jìn)行詞語、語意提取,獲取提取信息;該系統(tǒng)還包括文本修正子系統(tǒng),用于根據(jù)文本信息和提取信息,修正文本信息。
基于上述任意基于多維度信息的意圖識別系統(tǒng)實施例,進(jìn)一步地,特征信息確定子系統(tǒng)具體用于:對當(dāng)前文本信息進(jìn)行話題識別,獲取當(dāng)前話題信息;對歷史文本信息進(jìn)行話題識別,獲取歷史話題信息,文本信息包括當(dāng)前文本信息和歷史文本信息,特征信息包括當(dāng)前話題信息和歷史話題信息;
意圖預(yù)測子系統(tǒng)具體用于:根據(jù)當(dāng)前話題信息、歷史話題信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別。
進(jìn)一步地,特征信息確定子系統(tǒng)具體用于:對當(dāng)前文本信息進(jìn)行情緒識別,獲取當(dāng)前情緒信息;對歷史文本信息進(jìn)行情緒識別,獲取歷史情緒信息,文本信息包括當(dāng)前文本信息和歷史文本信息,特征信息包括當(dāng)前情緒信息和歷史情緒信息;
意圖預(yù)測子系統(tǒng)具體用于:根據(jù)當(dāng)前情緒信息、歷史情緒信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別。
由上述技術(shù)方案可知,本發(fā)明基于多維度信息的意圖識別方法及系統(tǒng),能夠通過用戶的文本信息進(jìn)行提取或識別,獲得特征信息。根據(jù)用戶的特征信息和用戶歷史操作信息,結(jié)合外部信息,對用戶意圖進(jìn)行識別,能夠提高意圖識別的精準(zhǔn)度。并且,該方法結(jié)合用戶歷史操作信息,根據(jù)用戶的個性化使用狀態(tài),意圖識別精準(zhǔn)、可靠,數(shù)據(jù)處理效率高,有助于提高用戶體驗。
因此,本發(fā)明基于多維度信息的意圖識別方法及系統(tǒng),能夠提高意圖識別的精準(zhǔn)度和數(shù)據(jù)處理效率,防止意圖預(yù)測失真,增強(qiáng)用戶體驗。
附圖說明
為了更清楚地說明本發(fā)明具體實施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對具體實施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹。在所有附圖中,類似的元件或部分一般由類似的附圖標(biāo)記標(biāo)識。附圖中,各元件或部分并不一定按照實際的比例繪制。
圖1示出了本發(fā)明所提供的一種基于多維度信息的意圖識別方法流程圖;
圖2示出了本發(fā)明所提供的一種基于多維度信息的意圖識別系統(tǒng)結(jié)構(gòu)示意圖;
圖3示出了本發(fā)明所提供的另一種基于多維度信息的意圖識別系統(tǒng)結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合附圖對本發(fā)明技術(shù)方案的實施例進(jìn)行詳細(xì)的描述。以下實施例僅用于更加清楚地說明本發(fā)明的技術(shù)方案,因此只是作為示例,而不能以此來限制本發(fā)明的保護(hù)范圍。
需要注意的是,除非另有說明,本申請使用的技術(shù)術(shù)語或者科學(xué)術(shù)語應(yīng)當(dāng)為本發(fā)明所屬領(lǐng)域技術(shù)人員所理解的通常意義。
第一方面,本發(fā)明實施例提供一種基于多維度信息的意圖識別方法,結(jié)合圖1,該方法包括:
步驟S1,獲取用戶的文本信息、用戶歷史操作信息和外部信息,其中,文本信息可以是用戶輸入的文本語句,用戶歷史操作信息為用戶的操作接口、設(shè)備信息或手機(jī)、計算機(jī)等操作媒介上的使用習(xí)慣信息,外部信息為使用時間、使用地點或當(dāng)前熱門話題、新聞等;
步驟S2,對文本信息進(jìn)行信息提取和/或識別,獲取特征信息;
步驟S3,根據(jù)特征信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別,獲取用戶預(yù)測意圖。
由上述技術(shù)方案可知,本實施例基于多維度信息的意圖識別方法,能夠通過用戶的文本信息進(jìn)行提取或識別,獲得特征信息。根據(jù)用戶的特征信息和用戶歷史操作信息,結(jié)合外部信息,對用戶意圖進(jìn)行識別,能夠提高意圖識別的精準(zhǔn)度。并且,該方法結(jié)合用戶歷史操作信息,根據(jù)用戶的個性化使用狀態(tài),意圖識別精準(zhǔn)、可靠,數(shù)據(jù)處理效率高,有助于提高用戶體驗。
因此,本實施例基于多維度信息的意圖識別方法,能夠提高意圖識別的精準(zhǔn)度和數(shù)據(jù)處理效率,防止意圖預(yù)測失真,增強(qiáng)用戶體驗。
具體地,在獲取特征信息時,該方法具體實現(xiàn)過程如下:
對所述文本信息進(jìn)行信息提取,獲取提取信息,在此,根據(jù)文本信息的語意進(jìn)行信息提?。?/p>
對文本信息進(jìn)行話題識別,獲取話題識別信息,在此,根據(jù)文本信息的話題進(jìn)行識別,如識別主要話題、次要話題等;
對文本信息進(jìn)行情緒識別,獲取情緒狀態(tài)信息;
對文本信息進(jìn)行語言行為識別,獲取語言行為信息,如文本信息的句型、語氣等,特征信息包括提取信息、話題識別信息、情緒狀態(tài)信息和語言行為信息;
根據(jù)特征信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別,具體包括:根據(jù)提取信息、話題識別信息、情緒狀態(tài)信息和語言行為信息,以及用戶歷史操作信息和外部信息,進(jìn)行意圖識別。同時,本實施例基于多維度信息的意圖識別方法還能夠根據(jù)提取信息、話題識別信息、情緒狀態(tài)信息和語言行為信息四種信息中的至少一種,并結(jié)合用戶歷史操作信息和外部信息,進(jìn)行意圖識別。
在此,本實施例基于多維度信息的意圖識別方法,能夠識別或提取出用戶的語意、話題、情緒和語言行為等多方面的信息,為意圖識別提供全面、有效的信息支持,有助于提高意圖識別的準(zhǔn)確度,防止意圖預(yù)測失真。
具體地,在獲取提取信息時,本實施例基于多維度信息的意圖識別方法能夠針對詞語、語意進(jìn)行提取,即對文本信息進(jìn)行詞語、語意提取,獲取提取信息,即結(jié)合文本信息的語意進(jìn)行提取,同時,也會提取關(guān)鍵詞、專有名詞等。在獲取提取信息之后,進(jìn)行意圖識別之前,該方法還包括:根據(jù)文本信息和提取信息,修正文本信息,即結(jié)合文本信息的上下文文意和原始語句,將文本信息的原始語句進(jìn)行修正或改寫,以有利于意圖識別和預(yù)測,降低意圖識別過程的數(shù)據(jù)處理復(fù)雜程度。
為了進(jìn)一步提高意圖識別的準(zhǔn)確性,該方法還能夠?qū)v史文本信息進(jìn)行識別,如進(jìn)行話題識別時,該方法的具體實現(xiàn)過程如下:
對當(dāng)前文本信息進(jìn)行話題識別,獲取當(dāng)前話題信息,如當(dāng)前主要話題、當(dāng)前次要話題、當(dāng)前熱門話題等;
對歷史文本信息進(jìn)行話題識別,獲取歷史話題信息,如主要話題、當(dāng)前次要話題、常聊話題、喜好話題等,歷史文本信息包括當(dāng)前文本信息和歷史文本信息,特征信息包括當(dāng)前話題信息和歷史話題信息;
根據(jù)特征信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別,具體包括:根據(jù)當(dāng)前話題信息、歷史話題信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別。在此,該方法能夠兼顧用戶的歷史話題信息,結(jié)合用戶在討論不同話題時的個性化使用狀況,進(jìn)行用戶意圖識別,有助于增強(qiáng)意圖識別的準(zhǔn)確性。
如進(jìn)行情緒識別時,該方法的具體實現(xiàn)過程如下:
對當(dāng)前文本信息進(jìn)行情緒識別,獲取當(dāng)前情緒信息;
對歷史文本信息進(jìn)行情緒識別,獲取歷史情緒信息,如用戶歷史主要情緒狀態(tài)、用戶歷史次要情緒狀態(tài)等,文本信息包括當(dāng)前文本信息和歷史文本信息,特征信息包括當(dāng)前情緒信息和歷史情緒信息;
根據(jù)特征信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別,具體包括:根據(jù)當(dāng)前情緒信息、歷史情緒信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別。在此,該方法能夠兼顧用戶的歷史情緒信息,結(jié)合用戶在不同情緒下的個性化使用狀況,進(jìn)行用戶意圖識別,有助于增強(qiáng)意圖識別的準(zhǔn)確性。
具體地,在實現(xiàn)上述處理過程中,該方法主要采用邏輯規(guī)則或機(jī)器學(xué)習(xí)等算法,來推論使用者的意圖。在訓(xùn)練階段,該方法透過事先搜集的每個用戶的文本信息,進(jìn)行信息識別、提取,獲取該用戶的提取信息、話題識別信息、情緒狀態(tài)信息和語言行為信息,以及該用戶的歷史操作信息和外部信息,對每種信息進(jìn)行意圖反饋,以更新邏輯運(yùn)算單元個數(shù)、排序方式或機(jī)器學(xué)習(xí)參數(shù)。例如,根據(jù)訓(xùn)練階段中每個用戶的實際意圖狀況和實驗反饋意圖進(jìn)行對比,若對比結(jié)果不一致,則更新邏輯運(yùn)算單元個數(shù)、排序方式或機(jī)器學(xué)習(xí)參數(shù),且重復(fù)進(jìn)行迭代,當(dāng)實際意圖狀況與實驗反饋意圖一致性達(dá)到最高時,則體質(zhì)迭代,且訓(xùn)練完成。在測試階段,當(dāng)使用者輸入一個本文句子時,我們可以通過過往的數(shù)據(jù)訓(xùn)練進(jìn)行推論。
第二方面,本發(fā)明實施例提供一種基于多維度信息的意圖識別系統(tǒng),結(jié)合圖2,該系統(tǒng)包括信息獲取子系統(tǒng)1、特征信息確定子系統(tǒng)2和意圖預(yù)測子系統(tǒng)3,信息獲取子系統(tǒng)1用于獲取用戶的文本信息、用戶歷史操作信息和外部信息;特征信息確定子系統(tǒng)2用于對文本信息進(jìn)行信息提取和/或識別,獲取特征信息;意圖預(yù)測子系統(tǒng)3用于根據(jù)特征信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別,獲取用戶預(yù)測意圖。
由上述技術(shù)方案可知,本實施例基于多維度信息的意圖識別系統(tǒng),能夠通過用戶的文本信息進(jìn)行提取或識別,獲得特征信息。根據(jù)用戶的特征信息和用戶歷史操作信息,結(jié)合外部信息,對用戶意圖進(jìn)行識別,能夠提高意圖識別的精準(zhǔn)度。并且,該系統(tǒng)結(jié)合用戶歷史操作信息,根據(jù)用戶的個性化使用狀態(tài),意圖識別精準(zhǔn)、可靠,數(shù)據(jù)處理效率高,有助于提高用戶體驗。
因此,本實施例基于多維度信息的意圖識別系統(tǒng),能夠提高意圖識別的精準(zhǔn)度和數(shù)據(jù)處理效率,防止意圖預(yù)測失真,增強(qiáng)用戶體驗。
為了進(jìn)一步提高本實施例基于多維度信息的意圖識別系統(tǒng)的準(zhǔn)確性,結(jié)合圖3,特征信息確定子系統(tǒng)2能夠識別多方面的信息,特征信息確定子系統(tǒng)2包括信息提取模塊、話題識別模塊、情緒識別模塊和語言行為識別模塊,其中,信息提取模塊對文本信息進(jìn)行信息提取,獲取提取信息;話題識別模塊對文本信息進(jìn)行話題識別,獲取話題識別信息;情緒識別模塊對文本信息進(jìn)行情緒識別,獲取情緒狀態(tài)信息;語言行為識別模塊對文本信息進(jìn)行語言行為識別,獲取語言行為信息,特征信息包括提取信息、話題識別信息、情緒狀態(tài)信息和語言行為信息;意圖預(yù)測子系統(tǒng)3具體用于:根據(jù)提取信息、話題識別信息、情緒狀態(tài)信息和語言行為信息,以及用戶歷史操作信息和外部信息,進(jìn)行意圖識別。在此,特征信息確定子系統(tǒng)2能夠識別或提取出用戶的語意、話題、情緒和語言行為等多方面的信息,為意圖識別提供全面、有效的信息支持,有助于意圖預(yù)測子系統(tǒng)3提高意圖識別的準(zhǔn)確度,防止意圖預(yù)測失真。
特征信息確定子系統(tǒng)2在對文本信息進(jìn)行信息提取,獲取提取信息時,具體用于:對文本信息進(jìn)行詞語、語意提取,獲取提取信息;該系統(tǒng)還包括文本修正子系統(tǒng),用于根據(jù)文本信息和提取信息,修正文本信息,以有利于意圖識別和預(yù)測,降低意圖識別過程的數(shù)據(jù)處理復(fù)雜程度。
在進(jìn)行話題識別時,特征信息確定子系統(tǒng)2的話題識別模塊具體用于:對當(dāng)前文本信息進(jìn)行話題識別,獲取當(dāng)前話題信息;對歷史文本信息進(jìn)行話題識別,獲取歷史話題信息,文本信息包括當(dāng)前文本信息和歷史文本信息,特征信息包括當(dāng)前話題信息和歷史話題信息;意圖預(yù)測子系統(tǒng)3具體用于:根據(jù)當(dāng)前話題信息、歷史話題信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別。在此,特征信息確定子系統(tǒng)2能夠兼顧用戶的歷史話題信息,為意圖預(yù)測子系統(tǒng)3提供用戶在討論不同話題時的個性化使用狀況,以進(jìn)行用戶意圖識別,有助于增強(qiáng)意圖識別的準(zhǔn)確性。
在進(jìn)行情緒識別時,特征信息確定子系統(tǒng)2的情緒識別模塊具體用于:對當(dāng)前文本信息進(jìn)行情緒識別,獲取當(dāng)前情緒信息;對歷史文本信息進(jìn)行情緒識別,獲取歷史情緒信息,文本信息包括當(dāng)前文本信息和歷史文本信息,特征信息包括當(dāng)前情緒信息和歷史情緒信息;意圖預(yù)測子系統(tǒng)3具體用于:根據(jù)當(dāng)前情緒信息、歷史情緒信息、用戶歷史操作信息和外部信息,進(jìn)行意圖識別。在此,特征信息確定子系統(tǒng)2能夠兼顧用戶的情緒狀況,為意圖預(yù)測子系統(tǒng)3提供用戶在不同情緒時的個性化使用狀況,以進(jìn)行用戶意圖識別,有助于增強(qiáng)意圖識別的準(zhǔn)確性。
最后應(yīng)說明的是:以上各實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對前述各實施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求和說明書的范圍當(dāng)中。