本技術(shù)涉及人工智能,尤其涉及一種基于對(duì)話的意圖識(shí)別方法和裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、對(duì)話意圖識(shí)別是識(shí)別對(duì)話中每一輪對(duì)話中的用戶意圖,對(duì)話意圖識(shí)別通常應(yīng)用于智能問(wèn)答領(lǐng)域,以便于智能機(jī)器人進(jìn)行答復(fù)時(shí),可以快速輸出符合用戶意圖的答復(fù)語(yǔ)句。
2、相關(guān)技術(shù)中,對(duì)話意圖識(shí)別受到角色和輪次信息的影響,通常做對(duì)話意圖識(shí)別時(shí)會(huì)采用多個(gè)編碼網(wǎng)絡(luò)分別對(duì)句子、角色信息和輪次信息編碼,再將角色表征和輪次表征融入到句子信息中。但是,采用多個(gè)編碼網(wǎng)絡(luò)完成句子、角色信息和輪次信息的編碼處理,不僅增加了模型的復(fù)雜性,還會(huì)增加對(duì)話意圖識(shí)別過(guò)程的計(jì)算量,影響對(duì)話意圖識(shí)別的效率。因此,如何提高對(duì)話意圖識(shí)別的效率,成為了亟待解決的技術(shù)問(wèn)題。
技術(shù)實(shí)現(xiàn)思路
1、本技術(shù)實(shí)施例的主要目的在于提出一種基于對(duì)話的意圖識(shí)別方法和裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),旨在提高對(duì)話意圖識(shí)別的效率。
2、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第一方面提出了一種基于對(duì)話的意圖識(shí)別方法,所述方法包括:
3、獲取原始對(duì)話數(shù)據(jù);其中,所述原始對(duì)話數(shù)據(jù)包括:至少兩個(gè)原始對(duì)話語(yǔ)句和每一所述原始對(duì)話語(yǔ)句的角色信息和輪次信息;
4、根據(jù)預(yù)設(shè)的對(duì)話截取參數(shù)對(duì)所述至少兩個(gè)原始對(duì)話語(yǔ)句進(jìn)行對(duì)話截取,得到至少兩個(gè)候選對(duì)話語(yǔ)句組;其中,每一所述候選對(duì)話語(yǔ)句組包括至少兩個(gè)候選對(duì)話語(yǔ)句,且相鄰兩個(gè)的所述候選對(duì)話語(yǔ)句組之間存在重疊的所述候選對(duì)話語(yǔ)句;
5、將所述角色信息和所述輪次信息補(bǔ)充至所述候選對(duì)話語(yǔ)句,得到目標(biāo)對(duì)話語(yǔ)句;
6、對(duì)所述目標(biāo)對(duì)話語(yǔ)句進(jìn)行編碼處理,得到目標(biāo)對(duì)話編碼數(shù)據(jù);
7、對(duì)所述目標(biāo)對(duì)話編碼數(shù)據(jù)進(jìn)行意圖識(shí)別,得到所述目標(biāo)對(duì)話語(yǔ)句的候選對(duì)話意圖信息和所述候選對(duì)話意圖信息的識(shí)別概率;其中,所述識(shí)別概率表征所述候選對(duì)話意圖信息的識(shí)別準(zhǔn)確程度;
8、根據(jù)所述識(shí)別概率從所述候選對(duì)話意圖信息中篩選出所述目標(biāo)對(duì)話語(yǔ)句的目標(biāo)對(duì)話意圖信息。
9、在一些實(shí)施例,所述對(duì)話截取參數(shù)包括:至少一個(gè)預(yù)設(shè)滑動(dòng)窗口和預(yù)設(shè)重疊句子數(shù)量;所述根據(jù)預(yù)設(shè)的對(duì)話截取參數(shù)對(duì)所述至少兩個(gè)原始對(duì)話語(yǔ)句進(jìn)行對(duì)話截取,得到至少兩個(gè)候選對(duì)話語(yǔ)句組,包括:
10、根據(jù)每一所述預(yù)設(shè)滑動(dòng)窗口對(duì)所述至少兩個(gè)原始對(duì)話語(yǔ)句進(jìn)行對(duì)話截取,得到初步對(duì)話語(yǔ)句組;
11、根據(jù)所述預(yù)設(shè)重疊句子數(shù)量對(duì)每一所述預(yù)設(shè)滑動(dòng)窗口進(jìn)行窗口調(diào)節(jié),得到更新滑動(dòng)窗口;
12、根據(jù)所述更新滑動(dòng)窗口對(duì)所述初步對(duì)話語(yǔ)句組進(jìn)行對(duì)話語(yǔ)句調(diào)整,得到更新對(duì)話語(yǔ)句組;
13、將所述更新對(duì)話語(yǔ)句組進(jìn)行拼接,得到至少兩個(gè)所述候選對(duì)話語(yǔ)句組。
14、在一些實(shí)施例,在所述根據(jù)所述識(shí)別概率從所述候選對(duì)話意圖信息中篩選出所述目標(biāo)對(duì)話語(yǔ)句的目標(biāo)對(duì)話意圖信息之后,所述方法還包括:
15、根據(jù)預(yù)設(shè)的意圖驗(yàn)證信息和所述目標(biāo)對(duì)話意圖信息進(jìn)行損失計(jì)算,得到意圖識(shí)別損失數(shù)據(jù);
16、根據(jù)所述意圖識(shí)別損失數(shù)據(jù)對(duì)所述預(yù)設(shè)重疊句子數(shù)量進(jìn)行調(diào)整,得到更新重疊句子數(shù)量;
17、根據(jù)所述更新重疊句子數(shù)量對(duì)所述候選對(duì)話語(yǔ)句組進(jìn)行調(diào)節(jié)處理,得到優(yōu)化對(duì)話語(yǔ)句組。
18、在一些實(shí)施例,所述將所述角色信息和所述輪次信息補(bǔ)充至所述候選對(duì)話語(yǔ)句,得到目標(biāo)對(duì)話語(yǔ)句,包括:
19、根據(jù)所述角色信息生成角色標(biāo)識(shí);
20、根據(jù)所述輪次信息生成輪次標(biāo)識(shí);
21、對(duì)所述候選對(duì)話語(yǔ)句進(jìn)行插入定位,得到插入定位信息;
22、根據(jù)所述插入定位信息將所述角色標(biāo)識(shí)、所述輪次標(biāo)識(shí)補(bǔ)充至所述候選對(duì)話語(yǔ)句,得到所述目標(biāo)對(duì)話語(yǔ)句。
23、在一些實(shí)施例,所述對(duì)所述目標(biāo)對(duì)話語(yǔ)句進(jìn)行編碼處理,得到目標(biāo)對(duì)話編碼數(shù)據(jù),包括:
24、對(duì)所述目標(biāo)對(duì)話語(yǔ)句進(jìn)行分解處理,得到分解詞語(yǔ);
25、對(duì)每一所述分解詞語(yǔ)進(jìn)行編碼處理,得到初步編碼數(shù)據(jù);其中,所述初步編碼數(shù)據(jù)包括:角色編碼信息、輪次編碼信息、上下文編碼信息和詞編碼信息;
26、將所述角色編碼信息、所述輪次編碼信息和所述上下文編碼信息進(jìn)行融合處理,得到目標(biāo)編碼信息;
27、將所述目標(biāo)編碼信息和所述詞編碼信息進(jìn)行拼接處理,得到所述目標(biāo)對(duì)話編碼數(shù)據(jù)。
28、在一些實(shí)施例,所述根據(jù)所述識(shí)別概率從所述候選對(duì)話意圖信息中篩選出所述目標(biāo)對(duì)話語(yǔ)句的目標(biāo)對(duì)話意圖信息,包括:
29、將同一所述目標(biāo)對(duì)話語(yǔ)句的所述識(shí)別概率進(jìn)行累加計(jì)算,得到目標(biāo)概率;
30、根據(jù)所述目標(biāo)概率從所述候選對(duì)話意圖信息中篩選出所述目標(biāo)對(duì)話語(yǔ)句的所述目標(biāo)對(duì)話意圖信息。
31、在一些實(shí)施例,所述對(duì)所述目標(biāo)對(duì)話編碼數(shù)據(jù)進(jìn)行意圖識(shí)別,得到所述目標(biāo)對(duì)話語(yǔ)句的候選對(duì)話意圖信息和所述候選對(duì)話意圖信息的識(shí)別概率,包括:
32、基于所述目標(biāo)對(duì)話編碼數(shù)據(jù)進(jìn)行意圖分類處理,得到所述候選對(duì)話意圖信息;
33、對(duì)所述候選對(duì)話意圖信息進(jìn)行識(shí)別準(zhǔn)確性評(píng)估,得到所述候選對(duì)話意圖信息的識(shí)別概率。
34、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第二方面提出了一種基于對(duì)話的意圖識(shí)別裝置,所述裝置包括:
35、數(shù)據(jù)獲取模塊,用于獲取原始對(duì)話數(shù)據(jù);其中,所述原始對(duì)話數(shù)據(jù)包括:至少兩個(gè)原始對(duì)話語(yǔ)句和每一所述原始對(duì)話語(yǔ)句的角色信息和輪次信息;
36、對(duì)話截取模塊,用于根據(jù)預(yù)設(shè)的對(duì)話截取參數(shù)對(duì)所述至少兩個(gè)原始對(duì)話語(yǔ)句進(jìn)行對(duì)話截取,得到至少兩個(gè)候選對(duì)話語(yǔ)句組;其中,每一所述候選對(duì)話語(yǔ)句組包括至少兩個(gè)候選對(duì)話語(yǔ)句,且相鄰兩個(gè)的所述候選對(duì)話語(yǔ)句組之間存在重疊的所述候選對(duì)話語(yǔ)句;
37、補(bǔ)充模塊,用于將所述角色信息和所述輪次信息補(bǔ)充至所述候選對(duì)話語(yǔ)句,得到目標(biāo)對(duì)話語(yǔ)句;
38、編碼模塊,用于對(duì)所述目標(biāo)對(duì)話語(yǔ)句進(jìn)行編碼處理,得到目標(biāo)對(duì)話編碼數(shù)據(jù);
39、意圖識(shí)別模塊,用于對(duì)所述目標(biāo)對(duì)話編碼數(shù)據(jù)進(jìn)行意圖識(shí)別,得到所述目標(biāo)對(duì)話語(yǔ)句的候選對(duì)話意圖信息和所述候選對(duì)話意圖信息的識(shí)別概率;其中,所述識(shí)別概率表征所述候選對(duì)話意圖信息的識(shí)別準(zhǔn)確程度;
40、信息篩選模塊,用于根據(jù)所述識(shí)別概率從所述候選對(duì)話意圖信息中篩選出所述目標(biāo)對(duì)話語(yǔ)句的目標(biāo)對(duì)話意圖信息。
41、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第三方面提出了一種計(jì)算機(jī)設(shè)備,所述計(jì)算機(jī)設(shè)備包括存儲(chǔ)器和處理器,所述存儲(chǔ)器存儲(chǔ)有計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)上述第一方面所述的方法。
42、為實(shí)現(xiàn)上述目的,本技術(shù)實(shí)施例的第四方面提出了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述第一方面所述的方法。
43、本技術(shù)提出的基于對(duì)話的意圖識(shí)別方法和裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì),其通過(guò)根據(jù)預(yù)設(shè)的對(duì)話截取參數(shù)對(duì)至少兩個(gè)原始對(duì)話語(yǔ)句中截取出至少兩個(gè)候選對(duì)話語(yǔ)句組,且相鄰的候選對(duì)話語(yǔ)句組之間存在重疊的候選對(duì)話語(yǔ)句,對(duì)每一候選對(duì)話語(yǔ)句組做意圖識(shí)別可以保留上下文的連續(xù)性,提高意圖識(shí)別的準(zhǔn)確性。為了節(jié)省編碼過(guò)程的編碼網(wǎng)絡(luò)的數(shù)量,先將輪次信息和角色信息添加至候選對(duì)話語(yǔ)句形成目標(biāo)對(duì)話語(yǔ)句,再對(duì)目標(biāo)對(duì)話語(yǔ)句編碼成目標(biāo)對(duì)話編碼數(shù)據(jù),然后對(duì)目標(biāo)對(duì)話編碼數(shù)據(jù)進(jìn)行意圖識(shí)別得到候選對(duì)話意圖信息和候選對(duì)話意圖信息的識(shí)別概率,以根據(jù)識(shí)別概率從候選對(duì)話意圖信息中篩選出目標(biāo)對(duì)話語(yǔ)句的目標(biāo)對(duì)話意圖信息。因此,在編碼之前將輪次信息和角色信息先添加候選對(duì)話語(yǔ)句,再進(jìn)行編碼,無(wú)需設(shè)置多個(gè)編碼網(wǎng)絡(luò),簡(jiǎn)化編碼結(jié)構(gòu),減少意圖識(shí)別過(guò)程的運(yùn)算量,提高意圖識(shí)別的效率。