本公開涉及人工智能,尤其涉及一種對話下文生成方法、裝置、電子設(shè)備及介質(zhì)。
背景技術(shù):
1、對話系統(tǒng)在很多ai(artificial?intelligence,人工智能)產(chǎn)品上均有應(yīng)用,例如智能客服、語音助手等。在對話系統(tǒng)中,存在多種對話場景,例如,垂域/任務(wù)多輪對話場景、垂域/任務(wù)單輪對話場景、開放域多輪對話場景以及開放域單輪對話場景等。
2、其中,對于開放域多輪對話場景,相關(guān)技術(shù)中還沒有很好的生成對話下文的方案。
技術(shù)實現(xiàn)思路
1、為克服相關(guān)技術(shù)中存在的問題,本公開提供一種對話下文生成方法、裝置、電子設(shè)備及介質(zhì)。
2、根據(jù)本公開實施例的第一方面,提供一種對話下文生成方法,所述對話下文生成方法包括:
3、獲取當(dāng)前輪對話中的原始上文以及所述當(dāng)前輪對話之前的歷史對話;
4、在基于所述原始上文以及所述歷史對話,確定所述原始上文所屬的對話場景為開放域多輪對話場景的情況下,基于預(yù)先訓(xùn)練的意圖生成模型對所述原始上文以及所述歷史對話進行處理,生成所述當(dāng)前輪對話對應(yīng)的真實上文,所述真實上文為所述原始上文表達的真實對話意圖的完整描述;
5、基于單輪對話場景的應(yīng)答策略,對所述真實上文進行應(yīng)答處理,并將應(yīng)答處理的結(jié)果確定為所述原始上文對應(yīng)的下文,其中,一條上文以及該條上文對應(yīng)的下文構(gòu)成一輪完整對話。
6、可選地,所述方法還包括:
7、基于預(yù)先訓(xùn)練的第一分類模型對所述原始上文以及所述歷史對話進行處理,得到所述對話場景包括的第一子場景的類別;
8、根據(jù)第一子場景的類別以及第二子場景識別策略之間的對應(yīng)關(guān)系,選擇與所述第一子場景的類別對應(yīng)的第二子場景識別策略對所述對話場景包括的第二子場景的類別進行識別,得到所述對話場景包括的第二子場景的類別。
9、可選地,所述根據(jù)第一子場景的類別以及第二子場景識別策略之間的對應(yīng)關(guān)系,選擇與所述第一子場景的類別對應(yīng)的第二子場景識別策略對所述對話場景包括的第二子場景的類別進行識別,得到所述對話場景包括的第二子場景的類別,包括:
10、在所述第一子場景的類別為開放域?qū)υ拡鼍暗那闆r下,基于預(yù)先訓(xùn)練的第二分類模型對所述原始上文以及所述歷史對話進行處理,得到所述對話場景包括的第二子場景的類別;
11、在所述第一子場景的類別為非開放域?qū)υ拡鼍暗那闆r下,提取所述原始上文的意圖以及槽位,和所述歷史對話中的上文以及下文的意圖以及槽位,并根據(jù)提取的意圖以及槽位,確定所述對話場景包括的第二子場景的類別。
12、可選地,所述預(yù)先訓(xùn)練的第二分類模型包括特征提取網(wǎng)絡(luò),所述特征提取網(wǎng)絡(luò)用于提取以下至少一種特征:每輪對話的上文以及下文各自的語義信息,每輪對話的上文以及下文各自的字符串長度,每輪對話的上文包含的疑問詞內(nèi)容,每輪對話的上文包含的疑問詞的個數(shù),相鄰兩輪對話的上文之間的最長子串及長度,相鄰兩輪對話的下文之間的最長子串及長度,相鄰兩輪對話的上文之間的最長共現(xiàn)序列及長度,相鄰兩輪對話的下文之間的最長共現(xiàn)序列及長度,相鄰兩輪對話各自的上文中對應(yīng)拼音的編輯距離,所述原始上文的上輪對話的下文是否屬于開放域?qū)υ拡鼍?,以及所述原始上文的上輪對話的下文是否屬于兜底回答?/p>
13、可選地,所述基于預(yù)先訓(xùn)練的第一分類模型對所述原始上文以及所述歷史對話進行處理,得到所述對話場景包括的第一子場景的類別,包括:
14、基于預(yù)先訓(xùn)練的第一分類模型對所述原始上文以及所述歷史對話進行處理,得到所述第一分類模型的召回結(jié)果;
15、在所述召回結(jié)果包括開放域?qū)υ拡鼍耙约胺情_放域?qū)υ拡鼍暗那闆r下,確定所述第一子場景的類別為所述非開放域?qū)υ拡鼍啊?/p>
16、可選地,所述基于單輪對話場景的應(yīng)答策略,對所述真實上文進行應(yīng)答處理,并將應(yīng)答處理的結(jié)果確定為所述原始上文對應(yīng)的下文,包括:
17、對所述真實上文進行第一子場景的類別識別,得到所述真實上文對應(yīng)的第一子場景的類別,所述第一子場景的類別包括開放域?qū)υ拡鼍?、非開放域?qū)υ拡鼍耙约胺菍υ拡鼍埃?/p>
18、根據(jù)第一子場景的類別以及答復(fù)策略之間的對應(yīng)關(guān)系,選擇與所述真實上文對應(yīng)的第一子場景的類別對應(yīng)的答復(fù)策略對所述真實上文進行應(yīng)答處理,并將應(yīng)答處理的結(jié)果確定為所述原始上文對應(yīng)的下文。
19、可選地,所述方法還包括:
20、在所述對話場景包括的第二子場景的類別為單輪對話場景的情況下,基于單輪對話場景的應(yīng)答策略,對所述原始上文進行應(yīng)答處理,得到所述原始上文對應(yīng)的下文。
21、根據(jù)本公開實施例的第二方面,提供一種對話下文生成裝置,所述對話下文生成裝置包括:
22、獲取模塊,被配置為獲取當(dāng)前輪對話中的原始上文以及所述當(dāng)前輪對話之前的歷史對話;
23、意圖生成模塊,被配置為在基于所述原始上文以及所述歷史對話,確定所述原始上文所屬的對話場景為開放域多輪對話場景的情況下,基于預(yù)先訓(xùn)練的意圖生成模型對所述原始上文以及所述歷史對話進行處理,生成所述當(dāng)前輪對話對應(yīng)的真實上文,所述真實上文為所述原始上文表達的真實對話意圖的完整描述;
24、對話下文生成模塊,被配置為基于單輪對話場景的應(yīng)答策略,對所述真實上文進行應(yīng)答處理,并將應(yīng)答處理的結(jié)果確定為所述原始上文對應(yīng)的下文,其中,一條上文以及該條上文對應(yīng)的下文構(gòu)成一輪完整對話。
25、根據(jù)本公開實施例的第三方面,提供一種電子設(shè)備,所述電子設(shè)備包括:處理器;用于存儲處理器可執(zhí)行指令的存儲器;其中,所述處理器被配置為執(zhí)行時實現(xiàn)第一方面所述方法的步驟。
26、根據(jù)本公開實施例的第四方面,提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序指令,該程序指令被處理器執(zhí)行時實現(xiàn)本公開第一方面所提供的方法的步驟。
27、本公開提供的一種對話下文生成方法、裝置、電子設(shè)備及介質(zhì),在基于所述原始上文以及所述歷史對話,確定所述原始上文所屬的對話場景為開放域多輪對話場景的情況下,基于預(yù)先訓(xùn)練的意圖生成模型對所述原始上文以及所述歷史對話進行處理,生成所述當(dāng)前輪對話對應(yīng)的真實上文,基于單輪對話場景的應(yīng)答策略,對所述真實上文進行應(yīng)答處理,并將應(yīng)答處理的結(jié)果確定為所述原始上文對應(yīng)的下文。通過將原始上文轉(zhuǎn)換為完整表達真實對話意圖的真實上文,可以實現(xiàn)多輪對話到單輪對話的轉(zhuǎn)換,以便于后續(xù)可以通過單輪對話場景的應(yīng)答策略,對所述真實上文進行應(yīng)答處理,以得到原始上文對應(yīng)的較為準(zhǔn)確的下文。
28、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的,并不能限制本公開。
1.一種對話下文生成方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)第一子場景的類別以及第二子場景識別策略之間的對應(yīng)關(guān)系,選擇與所述第一子場景的類別對應(yīng)的第二子場景識別策略對所述對話場景包括的第二子場景的類別進行識別,得到所述對話場景包括的第二子場景的類別,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述預(yù)先訓(xùn)練的第二分類模型包括特征提取網(wǎng)絡(luò),所述特征提取網(wǎng)絡(luò)用于提取以下至少一種特征:每輪對話的上文以及下文各自的語義信息,每輪對話的上文以及下文各自的字符串長度,每輪對話的上文包含的疑問詞內(nèi)容,每輪對話的上文包含的疑問詞的個數(shù),相鄰兩輪對話的上文之間的最長子串及長度,相鄰兩輪對話的下文之間的最長子串及長度,相鄰兩輪對話的上文之間的最長共現(xiàn)序列及長度,相鄰兩輪對話的下文之間的最長共現(xiàn)序列及長度,相鄰兩輪對話各自的上文中對應(yīng)拼音的編輯距離,所述原始上文的上輪對話的下文是否屬于開放域?qū)υ拡鼍埃约八鲈忌衔牡纳陷唽υ挼南挛氖欠駥儆诙档谆卮稹?/p>
5.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述基于預(yù)先訓(xùn)練的第一分類模型對所述原始上文以及所述歷史對話進行處理,得到所述對話場景包括的第一子場景的類別,包括:
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于單輪對話場景的應(yīng)答策略,對所述真實上文進行應(yīng)答處理,并將應(yīng)答處理的結(jié)果確定為所述原始上文對應(yīng)的下文,包括:
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
8.一種對話下文生成裝置,其特征在于,所述裝置包括:
9.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括:
10.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序指令,其特征在于,該程序指令被處理器執(zhí)行時實現(xiàn)權(quán)利要求1~7中任一項所述方法的步驟。