本技術(shù)涉及人工智能,具體而言,涉及一種話術(shù)優(yōu)化方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù):
1、當前基于大語言模型(large?language?model,llm)下的智能對話系統(tǒng)中,有一種實現(xiàn)方式是通過檢索向量庫,返回給llm備選話術(shù)之后,llm結(jié)合上下問對備選話術(shù)進行擇優(yōu)選擇,目前評判擇優(yōu)的標準是通過專家經(jīng)驗來干預(yù)llm的話術(shù)選擇能力。
2、但是隨著業(yè)務(wù)復(fù)雜度的提升,通過專家經(jīng)驗對每一個對話進行評判,并且人工干預(yù)llm的話術(shù)選擇的能力效率非常低下,甚至無法客觀反應(yīng)客戶溝通意愿。如何對智能對話系統(tǒng)的話術(shù)選擇進行優(yōu)化,且智能對話效率,是目前急需解決的問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)的一些實施例的目的在于提供一種話術(shù)優(yōu)化方法、裝置、電子設(shè)備及存儲介質(zhì),通過本技術(shù)的實施例的技術(shù)方案,通過獲取客戶終端的對話請求;根據(jù)預(yù)先訓(xùn)練的話術(shù)選擇模型,確定與所述客戶終端的對話請求對應(yīng)的目標話術(shù);其中,所述預(yù)先訓(xùn)練的話術(shù)選擇模型是采用語料數(shù)據(jù)對大語言模型進行訓(xùn)練得到的;所述預(yù)料數(shù)據(jù)是采用預(yù)設(shè)排序方式進行優(yōu)化后得到的,本技術(shù)中通過采用預(yù)設(shè)排序方式對語料數(shù)據(jù)進行優(yōu)化,即根據(jù)權(quán)重大小,增加新的語料或者將權(quán)重值小的語料刪除,從而根據(jù)不同場景實現(xiàn)語料的不斷優(yōu)化,進而生成更符合不同場景下的話術(shù)選擇模型,在接收到客戶終端的對話請求后,能夠更加準確地回復(fù)符合場景的目標話術(shù),提高話術(shù)選擇的準確性。
2、第一方面,本技術(shù)的一些實施例提供了一種話術(shù)優(yōu)化方法,包括:
3、獲取客戶終端的對話請求;
4、根據(jù)預(yù)先訓(xùn)練的話術(shù)選擇模型,確定與所述客戶終端的對話請求對應(yīng)的目標話術(shù);其中,所述預(yù)先訓(xùn)練的話術(shù)選擇模型是采用語料數(shù)據(jù)對大語言模型進行訓(xùn)練得到的;所述預(yù)料數(shù)據(jù)是采用預(yù)設(shè)排序方式進行優(yōu)化后得到的。
5、本技術(shù)的一些實施例通過采用預(yù)設(shè)排序方式對語料數(shù)據(jù)進行優(yōu)化,即根據(jù)權(quán)重大小,增加新的語料或者將權(quán)重值小的語料刪除,從而根據(jù)不同場景實現(xiàn)語料的不斷優(yōu)化,進而生成更符合不同場景下的話術(shù)選擇模型,在接收到客戶終端的對話請求后,能夠更加準確地回復(fù)符合場景的目標話術(shù),提高話術(shù)選擇的準確性。
6、可選地,所述預(yù)先訓(xùn)練的話術(shù)選擇模型通過如下方式獲得:
7、獲取訓(xùn)練語料,其中,所述訓(xùn)練語料至少包括客戶問題、回答話術(shù)和回答響應(yīng),所述回答響應(yīng)的權(quán)重值大于預(yù)設(shè)值;
8、在所述回答響應(yīng)的權(quán)重值大于預(yù)設(shè)值的情況下,根據(jù)所述客戶問題和所述問題答案,對大語言模型進行訓(xùn)練,得到所述話術(shù)選擇模型。
9、本技術(shù)的一些實施例通過歷史對話的數(shù)據(jù),對訓(xùn)練語料進行優(yōu)化修改,然后根據(jù)修改后的訓(xùn)練語料對大語言模型進行訓(xùn)練,得到話術(shù)選擇模型,這樣,可以更有效地學(xué)習(xí)到歷史對話中的信息,更好地符合不同的場景。
10、可選地,所述方法還包括:
11、根據(jù)所述回答響應(yīng)的權(quán)重值的大小,對所述語料數(shù)據(jù)中的客戶問題和/或回答話術(shù)進行修改,其中,所述回答響應(yīng)至少包括命中量、命中率、命中掛斷量、命中掛斷率、命中應(yīng)答量、命中應(yīng)答率、命中之后成交量、命中之后的成交率中的一種或多種。
12、本技術(shù)的一些實施例在模型訓(xùn)練的過程中,不斷學(xué)習(xí)到歷史對話數(shù)據(jù),并根據(jù)回答響應(yīng)的權(quán)重值的大小,對所述語料數(shù)據(jù)中的客戶問題和/或回答話術(shù)進行修改,對訓(xùn)練語料進行不斷優(yōu)化。
13、可選地,所述方法還包括:
14、每隔預(yù)設(shè)時間段對所述回答響應(yīng)的權(quán)重值進行更新。
15、本技術(shù)的一些實施例,每隔預(yù)設(shè)時間段根據(jù)歷史對話數(shù)據(jù)對回答響應(yīng)的權(quán)重值進行更新,提高了模型訓(xùn)練的準確性。
16、可選地,所述方法還包括:
17、在所述回答響應(yīng)的權(quán)重值小于且等于預(yù)設(shè)值的情況下,將與所述回答響應(yīng)對應(yīng)的客戶問題和回答話術(shù)進行刪除。
18、本技術(shù)的一些實施例將訓(xùn)練語料中表現(xiàn)不好的數(shù)據(jù),進行刪除,提高模型訓(xùn)練的準確性。
19、第二方面,本技術(shù)的一些實施例提供了一種話術(shù)優(yōu)化裝置,包括:
20、獲取模塊,用于獲取客戶終端的對話請求;
21、優(yōu)化模塊,用于根據(jù)預(yù)先訓(xùn)練的話術(shù)選擇模型,確定與所述客戶終端的對話請求對應(yīng)的目標話術(shù);其中,所述預(yù)先訓(xùn)練的話術(shù)選擇模型是采用語料數(shù)據(jù)對大語言模型進行訓(xùn)練得到的;所述預(yù)料數(shù)據(jù)是采用預(yù)設(shè)排序方式進行優(yōu)化后得到的。
22、本技術(shù)的一些實施例通過采用預(yù)設(shè)排序方式對語料數(shù)據(jù)進行優(yōu)化,即根據(jù)權(quán)重大小,增加新的語料或者將權(quán)重值小的語料刪除,從而根據(jù)不同場景實現(xiàn)語料的不斷優(yōu)化,進而生成更符合不同場景下的話術(shù)選擇模型,在接收到客戶終端的對話請求后,能夠更加準確地回復(fù)符合場景的目標話術(shù),提高話術(shù)選擇的準確性。
23、可選地,所述裝置還包括模型訓(xùn)練模塊,所述模型訓(xùn)練模塊用于:
24、獲取訓(xùn)練語料,其中,所述訓(xùn)練語料至少包括客戶問題、回答話術(shù)和回答響應(yīng),所述回答響應(yīng)的權(quán)重值大于預(yù)設(shè)值;
25、在所述回答響應(yīng)的權(quán)重值大于預(yù)設(shè)值的情況下,根據(jù)所述客戶問題和所述問題答案,對大語言模型進行訓(xùn)練,得到所述話術(shù)選擇模型。
26、本技術(shù)的一些實施例通過歷史對話的數(shù)據(jù),對訓(xùn)練語料進行優(yōu)化修改,然后根據(jù)修改后的訓(xùn)練語料對大語言模型進行訓(xùn)練,得到話術(shù)選擇模型,這樣,可以更有效地學(xué)習(xí)到歷史對話中的信息,更好地符合不同的場景。
27、可選地,所述模型訓(xùn)練模塊用于:
28、根據(jù)所述回答響應(yīng)的權(quán)重值的大小,對所述語料數(shù)據(jù)中的客戶問題和/或回答話術(shù)進行修改,其中,所述回答響應(yīng)至少包括命中量、命中率、命中掛斷量、命中掛斷率、命中應(yīng)答量、命中應(yīng)答率、命中之后成交量、命中之后的成交率中的一種或多種。
29、本技術(shù)的一些實施例在模型訓(xùn)練的過程中,不斷學(xué)習(xí)到歷史對話數(shù)據(jù),并根據(jù)回答響應(yīng)的權(quán)重值的大小,對所述語料數(shù)據(jù)中的客戶問題和/或回答話術(shù)進行修改,對訓(xùn)練語料進行不斷優(yōu)化。
30、可選地,所述模型訓(xùn)練模塊用于:
31、每隔預(yù)設(shè)時間段對所述回答響應(yīng)的權(quán)重值進行更新。
32、本技術(shù)的一些實施例,每隔預(yù)設(shè)時間段根據(jù)歷史對話數(shù)據(jù)對回答響應(yīng)的權(quán)重值進行更新,提高了模型訓(xùn)練的準確性。
33、可選地,所述模型訓(xùn)練模塊用于:
34、在所述回答響應(yīng)的權(quán)重值小于且等于預(yù)設(shè)值的情況下,將與所述回答響應(yīng)對應(yīng)的客戶問題和回答話術(shù)進行刪除。
35、本技術(shù)的一些實施例將訓(xùn)練語料中表現(xiàn)不好的數(shù)據(jù),進行刪除,提高模型訓(xùn)練的準確性。
36、第三方面,本技術(shù)的一些實施例提供一種電子設(shè)備,包括存儲器、處理器以及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,其中,所述處理器執(zhí)行所述程序時可實現(xiàn)如第一方面任一實施例所述的話術(shù)優(yōu)化方法。
37、第四方面,本技術(shù)的一些實施例提供一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述程序被處理器執(zhí)行時可實現(xiàn)如第一方面任一實施例所述的話術(shù)優(yōu)化方法。
38、第五方面,本技術(shù)的一些實施例提供一種計算機程序產(chǎn)品,所述的計算機程序產(chǎn)品包括計算機程序,其中,所述的計算機程序被處理器執(zhí)行時可實現(xiàn)如第一方面任一實施例所述的話術(shù)優(yōu)化方法。