本技術涉及人機對話交互,特別涉及一種對話交互方法及電子設備。
背景技術:
1、目前,隨著人工智能技術的快速發(fā)展,大語言模型在人機對話問答方面得到了廣泛應用,大語言模型基于用戶語音或者用戶輸入文本等對話信息可以給出對應回復信息。
2、現(xiàn)有技術中基于大語言模型的對話交互方法,是采用單一的大語言模型根據(jù)用戶語音或者用戶輸入文本等對話信息輸出對應回復信息。由于不同大語言模型在訓練數(shù)據(jù)、算法架構、參數(shù)設置、優(yōu)化目標等方面存在差異,導致采用不同大語言模型生成回答時都會有不同的優(yōu)勢和局限性。例如,部分大語言模型針對通用基礎知識的回答能力較強,針對特定領域的回答則通常需要使用特定領域?qū)I(yè)數(shù)據(jù)進行微調(diào)訓練后才能達到較好的回答效果;部分大語言模型訓練數(shù)據(jù)較陳舊,只能基于截止到某一時間點的知識進行回復;部分大語言模型具備互聯(lián)網(wǎng)檢索能力,能獲取到最新的知識信息,在知識回答的實時性上較強。因此,針對同一個問題,不同大語言模型給出的回答思路、視角、完整性、專業(yè)性、時效性等均有所不同,單一大模型很難實現(xiàn)較完美的萬能問答能力。也即采用單一大語言模型進行對話交互時,若對話信息并非該大語言模型擅長領域,則存在回復信息片面,不完整或理解偏差的問題。
技術實現(xiàn)思路
1、本技術提供了一種對話交互方法及電子設備,用于解決現(xiàn)有技術存在的采用單一大語言模型在進行對話信息回答時,可能存在回復信息片面、不完整或理解偏差的問題。
2、其中,將第一對話信息輸入至多個第一對話模型中,以使各第一對話模型根據(jù)第一對話信息得到第二對話信息,再將得到的各第二對話信息輸入至第二對話模型,以使第二對話模型對第二對話信息進行融合處理得到第三對話信息,將第三對話信息作為針對第一對話信息的回復信息。如此,基于多個不同的對話模型進行用戶對話交互,并基于第二對話模型得到融合后的對話信息作為回復信息,使得到的回復內(nèi)容更為全面、準確。
3、為解決上述技術問題,第一方面,本技術的實現(xiàn)方式公開了一種對話交互方法,該方法包括:將第一對話信息輸入至多個不同的第一對話模型,以使各第一對話模型根據(jù)第一對話信息得到第二對話信息;將第二對話信息輸入至第二對話模型,以使第二對話模型對第二對話信息進行信息融合處理得到第三對話信息;將第三對話信息作為針對第一對話信息的回復信息。
4、本技術實現(xiàn)方式提供的對話交互方法,將第一對話信息輸入至多個第一對話模型中,以使各第一對話模型根據(jù)第一對話信息得到第二對話信息,再將各第二對話信息輸入至第二對話模型,以使第二對話模型對第二對話信息進行信息融合處理得到第三對話信息,將第三對話信息作為針對第一對話信息的回復信息。如此,基于多個第一對話模型根據(jù)第一對話信息得到多個第二對話信息,并且基于第二對話模型對多個第二對話信息進行信息融合處理得到準確、唯一的第三對話信息作為回復信息。這種基于多個對話模型進行不同維度地對話信息生成以及融合處理的對話交互的方式,使得得到的回復信息內(nèi)容更為全面、準確,提升了對話交互體驗。
5、根據(jù)本技術的另一具體實現(xiàn)方式,本技術的實現(xiàn)方式公開的一種對話交互方法,該方法還包括,第二對話模型通過如下方式對第二對話信息進行信息融合處理得到第三對話信息:若各第二對話信息一致,則將任一第二對話信息作為第三對話信息;若存在第二對話信息不一致的情況,則確定各第一對話模型的參考權重,根據(jù)第一對話信息和各第一對話模型的參考權重,對第二對話信息進行信息融合處理,得到第三對話信息;或者若存在第二對話信息不一致的情況,從第二對話信息中確定出目標對話信息,將目標對話信息輸入至各第一對話模型,以使各第一對話模型根據(jù)目標對話信息得到第四對話信息,直至確定得到的第四對話信息中預設比例的第四對話信息一致,將一致的任一第四對話信息作為第三對話信息。
6、采用上述技術方案,基于第二對話模型對多個第一對話模型生成的第二對話信息進信息融合處理,得到第三對話信息作為回復信息,這種基于多個對話模型進行用戶對話交互的方式,使得得到的回復內(nèi)容更為全面、準確。進一步地,在多個第二對話信息不一致時,根據(jù)第一對話信息和各第一對話模型的參考權重,對第二對話信息進行信息融合處理,得到第三對話信息,或者從第二對話信息中確定出目標對話信息,將目標對話信息輸入至各第一對話模型,以使各第一對話模型根據(jù)目標對話信息得到第四對話信息,直至確定得到的第四對話信息中預設比例的第四對話信息一致,將一致的任一第四對話信息作為第三對話信息。如此,使得第二對話模型能夠得到唯一且準確的回復內(nèi)容,提升了用戶的人機交互體驗。
7、根據(jù)本技術的另一具體實現(xiàn)方式,本技術的實現(xiàn)方式公開的一種對話交互方法,該方法還包括,通過如下方式確定多個不同的第一對話模型:對第一對話信息進行特征提取處理,得到對話特征向量;根據(jù)對話特征向量和預設的分類規(guī)則從多個對話模型中確定出多個不同的第一對話模型。
8、采用上述技術方案,根據(jù)對話特征向量和預設的分類規(guī)則從多個對話模型中確定出多個不同的第一對話模型,如此,能夠根據(jù)第一對話信息的對話特征向量確定出相匹配的第一對話模型,使得第一對話模型根據(jù)第一對話信息得到的第二對話信息為更符合需求的對話信息。
9、根據(jù)本技術的另一具體實現(xiàn)方式,本技術的實現(xiàn)方式公開的一種對話交互方法,對第一對話信息進行特征提取處理,得到對話特征向量,包括:基于預設的特征提取規(guī)則對第一對話信息進行特征提取處理,得到文本長度特征向量和語言特征向量;基于文本分類算法對第一對話信息進行特征提取處理,得到對話類型特征向量;基于第三對話模型對第一對話信息進行特征提取處理,得到目標特征向量;根據(jù)文本長度特征向量、語言特征向量、對話類型特征向量以及目標特征向量得到對話特征向量。
10、采用上述技術方案,根據(jù)文本長度特征向量、語言特征向量、對話類型特征向量以及目標特征向量得到對話特征向量,使得基于第一對話信息的多個特征向量確定第一對話模型,使得得到的第一對話模型為更適合處理該第一對話信息的模型,使得最終得到的回復信息更為準確。
11、根據(jù)本技術的另一具體實現(xiàn)方式,本技術的實現(xiàn)方式公開的一種對話交互方法,基于文本分類算法對第一對話信息進行特征提取處理,得到對話類型特征向量,包括:確定文本分類算法的多個訓練集樣本,以及確定各訓練集樣本的第一文本特征向量;基于文本分類算法根據(jù)第一文本特征向量以及第一對話信息對應的第二文本特征向量,得到對話類型特征向量,第二文本特征向量基于特征提取算法對第一對話信息進行特征提取處理得到。
12、采用上述技術方案,基于文本分類算法根據(jù)第一文本特征向量和各第二文本特征向量得到對話類型特征向量,如此,能夠確定第一對話信息的對話類型,進而基于對話類型特征向量確定出匹配的第一對話模型,使得得到的第一對話模型為更適合處理該第一對話信息的模型,使得最終得到的回復信息更為準確。
13、根據(jù)本技術的另一具體實現(xiàn)方式,本技術的實現(xiàn)方式公開的一種對話交互方法,特征提取算法為tf-idf算法、word2vector算法、glove算法中的其中一種。
14、采用上述技術方案,采用不同算法進行特征提取,使得特征提取更為高效。
15、根據(jù)本技術的另一具體實現(xiàn)方式,本技術的實現(xiàn)方式公開的一種對話交互方法,若特征提取算法為tf-idf算法,該方法還包括,通過以下方式基于特征提取算法對第一對話信息進行特征提取處理得到第二文本特征向量:確定第一對話信息中的分詞的出現(xiàn)次數(shù)和第一對話信息的總分詞數(shù);根據(jù)出現(xiàn)次數(shù)和總分詞數(shù)確定第一對話信息中的分詞的詞頻值;確定訓練集樣本中分詞的出現(xiàn)樣本數(shù)和訓練集樣本的總樣本數(shù);根據(jù)出現(xiàn)樣本數(shù)和總樣本數(shù)確定分詞的逆向文件頻率值;根據(jù)詞頻值和逆向文件頻率值得到分詞的頻率特征向量;將所有分詞的頻率特征向量,作為第一對話信息的第二文本特征向量。
16、采用上述技術方案,基于tf-idf算法確定第一對話信息的第一文本特征向量,使得第一文本特征向量的確定更為準確、高效。
17、根據(jù)本技術的另一具體實現(xiàn)方式,本技術的實現(xiàn)方式公開的一種對話交互方法,該方法還包括,通過如下方式得到分詞的頻率特征向量:
18、
19、其中,tf_idfx為第一對話信息的分詞x的頻率特征向量,tfx為分詞x的詞頻值,freq(x,h)為分詞x在第一對話信息h的出現(xiàn)次數(shù),size(h)為第一對話信息h的總分詞數(shù),idfx為分詞x的逆向文件頻率值,df(x)為分詞x在所有訓練集樣本的出現(xiàn)樣本數(shù),n為總樣本數(shù)。
20、采用上述技術方案,采用計算公式對頻率特征向量進行計算,得到準確的頻率特征向量,進而得到更為準確的第一文本特征向量,使得第一對話信息的對話類型的確定更為準確。
21、根據(jù)本技術的另一具體實現(xiàn)方式,本技術的實現(xiàn)方式公開的一種對話交互方法,基于文本分類算法根據(jù)第一文本特征向量以及第一對話信息對應的第二文本特征向量,得到對話類型特征向量,包括:計算各第一文本特征向量和第二文本特征向量的相似度;根據(jù)相似度從多個訓練集樣本中確定出預設數(shù)量的訓練集樣本,作為目標訓練集樣本;確定目標訓練集樣本的對話類型特征向量,將目標訓練集樣本的對話類型特征向量中重復次數(shù)最多的對話類型特征向量,作為第一對話信息的對話類型特征向量。
22、采用上述技術方案,采用相似度計算方式得到目標訓練集樣本,確定目標訓練集樣本的對話類型特征向量,將目標訓練集樣本的對話類型中重復次數(shù)最多的對話類型特征向量,作為第一對話信息的對話類型特征向量,如此,得到準確的第一對話信息的對話類型特征向量。
23、根據(jù)本技術的另一具體實現(xiàn)方式,本技術的實現(xiàn)方式公開的一種對話交互方法,該方法還包括,通過如下方式得到對話模型的參考權重:確定對話模型對應于對話特征向量的第一得分,以及確定所有對話模型對應于對話特征向量的總得分;根據(jù)第一得分和總得分確定對話模型對應于對話特征向量的參考權重;將對話模型對應于所有對話特征向量的參考權重的總和,作為對話模型的參考權重。
24、采用上述技術方案,通過計算第一對話模型的參考權重,在第二對話模型進行信息融合處理時,考慮對話模型中各第一對話模型的參考權重,進而對第一對話模型的參考權重和第二對話信息進行信息融合處理得到更為準確、更符合需求的第三對話信息。
25、根據(jù)本技術的另一具體實現(xiàn)方式,本技術的實現(xiàn)方式公開的一種對話交互方法,該方法還包括,通過如下方式得到對話模型的參考權重:
26、
27、其中,vi為對話模型i的參考權重,vm,i為對話模型i對應于對話特征向量m的參考權重,n為對話特征向量的數(shù)量,m≤n,sm,i為對話模型i對應于對話特征向量m的第一得分,為對話模型對應于對話特征向量m的總得分,k為對話模型的數(shù)量,i≤k。
28、采用上述技術方案,基于上述計算公式計算得到各對話模型的參考權重,進而能夠得到各第一對話模型的參考權重,使得第一對話模型的參考權重更為準確。
29、根據(jù)本技術的另一具體實現(xiàn)方式,本技術的實現(xiàn)方式公開的一種對話交互方法,各第一對話模型集成在多模型集成框架中,將第一對話信息輸入至多個不同的第一對話模型,包括:基于多模型集成框架的api接口將第一對話信息分別輸入至各第一對話模型。
30、采用上述技術方案,基于多模型集成框架的api接口將第一對話信息分別輸入至各第一對話模型,使得能夠直接基于api接口接入新的對話模型,使得基于多模型的對話交互處理更為高效。
31、第二方面,本技術的實現(xiàn)方式還公開了一種電子設備,包括:處理器,以及與處理器通信連接的存儲器;存儲器存儲計算機程序,處理器執(zhí)行存儲器存儲的計算機程序,以使電子設備實現(xiàn)如上述第一方面任意一種實現(xiàn)方式所提供的對話交互方法。
32、第三方面,本技術的實現(xiàn)方式提供了一種計算機可讀取存儲介質(zhì),計算機可讀存儲介質(zhì)中存儲有計算機程序,計算機程序被處理器執(zhí)行時用于實現(xiàn)如上述第一方面任意一種實現(xiàn)方式所提供的對話交互方法。
33、第四方面,本技術的實現(xiàn)方式提供了一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如上述第一方面任意一種實現(xiàn)方式所提供的對話交互方法。
34、可以理解的是,上述第二方面至第四方面的有益效果也可以參見上述第一方面中的相關描述,在此不再贅述。