本發(fā)明涉及基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法及系統(tǒng),屬于機械維修智能問答。
背景技術(shù):
1、在機械維修保障場景中,維修人員經(jīng)常會使用知識問答系統(tǒng)進行知識檢索,以輔助其在維修保障過程中對不熟悉的業(yè)務進行知識補充并指導具體的維修保障操作。因此,如何準確且高效地為維修人員提供維修保障知識,對機械維修保障過程至關(guān)重要。
2、現(xiàn)有技術(shù)中,維修人員在維修保障過程中遇到問題,根據(jù)已有經(jīng)驗無法解決問題時,通常采用知識問答系統(tǒng)進行問題檢索。知識問答系統(tǒng)是一種能夠用準確簡潔的自然語言回答用戶所提出的問題的信息檢索系統(tǒng)。其主要功能包括以下幾個方面:首先知識問答系統(tǒng)能夠?qū)τ脩籼岢龅膯栴}進行理解和分析,包括問題分類、關(guān)鍵詞提取等。系統(tǒng)通過解析問題的語義,確定用戶的意圖;然后系統(tǒng)根據(jù)問題理解的結(jié)果,在龐大的知識庫中進行檢索,包括結(jié)構(gòu)化與非結(jié)構(gòu)化的信息檢索。最后基于知識檢索的結(jié)果,系統(tǒng)能夠生成針對用戶問題的回答。
3、但是,本申請發(fā)明人在實現(xiàn)本申請實施例中發(fā)明技術(shù)方案的過程中,發(fā)現(xiàn)上述技術(shù)存在如下技術(shù)問題:一是應答不夠準確,在某些情況下,系統(tǒng)可能無法準確理解用戶的意圖,導致生成的答案與用戶的期望不符;二是知識管理不統(tǒng)一,在維護faq時,可能會遇到巨大的工作量,知識庫中的信息可能存在重復或不一致的情況,這會影響系統(tǒng)的回答準確性。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的在于提供基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法及系統(tǒng),以解決傳統(tǒng)的軟件在解決故障診斷與排查、預防性維護與保養(yǎng)、技術(shù)支持與指導、維修記錄與檔案管理、培訓與教育和協(xié)作與資源共享中高效知識轉(zhuǎn)化的作用有限的問題。
2、基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法,所述方法包括:
3、利用標注好的維修領域數(shù)據(jù)對大語言模型進行微調(diào),得到微調(diào)后的大語言模型;
4、將查詢問句輸入到微調(diào)后的大語言模型中,輸出所述查詢問句對應的?cypher查詢語句;
5、將cypher查詢語句輸入預先構(gòu)建的知識圖譜雙輪驅(qū)動數(shù)據(jù)庫中,輸出所述cypher查詢語句對應的候選方案;
6、將所述查詢問句與所述候選方案輸入生成模型,生成所述查詢問句對應的維修方案。
7、可選的,所述維修領域數(shù)據(jù),包括:
8、標注業(yè)務人員關(guān)注的問題,將問題進行人工泛化得到核心問題,根據(jù)核心問題構(gòu)建業(yè)務問題;
9、在通用大語言模型中生成或人工標注構(gòu)建cypher查詢語句,并在維修知識圖譜中執(zhí)行cypher查詢語句,對執(zhí)行不正確的語法進行人工改進;
10、將所述業(yè)務問題與cypher查詢語句進行匹配形成問答對形式,然后清洗和增強語料庫質(zhì)量,最后利用清洗增強后形成維修語料,得到維修領域數(shù)據(jù)。
11、可選的,所述問答形式為:{問:維修問題,答:cypher查詢語句}。
12、可選的,所述利用標注好的維修領域數(shù)據(jù)對大語言模型進行微調(diào),得到微調(diào)后的大語言模型,包括:
13、采用訓練集及有監(jiān)督的lora微調(diào)方法,對chatglm2-6b基礎模型下進行訓練,根據(jù)數(shù)據(jù)量、模型參數(shù)量、訓練時長、硬件資源來調(diào)整各項訓練參數(shù),使得損失值達到預設值,且模型學會通過維修問題轉(zhuǎn)換為cypher查詢語句的能力,得到微調(diào)后的大語言模型。
14、可選的,所述將查詢問句輸入到微調(diào)后的大語言模型中,輸出所述查詢問句對應的?cypher查詢語句,包括:
15、對輸入的查詢問句解析識別文本中的實體、關(guān)系、事件的信息并理解實體、關(guān)系、事件的語義關(guān)系;
16、將理解的語義關(guān)系映射到cypher圖查詢語言的語法和結(jié)構(gòu)上,確定查詢的方向和條件;
17、基于查詢的方向和條件構(gòu)建出查詢問句對應的?cypher查詢語句。
18、可選的,所述知識圖譜雙輪驅(qū)動數(shù)據(jù)庫的構(gòu)建包括:
19、采用訓練數(shù)據(jù)集訓練知識抽取模型;
20、利用deepke-llm工具結(jié)合知識抽取模型及提示詞進行實體關(guān)系抽??;
21、對抽取的實體關(guān)系進行人工審核,審核通過的實體關(guān)系加入到維修知識圖譜中,得到知識圖譜雙輪驅(qū)動數(shù)據(jù)庫。
22、可選的,所述生成模型使用chatglm2-6b基礎模型作為生成模型,部署在nvdia4090進行結(jié)果生成。
23、可選的,所述chatglm2-6b基礎模型由輸入層、嵌入層、glm層及輸出層組成。
24、可選的,所述大語言模型由28個glm層組成,每個所述glm層包含一個自注意力機制和一個mlp,用于對輸入序列進行深度處理,并生成輸出序列。
25、基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修系統(tǒng),所述系統(tǒng)包括:
26、微調(diào)模塊,被配置用于利用標注好的維修領域數(shù)據(jù)對大語言模型進行微調(diào),得到微調(diào)后的大語言模型;
27、轉(zhuǎn)換模塊,被配置用于將查詢問句輸入到微調(diào)后的大語言模型中,輸出所述查詢問句對應的?cypher查詢語句;
28、輸出模塊,被配置用于將cypher查詢語句輸入預先構(gòu)建的知識圖譜雙輪驅(qū)動數(shù)據(jù)庫中,輸出所述cypher查詢語句對應的候選方案;
29、查詢模塊,被配置用于將所述查詢問句與所述候選方案輸入生成模型,生成所述查詢問句對應的維修方案。
30、與現(xiàn)有技術(shù)相比,本發(fā)明所達到的有益效果:
31、本發(fā)明大幅度提高診斷效率,支持以多輪對話的方式與維修人員進行交互,利用大語言模型的意圖理解能力快速找出用戶詢問意圖的關(guān)鍵點;
32、本發(fā)明利用大模型+知識圖譜進行推理,將問題分解成各類小問題,然后再逐一檢索出答案,可靠性較高;
33、本發(fā)明通過高效知識積累,用戶積累的維修知識,快速迭代到系統(tǒng)中,使得知識得到快速廣泛的應用。
1.基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述的基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法,其特征在于,所述維修領域數(shù)據(jù),包括:
3.根據(jù)權(quán)利要求2所述的基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法,其特征在于,所述問答形式為:{問:維修問題,答:cypher查詢語句}。
4.根據(jù)權(quán)利要求1所述的基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法,其特征在于,所述利用標注好的維修領域數(shù)據(jù)對大語言模型進行微調(diào),得到微調(diào)后的大語言模型,包括:
5.?根據(jù)權(quán)利要求1所述的基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法,其特征在于,所述將查詢問句輸入到微調(diào)后的大語言模型中,輸出所述查詢問句對應的?cypher查詢語句,包括:
6.根據(jù)權(quán)利要求1所述的基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法,其特征在于,所述知識圖譜雙輪驅(qū)動數(shù)據(jù)庫的構(gòu)建包括:
7.根據(jù)權(quán)利要求1所述的基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法,其特征在于,所述生成模型使用chatglm2-6b基礎模型作為生成模型,部署在nvdia4090進行結(jié)果生成。
8.根據(jù)權(quán)利要求7所述的基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法,其特征在于,所述chatglm2-6b基礎模型由輸入層、嵌入層、glm層及輸出層組成。
9.根據(jù)權(quán)利要求1所述的基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修方法,其特征在于,所述大語言模型由28個glm層組成,每個所述glm層包含一個自注意力機制和一個mlp,用于對輸入序列進行深度處理,并生成輸出序列。
10.基于大語言模型與知識圖譜雙輪驅(qū)動的機械智能問答維修系統(tǒng),其特征在于,所述系統(tǒng)包括: