本技術屬于人工智能,具體涉及一種業(yè)務關系挖掘方法、裝置、計算機設備及存儲介質。
背景技術:
1、從海量的對話數據中分析和挖掘潛在關系是企業(yè)盤活存量客戶,提升服務質量的關鍵。如何提升關系識別的精準度,保障挖掘出的業(yè)務關系真實有效,這對業(yè)內產品提出了較高的挑戰(zhàn)。以保險銷售場景中的保險線索挖掘為例,傳統(tǒng)方案一般會選用關鍵詞模型識別,通過預先設定關鍵詞集,再通過規(guī)則匹配或者ai匹配模型遍歷對話數據,識別會話中是否出現關鍵詞,從而識別與關鍵詞相關的保險線索。這種方式存在明顯的弊端:1)預設關鍵詞集缺乏泛化能力,為了能夠更多的識別線索需要頻繁修改關鍵詞表,維護成本高;2)傳統(tǒng)方式缺乏對對話內容的語義理解能力,無法結合上下文語境進行精準的意圖識別,會遺漏與關鍵詞無關的保險線索。
技術實現思路
1、本技術實施例的目的在于提出一種業(yè)務關系挖掘方法、裝置、計算機設備及存儲介質,以解決傳統(tǒng)關鍵詞模型識別的業(yè)務關系挖掘存在的泛化力弱且維護成本高,且缺乏語義理解,易遺漏非關鍵詞相關線索的技術問題。
2、為了解決上述技術問題,本技術實施例提供一種業(yè)務關系挖掘方法,采用了如下所述的技術方案:
3、一種業(yè)務關系挖掘方法,包括:
4、獲取業(yè)務數據,識別業(yè)務數據中的關鍵業(yè)務線索,并對關鍵業(yè)務線索進行實體識別和關系抽取,得到關鍵業(yè)務線索中的實體和實體關系;
5、將關鍵業(yè)務線索中的實體和實體關系導入預先構建的業(yè)務領域知識圖譜中,生成目標知識圖譜;
6、對目標知識圖譜中的實體進行關聯分析,確定關聯實體;
7、采用共同鄰居算法對關聯實體進行分析關聯強度分析,生成關聯實體的關聯強度矩陣;
8、基于關聯強度矩陣構建加權無向圖,采用社區(qū)發(fā)現算法和聚類算法對加權無向圖進行聚類分析,得到關聯線索簇,基于關聯線索簇構建業(yè)務數據的業(yè)務關系。
9、進一步地,在將關鍵業(yè)務線索中的實體和實體關系導入預先構建的業(yè)務領域知識圖譜中,生成目標知識圖譜之前,還包括:
10、識別業(yè)務數據對應的業(yè)務領域,并獲取與業(yè)務數據匹配的業(yè)務領域標簽;
11、從圖數據庫查找與業(yè)務領域標簽匹配的知識圖譜架構,得到業(yè)務領域知識圖譜;
12、在獲取業(yè)務數據,識別業(yè)務數據中的關鍵業(yè)務線索,并對關鍵業(yè)務線索進行實體識別和關系抽取,得到關鍵業(yè)務線索中的實體和實體關系之前,還包括:
13、獲取不同業(yè)務領域的歷史業(yè)務數據,并對歷史業(yè)務數據進行分類,得到業(yè)務分類數據;
14、對業(yè)務分類數據進行實體識別和關系抽取,得到業(yè)務分類數據中的實體和實體關系;
15、通過語義標注對業(yè)務分類數據中的實體和實體關系進行結構化處理,得到結構化實體和實體關系;
16、采用本體建模技術將結構化實體和實體關系映射到本體模型中,生成不同業(yè)務領域的業(yè)務領域知識圖譜;
17、將不同業(yè)務領域的業(yè)務領域知識圖譜存儲到圖數據庫中,并為不同業(yè)務領域的業(yè)務領域知識圖譜配置對應的業(yè)務領域標簽。
18、進一步地,對目標知識圖譜中的實體進行關聯分析,確定關聯實體,具體包括:
19、確定目標知識圖譜中兩個實體作為目標實體;
20、通過圖遍歷算法遍歷目標實體之間的路徑,并確定目標實體之間的最短路徑;
21、獲取目標實體的實體屬性和實體關系,基于目標實體的實體屬性和實體關系計算目標實體之間的相似度;
22、基于目標實體之間的最短路徑和目標實體之間的相似度判斷目標實體是否為關聯實體;
23、當目標實體之間的最短路徑小于預設的路徑長度閾值且目標實體之間的相似度大于預設相似度閾值時,判定目標實體為關聯實體。
24、進一步地,采用共同鄰居算法對關聯實體進行分析關聯強度分析,生成關聯實體的關聯強度矩陣,具體包括:
25、識別目標實體中的第一實體的相鄰鄰居節(jié)點,以及識別第二實體的相鄰鄰居節(jié)點,其中,相鄰鄰居節(jié)點包括一階鄰居節(jié)點和二階鄰居節(jié)點;
26、篩選第一實體和第二實體的一階共同鄰居節(jié)點和二階共同鄰居節(jié)點;
27、基于一階共同鄰居節(jié)點和二階共同鄰居節(jié)點的數量計算實體關聯度評分,基于實體關聯度評分構建關聯強度矩陣。
28、進一步地,基于一階共同鄰居節(jié)點和二階共同鄰居節(jié)點的數量計算實體關聯度評分,基于實體關聯度評分構建關聯強度矩陣,具體包括:
29、統(tǒng)計一階共同鄰居節(jié)點的數量,得到第一節(jié)點數量,以及統(tǒng)計二階共同鄰居節(jié)點的數量,得到第二節(jié)點數量;
30、基于第一節(jié)點數量對第一實體進行關聯度評分,得到第一實體關聯度評分,以及基于第二節(jié)點數量對第二實體進行關聯度評分,得到第二實體關聯度評分。
31、將第一實體關聯度評分和第二實體關聯度評分填入預設的初始矩陣中,得到關聯強度矩陣,其中,初始矩陣為二維矩陣。
32、進一步地,基于關聯強度矩陣構建加權無向圖,采用社區(qū)發(fā)現算法和聚類算法對加權無向圖進行聚類分析,得到關聯線索簇,基于關聯線索簇構建業(yè)務數據的業(yè)務關系,具體包括:
33、以實體為節(jié)點,以關聯強度矩陣中的關聯強度為邊權,構建加權無向圖,其中,加權無向圖表征實體結構和關聯強度權重的分布;
34、采用社區(qū)發(fā)現算法對加權無向圖進行區(qū)域劃分,以在加權無向圖上形成若干個社區(qū)區(qū)域;
35、在每一個社區(qū)區(qū)域中使用聚類算法進行節(jié)點聚類,得到關聯線索簇;
36、基于關聯線索簇確定業(yè)務數據實體之間的依賴關系,基于依賴關系生成業(yè)務數據的業(yè)務關系。
37、進一步地,基于關聯線索簇確定業(yè)務數據實體之間的依賴關系,基于依賴關系生成業(yè)務數據的業(yè)務關系,具體包括:
38、通過分析各個關聯線索簇的節(jié)點關系,確定每個關聯線索簇對應的業(yè)務數據實體之間的關聯關系;
39、基于業(yè)務數據實體之間的關聯關系,計算業(yè)務數據實體之間的相似度;
40、基于業(yè)務數據實體之間的相似度確定業(yè)務數據實體之間的依賴關系;
41、基于業(yè)務數據實體之間的相似度和業(yè)務數據實體之間的依賴關系確定業(yè)務數據的業(yè)務關系。
42、為了解決上述技術問題,本技術實施例還提供一種業(yè)務關系挖掘裝置,采用了如下所述的技術方案:
43、一種業(yè)務關系挖掘裝置,包括:
44、實體處理模塊,用于獲取業(yè)務數據,識別業(yè)務數據中的關鍵業(yè)務線索,并對關鍵業(yè)務線索進行實體識別和關系抽取,得到關鍵業(yè)務線索中的實體和實體關系;
45、圖譜構建模塊,用于將關鍵業(yè)務線索中的實體和實體關系導入預先構建的業(yè)務領域知識圖譜中,生成目標知識圖譜;
46、實體關聯模塊,用于對目標知識圖譜中的實體進行關聯分析,確定關聯實體;
47、關聯分析模塊,用于采用共同鄰居算法對關聯實體進行分析關聯強度分析,生成關聯實體的關聯強度矩陣;
48、關系挖掘模塊,用于基于關聯強度矩陣構建加權無向圖,采用社區(qū)發(fā)現算法和聚類算法對加權無向圖進行聚類分析,得到關聯線索簇,基于關聯線索簇構建業(yè)務數據的業(yè)務關系。
49、為了解決上述技術問題,本技術實施例還提供一種計算機設備,采用了如下所述的技術方案:
50、一種計算機設備,包括存儲器和處理器,所述存儲器中存儲有計算機可讀指令,所述處理器執(zhí)行所述計算機可讀指令時實現如上述任一項所述的業(yè)務關系挖掘方法的步驟。
51、為了解決上述技術問題,本技術實施例還提供一種計算機可讀存儲介質,采用了如下所述的技術方案:
52、一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機可讀指令,所述計算機可讀指令被處理器執(zhí)行時實現如上述中任一項所述的業(yè)務關系挖掘方法的步驟。
53、與現有技術相比,本技術實施例主要有以下有益效果:
54、本技術公開一種業(yè)務關系挖掘方法、裝置、計算機設備及存儲介質,屬于人工智能技術領域。首先,通過智能分析業(yè)務數據,精準識別并抽取關鍵業(yè)務線索中的實體及其相互關系,構建初始知識圖譜。隨后,將這些實體與關系融入專業(yè)領域的知識圖譜中,形成目標知識圖譜。接著,利用關聯分析技術識別出高度相關的實體群,并采用共同鄰居算法量化這些關聯強度,構建關聯強度矩陣。最后,基于該矩陣構建加權無向圖,并融合社區(qū)發(fā)現與聚類算法對其進行深入聚類,形成緊密關聯的業(yè)務線索簇。本技術的方案克服了傳統(tǒng)關鍵詞模型進行業(yè)務關系挖掘時存在的局限,通過語義理解與知識圖譜構建,增強業(yè)務關系挖掘的泛化力,降低維護成本,精準捕捉非關鍵詞相關線索,全面揭示業(yè)務關系,提升決策精準度。