本技術屬于人工智能,具體涉及一種財產(chǎn)線索挖掘方法、裝置、計算機設備及存儲介質。
背景技術:
1、在金融領域內(nèi),不良資產(chǎn)指的是已陷入違約狀態(tài)或確認無法償還的債務資產(chǎn),這類資產(chǎn)因其難以直接轉化為現(xiàn)金流或變現(xiàn)價值極低,往往給金融機構及債權人帶來沉重負擔。為了減輕這一負擔并維護債權人權益,有效清收不良資產(chǎn)顯得尤為重要。而在這一過程中,核心任務在于深入挖掘債務人的財產(chǎn)線索,這些線索是追回欠款、減少損失的關鍵所在。
2、目前,金融機構在應對不良資產(chǎn)時,主要依賴自催、訴訟及委托第三方催收這三種策略,而策略能否有效實施依賴于能否成功挖掘并確認債務人的可執(zhí)行財產(chǎn)線索。因此,面對經(jīng)營困境重重甚至瀕臨破產(chǎn)的企業(yè)債務人,尋找并確認可執(zhí)行的有效財產(chǎn)線索成為了追償工作的重中之重。
3、在技術層面,傳統(tǒng)機器學習技術如支持向量機、神經(jīng)網(wǎng)絡等,雖已被應用于財產(chǎn)線索的挖掘,并取得了一定成效,但其局限性也日益顯現(xiàn)。這些方法高度依賴于復雜的人工特征工程,這不僅增加了操作的難度與成本,還使得模型的表現(xiàn)易受數(shù)據(jù)質量及樣本規(guī)模的限制。
4、因此,探索更加高效、智能且適應性強的技術手段,以優(yōu)化財產(chǎn)線索挖掘過程,成為不良資產(chǎn)清收領域亟待解決的問題。
技術實現(xiàn)思路
1、本技術實施例的目的在于提出一種財產(chǎn)線索挖掘方法、裝置、計算機設備及存儲介質,以解決現(xiàn)有財產(chǎn)線索挖掘方案存在的高度依賴于復雜的人工特征工程,增加了操作的難度與成本,以及使得模型的表現(xiàn)易受數(shù)據(jù)質量及樣本規(guī)模的限制的技術問題。
2、為了解決上述技術問題,本技術實施例提供一種財產(chǎn)線索挖掘方法,采用了如下所述的技術方案:
3、一種財產(chǎn)線索挖掘方法,財產(chǎn)線索挖掘方法應用于財產(chǎn)線索挖掘平臺,財產(chǎn)線索挖掘平臺包括文本處理模型和線索分類模型,財產(chǎn)線索挖掘方法包括:
4、接收財產(chǎn)線索挖掘指令,獲取待處理財產(chǎn)案件的案件文本,得到待處理案件文本;
5、將待處理案件文本導入財產(chǎn)線索挖掘平臺,提取待處理案件文本的摘要信息,得到摘要文本;
6、使用文本處理模型中的詞嵌入矩陣對摘要文本進行語義編碼,得到語義特征向量;
7、基于語義特征向量構建文本特征序列,使用線索分類模型中的卷積核對文本特征序列進行局部卷積操作,得到局部特征向量;
8、對語義特征向量和局部特征向量進行拼接,得到特征融合向量;
9、基于特征融合向量確定與待處理財產(chǎn)案件匹配的目標財產(chǎn)線索標簽,并輸出目標財產(chǎn)線索標簽。
10、進一步地,在使用文本處理模型中的詞嵌入矩陣對摘要文本進行語義編碼,得到語義特征向量的步驟之前,還包括:
11、從預設的案件數(shù)據(jù)庫中獲取第一歷史案件文本;
12、對第一歷史案件文本進行關鍵詞提取,并從第一歷史案件文本的關鍵詞提取結果中篩選法律分詞文本;
13、將法律分詞文本導入預設文本處理模型的原始詞表;
14、對原始詞表進行向量化處理,得到詞嵌入矩陣。
15、進一步地,在對原始詞表進行向量化處理,得到詞嵌入矩陣的步驟之后,還包括:
16、從預設的案件數(shù)據(jù)庫中獲取第二歷史案件文本,并對第二歷史案件文本進行數(shù)據(jù)標注;
17、基于標注后的第二歷史案件文本構建訓練數(shù)據(jù)集和測試數(shù)據(jù)集;
18、使用訓練數(shù)據(jù)集對預設文本處理模型進行預訓練;
19、使用測試數(shù)據(jù)集對完成預訓練的預設文本處理模型進行模型性能測試。
20、進一步地,文本處理模型為基于transformer架構的預訓練語言模型,transformer架構包括若干層編碼層和若干層解碼層結構,使用訓練數(shù)據(jù)集對預設文本處理模型進行預訓練的步驟,具體包括:
21、通過詞嵌入矩陣將訓練數(shù)據(jù)集中歷史案件文本映射為向量表示形式,并構建訓練樣本特征矩陣;
22、將訓練樣本特征矩陣按照特征層級關系依次導入transformer架構的若干層編碼層中,以進行訓練樣本特征的編碼操作;
23、獲取編碼層輸出的特征編碼結果,并將特征編碼結果輸入到解碼層中,以進行編碼特征的解碼操作;
24、獲取特征解碼結果,并將特征解碼結果與歷史案件文本的第一真實標簽進行比較,得到第一預測誤差,其中,第一真實標簽為標注的文本語義標簽;
25、基于第一預測誤差對transformer架構的參數(shù)進行迭代更新,直至模型擬合,得到預設文本處理模型。
26、進一步地,線索分類模型為基于文本卷積神經(jīng)網(wǎng)絡架構的預訓練神經(jīng)網(wǎng)絡模型,文本卷積神經(jīng)網(wǎng)絡中預設有若干個卷積核,在基于語義特征向量構建文本特征序列,使用線索分類模型中的卷積核對文本特征序列進行局部卷積操作,得到局部特征向量的步驟之前,還包括:
27、對編碼層輸出的特征編碼結果進行解析,得到編碼層輸出的特征編碼向量;
28、基于特征編碼向量構建特征編碼序列;
29、在預設線索分類模型中的若干個卷積核中確定適配的目標卷積核;
30、使用目標卷積核對特征編碼序列進行局部卷積操作,得到局部編碼向量;將特征編碼向量和局部編碼向量進行拼接,得到編碼融合向量;
31、基于特征融合向量確定與歷史案件文本匹配的財產(chǎn)線索標簽,得到歷史財產(chǎn)線索標簽;
32、將歷史財產(chǎn)線索標簽與歷史案件文本的第二真實標簽進行比較,得到第二預測誤差,其中,第二真實標簽為標注的財產(chǎn)線索標簽;
33、基于第二預測誤差對線索分類模型的參數(shù)進行迭代更新,直至模型擬合,得到預設文本處理模型。
34、進一步地,基于特征編碼向量構建特征編碼序列的步驟,具體包括:
35、對特征編碼向量進行篩選,獲取高階特征編碼向量;
36、基于高階特征編碼向量構建特征編碼序列。
37、進一步地,在基于第二預測誤差對線索分類模型的參數(shù)進行迭代更新,
38、直至模型擬合,得到預設文本處理模型的步驟之后,還包括:
39、為文本處理模型和線索分類模型配置初始模型權重參數(shù);
40、設置交叉熵損失函數(shù),并基于第一預測誤差和第二預測誤差,且以最小化交叉熵損失函數(shù)為優(yōu)化目標,動態(tài)更新初始模型權重參數(shù),得到最優(yōu)模型權重參數(shù);
41、基于最優(yōu)模型權重參數(shù)在財產(chǎn)線索挖掘平臺中配置文本處理模型和線索分類模型。
42、為了解決上述技術問題,本技術實施例還提供一種財產(chǎn)線索挖掘裝置,采用了如下所述的技術方案:
43、一種財產(chǎn)線索挖掘裝置,財產(chǎn)線索挖掘裝置運行于財產(chǎn)線索挖掘平臺,財產(chǎn)線索挖掘平臺包括文本處理模型和線索分類模型,財產(chǎn)線索挖掘裝置包括:
44、文本提取模塊,用于接收財產(chǎn)線索挖掘指令,獲取待處理財產(chǎn)案件的案件文本,得到待處理案件文本;
45、摘要提取模塊,用于將待處理案件文本導入財產(chǎn)線索挖掘平臺,提取待處理案件文本的摘要信息,得到摘要文本;
46、語義編碼模塊,用于使用文本處理模型中的詞嵌入矩陣對摘要文本進行語義編碼,得到語義特征向量;
47、局部卷積模塊,用于基于語義特征向量構建文本特征序列,使用線索分類模型中的卷積核對文本特征序列進行局部卷積操作,得到局部特征向量;
48、向量拼接模塊,用于對語義特征向量和局部特征向量進行拼接,得到特征融合向量;
49、線索匹配模塊,用于基于特征融合向量確定與待處理財產(chǎn)案件匹配的目標財產(chǎn)線索標簽,并輸出目標財產(chǎn)線索標簽。
50、為了解決上述技術問題,本技術實施例還提供一種計算機設備,采用了如下所述的技術方案:
51、一種計算機設備,包括存儲器和處理器,所述存儲器中存儲有計算機可讀指令,所述處理器執(zhí)行所述計算機可讀指令時實現(xiàn)如上述任一項所述的財產(chǎn)線索挖掘方法的步驟。
52、為了解決上述技術問題,本技術實施例還提供一種計算機可讀存儲介質,采用了如下所述的技術方案:
53、一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機可讀指令,所述計算機可讀指令被處理器執(zhí)行時實現(xiàn)如上述中任一項所述的財產(chǎn)線索挖掘方法的步驟。
54、與現(xiàn)有技術相比,本技術實施例主要有以下有益效果:
55、本技術公開一種財產(chǎn)線索挖掘方法、裝置、計算機設備及存儲介質,屬于人工智能技術領域。通過整合文本處理與線索分類兩個模型于財產(chǎn)線索挖掘平臺中,首先接收案件文本,提取其摘要信息,并運用文本處理模型的詞嵌入矩陣將摘要轉化為語義特征向量,隨后基于語義特征向量構建文本特征序列,并應用線索分類模型的卷積核對序列進行局部特征提取,將局部特征與語義特征融合,形成全面的特征融合向量,最終基于該融合向量精準匹配并輸出與案件相關的目標財產(chǎn)線索標簽。本技術通過自動化提取案件文本摘要、利用詞嵌入矩陣生成語義特征,并結合卷積操作捕捉局部特征,有效解決了傳統(tǒng)財產(chǎn)線索挖掘對人工特征工程的依賴,降低了操作難度與成本。同時,特征融合策略增強了模型的泛化能力,減少對數(shù)據(jù)質量與樣本規(guī)模的依賴,提高了財產(chǎn)線索挖掘的準確性和效率。