本發(fā)明涉及模型訓(xùn)練,具體涉及信用模型更新方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品。
背景技術(shù):
1、信用評(píng)分是指對(duì)個(gè)人還貸時(shí)發(fā)生違約的風(fēng)險(xiǎn)進(jìn)行量化評(píng)估的活動(dòng)。相關(guān)技術(shù)中,采用logistic回歸模型、基于樹(shù)的方法(cart、xgboost、lightgbm)、神經(jīng)網(wǎng)絡(luò)模型等進(jìn)行信用評(píng)分建模,以評(píng)估債權(quán)人因借款人未履約而遭受損失的可能性,輔助決策。
2、然而,上述方案都是通過(guò)交叉熵?fù)p失、均方誤差損失等作為損失函數(shù)進(jìn)行模型訓(xùn)練,在訓(xùn)練過(guò)程中更加關(guān)注模型的分類(lèi)準(zhǔn)確性,側(cè)重于對(duì)預(yù)測(cè)值與真實(shí)值之間的差異進(jìn)行建模,忽略了信用評(píng)分模型需要正確地將用戶(hù)按照違約風(fēng)險(xiǎn)大小進(jìn)行排序的需求;交叉熵?fù)p失計(jì)算時(shí)涉及對(duì)數(shù)運(yùn)算,會(huì)放大預(yù)測(cè)值和真實(shí)值之間的差距,均方誤差對(duì)每個(gè)樣本的誤差進(jìn)行平方處理,在進(jìn)行模型訓(xùn)練時(shí)對(duì)異常值敏感,而信用評(píng)分領(lǐng)域的用戶(hù)多、數(shù)據(jù)源多樣,會(huì)產(chǎn)生大量異常值,影響到模型的穩(wěn)定性;并且,交叉熵?fù)p失、均方誤差損失都是對(duì)稱(chēng)的損失函數(shù),當(dāng)發(fā)生預(yù)測(cè)錯(cuò)誤時(shí),無(wú)論針對(duì)的客戶(hù)優(yōu)質(zhì)與否,都給予相同的懲罰,但是在信用評(píng)分領(lǐng)域中,若針對(duì)非優(yōu)質(zhì)客戶(hù)發(fā)生預(yù)測(cè)錯(cuò)誤一般會(huì)造成更大的損失,因此通過(guò)上述方案訓(xùn)練得到的信用評(píng)分模型與信用評(píng)分領(lǐng)域的目標(biāo)需求不匹配,影響到預(yù)測(cè)的準(zhǔn)確性。
3、因此,亟需一種能夠?qū)⒂脩?hù)按照違約風(fēng)險(xiǎn)大小進(jìn)行排序且穩(wěn)定性好、準(zhǔn)確性高的信用模型更新方法。
技術(shù)實(shí)現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種信用模型更新方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)及程序產(chǎn)品,以解決相關(guān)技術(shù)中進(jìn)行信用評(píng)分模型訓(xùn)練時(shí)難以將用戶(hù)按照違約風(fēng)險(xiǎn)大小進(jìn)行排序且穩(wěn)定性差、準(zhǔn)確性低的問(wèn)題。
2、第一方面,本發(fā)明提供了一種信用模型更新方法,所述方法包括:
3、獲取信用違約數(shù)據(jù);所述信用違約數(shù)據(jù)包括用戶(hù)信息以及違約情況;
4、基于所述信用違約數(shù)據(jù),構(gòu)建ks統(tǒng)計(jì)量;所述ks統(tǒng)計(jì)量用于指示目標(biāo)模型判斷用戶(hù)違約的準(zhǔn)確性;所述ks統(tǒng)計(jì)量中包括目標(biāo)模型的違約評(píng)分閾值以及目標(biāo)模型的權(quán)重參數(shù);
5、以所述ks統(tǒng)計(jì)量最大為第一更新目標(biāo),更新所述違約評(píng)分閾值,以獲得目標(biāo)閾值;
6、以所述ks統(tǒng)計(jì)量最大為第二更新目標(biāo),更新所述權(quán)重參數(shù),得到更新后的目標(biāo)模型,以判斷用戶(hù)的信用評(píng)分。
7、在一種可選的實(shí)施方式中,所述ks統(tǒng)計(jì)量為:
8、
9、其中,n0是違約用戶(hù)的數(shù)量,n1是未違約用戶(hù)的數(shù)量,yi用于指示第i個(gè)用戶(hù)是否違約,yi=1代表沒(méi)有違約,yi=0代表違約;xi′用于指示第i個(gè)用戶(hù)的信用違約數(shù)據(jù);β為表示目標(biāo)模型的權(quán)重參數(shù);t為違約評(píng)分閾值,用于將目標(biāo)模型輸出的預(yù)測(cè)值分為兩類(lèi),預(yù)測(cè)值小于t代表沒(méi)有違約,預(yù)測(cè)值大于t代表違約;xi′β用于指示用戶(hù)得分,用戶(hù)得分與違約風(fēng)險(xiǎn)成反比;用于指示目標(biāo)模型正確判斷用戶(hù)違約的比例;用于指示目標(biāo)模型將實(shí)際未違約用戶(hù)錯(cuò)誤判斷為發(fā)生違約的比例。
10、在一種可選的實(shí)施方式中,在所述以所述ks統(tǒng)計(jì)量最大為第一更新目標(biāo),更新所述違約評(píng)分閾值之前,所述方法還包括:
11、構(gòu)建用于指示最大化ks(β)統(tǒng)計(jì)量的估計(jì)量公式如下:
12、
13、其中,的初始值設(shè)置為為β的最小二乘估計(jì)。
14、在一種可選的實(shí)施方式中,所述以所述ks統(tǒng)計(jì)量最大為第一更新目標(biāo),更新所述違約評(píng)分閾值,以獲得目標(biāo)閾值,包括:
15、以獲取最大化的目標(biāo)閾值t(0)為第一更新目標(biāo),設(shè)關(guān)于t的分段函數(shù)的截?cái)帱c(diǎn)候選值序列其中,是第i個(gè)用戶(hù)的用戶(hù)得分;
16、將截?cái)帱c(diǎn)候選值序列τ0按升序排列,得到排序后的截?cái)帱c(diǎn)候選值序列其中,用戶(hù)得分從小到大排列;
17、以為初始,通過(guò)以下公式迭代更新
18、
19、當(dāng)達(dá)到最大值時(shí),將此時(shí)的用戶(hù)得分作為目標(biāo)閾值t(0)。
20、在一種可選的實(shí)施方式中,所述以所述ks統(tǒng)計(jì)量最大為第二更新目標(biāo),更新所述權(quán)重參數(shù),包括:
21、逐一更新β,用于指示第s次迭代后的權(quán)重參數(shù),
22、用于指示第s次迭代時(shí)前k-1個(gè)變量已更新,則更新第k個(gè)變量的步驟如下:
23、步驟a1:記截?cái)帱c(diǎn)集合ds,k如下公式:
24、
25、其中,是在第s次迭代時(shí)的第i個(gè)截?cái)帱c(diǎn),t(s)是當(dāng)前的閾值,是與當(dāng)前特征和之前特征有關(guān)的系數(shù),xik是用戶(hù)數(shù)據(jù)的特征值,
26、步驟a2:將截?cái)帱c(diǎn)集合ds,k中的元素按照升序排序,得到
27、步驟a3:當(dāng)i=1時(shí),計(jì)算和
28、當(dāng)i∈[2,n]時(shí),通過(guò)以下網(wǎng)格搜索規(guī)則更新和
29、
30、
31、情形1:
32、情形2:
33、情形3:
34、情形4:
35、情形5:
36、情形6:
37、情形7:
38、情形8:
39、除情形1至8以外的其他情形中,并且
40、步驟a4:計(jì)算令令
41、步驟a5:重復(fù)步驟a1至步驟a4,得到權(quán)重參數(shù)β(s+1)。
42、在一種可選的實(shí)施方式中,所述得到更新后的目標(biāo)模型,包括:
43、重復(fù)所述以所述ks統(tǒng)計(jì)量最大為第一更新目標(biāo),更新所述違約評(píng)分閾值,以獲得目標(biāo)閾值的步驟以及所述步驟a1至步驟a5,直到目標(biāo)模型收斂;其中,目標(biāo)模型收斂條件如下公式:
44、|1-β(s-1)′β(s)|<10-6;
45、獲取模型收斂時(shí)的估計(jì)量采用所述模型收斂時(shí)的估計(jì)量更新目標(biāo)模型,得到更新后的目標(biāo)模型。
46、第二方面,本發(fā)明提供了一種信用模型更新裝置,所述裝置包括:
47、數(shù)據(jù)獲取模塊,用于獲取信用違約數(shù)據(jù);所述信用違約數(shù)據(jù)包括用戶(hù)信息以及違約情況;
48、ks構(gòu)建模塊,用于基于所述信用違約數(shù)據(jù),構(gòu)建ks統(tǒng)計(jì)量;所述ks統(tǒng)計(jì)量用于指示目標(biāo)模型判斷用戶(hù)違約的準(zhǔn)確性;所述ks統(tǒng)計(jì)量中包括目標(biāo)模型的違約評(píng)分閾值以及目標(biāo)模型的權(quán)重參數(shù);
49、目標(biāo)閾值獲取模塊,用于以所述ks統(tǒng)計(jì)量最大為第一更新目標(biāo),更新所述違約評(píng)分閾值,以獲得目標(biāo)閾值;
50、目標(biāo)模型更新模塊,用于以所述ks統(tǒng)計(jì)量最大為第二更新目標(biāo),更新所述權(quán)重參數(shù),得到更新后的目標(biāo)模型,以判斷用戶(hù)的信用評(píng)分。
51、第三方面,本發(fā)明提供了一種計(jì)算機(jī)設(shè)備,包括:存儲(chǔ)器和處理器,存儲(chǔ)器和處理器之間互相通信連接,存儲(chǔ)器中存儲(chǔ)有計(jì)算機(jī)指令,處理器通過(guò)執(zhí)行計(jì)算機(jī)指令,從而執(zhí)行上述第一方面或其對(duì)應(yīng)的任一實(shí)施方式的信用模型更新方法。
52、第四方面,本發(fā)明提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)指令,計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行上述第一方面或其對(duì)應(yīng)的任一實(shí)施方式的信用模型更新方法。
53、第五方面,本發(fā)明提供了一種計(jì)算機(jī)程序產(chǎn)品,包括計(jì)算機(jī)指令,計(jì)算機(jī)指令用于使計(jì)算機(jī)執(zhí)行上述第一方面或其對(duì)應(yīng)的任一實(shí)施方式的信用模型更新方法。
54、本發(fā)明提供的技術(shù)方案可以包括以下有益效果:
55、本發(fā)明提供的信用模型更新方法,通過(guò)選擇一個(gè)最優(yōu)的違約評(píng)分閾值,使得ks統(tǒng)計(jì)量最大化,確保目標(biāo)模型能夠有效地區(qū)分違約和未違約用戶(hù),在確定了最優(yōu)的目標(biāo)閾值后,進(jìn)一步調(diào)整模型的權(quán)重參數(shù),以達(dá)到更高的ks統(tǒng)計(jì)量,能夠使得目標(biāo)模型的排序能力和后續(xù)應(yīng)用時(shí)進(jìn)行判斷的準(zhǔn)確性更強(qiáng),在進(jìn)行信用模型更新時(shí),能夠?qū)⒂脩?hù)按照違約風(fēng)險(xiǎn)大小進(jìn)行排序且穩(wěn)定性好、準(zhǔn)確性高。