本公開(kāi)的實(shí)施例涉及計(jì)算機(jī),具體涉及訓(xùn)練預(yù)測(cè)模型的方法和裝置。
背景技術(shù):
1、供應(yīng)鏈金融目前是中小企業(yè)的一種重要融資渠道,目前金融業(yè)務(wù)模式包括動(dòng)產(chǎn)融資、運(yùn)費(fèi)保理、數(shù)據(jù)貸三種形式。動(dòng)產(chǎn)融資業(yè)務(wù)是指企業(yè)以自有或第三人合法擁有的動(dòng)產(chǎn)或貨權(quán)為抵/質(zhì)押、或銀行對(duì)企業(yè)動(dòng)產(chǎn)或貨權(quán)進(jìn)行監(jiān)管的授信業(yè)務(wù)。
2、當(dāng)前供應(yīng)鏈金融業(yè)務(wù)組在進(jìn)行業(yè)務(wù)拓客時(shí),多傾向于采取用準(zhǔn)入條件直接篩選客戶群體,即基于專(zhuān)家經(jīng)驗(yàn)對(duì)合格的客戶群體設(shè)置硬性條件,把準(zhǔn)入客群找出。然后對(duì)準(zhǔn)入的客群用人工按照經(jīng)驗(yàn)篩選的方式逐一對(duì)客戶進(jìn)行銷(xiāo)售資源分配,等一段時(shí)間后,若物流客戶名單有更新后,需要按照此方式重新進(jìn)行一次。
3、除了完全依賴(lài)經(jīng)驗(yàn)的拓客方式外,一些數(shù)據(jù)挖掘技術(shù)也已經(jīng)在商機(jī)挖掘領(lǐng)域得到了應(yīng)用。在拓客領(lǐng)域,通常數(shù)據(jù)只有單側(cè)標(biāo)簽,即“哪些客戶和我們合作過(guò)”,而缺乏另一側(cè)標(biāo)簽,即“哪些客戶絕不可能和我們合作”,這樣的數(shù)據(jù)結(jié)構(gòu)和異常值檢測(cè)領(lǐng)域較為相似。應(yīng)用一些無(wú)監(jiān)督、半監(jiān)督的方法如knn(k-nearestneighbor,最鄰近結(jié)點(diǎn)),孤立森林、one-class?svm(單類(lèi)支持向量機(jī))等技術(shù)可以類(lèi)似情境下發(fā)揮作用,但是受方法和數(shù)據(jù)的影響,這些方法都有一個(gè)明顯的問(wèn)題就是具備較高的召回率,即有問(wèn)題的案件會(huì)被高概率選出來(lái),但是同時(shí)具備較高的假陽(yáng)性率,即選出來(lái)的案件中有很大比例實(shí)際上沒(méi)有問(wèn)題。
4、完全基于人工經(jīng)驗(yàn)的方式,按照準(zhǔn)入條件篩選出的客戶群體量通常都較大。對(duì)于銷(xiāo)售團(tuán)隊(duì)來(lái)說(shuō),無(wú)法評(píng)估其中商家潛在合作的可能性大小,銷(xiāo)售資源沒(méi)有辦法進(jìn)一步地精細(xì)化分配,遍歷觸達(dá)客戶的話無(wú)異于大海撈針,對(duì)拓客效率有一定的影響。
5、基于數(shù)據(jù)挖掘的技術(shù),由于無(wú)法根據(jù)業(yè)務(wù)方的觸達(dá)效果來(lái)迭代模型,模型無(wú)法主動(dòng)迭代自身精度。同時(shí)適用于本場(chǎng)景的數(shù)據(jù)挖掘方法受限于假陽(yáng)性率過(guò)高的問(wèn)題,傾向于提供更多的名單,其中有不小的比例并非是精準(zhǔn)拓客的目標(biāo)客戶,這對(duì)拓客的效率也有一定的影響。
技術(shù)實(shí)現(xiàn)思路
1、本公開(kāi)的實(shí)施例提出了訓(xùn)練預(yù)測(cè)模型和預(yù)測(cè)客戶合作意向的方法和裝置。
2、第一方面,本公開(kāi)的實(shí)施例提供了一種訓(xùn)練預(yù)測(cè)模型的方法,包括:獲取待合作的至少一個(gè)客戶的特征,其中,所述客戶包括已合作過(guò)的客戶和未合作過(guò)的客戶;將每個(gè)客戶的特征輸入預(yù)測(cè)模型,得到每個(gè)客戶的合作可能性得分;根據(jù)合作可能性得分確定出可能合作的至少一個(gè)目標(biāo)客戶;將目標(biāo)客戶按合作可能性得分由高到低的順序排序,并按預(yù)定比例選取一部分合作可能性得分最高的第一目標(biāo)客戶和一部分合作可能性得分最低的第二目標(biāo)客戶;向所述第一目標(biāo)客戶和所述第二目標(biāo)客戶發(fā)出合作邀約,并接收所述第一目標(biāo)客戶和所述第二目標(biāo)客戶的合作反饋信息;根據(jù)所述合作反饋信息更新已合作過(guò)的客戶和未合作過(guò)的客戶;基于更新后的每個(gè)客戶的特征重新訓(xùn)練所述預(yù)測(cè)模型。
3、在一些實(shí)施例中,所述獲取待合作的至少一個(gè)客戶的特征,包括:獲取合作的準(zhǔn)入條件;獲取最新的客戶信息和已合作的客戶名單;過(guò)濾掉不符合所述準(zhǔn)入條件的客戶信息;從保留的客戶信息中按預(yù)定字段提取出每個(gè)客戶的特征。
4、在一些實(shí)施例中,該方法還包括:若客戶信息中沒(méi)有預(yù)定字段,則對(duì)客戶信息進(jìn)行語(yǔ)義分析,得到與預(yù)定字段同義的特征。
5、在一些實(shí)施例中,所述預(yù)測(cè)模型包括以下至少一種:?jiǎn)晤?lèi)支持向量機(jī)、最近鄰結(jié)節(jié)算法模型、孤立森林。
6、在一些實(shí)施例中,預(yù)測(cè)模型為單類(lèi)支持向量機(jī);以及所述根據(jù)合作可能性得分確定出可能合作的至少一個(gè)目標(biāo)客戶,包括:根據(jù)已合作客戶的非典型的比例將客戶的特征點(diǎn)基于kernel函數(shù)映射到高維空間,訓(xùn)練出超平面;客戶的特征點(diǎn)在超平面上投影得到雙水滴形的區(qū)域;將特征點(diǎn)在下部的水滴形區(qū)域內(nèi)的客戶確定為可能合作的目標(biāo)客戶。
7、第二方面,本公開(kāi)的實(shí)施例提供了一種預(yù)測(cè)客戶合作意向方法,包括:獲取待預(yù)測(cè)的客戶的特征;將所述特征輸入根據(jù)第一方面任一項(xiàng)所述的方法訓(xùn)練的預(yù)測(cè)模型,輸出所述客戶的合作可能性得分。
8、第三方面,本公開(kāi)的實(shí)施例提供了一種訓(xùn)練預(yù)測(cè)模型的裝置,包括:獲取單元,被配置成獲取待合作的至少一個(gè)客戶的特征,其中,所述客戶包括已合作過(guò)的客戶和未合作過(guò)的客戶;預(yù)測(cè)單元,被配置成將每個(gè)客戶的特征輸入預(yù)測(cè)模型,得到每個(gè)客戶的合作可能性得分;確定單元,被配置成根據(jù)合作可能性得分確定出可能合作的至少一個(gè)目標(biāo)客戶;選取單元,被配置成將目標(biāo)客戶按合作可能性得分由高到低的順序排序,并按預(yù)定比例選取一部分合作可能性得分最高的第一目標(biāo)客戶和一部分合作可能性得分最低的第二目標(biāo)客戶;邀約單元,被配置成向所述第一目標(biāo)客戶和所述第二目標(biāo)客戶發(fā)出合作邀約,并接收所述第一目標(biāo)客戶和所述第二目標(biāo)客戶的合作反饋信息;更新單元,被配置成根據(jù)所述合作反饋信息更新已合作過(guò)的客戶和未合作過(guò)的客戶;重訓(xùn)單元,被配置成基于更新后的每個(gè)客戶的特征重新訓(xùn)練所述預(yù)測(cè)模型。
9、在一些實(shí)施例中,所述獲取單元進(jìn)一步被配置成:獲取合作的準(zhǔn)入條件;獲取最新的客戶信息和已合作的客戶名單;過(guò)濾掉不符合所述準(zhǔn)入條件的客戶信息;從保留的客戶信息中按預(yù)定字段提取出每個(gè)客戶的特征。
10、在一些實(shí)施例中,所述獲取單元進(jìn)一步被配置成:若客戶信息中沒(méi)有預(yù)定字段,則對(duì)客戶信息進(jìn)行語(yǔ)義分析,得到與預(yù)定字段同義的特征。
11、在一些實(shí)施例中,所述預(yù)測(cè)模型包括以下至少一種:?jiǎn)晤?lèi)支持向量機(jī)、最近鄰結(jié)節(jié)算法模型、孤立森林。
12、在一些實(shí)施例中,預(yù)測(cè)模型為單類(lèi)支持向量機(jī);以及所述確定單元進(jìn)一步被配置成:根據(jù)已合作客戶的非典型的比例將客戶的特征點(diǎn)基于kernel函數(shù)映射到高維空間,訓(xùn)練出超平面;客戶的特征點(diǎn)在超平面上投影得到雙水滴形的區(qū)域;將特征點(diǎn)在下部的水滴形區(qū)域內(nèi)的客戶確定為可能合作的目標(biāo)客戶。
13、第四方面,本公開(kāi)的實(shí)施例提供了一種預(yù)測(cè)客戶合作意向的裝置,包括:獲取單元,被配置成獲取待預(yù)測(cè)的客戶的特征;預(yù)測(cè)單元,被配置成將所述特征輸入根據(jù)第一方面中任一項(xiàng)所述的方法訓(xùn)練的預(yù)測(cè)模型,輸出所述客戶的合作可能性得分。
14、第五方面,本公開(kāi)的實(shí)施例提供了一種電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,其上存儲(chǔ)有一個(gè)或多個(gè)計(jì)算機(jī)程序,當(dāng)所述一個(gè)或多個(gè)計(jì)算機(jī)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)如第一方面和第二方面中任一項(xiàng)所述的方法。
15、第六方面,本公開(kāi)的實(shí)施例提供了一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面和第二方面中任一項(xiàng)所述的方法。
16、本公開(kāi)實(shí)施例提供的訓(xùn)練預(yù)測(cè)模型的方法和裝置,通過(guò)將半監(jiān)督的主動(dòng)學(xué)習(xí)技術(shù),通過(guò)產(chǎn)品化的方式實(shí)現(xiàn)對(duì)目標(biāo)客戶的動(dòng)態(tài)挖掘,并隨著業(yè)務(wù)觸達(dá)反饋(合作與不合作),自動(dòng)化地迭代數(shù)據(jù)挖掘模型,解決人工拓客依賴(lài)經(jīng)驗(yàn)和效率低下,以及傳統(tǒng)數(shù)據(jù)挖掘無(wú)法及時(shí)根據(jù)反饋提升模型結(jié)果的問(wèn)題,更好地支持業(yè)務(wù)商機(jī)挖掘的目標(biāo)達(dá)成。
1.一種訓(xùn)練預(yù)測(cè)模型的方法,包括:
2.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取待合作的至少一個(gè)客戶的特征,包括:
3.根據(jù)權(quán)利要求2所述的方法,其中,所述方法還包括:
4.根據(jù)權(quán)利要求1所述的方法,其中,所述預(yù)測(cè)模型包括以下至少一種:?jiǎn)晤?lèi)支持向量機(jī)、最近鄰結(jié)節(jié)算法模型、孤立森林。
5.根據(jù)權(quán)利要求4所述的方法,其中,預(yù)測(cè)模型為單類(lèi)支持向量機(jī);以及
6.一種預(yù)測(cè)客戶合作意向的方法,包括:
7.一種訓(xùn)練預(yù)測(cè)模型的裝置,包括:
8.一種預(yù)測(cè)客戶合作意向的裝置,包括:
9.一種電子設(shè)備,包括:
10.一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其中,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-6中任一項(xiàng)所述的方法。