本公開(kāi)涉及數(shù)據(jù)處理
技術(shù)領(lǐng)域:
,具體而言,涉及一種模型訓(xùn)練方法、模型訓(xùn)練裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及電子設(shè)備。
背景技術(shù):
:近年來(lái),消費(fèi)信貸迅速發(fā)展,住房、購(gòu)車(chē)、信用卡、助學(xué)貸款等各種貸款義務(wù)規(guī)模不斷擴(kuò)大,日益增長(zhǎng)的信貸規(guī)模給銀行的風(fēng)險(xiǎn)評(píng)估能力帶來(lái)很大的挑戰(zhàn)。銀行為了控制風(fēng)險(xiǎn),不得不采取嚴(yán)格的信貸審核程序,導(dǎo)致貸款手續(xù)過(guò)于復(fù)雜,增加了消費(fèi)信貸的交易成本;為了解決上述問(wèn)題,建立一個(gè)完善的個(gè)人信用體系尤為重要,而個(gè)人信用評(píng)分是該體系中的重要技術(shù)環(huán)節(jié)。目前已有多種統(tǒng)計(jì)模型應(yīng)用于個(gè)人信用評(píng)分,例如logistic回歸、神經(jīng)網(wǎng)絡(luò)技術(shù)、支持向量機(jī)等方法,均有不同程度應(yīng)用于信用評(píng)分建模,但單一模型的問(wèn)題在于分類(lèi)精度不夠高,且面對(duì)信用數(shù)據(jù)變化時(shí)顯得不夠穩(wěn)健。需要說(shuō)明的是,在上述
背景技術(shù):
部分公開(kāi)的信息僅用于加強(qiáng)對(duì)本公開(kāi)的背景的理解,因此可以包括不構(gòu)成對(duì)本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。技術(shù)實(shí)現(xiàn)要素:本公開(kāi)的目的在于提供一種模型訓(xùn)練方法、模型訓(xùn)練裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以及電子設(shè)備,進(jìn)而至少在一定程度上克服由于相關(guān)技術(shù)的限制和缺陷而導(dǎo)致的一個(gè)或者多個(gè)問(wèn)題。根據(jù)本公開(kāi)的一個(gè)方面,提供一種模型訓(xùn)練方法,包括:構(gòu)建一決策函數(shù)模型并對(duì)所述決策函數(shù)模型進(jìn)行訓(xùn)練得到多個(gè)訓(xùn)練樣本的重要性度量值;根據(jù)各所述重要性度量值對(duì)各所述訓(xùn)練樣本進(jìn)行降序排列,并將排序后的各所述訓(xùn)練樣本生成一特征子空間;對(duì)所述特征子空間的各所述訓(xùn)練樣本進(jìn)行分類(lèi)并得到多個(gè)分類(lèi)結(jié)果,將多個(gè)所述分類(lèi)結(jié)果進(jìn)行加權(quán)整合得到一預(yù)測(cè)分?jǐn)?shù);判斷所述預(yù)測(cè)分?jǐn)?shù)是否與預(yù)設(shè)分?jǐn)?shù)相同,并在判斷所述預(yù)測(cè)分?jǐn)?shù)與所述預(yù)設(shè)分?jǐn)?shù)不同時(shí),對(duì)所述決策函數(shù)模型的參數(shù)進(jìn)行調(diào)整。在本公開(kāi)的一種示例性實(shí)施例中,構(gòu)建一決策函數(shù)模型包括:選擇一線(xiàn)性核函數(shù)構(gòu)建決策函數(shù):f(x)=<w,x>+b;其中,f(x)為決策函數(shù),<w,x>為線(xiàn)性核函數(shù),w為重要性度量值,x為自變量,b為常數(shù)。在本公開(kāi)的一種示例性實(shí)施例中,對(duì)所述決策函數(shù)模型進(jìn)行訓(xùn)練得到多個(gè)訓(xùn)練樣本的重要性度量值包括:假定所述決策函數(shù)的約束條件為:yi[(wi,xi)+b]-1≥0;其中,xi為第i個(gè)訓(xùn)練樣本,yi為與所述第i個(gè)訓(xùn)練樣本對(duì)應(yīng)的結(jié)果標(biāo)簽,b為常數(shù),wi為第i個(gè)訓(xùn)練樣本的重要性度量值;將多個(gè)訓(xùn)練樣本以及與多個(gè)所述訓(xùn)練樣本一一對(duì)應(yīng)的結(jié)果標(biāo)簽代入所述約束條件中并判斷所述約束條件是否成立;將約束條件成立的各所述訓(xùn)練樣本所對(duì)應(yīng)的決策函數(shù)組成一最小化特征子集j,其中,j={j1,j2,...,jm},m為使約束條件成立的訓(xùn)練樣本的個(gè)數(shù);對(duì)所述最小化特征子集j中的各訓(xùn)練樣本所對(duì)應(yīng)的決策函數(shù)進(jìn)行泰勒展開(kāi)得到:其中,δj(i)為最小化目標(biāo)函數(shù)j在第i個(gè)訓(xùn)練樣本的增量,δwi為重要性度量值w在第i個(gè)訓(xùn)練樣本的增量,為最小化目標(biāo)函數(shù)j的一階偏導(dǎo)數(shù),為最小化目標(biāo)函數(shù)j的二階偏導(dǎo)數(shù);根據(jù)第i個(gè)所述訓(xùn)練樣本對(duì)所述最小化目標(biāo)函數(shù)的影響得出在所述最小化目標(biāo)函數(shù)的最優(yōu)點(diǎn)上,一階偏導(dǎo)數(shù)為0,求解得到wi。在本公開(kāi)的一種示例性實(shí)施例中,將排序后的各所述各所述訓(xùn)練樣本生成一特征子空間包括:s10,配置一空集的特征序列f以及一特征子集s;其中,f=[],s=[1,…,p],p為排序后的訓(xùn)練樣本的個(gè)數(shù)且p≤m;s20,判斷所述特征子集s是否與φ相同并在判斷所述特征子序列s與φ不相同時(shí),將m個(gè)所述訓(xùn)練樣本生成支持向量;s30,根據(jù)各所述訓(xùn)練樣本的特征值wi計(jì)算所述支持向量中各所述訓(xùn)練樣本的排序規(guī)則ri,其中:ri=(wi)2;s40,根據(jù)所述排序規(guī)則ri的大小,查找到最小排序規(guī)則對(duì)應(yīng)的所述訓(xùn)練樣本的序號(hào),并將所述訓(xùn)練樣本的序號(hào)添加至所述特征序列f中;s50,重復(fù)步驟s30以及步驟s40,直至所述特征子集s與φ相同為止,并將每一次查找到的訓(xùn)練樣本的序號(hào)添加至特征序列f中以得到特征子空間。在本公開(kāi)的一種示例性實(shí)施例中,對(duì)所述特征子空間的各所述訓(xùn)練樣本進(jìn)行分類(lèi)并得到多個(gè)分類(lèi)結(jié)果,將多個(gè)所述分類(lèi)結(jié)果進(jìn)行加權(quán)整合得到一預(yù)測(cè)分?jǐn)?shù)包括:利用多個(gè)分類(lèi)器對(duì)所述特征序列f中的各序號(hào)對(duì)應(yīng)的訓(xùn)練樣本進(jìn)行分類(lèi)得到多個(gè)分類(lèi)結(jié)果;根據(jù)各所述分類(lèi)結(jié)果繪制準(zhǔn)確率與召回率曲線(xiàn),并根據(jù)準(zhǔn)確率與召回率曲線(xiàn)下面積計(jì)算各所述分類(lèi)器的權(quán)重wk,其中:auck為第k個(gè)分類(lèi)器的準(zhǔn)確率與召回率曲線(xiàn)下面積,min(auc)為各所述分類(lèi)器中準(zhǔn)確率與召回率曲線(xiàn)下面積的最小值,max(auc)為各所述分類(lèi)器中準(zhǔn)確率與召回率曲線(xiàn)下面積的最大值;根據(jù)各所述分類(lèi)器的權(quán)重wk對(duì)多個(gè)所述預(yù)測(cè)分?jǐn)?shù)進(jìn)行整合得到所述預(yù)測(cè)分?jǐn)?shù)q,其中:qk為第k個(gè)分類(lèi)器的輸出結(jié)果。在本公開(kāi)的一種示例性實(shí)施例中,所述模型訓(xùn)練方法還包括:獲取包括多個(gè)所述訓(xùn)練樣本以及與多個(gè)所述訓(xùn)練樣本一一對(duì)應(yīng)的結(jié)果標(biāo)簽的樣本集。在本公開(kāi)的一種示例性實(shí)施例中,所述模型訓(xùn)練方法還包括:對(duì)多個(gè)所述訓(xùn)練樣本進(jìn)行數(shù)據(jù)預(yù)處理。在本公開(kāi)的一種示例性實(shí)施例中,所述數(shù)據(jù)預(yù)處理包括數(shù)據(jù)采集、缺失數(shù)據(jù)填補(bǔ)、數(shù)據(jù)異常值處理以及數(shù)據(jù)歸一化中的一種或多種。根據(jù)本公開(kāi)的一個(gè)方面,提供一種模型訓(xùn)練裝置,包括:模型訓(xùn)練模塊,用于構(gòu)建一決策函數(shù)模型并對(duì)所述決策函數(shù)模型進(jìn)行訓(xùn)練得到多個(gè)訓(xùn)練樣本的重要性度量值;特征子空間生成模塊,用于根據(jù)各所述重要性度量值對(duì)各所述訓(xùn)練樣本進(jìn)行降序排列,并將排序后的各所述訓(xùn)練樣本生成一特征子空間;訓(xùn)練樣本分類(lèi)模塊,用于對(duì)所述特征子空間的各所述訓(xùn)練樣本進(jìn)行分類(lèi)并得到多個(gè)分類(lèi)結(jié)果,將多個(gè)所述分類(lèi)結(jié)果進(jìn)行加權(quán)整合得到一預(yù)測(cè)分?jǐn)?shù);參數(shù)調(diào)整模塊,用于判斷所述預(yù)測(cè)分?jǐn)?shù)是否與預(yù)設(shè)分?jǐn)?shù)相同,并在判斷所述預(yù)測(cè)分?jǐn)?shù)與所述預(yù)設(shè)分?jǐn)?shù)不同時(shí),對(duì)所述決策函數(shù)模型的參數(shù)進(jìn)行調(diào)整。根據(jù)本公開(kāi)的一個(gè)方面,提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任意一項(xiàng)所述的模型訓(xùn)練方法。根據(jù)本公開(kāi)的一個(gè)方面,提供一種電子設(shè)備,包括:處理器;以及存儲(chǔ)器,用于存儲(chǔ)所述處理器的可執(zhí)行指令;其中,所述處理器配置為經(jīng)由執(zhí)行所述可執(zhí)行指令來(lái)執(zhí)行上述任意一項(xiàng)所述的模型訓(xùn)練方法。本公開(kāi)一種模型訓(xùn)練方法及裝置,通過(guò)構(gòu)建決策函數(shù)模型并得到多個(gè)訓(xùn)練樣本的重要性度量值,然后對(duì)重要性度量值進(jìn)行降序排列并生成特征子空間,最后對(duì)特征子空間的訓(xùn)練樣本進(jìn)行分類(lèi)并對(duì)分類(lèi)結(jié)果進(jìn)行加權(quán)整合得到預(yù)測(cè)分?jǐn)?shù),最后根據(jù)預(yù)測(cè)分?jǐn)?shù)調(diào)整決策函數(shù)模型;一方面,通過(guò)對(duì)訓(xùn)練樣本的的重要性度量值進(jìn)行排序然后生成一特征子空間,可以提煉出更加精簡(jiǎn)、準(zhǔn)確的訓(xùn)練樣本集,減少了冗余數(shù)據(jù)對(duì)分類(lèi)結(jié)果的影響;另一方面,通過(guò)對(duì)分類(lèi)結(jié)果進(jìn)行加權(quán)整合,得到最終的預(yù)測(cè)分?jǐn)?shù),提高了預(yù)測(cè)分?jǐn)?shù)的準(zhǔn)確性;再一方面,通過(guò)決策函數(shù)模型得到各訓(xùn)練樣本的重要性度量值,不再依賴(lài)專(zhuān)家知識(shí)和業(yè)務(wù)經(jīng)驗(yàn)得出各訓(xùn)練樣本的重要性度量值,由于不同專(zhuān)家看法不同而使得統(tǒng)一訓(xùn)練樣本的重要性度量值不同的問(wèn)題,提高了各訓(xùn)練樣本的重要性度量值的可靠性。應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開(kāi)。附圖說(shuō)明此處的附圖被并入說(shuō)明書(shū)中并構(gòu)成本說(shuō)明書(shū)的一部分,示出了符合本公開(kāi)的實(shí)施例,并與說(shuō)明書(shū)一起用于解釋本公開(kāi)的原理。顯而易見(jiàn)地,下面描述中的附圖僅僅是本公開(kāi)的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1示意性示出一種等級(jí)評(píng)估結(jié)構(gòu)示例圖。圖2示意性示出一種模型訓(xùn)練方法的流程圖。圖3示意性示出一種生成特征子空間的方法流程圖。。圖4示意性示出一種roc曲線(xiàn)示例圖。圖5示意性示出一種模型訓(xùn)練裝置的框圖。圖6示意性示出一種用于實(shí)現(xiàn)上述模型訓(xùn)練方法的電子設(shè)備示例圖。圖7示意性示出一種用于實(shí)現(xiàn)上述模型訓(xùn)練方法的計(jì)算機(jī)存儲(chǔ)介質(zhì)。具體實(shí)施方式現(xiàn)在將參考附圖更全面地描述示例實(shí)施方式。然而,示例實(shí)施方式能夠以多種形式實(shí)施,且不應(yīng)被理解為限于在此闡述的范例;相反,提供這些實(shí)施方式使得本公開(kāi)將更加全面和完整,并將示例實(shí)施方式的構(gòu)思全面地傳達(dá)給本領(lǐng)域的技術(shù)人員。所描述的特征、結(jié)構(gòu)或特性可以以任何合適的方式結(jié)合在一個(gè)或更多實(shí)施方式中。在下面的描述中,提供許多具體細(xì)節(jié)從而給出對(duì)本公開(kāi)的實(shí)施方式的充分理解。然而,本領(lǐng)域技術(shù)人員將意識(shí)到,可以實(shí)踐本公開(kāi)的技術(shù)方案而省略所述特定細(xì)節(jié)中的一個(gè)或更多,或者可以采用其它的方法、組元、裝置、步驟等。在其它情況下,不詳細(xì)示出或描述公知技術(shù)方案以避免喧賓奪主而使得本公開(kāi)的各方面變得模糊。此外,附圖僅為本公開(kāi)的示意性圖解,并非一定是按比例繪制。圖中相同的附圖標(biāo)記表示相同或類(lèi)似的部分,因而將省略對(duì)它們的重復(fù)描述。附圖中所示的一些方框圖是功能實(shí)體,不一定必須與物理或邏輯上獨(dú)立的實(shí)體相對(duì)應(yīng)??梢圆捎密浖问絹?lái)實(shí)現(xiàn)這些功能實(shí)體,或在一個(gè)或多個(gè)硬件模塊或集成電路中實(shí)現(xiàn)這些功能實(shí)體,或在不同網(wǎng)絡(luò)和/或處理器裝置和/或微控制器裝置中實(shí)現(xiàn)這些功能實(shí)體。在一種信用等級(jí)評(píng)估方法中,參考圖1所示,首先確定待評(píng)估目標(biāo),然后構(gòu)建指標(biāo)體系(指標(biāo)體系可以包括x1,年齡;x2,性別;x3,婚姻;…;xn,貸款金額),然后對(duì)指標(biāo)體系進(jìn)行數(shù)據(jù)預(yù)處理,數(shù)據(jù)預(yù)處理可以包括數(shù)據(jù)采集、缺失數(shù)據(jù)填補(bǔ)、異常值處理以及不平衡數(shù)據(jù)處理;當(dāng)數(shù)據(jù)預(yù)處理完成后,進(jìn)行模型設(shè)計(jì)與選擇,然后對(duì)模型進(jìn)行效果測(cè)試與對(duì)比,最后當(dāng)效果測(cè)試與對(duì)比完成后,再對(duì)模型進(jìn)行應(yīng)用。但是,上述信用等級(jí)評(píng)估方法中,體系指標(biāo)的構(gòu)建需要依據(jù)專(zhuān)家知識(shí)和業(yè)務(wù)經(jīng)驗(yàn),指標(biāo)重要性不同專(zhuān)家學(xué)者的看法不同,孰優(yōu)孰劣不能達(dá)成共識(shí);另外,未能考慮到各個(gè)指標(biāo)之間的相互影響,不能消除數(shù)據(jù)中的冗余,無(wú)法保證指標(biāo)的穩(wěn)定性。進(jìn)一步的,上述信用等級(jí)評(píng)估方法在模型設(shè)計(jì)與選擇上,只能選擇單一的算法進(jìn)行設(shè)計(jì)。其中,logistic回歸算法雖然無(wú)需假定特征變量的概率分布,也不要求協(xié)方差齊性,但是分類(lèi)精度不高;決策樹(shù)算法中參數(shù)和規(guī)則的設(shè)置對(duì)最后決策樹(shù)的生成規(guī)模以及預(yù)測(cè)精度有非常大的影響,同時(shí)在很大程度上,也依賴(lài)著專(zhuān)家經(jīng)驗(yàn),需要經(jīng)過(guò)反復(fù)測(cè)試才能獲得合適的決策樹(shù)規(guī)模,并且決策樹(shù)的表現(xiàn)缺乏穩(wěn)健性;貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法,均可以應(yīng)用于個(gè)人信用評(píng)分模型,但它們的精度或穩(wěn)健性均有所欠缺,不能實(shí)現(xiàn)模型建的優(yōu)勢(shì)互補(bǔ)。本示例實(shí)施方式中首先提供了一種模型訓(xùn)練方法。參考圖2所示,該模型訓(xùn)練方法可以包括以下步驟。步驟s210.構(gòu)建一決策函數(shù)模型并對(duì)所述決策函數(shù)模型進(jìn)行訓(xùn)練得到多個(gè)訓(xùn)練樣本的重要性度量值。步驟s220.根據(jù)各所述重要性度量值對(duì)各所述訓(xùn)練樣本進(jìn)行降序排列,并將排序后的各所述訓(xùn)練樣本生成一特征子空間。步驟s230.對(duì)所述特征子空間的各所述訓(xùn)練樣本進(jìn)行分類(lèi)并得到多個(gè)分類(lèi)結(jié)果,將多個(gè)所述分類(lèi)結(jié)果進(jìn)行加權(quán)整合得到一預(yù)測(cè)分?jǐn)?shù)。步驟s240.判斷所述預(yù)測(cè)分?jǐn)?shù)是否與預(yù)設(shè)分?jǐn)?shù)相同,并在判斷所述預(yù)測(cè)分?jǐn)?shù)與所述預(yù)設(shè)分?jǐn)?shù)不同時(shí),對(duì)所述決策函數(shù)模型的參數(shù)進(jìn)行調(diào)整。上述模型訓(xùn)練方法中,一方面,通過(guò)對(duì)訓(xùn)練樣本的的重要性度量值進(jìn)行排序然后生成一特征子空間,可以提煉出更加精簡(jiǎn)、準(zhǔn)確的訓(xùn)練樣本集,減少了冗余數(shù)據(jù)對(duì)分類(lèi)結(jié)果的影響;另一方面,通過(guò)對(duì)分類(lèi)結(jié)果進(jìn)行加權(quán)整合,得到最終的預(yù)測(cè)分?jǐn)?shù),保證了預(yù)測(cè)分?jǐn)?shù)的準(zhǔn)確性;再一方面,通過(guò)決策函數(shù)模型得到各訓(xùn)練樣本的重要性度量值,不再依賴(lài)專(zhuān)家知識(shí)和業(yè)務(wù)經(jīng)驗(yàn)得出各訓(xùn)練樣本的重要性度量值,由于不同專(zhuān)家看法不同而使得統(tǒng)一訓(xùn)練樣本的重要性度量值不同的問(wèn)題,提高了各訓(xùn)練樣本的重要性度量值的可靠性。下面,將對(duì)本示例實(shí)施方式中上述模型訓(xùn)練方法的各步驟進(jìn)行詳細(xì)的說(shuō)明。在步驟s210中,構(gòu)建一決策函數(shù)模型并對(duì)所述決策函數(shù)模型進(jìn)行訓(xùn)練得到多個(gè)訓(xùn)練樣本的重要性度量值。詳細(xì)而言:首先,選擇一線(xiàn)性核函數(shù)構(gòu)建決策函數(shù)f(x),并有f(x)=<w,x>+b;其中,f(x)為決策函數(shù),<w,x>為線(xiàn)性核函數(shù),w為重要性度量值,x為自變量,b為常數(shù);此處需要說(shuō)明的是,對(duì)于線(xiàn)性核函數(shù)<w,x>來(lái)說(shuō),有<w,x>=w·x=wx;因此,上述決策函數(shù)f(x)也可以改寫(xiě)為f(x)=wx+b。其次,假定所述決策函數(shù)的約束條件為:yi[(wi,xi)+b]-1≥0;其中,xi為第i個(gè)訓(xùn)練樣本(訓(xùn)練樣本可以包括訓(xùn)練樣本序號(hào)以及訓(xùn)練樣本序號(hào)所對(duì)應(yīng)的訓(xùn)練樣本內(nèi)容,可以參考下表1所示);yi為與所述第i個(gè)訓(xùn)練樣本對(duì)應(yīng)的結(jié)果標(biāo)簽,yi的取值可以為1或者-1;b為常數(shù);wi為第i個(gè)訓(xùn)練樣本的重要性度量值。在本示例實(shí)施方式中,上述訓(xùn)練樣本可以參考下表1所示:表1訓(xùn)練樣本序號(hào)訓(xùn)練樣本內(nèi)容x1年齡x2性別x3婚姻x4教育程度x5單位類(lèi)型x6職稱(chēng)x7收入x8在本銀行的賬戶(hù)x9儲(chǔ)蓄賬戶(hù)的儲(chǔ)蓄金額x10在本職位的時(shí)間x11家庭凈收入x12貸款金額x13違約記錄……緊接著,將多個(gè)訓(xùn)練樣本以及與多個(gè)所述訓(xùn)練樣本一一對(duì)應(yīng)的結(jié)果標(biāo)簽代入所述約束條件中并判斷所述約束條件是否成立。然后,將約束條件成立的各所述訓(xùn)練樣本所對(duì)應(yīng)的決策函數(shù)組成一最小化特征子集j,其中,j={j1,j2,...,jm},m為使約束條件成立的訓(xùn)練樣本的個(gè)數(shù)。再次,對(duì)所述最小化特征子集j中的各訓(xùn)練樣本所對(duì)應(yīng)的決策函數(shù)進(jìn)行泰勒展開(kāi)得到:其中,δj(i)為最小化目標(biāo)函數(shù)j在第i個(gè)訓(xùn)練樣本的增量,δwi為重要性度量值w在第i個(gè)訓(xùn)練樣本的增量,為最小化目標(biāo)函數(shù)j的一階偏導(dǎo)數(shù),為最小化目標(biāo)函數(shù)j的二階偏導(dǎo)數(shù)。最后,根據(jù)第i個(gè)所述訓(xùn)練樣本對(duì)所述最小化目標(biāo)函數(shù)的影響得出在所述最小化目標(biāo)函數(shù)的最優(yōu)點(diǎn)上,一階偏導(dǎo)數(shù)為0,求解得到wi。在步驟s220中,根據(jù)各所述重要性度量值對(duì)各所述訓(xùn)練樣本進(jìn)行降序排列,并將排序后的各所述訓(xùn)練樣本生成一特征子空間。參考圖3所示,將排序后的各所述訓(xùn)練樣本生成一特征子空間可以包括s10-s50。其中:s10,配置一空集的特征序列f以及一特征子集s;其中,f=[],s=[1,…,p],p為排序后的訓(xùn)練樣本的個(gè)數(shù)且p≤m。s20,判斷所述特征子集s是否與φ相同并在判斷所述特征子序列s與φ不相同時(shí),將m個(gè)所述訓(xùn)練樣本生成支持向量。s30,根據(jù)各所述訓(xùn)練樣本的特征值wi計(jì)算所述支持向量中各所述訓(xùn)練樣本的排序規(guī)則ri,其中:ri=(wi)2。s40,根據(jù)所述排序規(guī)則ri的大小,查找到最小排序規(guī)則對(duì)應(yīng)的所述訓(xùn)練樣本的序號(hào),并將所述訓(xùn)練樣本的序號(hào)添加至所述特征序列f中。s50,重復(fù)步驟s30以及步驟s40,直至所述特征子集s與φ相同為止,并將每一次查找到的訓(xùn)練樣本的序號(hào)添加至特征序列f中以得到特征子空間。在步驟s230中,對(duì)所述特征子空間的各所述訓(xùn)練樣本進(jìn)行分類(lèi)并得到多個(gè)分類(lèi)結(jié)果,將多個(gè)所述分類(lèi)結(jié)果進(jìn)行加權(quán)整合得到一預(yù)測(cè)分?jǐn)?shù)。詳細(xì)而言:首先,利用多個(gè)分類(lèi)器對(duì)所述特征序列f中的各序號(hào)對(duì)應(yīng)的訓(xùn)練樣本進(jìn)行分類(lèi)得到多個(gè)分類(lèi)結(jié)果。在本示例實(shí)施方式中,上述分類(lèi)器可以包括分類(lèi)器包括logistic回歸,貝葉斯網(wǎng)絡(luò)以及支持向量機(jī)等等,也可以包括其他的分類(lèi)器,例如可以是線(xiàn)性分類(lèi)器等,本示例實(shí)施方式對(duì)此不做特殊限制;舉例而言:上述特征序列f中各序號(hào)對(duì)應(yīng)的訓(xùn)練樣本例如可以包括:x3,婚姻;x4,教育程度;x7,收入;x11,家庭凈收入等等,則可以通過(guò)上述分類(lèi)器將訓(xùn)練樣本分為家庭類(lèi):x3,婚姻;x11,家庭凈收入;個(gè)人自身情況:x4,教育程度;x7,收入等等;也可以分為其他的類(lèi)型,本示例實(shí)施方式對(duì)此不做特殊限制。其次,根據(jù)各所述分類(lèi)結(jié)果繪制準(zhǔn)確率與召回率曲線(xiàn),并根據(jù)準(zhǔn)確率與召回率曲線(xiàn)下面積計(jì)算各所述分類(lèi)器的權(quán)重wk,其中:auck為第k個(gè)分類(lèi)器的準(zhǔn)確率與召回率曲線(xiàn)下面積,min(auc)為各所述分類(lèi)器中準(zhǔn)確率與召回率曲線(xiàn)下面積的最小值,max(auc)為各所述分類(lèi)器中準(zhǔn)確率與召回率曲線(xiàn)下面積的最大值。在本示例實(shí)施方式中,上述準(zhǔn)確率與召回率曲線(xiàn)可以參考圖4所示。其中,用于繪制準(zhǔn)確率與召回率曲線(xiàn)的標(biāo)準(zhǔn)可以參考如下表2所示:表2進(jìn)一步的,fprate=fp/n;specificity=1-fprate=tn/n;recall=tp/p;precision=tp/(tp+fp);accuracy=(tp+tn)/(p+n);f-score=precision*recall;其中,n=tn+fp,p=tp+fn。更進(jìn)一步的,利用roc(receiveroperatingcharacteristic,準(zhǔn)確率與召回率曲線(xiàn))作為評(píng)估單一分類(lèi)器總體精確度的參考依據(jù),roc是在tpr和fpr兩個(gè)不同維度上繪制的點(diǎn)圖,結(jié)果越接近左上角,分類(lèi)精度越高;因此,auc(areaundertheroccurve,roc曲線(xiàn)下面積)評(píng)價(jià)標(biāo)準(zhǔn)可以衡量數(shù)據(jù)類(lèi)別在任何分布或者任何錯(cuò)誤代價(jià)下分類(lèi)算法的總體性能。最后,根據(jù)各所述分類(lèi)器的權(quán)重wk對(duì)多個(gè)所述預(yù)測(cè)分?jǐn)?shù)進(jìn)行整合得到所述預(yù)測(cè)分?jǐn)?shù)q,其中:qk為第k個(gè)分類(lèi)器的輸出結(jié)果。在步驟s240中,判斷所述預(yù)測(cè)分?jǐn)?shù)是否與預(yù)設(shè)分?jǐn)?shù)相同,并在判斷所述預(yù)測(cè)分?jǐn)?shù)與所述預(yù)設(shè)分?jǐn)?shù)不同時(shí),對(duì)所述決策函數(shù)模型的參數(shù)進(jìn)行調(diào)整。本公開(kāi)還提供了另一種模型訓(xùn)練方法,該方法還可以包括:獲取包括多個(gè)所述訓(xùn)練樣本以及與多個(gè)所述訓(xùn)練樣本一一對(duì)應(yīng)的結(jié)果標(biāo)簽的樣本集。在本示例實(shí)施方式中,可以獲取一歷史時(shí)間段內(nèi)(例如截止當(dāng)前日期起的前三個(gè)月、六個(gè)月或者八個(gè)月等等,本示例實(shí)施方式對(duì)此不做特殊限制)的數(shù)據(jù)作為樣本集;其中,樣本集可以包括多個(gè)訓(xùn)練樣本,例如上述的xi;以及與各訓(xùn)練樣本一一對(duì)應(yīng)的結(jié)果標(biāo)簽,例如上述的yi,也可以包括其他內(nèi)容,例如可以是該樣本集的獲取日期等等,本示例實(shí)施方式對(duì)此不做特殊限制。在本公開(kāi)的一種示例性實(shí)施方式中,上述模型訓(xùn)練方法還可以包括:對(duì)多個(gè)所述訓(xùn)練樣本進(jìn)行數(shù)據(jù)預(yù)處理。詳細(xì)而言:對(duì)訓(xùn)練樣本進(jìn)行數(shù)據(jù)預(yù)處理可以包括數(shù)據(jù)采集、缺失數(shù)據(jù)填補(bǔ)、數(shù)據(jù)異常值處理以及數(shù)據(jù)歸一化等等,也可以包括數(shù)據(jù)過(guò)濾等,本示例實(shí)施方式對(duì)此不做特殊限制。其中,數(shù)據(jù)采集可以包括對(duì)歷史數(shù)據(jù)的獲取等,例如獲取某一個(gè)歷史時(shí)間內(nèi)的某一個(gè)數(shù)據(jù)表格中的各項(xiàng)數(shù)據(jù)作為訓(xùn)練樣本;缺失數(shù)據(jù)填補(bǔ)可以包括對(duì)各訓(xùn)練樣本的數(shù)據(jù)進(jìn)行補(bǔ)充等,例如在某一樣本集中,訓(xùn)練樣本內(nèi)容所對(duì)應(yīng)的訓(xùn)練樣本序號(hào)為空,則可以對(duì)該訓(xùn)練樣本序號(hào)進(jìn)行補(bǔ)充;數(shù)據(jù)異常值處理可以包括對(duì)各訓(xùn)練樣本出現(xiàn)的數(shù)據(jù)異常進(jìn)行修訂或刪除,例如在某一樣本集中,有一訓(xùn)練樣本為步行上下班,則可以將該訓(xùn)練樣本對(duì)應(yīng)的數(shù)據(jù)刪除掉;數(shù)據(jù)歸一化可以包括對(duì)各訓(xùn)練樣本中出現(xiàn)的數(shù)據(jù)格式不統(tǒng)一的情況進(jìn)行統(tǒng)一,例如出現(xiàn)的數(shù)字有大寫(xiě)有小寫(xiě),還有英文,則可以將其統(tǒng)一成十進(jìn)制的數(shù)字。本示例實(shí)施方式還提供了一種模型訓(xùn)練裝置。參考圖5所示,該模型訓(xùn)練裝置可以包括模型訓(xùn)練模塊510、特征子空間生成模塊520、訓(xùn)練樣本分類(lèi)模塊530以及參數(shù)調(diào)整模塊540。其中:模型訓(xùn)練模塊510可以用于構(gòu)建一決策函數(shù)模型并對(duì)所述決策函數(shù)模型進(jìn)行訓(xùn)練得到多個(gè)訓(xùn)練樣本的重要性度量值。特征子空間生成模塊520可以用于根據(jù)各所述重要性度量值對(duì)各所述訓(xùn)練樣本進(jìn)行降序排列,并將排序后的各所述訓(xùn)練樣本生成一特征子空間。訓(xùn)練樣本分類(lèi)模塊530可以用于對(duì)所述特征子空間的各所述訓(xùn)練樣本進(jìn)行分類(lèi)并得到多個(gè)分類(lèi)結(jié)果,將多個(gè)所述分類(lèi)結(jié)果進(jìn)行加權(quán)整合得到一預(yù)測(cè)分?jǐn)?shù)。參數(shù)調(diào)整模塊540可以用于判斷所述預(yù)測(cè)分?jǐn)?shù)是否與預(yù)設(shè)分?jǐn)?shù)相同,并在判斷所述預(yù)測(cè)分?jǐn)?shù)與所述預(yù)設(shè)分?jǐn)?shù)不同時(shí),對(duì)所述決策函數(shù)模型的參數(shù)進(jìn)行調(diào)整。上述模型訓(xùn)練裝置中各模塊的具體細(xì)節(jié)已經(jīng)在對(duì)應(yīng)的模型訓(xùn)練方法中進(jìn)行了詳細(xì)的描述,因此此處不再贅述。應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了用于動(dòng)作執(zhí)行的設(shè)備的若干模塊或者單元,但是這種劃分并非強(qiáng)制性的。實(shí)際上,根據(jù)本公開(kāi)的實(shí)施方式,上文描述的兩個(gè)或更多模塊或者單元的特征和功能可以在一個(gè)模塊或者單元中具體化。反之,上文描述的一個(gè)模塊或者單元的特征和功能可以進(jìn)一步劃分為由多個(gè)模塊或者單元來(lái)具體化。此外,盡管在附圖中以特定順序描述了本公開(kāi)中方法的各個(gè)步驟,但是,這并非要求或者暗示必須按照該特定順序來(lái)執(zhí)行這些步驟,或是必須執(zhí)行全部所示的步驟才能實(shí)現(xiàn)期望的結(jié)果。附加的或備選的,可以省略某些步驟,將多個(gè)步驟合并為一個(gè)步驟執(zhí)行,以及/或者將一個(gè)步驟分解為多個(gè)步驟執(zhí)行等。通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員易于理解,這里描述的示例實(shí)施方式可以通過(guò)軟件實(shí)現(xiàn),也可以通過(guò)軟件結(jié)合必要的硬件的方式來(lái)實(shí)現(xiàn)。因此,根據(jù)本公開(kāi)實(shí)施方式的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該軟件產(chǎn)品可以存儲(chǔ)在一個(gè)非易失性存儲(chǔ)介質(zhì)(可以是cd-rom,u盤(pán),移動(dòng)硬盤(pán)等)中或網(wǎng)絡(luò)上,包括若干指令以使得一臺(tái)計(jì)算設(shè)備(可以是個(gè)人計(jì)算機(jī)、服務(wù)器、移動(dòng)終端、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行根據(jù)本公開(kāi)實(shí)施方式的方法。在本公開(kāi)的示例性實(shí)施例中,還提供了一種能夠?qū)崿F(xiàn)上述方法的電子設(shè)備。所屬
技術(shù)領(lǐng)域:
的技術(shù)人員能夠理解,本發(fā)明的各個(gè)方面可以實(shí)現(xiàn)為系統(tǒng)、方法或程序產(chǎn)品。因此,本發(fā)明的各個(gè)方面可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件實(shí)施方式、完全的軟件實(shí)施方式(包括固件、微代碼等),或硬件和軟件方面結(jié)合的實(shí)施方式,這里可以統(tǒng)稱(chēng)為“電路”、“模塊”或“系統(tǒng)”。下面參照?qǐng)D6來(lái)描述根據(jù)本發(fā)明的這種實(shí)施方式的電子設(shè)備600。圖6顯示的電子設(shè)備600僅僅是一個(gè)示例,不應(yīng)對(duì)本發(fā)明實(shí)施例的功能和使用范圍帶來(lái)任何限制。如圖6所示,電子設(shè)備600以通用計(jì)算設(shè)備的形式表現(xiàn)。電子設(shè)備600的組件可以包括但不限于:上述至少一個(gè)處理單元610、上述至少一個(gè)存儲(chǔ)單元620、連接不同系統(tǒng)組件(包括存儲(chǔ)單元620和處理單元610)的總線(xiàn)630、顯示單元640。其中,所述存儲(chǔ)單元存儲(chǔ)有程序代碼,所述程序代碼可以被所述處理單元610執(zhí)行,使得所述處理單元610執(zhí)行本說(shuō)明書(shū)上述“示例性方法”部分中描述的根據(jù)本發(fā)明各種示例性實(shí)施方式的步驟。例如,所述處理單元610可以執(zhí)行如圖2中所示的步驟s110:檢測(cè)是否接收到第一觸控起始操作,并在檢測(cè)接收到所述第一觸控起始操作時(shí)判斷所述第一觸控起始操作是否發(fā)生所述第二區(qū)域步驟s120:在判斷所述第一觸控起始操作發(fā)生在所述第二區(qū)域時(shí),控制所述虛擬對(duì)象根據(jù)與所述第一觸控起始操作連續(xù)的滑動(dòng)操作移動(dòng);步驟s130:檢測(cè)是否接收到與所述滑動(dòng)操作連續(xù)的第一觸控結(jié)束操作并在檢測(cè)接收到所述第一觸控結(jié)束操作時(shí),判斷所述第一觸控結(jié)束操作是否發(fā)生在所述第一子區(qū)域;步驟s140:在判斷所述第一觸控結(jié)束操作發(fā)生在所述第一子區(qū)域時(shí),控制所述虛擬對(duì)象進(jìn)入轉(zhuǎn)向狀態(tài)以在所述轉(zhuǎn)向狀態(tài)下根據(jù)目標(biāo)轉(zhuǎn)動(dòng)方向控制轉(zhuǎn)向。存儲(chǔ)單元620可以包括易失性存儲(chǔ)單元形式的可讀介質(zhì),例如隨機(jī)存取存儲(chǔ)單元(ram)6201和/或高速緩存存儲(chǔ)單元6202,還可以進(jìn)一步包括只讀存儲(chǔ)單元(rom)6203。存儲(chǔ)單元620還可以包括具有一組(至少一個(gè))程序模塊6205的程序/實(shí)用工具6204,這樣的程序模塊6205包括但不限于:操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)??偩€(xiàn)630可以為表示幾類(lèi)總線(xiàn)結(jié)構(gòu)中的一種或多種,包括存儲(chǔ)單元總線(xiàn)或者存儲(chǔ)單元控制器、外圍總線(xiàn)、圖形加速端口、處理單元或者使用多種總線(xiàn)結(jié)構(gòu)中的任意總線(xiàn)結(jié)構(gòu)的局域總線(xiàn)。電子設(shè)備600也可以與一個(gè)或多個(gè)外部設(shè)備700(例如鍵盤(pán)、指向設(shè)備、藍(lán)牙設(shè)備等)通信,還可與一個(gè)或者多個(gè)使得用戶(hù)能與該電子設(shè)備600交互的設(shè)備通信,和/或與使得該電子設(shè)備600能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如路由器、調(diào)制解調(diào)器等等)通信。這種通信可以通過(guò)輸入/輸出(i/o)接口650進(jìn)行。并且,電子設(shè)備600還可以通過(guò)網(wǎng)絡(luò)適配器660與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖所示,網(wǎng)絡(luò)適配器660通過(guò)總線(xiàn)630與電子設(shè)備600的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以結(jié)合電子設(shè)備600使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理單元、外部磁盤(pán)驅(qū)動(dòng)陣列、raid系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)等。通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員易于理解,這里描述的示例實(shí)施方式可以通過(guò)軟件實(shí)現(xiàn),也可以通過(guò)軟件結(jié)合必要的硬件的方式來(lái)實(shí)現(xiàn)。因此,根據(jù)本公開(kāi)實(shí)施方式的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該軟件產(chǎn)品可以存儲(chǔ)在一個(gè)非易失性存儲(chǔ)介質(zhì)(可以是cd-rom,u盤(pán),移動(dòng)硬盤(pán)等)中或網(wǎng)絡(luò)上,包括若干指令以使得一臺(tái)計(jì)算設(shè)備(可以是個(gè)人計(jì)算機(jī)、服務(wù)器、終端裝置、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行根據(jù)本公開(kāi)實(shí)施方式的方法。在本公開(kāi)的示例性實(shí)施例中,還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有能夠?qū)崿F(xiàn)本說(shuō)明書(shū)上述方法的程序產(chǎn)品。在一些可能的實(shí)施方式中,本發(fā)明的各個(gè)方面還可以實(shí)現(xiàn)為一種程序產(chǎn)品的形式,其包括程序代碼,當(dāng)所述程序產(chǎn)品在終端設(shè)備上運(yùn)行時(shí),所述程序代碼用于使所述終端設(shè)備執(zhí)行本說(shuō)明書(shū)上述“示例性方法”部分中描述的根據(jù)本發(fā)明各種示例性實(shí)施方式的步驟。參考圖7所示,描述了根據(jù)本發(fā)明的實(shí)施方式的用于實(shí)現(xiàn)上述方法的程序產(chǎn)品800,其可以采用便攜式緊湊盤(pán)只讀存儲(chǔ)器(cd-rom)并包括程序代碼,并可以在終端設(shè)備,例如個(gè)人電腦上運(yùn)行。然而,本發(fā)明的程序產(chǎn)品不限于此,在本文件中,可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。所述程序產(chǎn)品可以采用一個(gè)或多個(gè)可讀介質(zhì)的任意組合??勺x介質(zhì)可以是可讀信號(hào)介質(zhì)或者可讀存儲(chǔ)介質(zhì)??勺x存儲(chǔ)介質(zhì)例如可以為但不限于電、磁、光、電磁、紅外線(xiàn)、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線(xiàn)的電連接、便攜式盤(pán)、硬盤(pán)、隨機(jī)存取存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊盤(pán)只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。計(jì)算機(jī)可讀信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了可讀程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括但不限于電磁信號(hào)、光信號(hào)或上述的任意合適的組合??勺x信號(hào)介質(zhì)還可以是可讀存儲(chǔ)介質(zhì)以外的任何可讀介質(zhì),該可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序??勺x介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于無(wú)線(xiàn)、有線(xiàn)、光纜、rf等等,或者上述的任意合適的組合。可以以一種或多種程序設(shè)計(jì)語(yǔ)言的任意組合來(lái)編寫(xiě)用于執(zhí)行本發(fā)明操作的程序代碼,所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言—諸如java、c++等,還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言—諸如“c”語(yǔ)言或類(lèi)似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶(hù)計(jì)算設(shè)備上執(zhí)行、部分地在用戶(hù)設(shè)備上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶(hù)計(jì)算設(shè)備上部分在遠(yuǎn)程計(jì)算設(shè)備上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算設(shè)備或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算設(shè)備的情形中,遠(yuǎn)程計(jì)算設(shè)備可以通過(guò)任意種類(lèi)的網(wǎng)絡(luò),包括局域網(wǎng)(lan)或廣域網(wǎng)(wan),連接到用戶(hù)計(jì)算設(shè)備,或者,可以連接到外部計(jì)算設(shè)備(例如利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng)連接)。此外,上述附圖僅是根據(jù)本發(fā)明示例性實(shí)施例的方法所包括的處理的示意性說(shuō)明,而不是限制目的。易于理解,上述附圖所示的處理并不表明或限制這些處理的時(shí)間順序。另外,也易于理解,這些處理可以是例如在多個(gè)模塊中同步或異步執(zhí)行的。本領(lǐng)域技術(shù)人員在考慮說(shuō)明書(shū)及實(shí)踐這里公開(kāi)的發(fā)明后,將容易想到本公開(kāi)的其他實(shí)施例。本申請(qǐng)旨在涵蓋本公開(kāi)的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開(kāi)的一般性原理并包括本公開(kāi)未公開(kāi)的本
技術(shù)領(lǐng)域:
中的公知常識(shí)或慣用技術(shù)手段。說(shuō)明書(shū)和實(shí)施例僅被視為示例性的,本公開(kāi)的真正范圍和精神由權(quán)利要求指出。應(yīng)當(dāng)理解的是,本公開(kāi)并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開(kāi)的范圍僅由所附的權(quán)利要求來(lái)限。當(dāng)前第1頁(yè)12