計(jì)算機(jī)實(shí)現(xiàn)的信息處理方法及裝置的制造方法
【專利摘要】一種計(jì)算機(jī)實(shí)現(xiàn)的信息處理方法和裝置。方法包括:獲取多個(gè)訓(xùn)練評(píng)估對(duì)象的數(shù)據(jù),構(gòu)建知識(shí)圖,創(chuàng)建基于知識(shí)圖的圖數(shù)據(jù)庫,知識(shí)圖的節(jié)點(diǎn)為評(píng)估對(duì)象或與評(píng)估對(duì)象具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)對(duì)象,知識(shí)圖的邊描述節(jié)點(diǎn)之間的關(guān)系且具有相應(yīng)權(quán)重;基于訓(xùn)練評(píng)估對(duì)象之間的距離,計(jì)算訓(xùn)練評(píng)估對(duì)象的特征向量,距離至少基于訓(xùn)練評(píng)估對(duì)象之間的路徑權(quán)重,特征向量針對(duì)訓(xùn)練評(píng)估對(duì)象指示在一定距離內(nèi)不同維度的圖數(shù)據(jù)庫中其他訓(xùn)練評(píng)估對(duì)象的數(shù)量;將特征向量和多個(gè)訓(xùn)練評(píng)估對(duì)象的評(píng)估類別作為樣本集合,構(gòu)建評(píng)估模型;響應(yīng)于收到新評(píng)估對(duì)象的數(shù)據(jù),計(jì)算新評(píng)估對(duì)象的特征向量和評(píng)估指標(biāo);基于評(píng)估指標(biāo),由計(jì)算機(jī)根據(jù)判別條件完成關(guān)于新評(píng)估對(duì)象的審核操作。
【專利說明】
計(jì)算機(jī)實(shí)現(xiàn)的信息處理方法及裝置
技術(shù)領(lǐng)域
[0001] 本公開設(shè)及計(jì)算機(jī)信息處理領(lǐng)域,尤其設(shè)及計(jì)算機(jī)實(shí)現(xiàn)的對(duì)象可信度評(píng)估方法和 裝置。
【背景技術(shù)】
[0002] 目前,在需要對(duì)人員信息進(jìn)行審核和可信度評(píng)估的應(yīng)用環(huán)境中,例如在社會(huì)安全 領(lǐng)域、金融安全領(lǐng)域等,通常通過針對(duì)個(gè)人信息、身份關(guān)聯(lián)信息、消費(fèi)交易信息等進(jìn)行個(gè)人 畫像,建立基于統(tǒng)計(jì)學(xué)的機(jī)器學(xué)習(xí)數(shù)學(xué)模型,進(jìn)而進(jìn)行可信度分析。
[0003] 隨著因特網(wǎng)的出現(xiàn)和社交網(wǎng)絡(luò)的興起,當(dāng)今針對(duì)個(gè)人正創(chuàng)造出比W往在我們的社 會(huì)歷史中任何時(shí)候創(chuàng)造的信息都要多的信息,數(shù)據(jù)之間具有非常復(fù)雜和千絲萬縷的聯(lián)系。 然而,在利用機(jī)器學(xué)習(xí)的數(shù)據(jù)模型時(shí),人們?nèi)狈?duì)個(gè)人數(shù)據(jù)的深入挖掘,同時(shí)對(duì)數(shù)據(jù)的應(yīng)用 仍然很有限,從而影響了對(duì)個(gè)人或個(gè)人行為的可信度評(píng)估的準(zhǔn)確性。
【發(fā)明內(nèi)容】
[0004] 為了解決上面所提出的問題,本公開提供一種深度利用個(gè)人相關(guān)數(shù)據(jù)W通過數(shù)學(xué) 模型進(jìn)行信息處理的計(jì)算機(jī)實(shí)現(xiàn)的技術(shù)方案。
[0005] 根據(jù)本公開的第一方面,提供一種計(jì)算機(jī)實(shí)現(xiàn)的信息處理方法,方法包括:獲取多 個(gè)訓(xùn)練評(píng)估對(duì)象的相關(guān)數(shù)據(jù),構(gòu)建知識(shí)圖,并且創(chuàng)建基于知識(shí)圖的圖數(shù)據(jù)庫,其中知識(shí)圖的 每個(gè)節(jié)點(diǎn)為評(píng)估對(duì)象或者與評(píng)估對(duì)象具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)對(duì)象,知識(shí)圖的邊描述知識(shí)圖的 節(jié)點(diǎn)之間的關(guān)系并且具有相應(yīng)權(quán)重;基于訓(xùn)練評(píng)估對(duì)象之間的距離,計(jì)算每個(gè)訓(xùn)練評(píng)估對(duì) 象的特征向量,其中距離至少基于訓(xùn)練評(píng)估對(duì)象之間的路徑權(quán)重,特征向量針對(duì)每個(gè)訓(xùn)練 評(píng)估對(duì)象指示在一定的距離內(nèi)不同維度的圖數(shù)據(jù)庫中其他訓(xùn)練評(píng)估對(duì)象的數(shù)量;將特征向 量和多個(gè)訓(xùn)練評(píng)估對(duì)象的評(píng)估類別作為樣本集合,W構(gòu)建評(píng)估模型;響應(yīng)于收到新的評(píng)估 對(duì)象的相關(guān)數(shù)據(jù),計(jì)算新的評(píng)估對(duì)象的特征向量;基于評(píng)估模型和新的評(píng)估對(duì)象的特征向 量,計(jì)算新的評(píng)估對(duì)象的評(píng)估指標(biāo);W及基于新的評(píng)估對(duì)象的評(píng)估指標(biāo),由計(jì)算機(jī)根據(jù)判別 條件完成關(guān)于新的評(píng)估對(duì)象的審核操作。
[0006] 根據(jù)本公開的實(shí)施例,其中訓(xùn)練評(píng)估對(duì)象之間的距離根據(jù)下式計(jì)算得到:
[0007]
[000引其中Xi、x汾別表示第i訓(xùn)練評(píng)估對(duì)象和第j訓(xùn)練評(píng)估對(duì)象,D(Xi,Xj)表示Xi和Xj之間的距 離,hx抑表示&和&路粗上的節(jié)點(diǎn),L表示&和X撕之間路徑的數(shù)目盧巧巧表示Xi和X撕路徑1 上邊的權(quán)重;I! (/I邸呼雌巧)為路徑1的影響因子,
表示影響因子最大的路徑所經(jīng)過的節(jié)點(diǎn)數(shù)目。
[0009]根據(jù)本公開的實(shí)施例,其中基于訓(xùn)練評(píng)估對(duì)象之間的距離,計(jì)算每個(gè)訓(xùn)練評(píng)估對(duì) 象的特征向量包括:針對(duì)訓(xùn)練評(píng)估對(duì)象的特定屬性的每個(gè)屬性值,統(tǒng)計(jì)距離D(xi,xj)中小于 特定距離闊值的路徑數(shù)量;W及基于統(tǒng)計(jì)的路徑數(shù)量,得到訓(xùn)練評(píng)估對(duì)象的特征向量。
[0010] 根據(jù)本公開的實(shí)施例,其中響應(yīng)于收到新的評(píng)估對(duì)象的相關(guān)數(shù)據(jù),計(jì)算新的評(píng)估 對(duì)象的特征向量包括:將新的評(píng)估對(duì)象的相關(guān)數(shù)據(jù)投射到知識(shí)圖中;基于新的評(píng)估對(duì)象與 知識(shí)圖中的其他評(píng)估對(duì)象之間的路徑權(quán)重,計(jì)算新的評(píng)估對(duì)象與其他評(píng)估對(duì)象之間的距 離;W及基于新的評(píng)估對(duì)象與其他評(píng)估對(duì)象之間的距離,計(jì)算新的評(píng)估對(duì)象的特征向量。
[0011] 根據(jù)本公開的實(shí)施例,其中評(píng)估模型包括W下中的一項(xiàng)或多項(xiàng):決策樹、邏輯回歸 模型、隨機(jī)森林模型。
[001^ 根據(jù)本公開的實(shí)施例,還包括更新圖數(shù)據(jù)庫和評(píng)估模型。
[0013] 根據(jù)本公開的實(shí)施例,還包括:將多個(gè)新的評(píng)估對(duì)象和相應(yīng)的評(píng)估類別更新到知 識(shí)圖中;基于更新后的知識(shí)圖和圖數(shù)據(jù)庫,生成新的評(píng)估模型;確定新的評(píng)估模型的準(zhǔn)確 度;W及基于新的評(píng)估模型的準(zhǔn)確度,更新評(píng)估模型。
[0014] 根據(jù)本公開的實(shí)施例,其中圖的節(jié)點(diǎn)中的與評(píng)估對(duì)象具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)對(duì)象包 括W下項(xiàng)中的一項(xiàng)或多項(xiàng):評(píng)估對(duì)象相關(guān)聯(lián)的個(gè)人數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的征信數(shù)據(jù) 對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的社會(huì)關(guān)系數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的社交網(wǎng)絡(luò)數(shù)據(jù)對(duì)象;評(píng)估對(duì) 象相關(guān)聯(lián)的通信數(shù)據(jù)對(duì)象。
[0015] 根據(jù)本公開的實(shí)施例,其中圖中的邊的權(quán)重至少基于W下項(xiàng)中的一項(xiàng)或多項(xiàng)來確 定:邊所關(guān)聯(lián)的節(jié)點(diǎn)的關(guān)系類型;邊所關(guān)聯(lián)的節(jié)點(diǎn)之間的關(guān)聯(lián)程度。
[0016] 根據(jù)本公開的第二方面,提供一種計(jì)算機(jī)實(shí)現(xiàn)的信息處理裝置,裝置包括:圖數(shù)據(jù) 庫創(chuàng)建裝置,被配置為獲取多個(gè)訓(xùn)練評(píng)估對(duì)象的相關(guān)數(shù)據(jù),構(gòu)建知識(shí)圖,并且創(chuàng)建基于知識(shí) 圖的圖數(shù)據(jù)庫,其中知識(shí)圖的每個(gè)節(jié)點(diǎn)為評(píng)估對(duì)象或者與評(píng)估對(duì)象具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)對(duì) 象,知識(shí)圖的邊描述知識(shí)圖的節(jié)點(diǎn)之間的關(guān)系并且具有相應(yīng)權(quán)重;第一計(jì)算裝置,被配置為 基于訓(xùn)練評(píng)估對(duì)象之間的距離,計(jì)算每個(gè)訓(xùn)練評(píng)估對(duì)象的特征向量,其中距離至少基于訓(xùn) 練評(píng)估對(duì)象之間的路徑權(quán)重,特征向量針對(duì)每個(gè)訓(xùn)練評(píng)估對(duì)象指示在一定的距離內(nèi)不同維 度的圖數(shù)據(jù)庫中其他訓(xùn)練評(píng)估對(duì)象的數(shù)量;評(píng)估模型構(gòu)建裝置,被配置為將特征向量和多 個(gè)訓(xùn)練評(píng)估對(duì)象的評(píng)估類別作為樣本集合,W構(gòu)建評(píng)估模型;第二計(jì)算裝置,被配置為響應(yīng) 于收到新的評(píng)估對(duì)象的相關(guān)數(shù)據(jù),計(jì)算新的評(píng)估對(duì)象的特征向量;W及基于評(píng)估模型和新 的評(píng)估對(duì)象的特征向量,計(jì)算新的評(píng)估對(duì)象的評(píng)估指標(biāo);W及審核處理裝置,被配置為基于 新的評(píng)估對(duì)象的評(píng)估指標(biāo),由計(jì)算機(jī)根據(jù)判別條件完成關(guān)于新的評(píng)估對(duì)象的審核操作。
[0017] 根據(jù)本公開的實(shí)施例,其中訓(xùn)練評(píng)估對(duì)象之間的距離根據(jù)下式計(jì)算得到:
[001 引
[0019] 其中xi、x汾別表示第i訓(xùn)練評(píng)估對(duì)象和斯訓(xùn)練評(píng)估對(duì)象,D(xi術(shù)讀示化和巧之間的距 離,巧表示Xi和Xj路徑讓的節(jié)點(diǎn),L表示Xi和Xj的之間路徑的數(shù)目,辟::i巧表示Xi和Xj的路徑1 上邊的權(quán)重;為路徑1的影響因子:
表示影響因子最大的路徑所經(jīng)過的節(jié)點(diǎn)數(shù)目。
[0020] 根據(jù)本公開的實(shí)施例,第一計(jì)算裝置還被配置為:針對(duì)訓(xùn)練評(píng)估對(duì)象的特定屬性 的每個(gè)屬性值,統(tǒng)計(jì)距離D(xi,xj)中小于特定距離闊值的路徑數(shù)量;W及基于統(tǒng)計(jì)的路徑數(shù) 量,得到訓(xùn)練評(píng)估對(duì)象的特征向量。
[0021] 根據(jù)本公開的實(shí)施例,第二計(jì)算裝置還被配置為:將新的評(píng)估對(duì)象的相關(guān)數(shù)據(jù)投 射到知識(shí)圖中;基于新的評(píng)估對(duì)象與知識(shí)圖中的其他評(píng)估對(duì)象之間的路徑權(quán)重,計(jì)算新的 評(píng)估對(duì)象與其他評(píng)估對(duì)象之間的距離;W及基于新的評(píng)估對(duì)象與其他評(píng)估對(duì)象之間的距 離,計(jì)算新的評(píng)估對(duì)象的特征向量。
[0022] 根據(jù)本公開的實(shí)施例,其中評(píng)估模型包括W下中的一項(xiàng)或多項(xiàng):決策樹、邏輯回歸 模型、隨機(jī)森林模型。
[0023] 根據(jù)本公開的實(shí)施例,還包括更新裝置,被配置為更新圖數(shù)據(jù)庫和評(píng)估模型。
[0024] 根據(jù)本公開的實(shí)施例,更新裝置還被配置為:將多個(gè)新的評(píng)估對(duì)象和相應(yīng)的評(píng)估 類別更新到知識(shí)圖中;基于更新后的知識(shí)圖和圖數(shù)據(jù)庫,生成新的評(píng)估模型;確定新的評(píng)估 模型的準(zhǔn)確度;W及基于新的評(píng)估模型的準(zhǔn)確度,更新評(píng)估模型。
[0025] 根據(jù)本公開的實(shí)施例,其中圖的節(jié)點(diǎn)中的與評(píng)估對(duì)象具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)對(duì)象包 括W下項(xiàng)中的一項(xiàng)或多項(xiàng):評(píng)估對(duì)象相關(guān)聯(lián)的個(gè)人數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的征信數(shù)據(jù) 對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的社會(huì)關(guān)系數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的社交網(wǎng)絡(luò)數(shù)據(jù)對(duì)象;評(píng)估對(duì) 象相關(guān)聯(lián)的通信數(shù)據(jù)對(duì)象。
[0026] 根據(jù)本公開的實(shí)施例,其中圖中的邊的權(quán)重至少基于W下項(xiàng)中的一項(xiàng)或多項(xiàng)來確 定:邊所關(guān)聯(lián)的節(jié)點(diǎn)的關(guān)系類型;邊所關(guān)聯(lián)的節(jié)點(diǎn)之間的關(guān)聯(lián)程度。
[0027] 本公開通過具有福射特征的知識(shí)圖來建立評(píng)估模型,將數(shù)據(jù)由一維的特征向量展 開為基于圖關(guān)系的模型,并將數(shù)據(jù)轉(zhuǎn)化為機(jī)器可理解數(shù)據(jù)形式,利用計(jì)算機(jī)實(shí)現(xiàn)數(shù)據(jù)信息 的處理,充分利用了數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的優(yōu)勢(shì)。
【附圖說明】
[0028] 結(jié)合附圖并參考W下詳細(xì)說明,本公開的各實(shí)施例的特征、優(yōu)點(diǎn)及其他方面將變 得更加明顯,現(xiàn)將僅通過示例而非限制性的方式示出了本公開的若干實(shí)施例,在附圖中:
[0029] 圖1示出了根據(jù)本公開的實(shí)施例的示意性信息處理框圖;
[0030] 圖2示出了根據(jù)本公開的實(shí)施例的方法流程圖;
[0031] 圖3示出了根據(jù)本公開的實(shí)施例的示例知識(shí)圖;W及
[0032] 圖4示出了根據(jù)本公開的實(shí)施例的裝置示意圖。
【具體實(shí)施方式】
[0033] W下參考附圖詳細(xì)描述本公開的各個(gè)示例性實(shí)施例。附圖中的流程圖和框圖示出 了根據(jù)本公開的各種實(shí)施例的方法和系統(tǒng)的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。應(yīng)當(dāng)注意, 流程圖或框圖中的每個(gè)方框可W代表一個(gè)模塊、程序段、或代碼的一部分,所述模塊、程序 段、或代碼的一部分可W包括一個(gè)或多個(gè)用于實(shí)現(xiàn)各個(gè)實(shí)施例中所規(guī)定的邏輯功能的可執(zhí) 行指令。也應(yīng)當(dāng)注意,在有些作為備選的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可W按照不同于附 圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)接連地表示的方框?qū)嶋H上可W基本并行地執(zhí)行,或者它 們有時(shí)也可W按照相反的順序執(zhí)行,運(yùn)取決于所設(shè)及的功能。同樣應(yīng)當(dāng)注意的是,流程圖 和/或框圖中的每個(gè)方框、W及流程圖和/或框圖中的方框的組合,可W使用執(zhí)行規(guī)定的功 能或操作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可W使用專用硬件與計(jì)算機(jī)指令的組合來 實(shí)現(xiàn)。
[0034] 本文所使用的術(shù)語"包括"、"包含"及類似術(shù)語應(yīng)該被理解為是開放性的術(shù)語,即 "包括/包含但不限于",表示還可W包括其他內(nèi)容。術(shù)語"基于"是"至少部分地基于"。術(shù)語 "一個(gè)實(shí)施例"表示"至少一個(gè)實(shí)施例";術(shù)語"另一實(shí)施例"表示"至少一個(gè)另外的實(shí)施例"。
[0035] 如前所述,本公開旨在深入挖掘基于關(guān)聯(lián)關(guān)系的信息數(shù)據(jù),利用信息的福射關(guān)系 特征,進(jìn)而使用計(jì)算機(jī)實(shí)現(xiàn)基于統(tǒng)計(jì)模型的對(duì)個(gè)人或個(gè)人行為的可信度評(píng)估。計(jì)算機(jī)實(shí)現(xiàn) 的統(tǒng)計(jì)模型算法(即機(jī)器學(xué)習(xí)算法)是一類從數(shù)據(jù)中自動(dòng)分析獲得規(guī)律,并利用規(guī)律對(duì)未知 數(shù)據(jù)進(jìn)行預(yù)測(cè)的算法。在本文中,術(shù)語"評(píng)估模型"為基于統(tǒng)計(jì)的數(shù)學(xué)模型,其可被用于對(duì)評(píng) 估對(duì)象進(jìn)行評(píng)估。術(shù)語"評(píng)估對(duì)象"為根據(jù)各種不同應(yīng)用場景而確定的需要進(jìn)行評(píng)估的對(duì) 象,例如個(gè)人或個(gè)人行為,在本公開的一個(gè)實(shí)施例中,評(píng)估對(duì)象可W為需要進(jìn)行審核的借款 或貸款,在另一實(shí)施例中,評(píng)估對(duì)象可W是需要審核的個(gè)人信息。術(shù)語"特征向量"表示根據(jù) 從樣本(例如,評(píng)估對(duì)象)所提取的特征信息而構(gòu)建的多維向量,向量的維度等于特征信息 類型的數(shù)目。
[0036] 可W理解,下文給出運(yùn)些示例性實(shí)施例僅是為了使本領(lǐng)域技術(shù)人員能夠更好地理 解并實(shí)現(xiàn)本公開的實(shí)施例,而并非W任何方式限制本公開的范圍。
[0037] 圖1示出了根據(jù)本公開的一個(gè)實(shí)施例的示意性信息處理框圖100。應(yīng)該指出,本公 開提出的信息處理解決方案并不限定具體的應(yīng)用場景,本領(lǐng)域技術(shù)人員可W理解,在需要 對(duì)客戶或用戶信息或者客戶或用戶行為信息進(jìn)行分析處理的適宜環(huán)境中,本公開的實(shí)施例 均可得到應(yīng)用。
[0038] 在圖1中示出了通過充分利用數(shù)據(jù)的關(guān)聯(lián)性而進(jìn)行的數(shù)據(jù)處理和評(píng)估模型建立的 過程。圖1中示出了數(shù)據(jù)源或數(shù)據(jù)設(shè)及的方面:用戶數(shù)據(jù)101、互聯(lián)網(wǎng)公開數(shù)據(jù)102、歷史數(shù)據(jù) 103,運(yùn)些數(shù)據(jù)可W存儲(chǔ)在一個(gè)或多個(gè)數(shù)據(jù)庫中。通常,用戶數(shù)據(jù)101為用戶自身提供的數(shù) 據(jù),例如年齡、教育程度、工作狀況、家庭背景、通信數(shù)據(jù)等等?;ヂ?lián)網(wǎng)公開數(shù)據(jù)102為在社交 網(wǎng)絡(luò)中所公開、任何人均可查看的數(shù)據(jù),例如社交網(wǎng)絡(luò)數(shù)據(jù)、網(wǎng)頁數(shù)據(jù)等等。歷史數(shù)據(jù)103為 應(yīng)用本方案的機(jī)構(gòu)或系統(tǒng)所已知的有關(guān)歷史數(shù)據(jù),例如在金融機(jī)構(gòu)的場景中,可W是消費(fèi) 數(shù)據(jù)、銀行數(shù)據(jù)、征信數(shù)據(jù)等等,而在捜索應(yīng)用的場景中,可W是用戶的歷史捜索數(shù)據(jù)等等。 圖1僅示意了數(shù)據(jù)可能設(shè)及的方面,可W理解,能夠充分利用數(shù)據(jù)的關(guān)聯(lián)性的潛在數(shù)據(jù)方面 都在本公開的范圍之內(nèi)。
[0039] 數(shù)據(jù)抽取過程104可W例如采集各種數(shù)據(jù)源,數(shù)據(jù)源可W包括如用戶數(shù)據(jù)101、互 聯(lián)網(wǎng)公開數(shù)據(jù)102、歷史數(shù)據(jù)103等,抽取其中可用的數(shù)據(jù),W形成基于圖關(guān)系的圖數(shù)據(jù)庫 105,并進(jìn)而生成訓(xùn)練數(shù)據(jù)107。因此,在數(shù)據(jù)抽取過程104中,對(duì)訓(xùn)練對(duì)象及其相互關(guān)聯(lián)的關(guān) 聯(lián)對(duì)象和相關(guān)數(shù)據(jù)進(jìn)行深入發(fā)現(xiàn)和挖掘。運(yùn)些訓(xùn)練對(duì)象W及相互關(guān)聯(lián)的關(guān)聯(lián)對(duì)象形成圖關(guān) 系的節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)由一個(gè)全局唯一的ID來標(biāo)識(shí)和索引,同時(shí)節(jié)點(diǎn)具有若干個(gè)屬性,W描述 節(jié)點(diǎn)的特性。例如,在節(jié)點(diǎn)為個(gè)人時(shí),其屬性可W為姓名、身份證號(hào)、家庭地址等等;在節(jié)點(diǎn) 為待售對(duì)象時(shí),其屬性可W為售賣類型、售賣金額等等;在節(jié)點(diǎn)為電話時(shí),其屬性可W為電 話類型、電話號(hào)碼、所屬地等等。而運(yùn)些節(jié)點(diǎn)之間的關(guān)系由圖的邊進(jìn)行描述,例如是is-a關(guān) 系,表示一個(gè)節(jié)點(diǎn)是另一個(gè)節(jié)點(diǎn)的一種,或是has-a關(guān)系,表示一個(gè)節(jié)點(diǎn)具有另一個(gè)節(jié)點(diǎn)等 等,運(yùn)樣的關(guān)系都是用來描述實(shí)體之間的關(guān)聯(lián)關(guān)系。同時(shí),運(yùn)種關(guān)系需要轉(zhuǎn)化為機(jī)器可W理 解的表示,在本公開的一個(gè)實(shí)施例中采用邊的權(quán)重來表征關(guān)聯(lián)程度。
[0040] 圖數(shù)據(jù)庫105中存儲(chǔ)基于圖關(guān)系的各種數(shù)據(jù),例如,如上所述的節(jié)點(diǎn)、節(jié)點(diǎn)ID、屬 性、邊、邊的關(guān)系、權(quán)重等等。信息處理系統(tǒng)可W利用計(jì)算機(jī)對(duì)圖數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行各種 處理,例如基于圖關(guān)系的遍歷、統(tǒng)計(jì)、查找、更新等。
[0041] 關(guān)系分析和提取過程106對(duì)圖數(shù)據(jù)庫105中的數(shù)據(jù)進(jìn)行分析、提取和處理,W形成 訓(xùn)練數(shù)據(jù)107。根據(jù)所需要獲得的訓(xùn)練數(shù)據(jù),基于圖數(shù)據(jù)庫中訓(xùn)練對(duì)象的各種關(guān)聯(lián)關(guān)系,提 取出訓(xùn)練對(duì)象的特征向量,并對(duì)訓(xùn)練對(duì)象進(jìn)行標(biāo)簽,作為樣本數(shù)據(jù)輸入到評(píng)估模型訓(xùn)練過 程108,最終得到評(píng)估模型109。
[0042] 在評(píng)估模型訓(xùn)練過程108中,將選取的已經(jīng)標(biāo)簽的樣本分為訓(xùn)練集和測(cè)試集,例如 可W將樣本的75%作為訓(xùn)練集,樣本的25%作為測(cè)試集。將訓(xùn)練集的樣本數(shù)據(jù)輸入統(tǒng)計(jì)模 型中,構(gòu)建統(tǒng)計(jì)模型,例如統(tǒng)計(jì)模型為GBDT(Gradient Boost Decision Tree)模型、邏輯回 歸模型等等,并在此過程中不斷迭代樣本,直到訓(xùn)練結(jié)束。之后將測(cè)試樣本輸入構(gòu)建的統(tǒng)計(jì) 模型,進(jìn)行測(cè)試驗(yàn)證并可W調(diào)整統(tǒng)計(jì)模型的參數(shù),最終完成評(píng)估模型訓(xùn)練過程108,得到評(píng) 估模型109。當(dāng)有新的評(píng)估對(duì)象需要進(jìn)行評(píng)估時(shí),經(jīng)過對(duì)該新評(píng)估對(duì)象的數(shù)據(jù)分析和提取, 將其特征向量輸入評(píng)估模型109,W計(jì)算得到其評(píng)估指標(biāo)。
[0043] 下面將結(jié)合具體實(shí)施例對(duì)本公開的技術(shù)方案進(jìn)行詳細(xì)描述。圖2示出了根據(jù)本公 開的一個(gè)實(shí)施例的方法200的流程圖。在步驟202,獲取多個(gè)訓(xùn)練評(píng)估對(duì)象的相關(guān)數(shù)據(jù),構(gòu)建 知識(shí)圖,并且創(chuàng)建基于知識(shí)圖的圖數(shù)據(jù)庫,其中知識(shí)圖的每個(gè)節(jié)點(diǎn)為評(píng)估對(duì)象或者與評(píng)估 對(duì)象具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)對(duì)象,知識(shí)圖的邊描述知識(shí)圖的節(jié)點(diǎn)之間的關(guān)系并且具有相應(yīng)權(quán) 重。
[0044] 為了便于理解的目的,在一個(gè)具體實(shí)施例中,例如針對(duì)個(gè)人信貸場景,節(jié)點(diǎn)定義示 意如下表所示。
[0045] 表 1
[0046]
[0047]
[0048] 如表1所示,在運(yùn)樣的場景中,節(jié)點(diǎn)可W為評(píng)估對(duì)象(例如貸款)或者評(píng)估對(duì)象相關(guān) 聯(lián)的關(guān)聯(lián)對(duì)象(例如銀行卡、貸款銷售員、電子郵件等等),另外,從表1可見,每個(gè)節(jié)點(diǎn)具有 相應(yīng)的若干個(gè)屬性?;谌舾蓚€(gè)評(píng)估對(duì)象及其相關(guān)聯(lián)的關(guān)聯(lián)對(duì)象,構(gòu)建知識(shí)圖,在運(yùn)樣的場 景中,圖的邊例如可W如表2所示。
[0049] 表 2
[(K)加]
[0化1 ]
[0052] 如表2所示,基于邊所描述的節(jié)點(diǎn)之間的關(guān)系W及關(guān)聯(lián)節(jié)點(diǎn)的類型,可W為各邊分 配相應(yīng)的權(quán)重值,該權(quán)重值表征了節(jié)點(diǎn)之間的關(guān)聯(lián)程度,或者在不同應(yīng)用場景中,表征對(duì)于 需要評(píng)估的對(duì)象的影響程度,其是定量表示。舉例來說,若需要評(píng)估的對(duì)象之間通過夫妻、 同事等關(guān)系連接,那么運(yùn)種聯(lián)系通??蒞具有較高的互相影響力,可W被分配一個(gè)較高的 權(quán)重值;若通過例如審批行為連接,即一個(gè)審批者審批了兩個(gè)對(duì)象,運(yùn)種聯(lián)系通常具有較低 的互相影響力,可W被分配一個(gè)較低的權(quán)重值。
[0053] 根據(jù)從數(shù)據(jù)源提取的節(jié)點(diǎn)和邊的相關(guān)數(shù)據(jù),可W構(gòu)建知識(shí)圖模型。在一個(gè)具體實(shí) 施例中,構(gòu)建了如圖3所示的知識(shí)圖示意300。如圖3所示,各節(jié)點(diǎn)之間具有復(fù)雜的關(guān)聯(lián)關(guān)系, 例如,對(duì)于節(jié)點(diǎn)301(貸款2),其與節(jié)點(diǎn)302(借款人2)、節(jié)點(diǎn)303(貸款銷售員1)具有直接關(guān)聯(lián) 關(guān)系,同時(shí)與節(jié)點(diǎn)302 (借款人2)關(guān)聯(lián)的節(jié)點(diǎn)305 (借款人1 )、節(jié)點(diǎn)306 (父親)、節(jié)點(diǎn)307 (手 機(jī))、節(jié)點(diǎn)308(電子郵件)、節(jié)點(diǎn)309(公司)等具有較近的間接關(guān)聯(lián)關(guān)系,與節(jié)點(diǎn)304(貸款3)、 節(jié)點(diǎn)306(父親)擁有的電話、在公司工作的其他人等等具有較遠(yuǎn)的間接關(guān)聯(lián)關(guān)系。事實(shí)上, 在不同應(yīng)用場景中,關(guān)注的關(guān)系方面各不相同,可W構(gòu)建適合應(yīng)用場景的、例如圖3所示意 的知識(shí)圖。
[0054] 知識(shí)圖模型存儲(chǔ)于圖數(shù)據(jù)庫105中,可W W不同的形式例如矩陣、鄰接表、鏈表等 進(jìn)行存儲(chǔ),方便于圖的遍歷和捜索等操作。可W理解,本公開中的知識(shí)圖(或圖數(shù)據(jù)庫)的建 立,提供了一種利用數(shù)據(jù)之間關(guān)系福射特性的解決方案,W更好地應(yīng)用于評(píng)估或預(yù)測(cè)的場 景。
[0055] 返回到圖2所示的方法200,在建立了圖數(shù)據(jù)庫105之后,在步驟204,基于訓(xùn)練評(píng)估 對(duì)象之間的距離,計(jì)算每個(gè)訓(xùn)練評(píng)估對(duì)象的特征向量,其中該距離至少基于訓(xùn)練評(píng)估對(duì)象 之間的路徑權(quán)重,特征向量針對(duì)每個(gè)訓(xùn)練評(píng)估對(duì)象指示在一定的距離內(nèi)不同維度的圖數(shù)據(jù) 庫中其他訓(xùn)練評(píng)估對(duì)象的數(shù)量。
[0056] 為了便于理解,仍然W圖3為例,節(jié)點(diǎn)302(借款人2)和節(jié)點(diǎn)305(借款人1)分別申請(qǐng) 了 W節(jié)點(diǎn)301(貸款2)和節(jié)點(diǎn)310(貸款1)表示的貸款,從運(yùn)個(gè)示例圖可W看出,節(jié)點(diǎn)310處于 壞賬狀態(tài),而節(jié)點(diǎn)302(借款人2)和節(jié)點(diǎn)305(借款人1)具有距離較近、權(quán)重較高的關(guān)聯(lián)特征, 在運(yùn)種情況下,節(jié)點(diǎn)301(貸款2)有極大可能概率具有極高不可信度。為了能夠達(dá)到區(qū)分和 量化評(píng)估的目標(biāo),在本公開的一個(gè)實(shí)施例中,通過計(jì)算評(píng)估對(duì)象之間的"距離",將評(píng)估對(duì)象 的特征向量提取為在一定的距離內(nèi)不同維度的圖數(shù)據(jù)庫中其他評(píng)估對(duì)象的數(shù)量,進(jìn)而能夠 區(qū)分評(píng)估對(duì)象的評(píng)估類別。因此,該距離能夠表征與關(guān)聯(lián)影響大、存在不可信(或者可信)因 素的對(duì)象之間"近"的距離的運(yùn)些對(duì)象,應(yīng)該分到顯著的評(píng)估類別。
[0057] 在本公開的一個(gè)具體實(shí)施例中,兩個(gè)評(píng)估對(duì)象心刊之間的距離D(xi,xj)可W根據(jù) 下式計(jì)算得到:
[0化引
(式1 j
[0059] 其中by巧表示Xi和Xj路徑讓的節(jié)點(diǎn),L表示Xi和Xj的之間路徑的數(shù)目,邸林徒示化和Xj 的路徑1上邊的權(quán)重;I:: 為路徑1的影響因子
表示影響因子最大的路徑所經(jīng)過的節(jié)點(diǎn)數(shù)目。
[0060] 也即,根據(jù)式(1)得到評(píng)估對(duì)象兩兩之間的距離,該距離為評(píng)估對(duì)象之間的所有路 徑中影響因子最大的路徑所經(jīng)過的節(jié)點(diǎn)數(shù)目?;谠摼嚯x,對(duì)于每個(gè)評(píng)估對(duì)象,可W根據(jù)需 要評(píng)估的屬性,選擇合適的福射程度,來得到用于數(shù)學(xué)模型的特征向量。
[0061] 在本公開的一個(gè)具體實(shí)施例中,例如在個(gè)人信貸應(yīng)用場景中,為了對(duì)評(píng)估對(duì)象(例 如貸款)提取特征向量,可W根據(jù)如表1所示的節(jié)點(diǎn)和節(jié)點(diǎn)屬性示例,將評(píng)估對(duì)象(例如貸 款)的屬性(例如貸款狀態(tài))的屬性值(例如各種狀態(tài))做如表3的定義,如表3所示,評(píng)估對(duì)象 的特定屬性有6個(gè)屬性值。
[0062] 表 3 「00631
[0064]~因此,可W針對(duì)評(píng)估對(duì)象XI,統(tǒng)計(jì)距
離小于一定距離闊值Dis的數(shù)量作為特征向 量,即
[00化]Cntj=I,2,XjKDis)(式 2)
[0066] 其中N表示評(píng)估對(duì)象的特定屬性的N個(gè)屬性值。根據(jù)式(2)得到評(píng)估對(duì)象Xi的N維特 征向量,
[0067]
[0068] 特征向量針對(duì)每個(gè)評(píng)估對(duì)象指示在一定的距離內(nèi)不同維度的圖數(shù)據(jù)庫中其他 評(píng)估對(duì)象的數(shù)量。
[0069] 當(dāng)在統(tǒng)計(jì)模型的訓(xùn)練過程中時(shí),可W按照上述方式計(jì)算訓(xùn)練評(píng)估對(duì)象之間的距離 W及得到訓(xùn)練評(píng)估對(duì)象的特征向量。在評(píng)估模型創(chuàng)建之后,對(duì)于新的評(píng)估對(duì)象,也可W按照 上述方式計(jì)算新的評(píng)估對(duì)象與其他評(píng)估對(duì)象之間的距離,并獲得新的評(píng)估對(duì)象的特征向 量。
[0070] 可W理解,W上所描述的距離的計(jì)算和特征向量的獲得,在具體計(jì)算機(jī)實(shí)現(xiàn)中,可 W采用基于圖的深度優(yōu)先遍歷和/或廣度優(yōu)先遍歷,計(jì)算符合福射條件的節(jié)點(diǎn)數(shù)目。
[0071] 再次回到圖2。接下來,方法200進(jìn)行到步驟206,將特征向量和多個(gè)訓(xùn)練評(píng)估對(duì)象 的評(píng)估類別作為樣本集合,W構(gòu)建評(píng)估模型。如W上針對(duì)圖1的描述,評(píng)估模型可W根據(jù)應(yīng) 用場景選擇適當(dāng)?shù)臄?shù)學(xué)模型,在本公開的一個(gè)具體實(shí)施例中,可W采用GBDT模型。G抓T模型 (或GBDT算法)每一次的計(jì)算是為了減少上一次計(jì)算的殘差,而為了消除殘差,可W在殘差 減少的梯度方向上建立一個(gè)新的模型。也就是說,在GBDT算法中,每個(gè)新的模型的建立是為 了使得之前模型的殘差往梯度方向減少。
[0072]例如,對(duì)于GBDT模型,針對(duì)評(píng)估對(duì)象Xi,其N種狀態(tài)概率分布為狀態(tài)概率分布為Fi (X),F(xiàn)2(x),…,Fn(X),結(jié)果為屬于類別k的概率為Pk(X) DLogistic變換如下:
[007;3]
(式 4 )
[0074] 對(duì)于Logistic變換后的結(jié)果,損失函數(shù)為:
[0075]
(式 5 )
[0076] 其中,yk為輸入的樣本數(shù)據(jù)的估計(jì)值,當(dāng)一個(gè)樣本Xi屬于類別k時(shí),yk=l,否則yk = 0。
[0077] 將式(4)帶入損失函數(shù)式(5),并且對(duì)其求導(dǎo),可W得到損失函數(shù)的梯度,
[007引
(式 6)
[0079] 對(duì)于一個(gè)樣本,最理想的梯度是越接近0的梯度。由W上公式進(jìn)行訓(xùn)練得出評(píng)估模 型。具體的訓(xùn)練過程如W上結(jié)合圖1的描述,將選取的已經(jīng)標(biāo)簽的樣本分為訓(xùn)練集和測(cè)試 集,例如可W將樣本的75%作為訓(xùn)練集,樣本的25%作為測(cè)試集,將訓(xùn)練集的樣本數(shù)據(jù)輸入 統(tǒng)計(jì)模型中,構(gòu)建統(tǒng)計(jì)模型,并在此過程中不斷迭代樣本,直到訓(xùn)練結(jié)束。之后將測(cè)試樣本 輸入構(gòu)建的統(tǒng)計(jì)模型,進(jìn)行測(cè)試驗(yàn)證并可W調(diào)整統(tǒng)計(jì)模型的參數(shù),最終完成評(píng)估模型訓(xùn)練 過程108,得到評(píng)估模型109。
[0080] 可W理解,本公開的實(shí)施例中的統(tǒng)計(jì)模型并不限于GBDT模型,也可W采用例如其 他決策樹模型、邏輯回歸模型、隨機(jī)森林模型等等。
[0081] 構(gòu)建了評(píng)估模型之后,方法200進(jìn)行到步驟208,響應(yīng)于收到新的評(píng)估對(duì)象的相關(guān) 數(shù)據(jù),計(jì)算新的評(píng)估對(duì)象的特征向量。在該步驟中,根據(jù)本公開的一個(gè)具體實(shí)施例,當(dāng)需要 對(duì)新的評(píng)估對(duì)象Xnew進(jìn)行預(yù)測(cè)或評(píng)估時(shí),響應(yīng)于接收到新的評(píng)估對(duì)象Xnew的相關(guān)數(shù)據(jù),將運(yùn) 些數(shù)據(jù)投射到構(gòu)建的知識(shí)圖中,W形成新的評(píng)估對(duì)象所關(guān)聯(lián)的圖結(jié)構(gòu)。之后,可W根據(jù)式 (1 )、式(2 )和式(3 )來計(jì)算新的評(píng)估對(duì)象Xnew的特征向;*巧ew.。
[0082] 在步驟210,基于評(píng)估模型和新的評(píng)估對(duì)象的特征向量,計(jì)算新的評(píng)估對(duì)象的評(píng)估 指標(biāo)。在本公開的一個(gè)實(shí)施例中,可W由構(gòu)建的GBDT模型預(yù)測(cè)或評(píng)估出評(píng)估指標(biāo)P(Xnew),p (Xnew)值越高則表示可信度越低。
[0083] 在步驟212,基于新的評(píng)估對(duì)象的評(píng)估指標(biāo),由計(jì)算機(jī)根據(jù)判別條件完成關(guān)于新的 評(píng)估對(duì)象的審核操作。在該步驟中,計(jì)算機(jī)根據(jù)預(yù)設(shè)的判別條件,例如闊值(諸如Pthreshuld、 Phigh和/或Pi?等)條件,當(dāng)評(píng)估指標(biāo)P (Xnew)〉Phigh表明可信度不高,計(jì)算機(jī)自動(dòng)拒絕,即審核 不通過;P ( Xnew) <Pl?表明可信度高,計(jì)算機(jī)自動(dòng)接受,即審核通過;Plow<P ( Xnew) <Phigh時(shí),可 W采用加入其他審核標(biāo)準(zhǔn)的方式或者介入人工審核等等。
[0084] 需要指出,在對(duì)新的評(píng)估對(duì)象做出審核后,可W將新的評(píng)估對(duì)象從知識(shí)圖中移除, W保證評(píng)估模型的穩(wěn)定性。為了能夠更好地提供預(yù)測(cè)或評(píng)估結(jié)果,可W在線學(xué)習(xí)和更新評(píng) 估模型。當(dāng)評(píng)估模型部署之后,例如可W定期將新的數(shù)據(jù)W及結(jié)果更新到知識(shí)圖模型中,由 于數(shù)據(jù)維度的增加,模型能夠?qū)W習(xí)到新的特征并加 W利用,W提高其預(yù)測(cè)準(zhǔn)確率。數(shù)據(jù)更 新、訓(xùn)練W及測(cè)試結(jié)束后,對(duì)比新的評(píng)估模型與已有評(píng)估模型的準(zhǔn)確度,當(dāng)且僅當(dāng)新模型準(zhǔn) 確率提高時(shí)才部署新評(píng)估模型,否則等待下輪學(xué)習(xí)訓(xùn)練過程。
[0085] 根據(jù)本公開的實(shí)施例,還提供一種計(jì)算機(jī)實(shí)現(xiàn)的信息處理裝置400。如圖4所示,裝 置400包括:圖數(shù)據(jù)庫創(chuàng)建裝置401,被配置為獲取多個(gè)訓(xùn)練評(píng)估對(duì)象的相關(guān)數(shù)據(jù),構(gòu)建知識(shí) 圖,并且創(chuàng)建基于知識(shí)圖的圖數(shù)據(jù)庫,其中知識(shí)圖的每個(gè)節(jié)點(diǎn)為評(píng)估對(duì)象或者與評(píng)估對(duì)象 具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)對(duì)象,知識(shí)圖的邊描述知識(shí)圖的節(jié)點(diǎn)之間的關(guān)系并且具有相應(yīng)權(quán)重; 第一計(jì)算裝置402,被配置為基于訓(xùn)練評(píng)估對(duì)象之間的距離,計(jì)算每個(gè)訓(xùn)練評(píng)估對(duì)象的特征 向量,其中距離至少基于訓(xùn)練評(píng)估對(duì)象之間的路徑權(quán)重,特征向量針對(duì)每個(gè)訓(xùn)練評(píng)估對(duì)象 指示在一定的距離內(nèi)不同維度的圖數(shù)據(jù)庫中其他訓(xùn)練評(píng)估對(duì)象的數(shù)量;評(píng)估模型構(gòu)建裝置 403,被配置為將特征向量和多個(gè)訓(xùn)練評(píng)估對(duì)象的評(píng)估類別作為樣本集合,W構(gòu)建評(píng)估模 型;第二計(jì)算裝置404,被配置為響應(yīng)于收到新的評(píng)估對(duì)象的相關(guān)數(shù)據(jù),計(jì)算新的評(píng)估對(duì)象 的特征向量;W及基于評(píng)估模型和新的評(píng)估對(duì)象的特征向量,計(jì)算新的評(píng)估對(duì)象的評(píng)估指 標(biāo);W及審核處理裝置405,被配置為基于新的評(píng)估對(duì)象的評(píng)估指標(biāo),由計(jì)算機(jī)根據(jù)判別條 件完成關(guān)于新的評(píng)估對(duì)象的審核操作。
[0086] 根據(jù)本公開的實(shí)施例,其中訓(xùn)練評(píng)估對(duì)象之間的距離可W根據(jù)下式計(jì)算得到:
[0087]
[008引其中汾別表示第i訓(xùn)練評(píng)估對(duì)象和第j訓(xùn)練評(píng)估對(duì)象,D(Xi,Xj)表示&和Xj之間的距 離,h巧,巧表示&和X脯粗上的節(jié)點(diǎn),L表示&和&的之間路徑的數(shù)目盧鳥,嗎表示Xi和X撕路徑1 上邊的權(quán)重;為路徑1的影響因子
表示影響因子最大的路徑所經(jīng)過的節(jié)點(diǎn)數(shù)目。
[0089] 根據(jù)本公開的實(shí)施例,第一計(jì)算裝置402還被配置為:針對(duì)訓(xùn)練評(píng)估對(duì)象的特定屬 性的每個(gè)屬性值,統(tǒng)計(jì)距離D(xi,xj)中小于特定距離闊值的路徑數(shù)量;W及基于統(tǒng)計(jì)的路徑 數(shù)量,得到訓(xùn)練評(píng)估對(duì)象的特征向量。
[0090] 根據(jù)本公開的實(shí)施例,第二計(jì)算裝置404還被配置為:將新的評(píng)估對(duì)象的相關(guān)數(shù)據(jù) 投射到知識(shí)圖中;基于新的評(píng)估對(duì)象與知識(shí)圖中的其他評(píng)估對(duì)象之間的路徑權(quán)重,計(jì)算新 的評(píng)估對(duì)象與其他評(píng)估對(duì)象之間的距離;W及基于新的評(píng)估對(duì)象與其他評(píng)估對(duì)象之間的距 離,計(jì)算新的評(píng)估對(duì)象的特征向量。
[0091] 根據(jù)本公開的實(shí)施例,其中評(píng)估模型包括W下中的一項(xiàng)或多項(xiàng):決策樹、邏輯回歸 模型、隨機(jī)森林模型。
[0092] 根據(jù)本公開的實(shí)施例,還包括更新裝置406,被配置為更新圖數(shù)據(jù)庫和評(píng)估模型。
[0093] 根據(jù)本公開的實(shí)施例,更新裝置406還被配置為:將多個(gè)新的評(píng)估對(duì)象和相應(yīng)的評(píng) 估類別更新到知識(shí)圖中;基于更新后的知識(shí)圖和圖數(shù)據(jù)庫,生成新的評(píng)估模型;確定新的評(píng) 估模型的準(zhǔn)確度;W及基于新的評(píng)估模型的準(zhǔn)確度,更新評(píng)估模型。
[0094] 根據(jù)本公開的實(shí)施例,其中圖的節(jié)點(diǎn)中的與評(píng)估對(duì)象具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)對(duì)象包 括W下項(xiàng)中的一項(xiàng)或多項(xiàng):評(píng)估對(duì)象相關(guān)聯(lián)的個(gè)人數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的征信數(shù)據(jù) 對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的社會(huì)關(guān)系數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的社交網(wǎng)絡(luò)數(shù)據(jù)對(duì)象;評(píng)估對(duì) 象相關(guān)聯(lián)的通信數(shù)據(jù)對(duì)象。
[00%]根據(jù)本公開的實(shí)施例,其中圖中的邊的權(quán)重至少基于W下項(xiàng)中的一項(xiàng)或多項(xiàng)來確 定:邊所關(guān)聯(lián)的節(jié)點(diǎn)的關(guān)系類型;邊所關(guān)聯(lián)的節(jié)點(diǎn)之間的關(guān)聯(lián)程度。
[0096]通過W上描述和相關(guān)附圖中所給出的教導(dǎo),運(yùn)里所給出的本公開的許多修改形式 和其它實(shí)施方式將被本公開相關(guān)領(lǐng)域的技術(shù)人員所意識(shí)到。因此,所要理解的是,本公開的 實(shí)施方式并不局限于所公開的【具體實(shí)施方式】,并且修改形式和其它實(shí)施方式意在包括在本 公開的范圍之內(nèi)。此外,雖然W上描述和相關(guān)附圖在部件和/或功能的某些示例組合形式的 背景下對(duì)示例實(shí)施方式進(jìn)行了描述,但是應(yīng)當(dāng)意識(shí)到的是,可W由備選實(shí)施方式提供部件 和/或功能的不同組合形式而并不背離本公開的范圍。就運(yùn)點(diǎn)而言,例如,與W上明確描述 的有所不同的部件和/或功能的其它組合形式也被預(yù)期處于本公開的范圍之內(nèi)。雖然運(yùn)里 采用了具體術(shù)語,但是它們僅W-般且描述性的含義所使用而并非意在進(jìn)行限制。
【主權(quán)項(xiàng)】
1. 一種計(jì)算機(jī)實(shí)現(xiàn)的信息處理方法,所述方法包括: 獲取多個(gè)訓(xùn)練評(píng)估對(duì)象的相關(guān)數(shù)據(jù),構(gòu)建知識(shí)圖,并且創(chuàng)建基于所述知識(shí)圖的圖數(shù)據(jù) 庫,其中所述知識(shí)圖的每個(gè)節(jié)點(diǎn)為評(píng)估對(duì)象或者與所述評(píng)估對(duì)象具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)對(duì) 象,所述知識(shí)圖的邊描述所述知識(shí)圖的所述節(jié)點(diǎn)之間的關(guān)系并且具有相應(yīng)權(quán)重; 基于所述訓(xùn)練評(píng)估對(duì)象之間的距離,計(jì)算每個(gè)訓(xùn)練評(píng)估對(duì)象的特征向量,其中所述距 離至少基于所述訓(xùn)練評(píng)估對(duì)象之間的路徑權(quán)重,所述特征向量針對(duì)每個(gè)所述訓(xùn)練評(píng)估對(duì)象 指示在一定的距離內(nèi)不同維度的所述圖數(shù)據(jù)庫中其他訓(xùn)練評(píng)估對(duì)象的數(shù)量; 將所述特征向量和所述多個(gè)訓(xùn)練評(píng)估對(duì)象的評(píng)估類別作為樣本集合,以構(gòu)建評(píng)估模 型; 響應(yīng)于收到新的評(píng)估對(duì)象的相關(guān)數(shù)據(jù),計(jì)算所述新的評(píng)估對(duì)象的特征向量; 基于所述評(píng)估模型和所述新的評(píng)估對(duì)象的所述特征向量,計(jì)算所述新的評(píng)估對(duì)象的評(píng) 估指標(biāo);以及 基于所述新的評(píng)估對(duì)象的所述評(píng)估指標(biāo),由所述計(jì)算機(jī)根據(jù)判別條件完成關(guān)于所述新 的評(píng)估對(duì)象的審核操作。2. 根據(jù)權(quán)利要求1所述的方法,其中所述訓(xùn)練評(píng)估對(duì)象之間的距離根據(jù)下式計(jì)算得到:其中Xl、&分別表示第i訓(xùn)練評(píng)估對(duì)象和第j訓(xùn)練評(píng)估對(duì)象,D(Xl,Xj)表示&和&之間的距離, 表示耵和々路徑1上的節(jié)點(diǎn),L表示沿和々的之間路徑的數(shù)目,?而·表示耵和々的路徑1上所 述邊的權(quán)重%路徑1的影響因子表示影響因子最大的路徑所經(jīng)過的節(jié)點(diǎn)數(shù)目。3. 根據(jù)權(quán)利要求2所述的方法,其中基于所述訓(xùn)練評(píng)估對(duì)象之間的距離,計(jì)算每個(gè)訓(xùn)練 評(píng)估對(duì)象的特征向量包括: 針對(duì)所述訓(xùn)練評(píng)估對(duì)象的特定屬性的每個(gè)屬性值,統(tǒng)計(jì)所述距離D(xi,Xj)中小于特定 距離閾值的路徑數(shù)量;以及 基于統(tǒng)計(jì)的所述路徑數(shù)量,得到所述訓(xùn)練評(píng)估對(duì)象的特征向量。4. 根據(jù)權(quán)利要求1所述的方法,其中響應(yīng)于收到新的評(píng)估對(duì)象的相關(guān)數(shù)據(jù),計(jì)算所述新 的評(píng)估對(duì)象的特征向量包括: 將所述新的評(píng)估對(duì)象的相關(guān)數(shù)據(jù)投射到所述知識(shí)圖中; 基于所述新的評(píng)估對(duì)象與所述知識(shí)圖中的其他評(píng)估對(duì)象之間的路徑權(quán)重,計(jì)算所述新 的評(píng)估對(duì)象與所述其他評(píng)估對(duì)象之間的距離;以及 基于所述新的評(píng)估對(duì)象與所述其他評(píng)估對(duì)象之間的距離,計(jì)算所述新的評(píng)估對(duì)象的特 征向量。5. 根據(jù)權(quán)利要求1所述的方法,其中所述評(píng)估模型包括以下中的一項(xiàng)或多項(xiàng):決策樹、 邏輯回歸模型、隨機(jī)森林模型。6. 根據(jù)權(quán)利要求1所述的方法,還包括:更新所述圖數(shù)據(jù)庫和所述評(píng)估模型。7. 根據(jù)權(quán)利要求6所述的方法,還包括: 將多個(gè)所述新的評(píng)估對(duì)象和相應(yīng)的評(píng)估類別更新到所述知識(shí)圖中; 基于更新后的所述知識(shí)圖和圖數(shù)據(jù)庫,生成新的評(píng)估模型; 確定所述新的評(píng)估模型的準(zhǔn)確度;以及 基于所述新的評(píng)估模型的所述準(zhǔn)確度,更新所述評(píng)估模型。8. 根據(jù)權(quán)利要求1所述的方法,其中所述圖的節(jié)點(diǎn)中的與所述評(píng)估對(duì)象具有關(guān)聯(lián)關(guān)系 的關(guān)聯(lián)對(duì)象包括以下項(xiàng)中的一項(xiàng)或多項(xiàng):評(píng)估對(duì)象相關(guān)聯(lián)的個(gè)人數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān) 聯(lián)的征信數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的社會(huì)關(guān)系數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的社交網(wǎng)絡(luò)數(shù) 據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的通信數(shù)據(jù)對(duì)象。9. 根據(jù)權(quán)利要求1所述的方法,其中所述圖中的所述邊的權(quán)重至少基于以下項(xiàng)中的一 項(xiàng)或多項(xiàng)來確定:所述邊所關(guān)聯(lián)的節(jié)點(diǎn)的關(guān)系類型;所述邊所關(guān)聯(lián)的節(jié)點(diǎn)之間的關(guān)聯(lián)程度。10. -種計(jì)算機(jī)實(shí)現(xiàn)的信息處理裝置,所述裝置包括: 圖數(shù)據(jù)庫創(chuàng)建裝置,被配置為獲取多個(gè)訓(xùn)練評(píng)估對(duì)象的相關(guān)數(shù)據(jù),構(gòu)建知識(shí)圖,并且創(chuàng) 建基于所述知識(shí)圖的圖數(shù)據(jù)庫,其中所述知識(shí)圖的每個(gè)節(jié)點(diǎn)為評(píng)估對(duì)象或者與所述評(píng)估對(duì) 象具有關(guān)聯(lián)關(guān)系的關(guān)聯(lián)對(duì)象,所述知識(shí)圖的邊描述所述知識(shí)圖的所述節(jié)點(diǎn)之間的關(guān)系并且 具有相應(yīng)權(quán)重; 第一計(jì)算裝置,被配置為基于所述訓(xùn)練評(píng)估對(duì)象之間的距離,計(jì)算每個(gè)訓(xùn)練評(píng)估對(duì)象 的特征向量,其中所述距離至少基于所述訓(xùn)練評(píng)估對(duì)象之間的路徑權(quán)重,所述特征向量針 對(duì)每個(gè)所述訓(xùn)練評(píng)估對(duì)象指示在一定的距離內(nèi)不同維度的所述圖數(shù)據(jù)庫中其他訓(xùn)練評(píng)估 對(duì)象的數(shù)量; 評(píng)估模型構(gòu)建裝置,被配置為將所述特征向量和所述多個(gè)訓(xùn)練評(píng)估對(duì)象的評(píng)估類別作 為樣本集合,以構(gòu)建評(píng)估模型; 第二計(jì)算裝置,被配置為響應(yīng)于收到新的評(píng)估對(duì)象的相關(guān)數(shù)據(jù),計(jì)算所述新的評(píng)估對(duì) 象的特征向量;以及基于所述評(píng)估模型和所述新的評(píng)估對(duì)象的所述特征向量,計(jì)算所述新 的評(píng)估對(duì)象的評(píng)估指標(biāo);以及 審核處理裝置,被配置為基于所述新的評(píng)估對(duì)象的所述評(píng)估指標(biāo),由所述計(jì)算機(jī)根據(jù) 判別條件完成關(guān)于所述新的評(píng)估對(duì)象的審核操作。11. 根據(jù)權(quán)利要求10所述的裝置,其中所述訓(xùn)練評(píng)估對(duì)象之間的距離根據(jù)下式計(jì)算得 到:其中&、幻分別表示第i訓(xùn)練評(píng)估對(duì)象和第j訓(xùn)練評(píng)估對(duì)象,D(Xl,Xj)表示取和幻之間的距離, 表示沿和幻路徑1上的節(jié)點(diǎn),L表示沿和幻的之間路徑的數(shù)目,叫內(nèi)表示沿和幻的路徑1上所述邊的權(quán)重;為路徑1的影響因子: 表示影響因子最大的路徑所經(jīng)過的節(jié)點(diǎn)數(shù)目。12. 根據(jù)權(quán)利要求11所述的裝置,所述第一計(jì)算裝置還被配置為: 針對(duì)所述訓(xùn)練評(píng)估對(duì)象的特定屬性的每個(gè)屬性值,統(tǒng)計(jì)所述距離D(xi,Xj)中小于特定 距離閾值的路徑數(shù)量;以及 基于統(tǒng)計(jì)的所述路徑數(shù)量,得到所述訓(xùn)練評(píng)估對(duì)象的特征向量。13. 根據(jù)權(quán)利要求10所述的裝置,所述第二計(jì)算裝置還被配置為: 將所述新的評(píng)估對(duì)象的相關(guān)數(shù)據(jù)投射到所述知識(shí)圖中; 基于所述新的評(píng)估對(duì)象與所述知識(shí)圖中的其他評(píng)估對(duì)象之間的路徑權(quán)重,計(jì)算所述新 的評(píng)估對(duì)象與所述其他評(píng)估對(duì)象之間的距離;以及 基于所述新的評(píng)估對(duì)象與所述其他評(píng)估對(duì)象之間的距離,計(jì)算所述新的評(píng)估對(duì)象的特 征向量。14. 根據(jù)權(quán)利要求10所述的裝置,其中所述評(píng)估模型包括以下中的一項(xiàng)或多項(xiàng):決策 樹、邏輯回歸模型、隨機(jī)森林模型。15. 根據(jù)權(quán)利要求10所述的裝置,還包括更新裝置,被配置為更新所述圖數(shù)據(jù)庫和所述 評(píng)估t吳型。16. 根據(jù)權(quán)利要求15所述的裝置,所述更新裝置還被配置為: 將多個(gè)所述新的評(píng)估對(duì)象和相應(yīng)的評(píng)估類別更新到所述知識(shí)圖中; 基于更新后的所述知識(shí)圖和圖數(shù)據(jù)庫,生成新的評(píng)估模型; 確定所述新的評(píng)估模型的準(zhǔn)確度;以及 基于所述新的評(píng)估模型的所述準(zhǔn)確度,更新所述評(píng)估模型。17. 根據(jù)權(quán)利要求10所述的裝置,其中所述圖的節(jié)點(diǎn)中的與所述評(píng)估對(duì)象具有關(guān)聯(lián)關(guān) 系的關(guān)聯(lián)對(duì)象包括以下項(xiàng)中的一項(xiàng)或多項(xiàng):評(píng)估對(duì)象相關(guān)聯(lián)的個(gè)人數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相 關(guān)聯(lián)的征信數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的社會(huì)關(guān)系數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的社交網(wǎng)絡(luò) 數(shù)據(jù)對(duì)象;評(píng)估對(duì)象相關(guān)聯(lián)的通信數(shù)據(jù)對(duì)象。18. 根據(jù)權(quán)利要求10所述的裝置,其中所述圖中的所述邊的權(quán)重至少基于以下項(xiàng)中的 一項(xiàng)或多項(xiàng)來確定:所述邊所關(guān)聯(lián)的節(jié)點(diǎn)的關(guān)系類型;所述邊所關(guān)聯(lián)的節(jié)點(diǎn)之間的關(guān)聯(lián)程 度。
【文檔編號(hào)】G06F17/30GK106021377SQ201610310902
【公開日】2016年10月12日
【申請(qǐng)日】2016年5月11日
【發(fā)明人】單憶南, K·拉加塞圖帕蒂, 程書欣, 畢鵬
【申請(qǐng)人】上海點(diǎn)榮金融信息服務(wù)有限責(zé)任公司