1.本公開涉及圖神經(jīng)網(wǎng)絡中的主動學習,并且在一些非限制性實施方案或方面中,涉及通過混合不確定性減少在圖神經(jīng)網(wǎng)絡中的主動學習。2.
背景技術:
圖(graph)是從網(wǎng)絡數(shù)據(jù)學習知識的強大工具,其中節(jié)點表示可以豐富屬性為特征的實例,并且邊對節(jié)點之間的關系進行編碼。然而,收集足夠量的標記數(shù)據(jù)可能是昂貴且耗時的,這增加了圖神經(jīng)網(wǎng)絡向安全關鍵領域,例如異常檢測等的擴展的挑戰(zhàn)。例如,許多現(xiàn)實世界場景的數(shù)據(jù)沒有足夠的標簽,這使得這些場景難以建模為被監(jiān)督問題。此外,許多現(xiàn)有研究集中于獨立和相同分布的數(shù)據(jù)場景,并且不是為聯(lián)網(wǎng)數(shù)據(jù)設計的。選擇用于標記以使圖模型的性能最大化的節(jié)點也并非不重要,因為不同的訓練節(jié)點集可能產(chǎn)生非常不同的圖表示結(jié)果。因此,需要利用主動學習從未標記數(shù)據(jù)動態(tài)地查詢具有最大信息量的實例的標簽,以應對圖中的數(shù)據(jù)短缺挑戰(zhàn)。
背景技術
0、背景
技術實現(xiàn)思路
1、因此,提供了用于通過混合不確定性減少在圖神經(jīng)網(wǎng)絡中主動學習的改進的系統(tǒng)、裝置、產(chǎn)品、設備和/或方法。
2、根據(jù)一些非限制性實施方案或方面,提供了一種計算機實現(xiàn)的方法,包括:(i)利用至少一個處理器獲得包括多條邊和針對所述多條邊的多個節(jié)點的圖,其中所述多個節(jié)點中的標記節(jié)點的子集中的每個標記節(jié)點與標簽相關聯(lián),并且其中所述多個節(jié)點中的未標記節(jié)點的子集中的每個未標記節(jié)點與標簽不相關聯(lián);(ii)利用所述至少一個處理器,使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽訓練圖神經(jīng)網(wǎng)絡(gnn),其中訓練所述gnn生成對所述多個節(jié)點中的每個節(jié)點的預測;(iii)利用所述至少一個處理器從所述未標記節(jié)點的子集生成候選節(jié)點的候選池;(iv)利用所述至少一個處理器使用標簽傳播算法為所述候選節(jié)點的候選池中的每個候選節(jié)點生成預測標簽;(v)利用所述至少一個處理器選擇所述候選節(jié)點的候選池中的與所述圖的最大混合熵減少相關聯(lián)的候選節(jié)點,其中基于對所述多個節(jié)點中的每個節(jié)點的預測確定所述圖的當前熵,其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,基于該候選節(jié)點的預測標簽確定所述圖的更新熵,并且其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,所述圖的混合熵減少被確定為所述圖的當前熵與針對該候選節(jié)點確定的所述圖的更新熵之間的差;(vi)利用所述至少一個處理器提供所選擇的候選節(jié)點以進行標記;(vii)利用所述至少一個處理器接收與所選擇的候選節(jié)點相關聯(lián)的新標簽;(viii)利用所述至少一個處理器將所選擇的候選節(jié)點作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集;以及(ix)利用所述至少一個處理器使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽,包括作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集的所選擇的候選節(jié)點的標簽,重新訓練所述gnn,其中重新訓練所述gnn重新生成對所述多個節(jié)點中的每個節(jié)點的預測。
3、在一些非限制性實施方案或方面中,所述方法還包括:利用所述至少一個處理器重復步驟(iii)-(ix)預算次數(shù)。
4、在一些非限制性實施方案或方面中,所述方法還包括:在重復步驟(iii)-(ix)預算次數(shù)之后,提供重新訓練的gnn;利用所述至少一個處理器接收另一圖,所述另一圖包括多條另外邊和針對所述多條另外邊的多個另外節(jié)點;利用所述至少一個處理器,使用所述重新訓練的gnn,通過提供所述另一圖作為所述gnn的輸入并且接收對所述多個另外節(jié)點中的每個另外節(jié)點的另一預測作為所述gnn的輸出來處理所述另一圖;以及利用所述至少一個處理器,基于對所述多個另外節(jié)點中的每個另外節(jié)點的另一預測,將所述多個另外節(jié)點中的另外節(jié)點識別為異常節(jié)點。
5、在一些非限制性實施方案或方面中,所述多個另外節(jié)點與多個商家相關聯(lián),并且其中與所述另外節(jié)點相關聯(lián)的商家被識別為默認風險。
6、在一些非限制性實施方案或方面中,所述方法還包括:響應于將所述商家識別為默認風險,執(zhí)行以下各項中的至少一項:(i)利用所述至少一個處理器將與所述商家的賬戶相關聯(lián)的信息自動傳輸?shù)綌?shù)據(jù)庫,以將所述賬戶標記為與所述默認風險相關聯(lián);(ii)利用所述至少一個處理器通過取消與所述商家相關聯(lián)的交易自動暫停在交易處理網(wǎng)絡中對所述交易的處理;(iii)利用所述至少一個處理器自動暫停所述商家的賬戶對所述交易處理網(wǎng)絡中的交易服務提供方系統(tǒng)的訪問;或者其任何組合。
7、在一些非限制性實施方案或方面中,從所述未標記節(jié)點的子集生成所述候選節(jié)點的候選池包括以下各項中的至少一項:(i)將所述未標記節(jié)點的子集聚類成未標記節(jié)點的多個集群,并且從所述多個集群中的每個集群為所述候選節(jié)點的候選池選擇在該集群的中心的閾值距離內(nèi)的未標記節(jié)點;(ii)基于所述圖計算所述未標記節(jié)點的子集中的每個未標記節(jié)點的圖中心性,并且為所述候選節(jié)點的候選池選擇與滿足閾值圖中心性的圖中心性相關聯(lián)的未標記節(jié)點;(iii)使用所述標簽傳播算法為所述未標記節(jié)點的子集中的每個未標記節(jié)點生成預測標簽,針對每個未標記節(jié)點,將該未標記節(jié)點的預測標簽與對該節(jié)點的預測進行比較,并且為所述候選節(jié)點的候選池選擇與所述預測標簽和所述預測之間的不一致相關聯(lián)的未標記節(jié)點;或者其任何組合。
8、在一些非限制性實施方案或方面中,所述gnn包括圖卷積網(wǎng)絡(gcn)。
9、根據(jù)一些非限制性實施方案或方面,提供了一種系統(tǒng),包括:至少一個處理器,所述至少一個處理器被編程和/或配置成:(i)獲得包括多條邊和針對所述多條邊的多個節(jié)點的圖,其中所述多個節(jié)點中的標記節(jié)點的子集中的每個標記節(jié)點與標簽相關聯(lián),并且其中所述多個節(jié)點中的未標記節(jié)點的子集中的每個未標記節(jié)點與標簽不相關聯(lián);(ii)使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽訓練圖神經(jīng)網(wǎng)絡(gnn),其中訓練所述gnn生成對所述多個節(jié)點中的每個節(jié)點的預測;(iii)從所述未標記節(jié)點的子集生成候選節(jié)點的候選池;(iv)使用標簽傳播算法為所述候選節(jié)點的候選池中的每個候選節(jié)點生成預測標簽;(v)選擇所述候選節(jié)點的候選池中的與所述圖的最大混合熵減少相關聯(lián)的候選節(jié)點,其中基于對所述多個節(jié)點中的每個節(jié)點的預測確定所述圖的當前熵,其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,基于該候選節(jié)點的預測標簽確定所述圖的更新熵,并且其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,所述圖的混合熵減少被確定為所述圖的當前熵與針對該候選節(jié)點確定的所述圖的更新熵之間的差;(vi)提供所選擇的候選節(jié)點以進行標記;(vii)接收與所選擇的候選節(jié)點相關聯(lián)的新標簽;(viii)將所選擇的候選節(jié)點作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集中;并且(ix)使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽,包括作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集的所選擇的候選節(jié)點的標簽,重新訓練所述gnn,其中重新訓練所述gnn重新生成對所述多個節(jié)點中的每個節(jié)點的預測。
10、在一些非限制性實施方案或方面中,所述至少一個處理器還被編程和/或配置成:重復步驟(iii)-(ix)預算次數(shù)。
11、在一些非限制性實施方案或方面中,所述至少一個處理器還被編程和/或配置成:在重復步驟(iii)–(ix)預算次數(shù)之后,提供重新訓練的gnn;接收另一圖,所述另一圖包括多條另外邊和針對所述多條另外邊的多個另外節(jié)點;使用所述重新訓練的gnn,通過提供所述另一圖作為所述gnn的輸入并且接收對所述多個另外節(jié)點中的每個另外節(jié)點的另一預測作為所述gnn的輸出來處理所述另一圖;以及基于對所述多個另外節(jié)點中的每個另外節(jié)點的另一預測,將所述多個另外節(jié)點中的另外節(jié)點識別為異常節(jié)點。
12、在一些非限制性實施方案或方面中,所述多個另外節(jié)點與多個商家相關聯(lián),并且其中與所述另外節(jié)點相關聯(lián)的商家被識別為默認風險。
13、在一些非限制性實施方案或方面中,所述至少一個處理器還被編程和/或配置成:響應于將所述商家識別為默認風險,執(zhí)行以下各項中的至少一項:(i)將與所述商家的賬戶相關聯(lián)的信息自動傳輸?shù)綌?shù)據(jù)庫,以將所述賬戶標記為與所述默認風險相關聯(lián);(ii)通過取消與所述商家相關聯(lián)的交易自動暫停在交易處理網(wǎng)絡中對所述交易的處理;(iii)自動暫停所述商家的賬戶對所述交易處理網(wǎng)絡中的交易服務提供方系統(tǒng)的訪問;或者其任何組合。
14、在一些非限制性實施方案或方面中,所述至少一個處理器被編程和/或配置成通過以下各項中的至少一項從所述未標記節(jié)點的子集生成所述候選節(jié)點的候選池:(i)將所述未標記節(jié)點的子集聚類成未標記節(jié)點的多個集群,并且從所述多個集群中的每個集群為所述候選節(jié)點的候選池選擇在該集群的中心的閾值距離內(nèi)的未標記節(jié)點;(ii)基于所述圖計算所述未標記節(jié)點的子集中的每個未標記節(jié)點的圖中心性,并且為所述候選節(jié)點的候選池選擇與滿足閾值圖中心性的圖中心性相關聯(lián)的未標記節(jié)點;(iii)使用所述標簽傳播算法生成所述未標記節(jié)點的子集中的每個未標記節(jié)點的預測標簽,針對每個未標記節(jié)點,將該未標記節(jié)點的預測標簽與對該節(jié)點的預測進行比較,并且為所述候選節(jié)點的候選池選擇與所述預測標簽和所述預測之間的不一致相關聯(lián)的未標記節(jié)點;或者其任何組合。
15、在一些非限制性實施方案或方面中,所述gnn包括圖卷積網(wǎng)絡(gcn)。
16、根據(jù)一些非限制性實施方案或方面,提供了一種計算機程序產(chǎn)品,包括至少一個非暫態(tài)計算機可讀介質(zhì),所述至少一個非暫態(tài)計算機可讀介質(zhì)包括程序指令,所述程序指令在由至少一個處理器執(zhí)行時使所述至少一個處理器:(i)獲得包括多條邊和針對所述多條邊的多個節(jié)點的圖,其中所述多個節(jié)點中的標記節(jié)點的子集中的每個標記節(jié)點與標簽相關聯(lián),并且其中所述多個節(jié)點中的未標記節(jié)點的子集中的每個未標記節(jié)點與標簽不相關聯(lián);(ii)使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽訓練圖神經(jīng)網(wǎng)絡(gnn),其中訓練所述gnn生成對所述多個節(jié)點中的每個節(jié)點的預測;(iii)從所述未標記節(jié)點的子集生成候選節(jié)點的候選池;(iv)使用標簽傳播算法為所述候選節(jié)點的候選池中的每個候選節(jié)點生成預測標簽;(v)選擇所述候選節(jié)點的候選池中的與所述圖的最大混合熵減少相關聯(lián)的候選節(jié)點,其中基于對所述多個節(jié)點中的每個節(jié)點的預測確定所述圖的當前熵,其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,基于該候選節(jié)點的預測標簽確定所述圖的更新熵,并且其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,所述圖的混合熵減少被確定為所述圖的當前熵與針對該候選節(jié)點確定的所述圖的更新熵之間的差;(vi)提供所選擇的候選節(jié)點以進行標記;(vii)接收與所選擇的候選節(jié)點相關聯(lián)的新標簽;(viii)將所選擇的候選節(jié)點作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集中;并且(ix)使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽,包括作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集的所選擇的候選節(jié)點的標簽,重新訓練所述gnn,其中重新訓練所述gnn重新生成所述多個節(jié)點中的每個節(jié)點的預測。
17、在一些非限制性實施方案或方面中,所述程序指令在由所述至少一個處理器執(zhí)行時還使所述至少一個處理器:重復步驟(iii)-(ix)預算次數(shù)。
18、在一些非限制性實施方案或方面中,所述程序指令在由所述至少一個處理器執(zhí)行時還使所述至少一個處理器:在重復步驟(iii)–(ix)預算次數(shù)之后,提供重新訓練的gnn;接收另一圖,所述另一圖包括多條另外邊和針對所述多條另外邊的多個另外節(jié)點;使用所述重新訓練的gnn,通過提供所述另一圖作為所述gnn的輸入并且接收對所述多個另外節(jié)點中的每個另外節(jié)點的另一預測作為所述gnn的輸出來處理所述另一圖;并且基于對所述多個另外節(jié)點中的每個另外節(jié)點的另一預測,將所述多個另外節(jié)點中的另外節(jié)點識別為異常節(jié)點。
19、在一些非限制性實施方案或方面中,所述多個另外節(jié)點與多個商家相關聯(lián),并且其中與所述另外節(jié)點相關聯(lián)的商家被識別為默認風險。
20、在一些非限制性實施方案或方面中,所述程序指令在由所述至少一個處理器執(zhí)行時還使所述至少一個處理器:響應于將所述商家識別為默認風險,執(zhí)行以下各項中的至少一項:(i)將與所述商家的賬戶相關聯(lián)的信息自動傳輸?shù)綌?shù)據(jù)庫,以將所述賬戶標記為與所述默認風險相關聯(lián);(ii)通過取消與所述商家相關聯(lián)的交易自動暫停在交易處理網(wǎng)絡中對所述交易的處理;(iii)自動暫停所述商家的賬戶對所述交易處理網(wǎng)絡中的交易服務提供方系統(tǒng)的訪問;或者其任何組合。
21、在一些非限制性實施方案或方面中,所述程序指令在由所述至少一個處理器執(zhí)行時使所述至少一個處理器通過以下各項中的至少一項從所述未標記節(jié)點的子集生成所述候選節(jié)點的候選池:(i)將所述未標記節(jié)點的子集聚類成未標記節(jié)點的多個集群,并且從所述多個集群中的每個集群為所述候選節(jié)點的候選池選擇在該集群的中心的閾值距離內(nèi)的未標記節(jié)點;(ii)基于所述圖計算所述未標記節(jié)點的子集中的每個未標記節(jié)點的圖中心性,并且為所述候選節(jié)點的候選池選擇與滿足閾值圖中心性的圖中心性相關聯(lián)的未標記節(jié)點;(iii)使用所述標簽傳播算法為所述未標記節(jié)點的子集中的每個未標記節(jié)點生成預測標簽,針對每個未標記節(jié)點,將該未標記節(jié)點的預測標簽與對該節(jié)點的預測進行比較,并且為所述候選節(jié)點的候選池選擇與所述預測標簽和所述預測之間的不一致相關聯(lián)的未標記節(jié)點;或者其任何組合。
22、在以下編號條款中闡述其他非限制性實施方案或方面:
23、條款1.一種計算機實現(xiàn)的方法,包括:(i)利用至少一個處理器獲得包括多條邊和針對所述多條邊的多個節(jié)點的圖,其中所述多個節(jié)點中的標記節(jié)點的子集中的每個標記節(jié)點與標簽相關聯(lián),并且其中所述多個節(jié)點中的未標記節(jié)點的子集中的每個未標記節(jié)點與標簽不相關聯(lián);(ii)利用所述至少一個處理器,使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽訓練圖神經(jīng)網(wǎng)絡(gnn),其中訓練所述gnn生成對所述多個節(jié)點中的每個節(jié)點的預測;(iii)利用所述至少一個處理器從所述未標記節(jié)點的子集生成候選節(jié)點的候選池;(iv)利用所述至少一個處理器使用標簽傳播算法為所述候選節(jié)點的候選池中的每個候選節(jié)點生成預測標簽;(v)利用所述至少一個處理器選擇所述候選節(jié)點的候選池中的與所述圖的最大混合熵減少相關聯(lián)的候選節(jié)點,其中基于對所述多個節(jié)點中的每個節(jié)點的預測確定所述圖的當前熵,其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,基于該候選節(jié)點的預測標簽確定所述圖的更新熵,并且其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,所述圖的混合熵減少被確定為所述圖的當前熵與針對該候選節(jié)點確定的所述圖的更新熵之間的差;(vi)利用所述至少一個處理器提供所選擇的候選節(jié)點以進行標記;(vii)利用所述至少一個處理器接收與所選擇的候選節(jié)點相關聯(lián)的新標簽;(viii)利用所述至少一個處理器將所選擇的候選節(jié)點作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集;以及(ix)利用所述至少一個處理器使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽,包括作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集的所選擇的候選節(jié)點的標簽,重新訓練所述gnn,其中重新訓練所述gnn重新生成對所述多個節(jié)點中的每個節(jié)點的預測。
24、條款2.根據(jù)條款1所述的計算機實現(xiàn)的方法,還包括:利用所述至少一個處理器重復步驟(iii)-(ix)預算次數(shù)。
25、條款3.根據(jù)條款1或2所述的計算機實現(xiàn)的方法,還包括:在重復步驟(iii)-(ix)預算次數(shù)之后,提供重新訓練的gnn;利用所述至少一個處理器接收另一圖,所述另一圖包括多條另外邊和針對所述多條另外邊的多個另外節(jié)點;利用所述至少一個處理器,使用所述重新訓練的gnn,通過提供所述另一圖作為所述gnn的輸入并且接收對所述多個另外節(jié)點中的每個另外節(jié)點的另一預測作為所述gnn的輸出來處理所述另一圖;以及利用所述至少一個處理器,基于對所述多個另外節(jié)點中的每個另外節(jié)點的另一預測,將所述多個另外節(jié)點中的另外節(jié)點識別為異常節(jié)點。
26、條款4.根據(jù)條款1-3中任一項所述的計算機實現(xiàn)的方法,其中所述多個另外節(jié)點與多個商家相關聯(lián),并且其中與所述另外節(jié)點相關聯(lián)的商家被識別為默認風險。
27、條款5.根據(jù)條款1-4中任一項所述的計算機實現(xiàn)的方法,還包括:響應于將所述商家識別為默認風險,執(zhí)行以下各項中的至少一項:(i)利用所述至少一個處理器將與所述商家的賬戶相關聯(lián)的信息自動傳輸?shù)綌?shù)據(jù)庫,以將所述賬戶標記為與所述默認風險相關聯(lián);(ii)利用所述至少一個處理器通過取消與所述商家相關聯(lián)的交易自動暫停在交易處理網(wǎng)絡中對所述交易的處理;(iii)利用所述至少一個處理器自動暫停所述商家的賬戶對所述交易處理網(wǎng)絡中的交易服務提供方系統(tǒng)的訪問;或者其任何組合。
28、條款6.根據(jù)條款1-5中任一項所述的計算機實現(xiàn)的方法,其中從所述未標記節(jié)點的子集生成所述候選節(jié)點的候選池包括以下各項中的至少一項:(i)將所述未標記節(jié)點的子集聚類成未標記節(jié)點的多個集群,并且從所述多個集群中的每個集群為所述候選節(jié)點的候選池選擇在該集群的中心的閾值距離內(nèi)的未標記節(jié)點;(ii)基于所述圖計算所述未標記節(jié)點的子集中的每個未標記節(jié)點的圖中心性,并且為所述候選節(jié)點的候選池選擇與滿足閾值圖中心性的圖中心性相關聯(lián)的未標記節(jié)點;(iii)使用所述標簽傳播算法為所述未標記節(jié)點的子集中的每個未標記節(jié)點生成預測標簽,針對每個未標記節(jié)點,將該未標記節(jié)點的預測標簽與對該節(jié)點的預測進行比較,并且為所述候選節(jié)點的候選池選擇與所述預測標簽和所述預測之間的不一致相關聯(lián)的未標記節(jié)點;或者其任何組合。
29、條款7.根據(jù)條款1-6中任一項所述的計算機實現(xiàn)的方法,其中所述gnn包括圖卷積網(wǎng)絡(gcn)。
30、條款8.一種系統(tǒng),包括:至少一個處理器,所述至少一個處理器被編程和/或配置成:(i)獲得包括多條邊和針對所述多條邊的多個節(jié)點的圖,其中所述多個節(jié)點中的標記節(jié)點的子集中的每個標記節(jié)點與標簽相關聯(lián),并且其中所述多個節(jié)點中的未標記節(jié)點的子集中的每個未標記節(jié)點與標簽不相關聯(lián);(ii)使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽訓練圖神經(jīng)網(wǎng)絡(gnn),其中訓練所述gnn生成對所述多個節(jié)點中的每個節(jié)點的預測;(iii)從所述未標記節(jié)點的子集生成候選節(jié)點的候選池;(iv)使用標簽傳播算法為所述候選節(jié)點的候選池中的每個候選節(jié)點生成預測標簽;(v)選擇所述候選節(jié)點的候選池中的與所述圖的最大混合熵減少相關聯(lián)的候選節(jié)點,其中基于對所述多個節(jié)點中的每個節(jié)點的預測確定所述圖的當前熵,其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,基于該候選節(jié)點的預測標簽確定所述圖的更新熵,并且其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,所述圖的混合熵減少被確定為所述圖的當前熵與針對該候選節(jié)點確定的所述圖的更新熵之間的差;(vi)提供所選擇的候選節(jié)點以進行標記;(vii)接收與所選擇的候選節(jié)點相關聯(lián)的新標簽;(viii)將所選擇的候選節(jié)點作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集中;以及(ix)使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽,包括作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集的所選擇的候選節(jié)點的標簽,重新訓練所述gnn,其中重新訓練所述gnn重新生成對所述多個節(jié)點中的每個節(jié)點的預測。
31、條款9.根據(jù)條款8所述的系統(tǒng),其中所述至少一個處理器還被編程和/或配置成:重復步驟(iii)-(ix)預算次數(shù)。
32、條款10.根據(jù)條款8或9所述的系統(tǒng),其中所述至少一個處理器還被編程和/或配置成:在重復所述步驟(iii)–(ix)預算次數(shù)之后,提供重新訓練的gnn;接收另一圖,所述另一圖包括多條另外邊和針對所述多條另外邊的多個另外節(jié)點;使用所述重新訓練的gnn,通過提供所述另一圖作為所述gnn的輸入處理所述另一圖,并且接收對所述多個另外節(jié)點中的每個另外節(jié)點的另外一預測作為所述gnn的輸出;并且基于對所述多個另外節(jié)點中的每個另外節(jié)點的另一預測,將所述多個另外節(jié)點中的另外節(jié)點識別為異常節(jié)點。
33、條款11.根據(jù)條款8-10中任一項所述的系統(tǒng),其中所述多個另外節(jié)點與多個商家相關聯(lián),并且其中與所述另外節(jié)點相關聯(lián)的商家被識別為默認風險。
34、條款12.根據(jù)條款8-11中任一項所述的系統(tǒng),其中所述至少一個處理器還被編程和/或配置成:響應于將所述商家識別為默認風險,執(zhí)行以下各項中的至少一項:(i)將與所述商家的賬戶相關聯(lián)的信息自動傳輸?shù)綌?shù)據(jù)庫,以將所述賬戶標記為與所述默認風險相關聯(lián);(ii)通過取消與所述商家相關聯(lián)的交易自動暫停在交易處理網(wǎng)絡中對所述交易的處理;(iii)自動暫停所述商家的賬戶對所述交易處理網(wǎng)絡中的交易服務提供方系統(tǒng)的訪問;或者其任何組合。
35、條款13.根據(jù)條款8-12中任一項所述的系統(tǒng),其中所述至少一個處理器被編程和/或配置成通過以下各項中的至少一項從所述未標記節(jié)點的子集生成所述候選節(jié)點的候選池:(i)將所述未標記節(jié)點的子集聚類成未標記節(jié)點的多個集群,并且從所述多個集群中的每個集群為所述候選節(jié)點的候選池選擇在該集群的中心的閾值距離內(nèi)的未標記節(jié)點;(ii)基于所述圖計算所述未標記節(jié)點的子集中的每個未標記節(jié)點的圖中心性,并且為所述候選節(jié)點的候選池選擇與滿足閾值圖中心性的圖中心性相關聯(lián)的未標記節(jié)點;(iii)使用所述標簽傳播算法為所述未標記節(jié)點的子集中的每個未標記節(jié)點生成預測標簽,針對每個未標記節(jié)點,將該未標記節(jié)點的預測標簽與對該節(jié)點的預測進行比較,并且為所述候選節(jié)點的候選池選擇與所述預測標簽和所述預測之間的不一致相關聯(lián)的所述未標記節(jié)點;或者其任何組合。
36、條款14.根據(jù)條款8-13中任一項所述的系統(tǒng),其中所述gnn包括圖卷積網(wǎng)絡(gcn)。
37、條款15.一種計算機程序產(chǎn)品,包括至少一個非暫態(tài)計算機可讀介質(zhì),所述至少一個非暫態(tài)計算機可讀介質(zhì)包括程序指令,所述程序指令在由至少一個處理器執(zhí)行時使所述至少一個處理器:(i)獲得包括多條邊和針對所述多條邊的多個節(jié)點的圖,其中所述多個節(jié)點中的標記節(jié)點的子集中的每個標記節(jié)點與標簽相關聯(lián),并且其中所述多個節(jié)點中的未標記節(jié)點的子集中的每個未標記節(jié)點與標簽不相關聯(lián);(ii)使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽訓練圖神經(jīng)網(wǎng)絡(gnn),其中訓練所述gnn生成對所述多個節(jié)點中的每個節(jié)點的預測;(iii)從所述未標記節(jié)點的子集生成候選節(jié)點的候選池;(iv)使用標簽傳播算法為所述候選節(jié)點的候選池中的每個候選節(jié)點生成預測標簽;(v)選擇所述候選節(jié)點的候選池中的與所述圖的最大混合熵減少相關聯(lián)的候選節(jié)點,其中基于對所述多個節(jié)點中的每個節(jié)點的預測確定所述圖的當前熵,其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,基于所述候選節(jié)點的預測標簽確定所述圖的更新熵,并且其中,對于所述候選節(jié)點的候選池中的每個候選節(jié)點,所述圖的混合熵減少被確定為所述圖的當前熵與針對該候選節(jié)點確定的圖的更新熵之間的差;(vi)提供所選擇的候選節(jié)點以進行標記;(vii)接收與所選擇的候選節(jié)點相關聯(lián)的新標簽;(viii)將所選擇的候選節(jié)點作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集中;以及(ix)使用所述圖和所述標記節(jié)點的子集中的每個標記節(jié)點的標簽,包括作為與所述新標簽相關聯(lián)的標記節(jié)點添加到所述標記節(jié)點的子集的所選擇的候選節(jié)點的標簽,重新訓練所述gnn,其中重新訓練所述gnn重新生成對所述多個節(jié)點中的每個節(jié)點的預測。
38、條款16.根據(jù)條款15所述的計算機程序產(chǎn)品,其中所述程序指令在由所述至少一個處理器執(zhí)行時還使所述至少一個處理器:重復步驟(iii)-(ix)預算次數(shù)。
39、條款17.根據(jù)條款15或16所述的計算機程序產(chǎn)品,其中所述程序指令在由所述至少一個處理器執(zhí)行時還使所述至少一個處理器:在重復步驟(iii)–(ix)預算次數(shù)之后,提供重新訓練的gnn;接收另一圖,所述另一圖包括多條另外邊和針對所述多條另外邊的多個另外節(jié)點;使用所述重新訓練的gnn,通過提供所述另一圖作為所述gnn的輸入并且接收對所述多個另外節(jié)點中的每個另外節(jié)點的另一預測作為所述gnn的輸出來處理所述另一圖;并且基于對所述多個另外節(jié)點中的每個另外節(jié)點的另一預測,將所述多個另外節(jié)點中的另外節(jié)點識別為異常節(jié)點。
40、條款18.根據(jù)條款15-17中任一項所述的計算機程序產(chǎn)品,其中所述多個另外節(jié)點與多個商家相關聯(lián),并且其中與所述另外節(jié)點相關聯(lián)的商家被識別為默認風險。
41、條款19.根據(jù)條款15-18中任一項所述的計算機程序產(chǎn)品,其中所述程序指令在由所述至少一個處理器執(zhí)行時還使所述至少一個處理器:響應于將所述商家識別為默認風險,執(zhí)行以下各項中的至少一項:(i)將與所述商家的賬戶相關聯(lián)的信息自動傳輸?shù)綌?shù)據(jù)庫,以將所述賬戶標記為與所述默認風險相關聯(lián);(ii)通過取消與所述商家相關聯(lián)的交易自動暫停在交易處理網(wǎng)絡中對所述交易的處理;(iii)自動暫停所述商家的賬戶對所述交易處理網(wǎng)絡中的交易服務提供方系統(tǒng)的訪問;或者其任何組合。
42、條款20.根據(jù)條款15-19中任一項所述的計算機程序產(chǎn)品,其中所述程序指令在由所述至少一個處理器執(zhí)行時使所述至少一個處理器通過以下各項中的至少一項從所述未標記節(jié)點的子集生成所述候選節(jié)點的候選池:(i)將所述未標記節(jié)點的子集聚類成未標記節(jié)點的多個集群,并且從所述多個集群中的每個集群為所述候選節(jié)點的候選池選擇在該集群的中心的閾值距離內(nèi)的未標記節(jié)點;(ii)基于所述圖計算所述未標記節(jié)點的子集中的每個未標記節(jié)點的圖中心性,并且為所述候選節(jié)點的候選池選擇與滿足閾值圖中心性的圖中心性相關聯(lián)的未標記節(jié)點;(iii)使用所述標簽傳播算法為所述未標記節(jié)點的子集中的每個未標記節(jié)點生成預測標簽,針對每個未標記節(jié)點,將該未標記節(jié)點的預測標簽與對該節(jié)點的預測進行比較,并且為所述候選節(jié)點的候選池選擇與所述預測標簽和所述預測之間的不一致相關聯(lián)的未標記節(jié)點;或者其任何組合。
43、在參考附圖考慮以下描述和所附權利要求書時,本公開的這些和其它特征和特性以及相關結(jié)構(gòu)元件和各部分的組合的操作方法和功能以及制造經(jīng)濟性將變得更加顯而易見,所有附圖形成本說明書的部分,其中相似附圖標號在各圖中標示對應部分。然而,應明確地理解,各圖式僅用于說明和描述目的,并非旨在作為對限制的定義。除非上下文另外明確規(guī)定,否則在本說明書和權利要求書中所用時,單數(shù)形式“一”及“所述”包括多個指示物。