本發(fā)明屬于金融科技領域,涉及金融領域云計算平臺中,一種特征松弛回歸的宿主機存儲鏈路活動狀態(tài)判別方法及裝置。
背景技術:
1、宿主機作為云管理平臺重要的計算節(jié)點,為金融科技中各類系統(tǒng)運行提供計算、網(wǎng)絡、存儲等算力資源,如何保障宿主機提供穩(wěn)定、可靠的算力服務,及時發(fā)現(xiàn)運行隱患特別是宿主機存儲鏈路隱患,保障宿主機存儲服務不中斷、業(yè)務不降級變得尤為重要。
2、當宿主機存儲鏈路不活動,運行在宿主機上的各類業(yè)務系統(tǒng)服務可受到影響甚至無法提供金融服務、無法開展業(yè)務,甚至可導致客戶投訴,資金損失等。如何及時監(jiān)測、判別宿主機存儲鏈路活動狀態(tài),成為一個需要解決的課題。
3、傳統(tǒng)的宿主機存儲鏈路活動狀態(tài)巡檢方法可為登錄到宿主機所在的云管理平臺中,逐個查看每臺宿主機的每條存儲鏈路狀態(tài)。這種手工判別方式存在如下問題:1.該方式完全手動,依賴巡檢人員的能力水平、技術水準。2.巡檢耗時、費力、效率低,無法滿足宿主機存儲鏈路運行管理、監(jiān)測的時效性要求;3.巡檢操作手動,具有誤點擊、誤操作風險和漏點擊、漏分析問題;
4、此外,針對宿主機存儲鏈路活動狀態(tài)的監(jiān)測,很多金融機構會在云管理平臺中配置監(jiān)控告警,該方式存在如下不足之處:1.告警模塊需要嵌入至云管理平臺中,依賴云管理平臺本身告警配置及監(jiān)測的敏捷度、準確性。2.云管理平臺本身運行失效或告警配置丟失的情況下,將無法實現(xiàn)宿主機存儲鏈路活動狀態(tài)的監(jiān)測;3.無法對存儲鏈路活動狀態(tài)開展離線分析及巡檢;4.告警配置及確認等操作仍需要登錄云管理平臺中,仍具有誤點擊、誤操作風險。
5、近些年,在針對宿主機存儲鏈路原始信息分析模型或算法中,因原始數(shù)據(jù)維度高,數(shù)據(jù)維度之間存在耦合、冗余、線性關系,存在直接判別計算開銷大、分析效果不顯著缺陷以及判別模型過擬合、泛化能力弱等痛點。
6、因此一種能夠無需登錄云管理平臺,不依賴于云管理平臺運行,能夠對原始高維信息進行數(shù)據(jù)處理,剔除耦合、線性、冗余維度信息同時防止模型過擬合,對宿主機存儲鏈路活動狀態(tài)的判別效果提升具有重要意義。
技術實現(xiàn)思路
1、本發(fā)明的目的在于針對傳統(tǒng)金融領域vmware云計算平臺中,需要技術人員登錄云管理平臺進行手動巡檢,存在巡檢結果依賴巡檢人員的能力水平、技術水準,巡檢效率低、無法滿足宿主機存儲鏈路運行管理、監(jiān)測的時效性要求的痛點。同時巡檢操作手動,具有誤點擊、誤操作風險和漏點擊、漏分析問題的缺陷;或者需要依賴敏捷、高準度的告警配置,需要耦合嵌入云管理平臺中,依托云管理平臺運行,無法滿足離線分析及巡檢需求,存在云管理平臺本身運行失效或告警配置丟失、失效情況下,無法實現(xiàn)宿主機存儲鏈路活動狀態(tài)監(jiān)測的痛點,且仍然需要人工登錄云管理平臺,依然具有誤點擊、誤操作等諸多痛點、缺陷,提出了一種能夠無需手工操作,不依賴于云管理平臺運行,能夠對原始高維信息進行數(shù)據(jù)處理,剔除耦合、線性、冗余維度信息,同時能夠自主迭代、回歸學習同類樣本集合的綜合信息及異類樣本集合可易區(qū)分方向,并引入損失函數(shù),通過調整損失函數(shù)松弛系數(shù)、損失函數(shù)調節(jié)參數(shù),調節(jié)樣本特征回歸樣本標簽的松弛程度,解決判別模型剛性回歸、過擬合痛點,實現(xiàn)樣本特征松弛回歸樣本標簽,防止模型過擬合的宿主機存儲鏈路活動狀態(tài)判別方法及裝置。
2、根據(jù)本發(fā)明的第一方面,提供一種特征松弛回歸的宿主機存儲鏈路活動狀態(tài)判別方法,該方法包括以下步驟:
3、(1)通過云管理平臺運行數(shù)據(jù)獲得宿主機主機名以及宿主機存儲鏈路狀態(tài)信息,得到原始樣本,并對其中非數(shù)字特征進行數(shù)字特征處理;
4、(2)以原始樣本中宿主機存儲鏈路活動狀態(tài)作為標簽,基于標簽獲得樣本集合;
5、(3)對原始樣本進行特征數(shù)據(jù)降維,設置目標函數(shù)對樣本標簽進行線性回歸,目標函數(shù)包含:
6、特征回歸,基于回歸樣本標簽可容許偏離的程度作為松弛系數(shù)設置損失函數(shù);
7、回歸截距,表示當樣本特征值全為0時,樣本特征回歸樣本標簽的回歸預測值;
8、求取樣本集合的綜合信息矩陣,該矩陣綜合了樣本集合中所有的樣本信息,并與樣本集合的綜合信息差異最??;
9、選取異類樣本集合當中可易區(qū)分方向,基于回歸矩陣使得樣本降維后不同類樣本具有區(qū)分度,保持異類樣本間綜合信息矩陣差異最大化;
10、(4)循環(huán)迭代求解目標函數(shù),得到判別模型,基于判別模型預測樣本標簽,得到宿主機存儲鏈路活動狀態(tài)判別結果。
11、進一步地,原始樣本數(shù)據(jù)中非數(shù)字特征進行數(shù)字特征處理具體為:建立非數(shù)字特征維度的數(shù)字字典,實現(xiàn)每一維度特征與數(shù)字一一映射關系,通過對原始特征進行數(shù)字替換,完成原始輸入樣本非數(shù)字特征維度特征的數(shù)字處理。
12、進一步地,根據(jù)宿主機存儲鏈路活動狀態(tài)的實際情況,對樣本進行人工標記,該標記作為樣本標簽,基于宿主機存儲鏈路狀態(tài)皆為活動的樣本標簽以及宿主機存儲鏈路狀態(tài)存在不活動鏈路的樣本標簽分別獲得相應的樣本集合。
13、進一步地,特征回歸的損失函數(shù)允許所有的樣本特征在回歸樣本標簽時,均可具有一定的偏移,特征回歸的損失函數(shù)中,基于樣本特征回歸樣本標簽可允許偏移的區(qū)間范圍大小設計損失函數(shù)松弛系數(shù),損失函數(shù)松弛系數(shù)值越大,樣本特征回歸樣本標簽可允許偏移的區(qū)間范圍越大;基于樣本特征回歸樣本標簽超出可允許偏移區(qū)間范圍的樣本約束程度的大小設計損失函數(shù)調節(jié)參數(shù),損失函數(shù)調節(jié)參數(shù)值越大,樣本特征回歸樣本標簽超出偏移范圍的約束程度越大,要求所有的樣本盡可能均在偏離區(qū)間范圍內。
14、進一步地,調節(jié)損失函數(shù)中的松弛系數(shù)以及損失函數(shù)調節(jié)參數(shù),調節(jié)樣本回歸樣本標簽的松弛程度,實現(xiàn)樣本特征松弛回歸樣本標簽。
15、進一步地,樣本集合的綜合信息為樣本集合中的樣本權重系數(shù)乘以樣本并求和得到,其中當樣本特征值存在缺失,或者部分特征值為n/a,則樣本在樣本集合中的樣本權重系數(shù)為0,當樣本特征值完整無缺失,樣本在樣本集合中的樣本權重系數(shù)為完整樣本數(shù)的倒數(shù)。
16、進一步地,初始化回歸矩陣、回歸截距以及樣本集合綜合信息矩陣,對目標函數(shù)中的回歸矩陣、回歸截距以及綜合信息矩陣采取交替迭代方式進行目標函數(shù)求解,當?shù)螖?shù)達到預設的最大迭代次數(shù)或相鄰兩次迭代的回歸截距、回歸矩陣以及樣本集合綜合信息矩陣之間的差異小于預設的差異閾值,則停止迭代。
17、根據(jù)本發(fā)明的第二方面,提供一種特征松弛回歸的宿主機存儲鏈路活動狀態(tài)判別裝置,包括存儲器和一個或多個處理器,所述存儲器中存儲有可執(zhí)行代碼,其特征在于,所述處理器執(zhí)行所述可執(zhí)行代碼時,實現(xiàn)所述的一種特征松弛回歸的宿主機存儲鏈路活動狀態(tài)判別方法。
18、根據(jù)本發(fā)明的第三方面,提供一種計算機可讀存儲介質,其上存儲有程序,其特征在于,所述程序被處理器執(zhí)行時,實現(xiàn)所述的一種特征松弛回歸的宿主機存儲鏈路活動狀態(tài)判別方法。
19、根據(jù)本發(fā)明的第四方面,提供一種計算機程序產(chǎn)品,包括計算機程序,其特征在于,所述計算機程序被處理器執(zhí)行時,實現(xiàn)所述的一種特征松弛回歸的宿主機存儲鏈路活動狀態(tài)判別方法。
20、本發(fā)明的優(yōu)點及有益效果是:
21、本發(fā)明方法針對傳統(tǒng)宿主機存儲鏈路活動狀態(tài)判別方式中,手工巡檢低效、依賴技術人員且需登錄云管理平臺具有遺漏巡檢、誤操作的痛點及風險,或告警配置模塊耦合嵌入云管理平臺、依賴云管理平臺運行,告警效果依賴告警配置的準確及敏捷性,仍需手動登錄云管理平臺的痛點等,提出一種能夠無需手工操作,不依賴于云管理平臺運行,能夠對原始高維信息進行數(shù)據(jù)處理,剔除耦合、線性、冗余維度信息的宿主機存儲鏈路活動狀態(tài)判別方法。該方法通過對宿主機原始的存儲鏈路數(shù)據(jù)的非數(shù)字特征進行數(shù)字化特征處理,實現(xiàn)原始特征可算式計算。通過綜合每類樣本集合中所有樣本信息,并與樣本集合的綜合信息差異最小,通過循環(huán)交替迭代,獲得每類樣本集合的綜合信息矩陣。通過保持異類樣本間綜合信息矩陣差異最大化,選取異類樣本集合中可易區(qū)分方向,能夠使樣本降維后,不同類樣本具有較好的區(qū)分度。通過引入損失函數(shù)并調節(jié)損失函數(shù)中的松弛系數(shù)以及損失函數(shù)調節(jié)參數(shù),調節(jié)樣本回歸樣本標簽的松弛程度,實現(xiàn)樣本特征松弛回歸樣本標簽,解決模型剛性回歸、過擬合問題,完成宿主機存儲鏈路活動狀態(tài)的判別。