1.一種云端ai驅(qū)動的大數(shù)據(jù)處理系統(tǒng),其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的云端ai驅(qū)動的大數(shù)據(jù)處理系統(tǒng),其特征在于,所述預測存儲消耗時長的獲取方式為:生成待存儲數(shù)據(jù)的若干副本數(shù)據(jù)塊,以數(shù)據(jù)丟失概率pds,訪問速度fv和存儲成本fc為約束,求解得到待存儲數(shù)據(jù)對應的存儲分布位置矩陣,從存儲分布位置矩陣中找到每個副本數(shù)據(jù)塊的目標存儲位置;基于每個副本數(shù)據(jù)塊與對應目標存儲位置的距離和網(wǎng)絡傳輸速度,計算每個副本數(shù)據(jù)塊抵達存儲分布位置矩陣的預測存儲消耗時長。
3.根據(jù)權(quán)利要求2所述的云端ai驅(qū)動的大數(shù)據(jù)處理系統(tǒng),其特征在于,所述預測存儲消耗時長的獲取過程包括下列內(nèi)容:
4.根據(jù)權(quán)利要求3所述的云端ai驅(qū)動的大數(shù)據(jù)處理系統(tǒng),其特征在于,所述存儲分布位置矩陣的獲取過程包括下列步驟:
5.根據(jù)權(quán)利要求1所述的云端ai驅(qū)動的大數(shù)據(jù)處理系統(tǒng),其特征在于,所述訪問時間偏離度的獲取方式為:基于訪問請求從數(shù)據(jù)庫中選擇距離最小的副本數(shù)據(jù)塊作為最近副本;獲取最近副本和數(shù)據(jù)請求位置的傳輸距離;基于實時網(wǎng)絡速度和副本數(shù)據(jù)塊大小,以及傳輸距離,計算得到預測訪問消耗時長;通過監(jiān)控實時測量,得到實際訪問消耗時長;基于實際訪問消耗時長和預測訪問消耗時長的差值,構(gòu)建得到訪問時間偏離度。
6.根據(jù)權(quán)利要求1所述的云端ai驅(qū)動的大數(shù)據(jù)處理系統(tǒng),其特征在于,基于機器學習算法搭建算力服務完成時間的算力任務預測模型,將算力服務的請求數(shù)據(jù)輸入算力任務預測模型,輸出預測算力服務完成時間,所述算力任務預測模型的搭建過程包括下列步驟:
7.根據(jù)權(quán)利要求1所述的云端ai驅(qū)動的大數(shù)據(jù)處理系統(tǒng),其特征在于,所述大數(shù)據(jù)處理系統(tǒng)還包括:
8.根據(jù)權(quán)利要求7所述的云端ai驅(qū)動的大數(shù)據(jù)處理系統(tǒng),其特征在于,用數(shù)據(jù)存儲質(zhì)量評估指數(shù)ya表示存儲時間偏離度;所述數(shù)據(jù)存儲質(zhì)量評估指數(shù)ya的獲取方式為:
9.根據(jù)權(quán)利要求7所述的云端ai驅(qū)動的大數(shù)據(jù)處理系統(tǒng),其特征在于,用數(shù)據(jù)訪問質(zhì)量評估指數(shù)yb表示訪問時間偏離度,獲取訪問的響應時間閾值記為tth;