1.全數(shù)據(jù)ai管控系統(tǒng)的智能化數(shù)據(jù)治理方法,其特征在于,所述方法包括:
2.如權利要求1所述的全數(shù)據(jù)ai管控系統(tǒng)的智能化數(shù)據(jù)治理方法,其特征在于,所述步驟4中對每個數(shù)據(jù)源進行數(shù)據(jù)治理的方法依次包括:數(shù)據(jù)清洗、數(shù)據(jù)去重、數(shù)據(jù)校驗和數(shù)據(jù)標準化。
3.如權利要求2所述的全數(shù)據(jù)ai管控系統(tǒng)的智能化數(shù)據(jù)治理方法,其特征在于,所述步驟1中的運行狀態(tài)數(shù)據(jù)包括:數(shù)據(jù)源在每個時間的數(shù)據(jù)量、數(shù)據(jù)源的維度數(shù)、數(shù)據(jù)源的數(shù)據(jù)更新頻率、數(shù)據(jù)源的字段數(shù)量和數(shù)據(jù)源的數(shù)據(jù)類型數(shù)。
4.如權利要求3所述的全數(shù)據(jù)ai管控系統(tǒng)的智能化數(shù)據(jù)治理方法,其特征在于,通過如下公式,計算總熵?:
5.如權利要求4所述的全數(shù)據(jù)ai管控系統(tǒng)的智能化數(shù)據(jù)治理方法,其特征在于,步驟2中的質(zhì)量表征數(shù)據(jù)包括:完整率、準確率和一致率;所述完整率表征源數(shù)據(jù)的缺失情況,其值等于實際的數(shù)據(jù)項數(shù)與預期的數(shù)據(jù)項數(shù)的比值;所述準確率表征源數(shù)據(jù)的準確情況,其值等于準確的數(shù)據(jù)項數(shù)與實際的數(shù)據(jù)項數(shù)的比值;所述一致率表征數(shù)據(jù)的偏差程度情況,其值等于所有的數(shù)據(jù)項的標準差;三維質(zhì)量張量通過如下公式進行表示:
6.如權利要求5所述的全數(shù)據(jù)ai管控系統(tǒng)的智能化數(shù)據(jù)治理方法,其特征在于,步驟3中,通過如下公式,將三維質(zhì)量張量進行高維特征空間映射,得到高維特征空間映射的結(jié)果:
7.如權利要求6所述的全數(shù)據(jù)ai管控系統(tǒng)的智能化數(shù)據(jù)治理方法,其特征在于,步驟3中將每個數(shù)據(jù)源視為一個節(jié)點,基于圖嵌入的方式,利用高維特征空間映射的結(jié)果計算關聯(lián)強度的過程具體包括:通過聚類算法計算得到每個數(shù)據(jù)源的聚類中心;計算每個數(shù)據(jù)源的聚類中心與其他數(shù)據(jù)源的聚類中心的距離,將距離低于設定閾值的兩個數(shù)據(jù)源視為連接數(shù)據(jù)源,構(gòu)建圖網(wǎng)絡;再根據(jù)如下公式,計算關聯(lián)強度:
8.如權利要求7所述的全數(shù)據(jù)ai管控系統(tǒng)的智能化數(shù)據(jù)治理方法,其特征在于,通過如下公式,構(gòu)建分類權重:
9.如權利要求8所述的全數(shù)據(jù)ai管控系統(tǒng)的智能化數(shù)據(jù)治理方法,其特征在于,通過如下公式,計算每個數(shù)據(jù)源的治理優(yōu)先級指數(shù):