本發(fā)明涉及數(shù)據(jù)處理,尤其是涉及一種基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法和裝置。
背景技術:
1、隨著電網(wǎng)自動化和智能化的不斷發(fā)展,產(chǎn)生了大量的電網(wǎng)數(shù)據(jù),包括傳感器數(shù)據(jù)、操作日志、維護記錄等。這些數(shù)據(jù)具有高維性、復雜性和動態(tài)變化的特點,對數(shù)據(jù)處理和分析提出了更高的要求。
2、但是,現(xiàn)有的數(shù)據(jù)處理技術中,數(shù)據(jù)處理模型缺乏訓練數(shù)據(jù),這限制了模型的泛化能力,導致在處理實際電網(wǎng)數(shù)據(jù)時準確性和可靠性不足。
技術實現(xiàn)思路
1、有鑒于此,本發(fā)明的目的在于提供一種基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法和裝置,通過生成對抗網(wǎng)絡進行訓練數(shù)據(jù)的擴充,以提高最終模型的泛化能力。
2、第一方面,本發(fā)明提供了一種基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法,包括:獲取歷史電網(wǎng)設備的電網(wǎng)數(shù)據(jù),對電網(wǎng)數(shù)據(jù)進行標注和預處理;其中,電網(wǎng)數(shù)據(jù)用于表征電網(wǎng)設備的狀態(tài);基于預先訓練完成的第一生成對抗網(wǎng)絡和/或預先訓練完成的第二生成對抗網(wǎng)絡對電網(wǎng)數(shù)據(jù)進行擴充得到生成數(shù)據(jù);其中,第一生成對抗網(wǎng)絡基于流行學習獲得的低維結構的電網(wǎng)數(shù)據(jù)進行數(shù)據(jù)擴充;在第二生成對抗網(wǎng)絡的訓練過程中通過引入隨機函數(shù)改變訓練過程中的噪聲的分布和結構;將生成數(shù)據(jù)與電網(wǎng)數(shù)據(jù)合并后再按預設的比例分割得到訓練集和驗證集;基于全連接神經(jīng)網(wǎng)絡對訓練集內的數(shù)據(jù)進行特征提??;其中,全連接神經(jīng)網(wǎng)絡的參數(shù)基于網(wǎng)絡的性能反饋進行動態(tài)調整;基于特征提取后的數(shù)據(jù)訓練分類器,得到基礎電網(wǎng)數(shù)據(jù)分類模型;其中,基于隨機梯度拉格朗日動力學調整分類器的網(wǎng)絡參數(shù);通過增強拓撲的神經(jīng)進化網(wǎng)絡分類算法調整分類器的網(wǎng)絡結構;通過能量基函數(shù)來評估和優(yōu)化分類的決策邊界;將基于驗證集驗證合格的基礎電網(wǎng)數(shù)據(jù)分類模型確定為電網(wǎng)數(shù)據(jù)分類模型;基于電網(wǎng)數(shù)據(jù)分類模型評價當前電網(wǎng)設備的狀態(tài)。
3、在本發(fā)明一些較佳的實施例中,第一生成對抗網(wǎng)絡包括第一生成器和第一判別器,其中,第一生成器基于流行學習獲得的低維結構的訓練數(shù)據(jù)初始化獲得,通過下述步驟訓練第一生成對抗網(wǎng)絡:對低維結構的訓練數(shù)據(jù)內的每個數(shù)據(jù)點進行黎曼編碼得到黎曼擾動,將黎曼擾動添加到第一生成器的訓練過程中;迭代訓練第一生成器和第一判別器,基于預設的參數(shù)更新學習率逐步調整第一生成器的參數(shù)和第一判別器的參數(shù),直到達到預設的迭代次數(shù)。
4、在本發(fā)明一些較佳的實施例中,對基于自適應特征重加權系數(shù)第一生成器的生成的數(shù)據(jù)進行自適應特征重加權;其中,自適應特征重加權系數(shù)基于第一生成器的生成的數(shù)據(jù)和預設的調節(jié)因子獲得。
5、在本發(fā)明一些較佳的實施例中,第一生成器的損失函數(shù)基于訓練樣本數(shù)量、噪聲樣本、預設的第一正則化參數(shù)和基于訓練樣本生成的數(shù)據(jù)的熵約束;第一判別器的損失函數(shù)基于訓練樣本數(shù)量、訓練樣本、噪聲樣本、預設的第二正則化參數(shù)和差異方差項約束;其中,差異方差項用于表征生成數(shù)據(jù)與真實數(shù)據(jù)之間的差異。
6、在本發(fā)明一些較佳的實施例中,基于自適應動態(tài)調整的方式設置參數(shù)更新學習率。
7、在本發(fā)明一些較佳的實施例中,通過下述步驟訓練第二生成對抗網(wǎng)絡:初始化第二生成對抗網(wǎng)絡;將隨機噪聲分布作為第二生成對抗網(wǎng)絡中的第二生成器的輸入;迭代訓練第二生成對抗網(wǎng)絡,直至達到預設的迭代次數(shù)。
8、在本發(fā)明一些較佳的實施例中,通過切比雪夫不等式調整隨機噪聲分布。
9、在本發(fā)明一些較佳的實施例中,第二生成對抗網(wǎng)絡的損失函數(shù)基于真實數(shù)據(jù)和隨機噪聲分布約束。
10、在本發(fā)明一些較佳的實施例中,迭代訓練第二生成對抗網(wǎng)絡,直至達到預設的迭代次數(shù)的步驟包括:在每次迭代后,基于切比雪夫不等式計算生成數(shù)據(jù)與真實數(shù)據(jù)在統(tǒng)計特性上的偏差,基于偏差利用梯度下降法調整第二生成器的參數(shù),直至達到預設的迭代次數(shù)。
11、第二方面,本發(fā)明提供了一種基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理裝置,包括:數(shù)據(jù)預處理模塊,用于獲取電網(wǎng)設備的電網(wǎng)數(shù)據(jù),對電網(wǎng)數(shù)據(jù)進行標注和預處理;其中,電網(wǎng)數(shù)據(jù)用于表征電網(wǎng)設備的狀態(tài);數(shù)據(jù)擴充模塊,用于基于預先訓練完成的第一生成對抗網(wǎng)絡和/或預先訓練完成的第二生成對抗網(wǎng)絡對電網(wǎng)數(shù)據(jù)進行擴充得到生成數(shù)據(jù);其中,第一生成對抗網(wǎng)絡基于流行學習獲得的低維結構的電網(wǎng)數(shù)據(jù)進行數(shù)據(jù)擴充;在第二生成對抗網(wǎng)絡的訓練過程中通過引入隨機函數(shù)改變訓練過程中的噪聲的分布和結構;訓練數(shù)據(jù)處理模塊,用于將生成數(shù)據(jù)與電網(wǎng)數(shù)據(jù)合并后再按預設的比例分割得到訓練集和驗證集;特征提取模塊,用于基于全連接神經(jīng)網(wǎng)絡對訓練集內的數(shù)據(jù)進行特征提??;其中,全連接神經(jīng)網(wǎng)絡的參數(shù)基于網(wǎng)絡的性能反饋進行動態(tài)調整;數(shù)據(jù)分類模塊,用于基于特征提取后的數(shù)據(jù)訓練分類器,得到基礎電網(wǎng)數(shù)據(jù)分類模型;其中,基于隨機梯度拉格朗日動力學調整分類器的網(wǎng)絡參數(shù);通過增強拓撲的神經(jīng)進化網(wǎng)絡分類算法調整分類器的網(wǎng)絡結構;通過能量基函數(shù)來評估和優(yōu)化分類的決策邊界;模型確定模塊,用于將基于驗證集驗證合格的基礎電網(wǎng)數(shù)據(jù)分類模型確定為電網(wǎng)數(shù)據(jù)分類模型;狀態(tài)評價模塊,用于基于電網(wǎng)數(shù)據(jù)分類模型評價電網(wǎng)設備的狀態(tài)。
12、本發(fā)明帶來了以下有益效果:
13、本發(fā)明提供了一種基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法和裝置,該方法包括:獲取歷史電網(wǎng)設備的電網(wǎng)數(shù)據(jù),對電網(wǎng)數(shù)據(jù)進行標注和預處理;其中,電網(wǎng)數(shù)據(jù)用于表征電網(wǎng)設備的狀態(tài);基于預先訓練完成的第一生成對抗網(wǎng)絡和/或預先訓練完成的第二生成對抗網(wǎng)絡對電網(wǎng)數(shù)據(jù)進行擴充得到生成數(shù)據(jù);其中,第一生成對抗網(wǎng)絡基于流行學習獲得的低維結構的電網(wǎng)數(shù)據(jù)進行數(shù)據(jù)擴充;在第二生成對抗網(wǎng)絡的訓練過程中通過引入隨機函數(shù)改變訓練過程中的噪聲的分布和結構;將生成數(shù)據(jù)與電網(wǎng)數(shù)據(jù)合并后再按預設的比例分割得到訓練集和驗證集;基于全連接神經(jīng)網(wǎng)絡對訓練集內的數(shù)據(jù)進行特征提取;其中,全連接神經(jīng)網(wǎng)絡的參數(shù)基于網(wǎng)絡的性能反饋進行動態(tài)調整;基于特征提取后的數(shù)據(jù)訓練分類器,得到基礎電網(wǎng)數(shù)據(jù)分類模型;其中,基于隨機梯度拉格朗日動力學調整分類器的網(wǎng)絡參數(shù);通過增強拓撲的神經(jīng)進化網(wǎng)絡分類算法調整分類器的網(wǎng)絡結構;通過能量基函數(shù)來評估和優(yōu)化分類的決策邊界;將基于驗證集驗證合格的基礎電網(wǎng)數(shù)據(jù)分類模型確定為電網(wǎng)數(shù)據(jù)分類模型;基于電網(wǎng)數(shù)據(jù)分類模型評價當前電網(wǎng)設備的狀態(tài);通過生成對抗網(wǎng)絡進行訓練數(shù)據(jù)的擴充,以提高最終模型的泛化能力。
1.一種基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法,其特征在于,包括:
2.根據(jù)權利要求1所述的基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法,其特征在于,所述第一生成對抗網(wǎng)絡包括第一生成器和第一判別器,其中,所述第一生成器基于所述流行學習獲得的低維結構的訓練數(shù)據(jù)初始化獲得,通過下述步驟訓練所述第一生成對抗網(wǎng)絡:
3.根據(jù)權利要求2所述的基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法,其特征在于,對基于自適應特征重加權系數(shù)所述第一生成器的生成的數(shù)據(jù)進行自適應特征重加權;其中,所述自適應特征重加權系數(shù)基于所述第一生成器的生成的數(shù)據(jù)和預設的調節(jié)因子獲得。
4.根據(jù)權利要求2所述的基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法,其特征在于,所述第一生成器的損失函數(shù)基于訓練樣本數(shù)量、噪聲樣本、預設的第一正則化參數(shù)和基于所述訓練樣本生成的數(shù)據(jù)的熵約束;所述第一判別器的損失函數(shù)基于所述訓練樣本數(shù)量、訓練樣本、所述噪聲樣本、預設的第二正則化參數(shù)和差異方差項約束;其中,所述差異方差項用于表征生成數(shù)據(jù)與真實數(shù)據(jù)之間的差異。
5.根據(jù)權利要求2所述的基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法,其特征在于,基于自適應動態(tài)調整的方式設置所述參數(shù)更新學習率。
6.根據(jù)權利要求1所述的基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法,其特征在于,通過下述步驟訓練所述第二生成對抗網(wǎng)絡:
7.根據(jù)權利要求6所述的基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法,其特征在于,通過切比雪夫不等式調整所述隨機噪聲分布。
8.根據(jù)權利要求6所述的基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法,其特征在于,所述第二生成對抗網(wǎng)絡的損失函數(shù)基于真實數(shù)據(jù)和所述隨機噪聲分布約束。
9.根據(jù)權利要求6所述的基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理方法,其特征在于,迭代訓練所述第二生成對抗網(wǎng)絡,直至達到預設的迭代次數(shù)的步驟包括:
10.一種基于大數(shù)據(jù)的智能電網(wǎng)平臺數(shù)據(jù)處理裝置,其特征在于,包括: