1.一種基于改進(jìn)ddpg的氫電耦合多微電網(wǎng)系統(tǒng)能量管理方法,其特征在于:包括以下步驟,
2.如權(quán)利要求1所述的基于改進(jìn)ddpg的氫電耦合多微電網(wǎng)系統(tǒng)能量管理方法,其特征在于:步驟s1中,歷史輸入狀態(tài)包括各氫電耦合微電網(wǎng)各時(shí)段的光伏發(fā)電功率、充電功率、充氫功率、儲(chǔ)氫罐內(nèi)的氫氣量、儲(chǔ)氫罐內(nèi)的氫氣量儲(chǔ)能系統(tǒng)的荷電狀態(tài);歷史動(dòng)作包括各氫電耦合微電網(wǎng)各時(shí)段的電解槽制氫功率、光伏發(fā)電功率儲(chǔ)能充放電功率、購電價(jià)格。
3.?如權(quán)利要求1所述的基于改進(jìn)ddpg的氫電耦合多微電網(wǎng)系統(tǒng)能量管理方法,其特征在于:步驟s2中,每個(gè)策略網(wǎng)絡(luò)包括第一長短期記憶網(wǎng)絡(luò)即第一?lstm網(wǎng)絡(luò)和兩個(gè)第一全連接層,由第一lstm網(wǎng)絡(luò)對(duì)接收的氫電耦合微電網(wǎng)的輸入狀態(tài)進(jìn)行處理后,再由兩個(gè)全連接層進(jìn)行處理后輸出微電網(wǎng)的動(dòng)作。
4.如權(quán)利要求1所述的基于改進(jìn)ddpg的氫電耦合多微電網(wǎng)系統(tǒng)能量管理方法,其特征在于:步驟s2中,每個(gè)q網(wǎng)絡(luò)包括第二lstm網(wǎng)絡(luò)、第二全連接層和第三全連接層,在critic神經(jīng)網(wǎng)絡(luò)接收到氫電耦合多微電網(wǎng)系統(tǒng)的輸入狀態(tài)和動(dòng)作時(shí),輸入狀態(tài)由第二lstm網(wǎng)絡(luò)處理,動(dòng)作由第二全連接層處理,第二lstm網(wǎng)絡(luò)與第二全連接層的輸出結(jié)果由第三全連接層處理后輸出關(guān)于狀態(tài)和動(dòng)作的q值。
5.如權(quán)利要求1-4任一項(xiàng)所述的基于改進(jìn)ddpg的氫電耦合多微電網(wǎng)系統(tǒng)能量管理方法,其特征在于:步驟s3中,建立基于改進(jìn)ddpg的氫電耦合多微電網(wǎng)系統(tǒng)的能量管理模型的目標(biāo)函數(shù)f:
6.如權(quán)利要求1-4任一項(xiàng)所述的基于改進(jìn)ddpg的氫電耦合多微電網(wǎng)系統(tǒng)能量管理方法,其特征在于:步驟s4中,初始化能量管理系統(tǒng)智能體的運(yùn)行環(huán)境,具體為,
7.如權(quán)利要求6所述的基于改進(jìn)ddpg的氫電耦合多微電網(wǎng)系統(tǒng)能量管理方法,其特征在于:步驟s42,具體為,
8.如權(quán)利要求1-4任一項(xiàng)所述的基于改進(jìn)ddpg的氫電耦合多微電網(wǎng)系統(tǒng)能量管理方法,其特征在于:步驟s5中,對(duì)基于改進(jìn)ddpg的氫電耦合多微電網(wǎng)系統(tǒng)的能量管理模型進(jìn)行訓(xùn)練,具體為,