本發(fā)明涉及光伏并網(wǎng)點電壓控制,并且更具體地,涉一種基于演員-評論家機制的光伏并網(wǎng)點電壓控制方法及系統(tǒng)。
背景技術(shù):
1、光伏發(fā)電系統(tǒng)是目前廣泛應(yīng)用于能源領(lǐng)域的一種可再生能源發(fā)電方式,它利用太陽能將光能轉(zhuǎn)化為電能,光伏發(fā)電系統(tǒng)的關(guān)鍵問題之一是如何將產(chǎn)生的電能并網(wǎng),即將發(fā)電系統(tǒng)的電能與電網(wǎng)進行有效的連接,然而,光伏發(fā)電系統(tǒng)的電壓波動較大,可能會對電網(wǎng)造成影響。
2、現(xiàn)有的光伏并網(wǎng)點電壓存在其經(jīng)常會出現(xiàn)波動情況,此時電壓波動可能會導(dǎo)致光伏發(fā)電系統(tǒng)輸出的電能質(zhì)量下降,影響電網(wǎng)穩(wěn)定運行,電壓波動還可能引起電力設(shè)備的故障,進而影響電能的傳輸和分配,同時電壓波動會導(dǎo)致光伏電池的工作狀態(tài)不穩(wěn)定,從而降低發(fā)電效率,長期存在的電壓波動會導(dǎo)致光伏發(fā)電系統(tǒng)發(fā)電量減少,增加了能源的浪費的問題。
技術(shù)實現(xiàn)思路
1、針對上述問題,本發(fā)明提出了一種用于光伏并網(wǎng)點的電壓控制方法,包括:
2、對光伏并網(wǎng)點進行實時監(jiān)測,以獲取所述光伏并網(wǎng)點的電網(wǎng)狀態(tài)數(shù)據(jù)及光伏輸出數(shù)據(jù);
3、通過演員網(wǎng)絡(luò)根據(jù)所述實電網(wǎng)狀態(tài)數(shù)據(jù)及光伏輸出數(shù)據(jù),生成控制策略,通過評論家網(wǎng)絡(luò)對所述控制策略進行效用值評估,基于評估結(jié)果,對所述控制策略進行更新,生成更新策略;
4、以所述更新策略生成行動方式,以所述行動方式執(zhí)行控制動作,對所述光伏并網(wǎng)點的電壓進行控制。
5、可選的,電網(wǎng)狀態(tài)數(shù)據(jù),包括:電壓數(shù)據(jù)及功率數(shù)據(jù)。
6、可選的,光伏輸出數(shù)據(jù),包括:逆變器狀態(tài)數(shù)據(jù)。
7、可選的,通過評論家網(wǎng)絡(luò)對所述控制策略進行效用值評估,包括:
8、通過評論家網(wǎng)絡(luò)對實時電網(wǎng)狀態(tài)和期望電網(wǎng)狀態(tài)進行對比,獲取對比結(jié)果,基于所述對比結(jié)果,確定所述控制策略的效用值。
9、可選的,通過光伏并網(wǎng)點的狀態(tài)及行動,確定獎勵,基于確定的獎勵更新演員網(wǎng)絡(luò)和評論家網(wǎng)絡(luò)。
10、可選的,確定獎勵的獎勵函數(shù)公式如下:
11、r=-α|v-vtarget|-β|ploss|-γδv
12、其中,r為獎勵,α、β、γ為權(quán)重系數(shù),v為光伏并網(wǎng)點當前電壓,vtarget為目標電壓值,δv為電壓波動率,ploss為臺區(qū)線損。
13、再一方面,本發(fā)明還提出了一種用于光伏并網(wǎng)點的電壓控制系統(tǒng),包括:
14、實時監(jiān)測單元,用于對光伏并網(wǎng)點進行實時監(jiān)測,以獲取所述光伏并網(wǎng)點的電網(wǎng)狀態(tài)數(shù)據(jù)及光伏輸出數(shù)據(jù);
15、演員評論家單元,用于通過演員網(wǎng)絡(luò)根據(jù)所述實電網(wǎng)狀態(tài)數(shù)據(jù)及光伏輸出數(shù)據(jù),生成控制策略,通過評論家網(wǎng)絡(luò)對所述控制策略進行效用值評估,基于評估結(jié)果,對所述控制策略進行更新,生成更新策略;
16、控制單元,用于以所述更新策略生成行動方式,以所述行動方式執(zhí)行控制動作,對所述光伏并網(wǎng)點的電壓進行控制。
17、可選的,電網(wǎng)狀態(tài)數(shù)據(jù),包括:電壓數(shù)據(jù)及功率數(shù)據(jù)。
18、可選的,光伏輸出數(shù)據(jù),包括:逆變器狀態(tài)數(shù)據(jù)。
19、可選的,通過評論家網(wǎng)絡(luò)對所述控制策略進行效用值評估,包括:
20、通過評論家網(wǎng)絡(luò)對實時電網(wǎng)狀態(tài)和期望電網(wǎng)狀態(tài)進行對比,獲取對比結(jié)果,基于所述對比結(jié)果,確定所述控制策略的效用值。
21、可選的,演員評論加單元通過光伏并網(wǎng)點的狀態(tài)及行動,確定獎勵,基于確定的獎勵更新演員網(wǎng)絡(luò)和評論家網(wǎng)絡(luò)。
22、可選的,確定獎勵的獎勵函數(shù)公式如下:
23、r=-α|v-vtarget|-β|ploss|-γδv
24、其中,r為獎勵,α、β、γ為權(quán)重系數(shù),v為光伏并網(wǎng)點當前電壓,vtarget為目標電壓值,δv為電壓波動率,ploss為臺區(qū)線損。
25、再一方面,本發(fā)明還提供了一種計算設(shè)備,包括:一個或多個處理器;
26、處理器,用于執(zhí)行一個或多個程序;
27、當所述一個或多個程序被所述一個或多個處理器執(zhí)行時,實現(xiàn)如上述所述的方法。
28、再一方面,本發(fā)明還提供了一種計算機可讀存儲介質(zhì),其上存有計算機程序,所述計算機程序被執(zhí)行時,實現(xiàn)如上述所述的方法。
29、與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果為:
30、本發(fā)明提供了一種用于光伏并網(wǎng)點的電壓控制方法,包括:對光伏并網(wǎng)點進行實時監(jiān)測,以獲取所述光伏并網(wǎng)點的電網(wǎng)狀態(tài)數(shù)據(jù)及光伏輸出數(shù)據(jù);通過演員網(wǎng)絡(luò)根據(jù)所述實電網(wǎng)狀態(tài)數(shù)據(jù)及光伏輸出數(shù)據(jù),生成控制策略,通過評論家網(wǎng)絡(luò)對所述控制策略進行效用值評估,基于評估結(jié)果,對所述控制策略進行更新,生成更新策略;以所述更新策略生成行動方式,以所述行動方式執(zhí)行控制動作,對所述光伏并網(wǎng)點的電壓進行控制。本發(fā)明的應(yīng)用,提高了能源的利用效率。
1.一種基于演員-評論家機制的光伏并網(wǎng)點電壓控制方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述電網(wǎng)狀態(tài)數(shù)據(jù),包括:電壓數(shù)據(jù)及功率數(shù)據(jù)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述光伏輸出數(shù)據(jù),包括:逆變器狀態(tài)數(shù)據(jù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過評論家網(wǎng)絡(luò)對所述控制策略進行效用值評估,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過光伏并網(wǎng)點的狀態(tài)及行動,確定獎勵,基于確定的獎勵更新演員網(wǎng)絡(luò)和評論家網(wǎng)絡(luò)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述確定獎勵的獎勵函數(shù)公式如下:
7.一種基于演員-評論家機制的光伏并網(wǎng)點電壓控制系統(tǒng),其特征在于,包括:
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述電網(wǎng)狀態(tài)數(shù)據(jù),包括:電壓數(shù)據(jù)及功率數(shù)據(jù)。
9.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述光伏輸出數(shù)據(jù),包括:逆變器狀態(tài)數(shù)據(jù)。
10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述通過評論家網(wǎng)絡(luò)對所述控制策略進行效用值評估,包括:
11.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述演員評論加單元通過光伏并網(wǎng)點的狀態(tài)及行動,確定獎勵,基于確定的獎勵更新演員網(wǎng)絡(luò)和評論家網(wǎng)絡(luò)。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述確定獎勵的獎勵函數(shù)公式如下:
13.一種計算機設(shè)備,其特征在于,包括:
14.一種計算機可讀存儲介質(zhì),其特征在于,其上存有計算機程序,所述計算機程序被執(zhí)行時,實現(xiàn)如權(quán)利要求1-6中任一所述的方法。