本發(fā)明屬于多能互補(bǔ)微網(wǎng)技術(shù)領(lǐng)域,涉及多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度方法,尤其是一種基于Rollout算法的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度方法。
背景技術(shù):
隨著智能電網(wǎng)技術(shù)的發(fā)展,含新能源和儲(chǔ)能的多能互補(bǔ)微網(wǎng)系統(tǒng)引起了研究人員廣泛的關(guān)注。作為能夠?qū)崿F(xiàn)自我控制、保護(hù)和管理的自治系統(tǒng),多能互補(bǔ)微網(wǎng)可以促進(jìn)分布式能源的就地消納,以一種更加經(jīng)濟(jì)友好的方式,實(shí)現(xiàn)對(duì)負(fù)荷多種能源形式的高可靠供給,使傳統(tǒng)電網(wǎng)向智能電網(wǎng)過(guò)渡。
新能源出力的波動(dòng)性和間歇性給多能互補(bǔ)微網(wǎng)的實(shí)時(shí)調(diào)度帶來(lái)了很大的挑戰(zhàn),并且由于實(shí)時(shí)調(diào)度是一個(gè)滾動(dòng)時(shí)域過(guò)程,當(dāng)前調(diào)度區(qū)間內(nèi)的控制行為不僅對(duì)當(dāng)前周期產(chǎn)生影響,還會(huì)影響到下一個(gè)調(diào)度區(qū)間的狀態(tài)。馬爾科夫決策模型為解決這種包含不確定性變量的滾動(dòng)調(diào)度問(wèn)題提供了一種好的思路,但是大量的變量數(shù)目帶來(lái)了維數(shù)災(zāi)難,模型的求解成為難題,如何找到一個(gè)行之有效的方法解決上述難題成為實(shí)時(shí)調(diào)度的關(guān)鍵。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種設(shè)計(jì)合理、簡(jiǎn)易可行、實(shí)用性強(qiáng)且高效快速的基于Rollout算法的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度方法。
本發(fā)明解決其技術(shù)問(wèn)題是采取以下技術(shù)方案實(shí)現(xiàn)的:
一種基于Rollout算法的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度方法,包括以下步驟:
步驟1、建立包含新能源出力隨機(jī)性的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度的滾動(dòng)時(shí)域馬爾科夫決策過(guò)程模型,確立實(shí)時(shí)調(diào)度的約束條件;
步驟2、以滾動(dòng)時(shí)域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運(yùn)行費(fèi)用最低為目標(biāo),確立包含新能源出力隨機(jī)性的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度的滾動(dòng)時(shí)域馬爾科夫決策過(guò)程模型的實(shí)時(shí)調(diào)度的目標(biāo)函數(shù);
步驟3、將單個(gè)完整調(diào)度周期劃分成若干個(gè)調(diào)度區(qū)間,基于貪心算法得到滿足實(shí)時(shí)調(diào)度約束條件的一個(gè)基礎(chǔ)可行解;
步驟4、基于步驟3所述的基礎(chǔ)可行解,運(yùn)用Rollout算法求解該多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度的滾動(dòng)時(shí)域馬爾科夫決策過(guò)程模型。
而且,所述步驟1的確立實(shí)時(shí)調(diào)度的約束條件包括:微網(wǎng)的電平衡約束、蓄電池的運(yùn)行約束、微網(wǎng)與主網(wǎng)的交易電功率約束和熱電聯(lián)產(chǎn)設(shè)備的電功率出力約束;
所述微網(wǎng)的電平衡約束如下:
上式中,t是時(shí)間參數(shù);pG(t)是t時(shí)刻微網(wǎng)與主網(wǎng)的交換電功率,向主網(wǎng)購(gòu)電為正,向主網(wǎng)售電為負(fù);N是熱電聯(lián)產(chǎn)設(shè)備的數(shù)目;是t時(shí)刻第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備輸出電功率;pB(t)是t時(shí)刻蓄電池的充放電功率,充電為負(fù),放電為正;pw(t)是t時(shí)刻風(fēng)電發(fā)電出力;pD(t)是t時(shí)刻的電負(fù)荷需求;
所述蓄電池的運(yùn)行約束如下:
上式中,E(t)與E(t+1)分別是t時(shí)刻和t+1時(shí)刻蓄電池的儲(chǔ)能水平;E與分別是蓄電池容量的下邊界和上邊界;ΔT是從t時(shí)刻至t+1時(shí)刻的時(shí)間間隔;αc與αd分別為蓄電池的充放電效率;pB(t)是t時(shí)刻蓄電池的充放電功率,充電為負(fù),放電為正;為蓄電池充放電功率的上限值;
所述微網(wǎng)與主網(wǎng)的交易電功率約束如下:
上式中,pG(t)與pG(t-1)分別是t時(shí)刻和t-1微網(wǎng)與主網(wǎng)的交換電功率,向主網(wǎng)購(gòu)電為正,向主網(wǎng)售電為負(fù);為微網(wǎng)與主網(wǎng)的交換電功率的上限值,δ是微網(wǎng)與主網(wǎng)的交換電功率的波動(dòng)上限;
所述熱電聯(lián)產(chǎn)設(shè)備的電功率出力約束如下:
上式中,是t時(shí)刻第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備輸出電功率;是第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備輸出電功率的上限;Hi(t)是t時(shí)刻需要由第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備供給的熱功率;vi與分別是第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備電、熱功率轉(zhuǎn)換效率的下限和上限。
而且,所述步驟2的確立包含新能源出力隨機(jī)性的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度的滾動(dòng)時(shí)域馬爾科夫決策過(guò)程模型的實(shí)時(shí)調(diào)度的目標(biāo)函數(shù)的具體方法為:首先以微網(wǎng)系統(tǒng)在單個(gè)調(diào)度區(qū)間內(nèi)的運(yùn)行費(fèi)用最低為目標(biāo),建立微網(wǎng)系統(tǒng)在單個(gè)調(diào)度區(qū)間內(nèi)的運(yùn)行費(fèi)用函數(shù),然后以微網(wǎng)系統(tǒng)在滾動(dòng)時(shí)域馬爾科夫決策周期內(nèi)的運(yùn)行費(fèi)用最低為目標(biāo),確立實(shí)時(shí)調(diào)度的目標(biāo)函數(shù);
所述微網(wǎng)系統(tǒng)在單個(gè)調(diào)度區(qū)間內(nèi)的運(yùn)行費(fèi)用函數(shù)如下:
其中,
上式中,X(t)是t時(shí)刻微網(wǎng)系統(tǒng)的狀態(tài)變量;A(t)是t時(shí)刻微網(wǎng)系統(tǒng)的控制變量;ct(X(t),A(t))是單個(gè)調(diào)度區(qū)間內(nèi)系統(tǒng)運(yùn)行費(fèi)用的函數(shù);λ(t)是t時(shí)刻電網(wǎng)電價(jià);c是天然氣的價(jià)格;Fic(t)是第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備耗氣量與電出力之間的線性函數(shù);ai與bi第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備耗氣量與電出力之間的線性函數(shù)的系數(shù);
所述實(shí)時(shí)調(diào)度的目標(biāo)函數(shù)如下:
上式中,Jt(X(t),A(t))為滾動(dòng)時(shí)域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運(yùn)行費(fèi)用的函數(shù);
而且,所述步驟3的具體方法為:將一個(gè)完整調(diào)度周期劃分成若干個(gè)調(diào)度區(qū)間,基于貪心算法分別針對(duì)每個(gè)調(diào)度區(qū)間內(nèi)的優(yōu)化調(diào)度問(wèn)題進(jìn)行求解,最后把每個(gè)調(diào)度區(qū)間的局部最優(yōu)解合成為整個(gè)調(diào)度區(qū)間上的一個(gè)基礎(chǔ)可行解。
而且,所述步驟3的基于貪心算法分別針對(duì)每個(gè)調(diào)度區(qū)間內(nèi)的優(yōu)化調(diào)度問(wèn)題進(jìn)行求解的具體步驟包括:
(1)根據(jù)步驟2所述的微網(wǎng)系統(tǒng)在單個(gè)調(diào)度區(qū)間內(nèi)的運(yùn)行費(fèi)用函數(shù),列出目標(biāo)函數(shù)和約束條件如下:
約束條件如下:
其中:
上式中,pb(t)與分別是構(gòu)建基礎(chǔ)可行解的過(guò)程中蓄電池充放電功率的新的下限和上限;pg(t)與分別是構(gòu)建基礎(chǔ)可行解的過(guò)程中微網(wǎng)與主網(wǎng)交換功率的新的下限和上限;pci(t)與分別是構(gòu)建基礎(chǔ)可行解的過(guò)程中第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備電出力的新的下限和上限;
(2)為了得到在一個(gè)調(diào)度區(qū)間內(nèi)的優(yōu)化結(jié)果,將上述目標(biāo)函數(shù)的N+2個(gè)系數(shù)按從小到大的順序進(jìn)行排列,得到各個(gè)決策變量調(diào)度順序,其中N+2個(gè)系數(shù)即為λ(t)·ΔT,0,c·ai(i=1,2,…,N),出現(xiàn)系數(shù)0是因?yàn)槟繕?biāo)函數(shù)中不包含pB(t);再令負(fù)荷差值d(t)=pD(t)-pw(t);根據(jù)d(t)的值和各個(gè)決策變量的調(diào)度順序即可求得最終的優(yōu)化結(jié)果;
(3)對(duì)其他調(diào)度區(qū)間依次求解,最后得到滿足微網(wǎng)運(yùn)行需求的一個(gè)基礎(chǔ)可行解。
而且,所述步驟4的具體方法為:
(1)設(shè)步驟3求得的基礎(chǔ)可行解為πb=(Ab,t+1,Ab,t+2,…,Ab,t+T-1),則得到一個(gè)實(shí)時(shí)調(diào)度從t到t+T-1時(shí)刻運(yùn)行費(fèi)用最低這個(gè)目標(biāo)函數(shù)的近似值:
上式中,為用Rollout算法求得的微網(wǎng)系統(tǒng)在滾動(dòng)時(shí)域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運(yùn)行費(fèi)用的函數(shù)。
(2)通過(guò)Rollout算法使得上述近似值趨于最小:
(3)根據(jù)當(dāng)前一個(gè)調(diào)度區(qū)間內(nèi)的X(t),結(jié)合t時(shí)刻的風(fēng)力發(fā)電出力值,求得下一個(gè)調(diào)度區(qū)間內(nèi)的X(t+1),同時(shí)得到t+1時(shí)刻的風(fēng)力發(fā)電出力值,然后計(jì)算下一個(gè)調(diào)度區(qū)間的X(t+2),重復(fù)此過(guò)程,直到整個(gè)調(diào)度周期結(jié)束。
本發(fā)明的優(yōu)點(diǎn)和積極效果是:
1、本發(fā)明提供了一種基于Rollout算法的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度方法,首先,建立多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度的滾動(dòng)時(shí)域馬爾科夫決策過(guò)程模型,確立實(shí)時(shí)調(diào)度的約束條件和目標(biāo)函數(shù);然后,將一個(gè)完整調(diào)度周期劃分成若干個(gè)調(diào)度區(qū)間,基于貪心算法得到滿足實(shí)時(shí)調(diào)度約束的一個(gè)基礎(chǔ)可行解;最后,基于上述基礎(chǔ)可行解,運(yùn)用Rollout算法求解該多能互補(bǔ)微網(wǎng)滾動(dòng)時(shí)域馬爾科夫決策問(wèn)題。本發(fā)明建立了多能互補(bǔ)微網(wǎng)的滾動(dòng)時(shí)域模型,并運(yùn)用Rollout算法進(jìn)行求解,簡(jiǎn)易有效,實(shí)用性強(qiáng)。
2、本發(fā)明運(yùn)用Rollout算法求解滾動(dòng)時(shí)域的馬爾科夫決策模型問(wèn)題,先建立一個(gè)包含新能源出力隨機(jī)性的馬爾科夫決策模型,運(yùn)用貪心算法找到一個(gè)基礎(chǔ)可行解,并在此基礎(chǔ)上接近目標(biāo),將新能源出力波動(dòng)性考慮在內(nèi),同時(shí)解決了傳統(tǒng)算法求解速度慢、效率低的問(wèn)題,實(shí)現(xiàn)了高效快速的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度。
附圖說(shuō)明
圖1是本發(fā)明的處理流程圖。
具體實(shí)施方式
以下結(jié)合附圖對(duì)本發(fā)明實(shí)施例作進(jìn)一步詳述:
本發(fā)明提出一種基于Rollout算法的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度方法,不僅把新能源出力的波動(dòng)性考慮在內(nèi),而且更有效地求解多能互補(bǔ)微網(wǎng)的滾動(dòng)時(shí)域調(diào)度問(wèn)題,運(yùn)用Rollout算法求解滾動(dòng)時(shí)域的馬爾科夫決策模型問(wèn)題,首先建立一個(gè)包含新能源出力隨機(jī)性的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度的滾動(dòng)時(shí)域馬爾科夫決策過(guò)程模型,確立實(shí)時(shí)調(diào)度的約束條件和目標(biāo)函數(shù);接著將一個(gè)完整調(diào)度周期劃分成若干個(gè)調(diào)度區(qū)間,基于貪心算法得到滿足實(shí)時(shí)調(diào)度約束的一個(gè)基礎(chǔ)可行解;最后基于上述基礎(chǔ)可行解,運(yùn)用Rollout算法求解該多能互補(bǔ)微網(wǎng)滾動(dòng)時(shí)域馬爾科夫決策過(guò)程模型。
一種基于Rollout算法的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度方法,如圖1所示,包括以下步驟:
步驟1、建立包含新能源出力隨機(jī)性的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度的滾動(dòng)時(shí)域馬爾科夫決策過(guò)程模型,確立實(shí)時(shí)調(diào)度的約束條件;
所述步驟1的確立實(shí)時(shí)調(diào)度的約束條件包括:微網(wǎng)的電平衡約束、蓄電池的運(yùn)行約束、微網(wǎng)與主網(wǎng)的交易電功率約束和熱電聯(lián)產(chǎn)設(shè)備的電功率出力約束;
所述微網(wǎng)的電平衡約束如下:
上式中,t是時(shí)間參數(shù);pG(t)是t時(shí)刻微網(wǎng)與主網(wǎng)的交換電功率,向主網(wǎng)購(gòu)電為正,向主網(wǎng)售電為負(fù);N是熱電聯(lián)產(chǎn)設(shè)備的數(shù)目;是t時(shí)刻第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備輸出電功率;pB(t)是t時(shí)刻蓄電池的充放電功率,充電為負(fù),放電為正;pw(t)是t時(shí)刻風(fēng)電發(fā)電出力;pD(t)是t時(shí)刻的電負(fù)荷需求;
所述蓄電池的運(yùn)行約束如下:
上式中,E(t)與E(t+1)分別是t時(shí)刻和t+1時(shí)刻蓄電池的儲(chǔ)能水平;E與分別是蓄電池容量的下邊界和上邊界;ΔT是從t時(shí)刻至t+1時(shí)刻的時(shí)間間隔;αc與αd分別為蓄電池的充放電效率;pB(t)是t時(shí)刻蓄電池的充放電功率,充電為負(fù),放電為正;為蓄電池充放電功率的上限值;
所述微網(wǎng)與主網(wǎng)的交易電功率約束如下:
上式中,pG(t)與pG(t-1)分別是t時(shí)刻和t-1微網(wǎng)與主網(wǎng)的交換電功率,向主網(wǎng)購(gòu)電為正,向主網(wǎng)售電為負(fù);為微網(wǎng)與主網(wǎng)的交換電功率的上限值,δ是微網(wǎng)與主網(wǎng)的交換電功率的波動(dòng)上限;
所述熱電聯(lián)產(chǎn)設(shè)備的電功率出力約束如下:
上式中,是t時(shí)刻第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備輸出電功率;是第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備輸出電功率的上限;Hi(t)是t時(shí)刻需要由第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備供給的熱功率;vi與分別是第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備電、熱功率轉(zhuǎn)換效率的下限和上限。
步驟2、以滾動(dòng)時(shí)域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運(yùn)行費(fèi)用最低為目標(biāo),確立包含新能源出力隨機(jī)性的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度的滾動(dòng)時(shí)域馬爾科夫決策過(guò)程模型的實(shí)時(shí)調(diào)度的目標(biāo)函數(shù);
所述多能互補(bǔ)微網(wǎng)與主網(wǎng)處于并網(wǎng)狀態(tài),可與主網(wǎng)交易電量,其供能設(shè)備包括風(fēng)力發(fā)電機(jī)、熱電聯(lián)產(chǎn)設(shè)備(CHP)、蓄電池;所述實(shí)時(shí)調(diào)度的目標(biāo)函數(shù)是為了實(shí)現(xiàn)微網(wǎng)系統(tǒng)的運(yùn)行費(fèi)用最低,包括系統(tǒng)購(gòu)電成本與熱電聯(lián)產(chǎn)設(shè)備燃料費(fèi)用兩部分。
所述確立包含新能源出力隨機(jī)性的多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度的滾動(dòng)時(shí)域馬爾科夫決策過(guò)程模型的實(shí)時(shí)調(diào)度的目標(biāo)函數(shù)的具體方法為:首先以微網(wǎng)系統(tǒng)在單個(gè)調(diào)度區(qū)間內(nèi)的運(yùn)行費(fèi)用最低為目標(biāo),建立微網(wǎng)系統(tǒng)在單個(gè)調(diào)度區(qū)間內(nèi)的運(yùn)行費(fèi)用函數(shù),然后以微網(wǎng)系統(tǒng)在滾動(dòng)時(shí)域馬爾科夫決策周期內(nèi)的運(yùn)行費(fèi)用最低為目標(biāo),確立實(shí)時(shí)調(diào)度的目標(biāo)函數(shù);
所述微網(wǎng)系統(tǒng)在單個(gè)調(diào)度區(qū)間內(nèi)的運(yùn)行費(fèi)用函數(shù)如下:
其中,
上式中,X(t)是t時(shí)刻微網(wǎng)系統(tǒng)的狀態(tài)變量;A(t)是t時(shí)刻微網(wǎng)系統(tǒng)的控制變量;ct(X(t),A(t))是單個(gè)調(diào)度區(qū)間內(nèi)系統(tǒng)運(yùn)行費(fèi)用的函數(shù);λ(t)是t時(shí)刻電網(wǎng)電價(jià);c是天然氣的價(jià)格;Fic(t)是第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備耗氣量與電出力之間的線性函數(shù);ai與bi第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備耗氣量與電出力之間的線性函數(shù)的系數(shù);
所述實(shí)時(shí)調(diào)度的目標(biāo)函數(shù)如下:
上式中,Jt(X(t),A(t))為滾動(dòng)時(shí)域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運(yùn)行費(fèi)用的函數(shù);
步驟3、將單個(gè)完整調(diào)度周期劃分成若干個(gè)調(diào)度區(qū)間,基于貪心算法得到滿足實(shí)時(shí)調(diào)度約束條件的一個(gè)基礎(chǔ)可行解;
所述步驟3的具體方法為:將一個(gè)完整調(diào)度周期劃分成若干個(gè)調(diào)度區(qū)間,基于貪心算法分別針對(duì)每個(gè)調(diào)度區(qū)間內(nèi)的優(yōu)化調(diào)度問(wèn)題進(jìn)行求解,最后把每個(gè)調(diào)度區(qū)間的局部最優(yōu)解合成為整個(gè)調(diào)度區(qū)間上的一個(gè)基礎(chǔ)可行解。
所述步驟3的基于貪心算法分別針對(duì)每個(gè)調(diào)度區(qū)間內(nèi)的優(yōu)化調(diào)度問(wèn)題進(jìn)行求解的具體步驟包括:
(1)根據(jù)步驟2所述的微網(wǎng)系統(tǒng)在單個(gè)調(diào)度區(qū)間內(nèi)的運(yùn)行費(fèi)用函數(shù),列出目標(biāo)函數(shù)和約束條件如下:
約束條件如下:
其中:
上式中,pb(t)與分別是構(gòu)建基礎(chǔ)可行解的過(guò)程中蓄電池充放電功率的新的下限和上限;pg(t)與分別是構(gòu)建基礎(chǔ)可行解的過(guò)程中微網(wǎng)與主網(wǎng)交換功率的新的下限和上限;pci(t)與分別是構(gòu)建基礎(chǔ)可行解的過(guò)程中第i臺(tái)熱電聯(lián)產(chǎn)設(shè)備電出力的新的下限和上限;
(2)為了得到在一個(gè)調(diào)度區(qū)間內(nèi)的優(yōu)化結(jié)果,將上述目標(biāo)函數(shù)的N+2個(gè)系數(shù)按從小到大的順序進(jìn)行排列,得到各個(gè)決策變量調(diào)度順序,其中N+2個(gè)系數(shù)即為λ(t)·ΔT,0,c·ai(i=1,2,…,N),出現(xiàn)系數(shù)0是因?yàn)槟繕?biāo)函數(shù)中不包含pB(t);再令負(fù)荷差值d(t)=pD(t)-pw(t);根據(jù)d(t)的值和各個(gè)決策變量的調(diào)度順序即可求得最終的優(yōu)化結(jié)果;
(3)對(duì)其他調(diào)度區(qū)間依次求解,最后得到滿足微網(wǎng)運(yùn)行需求的一個(gè)基礎(chǔ)可行解。
步驟4、基于步驟3所述的基礎(chǔ)可行解,運(yùn)用Rollout算法求解該多能互補(bǔ)微網(wǎng)實(shí)時(shí)調(diào)度的滾動(dòng)時(shí)域馬爾科夫決策過(guò)程模型。
所述步驟4的具體方法為:
(1)設(shè)步驟3求得的基礎(chǔ)可行解為πb=(Ab,t+1,Ab,t+2,…,Ab,t+T-1),那么我們得到了一個(gè)實(shí)時(shí)調(diào)度從t到t+T-1時(shí)刻運(yùn)行費(fèi)用最低這個(gè)目標(biāo)函數(shù)的近似值:
上式中,為用Rollout算法求得的微網(wǎng)系統(tǒng)在滾動(dòng)時(shí)域馬爾科夫決策周期內(nèi)微網(wǎng)系統(tǒng)的運(yùn)行費(fèi)用的函數(shù)。
(2)通過(guò)Rollout算法使得上述近似值趨于最小:
(3)根據(jù)當(dāng)前一個(gè)調(diào)度區(qū)間內(nèi)的X(t),結(jié)合t時(shí)刻的風(fēng)力發(fā)電出力值,求得下一個(gè)調(diào)度區(qū)間內(nèi)的X(t+1),同時(shí)得到t+1時(shí)刻的風(fēng)力發(fā)電出力值,然后計(jì)算下一個(gè)調(diào)度區(qū)間的X(t+2),重復(fù)此過(guò)程,直到整個(gè)調(diào)度周期結(jié)束。
需要強(qiáng)調(diào)的是,本發(fā)明所述的實(shí)施例是說(shuō)明性的,而不是限定性的,因此本發(fā)明包括并不限于具體實(shí)施方式中所述的實(shí)施例,凡是由本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的技術(shù)方案得出的其他實(shí)施方式,同樣屬于本發(fā)明保護(hù)的范圍。