一種分布式云計算平臺的動態(tài)節(jié)能資源調(diào)度系統(tǒng)及方法
【專利摘要】本發(fā)明提供一種分布式云計算平臺的動態(tài)節(jié)能資源調(diào)度系統(tǒng)及其方法,該系統(tǒng)包括所述分布式云計算平臺下的云服務(wù)器節(jié)點,所述云服務(wù)器節(jié)點分別連接全局控制器和監(jiān)測系統(tǒng);所述全局控制器和所述監(jiān)測系統(tǒng)分別連接建模分析模塊;所述監(jiān)測系統(tǒng)包括能耗監(jiān)測模塊、流量監(jiān)測模塊和資源監(jiān)測模塊;所述云服務(wù)器節(jié)點上運行節(jié)點控制器。本發(fā)明的系統(tǒng)和方法針對分布式云計算平臺的跨域分布特點及綜合節(jié)能資源調(diào)度需求,實現(xiàn)同時降低服務(wù)器和網(wǎng)絡(luò)能耗的效果。
【專利說明】一種分布式云計算平臺的動態(tài)節(jié)能資源調(diào)度系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種云計算【技術(shù)領(lǐng)域】的系統(tǒng)和方法,具體涉及一種分布式云計算平臺 的動態(tài)節(jié)能資源調(diào)度系統(tǒng)及方法。
【背景技術(shù)】
[0002] 云計算平臺向用戶提供三類云服務(wù):基礎(chǔ)設(shè)施即服務(wù)、平臺即服務(wù)、軟件即服務(wù), 這些云服務(wù)的基礎(chǔ)支撐為云數(shù)據(jù)中心。在云計算數(shù)據(jù)中心運營中,通過數(shù)量眾多的物理服 務(wù)器集群為用戶直接提供虛擬機(jī)或提供構(gòu)件在虛擬機(jī)之上的其他云服務(wù),虛擬機(jī)的創(chuàng)建會 使得物理服務(wù)器集群產(chǎn)生大量的熱量,最高可達(dá)50多度,帶來的代價是維持?jǐn)?shù)據(jù)中心標(biāo)準(zhǔn) 溫度的制冷系統(tǒng)電能消耗增加。Google在全球共有36個數(shù)據(jù)中心,一年消耗大約790億千 瓦時電力;2011年,全美國的數(shù)據(jù)中心共消耗電能10000億千瓦時,折合74億美元。可見, 隨著云數(shù)據(jù)中心規(guī)模日益增加,節(jié)能問題已成為云數(shù)據(jù)中心運營急需解決的一大難題。由 于云數(shù)據(jù)中心的核心是海量虛擬機(jī),因此,如何合理部署虛擬機(jī)以減少能耗成則是當(dāng)前學(xué) 術(shù)和IT企業(yè)研究的核心問題。
[0003] 大部分現(xiàn)有虛擬機(jī)部署方法僅考慮單方面因素,如最小化網(wǎng)絡(luò)能耗,實現(xiàn)散熱均 衡,或者最大化資源使用效率。例如,有人提出了 一種傳輸流量感知虛擬機(jī)部署模型TVMPP, 該模型可有效地降低數(shù)據(jù)交換頻繁和帶寬使用率很高的數(shù)據(jù)中心網(wǎng)絡(luò)能耗,從而大大提高 了數(shù)據(jù)中心的可擴(kuò)展性。TVMPP僅考慮了網(wǎng)絡(luò)傳輸流量因素。一些其他的傳統(tǒng)虛擬機(jī)部署 算法包括約束編程,裝箱統(tǒng)計,整數(shù)規(guī)劃,遺傳算法等。這些方法使得數(shù)據(jù)中心可以最大限 度地使用服務(wù)器資源,通過關(guān)閉使用率非常低或者并不工作的服務(wù)器達(dá)到節(jié)省服務(wù)器能耗 的目的??梢?,雖然數(shù)據(jù)中心節(jié)能投入了大量的研究者進(jìn)行研究,也提出了大量性能不錯 的方法,但是需要提供一種從多因素結(jié)合角度出發(fā)研究相應(yīng)的部署算法,從而達(dá)到同時降 低服務(wù)器端能耗和網(wǎng)絡(luò)能耗雙重目標(biāo)的解決方法,以在大部分?jǐn)?shù)據(jù)中心網(wǎng)絡(luò)中減小總的能 耗。
【發(fā)明內(nèi)容】
[0004] 為了克服上述現(xiàn)有技術(shù)的缺陷,本發(fā)明提供了一種分布式云計算平臺的動態(tài)節(jié)能 資源調(diào)度系統(tǒng)及方法。該系統(tǒng)和方法用于在服務(wù)器端約束條件和承載多層次應(yīng)用程序的虛 擬機(jī)之間的依賴關(guān)系約束多重條件下,最小化數(shù)據(jù)中心網(wǎng)絡(luò)傳輸量和服務(wù)器資源浪費,從 而降低網(wǎng)絡(luò)能耗和服務(wù)器能耗。
[0005] 為了實現(xiàn)上述發(fā)明目的,本發(fā)明采取如下技術(shù)方案:
[0006] -種分布式云計算平臺的動態(tài)節(jié)能資源調(diào)度系統(tǒng),所述系統(tǒng)包括所述分布式云計 算平臺下的云服務(wù)器節(jié)點,其改進(jìn)之處在于:所述云服務(wù)器節(jié)點分別連接全局控制器和監(jiān) 測系統(tǒng);
[0007] 所述全局控制器和所述監(jiān)測系統(tǒng)分別連接建模分析模塊;所述監(jiān)測系統(tǒng)包括能耗 監(jiān)測模塊、流量監(jiān)測模塊和資源監(jiān)測模塊;所述云服務(wù)器節(jié)點上運行節(jié)點控制器。
[0008] 進(jìn)一步的,所述云服務(wù)器節(jié)點包括所述分布式云計算平臺下各物理服務(wù)器及其虛 擬機(jī)。
[0009] 進(jìn)一步的,所述全局控制器為實現(xiàn)所述分布式云計算平臺的全網(wǎng)范圍內(nèi)虛擬機(jī)部 署過程中服務(wù)器能耗和網(wǎng)絡(luò)設(shè)備能耗的集中控制的模塊;
[0010] 所述節(jié)點控制器為實現(xiàn)物理服務(wù)器上虛擬機(jī)的資源分配的模塊。
[0011] 進(jìn)一步的,所述能耗監(jiān)測模塊為監(jiān)測所述物理服務(wù)器的用電數(shù)據(jù)和設(shè)備冷卻用電 信息的模塊;
[0012] 所述流量監(jiān)測模塊為監(jiān)測域內(nèi)網(wǎng)絡(luò)設(shè)備的數(shù)據(jù)轉(zhuǎn)發(fā)信息、物理服務(wù)器之間的通信 流量數(shù)據(jù)及虛擬機(jī)之間的通信流量數(shù)據(jù)的模塊;
[0013] 所述資源監(jiān)測模塊為統(tǒng)計物理服務(wù)器的CPU、內(nèi)存、存儲空間占用信息,虛擬機(jī) CPU、內(nèi)存、存儲空間占用信息,及網(wǎng)絡(luò)設(shè)備CPU、內(nèi)存信息的模塊。
[0014] 進(jìn)一步的,所述建模分析模塊的建模模塊為運用分析引擎進(jìn)行能耗、性能、遷移建 模,獲得云計算平臺性能、能耗、遷移管理的優(yōu)化參數(shù)的模塊;
[0015] 所述建模分析模塊的分析模塊為根據(jù)所述優(yōu)化參數(shù)實現(xiàn)所述分布式云計算平臺 的全局或局部能耗最小化的模塊。
[0016] 一種應(yīng)用于如權(quán)利要求1所述的分布式云計算平臺的動態(tài)節(jié)能資源調(diào)度系統(tǒng)的 方法,其改進(jìn)之處在于:所述動態(tài)節(jié)能資源調(diào)度方法包括以下步驟:
[0017] I、能耗監(jiān)測模塊、流量監(jiān)測模塊和資源監(jiān)測模塊分別獲取物理服務(wù)器的能耗信 息、流量信息和資源信息;
[0018] II、建模分析模塊的建模模塊運用分析引擎進(jìn)行建模;
[0019] III、建模分析模塊的分析模塊進(jìn)行全局或局部能耗最小化;
[0020] IV、全局控制器下的域控制器實現(xiàn)動態(tài)節(jié)能資源調(diào)度。
[0021] 進(jìn)一步的,所述步驟I中,所述能耗信息包括:物理服務(wù)器的用電數(shù)據(jù)和設(shè)備冷卻 用電信息;
[0022] 所述流量信息包括:域內(nèi)網(wǎng)絡(luò)設(shè)備的數(shù)據(jù)轉(zhuǎn)發(fā)信息、物理服務(wù)器之間的通信流量 數(shù)據(jù)及虛擬機(jī)之間的通信流量數(shù)據(jù);
[0023] 所述資源信息包括:所述物理服務(wù)器的CPU、內(nèi)存、存儲空間占用信息,所述物理 服務(wù)器上虛擬機(jī)CPU、內(nèi)存、存儲空間占用信息,及網(wǎng)絡(luò)設(shè)備CPU、內(nèi)存信息。
[0024] 進(jìn)一步的,所述步驟II包括:運用所述建模分析模塊的建模模塊對能耗、性能、遷 移進(jìn)行建模,獲得所述云計算平臺的性能、能耗、遷移管理的優(yōu)化參數(shù);建立減少物理服務(wù) 器能耗和網(wǎng)絡(luò)設(shè)備能耗多重目標(biāo)優(yōu)化模型;
[0025] 所述步驟III包括:建模分析模塊的分析模塊根據(jù)所述建模模塊建立的多重目標(biāo) 優(yōu)化模型下發(fā)性能管理、能耗管理、遷移管理、跨域管理的配置參數(shù),實現(xiàn)所述分布式云計 算平臺的全網(wǎng)或局部的能耗最小化。
[0026] 進(jìn)一步的,所述步驟IV包括:所述全局控制器下的域控制器通過云服務(wù)器節(jié)點實 施虛擬機(jī)部署和遷移,完成動態(tài)節(jié)能資源調(diào)度。
[0027] 進(jìn)一步的,所述動態(tài)節(jié)能資源調(diào)度的算法包括以下步驟:
[0028] I、針對η個虛擬機(jī)需要進(jìn)行部署,所述虛擬機(jī)間的依賴關(guān)系矩陣為D,設(shè)定所述η 個虛擬機(jī)為所述虛擬機(jī)之間的依賴關(guān)系圖G的節(jié)點,所述依賴關(guān)系矩陣D為加權(quán)邊,獲得所 述虛擬機(jī)之間的依賴關(guān)系圖G ;
[0029] 設(shè)定資源余量閾值迭代、每個虛擬機(jī)的資源需求為一個d維向量、所述物理服務(wù) 器的資源包括基本單元、所述基本單元的資源需求為一個d維向量;
[0030] II、將所述圖G分成相互獨立的k個子集,所述η個虛擬機(jī)分成大小不同的k組, 獲得所述依賴關(guān)系圖G的最小權(quán)重的割k_cut ;
[0031] III、給定資源基本單元,將物理服務(wù)器以基本單元的整數(shù)倍劃分k組;
[0032] IV、匹配虛擬機(jī)分組和物理服務(wù)器分組,直至匹配結(jié)果滿足資源余量小于或等于 資源余量閾值迭代結(jié)束,獲得虛擬機(jī)部署或遷移結(jié)果同時滿足了最小化云計算平臺網(wǎng)絡(luò)傳 輸量和服務(wù)器資源余量的要求,實現(xiàn)多維度降低云計算平臺能耗。
[0033] 與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:
[0034] 1、本發(fā)明的系統(tǒng)和方法針對分布式云計算平臺的跨域分布特點及綜合節(jié)能資源 調(diào)度需求,實現(xiàn)同時降低服務(wù)器和網(wǎng)絡(luò)能耗的效果。
[0035] 2、本發(fā)明的系統(tǒng)和方法通過引入域的概念,提供基于域的資源管理機(jī)制,有效解 決了傳統(tǒng)方法以物理集群粒度進(jìn)行資源調(diào)度存在的調(diào)度不靈活的問題,實現(xiàn)了集群內(nèi)和跨 集群資源的邏輯重組、動態(tài)分配和多粒度調(diào)度。域與集群的對應(yīng)關(guān)系有如下三種:一是集群 和域的一一對應(yīng),此時退化為傳統(tǒng)集群粒度調(diào)度;二是可在一個較大的集群內(nèi)進(jìn)行域的劃 分,實現(xiàn)資源的細(xì)粒度分配與調(diào)度;三是可跨集群實現(xiàn)資源調(diào)度,在邏輯上將多個集劃分為 一個域,實現(xiàn)跨域統(tǒng)一資源管理和調(diào)度。
[0036] 3、本發(fā)明的系統(tǒng)和方法通過將多級資源調(diào)度控制機(jī)制、能耗/資源/流量多維監(jiān) 測、分析建模引擎構(gòu)成閉環(huán)系統(tǒng)的方式完成資源動態(tài)調(diào)度,避免了傳統(tǒng)方法缺乏有效的反 饋機(jī)制存在的弊端,提供了高效靈活的資源調(diào)度一〉實時反饋一〉模型參數(shù)調(diào)整一> 資源調(diào) 度動態(tài)調(diào)優(yōu)的資源調(diào)度體系。
[0037] 4、本發(fā)明的方法基于多維度(能耗、資源占用率、通信流量)監(jiān)測提供的完備信 息,提出了能同時降低網(wǎng)絡(luò)設(shè)備能耗和服務(wù)器能耗的多目標(biāo)調(diào)度模型,實現(xiàn)了基于k-cut 的調(diào)度算法。相比傳統(tǒng)的單目標(biāo)節(jié)能建模方法,避免了單純降低物理服務(wù)器能耗或網(wǎng)絡(luò)設(shè) 備能耗手段單一和效果差的問題;相比傳統(tǒng)多目標(biāo)節(jié)能建模方法,通過上述閉環(huán)系統(tǒng)形成 的反饋機(jī)制,可動態(tài)調(diào)整相應(yīng)參數(shù),有效避免了多目標(biāo)迭代算法收斂速度慢、參數(shù)設(shè)置不當(dāng) 等問題。
【專利附圖】
【附圖說明】
[0038] 圖1為本發(fā)明的動態(tài)節(jié)能資源調(diào)度系統(tǒng)的示意圖;
[0039] 圖2為本發(fā)明的動態(tài)節(jié)能資源調(diào)度工作過程流程圖;
[0040] 圖3為本發(fā)明的動態(tài)節(jié)能資源調(diào)度方法流程圖。
【具體實施方式】
[0041] 下面結(jié)合附圖對本發(fā)明作進(jìn)一步說明。
[0042] 云計算平臺或云數(shù)據(jù)中心能耗主要包括服務(wù)器能耗和網(wǎng)絡(luò)能耗,降低服務(wù)器能耗 的關(guān)鍵在于最大程度上減少虛擬機(jī)部署過程中物理機(jī)器資源的浪費,使用盡量少的物理機(jī) 器承載所有的虛擬機(jī),最大化物理機(jī)器的利用率;降低網(wǎng)絡(luò)能耗的關(guān)鍵在于通過應(yīng)用感知 虛擬機(jī)部署機(jī)制最大程度上減少云計算平臺中跨交換機(jī)數(shù)據(jù)傳輸流量,節(jié)省帶寬資源以及 交換機(jī)能耗;因此本發(fā)明提供一種分布式云計算平臺的動態(tài)節(jié)能資源調(diào)度系統(tǒng)及其調(diào)度方 法,該系統(tǒng)和方法用于實現(xiàn)在服務(wù)器端約束條件和承載多層次應(yīng)用程序的虛擬機(jī)之間的依 賴關(guān)系約束多重條件下,最小化數(shù)據(jù)中心網(wǎng)絡(luò)傳輸量和服務(wù)器資源浪費,從而降低網(wǎng)絡(luò)能 耗和服務(wù)器能耗,最終實現(xiàn)多維度降低云計算平臺能耗的目標(biāo)。上述多維度指網(wǎng)絡(luò)設(shè)備能 耗維度和服務(wù)器能耗維度。
[0043] 本發(fā)明的方法中,基于需降低網(wǎng)絡(luò)能耗和服務(wù)器能耗的目的實現(xiàn)大規(guī)模分布式云 計算環(huán)境下兩類資源動態(tài)映射,包括:一、從應(yīng)用程序負(fù)載到資源需求的映射,針對降低網(wǎng) 絡(luò)能耗;二、從虛擬機(jī)到物理機(jī)器的映射,針對降低服務(wù)器能耗。
[0044] 為支持這兩種映射,系統(tǒng)分為全局控制器、域控制器和節(jié)點控制器三級架構(gòu)。其 中,全局控制器工作在整個云計算平臺的資源池層次,域控制器工作在管理域?qū)哟?,?jié)點控 制器則工作在虛擬機(jī)層次。
[0045] 每個物理服務(wù)器節(jié)點上運行節(jié)點控制器,用于監(jiān)測虛擬機(jī)及其承載的應(yīng)用程序資 源占用、能耗情況等。域控制器和全局控制器程序則分別負(fù)責(zé)完成全域或整個云平臺的虛 擬機(jī)部署和相應(yīng)的資源分配。
[0046] 此外,云計算平臺的監(jiān)測系統(tǒng)檢測如下系統(tǒng)信息:每個服務(wù)器和網(wǎng)絡(luò)設(shè)備上的能 耗情況,資源使用情況,相互關(guān)聯(lián)的應(yīng)用程序之間的通信流量,并形成相關(guān)信息發(fā)送到集中 分析庫,分析和建模模塊利用云平臺監(jiān)測系統(tǒng)收集的信息對服務(wù)器和網(wǎng)絡(luò)設(shè)備能耗進(jìn)行分 析并建立模型,并把最終結(jié)果發(fā)送到全局控制器幫助其完成節(jié)能部署決策。
[0047] 如圖1所示,圖1為本發(fā)明的動態(tài)節(jié)能資源調(diào)度系統(tǒng)的示意圖;本發(fā)明的系統(tǒng)包 括:分布式云計算平臺下的云服務(wù)器節(jié)點、全局控制器、節(jié)點控制器、建模分析模塊。
[0048] 述云服務(wù)器節(jié)點分別連接全局控制器和節(jié)點控制器;所述全局控制器和所述節(jié)點 控制器分別連接建模分析模塊;所述節(jié)點控制器包括能耗監(jiān)測模塊、流量監(jiān)測模塊和資源 監(jiān)測模塊。
[0049] 上述分布式云計算平臺下的云服務(wù)器節(jié)點為云計算平臺的測試機(jī),針對上述測試 機(jī)進(jìn)行動態(tài)節(jié)能資源調(diào)度系統(tǒng)。云服務(wù)器節(jié)點包括所述分布式云計算平臺下的各物理服務(wù) 器節(jié)點,具體包括各物理服務(wù)器和各物理服務(wù)器上的虛擬機(jī)。
[0050] 所述全局控制器連接各域控制器,所述域控制器連接多個物理集群內(nèi)或整個物理 集群內(nèi)或某個物理集群內(nèi)部分上述云服務(wù)器節(jié)點的節(jié)點控制器。
[0051 ] 全局控制器:實現(xiàn)所述分布式云計算平臺的全網(wǎng)范圍內(nèi)虛擬機(jī)部署過程中服務(wù)器 能耗和網(wǎng)絡(luò)設(shè)備能耗的集中控制。
[0052] 節(jié)點控制器:運行于物理服務(wù)器上,用于實現(xiàn)物理服務(wù)器上虛擬機(jī)的資源分配的 模塊。
[0053] 能耗監(jiān)測模塊:用于監(jiān)測所述物理服務(wù)器的用電數(shù)據(jù)和設(shè)備冷卻用電信息的模 塊。
[0054] 流量監(jiān)測模塊:用于監(jiān)測域內(nèi)網(wǎng)絡(luò)設(shè)備的數(shù)據(jù)轉(zhuǎn)發(fā)信息、物理服務(wù)器之間的通信 流量數(shù)據(jù)及虛擬機(jī)之間的通信流量數(shù)據(jù)的模塊。
[0055] 資源監(jiān)測模塊:用于統(tǒng)計物理服務(wù)器的CPU、內(nèi)存、存儲空間占用信息,虛擬機(jī) CPU、內(nèi)存、存儲空間占用信息,及網(wǎng)絡(luò)設(shè)備CPU、內(nèi)存等信息的模塊。
[0056] 建模分析模塊:運用分析引擎進(jìn)行能耗、性能、遷移建模,獲得云計算平臺性能、能 耗、遷移管理的優(yōu)化參數(shù),根據(jù)所述優(yōu)化參數(shù)實現(xiàn)所述分布式云計算平臺的全局或局部能 耗最小化。
[0057] 建模分析模塊包括建模模塊和分析模塊,其中,運用分析引擎進(jìn)行能耗、性能、遷 移建模,獲得云計算平臺性能、能耗、遷移管理的優(yōu)化參數(shù)由建模模塊實現(xiàn),根據(jù)所述優(yōu)化 參數(shù)實現(xiàn)所述分布式云計算平臺的全局或局部能耗最小化由分析模塊實現(xiàn)。
[0058] 如圖2所示,圖2為本發(fā)明的動態(tài)節(jié)能資源調(diào)度工作過程流程圖;本發(fā)明還提供了 一種應(yīng)用于分布式云計算平臺的動態(tài)節(jié)能資源調(diào)度系統(tǒng)的方法,該動態(tài)節(jié)能資源調(diào)度方法 包括以下步驟:
[0059] I、能耗監(jiān)測模塊、流量監(jiān)測模塊和資源監(jiān)測模塊分別獲取物理服務(wù)器的能耗信 息、流量信息和資源信息;
[0060] II、建模分析模塊的建模模塊運用分析引擎進(jìn)行建模;
[0061] III、建模分析模塊的分析模塊實現(xiàn)全局或局部能耗最小化;
[0062] IV、全局控制器下的域控制器實現(xiàn)動態(tài)節(jié)能資源調(diào)度。
[0063] 步驟I中,所述能耗信息包括:物理服務(wù)器的用電數(shù)據(jù)和設(shè)備冷卻用電信息;
[0064] 所述流量信息包括:域內(nèi)網(wǎng)絡(luò)設(shè)備的數(shù)據(jù)轉(zhuǎn)發(fā)信息、物理服務(wù)器之間的通信流量 數(shù)據(jù)及虛擬機(jī)之間的通信流量數(shù)據(jù);
[0065] 所述資源信息包括:所述物理服務(wù)器的CPU、內(nèi)存、存儲空間占用信息,所述物理 服務(wù)器上虛擬機(jī)CPU、內(nèi)存、存儲空間占用信息,及網(wǎng)絡(luò)設(shè)備CPU、內(nèi)存。
[0066] 步驟II包括:運用所述分析引擎對能耗、性能、遷移進(jìn)行建模,獲得所述云計算平 臺的性能、能耗、遷移管理的優(yōu)化參數(shù);建立減少物理服務(wù)器能耗和網(wǎng)絡(luò)設(shè)備能耗多重目標(biāo) 優(yōu)化模型。
[0067] 步驟III包括:全局控制器根據(jù)建模分析模塊建立的多重目標(biāo)優(yōu)化模型下發(fā)性能 管理、能耗管理、遷移管理、跨域管理的配置參數(shù),實現(xiàn)所述分布式云計算平臺的全網(wǎng)或局 部的能耗最小化。
[0068] 步驟IV包括:所述全局控制器下的域控制器通過云服務(wù)器節(jié)點實施虛擬機(jī)部署 和遷移,完成動態(tài)節(jié)能資源調(diào)度。
[0069] 如圖3所示,圖3為本發(fā)明的動態(tài)節(jié)能資源調(diào)度方法流程圖;上述動態(tài)節(jié)能資源調(diào) 度的方法,該方法由分析模塊實現(xiàn),方法包括以下步驟:
[0070] I、假設(shè)針對η個虛擬機(jī)需要進(jìn)行部署,虛擬機(jī)間的依賴關(guān)系矩陣為D,D矩陣為的 單元值為〇或1,若兩個虛擬機(jī)存在相互通信,則為1,沒有通信關(guān)系,則為〇 ;
[0071] 每個虛擬機(jī)的資源需求為一個d維向量,該向量的每一維代表運行在虛擬機(jī)上的 應(yīng)用程序請求的某一類資源,包括CPU,內(nèi)存或者存儲空間等。
[0072] 相應(yīng)地,物理服務(wù)器所具備的資源被分成多個基本單元,每一單元的資源的多少 根據(jù)虛擬機(jī)請求的資源確定,資源基本單元同樣為一個d維向量。
[0073] 同時,給定資源余量閾值參數(shù)。
[0074] 為盡量將通信頻繁的虛擬機(jī)分配到一組通信成本較低的槽上,以減少虛擬機(jī)間通 信對底層拓?fù)浣Y(jié)構(gòu)造成的影響達(dá)到降低通信成本和降低網(wǎng)絡(luò)設(shè)備能耗的目的;通過將η個 虛擬機(jī)看成依賴關(guān)系圖的節(jié)點,而依賴關(guān)系矩陣D看成是依賴關(guān)系圖的加權(quán)邊,從而獲得 虛擬機(jī)之間的依賴關(guān)系圖G ;
[0075] II、將上述依賴關(guān)系圖G分成相互獨立的k個子集,所述η個虛擬機(jī)分成大小不同 的k組,獲得所述依賴關(guān)系圖G的最小權(quán)重的割k_cut ;
[0076] III、給定資源基本單元,將物理服務(wù)器以基本單元的整數(shù)倍劃分k組;
[0077] IV、匹配虛擬機(jī)分組和物理服務(wù)器分組,直至匹配結(jié)果滿足資源余量小于或等于 資源余量閾值迭代結(jié)束,獲得虛擬機(jī)部署或遷移結(jié)果同時滿足了最小化云計算平臺網(wǎng)絡(luò)傳 輸量和服務(wù)器資源余量的要求,實現(xiàn)多維度(包括網(wǎng)絡(luò)設(shè)備能耗維度和服務(wù)器能耗維度) 降低云計算平臺能耗。
[0078] 提供一具體實施例,假設(shè)已經(jīng)部署的虛擬機(jī)是按照上述動態(tài)資源調(diào)度機(jī)制實施 的,此實施例為增量實施方案,方案如下:
[0079] 步驟一:分布式云平臺虛擬機(jī)快速部署模塊(所述快速部署模塊為云平臺固有模 塊)向全局控制器申請?zhí)摂M機(jī)創(chuàng)建和部署,全局控制器根據(jù)用戶提交的參數(shù)從全局資源視 圖中篩選符合要求的物理服務(wù)器節(jié)點;
[0080] 步驟二:全局控制器篩選出可用云服務(wù)器節(jié)點集合后,進(jìn)一步構(gòu)建虛擬機(jī)的依賴 關(guān)系圖G(需要監(jiān)測模塊和建模分析模塊的共同參與),最終確定虛擬機(jī)部署的域和承載服 務(wù)器節(jié)點;
[0081] 步驟三:節(jié)點控制器按照圖3所示的資源調(diào)度算法完成虛擬機(jī)資源和物理服務(wù)器 資源的映射綁定過程,并將映射關(guān)系反饋給域控制器和全局控制器,完成初步部署過程。 [0082] 步驟四:節(jié)點控制器不斷采集已部署的虛擬機(jī)的資源使用信息、通信流量信息、本 物理服務(wù)器節(jié)點的資源使用信息,并反饋給分析建模模塊,分析建模模塊根據(jù)實時信息調(diào) 整迭代參數(shù)(如資源余量閾值、物理服務(wù)器節(jié)點資源CPU/內(nèi)存/存儲空間閾值、能耗上限 閾值等),并反饋給全局控制器,由全局控制器決定是否需要進(jìn)一步進(jìn)行虛擬機(jī)遷移等操 作。
[0083] 最后應(yīng)當(dāng)說明的是:以上實施例僅用以說明本發(fā)明的技術(shù)方案而非對其限制,盡 管參照上述實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,所屬領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:依然 可以對本發(fā)明的【具體實施方式】進(jìn)行修改或者等同替換,而未脫離本發(fā)明精神和范圍的任何 修改或者等同替換,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。
【權(quán)利要求】
1. 一種分布式云計算平臺的動態(tài)節(jié)能資源調(diào)度系統(tǒng),所述系統(tǒng)包括所述分布式云計 算平臺下的云服務(wù)器節(jié)點,其特征在于:所述云服務(wù)器節(jié)點分別連接全局控制器和監(jiān)測系 統(tǒng); 所述全局控制器和所述監(jiān)測系統(tǒng)分別連接建模分析模塊;所述監(jiān)測系統(tǒng)包括能耗監(jiān)測 模塊、流量監(jiān)測模塊和資源監(jiān)測模塊;所述云服務(wù)器節(jié)點上運行節(jié)點控制器。
2. 如權(quán)利要求1所述的動態(tài)節(jié)能資源調(diào)度系統(tǒng),其特征在于:所述云服務(wù)器節(jié)點包括 所述分布式云計算平臺下各物理服務(wù)器及其虛擬機(jī)。
3. 如權(quán)利要求1所述的動態(tài)節(jié)能資源調(diào)度系統(tǒng),其特征在于:所述全局控制器為實現(xiàn) 所述分布式云計算平臺的全網(wǎng)范圍內(nèi)虛擬機(jī)部署過程中服務(wù)器能耗和網(wǎng)絡(luò)設(shè)備能耗的集 中控制的模塊; 所述節(jié)點控制器為實現(xiàn)物理服務(wù)器上虛擬機(jī)的資源分配的模塊。
4. 如權(quán)利要求1所述的動態(tài)節(jié)能資源調(diào)度系統(tǒng),其特征在于:所述能耗監(jiān)測模塊為監(jiān) 測所述物理服務(wù)器的用電數(shù)據(jù)和設(shè)備冷卻用電信息的模塊; 所述流量監(jiān)測模塊為監(jiān)測域內(nèi)網(wǎng)絡(luò)設(shè)備的數(shù)據(jù)轉(zhuǎn)發(fā)信息、物理服務(wù)器之間的通信流量 數(shù)據(jù)及虛擬機(jī)之間的通信流量數(shù)據(jù)的模塊; 所述資源監(jiān)測模塊為統(tǒng)計物理服務(wù)器的CPU、內(nèi)存、存儲空間占用信息,虛擬機(jī)CPU、內(nèi) 存、存儲空間占用信息,及網(wǎng)絡(luò)設(shè)備CPU、內(nèi)存信息的模塊。
5. 如權(quán)利要求1所述的動態(tài)節(jié)能資源調(diào)度系統(tǒng),其特征在于:所述建模分析模塊的建 模模塊為運用分析引擎進(jìn)行能耗、性能、遷移建模,獲得云計算平臺性能、能耗、遷移管理的 優(yōu)化參數(shù)的模塊; 所述建模分析模塊的分析模塊為根據(jù)所述優(yōu)化參數(shù)實現(xiàn)所述分布式云計算平臺的全 局或局部能耗最小化的模塊。
6. -種應(yīng)用于如權(quán)利要求1所述的分布式云計算平臺的動態(tài)節(jié)能資源調(diào)度系統(tǒng)的方 法,其特征在于:所述動態(tài)節(jié)能資源調(diào)度方法包括以下步驟: I、 能耗監(jiān)測模塊、流量監(jiān)測模塊和資源監(jiān)測模塊分別獲取物理服務(wù)器的能耗信息、流 量信息和資源信息; II、 建模分析模塊的建模模塊運用分析引擎進(jìn)行建模; III、 建模分析模塊的分析模塊進(jìn)行全局或局部能耗最小化; IV、 全局控制器下的域控制器實現(xiàn)動態(tài)節(jié)能資源調(diào)度。
7. 如權(quán)利要求6所述的方法,其特征在于:所述步驟I中,所述能耗信息包括:物理服 務(wù)器的用電數(shù)據(jù)和設(shè)備冷卻用電信息; 所述流量信息包括:域內(nèi)網(wǎng)絡(luò)設(shè)備的數(shù)據(jù)轉(zhuǎn)發(fā)信息、物理服務(wù)器之間的通信流量數(shù)據(jù) 及虛擬機(jī)之間的通信流量數(shù)據(jù); 所述資源信息包括:所述物理服務(wù)器的CPU、內(nèi)存、存儲空間占用信息,所述物理服務(wù) 器上虛擬機(jī)CPU、內(nèi)存、存儲空間占用信息,及網(wǎng)絡(luò)設(shè)備CPU、內(nèi)存信息。
8. 如權(quán)利要求6所述的方法,其特征在于:所述步驟II包括:運用所述建模分析模塊 的建模模塊對能耗、性能、遷移進(jìn)行建模,獲得所述云計算平臺的性能、能耗、遷移管理的優(yōu) 化參數(shù);建立減少物理服務(wù)器能耗和網(wǎng)絡(luò)設(shè)備能耗多重目標(biāo)優(yōu)化模型; 所述步驟III包括:建模分析模塊的分析模塊根據(jù)所述建模模塊建立的多重目標(biāo)優(yōu)化 模型下發(fā)性能管理、能耗管理、遷移管理、跨域管理的配置參數(shù),實現(xiàn)所述分布式云計算平 臺的全網(wǎng)或局部的能耗最小化。
9. 如權(quán)利要求6所述的方法,其特征在于:所述步驟IV包括:所述全局控制器下的域 控制器通過云服務(wù)器節(jié)點實施虛擬機(jī)部署和遷移,完成動態(tài)節(jié)能資源調(diào)度。
10. 如權(quán)利要求9所述的方法,其特征在于:所述動態(tài)節(jié)能資源調(diào)度的算法包括以下步 驟: I、針對η個虛擬機(jī)需要進(jìn)行部署,所述虛擬機(jī)間的依賴關(guān)系矩陣為D,設(shè)定所述η個虛 擬機(jī)為所述虛擬機(jī)之間的依賴關(guān)系圖G的節(jié)點,所述依賴關(guān)系矩陣D為加權(quán)邊,獲得所述虛 擬機(jī)之間的依賴關(guān)系圖G ; 設(shè)定資源余量閾值迭代、每個虛擬機(jī)的資源需求為一個d維向量、所述物理服務(wù)器的 資源包括基本單元、所述基本單元的資源需求為一個d維向量;
11. 將所述圖G分成相互獨立的k個子集,所述η個虛擬機(jī)分成大小不同的k組,獲得 所述依賴關(guān)系圖G的最小權(quán)重的割k_cut ; III、 給定資源基本單元,將物理服務(wù)器以基本單元的整數(shù)倍劃分k組; IV、 匹配虛擬機(jī)分組和物理服務(wù)器分組,直至匹配結(jié)果滿足資源余量小于或等于資源 余量閾值迭代結(jié)束,獲得虛擬機(jī)部署或遷移結(jié)果同時滿足了最小化云計算平臺網(wǎng)絡(luò)傳輸量 和服務(wù)器資源余量的要求,實現(xiàn)多維度降低云計算平臺能耗。
【文檔編號】G06F9/48GK104052820SQ201410301191
【公開日】2014年9月17日 申請日期:2014年6月27日 優(yōu)先權(quán)日:2014年6月27日
【發(fā)明者】黃道超, 劉欣然, 張鴻, 史亮 申請人:國家計算機(jī)網(wǎng)絡(luò)與信息安全管理中心