基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),包含有策略數(shù)據(jù)庫、策略引擎、數(shù)據(jù)處理裝置、設(shè)備控制裝置、監(jiān)控裝置;策略數(shù)據(jù)庫、數(shù)據(jù)處理裝置、設(shè)備控制裝置均與策略引擎通訊連接,監(jiān)控裝置與數(shù)據(jù)處理裝置通訊連接,可實(shí)現(xiàn)對(duì)電源功耗的有效監(jiān)控,及時(shí)、全面、準(zhǔn)確的對(duì)能耗情況進(jìn)行監(jiān)控,以此為基礎(chǔ),進(jìn)行數(shù)據(jù)中心工作情況的分析和判斷,進(jìn)而實(shí)施管理和控制,以促使數(shù)據(jù)中心處于更合理的運(yùn)行狀態(tài)。
【專利說明】基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及IT運(yùn)維服務(wù)領(lǐng)域,尤其是一種基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)。
【背景技術(shù)】
[0002]隨著IT技術(shù)的廣泛發(fā)展和應(yīng)用,人們對(duì)IT技術(shù)的依賴也越來越大,承載信息技術(shù)方案的設(shè)備實(shí)體的規(guī)模日益龐大,數(shù)據(jù)中心作為專業(yè)載體,可提高各設(shè)備的利用效率和維護(hù)水平,但在數(shù)據(jù)中心的建設(shè)和使用中也存在諸多問題,其中,高能耗問題不僅影響了運(yùn)營成本,而且威脅到了系統(tǒng)的穩(wěn)定性,現(xiàn)有數(shù)據(jù)中心內(nèi)的設(shè)備如服務(wù)器一般長(zhǎng)期開機(jī)運(yùn)行,即使設(shè)計(jì)負(fù)載不飽和或者負(fù)載波谷時(shí)段,也難以實(shí)現(xiàn)停機(jī)管控,不利于降低能耗、節(jié)約供電成本;與此同時(shí),長(zhǎng)期高能耗帶導(dǎo)致熱能淤積,往往需要采取額外的制冷措施,這又一次增加了數(shù)據(jù)中心維護(hù)成本;再者,出于對(duì)服務(wù)器過密、無法及時(shí)散熱,威脅到設(shè)備穩(wěn)定工作的擔(dān)憂,數(shù)據(jù)中心機(jī)柜實(shí)際難以滿柜,影響了利用率而間接提高了成本;另外,供電異常會(huì)造成數(shù)據(jù)中心數(shù)據(jù)丟失,造成不必要的經(jīng)濟(jì)損失。
[0003]因此,如何對(duì)數(shù)據(jù)中心服務(wù)器平臺(tái)進(jìn)行實(shí)時(shí)監(jiān)控以避免數(shù)據(jù)中心局部過熱,解決功耗狀態(tài)未知;如何在允許范圍內(nèi)提高數(shù)據(jù)中心機(jī)架的密度以減少成本;如何在供電異常的情況下提前告警,并自動(dòng)降低數(shù)據(jù)中心功耗以獲取關(guān)鍵的時(shí)間進(jìn)行數(shù)據(jù)搶救,均是當(dāng)下IT運(yùn)維領(lǐng)域的管理人員面臨的迫切問題。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的目的在于提供一種基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),實(shí)現(xiàn)對(duì)電源功耗的有效監(jiān)控,及時(shí)、全面、準(zhǔn)確的對(duì)能耗情況進(jìn)行監(jiān)控,以此為基礎(chǔ),進(jìn)行數(shù)據(jù)中心工作情況的分析和判斷,進(jìn)而實(shí)施管理和控制,以促使數(shù)據(jù)中心處于更合理的運(yùn)行狀態(tài),并克服現(xiàn)有技術(shù)中的前述不足。
[0005]本發(fā)明的目的采用如下方案實(shí)現(xiàn):基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)包含有策略數(shù)據(jù)庫、策略引擎、數(shù)據(jù)處理裝置、設(shè)備控制裝置、監(jiān)控裝置;策略數(shù)據(jù)庫、數(shù)據(jù)處理裝置、設(shè)備控制裝置均與策略引擎通訊連接,監(jiān)控裝置與數(shù)據(jù)處理裝置通訊連接,其中:
策略數(shù)據(jù)庫:用于設(shè)置并保存電源和功耗的策略;
策略引擎:用于根據(jù)策略數(shù)據(jù)庫中的預(yù)設(shè)策略調(diào)用數(shù)據(jù)處理裝置和設(shè)備控制裝置;數(shù)據(jù)處理裝置:用于保存監(jiān)控裝置采集到得數(shù)據(jù),并進(jìn)行策略計(jì)算和分析并將最終結(jié)果反饋給策略引擎;
設(shè)備控制裝置:用于根據(jù)策略引擎做出的判斷對(duì)數(shù)據(jù)中心各設(shè)備實(shí)施控制;
監(jiān)控裝置:用于對(duì)數(shù)據(jù)中心各設(shè)備實(shí)施監(jiān)控,并采集監(jiān)控所得原始數(shù)據(jù)報(bào)數(shù)據(jù)處理裝置。
[0006]更進(jìn)一步的,所述基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)可以集中部署,也可以根據(jù)數(shù)據(jù)中心能耗管控級(jí)別多層級(jí)部署??蛇m應(yīng)不同規(guī)模的數(shù)據(jù)中心,擴(kuò)展容易。[0007]應(yīng)用上述裝置可以測(cè)量數(shù)據(jù)中心的實(shí)際功耗,從而實(shí)時(shí)提供數(shù)據(jù)中心實(shí)際的功耗數(shù)據(jù),利用策略引擎可以對(duì)數(shù)據(jù)中心的運(yùn)行狀態(tài)進(jìn)行評(píng)估和自動(dòng)生成調(diào)整方案,并通過實(shí)施裝置,即所述設(shè)備控制裝置,將數(shù)據(jù)中心各設(shè)備設(shè)置為目標(biāo)狀態(tài),從而使平臺(tái)在限定功率下保持最佳狀態(tài)和最大利用率。
[0008]更進(jìn)一步的,本發(fā)明所采用的優(yōu)化方法為基于電源功耗監(jiān)控的數(shù)據(jù)中心優(yōu)化方法:具體包括如下步驟:
1)、設(shè)定數(shù)據(jù)中心服務(wù)器的電源和功耗的策略;
2)、在策略引擎的調(diào)度下,設(shè)備控制裝置按照設(shè)定的策略對(duì)數(shù)據(jù)中心的運(yùn)行實(shí)施控
制;
3)、實(shí)時(shí)監(jiān)控電源模塊工作情況,通過數(shù)據(jù)中心服務(wù)器的主板電源接口實(shí)施監(jiān)控;
4)、對(duì)第3)步中所獲取的數(shù)據(jù)進(jìn)行分析計(jì)算;
5)、將第4)步中所得分析結(jié)果反饋策略引擎,策略引擎做出判斷并通過設(shè)備控制裝置調(diào)整數(shù)據(jù)中心的設(shè)備運(yùn)行狀態(tài)。
[0009]采用這種方法,對(duì)數(shù)據(jù)中心的能耗情況進(jìn)行了設(shè)備級(jí)的實(shí)時(shí)監(jiān)控,并對(duì)監(jiān)控結(jié)果實(shí)施分析判斷,還根據(jù)判斷結(jié)果對(duì)數(shù)據(jù)中心的設(shè)備實(shí)施了控制,以實(shí)現(xiàn)預(yù)期的工作狀態(tài),而且分析判斷的策略和規(guī)則可以自由定制,增強(qiáng)了調(diào)控的靈活性和豐富性。
[0010]更詳細(xì)的原理描述如下:將數(shù)據(jù)中心視為三層:
第一層為裝置層,包含基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng);
第二層為通信層,由網(wǎng)絡(luò)通信設(shè)施構(gòu)成;
第三層為硬件組件層,由需要優(yōu)化的數(shù)據(jù)中心平臺(tái)設(shè)備構(gòu)成。
[0011]裝置層的主要任務(wù)是負(fù)責(zé)監(jiān)控采集數(shù)據(jù)中心服務(wù)器平臺(tái)電源情況數(shù)據(jù),智能分析數(shù)據(jù),基于策略發(fā)出控制命令控制數(shù)據(jù)中心服務(wù)器平臺(tái)服務(wù)器的處理器主頻等參數(shù)。
[0012]裝置層的工作流程主要是第一步由運(yùn)維工程師設(shè)置策略,監(jiān)控裝置通過通信層實(shí)時(shí)監(jiān)控電源模塊情況,并將數(shù)據(jù)反饋到數(shù)據(jù)處理裝置,由數(shù)據(jù)處理裝置對(duì)數(shù)據(jù)依據(jù)策略進(jìn)行計(jì)算并得出結(jié)論,將相應(yīng)的結(jié)論發(fā)送給策略引擎,策略引擎根據(jù)監(jiān)控結(jié)論和預(yù)設(shè)策略調(diào)用設(shè)備控制裝置,設(shè)備控制裝置通過通信層控制數(shù)據(jù)中心服務(wù)器處理器的參數(shù)以適應(yīng)策略要求。
[0013]與此同時(shí),運(yùn)維工程師也可以根據(jù)數(shù)據(jù)處理中心分析的數(shù)據(jù)和結(jié)論以擴(kuò)展數(shù)據(jù)中心機(jī)房機(jī)架的密度,也可由策略引擎給出調(diào)配建議。數(shù)據(jù)處理中心得出的結(jié)論無法由控制裝置處理時(shí),如電源異常,策略引擎會(huì)發(fā)出告警或通知,通知運(yùn)維工程進(jìn)行相應(yīng)處理。
[0014]如上所述,可實(shí)現(xiàn)運(yùn)維工程師設(shè)定策略、監(jiān)控裝置對(duì)數(shù)據(jù)中心服務(wù)器平臺(tái)進(jìn)行電源和功耗監(jiān)控、數(shù)據(jù)中心保存數(shù)據(jù)并進(jìn)行計(jì)算和分析、控制裝置依據(jù)數(shù)據(jù)處理裝置分析的結(jié)果對(duì)數(shù)據(jù)中心服務(wù)器進(jìn)行控制。
[0015]綜上所述,和傳統(tǒng)技術(shù)方法相比,本發(fā)明方法優(yōu)點(diǎn)在于:第一、實(shí)時(shí)電源和功耗監(jiān)控,使得數(shù)據(jù)中心服務(wù)器平臺(tái)功耗狀態(tài)可預(yù)知,運(yùn)維工程師根據(jù)監(jiān)控?cái)?shù)據(jù)做出適當(dāng)調(diào)整以避免數(shù)據(jù)中心服務(wù)器平臺(tái)局部過熱而導(dǎo)致服務(wù)器性能降低或者損壞,減少經(jīng)濟(jì)損失;第二、運(yùn)維工程師根據(jù)策略反饋情況提升數(shù)據(jù)中心服務(wù)器平臺(tái)機(jī)架密度,從而降低成本節(jié)約空間;第三、依據(jù)策略控制負(fù)載均衡狀態(tài)下使得數(shù)據(jù)中心服務(wù)器平臺(tái)隨時(shí)處于最佳功耗狀態(tài),忙時(shí)高功耗,閑時(shí)低功耗以降低用電和制冷成本;第四、智能告警和做出應(yīng)急處理,當(dāng)電源處于異常狀態(tài),例如緊急停電,該裝置可以降低功耗和電源消耗,及時(shí)告警,延長(zhǎng)數(shù)據(jù)中心服務(wù)器因停電而關(guān)機(jī)的時(shí)間,為運(yùn)維工程搶救數(shù)據(jù)贏得時(shí)間。
【專利附圖】
【附圖說明】
[0016]圖1是本發(fā)明的工作流程示意圖;
圖2是本發(fā)明的原理示意圖;
圖3是本發(fā)明中基于策略的電源管理流程示意圖;
圖4是本發(fā)明的一個(gè)大型部署示例的示意圖。
【具體實(shí)施方式】
[0017]本說明書中公開的所有特征,或公開的所有方法或過程中的步驟,除了互相排斥的特征和/或步驟以外,均可以以任何方式組合。
[0018]如圖2所示,本發(fā)明中將數(shù)據(jù)中心平臺(tái)分三層進(jìn)行管理和交互通信,分別為:1)裝置層,裝置層由本發(fā)明所提供的基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)構(gòu)成,是發(fā)明的核心所在,主要負(fù)責(zé)策略設(shè)置、數(shù)據(jù)分析和計(jì)算、監(jiān)控?cái)?shù)據(jù)、控制服務(wù)器平臺(tái)功耗等任務(wù)。2)通信層,通信層是溝通數(shù)據(jù)中心服務(wù)器平臺(tái)和基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)的橋梁,基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)通過通信層獲取數(shù)據(jù)中心服務(wù)器平臺(tái)監(jiān)控?cái)?shù)據(jù),同時(shí)通過通信層發(fā)送控制指令,控制數(shù)據(jù)中心服務(wù)器平臺(tái)各個(gè)服務(wù)器的功耗。3)硬件組件層,硬件組件層是本發(fā)明所針對(duì)的對(duì)象,硬件組件層提供監(jiān)控接口和控制接口以供本發(fā)明監(jiān)控?cái)?shù)據(jù)和發(fā)出指令。
[0019]如圖1所示,本發(fā)明所包含的步驟為:1)設(shè)定數(shù)據(jù)中心服務(wù)器的電源和功耗的策略;2)控制數(shù)據(jù)中心運(yùn)行,使其處于最佳的運(yùn)行狀態(tài);3)電源模塊監(jiān)控,通過數(shù)據(jù)中心服務(wù)器的主板電源接口監(jiān)控電源情況;4)對(duì)第3)步中所獲取的數(shù)據(jù)進(jìn)行智能分析計(jì)算;5)將分析結(jié)果反饋策略引擎,策略引擎做出判斷并通過裝置控制器控制數(shù)據(jù)中心的處理器功耗。
[0020]如圖3所示,本發(fā)明基于策略的電源管理步驟為:1)配置策略引擎和步驟,運(yùn)維工程師首先配置策略引擎和初始化參數(shù)步驟;2)監(jiān)控裝置開始進(jìn)行實(shí)時(shí)監(jiān)控,采集數(shù)據(jù)中心各個(gè)服務(wù)器的電源和功耗數(shù)據(jù);3)計(jì)算數(shù)據(jù)中心服務(wù)器平臺(tái)每一個(gè)機(jī)柜中的電源和功耗消耗情況;4)優(yōu)化數(shù)據(jù)中心服務(wù)器機(jī)柜策略,使其在一個(gè)給定電源范圍和服務(wù)器工作負(fù)載;5)判定是否進(jìn)行新的策略設(shè)置,如果不需要?jiǎng)t跳過步驟6),否則執(zhí)行步驟6) ;6)設(shè)定新數(shù)據(jù)中心服務(wù)器平臺(tái)策略;7)檢測(cè)并更新策略;8)告警并通知,根據(jù)策略做出告警并通知運(yùn)維工程師做出相應(yīng)處理;9)處理告警,針對(duì)裝置的告警和通知做出相應(yīng)的處理和應(yīng)對(duì)。
[0021]如圖4所示,本發(fā)明的一個(gè)大型部署示例,具體情況如下:1)單機(jī)級(jí)別,數(shù)據(jù)中心服務(wù)器平臺(tái)的每個(gè)服務(wù)器可以部署一套本發(fā)明基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),一套發(fā)明基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng)針對(duì)一個(gè)服務(wù)器,單獨(dú)監(jiān)控和控制每一個(gè)服務(wù)器。2)組級(jí)別,一套本發(fā)明可以同時(shí)監(jiān)控和控制一組數(shù)據(jù)中心服務(wù)器平臺(tái),該組可以根據(jù)實(shí)際情況劃分,例如,按機(jī)架分組,按不同樓層分組,按不同功能分組等等。3)數(shù)據(jù)中心級(jí)別,針對(duì)大型數(shù)據(jù)中心,集成了單機(jī)級(jí)別和組級(jí)別,數(shù)據(jù)中心級(jí)別數(shù)據(jù)處理裝置收集單機(jī)級(jí)別和組級(jí)別采集到得數(shù)據(jù),并發(fā)出控制指令到達(dá)各個(gè)具體數(shù)據(jù)中心服務(wù)器控制其功耗主頻,使數(shù)據(jù)中心服務(wù)器處于最佳狀態(tài),由此使得本發(fā)明具有更廣的適用性和易拓展性。
【權(quán)利要求】
1.基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),其特征在于,該系統(tǒng)包含有策略數(shù)據(jù)庫、策略引擎、數(shù)據(jù)處理裝置、設(shè)備控制裝置、監(jiān)控裝置;策略數(shù)據(jù)庫、數(shù)據(jù)處理裝置、設(shè)備控制裝置均與策略引擎通訊連接,監(jiān)控裝置與數(shù)據(jù)處理裝置通訊連接,其中: 策略數(shù)據(jù)庫:用于設(shè)置并保存電源和功耗的策略; 策略引擎:用于根據(jù)策略數(shù)據(jù)庫中的預(yù)設(shè)策略調(diào)用數(shù)據(jù)處理裝置和設(shè)備控制裝置;數(shù)據(jù)處理裝置:用于保存監(jiān)控裝置采集到得數(shù)據(jù),并進(jìn)行策略計(jì)算和分析并將最終結(jié)果反饋給策略引擎; 設(shè)備控制裝置:用于根據(jù)策略引擎做出的判斷對(duì)數(shù)據(jù)中心各設(shè)備實(shí)施控制; 監(jiān)控裝置:用于對(duì)數(shù)據(jù)中心各設(shè)備實(shí)施監(jiān)控,并采集監(jiān)控所得原始數(shù)據(jù)報(bào)數(shù)據(jù)處理裝置。
2.根據(jù)權(quán)利要求1所述的基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),其特征在于:所述策略數(shù)據(jù)庫、策略引擎、數(shù)據(jù)處理裝置、設(shè)備控制裝置、監(jiān)控裝置均設(shè)置在一臺(tái)優(yōu)化服務(wù)器上實(shí)現(xiàn),有多套監(jiān)控裝置和設(shè)備控制裝置集成在其中。
3.根據(jù)權(quán)利要求1所述的基于電源功耗監(jiān)控的數(shù)據(jù)中心管控系統(tǒng),其特征在于:所述策略數(shù)據(jù)庫、策略引擎、數(shù)據(jù)處理裝置、設(shè)備控制裝置、監(jiān)控裝置按照數(shù)據(jù)中心級(jí)別多層級(jí)設(shè)置。
【文檔編號(hào)】G05B19/418GK103853107SQ201210496551
【公開日】2014年6月11日 申請(qǐng)日期:2012年11月29日 優(yōu)先權(quán)日:2012年11月29日
【發(fā)明者】王建軍 申請(qǐng)人:成都勤智數(shù)碼科技股份有限公司