專利名稱:一種大規(guī)模集群中服務(wù)器分時上電的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機(jī)領(lǐng)域,具體涉及一種集群中服務(wù)器管理的技術(shù),尤其涉及一 種服務(wù)器分時上電的方法。
背景技術(shù):
隨著集群應(yīng)用的推廣,集群的管理越來越重要,對服務(wù)器電源的管理尤其重要, 它不但關(guān)系到服務(wù)器能否正常運(yùn)行,嚴(yán)重時還會損壞服務(wù)器,造成安全隱患。月艮
務(wù)器在開機(jī)的瞬間會產(chǎn)生很大的浪涌電流,通常為服務(wù)器額定電流的2、 3倍,雖 然該電流的持續(xù)時間極短,但是如果多臺服務(wù)器在同一時刻同時啟動,則會產(chǎn)生 巨大的電流,容易造成服務(wù)器元器件的損壞,甚至燒毀供電設(shè)備。服務(wù)器的使用 壽命也會因此受到影響。目前電源防止大的浪涌電流的技術(shù)已經(jīng)比較成熟,在電 源的設(shè)計里面有很多電路是防止浪涌電流的,而且智能的PDU提供遠(yuǎn)程的對用電 情況的管理和監(jiān)控,但是它成本高,造價較大。目前在集群中大部分的使用的仍 然是普通的PDU,在不改變現(xiàn)有硬件設(shè)備的情況下,如果能提供一種純軟件方式的 方法,對服務(wù)器實現(xiàn)智能的分時上電管理,將能節(jié)約投資成本,提高集群的管理 水平,增加服務(wù)器的使用壽命。而且軟件的方法在定制化方面更加靈活,能在界 面,服務(wù)器節(jié)點(diǎn)排序,定制分時時間,分時策略方面能滿足管理員的特殊需求。
發(fā)明內(nèi)容
本發(fā)明的一種大規(guī)模集群中服務(wù)器分時上電的方法是按以下方式實現(xiàn)的。
該方法通過在控制端對集群中需要管理的服務(wù)器設(shè)置電源的總功率、每種型號 服務(wù)器的額定功率、以及服務(wù)器啟動時間,啟動間隔時間。利用智能的調(diào)度策略, 在恰當(dāng)?shù)臅r間向各服務(wù)器發(fā)出網(wǎng)絡(luò)啟動的命令,實現(xiàn)服務(wù)器的分時上電。
其中智能的調(diào)度策略,會自動對所要啟動的服務(wù)器進(jìn)行分組,然后發(fā)送啟動命 令。假設(shè)要上電的服務(wù)器數(shù)量是N, N大于l,此調(diào)度策略利用電源額定總功率W1 減去正在運(yùn)行服務(wù)器的額定功率之和EW,計算出能夠提供的額定輸出功率W2,然 后除以經(jīng)驗值3,把得到的結(jié)果W3作為額定功率,看能夠滿足幾臺服務(wù)器的運(yùn)行, 假設(shè)能夠滿足M臺服務(wù)器的運(yùn)行,然后在控制端發(fā)送M臺機(jī)器的啟動命令,這M 個啟動命令默認(rèn)間隔時間是30毫秒,然后按照設(shè)定的時間間隔再發(fā)送M臺機(jī)器的 啟動命令,直到N臺服務(wù)器的啟動指令都發(fā)送完畢。
本發(fā)明的方法要求能夠支持網(wǎng)絡(luò)啟動的服務(wù)器,其網(wǎng)卡和主板都要支持網(wǎng)絡(luò)啟 動,目前大部分的網(wǎng)卡和主板都支持。網(wǎng)絡(luò)啟動時需要服務(wù)器的網(wǎng)卡的MAC地址。該發(fā)明中需要網(wǎng)絡(luò)啟動的服務(wù)器的MAC地址是通過ARP解析自動獲取的。在控 制端已知所有被管理服務(wù)器的IP地址,通過arp解析命令獲得所有被管理服務(wù)器 的MAC地址保存到數(shù)據(jù)庫,供其他程序使用。
本發(fā)明通過智能的調(diào)度策略在控制端對需要啟動的服務(wù)器實現(xiàn)自動分時上電, 本發(fā)明的有益效果是能節(jié)約硬件投資成本,提高集群的管理水平,增加服務(wù)器 的使用壽命,而且基于控制端的管理方式能方便管理員的遠(yuǎn)程管理。這種方法適 用范圍廣,無論硬件方面采用何種電源管理方式,采用此方法都能簡單靈活的實 現(xiàn)服務(wù)器的分時上電。
具體實施例方式
為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清晰,對本發(fā)明作以下詳細(xì)說明。
此實施實例是浪潮的天梭管理監(jiān)控軟件,在實施實例中采用jsp和java語言 實現(xiàn),jsp實現(xiàn)界面顯示部分,java實現(xiàn)具體功能部分。
用jsp編寫機(jī)柜管理頁面,如
圖1所示,在機(jī)柜管理中可以査看現(xiàn)有機(jī)柜詳細(xì) 信息,新建機(jī)柜和刪除機(jī)柜。例如圖1的機(jī)柜管理界面中,可以查看到機(jī)柜 "cabinetl" 、 "cabinet2"的電源能夠支持的總額定功率。這個總額定功率在"新 建機(jī)柜"時輸入,記作W1,由后臺java程序保存到數(shù)據(jù)庫中,供其他程序使用。
由于每個服務(wù)器在集群中可以看作一個節(jié)點(diǎn),所以服務(wù)器的基本信息,可以稱 為節(jié)點(diǎn)的基本信息。用jsp編寫的節(jié)點(diǎn)管理頁面如圖2所示。在節(jié)點(diǎn)管理中,可 以參看、修改節(jié)點(diǎn)的基本信息,對節(jié)點(diǎn)進(jìn)行IP配置等。在圖2中,選中節(jié)點(diǎn) "nodell",出現(xiàn)節(jié)點(diǎn)nodell的管理頁面,在節(jié)點(diǎn)nodell的基本信息中可以查看 到節(jié)點(diǎn)nodell的"機(jī)器類型"和"額定功率",在"節(jié)點(diǎn)nodell的IP配置"中 可以査看nodell的現(xiàn)有IP地址和MAC,同樣可以添加其他的網(wǎng)絡(luò)接口或者IP等 操作。其中額定功率記作W+節(jié)點(diǎn)名,例如Wnodell。這些信息是在"新建節(jié)點(diǎn)" 時輸入的,然后由后臺java程序保存到數(shù)據(jù)庫中,現(xiàn)有MAC地址是通過在控制端 對IP的ARP解析獲得的,保存到后臺數(shù)據(jù)庫,供其他程序使用。同樣可以査看 nodel2、 nodel3等其他節(jié)點(diǎn)的信息。
用jsp編寫的服務(wù)器啟動/關(guān)閉管理界面如例圖3所示。在該頁面中能夠?qū)崿F(xiàn) 單臺/多臺服務(wù)器的啟動關(guān)閉,其中包括多臺服務(wù)器的分時上電的功能。首先選擇 需要啟動的服務(wù)器節(jié)點(diǎn),在左側(cè)樹圖中關(guān)閉狀態(tài)的節(jié)點(diǎn)均顯示成X,選中要啟動的 "nodel2"、 "nodel3"、 "nodel4"、 "nodel6";其次設(shè)定啟動間隔時間,在例圖3 中選定"設(shè)定啟動間隔時間",輸入1,代表1S,其最小單位是0. 1S;最后是nodel2、 nodel3、 nodel4、 nodel6的啟動,在例圖3中,點(diǎn)擊"啟動",交給后臺java程 序,實現(xiàn)nodel2、 nodel3、 nodel4、 nodel6的分時上電。后臺java程序按照智 能調(diào)度策略的算法,首先獲得機(jī)柜cabinetl的總額定功率W1,在此實施例中Wl=8000w,然后獲得正在運(yùn)行服務(wù)器的額定功率之和EW,此實施例中正在運(yùn)行的 服務(wù)器是nodell,其額定功率是480w,因此I]W:480w,因此機(jī)柜還能提供的額定 輸出功率W2H-EW=8000w-480w=7520w, W2除以經(jīng)驗值3,得到W3=2506w,判斷 W3能否滿足node12、 nodel3、 nodel4、 nodel6啟動需要的額定功率。因為此實施 例中機(jī)器類型都是NF190D,單臺服務(wù)器的額定功率都是480w, W3能夠支持5臺 NF190D的同時啟動。因此,W3顯然能夠滿足node12、 nodel3、 nodel4、 nodel6 啟動需要的額定功率,后臺程序依次對node12、 nodel3、 nodel4、 nodel6發(fā)送網(wǎng) 絡(luò)啟動的命令,這些命令默認(rèn)間隔30ms發(fā)送。假設(shè)在左側(cè)樹圖中,選中要啟動的 節(jié)點(diǎn)是"nodel2"至"nodel7";那么上述情況則有所不同。W3仍然不變,但是 nodel2至nodel7是6個節(jié)點(diǎn),啟動需要的額定功率是2880w, W3只能滿足5個節(jié) 點(diǎn),因此網(wǎng)絡(luò)啟動命令將分為2組發(fā)送,第一組是nodel2至node16,共5個節(jié)點(diǎn), 依次間隔30ms發(fā)送,費(fèi)時120ms,然后間隔1S后,發(fā)送第二組nodel7的網(wǎng)絡(luò)啟 動命令。命令發(fā)送成功后,頁面上會顯示啟動命令發(fā)送成功的提示,當(dāng)各節(jié)點(diǎn)啟 動后,其狀態(tài)由紅色X自動更新到如nodell的狀態(tài)。
由本發(fā)明的技術(shù)方案可見,本發(fā)明不但對服務(wù)器實現(xiàn)了智能的分時上電管理, 能節(jié)約投資成本,提高集群的管理水平,增加服務(wù)器的使用壽命。而且能在用戶
權(quán)利要求
1、一種大規(guī)模集群中服務(wù)器分時上電的方法,其特征在于該方法是通過在控制端對集群中需要管理的服務(wù)器設(shè)置電源總功率、額定功率、啟動間隔時間參數(shù),利用智能調(diào)度策略,適時向各服務(wù)器發(fā)出網(wǎng)絡(luò)啟動命令,實現(xiàn)服務(wù)器的分時啟動;步驟如下
2、 根據(jù)權(quán)利要求1所描述的方法,其特征在于,根據(jù)集群中各種型號服務(wù)器 的額定功率以及啟動間隔時間累計設(shè)定電源的總功率,其中啟動間隔時間包括自定義或按照默認(rèn)的間隔時間執(zhí)行。
3、 根據(jù)權(quán)利要求1所描述的方法,其特征在于,智能調(diào)度策略是:設(shè)定上電的 服務(wù)器數(shù)量是N, N大于l,電源額定總功率W1減去正在運(yùn)行服務(wù)器的額定功率之 和i:W,計算出能夠提供的額定輸出功率W2,然后除以經(jīng)驗值3,把得到的結(jié)果W3 作為額定功率,額定功率能夠滿足M臺服務(wù)器的運(yùn)行,然后在控制端發(fā)送M臺機(jī) 器的啟動命令,這M個啟動命令默認(rèn)間隔時間是30毫秒,然后按照設(shè)定的時間間 隔再發(fā)送相同數(shù)量的M臺服務(wù)器的啟動命令,直到N臺服務(wù)器的啟動指令都發(fā)送 完畢。
4、 根據(jù)權(quán)利要求1所描述的方法,其特征在于,使用該方法的服務(wù)器都支持 網(wǎng)絡(luò)啟動,控制端發(fā)送的啟動命令的目標(biāo)是與控制端相連的服務(wù)器網(wǎng)卡的MAC地 址。
全文摘要
本發(fā)明提供了一種適應(yīng)大規(guī)模集群中服務(wù)器分時上電的方法,這種方法是一種純軟件方式的方法,有別于軟硬結(jié)合的電源管理的方法。該方法通過在控制端對集群中需要管理的服務(wù)器設(shè)置電源總功率、額定功率、啟動間隔時間等參數(shù),利用智能的調(diào)度策略,在恰當(dāng)?shù)臅r間向各服務(wù)器發(fā)出網(wǎng)絡(luò)啟動的命令,實現(xiàn)服務(wù)器的分時啟動。通過該方法在集群管理中,對服務(wù)器進(jìn)行分時上電,避免服務(wù)器同時開機(jī)出現(xiàn)的浪涌,使電源能力不足,同時降低功耗、節(jié)約能源。該方法實現(xiàn)簡單,成本低。
文檔編號H04L12/10GK101599840SQ20091001680
公開日2009年12月9日 申請日期2009年7月7日 優(yōu)先權(quán)日2009年7月7日
發(fā)明者剛 李, 邸雙朋, 健 魏 申請人:浪潮電子信息產(chǎn)業(yè)股份有限公司