專(zhuān)利名稱(chēng):一種管理刀片式服務(wù)器的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)服務(wù)器管理領(lǐng)域,尤其涉及一種管理刀片式服務(wù)器的方 法及系統(tǒng)。
技術(shù)背景刀片式服務(wù)器是一種更高可用高密度機(jī)架結(jié)構(gòu)的服務(wù)器平臺(tái),其中每一塊 服務(wù)器刀片實(shí)際上就是一塊系統(tǒng)主板,類(lèi)似一臺(tái)臺(tái)可獨(dú)立工作的服務(wù)器,在這 種模式下,每一個(gè)主板可以通過(guò)本地硬盤(pán)啟動(dòng)自己的操作系統(tǒng),服務(wù)于指定的 不同用戶群,相互之間沒(méi)有關(guān)聯(lián)。而另一方面,刀片式服務(wù)器也可以用系統(tǒng)軟 件集合成一個(gè)服務(wù)器集群,在集群模式下,所有的主板都可連接起來(lái)提供高速 的網(wǎng)絡(luò)環(huán)境,并共享資源,為相同的用戶群提供服務(wù),同時(shí)由于每塊服務(wù)器刀 片都支持熱插拔,所以系統(tǒng)可以輕松地進(jìn)行替換。這些服務(wù)器可共用系統(tǒng)背板、 冗余電源、冗余風(fēng)扇、網(wǎng)絡(luò)端口、光驅(qū)、軟驅(qū)、鍵盤(pán)、顯示器和鼠標(biāo), 一個(gè)機(jī) 箱對(duì)外就是一臺(tái)服務(wù)器,而且多個(gè)服務(wù)器刀片機(jī)箱還可以級(jí)聯(lián),形成更大的集 群系統(tǒng)。目前,刀片式服務(wù)器大多都是模塊化的結(jié)構(gòu),圖l為現(xiàn)有技術(shù)中刀片式服務(wù)器內(nèi)部模塊示意圖,圖中包括服務(wù)器刀片101、管理模塊(MM, Management Module) 102、交換模塊103、風(fēng)扇模塊104和電源模塊105。其中,管理模 塊102用于管理整臺(tái)刀片式服務(wù)器,包括對(duì)內(nèi)部服務(wù)器刀片中的數(shù)據(jù)進(jìn)行監(jiān) 控,實(shí)現(xiàn)鍵盤(pán)、顯示器、鼠標(biāo)(KVM, Keyboard Video Module)管理以及對(duì) 交換模塊103的管理。交換模塊103用于使刀片式服務(wù)器與外部網(wǎng)絡(luò)建立連接。 風(fēng)扇模塊104用于刀片式服務(wù)器的散熱。電源模塊105為刀片式服務(wù)器提供電 源。對(duì)于管理一臺(tái)或者幾臺(tái)刀片式服務(wù)器,可以通過(guò)刀片式服務(wù)器自帶的管理 模塊的網(wǎng)絡(luò)管理接口進(jìn)行管理。但是,在高性能計(jì)算、數(shù)據(jù)管理中心、電信等 應(yīng)用中,用戶往往需要多臺(tái)刀片式服務(wù)器,并將這些刀片式服務(wù)器放置在一個(gè)或者多個(gè)機(jī)拒中,組成服務(wù)器機(jī)群。因此,如何對(duì)這些刀片式服務(wù)器的進(jìn)行管 理,成為用戶必須解決的首要問(wèn)題。現(xiàn)有的刀片式服務(wù)器管理方案是采用以太網(wǎng)(Ethernet)網(wǎng)絡(luò),通過(guò)刀片 式服務(wù)器管理模塊上的以太網(wǎng)接口 ,將所有的刀片式服務(wù)器的網(wǎng)絡(luò)管理接口連 接到網(wǎng)絡(luò)交換機(jī)上,再通過(guò)一臺(tái)管理服務(wù)器對(duì)這些刀片式服務(wù)器進(jìn)行管理。具 體參見(jiàn)圖2所示,圖2為現(xiàn)有技術(shù)中刀片式服務(wù)器管理結(jié)構(gòu)圖,包括管理服務(wù) 器201、網(wǎng)絡(luò)交換機(jī)202、第一機(jī)拒203、第二機(jī)根204,第一機(jī)拒203包括第 一刀片式服務(wù)器2031、第二刀片式服務(wù)器2032、第三刀片式服務(wù)器2033,第 二機(jī)拒204包括第一刀片式服務(wù)器2041、第二刀片式服務(wù)器2042、第三刀片 式服務(wù)器2043,在第一機(jī)拒203中,第一刀片式服務(wù)器2031包括第一管理模 塊20311和第二管理模塊20312,第二刀片式服務(wù)器2032包括第一管理模塊 20321和第二管理模塊20322,第三刀片式服務(wù)器2033包括第一管理模塊 20331和第二管理模塊20332。在第二機(jī)拒204中,第一刀片式服務(wù)器2041 包括第一管理模塊20411和第二管理模塊20412,第二刀片式服務(wù)器2042包 括第一管理模塊20421和第二管理模塊20422,第三刀片式服務(wù)器2043包括 第一管理模塊20431和第二管理模塊20432。另外,在每臺(tái)刀片式服務(wù)器的管理模塊中設(shè)有KVM管理接口,多臺(tái)刀片 式服務(wù)器通過(guò)各自的KVM管理接口實(shí)現(xiàn)KVM管理。對(duì)于有些刀片式服務(wù)器, 其KVM管理接口和網(wǎng)絡(luò)管理接口共用一個(gè)以太網(wǎng)接口,用于實(shí)現(xiàn)基于網(wǎng)絡(luò)的 KVM管理。現(xiàn)有的刀片式服務(wù)器管理方案在管理大量的刀片式服務(wù)器時(shí),存在以下缺點(diǎn)連線多,每臺(tái)刀片式服務(wù)器都要通過(guò)網(wǎng)線連接到交換機(jī),如管理128臺(tái)刀 片式服務(wù)器就需要256條網(wǎng)線,大量的網(wǎng)線造成在機(jī)房?jī)?nèi)布線的難度增加,出 現(xiàn)線^4丈障時(shí),難以進(jìn)行故障的查找和排除。需要多臺(tái)網(wǎng)絡(luò)交換機(jī),增加了管理設(shè)備成本,當(dāng)管理的刀片式服務(wù)器數(shù)量 很多時(shí),就需要配置更多的交換機(jī),如管理128臺(tái)刀片式服務(wù)器,需要使用8 臺(tái)32 口的交換機(jī)。需要單獨(dú)的管理服務(wù)器,通過(guò)配置單獨(dú)的管理服務(wù)器和管理軟件對(duì)每臺(tái)刀片式服務(wù)器進(jìn)行管理,監(jiān)控刀片式服務(wù)器的狀態(tài)和KVM的管理;管理服務(wù)器需要配置的每臺(tái)刀片式服務(wù)器的網(wǎng)際協(xié)議(IP)地址,對(duì)于基 于以太網(wǎng)的刀片式服務(wù)器管理,需要在管理服務(wù)器上配置每臺(tái)刀片式服務(wù)器管 理模塊的IP地址,然后通過(guò)相應(yīng)的管理軟件輪詢(xún)這些管理模塊來(lái)監(jiān)控每臺(tái)刀 片式服務(wù)器的狀態(tài)。 發(fā)明內(nèi)容有鑒于此,本發(fā)明的目的在于提供一種管理刀片式服務(wù)器的方法及系統(tǒng), 該方法及系統(tǒng)為用戶提供了一套布線簡(jiǎn)潔、設(shè)備成本投入少、單一IP管理的 具有高可靠性的刀片式服務(wù)器管理解決方案。本發(fā)明提供了一種管理刀片式服務(wù)器的系統(tǒng),包括多臺(tái)刀片式服務(wù)器,每' 臺(tái)刀片式服務(wù)器包括至少兩個(gè)管理模塊,其特征在于,該系統(tǒng)進(jìn)一步包括用戶 管理器和集中管理器,集中管理器進(jìn)一步包括通信模塊,通信模塊包括至少兩對(duì)端口 ;用戶管理器與集中管理器連接,集中管理器中的通信模塊的每對(duì)端口中的 第一端口順序連接每臺(tái)刀片式服務(wù)器中的一個(gè)管理模塊后連接至該對(duì)端口的第二端口;用戶管理器發(fā)出控制命令,集中管理器中的通信模塊接收該控制命令,通 信模塊將該控制命令轉(zhuǎn)發(fā)給刀片式服務(wù)器并獲取刀片式服務(wù)器的信息,對(duì)刀片 式服務(wù)器進(jìn)行管理。該系統(tǒng)進(jìn)一步包括網(wǎng)絡(luò)控制模塊,該網(wǎng)絡(luò)控制模塊位于用戶管理器和集中 管理器之間,用于接收一個(gè)或一個(gè)以上用戶管理器發(fā)出的控制命令,并將控制 命令轉(zhuǎn)發(fā)給集中管理器。該系統(tǒng)所述集中管理器進(jìn)一步包括存儲(chǔ)器,該存儲(chǔ)器用于存儲(chǔ)刀片式服務(wù) 器的信息和數(shù)據(jù)。該系統(tǒng)所述集中管理器進(jìn)一步包括網(wǎng)絡(luò)模塊,用于對(duì)刀片式服務(wù)器進(jìn)行基 于網(wǎng)際協(xié)議IP的鍵盤(pán)、顯示器、鼠標(biāo)KVM管理和嵌入式網(wǎng)頁(yè)Web頁(yè)面管理。該系統(tǒng)所述集中管理器進(jìn)一步包括KVM處理模塊,用于對(duì)刀片式服務(wù)器 進(jìn)行KVM管理。該系統(tǒng)所述集中管理器進(jìn)一步包括微處理器,用于控制存儲(chǔ)器、網(wǎng)絡(luò)才莫塊、KVM處理模塊和通信模塊。本發(fā)明還提供了 一種管理刀片式服務(wù)器的方法,包括以下步驟a) 建立管理閉環(huán)鏈路;b) 檢測(cè)和設(shè)置管理閉環(huán)鏈路上刀片式服務(wù)器的管理^t塊的身份ID地址;c) 采用輪詢(xún)機(jī)制獲取管理閉環(huán)《連路上刀片式服務(wù)器的監(jiān)控狀態(tài)信息;d) 判斷是否接收到用戶發(fā)出的控制命令,如果是,執(zhí)行控制命令,將執(zhí)行 結(jié)果返回給用戶;否則,返回步驟b)。該方法步驟a)所述管理閉環(huán)鏈路包括集中管理器和多臺(tái)刀片式服務(wù)器,在 集中管理器中設(shè)置至少兩對(duì)端口 ,在每臺(tái)刀片式服務(wù)器中設(shè)置至少兩個(gè)管理模 塊;每路信號(hào)依次經(jīng)過(guò)集中管理器其中一對(duì)端口中的第一端口、每臺(tái)刀片式服 務(wù)器的一個(gè)管理模塊后,到達(dá)該對(duì)端口的第二端口 ,形成所述的管理閉環(huán)鏈路;該方法步驟c)所述輪詢(xún)機(jī)制為集中管理器從其中 一對(duì)端口中的第 一端口 發(fā)出查詢(xún)命令,4企測(cè)該對(duì)端口的第二端口是否收到該查詢(xún)命令,如果是,確定 該管理閉環(huán)鏈路連接完好,集中管理器從該對(duì)端口的第一端口或第二端口發(fā)出 輪詢(xún)命令,對(duì)該管理閉環(huán)鏈路中的刀片式服務(wù)器進(jìn)行輪詢(xún)?cè)L問(wèn),該管理閉環(huán)鏈 路中的刀片式服務(wù)器對(duì)輪詢(xún)命令發(fā)出響應(yīng),集中管理器存儲(chǔ)輪詢(xún)?cè)L問(wèn)獲得的刀 片式服務(wù)器監(jiān)控狀態(tài)信息;否則,確定該管理閉環(huán)鏈路為開(kāi)路,集中管理器從 該對(duì)端口的第一端口或第二端口發(fā)出輪詢(xún)命令,對(duì)已處于開(kāi)路狀態(tài)的管理閉環(huán) 鏈路中的刀片式服務(wù)器進(jìn)行輪詢(xún)?cè)L問(wèn),查詢(xún)處于開(kāi)路狀態(tài)的管理閉環(huán)鏈路中的 刀片式服務(wù)器是否對(duì)輪詢(xún)命令發(fā)出響應(yīng),如果是,集中管理器存儲(chǔ)輪詢(xún)?cè)L問(wèn)獲得的刀片式服務(wù)器監(jiān)控狀態(tài)信息;否則,啟用另一對(duì)端口所在的管理閉環(huán)鏈路, 后續(xù)操作與該管理閉環(huán)鏈路上的操作相同。該方法中集中管理器可同時(shí)對(duì)多個(gè)管理閉環(huán)鏈路上的刀片式服務(wù)器進(jìn)行 專(zhuān)侖詢(xún)?cè)L問(wèn)。該方法步驟b)和步驟c)之間進(jìn)一步包括檢測(cè)刀片式服務(wù)器的在線狀態(tài), 當(dāng)檢測(cè)到管理閉環(huán)鏈路中添加了刀片式服務(wù)器或者刪除了刀片式服務(wù)器時(shí),將 返回步驟b),重新設(shè)置整個(gè)閉環(huán)鏈路中每臺(tái)刀片式服務(wù)器中管理模塊的ID地 址。該方法所述管理閉環(huán)鏈路中的集中管理器與刀片式服務(wù)器的通信方式為基于RS-485串口協(xié)議的通信方式或者基于控制器局域網(wǎng)絡(luò)CAN總線協(xié)議的 通信方式。本發(fā)明所述的管理刀片式服務(wù)器的方法,通過(guò)建立多個(gè)管理閉環(huán)鏈路,實(shí) 現(xiàn)對(duì)刀片式服務(wù)器的冗余管理,解決了因管理閉環(huán)鏈路上某臺(tái)刀片式服務(wù)器出 現(xiàn)故障造成無(wú)法對(duì)其它刀片式服務(wù)器進(jìn)行管理的缺陷,進(jìn)而大大提高了刀片式 服務(wù)器管理的可靠性。本發(fā)明所述的管理刀片式服務(wù)器的系統(tǒng),系統(tǒng)內(nèi)部連線簡(jiǎn)單,采用集中管 理器管理所有的刀片式服務(wù)器,集中管理器支持嵌入式Web頁(yè)面管理,只需 為集中管理器分配一個(gè)IP地址,就可實(shí)現(xiàn)對(duì)刀片式服務(wù)器的遠(yuǎn)程管理。
圖1為現(xiàn)有技術(shù)中刀片式服務(wù)器內(nèi)部模塊示意圖; 圖2為現(xiàn)有技術(shù)中實(shí)現(xiàn)刀片式服務(wù)器管理的系統(tǒng)結(jié)構(gòu)圖; 圖3為本發(fā)明中實(shí)現(xiàn)刀片式服務(wù)器管理的系統(tǒng)結(jié)構(gòu)圖; 圖4為本發(fā)明中集中管理器硬件結(jié)構(gòu)圖; 圖5為本發(fā)明中集中管理器實(shí)現(xiàn)刀片式服務(wù)器管理的流程圖; 圖6為本發(fā)明中集中管理器輪詢(xún)?cè)L問(wèn)刀片式服務(wù)器的流程圖。
具體實(shí)施方式
下面結(jié)合附圖來(lái)說(shuō)明本發(fā)明的具體實(shí)施方式
。本發(fā)明中實(shí)現(xiàn)刀片式服務(wù)器管理的系統(tǒng)結(jié)構(gòu)圖參見(jiàn)圖3所示,圖中包括用 戶管理器301,網(wǎng)絡(luò)控制模塊302,集中管理器303,機(jī)柜304,機(jī)柜305。機(jī) 柜304包括第一刀片式服務(wù)器3041,第二刀片式服務(wù)器3042,第三刀片式服 務(wù)器3043。在機(jī)拒304中,第一刀片式服務(wù)器3041包括第一管理模塊30411, 第二管理模塊30412;第二刀片式服務(wù)器3042包括第一管理模塊30421 ,第二 管理模塊30422;第三刀片式服務(wù)器3043包括第一管理模塊3(H31,第二管理 模塊30432。機(jī)拒305包括第一刀片式服務(wù)器3051,第二刀片式服務(wù)器3052, 第三刀片式服務(wù)器3053。在機(jī)拒305中,第一刀片式服務(wù)器3051包括第一管 理模塊30511,第二管理模塊30512;第二刀片式服務(wù)器3052包括第一管理模 塊30521,第二管理模塊30522;第三刀片式服務(wù)器3043包括第一管理模塊 30531,第二管理模塊30532。用戶管理器301用于發(fā)出控制命令,如需要對(duì)刀片式服務(wù)器進(jìn)行KVM管理器301與現(xiàn)有技術(shù)中的管理服務(wù)器區(qū)別在于,現(xiàn)有技術(shù)中的管理服務(wù)器由于 需要直接對(duì)與其連接的多臺(tái)刀片式服務(wù)器進(jìn)行管理,因此必須具備非常強(qiáng)大的 硬件資源和處理運(yùn)行能力,而本發(fā)明中的用戶管理器301可以是一臺(tái)普通的計(jì) 算機(jī)。網(wǎng)絡(luò)控制才莫塊302用于接收用戶管理器301發(fā)出的控制命令,并以基于以 太網(wǎng)的通訊方式將控制命令轉(zhuǎn)發(fā)給集中管理器303。包括對(duì)刀片式服務(wù)器進(jìn)行KVM管理和實(shí)時(shí)監(jiān)控管理,以及根據(jù)用戶管理器 301發(fā)出的控制命令對(duì)刀片式服務(wù)器的管理。機(jī)拒304和機(jī)拒305中的每臺(tái)刀片式服務(wù)器中的兩個(gè)管理模塊,都負(fù)責(zé)各 自所屬的刀片式服務(wù)器中的服務(wù)器刀片的管理,在功能實(shí)現(xiàn)上完全相同,只不 過(guò),在實(shí)際應(yīng)用過(guò)程中,用戶可以選擇兩個(gè)管理模塊中的一個(gè)作為主管理模塊, 另一個(gè)作為從管理模塊,當(dāng)主管理模塊出現(xiàn)故障不能正常工作時(shí),從管理模塊 自動(dòng)代替主管理模塊執(zhí)行工作,從而實(shí)現(xiàn)兩個(gè)管理才莫塊間的冗余。另外,管理 模塊中分別設(shè)有兩個(gè)可以支持菊花鏈連接的網(wǎng)絡(luò)接口, 一般采用RJ45接口, 通過(guò)該網(wǎng)絡(luò)接口實(shí)現(xiàn)刀片式服務(wù)器之間、刀片式服務(wù)器與集中管理器之間的連 接。圖3為本發(fā)明中實(shí)現(xiàn)刀片式服務(wù)器管理的系統(tǒng)結(jié)構(gòu)圖,圖3中,用戶管理 器301依次與網(wǎng)絡(luò)控制模塊302、集中管理器303順序連接,集中管理器303 與機(jī)柜304、 305的連接包括兩條閉環(huán)鏈路,閉環(huán)鏈路AB和閉環(huán)鏈路CD。閉環(huán)鏈路AB為從集中管理器303的端口 A經(jīng)過(guò)機(jī)拒304、 305中的每臺(tái) 刀片式服務(wù)器后到達(dá)集中管理器303的端口 B,具體包括,集中管理器303的 端口 A與機(jī)拒304中的第一刀片式服務(wù)器3041的第一管理模塊30411相連接; 在機(jī)拒304中,第一刀片式服務(wù)器3041的第一管理模塊30411通過(guò)網(wǎng)絡(luò)接口 與第二刀片式服務(wù)器3042的第一管理模塊30421相連接,第二刀片式服務(wù)器 3042的第一管理模塊30421通過(guò)網(wǎng)絡(luò)接口與第三刀片式服務(wù)器3043的第一管 理模塊30431相連接;機(jī)拒304中的第三刀片式服務(wù)器3043的第一管理才莫塊30"1通過(guò)網(wǎng)絡(luò)接口與機(jī)柜305中的第三刀片式服務(wù)器3053的第一管理模塊 30531相連接;在機(jī)拒305中,第三刀片式服務(wù)器3053的第一管理模塊30531 通過(guò)網(wǎng)絡(luò)接口與第二刀片式服務(wù)器3052的第一管理模塊30521相連接,第二 刀片式服務(wù)器3052的第一管理模塊30521通過(guò)網(wǎng)絡(luò)接口與第一刀片式服務(wù)器 鄧51的第一管理模塊30511相連接。第一刀片式服務(wù)器3051的第一管理模塊 30511與集中管理器303的端口 B相連接。閉環(huán)鏈路CD為從集中管理器303的端口 C經(jīng)過(guò)機(jī)拒304、 305中的每臺(tái) 刀片式服務(wù)器后到達(dá)集中管理器303的端口 D,具體包括,集中管理器303的 端口 C與機(jī)拒304中的第一刀片式服務(wù)器3041的第二管理模塊30412相連接; 在機(jī)拒304中,第一刀片式月良務(wù)器3041的第二管理模塊30412通過(guò)網(wǎng)絡(luò)接口' 與第二刀片式服務(wù)器3042的第二管理模塊30422相連接,第二刀片式服務(wù)器 3042的第二管理模塊30422通過(guò)網(wǎng)絡(luò)接口與第三刀片式服務(wù)器3043的第二管 理模塊30432相連接;機(jī)拒304中的第三刀片式服務(wù)器3043的第二管理模塊 30432通過(guò)網(wǎng)絡(luò)接口與機(jī)拒305中的第三刀片式服務(wù)器3053的第二管理模塊 30532相連接;在機(jī)柜305中,第三刀片式服務(wù)器3053的第二管理模塊30532 通過(guò)網(wǎng)絡(luò)接口與第二刀片式服務(wù)器3052的第二管理模塊30522相連接,第二 刀片式服務(wù)器3052的第二管理模塊30522通過(guò)網(wǎng)絡(luò)接口與第一刀片式服務(wù)器 3051的第二管理模塊30512相連接。第一刀片式服務(wù)器3051的第二管理模塊 30512與集中管理器303的端口 D相連接。在閉環(huán)鏈路AB中,連4妄了每臺(tái)服務(wù)器的第一管理模塊,而在閉環(huán)鏈路 CD中,連接了每臺(tái)服務(wù)器的第二管理模塊。由于刀片式服務(wù)器中的第一管理 模塊與第二管理模塊互為冗余,因此,閉環(huán)鏈路AB與閉環(huán)鏈路CD也互為冗 余,當(dāng)閉環(huán)鏈路AB出現(xiàn)故障不能正常工作時(shí),閉環(huán)鏈路CD將代替閉環(huán)鏈路 AB工作。另外,對(duì)于閉環(huán)鏈路AB和閉環(huán)鏈路CD,當(dāng)鏈路上因一處或多處 出現(xiàn)故障而使閉環(huán)鏈路變成了開(kāi)環(huán)鏈路時(shí),只要刀片服務(wù)器還處于集中管理器 端口 A、 B、 C和D中任意一個(gè)端口所連接的鏈路上,則集中管理器就可以通 過(guò)該端口實(shí)現(xiàn)對(duì)該刀片服務(wù)器的管理。閉環(huán)鏈路AB和閉環(huán)鏈路CD中所有連接線都采用5類(lèi)線纜(CAT5 ),該 線一共有4對(duì)雙絞線,其中3對(duì)雙絞線用于差分傳輸KVM信號(hào),另外l對(duì)用該通信傳輸?shù)男盘?hào)可以是基于RS-485串口協(xié)議或者控制器局域網(wǎng)絡(luò)(CAN, Controller Area Network)總線協(xié)議的信號(hào)。本發(fā)明優(yōu)先使用基于RS-485串口 協(xié)議的通信信號(hào),通過(guò)該信號(hào),實(shí)現(xiàn)集中管理器與刀片式服務(wù)器中的管理模塊 之間的通信,從而將獲取的刀片式服務(wù)器的監(jiān)控?cái)?shù)據(jù)存儲(chǔ)到集中管理器中。另 外,用戶可以通過(guò)集中管理器控制刀片式服務(wù)器中的管理模塊,進(jìn)而實(shí)現(xiàn)對(duì)每 臺(tái)刀片式服務(wù)器的管理。圖4為本發(fā)明中集中管理器的內(nèi)部硬件結(jié)構(gòu)圖,圖中包括微處理器401、 存儲(chǔ)器402、網(wǎng)絡(luò)模塊403、 KVM管理模塊404和通信模塊405。微處理器401作為集中管理器的核心,用于控制存儲(chǔ)器402 、網(wǎng)絡(luò)模塊403 、 KVM處理模塊404和通信模塊405 。存儲(chǔ)器402用于保存刀片式服務(wù)器的監(jiān)控狀態(tài)信息和數(shù)據(jù)。網(wǎng)絡(luò)模塊403用于對(duì)刀片式服務(wù)器進(jìn)行基于網(wǎng)際協(xié)議的KVM管理和嵌入 式Web頁(yè)面管理,遠(yuǎn)程用戶通過(guò)以太網(wǎng)訪問(wèn)集中管理器進(jìn)行刀片式服務(wù)器的 管理。由于集中管理器與用戶管理器之間采用以太網(wǎng)連接,而與服務(wù)器之間釆 用基于RS-485串口協(xié)議或CAN總線協(xié)議的連接,因此,用戶可以通過(guò)一個(gè) IP地址來(lái)管理所有閉環(huán)鏈路中的刀片式服務(wù)器,而不再需要為每一臺(tái)刀片式 服務(wù)器都配置一個(gè)IP地址。KVM處理模塊404用于實(shí)現(xiàn)對(duì)刀片式服務(wù)器的KVM管理。通信模塊405用于與刀片式服務(wù)器進(jìn)行通信,獲取刀片式服務(wù)器的信息和 轉(zhuǎn)發(fā)用戶的控制命令。圖5為本發(fā)明中集中管理器實(shí)現(xiàn)刀片式服務(wù)器管理的流程圖,集中管理器 上電,進(jìn)行初始化自動(dòng)檢測(cè),自動(dòng)檢測(cè)成功后,進(jìn)行刀片式服務(wù)器管理模塊的 ID地址檢測(cè)與設(shè)置,然后實(shí)時(shí)檢測(cè)刀片式服務(wù)器的在線狀態(tài),通過(guò)輪詢(xún)機(jī)制 獲取每臺(tái)刀片式服務(wù)器的監(jiān)控狀態(tài),并將監(jiān)控狀態(tài)信息保存在其內(nèi)部的存儲(chǔ)器 中,執(zhí)行用戶命令。具體實(shí)施步驟如下步驟501:集中管理器上電,進(jìn)行初始化自動(dòng)檢測(cè)。集中管理器檢測(cè)內(nèi)部各個(gè)模塊的狀態(tài)是否正常,以及閉環(huán)鏈路中各臺(tái)服務(wù)器的管理模塊是否正常工作。步驟502:集中管理器檢測(cè)和設(shè)置刀片式服務(wù)器管理模塊的身份(ID, identity)地址。每臺(tái)刀片式服務(wù)器的管理模塊都有一個(gè)可以設(shè)置和修改的ID地址,該ID 地址一般設(shè)為16位(bit),集中管理器和管理模塊之間的通信通過(guò)該ID地址 進(jìn)行識(shí)別,該ID地址可以通過(guò)集中管理器進(jìn)行設(shè)置和修改。集中管理器在初 始化時(shí)自動(dòng)檢測(cè)過(guò)程中,如果發(fā)現(xiàn)管理模塊的ID地址存在沖突,則對(duì)沖突的 地址進(jìn)行修改。另外,用戶可以根據(jù)刀片式服務(wù)器的位置重新確定管理模塊的 ID地址。步驟503:集中管理器實(shí)時(shí)檢測(cè)刀片式服務(wù)器的在線狀態(tài)。如果在管理閉環(huán)鏈路中添加了刀片式服務(wù)器或者刪除了刀片式服務(wù)器,集中管 理器將返回步驟502,重新設(shè)置整個(gè)閉環(huán)鏈路中每臺(tái)刀片式服務(wù)器中管理模塊 的ID地址。另外,在完成執(zhí)行用戶發(fā)出的控制命令后,集中管理器也需要重 新檢測(cè)刀片式服務(wù)器的在線狀態(tài)。步驟504:集中管理器通過(guò)輪詢(xún)機(jī)制獲取刀片式服務(wù)器的監(jiān)控狀態(tài)信息, 并將監(jiān)控狀態(tài)信息保存到集中管理器的存儲(chǔ)器中。圖6為本發(fā)明中集中管理器輪詢(xún)?cè)L問(wèn)刀片式服務(wù)器的流程圖,步驟5041至步驟5042:集中管理器從端口 A發(fā)出查詢(xún)命令,檢測(cè)端口B 是否收到該查詢(xún)命令,如果是,則進(jìn)入步驟5043;否則,進(jìn)入步驟5044。步驟5043:確定閉環(huán)鏈路AB連接完好,集中管理器從端口 A或端口 B 發(fā)出輪詢(xún)命令,對(duì)閉環(huán)鏈路AB中的刀片式服務(wù)器進(jìn)行輪詢(xún)?cè)L問(wèn),進(jìn)入步驟 5045。步驟5044:確定閉環(huán)鏈路AB開(kāi)路,集中管理器從端口 A或端口 B發(fā)出 輪詢(xún)命令,對(duì)已處于開(kāi)路狀態(tài)的閉環(huán)鏈路AB中的刀片式服務(wù)器進(jìn)行輪詢(xún)?cè)L 問(wèn),進(jìn)入步驟5046。步驟5045:查詢(xún)閉環(huán)鏈路AB中的刀片式服務(wù)器是否對(duì)輪詢(xún)命令發(fā)出響 應(yīng),如果是,進(jìn)入步驟5047;否則,進(jìn)入步驟5048。步驟5046:查詢(xún)處于開(kāi)路狀態(tài)的閉環(huán)鏈路AB中的刀片式服務(wù)器是否對(duì)輪詢(xún)命令發(fā)出響應(yīng),如果是,進(jìn)入步驟5047;否則,進(jìn)入步驟5049。步驟5047:集中管理器存儲(chǔ)輪詢(xún)?cè)L問(wèn)獲得的刀片式服務(wù)器監(jiān)控狀態(tài)信息。 步驟5048:集中管理器確定閉環(huán)鏈路AB中的刀片式服務(wù)器發(fā)生故障。 步驟5049:啟用閉環(huán)鏈路CD。集中管理器從端口 C發(fā)送查詢(xún)命令,后續(xù)步驟與在閉環(huán)鏈路AB上的操作 步驟一致。上述集中管理器通過(guò)輪詢(xún)機(jī)制獲取每臺(tái)刀片式服務(wù)器的監(jiān)控狀態(tài)過(guò)程中, 對(duì)于閉環(huán)鏈路AB,集中管理器也可以從端口 B發(fā)出查詢(xún)命令,檢測(cè)端口 A是 否收到該查詢(xún)命令;對(duì)于閉環(huán)鏈路CD,集中管理器也可以從端口 D發(fā)出查詢(xún) 命令,檢測(cè)端口 C是否收到該查詢(xún)命令。另外,集中管理器可以同時(shí)對(duì)閉環(huán) 鏈路AB和閉環(huán)鏈路CD上的刀片式服務(wù)器進(jìn)行輪詢(xún)?cè)L問(wèn)。步驟505、 506:集中管理器判斷是否接收到用戶發(fā)出的控制命令,如果 是,則執(zhí)行該控制命令;否則,返回步驟502。集中管理器接收到用戶發(fā)出的控制命令,如用戶需要對(duì)刀片式服務(wù)器進(jìn)行 KVM管理,或者對(duì)刀片式服務(wù)器進(jìn)行開(kāi)機(jī)或關(guān)機(jī),此時(shí),將停止對(duì)刀片式服 務(wù)器的輪詢(xún)?cè)L問(wèn),執(zhí)行控制命令,并將命令執(zhí)行結(jié)果返回給用戶。在執(zhí)行控制 命令過(guò)程中,集中管理器將查詢(xún)其內(nèi)部存儲(chǔ)器存儲(chǔ)的刀片式服務(wù)器的狀態(tài)信 息。本發(fā)明具體實(shí)施例中描述了用戶通過(guò)集中管理器和刀片式服務(wù)器建立閉 環(huán)鏈路AB和閉環(huán)鏈路CD,實(shí)現(xiàn)對(duì)2臺(tái)機(jī)拒中的6臺(tái)刀片式服務(wù)器的管理, 當(dāng)然,用戶可以根據(jù)實(shí)際情況,在集中管理器上設(shè)置更多的端口,建立更多的 管理閉環(huán)鏈路,從而實(shí)現(xiàn)對(duì)更多刀片式服務(wù)器的管理。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā) 明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā) 明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1. 一種管理刀片式服務(wù)器的系統(tǒng),包括多臺(tái)刀片式服務(wù)器,每臺(tái)刀片式服務(wù)器包括至少兩個(gè)管理模塊,其特征在于,該系統(tǒng)進(jìn)一步包括用戶管理器和集中管理器,集中管理器進(jìn)一步包括通信模塊,通信模塊包括至少兩對(duì)端口;用戶管理器與集中管理器連接,集中管理器中的通信模塊的每對(duì)端口中的第一端口順序連接每臺(tái)刀片式服務(wù)器中的一個(gè)管理模塊后連接至該對(duì)端口的第二端口;用戶管理器發(fā)出控制命令,集中管理器中的通信模塊接收該控制命令,通信模塊將該控制命令轉(zhuǎn)發(fā)給刀片式服務(wù)器并獲取刀片式服務(wù)器的信息,對(duì)刀片式服務(wù)器進(jìn)行管理。
2. 根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,該系統(tǒng)進(jìn)一步包括網(wǎng)絡(luò)控 制模塊,該網(wǎng)絡(luò)控制模塊位于用戶管理器和集中管理器之間,用于接收一個(gè)或 一個(gè)以上用戶管理器發(fā)出的控制命令,并將控制命令轉(zhuǎn)發(fā)給集中管理器。
3. 根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于,所述集中管理器進(jìn)一步包 括存儲(chǔ)器,該存儲(chǔ)器用于存儲(chǔ)刀片式服務(wù)器的信息和數(shù)據(jù)。
4. 根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于,所述集中管理器進(jìn)一步包 括網(wǎng)絡(luò)模塊,用于對(duì)刀片式服務(wù)器進(jìn)行基于網(wǎng)際協(xié)議IP的鍵盤(pán)、顯示器、鼠 標(biāo)KVM管理和嵌入式網(wǎng)頁(yè)Web頁(yè)面管理。
5. 根據(jù)權(quán)利要求4所述的系統(tǒng),其特征在于,所述集中管理器進(jìn)一步包 括KVM處理模塊,用于對(duì)刀片式服務(wù)器進(jìn)行KVM管理。
6. 根據(jù)權(quán)利要求5任意一項(xiàng)所述的系統(tǒng),其特征在于,所述集中管理器 進(jìn)一步包括微處理器,用于控制存儲(chǔ)器、網(wǎng)絡(luò)模塊、KVM處理模塊和通信模 塊。
7. —種管理刀片式服務(wù)器的方法,其特征在于,包括以下步驟a) 建立管理閉環(huán)鏈路;b) 檢測(cè)和設(shè)置管理閉環(huán)鏈路上刀片式服務(wù)器的管理模塊的身份ID地址;c) 采用輪詢(xún)機(jī)制獲取管理閉環(huán)鏈路上刀片式服務(wù)器的監(jiān)控狀態(tài)信息;d) 判斷是否接收到用戶發(fā)出的控制命令,如果是,執(zhí)行控制命令,將執(zhí)行結(jié)果返回給用戶;否則,返回步驟b)。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,步驟a)所述管理閉環(huán)鏈路包括集中管理器和多臺(tái)刀片式服務(wù)器,在集中管 理器中設(shè)置至少兩對(duì)端口,在每臺(tái)刀片式服務(wù)器中設(shè)置至少兩個(gè)管理模塊;每 路信號(hào)依次經(jīng)過(guò)集中管理器其中一對(duì)端口中的第一端口、每臺(tái)刀片式服務(wù)器的 一個(gè)管理模塊后,到達(dá)該對(duì)端口的第二端口,形成所述的管理閉環(huán)鏈路;步驟c)所述輪詢(xún)機(jī)制為集中管理器從其中 一對(duì)端口中的第一端口發(fā)出查 詢(xún)命令,檢測(cè)該對(duì)端口的第二端口是否收到該查詢(xún)命令,如果是,確定該管理 閉環(huán)鏈路連接完好,集中管理器從該對(duì)端口的第 一端口或第二端口發(fā)出輪詢(xún)命 令,對(duì)該管理閉環(huán)鏈路中的刀片式服務(wù)器進(jìn)行輪詢(xún)?cè)L問(wèn),該管理閉環(huán)鏈路中的 刀片式服務(wù)器對(duì)輪詢(xún)命令發(fā)出響應(yīng),集中管理器存儲(chǔ)輪詢(xún)?cè)L問(wèn)獲得的刀片式服 務(wù)器監(jiān)控狀態(tài)信息;否則,確定該管理閉環(huán)鏈路為開(kāi)路,集中管理器從該對(duì)端 口的第一端口或第二端口發(fā)出輪詢(xún)命令,對(duì)已處于開(kāi)路狀態(tài)的管理閉環(huán)鏈路中 的刀片式服務(wù)器進(jìn)行輪詢(xún)?cè)L問(wèn),查詢(xún)處于開(kāi)路狀態(tài)的管理閉環(huán)鏈路中的刀片式 服務(wù)器是否對(duì)輪詢(xún)命令發(fā)出響應(yīng),如果是,集中管理器存儲(chǔ)輪詢(xún)?cè)L問(wèn)獲得的刀 片式服務(wù)器監(jiān)控狀態(tài)信息;否則,啟用另一對(duì)端口所在的管理閉環(huán)鏈路,后續(xù) 操作與該管理閉環(huán)鏈路上的操作相同。
9. 根據(jù)權(quán)利要求8所述的方法,其特征在于,該方法中集中管理器可同 時(shí)對(duì)多個(gè)管理閉環(huán)鏈路上的刀片式服務(wù)器進(jìn)行輪詢(xún)?cè)L問(wèn)。
10. 根據(jù)權(quán)利要求7所述的方法,其特征在于,步驟b)和步驟c)之間進(jìn)一 步包括檢測(cè)刀片式服務(wù)器的在線狀態(tài),當(dāng)檢測(cè)到管理閉環(huán)鏈路中添加了刀片 式服務(wù)器或者刪除了刀片式服務(wù)器時(shí),將返回步驟b),重新設(shè)置整個(gè)閉環(huán)鏈路 中每臺(tái)刀片式服務(wù)器中管理模塊的ID地址。
11. 根據(jù)權(quán)利要求8所述的方法,其特征在于,所述管理閉環(huán)鏈路中的集 中管理器與刀片式服務(wù)器的通信方式為基于RS-485串口協(xié)議的通信方式或者 基于控制器局域網(wǎng)絡(luò)CAN總線協(xié)議的通信方式。
全文摘要
本發(fā)明公開(kāi)了一種管理刀片式服務(wù)器的方法建立管理閉環(huán)鏈路,檢測(cè)和設(shè)置管理閉環(huán)鏈路上刀片式服務(wù)器的管理模塊的身份ID地址,采用輪詢(xún)機(jī)制獲取管理閉環(huán)鏈路上刀片式服務(wù)器的監(jiān)控狀態(tài)信息,接收用戶發(fā)出的控制命令后參考監(jiān)控狀態(tài)信息執(zhí)行控制命令。同時(shí)還公開(kāi)了一種管理刀片式服務(wù)器的系統(tǒng),包括用戶管理器、多臺(tái)刀片式服務(wù)器和集中管理器。通過(guò)本發(fā)明為用戶提供了布線簡(jiǎn)潔、設(shè)備成本投入少、單一IP管理的具有高可靠性的刀片式服務(wù)器管理解決方案。
文檔編號(hào)H04L12/04GK101277214SQ20071006490
公開(kāi)日2008年10月1日 申請(qǐng)日期2007年3月28日 優(yōu)先權(quán)日2007年3月28日
發(fā)明者崔吉順, 迅 黃 申請(qǐng)人:聯(lián)想(北京)有限公司