一種自動化監(jiān)測診斷的雙活式刀片服務(wù)器管理系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及服務(wù)器管理架構(gòu)技術(shù),尤其涉及一種自動化監(jiān)測診斷的雙活式刀片服務(wù)器管理系統(tǒng)。
【背景技術(shù)】
[0002]目前隨著數(shù)據(jù)量的爆炸式增長,單一的服務(wù)器單元已經(jīng)無法滿足海量數(shù)據(jù)的處理需要,大規(guī)模并行化的計算機(jī)系統(tǒng)架構(gòu),由其具有擴(kuò)展性強(qiáng),計算能力高、支持統(tǒng)一管理等特點(diǎn),越來越迎合大數(shù)據(jù)時代對服務(wù)器產(chǎn)品的需求,這使得目前的服務(wù)器系統(tǒng)物理體積逐漸龐大、模塊組成逐漸復(fù)雜、集成度逐漸增加,同時對系統(tǒng)的冗余度要求也越來越高。監(jiān)控管理系統(tǒng)是計算機(jī)系統(tǒng)的重要組成部分,是系統(tǒng)可靠性和可維修性的核心保障,在管理技術(shù)中目前業(yè)界有I2C硬件狀態(tài)監(jiān)測、JTAG邊界掃描和RS232串口調(diào)試技術(shù),如何合成多個層次上的多個監(jiān)測通道,實(shí)現(xiàn)綜合診斷,是監(jiān)控診斷子系統(tǒng)中的一個關(guān)鍵性技術(shù)。
[0003]監(jiān)控診斷子系對于提高計算機(jī)系統(tǒng)的整體可靠性和可維護(hù)性起到核心保障的作用,但目前服務(wù)器的管理架構(gòu)多采用單一的管理通道,管理通道單一,無法實(shí)現(xiàn)有效的綜合故障監(jiān)測、診斷、調(diào)試功能;另一方面業(yè)界計算機(jī)系統(tǒng)中同一時間均采用I個管理控制器,造成管理系統(tǒng)資源的閑置與浪費(fèi)。
【發(fā)明內(nèi)容】
[0004]為了解決該問題,本文提出了一種自動化監(jiān)測診斷的雙活式刀片服務(wù)器管理系統(tǒng)架構(gòu)。
[0005]一種自動化監(jiān)測診斷的雙活式刀片服務(wù)器管理系統(tǒng),主要由冗余的系統(tǒng)管理控制器、模塊級監(jiān)控診斷代理和多重監(jiān)控診斷網(wǎng)絡(luò)組成;系統(tǒng)管理控制器負(fù)責(zé)全系統(tǒng)的監(jiān)控、管理與診斷測試;監(jiān)控診斷代理集成于各個模塊中,負(fù)責(zé)模塊級的故障監(jiān)測、診斷、隔離與恢復(fù);多重監(jiān)控診斷網(wǎng)絡(luò)主要由I2C監(jiān)控網(wǎng)絡(luò)、JTAG邊界掃描網(wǎng)絡(luò)和串口調(diào)試網(wǎng)絡(luò)組成;采用了雙管理控制器冗余設(shè)計的技術(shù),雙控制器與各個功能模塊中的監(jiān)控代理之間形成兩套冗余的監(jiān)測控制網(wǎng)絡(luò)。
[0006]在新的管理架構(gòu)中,嵌入式系統(tǒng)管理控制器SMC通過I2C通道對系統(tǒng)各模塊中關(guān)鍵設(shè)備的電壓、溫度、邏輯狀態(tài)進(jìn)行實(shí)時監(jiān)測,并對過壓、過溫等緊急故障采取應(yīng)急措施,避免引起系統(tǒng)損壞;通過邊界掃描通道對系統(tǒng)中的處理模塊、交換模塊和I/o模塊進(jìn)行診斷測試,實(shí)時監(jiān)測硬件邏輯錯誤信息,并與操作系統(tǒng)進(jìn)行交互,實(shí)現(xiàn)對各個模塊的實(shí)時在線診斷;通過串口通道實(shí)現(xiàn)各處理模塊的串口重定向操作,為系統(tǒng)調(diào)試及用戶提供直接的管理控制臺接口。新的管理架構(gòu)不但能提高系統(tǒng)的診斷效率,而且大幅提升系統(tǒng)管理的冗余度,減少計算機(jī)系統(tǒng)停機(jī)維修次數(shù)。系統(tǒng)管理控制器具有事件記錄功能。
[0007]模塊級監(jiān)控診斷代理分別設(shè)置在各個子系統(tǒng)模塊中,利用I2C總線,完成局部的監(jiān)測任務(wù);其主要功能是對模塊內(nèi)各部件進(jìn)行監(jiān)控,包括電壓、溫度、風(fēng)扇轉(zhuǎn)速、錯誤狀態(tài),同時還可以讀取結(jié)點(diǎn)內(nèi)芯片相關(guān)信息,在緊急情況時實(shí)施保護(hù)措施。
[0008]模塊級監(jiān)控診斷代理與處理模塊內(nèi)的傳統(tǒng)I/O控制器相連接,構(gòu)成模塊內(nèi)調(diào)試診斷網(wǎng)絡(luò),并對外提供RS232串行接口,既可用于調(diào)試診斷目的,也可用于實(shí)現(xiàn)單結(jié)點(diǎn)終端控制臺功能;監(jiān)控診斷子系統(tǒng)與系統(tǒng)I/O控制器通過I/O總線相連,并可通過異步中斷方式向系統(tǒng)傳遞故障檢測診斷信息,與操作系統(tǒng)故障處理機(jī)制協(xié)同,實(shí)現(xiàn)軟硬件相結(jié)合的故障監(jiān)控、診斷、隔離和恢復(fù)功能。
[0009]系統(tǒng)管理控制器作為整個系統(tǒng)上的核心單元,負(fù)責(zé)整個模塊上管理功能的實(shí)現(xiàn);系統(tǒng)管理控制器會通過兩組SMC_SEL信號連接到系統(tǒng)中背板,當(dāng)系統(tǒng)中的管理模塊要訪問融合交換模塊時,系統(tǒng)管理模塊會通過SMC_SEL通知系統(tǒng)管理控制器,由系統(tǒng)管理控制器分配訪問的權(quán)限。
[0010]1、新的架構(gòu)采用了雙管理控制器冗余設(shè)計的技術(shù),雙控制器與各個功能模塊中的監(jiān)控代理之間形成兩套冗余的監(jiān)測控制網(wǎng)絡(luò),使得新的管理架構(gòu)具備更高的冗余度;
2、在新的管理架構(gòu)中首次采用雙控制器同時并存工作設(shè)計的技術(shù),完全實(shí)現(xiàn)故障的隔離,增強(qiáng)系統(tǒng)管理資源的利用率,提高系統(tǒng)并行化工作的效率。
[0011]本發(fā)明的有益效果:
采用了雙管理控制器冗余設(shè)計的技術(shù),雙控制器與各個功能模塊中的監(jiān)控代理之間形成兩套冗余的監(jiān)測控制網(wǎng)絡(luò),使得新的管理架構(gòu)具備更高的冗余度。同時在新的管理架構(gòu)中首次采用雙控制器同時并存工作設(shè)計的技術(shù),完全實(shí)現(xiàn)故障的隔離,增強(qiáng)系統(tǒng)管理資源的利用率,提高系統(tǒng)并行化工作的效率。
【附圖說明】
[0012]附圖1是本發(fā)明的管理系統(tǒng)架構(gòu)框圖。
[0013]附圖2是系統(tǒng)管理控制器SMC結(jié)構(gòu)圖。
[0014]附圖3是模塊級監(jiān)控制器MMA設(shè)計原理框圖。
[0015]附圖4是系統(tǒng)模塊級管理原理框圖。
【具體實(shí)施方式】
[0016]下面對本發(fā)明的內(nèi)容進(jìn)行更加詳細(xì)的闡述:
圖1為支持雙冗余度的可實(shí)現(xiàn)多通道綜合自動化監(jiān)測診斷的雙活式刀片服務(wù)器管理系統(tǒng)架構(gòu)框圖,其中監(jiān)控診斷子系統(tǒng)由冗余的系統(tǒng)管理控制器(System ManagementController,簡稱SMC)、模塊級監(jiān)控診斷代理(Modular Monitor Agent,簡稱MMA)和多重監(jiān)控診斷網(wǎng)絡(luò)組成。系統(tǒng)管理控制器負(fù)責(zé)全系統(tǒng)的監(jiān)控、管理與診斷測試。監(jiān)控診斷代理集成于各個模塊中,負(fù)責(zé)模塊級的故障監(jiān)測、診斷、隔離與恢復(fù)。多重監(jiān)控診斷網(wǎng)絡(luò)由I2C監(jiān)控網(wǎng)絡(luò)、JTAG邊界掃描網(wǎng)絡(luò)和串口調(diào)試網(wǎng)絡(luò)組成。
[0017]圖2為系統(tǒng)管理控制器SMC結(jié)構(gòu)圖,系統(tǒng)管理控制器SMC由嵌入式處理器、I2C總線控制器、RS232串行通信接口、JTAG邊界掃描控制器、以太網(wǎng)、面板控制邏輯等部分組成,運(yùn)行支持多任務(wù)的實(shí)時嵌入式操作系統(tǒng)。其中SMC通過I2C總線收集電壓、電流和溫度等傳感數(shù)據(jù),實(shí)現(xiàn)硬件環(huán)境監(jiān)控。通過邊界掃描鏈采集硬件模塊內(nèi)各芯片的狀態(tài),實(shí)現(xiàn)故障定位;通過邊界掃描鏈向各芯片發(fā)送控制碼,實(shí)現(xiàn)導(dǎo)通測試、硬件配置、模塊復(fù)位、故障隔離等功能。通過串口網(wǎng)絡(luò)收集運(yùn)行狀態(tài)回顯,發(fā)送指令,實(shí)現(xiàn)硬件邏輯和系統(tǒng)軟件的功能調(diào)試,同時還為用戶提供串口終端控制臺服務(wù)和基于Web方式的以太網(wǎng)遠(yuǎn)程維護(hù)診斷界面。此夕卜,系統(tǒng)管理控制器SMC具有事件記錄功能。
[0018]圖3為模塊級監(jiān)控制器設(shè)計原理框圖,模塊級監(jiān)控診斷代理分別設(shè)置在各個子系統(tǒng)模塊中,利用I2C總線,完成局部的監(jiān)測任務(wù)。其主要功能是對模塊內(nèi)各部件進(jìn)行監(jiān)控,包括電壓、溫度、風(fēng)扇轉(zhuǎn)速、錯誤狀態(tài)等,同時還可以讀取結(jié)點(diǎn)內(nèi)芯片相關(guān)信息,在緊急情況時實(shí)施保護(hù)措施。監(jiān)控診斷代理與處理模塊內(nèi)的傳