專利名稱:一種高可用集群備份系統(tǒng)及其備份方法
技術(shù)領(lǐng)域:
本發(fā)明涉及控制技術(shù),尤其涉及一種高可用(High Availability,HA)集群備份系 統(tǒng)及其備份方法。
背景技術(shù):
隨著數(shù)字技術(shù)的發(fā)展,當(dāng)今有各個領(lǐng)域都需要保證設(shè)備運(yùn)行的高可靠性,特別是 銀行、電信、導(dǎo)航等民生領(lǐng)域,以及金融、交通甚至軍事領(lǐng)域等等都是如此。而現(xiàn)在云計算、 云存儲技術(shù)的興起,對設(shè)備的高可靠性需求更是提到了前所未有的高度。所有的設(shè)備都有使用壽命,而且各種設(shè)備的使用壽命又都不盡相同,另外,設(shè)備運(yùn) 行過程中,也可能出現(xiàn)各種故障。這樣,各種設(shè)備組合在一起的大型系統(tǒng),就無法準(zhǔn)確知道 設(shè)備在何時會出現(xiàn)故障,進(jìn)而難以高效預(yù)防對用戶可能造成的損失。軟件雙機(jī)HA系統(tǒng)能夠提高可靠性保證,其是在系統(tǒng)的主CPU中運(yùn)行HA后臺管理 進(jìn)程,該進(jìn)程能對本機(jī)的許多主要模塊進(jìn)行偵測,如CPU、數(shù)據(jù)庫、操作系統(tǒng)以及網(wǎng)絡(luò)等。當(dāng) 本機(jī)發(fā)現(xiàn)所偵測的這些模塊出現(xiàn)故障了,將停止向備份機(jī)發(fā)送HA信號。備份機(jī)將在此時接 管主機(jī)的全部工作,以保證對外界的服務(wù)正常運(yùn)行。但是,現(xiàn)有的軟件雙機(jī)HA集群備份技術(shù),不能對故障模塊進(jìn)行定位,也不能根據(jù) 故障嚴(yán)重程度進(jìn)行區(qū)別性處理。同時軟件HA將占用主機(jī)的資源,這將影響主機(jī)的主要性 能。在以往的HA技術(shù)中,備份設(shè)備往往不參與工作,只是監(jiān)視主設(shè)備的工作狀態(tài),只 有在主設(shè)備出現(xiàn)故障時,備份設(shè)備才接管主設(shè)備的工作。這將帶來硬件資源的浪費(fèi),因為備 份設(shè)備也在一起的老化,并且在大部分時間中未能發(fā)揮其應(yīng)有的效益。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是需要提供一種雙機(jī)集群備份技術(shù),克服現(xiàn)有高可用 集群備份技術(shù)不能對故障模塊進(jìn)行定位的不足。為了解決上述技術(shù)問題,本發(fā)明提供了一種雙機(jī)集群備份系統(tǒng),包括互為備份的 第一設(shè)備和第二設(shè)備,每一設(shè)備均包括主控裝置、監(jiān)控裝置及附屬裝置群,其中任一設(shè)備中的監(jiān)控裝置,均用于監(jiān)控所屬設(shè)備中主控裝置及附屬裝置群中各附屬 裝置的工作狀態(tài),獲得運(yùn)行狀態(tài)數(shù)據(jù)并封裝成監(jiān)控幀數(shù)據(jù)發(fā)送給另一設(shè)備,還用于在所述 另一設(shè)備中的監(jiān)控裝置監(jiān)控到所屬主控裝置及附屬裝置群中各附屬裝置出現(xiàn)工作故障時, 對所述另一設(shè)備中的監(jiān)控裝置發(fā)送的監(jiān)控幀數(shù)據(jù)進(jìn)行解析和辨別,獲得解析結(jié)果及所述工 作故障的嚴(yán)重程度,并根據(jù)所述解析結(jié)果及所述工作故障的嚴(yán)重程度采取控制措施。優(yōu)選地,所述任一設(shè)備中的監(jiān)控裝置,均包含有故障識別部件;所述故障識別部件 預(yù)先存儲有所述另一設(shè)備的主控裝置及附屬裝置群中的各附屬裝置的故障類型,用于根據(jù) 所述故障類型對所述工作故障進(jìn)行所述辨別,獲得所述工作故障的嚴(yán)重程度。優(yōu)選地,所述監(jiān)控幀數(shù)據(jù)包括主控裝置軟硬件運(yùn)行狀態(tài)及附屬裝置群中各附屬裝置的運(yùn)行狀態(tài)。優(yōu)選地,所述監(jiān)控幀數(shù)據(jù)進(jìn)一步包括前導(dǎo)符、幀校驗位以及停止位。為了解決上述技術(shù)問題,本發(fā)明還提供了一種雙機(jī)集群備份系統(tǒng)的備份方法,所 述雙機(jī)集群備份系統(tǒng)包括互為備份的第一設(shè)備和第二設(shè)備,每一設(shè)備均包括主控裝置、監(jiān) 控裝置及附屬裝置群;在所述方法中任一設(shè)備中的監(jiān)控裝置均監(jiān)控所屬設(shè)備中主控裝置及附屬裝置群中各附屬裝置 的工作狀態(tài),獲得運(yùn)行狀態(tài)數(shù)據(jù)并封裝成監(jiān)控幀數(shù)據(jù)發(fā)送給另一設(shè)備;在所述另一設(shè)備中的監(jiān)控裝置監(jiān)控到所屬主控裝置及附屬裝置群中各附屬裝置 出現(xiàn)工作故障時,所述任一設(shè)備中的監(jiān)控裝置對所述另一設(shè)備中的監(jiān)控裝置發(fā)送的監(jiān)控幀 數(shù)據(jù)進(jìn)行解析和辨別,獲得解析結(jié)果及所述工作故障的嚴(yán)重程度,并根據(jù)所述解析結(jié)果及 所述工作故障的嚴(yán)重程度采取控制措施。優(yōu)選地,所述任一設(shè)備中的監(jiān)控裝置預(yù)先存儲有所述另一設(shè)備的主控裝置及附屬 裝置群中的各附屬裝置的故障類型,根據(jù)所述故障類型對所述工作故障進(jìn)行所述辨別,獲 得所述工作故障的嚴(yán)重程度。優(yōu)選地,所述監(jiān)控幀數(shù)據(jù)包括主控裝置軟硬件運(yùn)行狀態(tài)及附屬裝置群中各附屬裝 置的運(yùn)行狀態(tài)。優(yōu)選地,所述監(jiān)控幀數(shù)據(jù)進(jìn)一步包括前導(dǎo)符、幀校驗位以及停止位。本發(fā)明技術(shù)方案相對于以往關(guān)于提高設(shè)備可靠性的HA技術(shù)的不同之處在于,本 發(fā)明通過硬件設(shè)備(如控制芯片等)來實現(xiàn)HA,其優(yōu)點在于不會占用設(shè)備主控裝置的帶寬。 進(jìn)一步地,兩臺設(shè)備互為備份,在同時完成工作的基礎(chǔ)上,還同時監(jiān)視本設(shè)備及另一設(shè)備的 運(yùn)行狀態(tài),并針對性地采取相應(yīng)的措施,提高了資源利用率。本發(fā)明的其它特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變 得顯而易見,或者通過實施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點可通過在說明書、權(quán)利 要求書以及附圖中所特別指出的結(jié)構(gòu)來實現(xiàn)和獲得。
附圖用來提供對本發(fā)明的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本發(fā)明的實 施例一起用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的限制。在附圖中圖1是本發(fā)明實施例所述的雙機(jī)集群備份系統(tǒng)的組成示意圖。
具體實施例方式以下將結(jié)合附圖及實施例來詳細(xì)說明本發(fā)明的實施方式,借此對本發(fā)明如何應(yīng)用 技術(shù)手段來解決技術(shù)問題,并達(dá)成技術(shù)效果的實現(xiàn)過程能充分理解并據(jù)以實施。首先,如果不沖突,本發(fā)明實施例以及實施例中的各個特征可以相互結(jié)合,均在本 發(fā)明的保護(hù)范圍之內(nèi)。另外,在附圖的流程圖示出的步驟可以在諸如一組計算機(jī)可執(zhí)行指 令的計算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以 以不同于此處的順序執(zhí)行所示出或描述的步驟。實施例一、一種雙機(jī)集群(HA)備份系統(tǒng)
本實施例包括第一設(shè)備和第二設(shè)備,兩設(shè)備互為備份,每一設(shè)備均包括主控裝置、 監(jiān)控裝置及附屬裝置群。任一設(shè)備中的監(jiān)控裝置,用于監(jiān)控所屬設(shè)備中主控裝置及附屬裝 置群中各附屬裝置的工作狀態(tài),獲得運(yùn)行狀態(tài)數(shù)據(jù)并封裝成監(jiān)控幀數(shù)據(jù)發(fā)送給另一設(shè)備, 還用于在另一設(shè)備中的監(jiān)控裝置監(jiān)控到所屬主控裝置及附屬裝置群中各附屬裝置出現(xiàn)工 作故障時,對另一設(shè)備中的監(jiān)控裝置發(fā)送的監(jiān)控幀數(shù)據(jù)進(jìn)行解析和辨別,獲得解析結(jié)果及 工作故障的嚴(yán)重程度,并根據(jù)解析結(jié)果及工作故障的嚴(yán)重程度采取控制措施。如圖1所示,本實施例主要包括第一設(shè)備100和第二設(shè)備200,其中第一設(shè)備100 包括有第一主控裝置110、第一監(jiān)控裝置120、第一附屬裝置群130 ;第二設(shè)備200包括有第 二主控裝置210、第二監(jiān)控裝置220、第二附屬裝置群230。第一設(shè)備100的組成與結(jié)構(gòu),均 與第二設(shè)備200相同,包括兩個設(shè)備各自所包括的主控裝置、監(jiān)控裝置,附屬裝置群所包含 的各種附屬裝置等等,也都是一模一樣的。附屬裝置群(第一附屬裝置群130和第二附屬 裝置群230)中的附屬裝置比如包括電源、風(fēng)扇、溫度傳感器等等。第一監(jiān)控裝置120,用于監(jiān)控第一主控裝置110及第一附屬裝置群130中各附屬裝 置的工作狀態(tài),獲得第一運(yùn)行狀態(tài)數(shù)據(jù),將第一運(yùn)行狀態(tài)數(shù)據(jù)封裝成第一監(jiān)控幀數(shù)據(jù)后發(fā) 送給第二監(jiān)控裝置220 ;第二監(jiān)控裝置220,用于接收第一監(jiān)控裝置120發(fā)送的第一監(jiān)控幀數(shù)據(jù),在第一監(jiān) 控裝置120監(jiān)控到第一主控裝置110及第一附屬裝置群130中各附屬裝置出現(xiàn)工作故障 時,對第一監(jiān)控幀數(shù)據(jù)進(jìn)行解析和辨別,獲得第一解析結(jié)果及第一工作故障的嚴(yán)重程度,并 根據(jù)第一解析結(jié)果及第一工作故障的嚴(yán)重程度采取相應(yīng)的控制措施。需要說明的是,第一設(shè)備100和第二設(shè)備200 二者互為備份,因此前述的第一監(jiān)控 裝置220,同樣可以用于監(jiān)控第而主控裝置210及第二附屬裝置群230中各附屬裝置的工 作狀態(tài),獲得第二運(yùn)行狀態(tài)數(shù)據(jù),將第二運(yùn)行狀態(tài)數(shù)據(jù)封裝成第二監(jiān)控幀數(shù)據(jù)后發(fā)送給第 一監(jiān)控裝置120 ;前述的第一監(jiān)控裝置120同樣可以用于接收第二監(jiān)控裝置220發(fā)送的第 二監(jiān)控幀數(shù)據(jù),在第二監(jiān)控裝置220監(jiān)控到第二主控裝置210及第二附屬裝置群230中各 附屬裝置出現(xiàn)工作故障時,對第二監(jiān)控幀數(shù)據(jù)進(jìn)行解析和辨別,獲得第二解析結(jié)果及第二 工作故障的嚴(yán)重程度,并根據(jù)第二解析結(jié)果及第二工作故障的嚴(yán)重程度采取相應(yīng)的控制措 施。以下論述中,稱第一設(shè)備100和第二設(shè)備200的其中之一為主機(jī)設(shè)備時,另一則相 應(yīng)地為其備份設(shè)備。另外,需要說明的是,前述以及后述的“第一”、“第二”僅是為了描述的 方便,以相互區(qū)分具有相同功能和/或含義的兩者,除此之外并無其他含義。在正常情況下,互為備份的兩臺設(shè)備(第一設(shè)備100和第二設(shè)備200)協(xié)同工作, 這種處理方法可以提升在正常情況下的系統(tǒng)處理速度。而在某臺設(shè)備出現(xiàn)故障的時候,沒 有出現(xiàn)故障的設(shè)備就會出現(xiàn)故障的那臺設(shè)備所處理的任務(wù)進(jìn)行完全的接管。設(shè)備中的監(jiān)控裝置對設(shè)備中的主控裝置及附屬裝置群的運(yùn)行狀態(tài)進(jìn)行監(jiān)控(第 一監(jiān)控裝置120對第一設(shè)備100中的第一主控裝置110及第一附屬裝置群130中的附屬裝 置的運(yùn)行狀態(tài)進(jìn)行監(jiān)控,以及第二監(jiān)控裝置220對第二設(shè)備200中的第二主控裝置210及 第二附屬裝置群230的附屬裝置的運(yùn)行狀態(tài)進(jìn)行監(jiān)控),獲得運(yùn)行狀態(tài)數(shù)據(jù)(第一監(jiān)控裝置 120獲得第一運(yùn)行狀態(tài)數(shù)據(jù),第二監(jiān)控裝置220獲得第二運(yùn)行狀態(tài)數(shù)據(jù))。監(jiān)控裝置把監(jiān)控 獲得的運(yùn)行狀態(tài)數(shù)據(jù)封裝成監(jiān)控幀數(shù)據(jù)(將第一運(yùn)行狀態(tài)數(shù)據(jù)封裝成第一監(jiān)控幀數(shù)據(jù),將第二運(yùn)行狀態(tài)數(shù)據(jù)封裝成第二監(jiān)控幀數(shù)據(jù)),周期性地發(fā)送給備份設(shè)備的監(jiān)控裝置。監(jiān)控幀 數(shù)據(jù)中的每一位都有其特定的含義,它們代表著監(jiān)控對象的運(yùn)行狀況。監(jiān)控裝置還能對主 控裝置、附屬裝置群中的各種附屬裝置進(jìn)行簡單的管理(例如開啟和停止等)。在實際應(yīng)用中,上述的監(jiān)控裝置可以是低成本的CPU (如8051單片機(jī)等),在這個 CPU當(dāng)中可以運(yùn)行一個簡單的程序,該程序可以對本設(shè)備的各部分運(yùn)行狀態(tài)進(jìn)行監(jiān)控,并把 各部分監(jiān)控狀態(tài)封裝成數(shù)據(jù)幀發(fā)送給另一設(shè)備的監(jiān)控裝置,該程序還具有對本設(shè)備監(jiān)控狀 態(tài)數(shù)據(jù)幀以及接收到的另一設(shè)備的監(jiān)控裝置發(fā)送過來的監(jiān)控狀態(tài)數(shù)據(jù)幀進(jìn)行解析的功能, 還可以對解析后的結(jié)果采取相應(yīng)的進(jìn)一步措施。監(jiān)控裝置包含有故障識別部件,該故障識別部件預(yù)先存儲有另一設(shè)備中監(jiān)控裝置 的監(jiān)控對象(即另一設(shè)備的主控裝置及附屬裝置群中的各附屬裝置)的故障類型,用于根 據(jù)該故障類型能對監(jiān)控對象所出現(xiàn)的工作故障進(jìn)行辨別,獲得工作故障的嚴(yán)重程度,然后 依據(jù)所獲得的工作故障的嚴(yán)重程度采取相應(yīng)的控制措施。例如當(dāng)?shù)谝辉O(shè)備100中的第一監(jiān)控裝置120監(jiān)控到第一主控裝置110運(yùn)行出現(xiàn) 故障(如運(yùn)行不正常)時,就將含有第一主控裝置120出現(xiàn)故障的監(jiān)控幀數(shù)據(jù)發(fā)送給第二 設(shè)備200的第二監(jiān)控裝置220,并由該第二監(jiān)控裝置220采取進(jìn)一步措施,而該第一監(jiān)控裝 置120則關(guān)閉所監(jiān)控的第一主控裝置110及第一附屬裝置群130中的各附屬裝置。第二設(shè)備200的第二監(jiān)控裝置220對第一設(shè)備100所發(fā)送過來的監(jiān)控幀數(shù)據(jù)進(jìn)行 解析,獲得第一解析結(jié)果,并根據(jù)第一解析結(jié)果采取不同的措施。例如第一解析結(jié)果表示第一設(shè)備100的第一主控裝置110出現(xiàn)了故障,那么第二設(shè) 備200的第二監(jiān)控裝置220即通知自身所監(jiān)控的第二主控裝置210全部接管第一設(shè)備100 的第一主控裝置110處理的全部數(shù)據(jù)處理任務(wù),同時發(fā)送第一設(shè)備出現(xiàn)故障的第一告警消 息,發(fā)送的第一告警消息包括該第一解析結(jié)果,以及對故障的初步判斷。另外,還可以同時 點亮第一設(shè)備100的故障報警燈。在實際應(yīng)用中,上述的故障識別部件可以是獨(dú)立的功能實體,也可以是監(jiān)控裝置 集成有此功能,比如用程序來對數(shù)據(jù)幀進(jìn)行解析來實現(xiàn)。相比較而言,程序解析的方法在一 定程度上可能會相對簡單,因為監(jiān)控裝置本身可以有一個CPU。以上是以第一設(shè)備出現(xiàn)故障為例進(jìn)行說明的,實際上,第一設(shè)備100與第二設(shè)備 200互為備份設(shè)備,它們的性能以及工作方式等都完全相同,各自的運(yùn)行狀態(tài)的信息會互相 發(fā)送。設(shè)備在運(yùn)行時每隔一段時間都會向?qū)Ψ睫D(zhuǎn)達(dá)自己的工作狀態(tài),如果在某時間段后沒 有收到對方設(shè)備發(fā)送來的信息,則也可以認(rèn)為對方設(shè)備已經(jīng)出現(xiàn)故障,這種情況下,本方設(shè) 備可以主動接管對方設(shè)備所處理的所有數(shù)據(jù)處理任務(wù),并為對方設(shè)備進(jìn)行故障報警。假定兩臺設(shè)備一開始都正常運(yùn)行。在運(yùn)行當(dāng)中,各自的監(jiān)控裝置分別相互獨(dú)立地 對本設(shè)備的主控裝置及附屬裝置群進(jìn)行監(jiān)控,同時也接收對方設(shè)備監(jiān)控幀數(shù)據(jù)并進(jìn)行解 析,這樣,就可以知道本設(shè)備和對方設(shè)備的運(yùn)行狀態(tài),并對運(yùn)行采取恰當(dāng)?shù)墓芾泶胧?。第一監(jiān)控裝置120還可以對監(jiān)控第一主控裝置110及第一附屬裝置群130中的附 屬裝置的運(yùn)行狀態(tài)所產(chǎn)生的第一運(yùn)行狀態(tài)數(shù)據(jù)進(jìn)行處理。具體地,對第一運(yùn)行狀態(tài)數(shù)據(jù)解 析,判斷第一主控裝置110及第一附屬裝置群130中的附屬裝置的運(yùn)行是否出錯。如果運(yùn) 行正常,則把第一運(yùn)行狀態(tài)數(shù)據(jù)發(fā)送給第二設(shè)備200的第二監(jiān)控裝置220 ;如果出錯,則對 錯誤的危害程度進(jìn)行評估,如果評估出錯誤危害性較小,則向管理人員發(fā)送出錯信息,同時把出錯信息發(fā)送給第二設(shè)備200的第二監(jiān)控裝置220 ;如果評估出錯位危害性較大,則向第 二設(shè)備200的第二監(jiān)控裝置220發(fā)送嚴(yán)重出錯信息,同時關(guān)閉第一主控裝置110及第一附 屬裝置群130中的各附屬裝置,最終關(guān)閉該第一監(jiān)控裝置本身。相應(yīng)地,第二監(jiān)控裝置220同樣可以對監(jiān)控第二主控裝置210及第二附屬裝置群 230中的附屬裝置的運(yùn)行狀態(tài)所產(chǎn)生的第二運(yùn)行狀態(tài)數(shù)據(jù)進(jìn)行同樣性質(zhì)的處理。前述的監(jiān)控幀數(shù)據(jù),本實施例中包括如下組成部分1、4比特(bit)前導(dǎo)符;2、lbit做起始位,附屬裝置群中的每個附屬裝置的運(yùn)行狀態(tài)各占lbit,主控裝置 的運(yùn)行狀態(tài)占2bit,然后再有Ibit做奇偶校驗,Ibit做停止位。本實施例中的監(jiān)控幀數(shù)據(jù)可以如下形式
權(quán)利要求
1.一種雙機(jī)集群備份系統(tǒng),其特征在于,包括互為備份的第一設(shè)備和第二設(shè)備,每一設(shè) 備均包括主控裝置、監(jiān)控裝置及附屬裝置群,其中任一設(shè)備中的監(jiān)控裝置,均用于監(jiān)控所屬設(shè)備中主控裝置及附屬裝置群中各附屬裝置 的工作狀態(tài),獲得運(yùn)行狀態(tài)數(shù)據(jù)并封裝成監(jiān)控幀數(shù)據(jù)發(fā)送給另一設(shè)備,還用于在所述另一 設(shè)備中的監(jiān)控裝置監(jiān)控到所屬主控裝置及附屬裝置群中各附屬裝置出現(xiàn)工作故障時,對所 述另一設(shè)備中的監(jiān)控裝置發(fā)送的監(jiān)控幀數(shù)據(jù)進(jìn)行解析和辨別,獲得解析結(jié)果及所述工作故 障的嚴(yán)重程度,并根據(jù)所述解析結(jié)果及所述工作故障的嚴(yán)重程度采取控制措施。
2.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于所述任一設(shè)備中的監(jiān)控裝置,均包含有故障識別部件;所述故障識別部件預(yù)先存儲有 所述另一設(shè)備的主控裝置及附屬裝置群中的各附屬裝置的故障類型,用于根據(jù)所述故障類 型對所述工作故障進(jìn)行所述辨別,獲得所述工作故障的嚴(yán)重程度。
3.根據(jù)權(quán)利要求1所述的系統(tǒng),其特征在于所述監(jiān)控幀數(shù)據(jù)包括主控裝置軟硬件運(yùn)行狀態(tài)及附屬裝置群中各附屬裝置的運(yùn)行狀態(tài)。
4.根據(jù)權(quán)利要求3所述的系統(tǒng),其特征在于所述監(jiān)控幀數(shù)據(jù)進(jìn)一步包括前導(dǎo)符、幀校驗位以及停止位。
5.一種雙機(jī)集群備份系統(tǒng)的備份方法,其特征在于,所述雙機(jī)集群備份系統(tǒng)包括互為 備份的第一設(shè)備和第二設(shè)備,每一設(shè)備均包括主控裝置、監(jiān)控裝置及附屬裝置群;在所述方法中任一設(shè)備中的監(jiān)控裝置均監(jiān)控所屬設(shè)備中主控裝置及附屬裝置群中各附屬裝置的工 作狀態(tài),獲得運(yùn)行狀態(tài)數(shù)據(jù)并封裝成監(jiān)控幀數(shù)據(jù)發(fā)送給另一設(shè)備;在所述另一設(shè)備中的監(jiān)控裝置監(jiān)控到所屬主控裝置及附屬裝置群中各附屬裝置出現(xiàn) 工作故障時,所述任一設(shè)備中的監(jiān)控裝置對所述另一設(shè)備中的監(jiān)控裝置發(fā)送的監(jiān)控幀數(shù)據(jù) 進(jìn)行解析和辨別,獲得解析結(jié)果及所述工作故障的嚴(yán)重程度,并根據(jù)所述解析結(jié)果及所述 工作故障的嚴(yán)重程度采取控制措施。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于所述任一設(shè)備中的監(jiān)控裝置預(yù)先存儲有所述另一設(shè)備的主控裝置及附屬裝置群中的 各附屬裝置的故障類型,根據(jù)所述故障類型對所述工作故障進(jìn)行所述辨別,獲得所述工作 故障的嚴(yán)重程度。
7.根據(jù)權(quán)利要求5所述的方法,其特征在于所述監(jiān)控幀數(shù)據(jù)包括主控裝置軟硬件運(yùn)行狀態(tài)及附屬裝置群中各附屬裝置的運(yùn)行狀態(tài)。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于所述監(jiān)控幀數(shù)據(jù)進(jìn)一步包括前導(dǎo)符、幀校驗位以及停止位。
全文摘要
本發(fā)明公開了一種高可用集群備份系統(tǒng)及其備份方法,克服現(xiàn)有高可用集群備份技術(shù)不能對故障模塊進(jìn)行定位的不足。其中該系統(tǒng)包括互為備份的兩臺設(shè)備,每一設(shè)備均包括主控裝置、監(jiān)控裝置及附屬裝置群,任一設(shè)備中的監(jiān)控裝置均用于監(jiān)控所屬設(shè)備中主控裝置及附屬裝置群中各附屬裝置的工作狀態(tài),獲得運(yùn)行狀態(tài)數(shù)據(jù)并封裝成監(jiān)控幀數(shù)據(jù)發(fā)送給另一設(shè)備,還用于在另一設(shè)備中的監(jiān)控裝置監(jiān)控到所屬主控裝置及附屬裝置群中各附屬裝置出現(xiàn)工作故障時,對另一設(shè)備中的監(jiān)控裝置發(fā)送的監(jiān)控幀數(shù)據(jù)進(jìn)行解析和辨別,獲得解析結(jié)果及工作故障的嚴(yán)重程度,并根據(jù)解析結(jié)果及工作故障的嚴(yán)重程度采取控制措施。本發(fā)明通過硬件設(shè)備來實現(xiàn)HA,不占用設(shè)備主控裝置的帶寬。
文檔編號H04L12/24GK102006190SQ201010560550
公開日2011年4月6日 申請日期2010年11月23日 優(yōu)先權(quán)日2010年11月23日
發(fā)明者唐金榮, 李海東, 肖健明 申請人:浪潮(北京)電子信息產(chǎn)業(yè)有限公司