国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      提供用于ha集群的管理程序的基于應(yīng)用的監(jiān)控及恢復(fù)的制作方法

      文檔序號(hào):6533510閱讀:280來(lái)源:國(guó)知局
      提供用于ha集群的管理程序的基于應(yīng)用的監(jiān)控及恢復(fù)的制作方法
      【專利摘要】本發(fā)明的實(shí)施例涉及一種與包括管理程序和來(lái)賓虛擬機(jī)的節(jié)點(diǎn)相關(guān)聯(lián)的方法,其中,每個(gè)來(lái)賓虛擬機(jī)由管理程序管理,并被安排以運(yùn)行應(yīng)用,該節(jié)點(diǎn)與其它節(jié)點(diǎn)一起形成高可用性集群。該方法包括:在每個(gè)來(lái)賓虛擬機(jī)和管理程序之間建立內(nèi)部雙向通信通道,并還包括通過(guò)通道發(fā)送命令和對(duì)命令的響應(yīng),其中各個(gè)命令管理在給定來(lái)賓虛擬機(jī)上運(yùn)行的指定應(yīng)用。有選擇地監(jiān)控消息,以檢測(cè)與在給定來(lái)賓虛擬機(jī)上運(yùn)行的指定應(yīng)用相關(guān)聯(lián)的故障狀態(tài)。響應(yīng)于檢測(cè)到故障狀態(tài),采取措施以糾正故障狀態(tài),其中,措施包括通過(guò)內(nèi)部通道將至少一個(gè)命令從管理程序發(fā)送到給定來(lái)賓虛擬機(jī)。
      【專利說(shuō)明】提供用于HA集群的管理程序的基于應(yīng)用的監(jiān)控及恢復(fù)

      【技術(shù)領(lǐng)域】
      [0001]在此公開和要求保護(hù)的本發(fā)明一般涉及一種方法和裝置,其中,管理程序被鏈接到一個(gè)或多個(gè)其它管理程序以形成高可用性(HA)集群。更具體地,本發(fā)明涉及一種上述類型的方法和裝置,其中,每個(gè)管理程序可使得多個(gè)來(lái)賓操作系統(tǒng)或來(lái)賓虛擬機(jī)(VM)能夠在主機(jī)計(jì)算平臺(tái)上同時(shí)運(yùn)行。

      【背景技術(shù)】
      [0002]某些虛擬化管理產(chǎn)品通過(guò)在其產(chǎn)品供應(yīng)中包括或嵌入HA集群產(chǎn)品來(lái)維持來(lái)賓VM的可用性。典型地,這些產(chǎn)品通過(guò)將底層管理程序形成為高可用性集群來(lái)工作,其中每個(gè)底層管理程序運(yùn)行在物理機(jī)上。然后,在管理程序之間執(zhí)行心跳。當(dāng)集群的成員或者由于管理程序故障或者由于物理服務(wù)器故障而心跳故障時(shí),所嵌入的HA集群技術(shù)在替代服務(wù)器上重新啟動(dòng)來(lái)賓VM,從而維持來(lái)賓VM的可用性。
      [0003]該方法有很多局限性。例如,該方法不能檢測(cè)來(lái)賓VM系統(tǒng)自身的故障并從中恢復(fù),除了來(lái)賓的操作系統(tǒng)全部崩潰以外。這種方法只檢測(cè)底層管理程序及其物理服務(wù)器的故障并從中恢復(fù)。它也不檢測(cè)在來(lái)賓VM內(nèi)運(yùn)行的應(yīng)用的故障并從中恢復(fù)。因此,應(yīng)用可在來(lái)賓VM內(nèi)運(yùn)行時(shí)發(fā)生故障,而基于管理程序的集群沒有注意到。在這種情況下,來(lái)賓機(jī)仍在運(yùn)行,但不提供服務(wù)。這對(duì)虛擬化系統(tǒng)的可實(shí)現(xiàn)的可用性造成明顯限制,因?yàn)楣收贤ǔJ怯捎诓僮飨到y(tǒng)問題,應(yīng)用崩潰并中止。此外,更復(fù)雜的關(guān)鍵業(yè)務(wù)應(yīng)用要求應(yīng)用級(jí)別的操作利用某個(gè)內(nèi)置數(shù)據(jù)復(fù)制技術(shù)。如果沒有來(lái)賓VM內(nèi)的任何可見性,則不可能調(diào)用這些操作并利用內(nèi)置特性。
      [0004]此外,希望利用管理程序級(jí)別的HA特性或來(lái)賓VM內(nèi)的HA特性的用戶通常必須精通并必須安裝管理程序級(jí)別和應(yīng)用級(jí)別的HA集群管理器。同時(shí),這種用戶必須確保表示資源之間的關(guān)系和確保例如文件系統(tǒng)被安裝在應(yīng)用被啟動(dòng)或者數(shù)據(jù)復(fù)制對(duì)的接收機(jī)在另一個(gè)物理系統(tǒng)上被啟動(dòng)為發(fā)送機(jī)的地方的策略被管理程序級(jí)別和應(yīng)用級(jí)別的HA系統(tǒng)維持。然而,這一級(jí)別的復(fù)雜性管理通常超出了大多數(shù)用戶的能力。


      【發(fā)明內(nèi)容】

      [0005]本發(fā)明的實(shí)施例可有選擇地采用方法、計(jì)算機(jī)程序產(chǎn)品或裝置的形式。針對(duì)方法的實(shí)施例與第一節(jié)點(diǎn)相關(guān)聯(lián),該第一節(jié)點(diǎn)包括管理程序和一個(gè)或多個(gè)來(lái)賓虛擬機(jī)(VM),其中,每個(gè)來(lái)賓虛擬機(jī)被安排以運(yùn)行一個(gè)或多個(gè)應(yīng)用,第一節(jié)點(diǎn)與一個(gè)或多個(gè)其它節(jié)點(diǎn)一起形成高可用性(HA)集群。該方法包括:在第一節(jié)點(diǎn)的每個(gè)來(lái)賓虛擬機(jī)和管理程序之間建立內(nèi)部雙向通信通道。該方法還包括:在管理程序和給定來(lái)賓VM之間,通過(guò)內(nèi)部通道發(fā)送包括命令和對(duì)命令的響應(yīng)的消息,其中,各個(gè)命令被發(fā)送以管理在給定來(lái)賓VM上運(yùn)行的指定應(yīng)用。有選擇地監(jiān)控消息,以檢測(cè)與在給定來(lái)賓虛擬機(jī)上運(yùn)行的指定應(yīng)用相關(guān)聯(lián)的故障狀態(tài)的發(fā)生。響應(yīng)于檢測(cè)到故障狀態(tài),采取措施以糾正故障狀態(tài),其中,措施包括通過(guò)內(nèi)部通道將至少一個(gè)命令從管理程序發(fā)送到給定來(lái)賓VM。

      【專利附圖】

      【附圖說(shuō)明】
      [0006]圖1A和IB是各自描繪HA節(jié)點(diǎn)集群的框圖,其中實(shí)現(xiàn)了本發(fā)明的說(shuō)明性實(shí)施例;
      [0007]圖2是說(shuō)明用于圖1A或IB的節(jié)點(diǎn)集群的節(jié)點(diǎn)的示意圖;
      [0008]圖3是示出包括本發(fā)明的實(shí)施例的方法的步驟的流程圖;
      [0009]圖4是示出可用作本發(fā)明的實(shí)施例的一個(gè)或多個(gè)組件的計(jì)算機(jī)或數(shù)據(jù)處理系統(tǒng)的框圖。

      【具體實(shí)施方式】
      [0010]所屬【技術(shù)領(lǐng)域】的技術(shù)人員知道,本發(fā)明的各個(gè)方面可以實(shí)現(xiàn)為系統(tǒng)、方法或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明的各個(gè)方面可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件實(shí)施方式、完全的軟件實(shí)施方式(包括固件、駐留軟件、微代碼等),或硬件和軟件方面結(jié)合的實(shí)施方式,這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。此外,在一些實(shí)施例中,本發(fā)明的各個(gè)方面還可以實(shí)現(xiàn)為在一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)中的計(jì)算機(jī)程序產(chǎn)品的形式,該計(jì)算機(jī)可讀介質(zhì)中包括計(jì)算機(jī)可讀的程序代碼。
      [0011]可以采用一個(gè)或多個(gè)計(jì)算機(jī)可讀介質(zhì)的任意組合。計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是一但不限于一電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)盤、硬盤、隨機(jī)存取內(nèi)存(RAM)、只讀內(nèi)存(ROM)、可擦式可編程只讀內(nèi)存(EPR0M或閃存)、光纖、便攜式緊湊盤只讀內(nèi)存(CD-ROM)、光內(nèi)存件、磁內(nèi)存件、或者上述的任意合適的組合。在本文件中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包括或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
      [0012]計(jì)算機(jī)可讀的信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括——但不限于——電磁信號(hào)、光信號(hào)或上述的任意合適的組合。計(jì)算機(jī)可讀的信號(hào)介質(zhì)還可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
      [0013]計(jì)算機(jī)可讀介質(zhì)上包括的程序代碼可以用任何適合的介質(zhì)傳輸,包括一但不限于一無(wú)線、有線、光纜、RF等等,或者上述的任意合適的組合。
      [0014]可以以一種或多種程序設(shè)計(jì)語(yǔ)言的任意組合來(lái)編寫用于執(zhí)行本發(fā)明操作的計(jì)算機(jī)程序代碼,所述程序設(shè)計(jì)語(yǔ)言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語(yǔ)言一諸如Java、Smalltalk、C++等,還包括常規(guī)的過(guò)程式程序設(shè)計(jì)語(yǔ)言一諸如“C”語(yǔ)言或類似的程序設(shè)計(jì)語(yǔ)言。程序代碼可以完全地在用戶計(jì)算機(jī)上執(zhí)行、部分地在用戶計(jì)算機(jī)上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算機(jī)上部分在遠(yuǎn)程計(jì)算機(jī)上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算機(jī)或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算機(jī)的情形中,遠(yuǎn)程計(jì)算機(jī)可以通過(guò)任意種類的網(wǎng)絡(luò)一包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN)—連接到用戶計(jì)算機(jī),或者,可以連接到外部計(jì)算機(jī)(例如利用因特網(wǎng)服務(wù)提供商來(lái)通過(guò)因特網(wǎng)連接)。
      [0015]下面將參照根據(jù)本發(fā)明實(shí)施例的方法、裝置(系統(tǒng))和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或框圖描述本發(fā)明。應(yīng)當(dāng)理解,流程圖和/或框圖的每個(gè)方框以及流程圖和/或框圖中各方框的組合,都可以由計(jì)算機(jī)程序指令實(shí)現(xiàn)。這些計(jì)算機(jī)程序指令可以提供給通用計(jì)算機(jī)、專用計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器,從而生產(chǎn)出一種機(jī)器,使得這些計(jì)算機(jī)程序指令在通過(guò)計(jì)算機(jī)或其它可編程數(shù)據(jù)處理裝置的處理器執(zhí)行時(shí),產(chǎn)生了實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的裝置。
      [0016]也可以把這些計(jì)算機(jī)程序指令存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中,這些指令使得計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備以給定方式工作,從而,存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)中的指令就產(chǎn)生出包括實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的指令的制造品(article of manufacture)。
      [0017]也可以把這些計(jì)算機(jī)程序指令加載到計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備中,以使一系列操作步驟在計(jì)算機(jī)、其它可編程數(shù)據(jù)處理裝置、或其它設(shè)備中執(zhí)行,以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的過(guò)程,以使得在計(jì)算機(jī)或其它可編程裝置上執(zhí)行的指令提供實(shí)現(xiàn)流程圖和/或框圖中的一個(gè)或多個(gè)方框中規(guī)定的功能/動(dòng)作的過(guò)程。
      [0018]參照?qǐng)D1A,示出了高可用性(HA)計(jì)算機(jī)集群100,其包括例如節(jié)點(diǎn)102和104的多個(gè)節(jié)點(diǎn)。節(jié)點(diǎn)102和104也可分別表示為節(jié)點(diǎn)I和節(jié)點(diǎn)N,其中N是節(jié)點(diǎn)的總數(shù)。有用地,N是2,但集群100并不限于此。各個(gè)節(jié)點(diǎn)一起通過(guò)總線106等形成集群。
      [0019]每個(gè)節(jié)點(diǎn)包括計(jì)算機(jī)服務(wù)器系統(tǒng),其根據(jù)本發(fā)明的實(shí)施例構(gòu)建或配置,如下文結(jié)合圖2所描述的。更具體地,每個(gè)節(jié)點(diǎn)包括管理程序和硬件平臺(tái),用于運(yùn)行應(yīng)用和多個(gè)來(lái)賓操作系統(tǒng),此處來(lái)賓操作系統(tǒng)被稱為來(lái)賓虛擬機(jī)(VM)。
      [0020]進(jìn)一步參照?qǐng)D1A,示出了纜線108,其用于將集群100的節(jié)點(diǎn)的每個(gè)管理程序互連,并承載其間的心跳脈沖或消息。如果應(yīng)用在給定節(jié)點(diǎn)上運(yùn)行,并且其它節(jié)點(diǎn)檢測(cè)到由給定節(jié)點(diǎn)發(fā)送的心跳的改變或故障,則其它節(jié)點(diǎn)將認(rèn)識(shí)到在給定節(jié)點(diǎn)的管理程序或物理服務(wù)器中已發(fā)生了故障。然后,其它節(jié)點(diǎn)可被啟動(dòng)以執(zhí)行故障轉(zhuǎn)移,以從由其它節(jié)點(diǎn)的管理程序管理的來(lái)賓VM運(yùn)行應(yīng)用。
      [0021]集群100是對(duì)等設(shè)置,因?yàn)榧簺]有配備中央管理器以指示或控制不同節(jié)點(diǎn)之間的故障轉(zhuǎn)移。作為替代,故障轉(zhuǎn)移由節(jié)點(diǎn)自身實(shí)施。
      [0022]參照?qǐng)D1B,再次示出了通過(guò)總線106 —起形成集群的節(jié)點(diǎn)102和節(jié)點(diǎn)104。然而,代替心跳線108,圖1B的集群裝備有HA集群管理器110。當(dāng)應(yīng)用在給定節(jié)點(diǎn)上運(yùn)行時(shí),給定節(jié)點(diǎn)所發(fā)送的心跳有管理器110監(jiān)控。在檢測(cè)到由心跳指示的故障后,管理器110可以實(shí)施故障轉(zhuǎn)移以在其它節(jié)點(diǎn)上運(yùn)行應(yīng)用。
      [0023]參照?qǐng)D2,示出了節(jié)點(diǎn)200,其可用作圖1A和圖1B中的節(jié)點(diǎn)102或節(jié)點(diǎn)104。節(jié)點(diǎn)200具有計(jì)算平臺(tái)202,其包括硬件組件204a和包括管理程序206的操作系統(tǒng)204b。硬件組件204a和主機(jī)204b工作以提供由管理程序206管理的來(lái)賓操作系統(tǒng)或虛擬機(jī)(VM) 208和210。來(lái)賓VM 208和210能夠運(yùn)行各自的應(yīng)用212和214,并裝備有用于控制并監(jiān)控這種應(yīng)用的應(yīng)用可用性管理器216和218。
      [0024]圖2還示出了本地HA集群管理器220,其通過(guò)諸如鏈路220a的雙向通信路徑管理管理程序206。如下文進(jìn)一步詳細(xì)描述的,提供HA集群管理器220以實(shí)施涉及節(jié)點(diǎn)200的故障轉(zhuǎn)移。例如,如果應(yīng)用在來(lái)賓VM上運(yùn)行,管理程序206將檢測(cè)到的故障通知集群管理器220,則HA集群管理器220可以指示管理程序206以使應(yīng)用在節(jié)點(diǎn)200的不同來(lái)賓VM或者相關(guān)聯(lián)的節(jié)點(diǎn)集群的不同節(jié)點(diǎn)的來(lái)賓VM上運(yùn)行。通過(guò)提供這種能力,節(jié)點(diǎn)集群能夠?qū)崿F(xiàn)高可用性。下文將更詳細(xì)地描述HA集群管理器220和管理程序206各自的操作以及二者之間的交互以監(jiān)控和管理來(lái)賓VM208、210和在來(lái)賓VM上運(yùn)行的應(yīng)用。
      [0025]在本發(fā)明的再一個(gè)實(shí)施例中,HA集群管理器220可以位于鄰近管理程序206的位置或者可包含在管理程序206內(nèi)。在該實(shí)施例中,這些組件的每一個(gè)可如上所述地起作用或工作。
      [0026]有用地,HA集群管理器220包括國(guó)際商用機(jī)器公司的Tivoli系統(tǒng)自動(dòng)化多平臺(tái)(TSA-MP)的組件。然而,本發(fā)明并不限于此。圖2還示出了 HA集群管理器220,其分別通過(guò)鏈路220b和220c與計(jì)算平臺(tái)202的本地文件系統(tǒng)組件222和224連接并進(jìn)行交互。這些文件系統(tǒng)組件用于分別與來(lái)賓VM216和218的數(shù)據(jù)傳輸,如在下文進(jìn)一步詳細(xì)描述的。
      [0027]進(jìn)一步參照?qǐng)D2,示出了 VM通道或內(nèi)部通道226,其在管理程序206和來(lái)賓VM 208的應(yīng)用可用性管理器216之間延伸。類似的內(nèi)部通道228在管理程序206和來(lái)賓VM 210的應(yīng)用可用性管理器218之間延伸。內(nèi)部通道226和228每個(gè)都是雙向的,并因此能夠在管理程序206與各自的來(lái)賓VM 208和210之間攜帶消息。圖2還示出了進(jìn)一步延伸到文件系統(tǒng)222的通道226和進(jìn)一步延伸到文件系統(tǒng)224的通道228。內(nèi)部通道226和228可以通過(guò)使用基于內(nèi)核的虛擬機(jī)(KVM)管理程序?qū)崿F(xiàn),雖然本發(fā)明并不限于此。
      [0028]內(nèi)部通道226包括預(yù)先指定的路徑,其用于在管理程序206和來(lái)賓VM208的應(yīng)用可用性管理器208之間在兩個(gè)方向上對(duì)數(shù)據(jù)進(jìn)行流傳輸。內(nèi)部通道226在其每一端包括預(yù)先指定的容量的存儲(chǔ)緩沖器,以通過(guò)通道對(duì)數(shù)據(jù)進(jìn)行流傳輸或接收流傳輸?shù)臄?shù)據(jù)。讀消息和寫消息可通過(guò)使用,創(chuàng)建并使用用于內(nèi)部通道上的通信的端口的API發(fā)送。端口可創(chuàng)建在管理程序處,也可創(chuàng)建在應(yīng)用可用性管理器216處。
      [0029]內(nèi)部通道228與內(nèi)部通道226類似或相同,除了內(nèi)部通道228在管理程序206和應(yīng)用可用性管理器218之間延伸以外。
      [0030]通過(guò)提供根據(jù)本發(fā)明的實(shí)施例并如上所述的通道226和228,通過(guò)管理程序206工作的HA集群管理器220被給予管理和控制在來(lái)賓VM 208和210上運(yùn)行的應(yīng)用的增強(qiáng)能力。例如,管理程序206能夠通過(guò)內(nèi)部通道226向來(lái)賓VM 208的內(nèi)核發(fā)送命令,更具體地,向來(lái)賓VM 208的應(yīng)用可用性管理器216發(fā)送。這些命令包括與應(yīng)用212相關(guān)的啟動(dòng)命令、停止命令和狀態(tài)查詢命令。響應(yīng)于這些命令,響應(yīng)代碼從來(lái)賓VM 208的管理器216發(fā)送回管理程序206。因此,當(dāng)應(yīng)用212在來(lái)賓VM 208上運(yùn)行時(shí),管理程序206能夠直接控制應(yīng)用212的運(yùn)行。
      [0031]此外,管理程序206可以通過(guò)內(nèi)部通道226向可用性管理器216發(fā)送消息,以請(qǐng)求在來(lái)賓VM 208上運(yùn)行的應(yīng)用212的狀態(tài)或可用性。由可用性管理器216通過(guò)內(nèi)部通道226提供的狀態(tài)信息可包括由管理器216記錄的錯(cuò)誤消息、應(yīng)用212的性能信息和諸如有限的存儲(chǔ)容量的警告消息。狀態(tài)信息還可進(jìn)一步包括閾值已被超過(guò)的通知,其與同應(yīng)用212相關(guān)聯(lián)的預(yù)先指定的規(guī)則有關(guān)。通過(guò)監(jiān)控從來(lái)賓VM 208的應(yīng)用可用性管理器216通過(guò)內(nèi)部通道226發(fā)送的對(duì)這些請(qǐng)求的響應(yīng)以及其它消息,可檢測(cè)已經(jīng)在運(yùn)行的應(yīng)用212或來(lái)賓VM208中發(fā)生的故障。在檢測(cè)到其中一個(gè)故障后,可采取糾正措施。因此,通過(guò)如上所述地提供應(yīng)用可用性管理器216以及內(nèi)部通道,可管理和監(jiān)控VM 208內(nèi)的應(yīng)用。
      [0032]HA集群管理器220能夠通過(guò)鏈路220a等從管理程序206獲得關(guān)于來(lái)賓VM 208和210兩者中的應(yīng)用可用性設(shè)備和硬件設(shè)備的狀態(tài)信息,這包括可用性管理器216和218。響應(yīng)于積累這些狀態(tài)信息,集群管理器220能夠基于預(yù)先制定的規(guī)則進(jìn)行決策,以用于對(duì)管理程序206執(zhí)行命令。這些命令可通過(guò)運(yùn)行腳本等執(zhí)行。因此,如果在運(yùn)行應(yīng)用212中檢測(cè)到故障,則如上所述,HA集群管理器220可指示管理程序206啟動(dòng)、停止、然后在同一個(gè)來(lái)賓VM 208上重新啟動(dòng)應(yīng)用212。該措施可通過(guò)從管理程序206通過(guò)內(nèi)部通道226向虛擬機(jī)208發(fā)送適合的命令序列容易地執(zhí)行。
      [0033]作為可選的糾正措施,應(yīng)用212可被停止,然后在節(jié)點(diǎn)200的不同來(lái)賓VM(例如來(lái)賓VM 210)上重新啟動(dòng)以運(yùn)行,。作為再一個(gè)糾正措施,應(yīng)用212可被停止,然后在位于節(jié)點(diǎn)集群100中除了節(jié)點(diǎn)200之外的節(jié)點(diǎn)上的來(lái)賓VM上重新啟動(dòng)以運(yùn)行。來(lái)賓VM可以是來(lái)賓VM 208或者不同的來(lái)賓VM。正如本領(lǐng)域技術(shù)人員知道并在此使用的,上述類型的措施成為“故障轉(zhuǎn)移”和“實(shí)施故障轉(zhuǎn)移”。
      [0034]應(yīng)當(dāng)知道,上述的來(lái)賓VM 208、應(yīng)用212、管理器216和內(nèi)部通道226的功能和運(yùn)行的描述也分別適用于來(lái)賓VM 210、應(yīng)用214、管理器218和內(nèi)部通道228。
      [0035]當(dāng)應(yīng)用在如圖2所示的類型的來(lái)賓VM上運(yùn)行時(shí),需要跟蹤由此產(chǎn)生的并與其相關(guān)聯(lián)的數(shù)據(jù)。需要確保這樣的數(shù)據(jù)在如上所述地發(fā)生故障轉(zhuǎn)移到不同的節(jié)點(diǎn)或者轉(zhuǎn)移到同一個(gè)節(jié)點(diǎn)的不同來(lái)賓VM的情況下可用。為此,在如上所述的節(jié)點(diǎn)集群100的每個(gè)節(jié)點(diǎn)上分發(fā)復(fù)制軟件。并且,如圖2所示,來(lái)賓VM 208和210分別裝備了 I/O模擬器230和232。每個(gè)模擬器使得數(shù)據(jù)能夠被對(duì)應(yīng)的來(lái)賓VM接收和從對(duì)應(yīng)的來(lái)賓VM發(fā)送。I/O設(shè)備請(qǐng)求組件234與模擬器230相關(guān)聯(lián),并連接到內(nèi)部通道226。組件234響應(yīng)通過(guò)內(nèi)部通道226發(fā)送的命令,以使數(shù)據(jù)在來(lái)賓VM 208和計(jì)算平臺(tái)202的文件系統(tǒng)222之間有選擇性地交換。類似的I/O設(shè)備請(qǐng)求組件236與I/O模擬器232相關(guān)聯(lián),并連接到內(nèi)部通道228。
      [0036]當(dāng)應(yīng)用212在來(lái)賓VM 208上運(yùn)行時(shí),諸如組件234的組件作為復(fù)制發(fā)送器運(yùn)行。也就是說(shuō),它使與運(yùn)行的應(yīng)用212相關(guān)聯(lián)的進(jìn)入數(shù)據(jù)和其它數(shù)據(jù)被諸如文件系統(tǒng)222等復(fù)制和存儲(chǔ)。在此期間,諸如來(lái)賓VM 210的組件236的組件可作為復(fù)制接收器運(yùn)行。復(fù)制接收器用于接收或跟蹤已被復(fù)制發(fā)送器復(fù)制的數(shù)據(jù)。然后,如果如上所述地發(fā)生故障,則應(yīng)用212可在來(lái)賓VM 208上停止,并在來(lái)賓VM 210上啟動(dòng)。如果發(fā)生這種情況,則命令通過(guò)內(nèi)部通道228從管理器220發(fā)送到組件236,其中命令指示組件236以執(zhí)行復(fù)制發(fā)送器的功能而非復(fù)制接收器的功能。類似地,指示組件234以執(zhí)行復(fù)制接收器的功能。然后,被復(fù)制發(fā)送器236復(fù)制的數(shù)據(jù)可被路由以用于存儲(chǔ)。可選地,在SAP AG的隊(duì)列復(fù)制服務(wù)(ENQREP)的情況下,在存儲(chǔ)器中保存所復(fù)制的數(shù)據(jù)。如果SAP隊(duì)列服務(wù)(ENQ)終止并在ENQREP的來(lái)賓機(jī)上重新啟動(dòng),則它通過(guò)存儲(chǔ)器到存儲(chǔ)器轉(zhuǎn)儲(chǔ)來(lái)獲取其數(shù)據(jù),這種轉(zhuǎn)儲(chǔ)比任何存儲(chǔ)器存取更快。
      [0037]通過(guò)如上所述地在圖2的配置中提供VM或內(nèi)部通道,本發(fā)明的實(shí)施例向其用戶提供更重要的益處。更具體地,HA集群管理器220可以是可能很復(fù)雜的高可用性集群管理產(chǎn)品的組件。例如,這種產(chǎn)品可包括復(fù)雜的管理腳本和資源配置。然而,在圖2的實(shí)施例中,這種腳本和配置都包含在管理程序206中,如組件238所示。因此,使用圖2的實(shí)施例以在來(lái)賓VM 208和210等上運(yùn)行其應(yīng)用的用戶不需要學(xué)習(xí)或熟悉集群管理產(chǎn)品的所有腳本和資源。
      [0038]參照?qǐng)D3,示出了包括本發(fā)明的實(shí)施例的方法的步驟。在步驟302中,在計(jì)算平臺(tái)的管理程序和多個(gè)來(lái)賓VM的每一個(gè)之間建立內(nèi)部雙向通道,其中管理程序和來(lái)賓VM被包括在節(jié)點(diǎn)集群的節(jié)點(diǎn)中。在步驟304中,通過(guò)管理程序和一個(gè)來(lái)賓VM之間的內(nèi)部通道發(fā)送消息,以管理在該來(lái)賓VM上運(yùn)行的應(yīng)用。步驟306公開了監(jiān)控通過(guò)內(nèi)部通道發(fā)送的消息,以便檢測(cè)在來(lái)賓VM上運(yùn)行的應(yīng)用的故障。
      [0039]響應(yīng)于檢測(cè)到故障,采取糾正措施,其包括通過(guò)內(nèi)部通道,從管理程序向來(lái)賓VM發(fā)送命令,其中,命令停止然后重新啟動(dòng)在來(lái)賓VM上運(yùn)行的應(yīng)用。根據(jù)決策步驟310,如果步驟308的糾正措施成功,以使得所檢測(cè)到的故障被克服,則圖3的方法結(jié)束。否則,方法進(jìn)行到步驟312。
      [0040]在步驟312中,選擇若干進(jìn)一步的措施中的一個(gè)。這些措施的每一個(gè)最初包括停止在來(lái)賓VM上運(yùn)行的應(yīng)用,這通常通過(guò)從管理程序通過(guò)內(nèi)部通道向來(lái)賓VM發(fā)送停止命令來(lái)實(shí)現(xiàn)。然后,進(jìn)一步的措施分別包括:在同一個(gè)節(jié)點(diǎn)的不同來(lái)賓VM上運(yùn)行應(yīng)用;在集群的不同節(jié)點(diǎn)上運(yùn)行應(yīng)用和來(lái)賓VM;以及在不同節(jié)點(diǎn)的不同來(lái)賓VM上運(yùn)行應(yīng)用。在采取這些措施之一后,圖3的方法結(jié)束。
      [0041]圖4是示出根據(jù)說(shuō)明性的實(shí)施例的數(shù)據(jù)處理系統(tǒng)的框圖。數(shù)據(jù)處理系統(tǒng)400是計(jì)算機(jī)的例子,其可用于實(shí)現(xiàn)本發(fā)明的實(shí)施例的一個(gè)或多個(gè)組件,并可在其中設(shè)有用于說(shuō)明性的實(shí)施例的實(shí)現(xiàn)相關(guān)過(guò)程的計(jì)算機(jī)可用程序代碼或指令。在該說(shuō)明性的例子中,數(shù)據(jù)處理系統(tǒng)400包括通信架構(gòu)402,其提供處理器單元404、存儲(chǔ)器406、永久存儲(chǔ)器408、通信單元410,輸入/輸出(I/O)單元412和顯示器414之間的通信。
      [0042]處理器單元404用于執(zhí)行可裝載入存儲(chǔ)器406的軟件指令。處理器單元404可以是一個(gè)或多個(gè)處理器的集合或者可以是多處理器核,這取決于具體實(shí)現(xiàn)。進(jìn)一步地,處理器單元404可使用一個(gè)或多個(gè)異構(gòu)處理器系統(tǒng)實(shí)現(xiàn),其中主處理器與次級(jí)處理器一起在單個(gè)芯片上提供。作為另一個(gè)說(shuō)明性的例子,處理器單元404可以是包含多個(gè)相同類型的處理器的對(duì)稱多處理器系統(tǒng)。
      [0043]存儲(chǔ)器406和永久存儲(chǔ)器408是存儲(chǔ)設(shè)備416的例子。存儲(chǔ)設(shè)備是任何能夠存儲(chǔ)信息的硬件,信息例如但不限于是數(shù)據(jù)、功能形式的程序代碼和/或其它適合的臨時(shí)和/或永久的信息。在這些例子中,存儲(chǔ)器406可以例如是隨機(jī)存取存儲(chǔ)器或者任何其它適合的易失性或非易失性存儲(chǔ)設(shè)備。永久存儲(chǔ)器408可以采用各種形式,這取決于具體實(shí)現(xiàn)。例如,永久存儲(chǔ)器408可包含一個(gè)或多個(gè)組件或器件。例如,永久存儲(chǔ)器408可以是硬盤、閃存、可重寫光盤、可重寫磁帶或者上述的一些組合。永久存儲(chǔ)器408所使用的介質(zhì)可以是可移除的。例如,可移除硬盤驅(qū)動(dòng)器可用于永久存儲(chǔ)器408。
      [0044]在這些例子中,通信單元410提供與其它數(shù)據(jù)處理系統(tǒng)或設(shè)備之間的通信。在這些例子中,通信單元410是網(wǎng)絡(luò)接口卡。通信單元410可通過(guò)使用物理通信鏈路和無(wú)線通信鏈路的任意之一或兩者來(lái)提供通信。
      [0045]輸入/輸出單元412允許與可連接到數(shù)據(jù)處理系統(tǒng)400的其它設(shè)備的數(shù)據(jù)輸入和輸出。例如,輸入/輸出單元412可向通過(guò)鍵盤、鼠標(biāo)和/或其它適合的輸入設(shè)備的用戶輸入提供連接。進(jìn)一步地,輸入/輸出單元412可向打印機(jī)發(fā)送輸出。顯示器414提供向用戶顯示信息的機(jī)制。
      [0046]用于操縱系統(tǒng)、應(yīng)用和/或程序的指令可設(shè)在存儲(chǔ)設(shè)備416中,其通過(guò)通信架構(gòu)402與處理器單元404進(jìn)行通信。在這些說(shuō)明性例子中,指令在永久存儲(chǔ)器408上采用功能形式。這些指令可被加載到存儲(chǔ)器406中以用于由處理器單元404執(zhí)行。不同的實(shí)施例的過(guò)程可由處理器單元404使用計(jì)算機(jī)實(shí)現(xiàn)的指令執(zhí)行,其中計(jì)算機(jī)實(shí)現(xiàn)的指令可設(shè)在存儲(chǔ)器中,諸如存儲(chǔ)器406。
      [0047]這些指令指可稱為程序代碼、計(jì)算機(jī)可用程序代碼、或者計(jì)算機(jī)可讀程序代碼,其可由處理器單元404中的處理器讀取并執(zhí)行。在不同的實(shí)施例中,程序代碼可包含在不同的物理或計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,諸如存儲(chǔ)器406或永久存儲(chǔ)器408。
      [0048]程序代碼418以功能形式設(shè)在可選擇地移除的計(jì)算機(jī)可讀介質(zhì)420上,并可被加載到或傳送到數(shù)據(jù)處理系統(tǒng)400以用于由處理器單元404執(zhí)行。程序代碼418和計(jì)算機(jī)可讀介質(zhì)420形成計(jì)算機(jī)程序產(chǎn)品422。在一個(gè)例子中,計(jì)算機(jī)可讀介質(zhì)420可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)424或計(jì)算機(jī)可讀信號(hào)介質(zhì)426。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)424可以包括例如光盤或磁盤,其被插入或置入是永久存儲(chǔ)器408的一部分的驅(qū)動(dòng)器或其它設(shè)備中,以用于傳送到是永久存儲(chǔ)器408的一部分的存儲(chǔ)設(shè)備上,諸如硬盤驅(qū)動(dòng)器。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)424也可以采用永久存儲(chǔ)器的形式,諸如連接到數(shù)據(jù)處理系統(tǒng)400的硬盤驅(qū)動(dòng)器、拇指驅(qū)動(dòng)器或閃存。在一些實(shí)例中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)424不可以從數(shù)據(jù)處理系統(tǒng)400中移除。
      [0049]可選地,程序代碼418可使用計(jì)算機(jī)可讀信號(hào)介質(zhì)426而傳送到數(shù)據(jù)處理系統(tǒng)400。計(jì)算機(jī)可讀信號(hào)介質(zhì)426可以是例如包含程序代碼418的傳播數(shù)據(jù)信號(hào)。例如,計(jì)算機(jī)可讀信號(hào)介質(zhì)426可以是電磁信號(hào)、光信號(hào)和/或任何其它合適類型的信號(hào)。這些信號(hào)可通過(guò)通信鏈路傳輸,諸如無(wú)線通信鏈路、光纖電纜、同軸電纜、電線和/或任何其它合適類型的通信鏈路。換句話說(shuō),在說(shuō)明性的例子中,通信鏈路和/或連接可以是物理的或無(wú)線的。計(jì)算機(jī)可讀介質(zhì)還可以采用非有形介質(zhì)的形式,諸如包含程序代碼的通信鏈路或無(wú)線傳輸。
      [0050]在一些說(shuō)明性的實(shí)施例中,程序代碼418可通過(guò)在數(shù)據(jù)處理系統(tǒng)400內(nèi)使用的計(jì)算機(jī)可讀信號(hào)介質(zhì)426從另一個(gè)設(shè)備或數(shù)據(jù)處理系統(tǒng)通過(guò)網(wǎng)絡(luò)下載到永久存儲(chǔ)器408上。例如,在服務(wù)器數(shù)據(jù)處理系統(tǒng)中的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中存儲(chǔ)的程序代碼可通過(guò)網(wǎng)絡(luò)從服務(wù)器下載到數(shù)據(jù)處理系統(tǒng)400上。提供程序代碼418的數(shù)據(jù)處理系統(tǒng)可以是服務(wù)器計(jì)算機(jī)、客戶端計(jì)算機(jī)或某些其它能夠存儲(chǔ)并傳輸程序代碼418的設(shè)備。
      [0051]用于數(shù)據(jù)處理系統(tǒng)400的不同組件并不意味著對(duì)可實(shí)現(xiàn)不同實(shí)施例的方式提供物理或結(jié)構(gòu)的限制。不同的說(shuō)明性實(shí)施例可在除了包括用于數(shù)據(jù)處理系統(tǒng)400的組件之外還包括其它組件的數(shù)據(jù)處理系統(tǒng)中實(shí)現(xiàn),和/或在包括代替數(shù)據(jù)處理系統(tǒng)400的組件的組件的數(shù)據(jù)處理系統(tǒng)中實(shí)現(xiàn)。圖4中所示的其它組件可根據(jù)所示的說(shuō)明性例子改變。不同的實(shí)施例可使用任何能夠執(zhí)行程序代碼的硬件設(shè)備或系統(tǒng)實(shí)現(xiàn)。作為一個(gè)例子,數(shù)據(jù)處理系統(tǒng)400可包括與無(wú)機(jī)組件集成的有機(jī)組件和/或可完全由不包括人類的有機(jī)組件構(gòu)成。例如,存儲(chǔ)設(shè)備可以包括有機(jī)半導(dǎo)體。
      [0052]作為另一個(gè)例子,數(shù)據(jù)處理系統(tǒng)400中的存儲(chǔ)設(shè)備是任何可存儲(chǔ)數(shù)據(jù)的硬件裝置。存儲(chǔ)器406、永久存儲(chǔ)器408和計(jì)算機(jī)可讀介質(zhì)420是采用有形形式的存儲(chǔ)設(shè)備的例子。
      [0053]在另一個(gè)例子中,總線系統(tǒng)可用于實(shí)現(xiàn)通信架構(gòu)402,并可包括一個(gè)或多個(gè)總線,諸如系統(tǒng)總線或輸入/輸出總線。當(dāng)然,總線系統(tǒng)可使用任何合適類型的在連接到總線系統(tǒng)的不同組件或設(shè)備之間提供數(shù)據(jù)傳送的架構(gòu)實(shí)現(xiàn)。此外,通信單元可以包括一個(gè)或多個(gè)用于傳輸和接收數(shù)據(jù)的設(shè)備,諸如調(diào)制解調(diào)器或網(wǎng)絡(luò)適配器。進(jìn)一步地,存儲(chǔ)器可以是例如存儲(chǔ)器406或緩存器,諸如在可在通信架構(gòu)402中提供的接口和存儲(chǔ)器控制器集線器中發(fā)現(xiàn)的。
      [0054]已經(jīng)給出了本發(fā)明的各種實(shí)施例的描述以用于說(shuō)明的目的,但并不意味著窮盡或限制在此公開的實(shí)施例。對(duì)于本領(lǐng)域技術(shù)人員來(lái)說(shuō),在不脫離所描述的實(shí)施例的范圍和精神的前提下,顯然可以進(jìn)行許多修改和變形。在此使用的術(shù)語(yǔ)被選擇以最佳地解釋本發(fā)明的原理、實(shí)際應(yīng)用或?qū)ΜF(xiàn)有技術(shù)的技術(shù)改進(jìn),或者以使得本領(lǐng)域技術(shù)人員能夠更好地理解在此公開的實(shí)施例。
      [0055]附圖中的流程圖和框圖說(shuō)明了根據(jù)本發(fā)明的各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表代碼的模塊、片段或一部分,其包括一個(gè)或多個(gè)用于實(shí)現(xiàn)指定的邏輯功能的可執(zhí)行指令。還應(yīng)當(dāng)注意,在某些可選的的實(shí)現(xiàn)中,在方框中所標(biāo)注的功能可以按照不同于附圖中所標(biāo)注的順序發(fā)生。例如,顯示為連續(xù)的兩個(gè)方框?qū)嶋H上可以基本并行地執(zhí)行,或者有時(shí)可以按相反的順序執(zhí)行,這取決于所涉及的功能。也應(yīng)當(dāng)注意,框圖和/或流程圖中的每個(gè)方框以及框圖和/或流程圖中的方框的組合可以通過(guò)執(zhí)行指定功能或動(dòng)作的專用的基于硬件的系統(tǒng)或者專用硬件與計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。
      【權(quán)利要求】
      1.一種方法,與第一節(jié)點(diǎn)相關(guān)聯(lián),所述第一節(jié)點(diǎn)包括管理程序和一個(gè)或多個(gè)來(lái)賓虛擬機(jī)(VM),其中每個(gè)來(lái)賓虛擬機(jī)被安排以運(yùn)行一個(gè)或多個(gè)應(yīng)用,所述第一節(jié)點(diǎn)與一個(gè)或多個(gè)其它節(jié)點(diǎn)一起形成高可用性(HA)集群,所述方法包括以下步驟: 在所述第一節(jié)點(diǎn)的每個(gè)來(lái)賓虛擬機(jī)和管理程序之間,建立內(nèi)部雙向通信通道; 在所述管理程序和給定來(lái)賓虛擬機(jī)之間,通過(guò)所述內(nèi)部通道發(fā)送包括命令和對(duì)命令的響應(yīng)的消息,其中,各個(gè)命令被發(fā)送以管理在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的指定應(yīng)用; 有選擇地監(jiān)控所述消息,以檢測(cè)與在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的所述指定應(yīng)用相關(guān)聯(lián)的故障狀態(tài)的發(fā)生;以及 響應(yīng)于檢測(cè)到故障狀態(tài),采取措施以糾正所述故障狀態(tài),其中,所述措施包括通過(guò)所述內(nèi)部通道將至少一個(gè)命令從所述管理程序發(fā)送到所述給定來(lái)賓虛擬機(jī)。
      2.根據(jù)權(quán)利要求1所述的方法,其中, 每個(gè)所述內(nèi)部雙向通道建立在與一個(gè)所述來(lái)賓虛擬機(jī)相關(guān)聯(lián)的應(yīng)用可用性管理器和所述第一節(jié)點(diǎn)的所述管理程序之間。
      3.根據(jù)權(quán)利要求1所述的方法,其中,所述糾正的措施選擇性地包括: 通過(guò)所述內(nèi)部通道,將命令序列從所述管理程序發(fā)送到所述給定來(lái)賓虛擬機(jī),以停止在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的所述指定應(yīng)用,然后,在所述第一節(jié)點(diǎn)中,在所述給定來(lái)賓虛擬機(jī)上重新啟動(dòng)所述指定應(yīng)用;或者 實(shí)現(xiàn)所述指定應(yīng)用的故障轉(zhuǎn)移到所述第一節(jié)點(diǎn)的除了所述給定來(lái)賓虛擬機(jī)之外的另一個(gè)來(lái)賓虛擬機(jī),并在所述另一個(gè)來(lái)賓虛擬機(jī)上運(yùn)行所述指定應(yīng)用。
      4.根據(jù)權(quán)利要求3所述的方法,其中, 在故障轉(zhuǎn)移到所述另一個(gè)來(lái)賓虛擬機(jī)之前,所述另一個(gè)來(lái)賓虛擬機(jī)的指定組件被用作復(fù)制接收器;在故障轉(zhuǎn)移到所述另一個(gè)來(lái)賓虛擬機(jī)之后,響應(yīng)于通過(guò)所述內(nèi)部通道從所述管理程序發(fā)送到所述另一個(gè)來(lái)賓虛擬機(jī)的命令,所述另一個(gè)來(lái)賓虛擬機(jī)的所述指定組件被用作復(fù)制發(fā)送器。
      5.根據(jù)權(quán)利要求4所述的方法,其中, 在故障轉(zhuǎn)移到所述另一個(gè)來(lái)賓虛擬機(jī)之后,進(jìn)入數(shù)據(jù)被路由到所述另一個(gè)來(lái)賓虛擬機(jī),并被所述復(fù)制發(fā)送器復(fù)制到與所述另一個(gè)來(lái)賓虛擬機(jī)相關(guān)聯(lián)的存儲(chǔ)器,所述給定來(lái)賓虛擬機(jī)的指定組件被用作復(fù)制接收器。
      6.根據(jù)權(quán)利要求1所述的方法,其中,所述糾正的措施包括: 實(shí)現(xiàn)所述指定應(yīng)用和所述給定來(lái)賓虛擬機(jī)的故障轉(zhuǎn)移到所述高可用性集群的第二節(jié)點(diǎn),以及在所述第二節(jié)點(diǎn)中,在所述給定來(lái)賓虛擬機(jī)上運(yùn)行所述指定應(yīng)用。
      7.根據(jù)權(quán)利要求1所述的方法,其中,所述糾正的措施包括: 實(shí)現(xiàn)所述指定應(yīng)用的故障轉(zhuǎn)移到所述高可用性集群的第二節(jié)點(diǎn),以及在所述第二節(jié)點(diǎn)中,在除了所述給定來(lái)賓虛擬機(jī)之外的來(lái)賓虛擬機(jī)上運(yùn)行所述指定應(yīng)用。
      8.根據(jù)權(quán)利要求1所述的方法,其中, 在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的所述指定應(yīng)用由與所述管理程序相關(guān)聯(lián)的高可用性集群管理器管理,其中,所述高可用性集群管理器要求指定的管理腳本和配置資源以用于其運(yùn)行,并且所有所述腳本和配置都包括在所述管理程序中。
      9.根據(jù)權(quán)利要求1所述的方法,其中, 所述高可用性集群具備用于監(jiān)控由所述高可用性集群的各個(gè)節(jié)點(diǎn)產(chǎn)生的心跳的系統(tǒng),其中,節(jié)點(diǎn)的故障通過(guò)由此產(chǎn)生的所述心跳的缺陷指示。
      10.根據(jù)權(quán)利要求1所述的方法,其中, 所述高可用性集群的每個(gè)節(jié)點(diǎn)具有本地高可用性管理器,其中,節(jié)點(diǎn)中的來(lái)賓虛擬機(jī)故障由其高可用性管理器檢測(cè)。
      11.一種能夠在可記錄存儲(chǔ)介質(zhì)中執(zhí)行的計(jì)算機(jī)程序產(chǎn)品,與第一節(jié)點(diǎn)相關(guān)聯(lián),所述第一節(jié)點(diǎn)包括管理程序和一個(gè)或多個(gè)來(lái)賓虛擬機(jī),其中每個(gè)來(lái)賓虛擬機(jī)被安排以運(yùn)行一個(gè)或多個(gè)應(yīng)用,所述第一節(jié)點(diǎn)與一個(gè)或多個(gè)其它節(jié)點(diǎn)一起形成高可用性(HA)集群,所述計(jì)算機(jī)程序產(chǎn)品包括: 用于在所述第一節(jié)點(diǎn)的每個(gè)來(lái)賓虛擬機(jī)和所述管理程序之間建立內(nèi)部雙向通信通道的指令; 用于在所述管理程序和給定來(lái)賓虛擬機(jī)之間,通過(guò)所述內(nèi)部通道發(fā)送包括命令和對(duì)命令的響應(yīng)的消息的指令,其中,各個(gè)命令被發(fā)送以管理在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的指定應(yīng)用; 用于有選擇地監(jiān)控所述消息以檢測(cè)與在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的所述指定應(yīng)用相關(guān)聯(lián)的故障狀態(tài)的發(fā)生的指令;以及 用于響應(yīng)于檢測(cè)到故障狀態(tài),采取措施以糾正所述故障狀態(tài)的指令,其中,所述措施包括通過(guò)所述內(nèi)部通道,將至少一個(gè)命令從所述管理程序發(fā)送到所述給定來(lái)賓虛擬機(jī)。
      12.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序產(chǎn)品,其中, 每個(gè)所述內(nèi)部雙向通道建立在與一個(gè)所述來(lái)賓虛擬機(jī)相關(guān)聯(lián)的應(yīng)用可用性管理器和所述第一節(jié)點(diǎn)的所述管理程序之間。
      13.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述糾正的措施選擇性地包括: 通過(guò)所述內(nèi)部通道,將命令序列從所述管理程序發(fā)送到所述給定來(lái)賓虛擬機(jī),以停止在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的所述指定應(yīng)用,然后,在所述第一節(jié)點(diǎn)中,在所述給定來(lái)賓虛擬機(jī)上重新啟動(dòng)所述指定應(yīng)用;或者 實(shí)現(xiàn)所述指定應(yīng)用的故障轉(zhuǎn)移到所述第一節(jié)點(diǎn)中除了所述給定來(lái)賓虛擬機(jī)之外的另一個(gè)來(lái)賓虛擬機(jī),以及在所述另一個(gè)來(lái)賓虛擬機(jī)上運(yùn)行所述指定應(yīng)用。
      14.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序產(chǎn)品,其中,所述糾正的措施包括: 實(shí)現(xiàn)所述指定應(yīng)用的故障轉(zhuǎn)移到所述高可用性集群的第二節(jié)點(diǎn),以及在所述第二節(jié)點(diǎn)中,在除了所述給定來(lái)賓虛擬機(jī)之外的來(lái)賓虛擬機(jī)上運(yùn)行所述指定應(yīng)用。
      15.根據(jù)權(quán)利要求11所述的計(jì)算機(jī)程序產(chǎn)品,其特征在于: 在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的所述指定應(yīng)用由與所述管理程序相關(guān)聯(lián)的高可用性集群管理器管理,其中,所述高可用性集群管理器要求指定的管理腳本和配置資源以用于其運(yùn)行,并且所有所述腳本和配置都包括在所述管理程序中。
      16.一種裝置,與第一節(jié)點(diǎn)相關(guān)聯(lián),所述第一節(jié)點(diǎn)包括管理程序和一個(gè)或多個(gè)來(lái)賓虛擬機(jī),其中每個(gè)來(lái)賓虛擬機(jī)被安排以運(yùn)行一個(gè)或多個(gè)應(yīng)用,所述第一節(jié)點(diǎn)與一個(gè)或多個(gè)其它節(jié)點(diǎn)一起形成高可用性(HA)集群,所述裝置包括: 用于在所述第一節(jié)點(diǎn)的每個(gè)來(lái)賓虛擬機(jī)和所述管理程序之間建立內(nèi)部雙向通信通道的處理器裝置; 用于在所述管理程序和給定來(lái)賓虛擬機(jī)之間,通過(guò)所述內(nèi)部通道發(fā)送包括命令和對(duì)命令的響應(yīng)的消息的處理器裝置,其中,各個(gè)命令被發(fā)送以管理在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的指定應(yīng)用; 用于有選擇地監(jiān)控所述消息以檢測(cè)與在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的所述指定應(yīng)用相關(guān)聯(lián)的故障狀態(tài)的發(fā)生的處理器裝置;以及 用于響應(yīng)于檢測(cè)到故障狀態(tài),采取措施以糾正所述故障狀態(tài)的處理器裝置,其中,所述措施包括通過(guò)所述內(nèi)部通道,將至少一個(gè)命令從所述管理程序發(fā)送到所述給定來(lái)賓虛擬機(jī)。
      17.根據(jù)權(quán)利要求16所述的裝置,其中, 每個(gè)所述內(nèi)部雙向通道建立在與一個(gè)所述來(lái)賓虛擬機(jī)相關(guān)聯(lián)的應(yīng)用可用性管理器和所述第一節(jié)點(diǎn)的所述管理程序之間。
      18.根據(jù)權(quán)利要求16所述的裝置,其中,所述糾正的措施選擇性地包括: 通過(guò)所述內(nèi)部通道,將命令序列從所述管理程序發(fā)送到所述給定來(lái)賓虛擬機(jī),以停止在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的所述指定應(yīng)用,然后在所述第一節(jié)點(diǎn)中,在所述給定來(lái)賓虛擬機(jī)上重新啟動(dòng)所述指定應(yīng)用;或者 實(shí)現(xiàn)所述指定應(yīng)用的故障轉(zhuǎn)移到所述第一節(jié)點(diǎn)中除了所述給定來(lái)賓虛擬機(jī)之外的另一個(gè)來(lái)賓虛擬機(jī),以及在所述另一個(gè)來(lái)賓虛擬機(jī)上運(yùn)行所述指定應(yīng)用。
      19.根據(jù)權(quán)利要求16所述的裝置,其中,所述糾正的措施包括: 實(shí)現(xiàn)所述指定應(yīng)用的故障轉(zhuǎn)移到所述高可用性集群的第二節(jié)點(diǎn),以及在所述第二節(jié)點(diǎn)中,在除了所述給定來(lái)賓虛擬機(jī)之外的來(lái)賓虛擬機(jī)上運(yùn)行所述指定應(yīng)用。
      20.根據(jù)權(quán)利要求16所述的裝置,其中, 在所述給定來(lái)賓虛擬機(jī)上運(yùn)行的所述指定應(yīng)用由與所述管理程序相關(guān)聯(lián)的高可用性集群管理器管理,其中,所述高可用性集群管理器要求指定的管理腳本和配置資源以用于其運(yùn)行,并且所有所述腳本和配置都包括在所述管理程序中。
      【文檔編號(hào)】G06F11/30GK104205060SQ201380018522
      【公開日】2014年12月10日 申請(qǐng)日期:2013年3月26日 優(yōu)先權(quán)日:2012年4月12日
      【發(fā)明者】M·穆勒, M·米特爾施塔特, R·E·哈珀, L·F·斯帕諾維爾 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1