国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法及系統(tǒng)的制作方法

      文檔序號(hào):6623610閱讀:247來(lái)源:國(guó)知局
      基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法及系統(tǒng)的制作方法
      【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法:S1、設(shè)置至少兩個(gè)控制節(jié)點(diǎn)和至少兩個(gè)計(jì)算節(jié)點(diǎn);將其中一個(gè)控制節(jié)點(diǎn)設(shè)置為主控制節(jié)點(diǎn),將其他的控制節(jié)點(diǎn)設(shè)置為備控制節(jié)點(diǎn)并配置其優(yōu)先級(jí)順序;設(shè)置主控制節(jié)點(diǎn)的優(yōu)先級(jí)高于任何一備控制節(jié)點(diǎn);S2、各控制節(jié)點(diǎn)分別重復(fù)采集并存儲(chǔ)所有的計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù);S3、判斷當(dāng)前控制節(jié)點(diǎn)是否為主控制節(jié)點(diǎn),如果是則跳轉(zhuǎn)到步驟S5;否則跳轉(zhuǎn)到步驟S4;S4、優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)主控制節(jié)點(diǎn)是否出現(xiàn)故障;優(yōu)先級(jí)低的備控制節(jié)點(diǎn)實(shí)時(shí)探測(cè)比其優(yōu)先級(jí)高一級(jí)的備控制節(jié)點(diǎn)是否出現(xiàn)故障;如是則修改優(yōu)先級(jí)順序;S5、主控制節(jié)點(diǎn)分析存儲(chǔ)的健康狀態(tài)數(shù)據(jù),根據(jù)分析結(jié)果對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理。
      【專(zhuān)利說(shuō)明】基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法及系統(tǒng)

      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明涉及一種計(jì)算機(jī)高可用【技術(shù)領(lǐng)域】,尤其涉及一種基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法及系統(tǒng)。

      【背景技術(shù)】
      [0002]計(jì)算機(jī)系統(tǒng)的可靠性用平均無(wú)故障時(shí)間來(lái)度量,即計(jì)算機(jī)系統(tǒng)平均能夠正常運(yùn)行多長(zhǎng)時(shí)間,才發(fā)生一次故障。計(jì)算機(jī)系統(tǒng)的可用性定義為系統(tǒng)保持正常運(yùn)行時(shí)間的百分比。高可用性(High Availability ;HA)用于描述一個(gè)系統(tǒng)經(jīng)過(guò)專(zhuān)門(mén)的設(shè)計(jì),從而減少停工時(shí)間,而保持其服務(wù)的高度可用性。為了提高服務(wù)器設(shè)備或軟件的高可用性,目前常用的方法主要有:
      [0003]1、雙機(jī)冷備份技術(shù):主機(jī)處于運(yùn)行狀態(tài),備份機(jī)處于等待狀態(tài)。一旦主機(jī)出現(xiàn)故障,備份機(jī)立即開(kāi)啟主機(jī)的服務(wù)。
      [0004]2、雙機(jī)熱備份技術(shù):該技術(shù)即為目前通常所說(shuō)的激活(active)/等待(standby)工作方式,Active和standby設(shè)備具有相同的硬件配置和軟件系統(tǒng)。一旦active設(shè)備出現(xiàn)故障的時(shí)候,standby設(shè)備立即激活應(yīng)用服務(wù),保證應(yīng)用服務(wù)在短時(shí)間內(nèi)完全恢復(fù)正常使用。高可用性軟件(HA)包括RoseHa等軟件。
      [0005]3、虛擬機(jī)高可用容錯(cuò)技術(shù):通過(guò)對(duì)服務(wù)器進(jìn)行虛擬化后,在虛擬服務(wù)器上進(jìn)行容錯(cuò)備份配置,再通過(guò)心跳檢測(cè)和虛擬機(jī)實(shí)時(shí)遷移技術(shù),來(lái)實(shí)現(xiàn)計(jì)算機(jī)系統(tǒng)所有應(yīng)用的透明容錯(cuò)計(jì)算功能。
      [0006]以上提高服務(wù)器設(shè)備或軟件的高可用性的方法存在以下缺陷:
      [0007]1、雙機(jī)冷備份技術(shù)和雙機(jī)熱備份技術(shù)大多是針對(duì)某一確定服務(wù)進(jìn)程進(jìn)行設(shè)計(jì),SP為提高某一服務(wù)的高可用性而進(jìn)行的專(zhuān)門(mén)設(shè)計(jì),不支持其它應(yīng)用程序的容錯(cuò)計(jì)算,因此用戶(hù)自己開(kāi)發(fā)的應(yīng)用軟件的用戶(hù)業(yè)務(wù)必須通過(guò)修改應(yīng)用程序,而調(diào)用高可用軟件的專(zhuān)用API,來(lái)實(shí)現(xiàn)用戶(hù)業(yè)務(wù)的容錯(cuò)處理,使得用戶(hù)自己開(kāi)發(fā)的應(yīng)用軟件要通過(guò)商用高可用軟件實(shí)現(xiàn)高可用則比較困難。
      [0008]2、虛擬機(jī)高可用容錯(cuò)技術(shù)的系統(tǒng)資源開(kāi)銷(xiāo)較大。


      【發(fā)明內(nèi)容】

      [0009]有鑒于此,有必要提供一種系統(tǒng)資源開(kāi)銷(xiāo)小,支持各種應(yīng)用程序的容錯(cuò)計(jì)算的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法及系統(tǒng)。
      [0010]本發(fā)明解決其技術(shù)問(wèn)題所采用的技術(shù)方案是:構(gòu)造一種基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法,所述基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法包括如下步驟:
      [0011]S1、設(shè)置至少兩個(gè)控制節(jié)點(diǎn)和至少兩個(gè)計(jì)算節(jié)點(diǎn);將其中一個(gè)控制節(jié)點(diǎn)設(shè)置為主控制節(jié)點(diǎn),將其他的控制節(jié)點(diǎn)設(shè)置為備控制節(jié)點(diǎn)并配置備控制節(jié)點(diǎn)的優(yōu)先級(jí)順序;設(shè)置主控制節(jié)點(diǎn)的優(yōu)先級(jí)高于任何一備控制節(jié)點(diǎn);
      [0012]S2、各控制節(jié)點(diǎn)分別重復(fù)采集并存儲(chǔ)所有的計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù);
      [0013]S3、判斷當(dāng)前控制節(jié)點(diǎn)是否為主控制節(jié)點(diǎn),如果當(dāng)前控制節(jié)點(diǎn)是主控制節(jié)點(diǎn),則跳轉(zhuǎn)到步驟S5 ;如果當(dāng)前控制節(jié)點(diǎn)是備控制節(jié)點(diǎn),則跳轉(zhuǎn)到步驟S4 ;
      [0014]S4、優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)主控制節(jié)點(diǎn)是否出現(xiàn)故障;優(yōu)先級(jí)低的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)比其優(yōu)先級(jí)高一級(jí)的備控制節(jié)點(diǎn)是否出現(xiàn)故障;如果控制節(jié)點(diǎn)出現(xiàn)故障,則修改優(yōu)先級(jí)順序;
      [0015]S5、主控制節(jié)點(diǎn)分析存儲(chǔ)在主控制節(jié)點(diǎn)的存儲(chǔ)器上存儲(chǔ)的健康狀態(tài)數(shù)據(jù),根據(jù)分析結(jié)果對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理。
      [0016]本發(fā)明還提供一種基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng),其特征在于,所述基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng)包括如下模塊:
      [0017]節(jié)點(diǎn)配置模塊,用于設(shè)置至少兩個(gè)控制節(jié)點(diǎn)和至少兩個(gè)計(jì)算節(jié)點(diǎn);將其中一個(gè)控制節(jié)點(diǎn)設(shè)置為主控制節(jié)點(diǎn),將其他的控制節(jié)點(diǎn)設(shè)置為備控制節(jié)點(diǎn)并配置備控制節(jié)點(diǎn)的優(yōu)先級(jí)順序;設(shè)置主控制節(jié)點(diǎn)的優(yōu)先級(jí)高于任何一備控制節(jié)點(diǎn);
      [0018]數(shù)據(jù)采集模塊,用于通過(guò)各控制節(jié)點(diǎn)分別重復(fù)采集并存儲(chǔ)所有的計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù);
      [0019]節(jié)點(diǎn)判斷模塊,用于判斷當(dāng)前控制節(jié)點(diǎn)是否為主控制節(jié)點(diǎn),如果當(dāng)前控制節(jié)點(diǎn)是主控制節(jié)點(diǎn),則跳轉(zhuǎn)到數(shù)據(jù)分析模塊;如果當(dāng)前控制節(jié)點(diǎn)是備控制節(jié)點(diǎn),則跳轉(zhuǎn)到故障判斷模塊;
      [0020]故障判斷模塊,用于通過(guò)優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)主控制節(jié)點(diǎn)是否出現(xiàn)故障;通過(guò)優(yōu)先級(jí)低的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)比其優(yōu)先級(jí)高一級(jí)的備控制節(jié)點(diǎn)是否出現(xiàn)故障;當(dāng)控制節(jié)點(diǎn)出現(xiàn)故障時(shí),修改優(yōu)先級(jí)順序;
      [0021]數(shù)據(jù)分析模塊,用于通過(guò)主控制節(jié)點(diǎn)分析存儲(chǔ)在主控制節(jié)點(diǎn)的存儲(chǔ)器上存儲(chǔ)的健康狀態(tài)數(shù)據(jù),根據(jù)分析結(jié)果對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理。
      [0022]本發(fā)明提供的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法及系統(tǒng),通過(guò)靈活配置控制節(jié)點(diǎn)的數(shù)量以及優(yōu)先級(jí),配置非常靈活。并通過(guò)主控制節(jié)點(diǎn)分析存儲(chǔ)在主控制節(jié)點(diǎn)的存儲(chǔ)器上存儲(chǔ)的健康狀態(tài)數(shù)據(jù),根據(jù)分析結(jié)果對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理,實(shí)現(xiàn)了提前預(yù)知計(jì)算節(jié)點(diǎn)的趨勢(shì)性損耗故障。健康狀態(tài)數(shù)據(jù)通過(guò)計(jì)算節(jié)點(diǎn)的旁路獲取,不占用計(jì)算節(jié)點(diǎn)的CPU、內(nèi)存、網(wǎng)絡(luò)等資源,相對(duì)于雙機(jī)冷備份技術(shù)、雙機(jī)熱備份技術(shù)、虛擬機(jī)高可用容錯(cuò)技術(shù),節(jié)省了系統(tǒng)資源開(kāi)銷(xiāo)。

      【專(zhuān)利附圖】

      【附圖說(shuō)明】
      [0023]圖1是本發(fā)明一較佳實(shí)施例的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法流程圖;
      [0024]圖2是圖1中步驟S2的子流程圖;
      [0025]圖3是圖1中步驟S4的子流程圖;
      [0026]圖4是圖1中步驟S5的子流程圖;
      [0027]圖5是圖4中步驟S58的子流程圖;
      [0028]圖6是本發(fā)明實(shí)施例中聞可用系統(tǒng)的邏輯關(guān)系圖;
      [0029]圖7是本發(fā)明實(shí)施例中主控制節(jié)點(diǎn)和備控制節(jié)點(diǎn)的工作流程圖;
      [0030]圖8是本發(fā)明實(shí)施例中控制節(jié)點(diǎn)接管順序示意圖;
      [0031]圖9是本發(fā)明實(shí)施例中健康狀態(tài)數(shù)據(jù)采集分析處理工作流程圖;
      [0032]圖10是本發(fā)明實(shí)施例中健康狀態(tài)數(shù)據(jù)歷史值矩陣示意圖。
      [0033]圖11是本發(fā)明一較佳實(shí)施例的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng)的結(jié)構(gòu)框圖;
      [0034]圖12是圖11中數(shù)據(jù)采集模塊的子結(jié)構(gòu)框圖;
      [0035]圖13是圖11中故障判斷模塊的子結(jié)構(gòu)框圖;
      [0036]圖14是圖11中數(shù)據(jù)分析模塊的子結(jié)構(gòu)框圖;
      [0037]圖15是圖14中計(jì)算節(jié)點(diǎn)管理單元的子結(jié)構(gòu)框圖。

      【具體實(shí)施方式】
      [0038]如圖1所示,本發(fā)明實(shí)施例提供一種基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法,所述基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法包括如下步驟:
      [0039]S1、設(shè)置至少兩個(gè)控制節(jié)點(diǎn)和至少兩個(gè)計(jì)算節(jié)點(diǎn)。將其中一個(gè)控制節(jié)點(diǎn)設(shè)置為主控制節(jié)點(diǎn),將其他的控制節(jié)點(diǎn)設(shè)置為備控制節(jié)點(diǎn)并配置備控制節(jié)點(diǎn)的優(yōu)先級(jí)順序。設(shè)置主控制節(jié)點(diǎn)的優(yōu)先級(jí)高于任何一備控制節(jié)點(diǎn)。
      [0040]本發(fā)明實(shí)施可根據(jù)高可用系統(tǒng)的任務(wù)重要性及高可用需求,添加或刪除控制節(jié)點(diǎn)的個(gè)數(shù),優(yōu)選控制節(jié)點(diǎn)的個(gè)數(shù)不超過(guò)計(jì)算節(jié)點(diǎn)的個(gè)數(shù),兩個(gè)或三個(gè)控制節(jié)點(diǎn)即可。可根據(jù)高可用系統(tǒng)的任務(wù)處理規(guī)模,添加或刪除計(jì)算節(jié)點(diǎn)的個(gè)數(shù),建議保留至少兩個(gè)計(jì)算節(jié)點(diǎn)。
      [0041]任一計(jì)算節(jié)點(diǎn)之外其它的所有計(jì)算節(jié)點(diǎn)都可配置成該計(jì)算節(jié)點(diǎn)的備計(jì)算節(jié)點(diǎn),因此大幅度提高了計(jì)算節(jié)點(diǎn)的冗余度,提高了計(jì)算節(jié)點(diǎn)的高可用性。
      [0042]S2、各控制節(jié)點(diǎn)分別重復(fù)采集并存儲(chǔ)所有的計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù)。
      [0043]健康狀態(tài)數(shù)據(jù)可以包括計(jì)算節(jié)點(diǎn)的溫度、風(fēng)扇、電壓、電流等健康狀態(tài)數(shù)據(jù)類(lèi)型。
      [0044]本發(fā)明實(shí)施例中的控制節(jié)點(diǎn)和計(jì)算節(jié)點(diǎn)可以是網(wǎng)絡(luò)系統(tǒng)中的服務(wù)器或者計(jì)算設(shè)備。
      [0045]本發(fā)明實(shí)施例中的健康狀態(tài)數(shù)據(jù)可以通過(guò)計(jì)算節(jié)點(diǎn)的前端模塊(BMC模塊)的旁路獲取,不占用計(jì)算節(jié)點(diǎn)的CPU、內(nèi)存、網(wǎng)絡(luò)等資源,因此相比雙機(jī)熱備份、雙機(jī)冷備份技術(shù)、虛擬機(jī)容錯(cuò)技術(shù)等實(shí)現(xiàn)高可用方法。本發(fā)明實(shí)施例對(duì)計(jì)算節(jié)點(diǎn)本身的性能影響更小。
      [0046]可選地,如圖2所示,所述步驟S2包括以下子步驟:
      [0047]S21、各控制節(jié)點(diǎn)分別采集一次所有的計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù),并將采集的所述健康狀態(tài)數(shù)據(jù)保存到各控制節(jié)點(diǎn)各自的存儲(chǔ)器上;
      [0048]S22、判斷采集的次數(shù)是否小于預(yù)定次數(shù)p,如果采集的次數(shù)小于預(yù)定次數(shù)P,則等待第一預(yù)設(shè)時(shí)間Tl后跳轉(zhuǎn)到步驟S21 ;如果采集的次數(shù)大于預(yù)定次數(shù)P,則刪除各控制節(jié)點(diǎn)存儲(chǔ)器上多余的歷史健康狀態(tài)數(shù)據(jù),保留最近的P次采集到的健康狀態(tài)數(shù)據(jù),則跳轉(zhuǎn)到步驟S23 ;如果采集的次數(shù)等于預(yù)定次數(shù)P,則跳轉(zhuǎn)到步驟S23 ;
      [0049]S23、將各控制節(jié)點(diǎn)P次采集到的η個(gè)計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù)設(shè)置成一個(gè)P行η列的健康狀態(tài)數(shù)據(jù)歷史值矩陣。
      [0050]所述步驟S23中的健康狀態(tài)數(shù)據(jù)歷史值矩陣可以參見(jiàn)圖10。
      [0051]S3、判斷當(dāng)前控制節(jié)點(diǎn)是否為主控制節(jié)點(diǎn),如果當(dāng)前控制節(jié)點(diǎn)是主控制節(jié)點(diǎn),則跳轉(zhuǎn)到步驟S5。如果當(dāng)前控制節(jié)點(diǎn)是備控制節(jié)點(diǎn),則跳轉(zhuǎn)到步驟S4。
      [0052]S4、優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)主控制節(jié)點(diǎn)是否出現(xiàn)故障。優(yōu)先級(jí)低的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)比其優(yōu)先級(jí)高一級(jí)的備控制節(jié)點(diǎn)是否出現(xiàn)故障。如果控制節(jié)點(diǎn)出現(xiàn)故障,則修改優(yōu)先級(jí)順序。
      [0053]可選地,如圖3所示,所述步驟S4包括以下子步驟:
      [0054]S41、優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)主控制節(jié)點(diǎn)是否出現(xiàn)故障;優(yōu)先級(jí)低的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)比其優(yōu)先級(jí)高一級(jí)的備控制節(jié)點(diǎn)是否出現(xiàn)故障。
      [0055]S42、如果探測(cè)到主控制節(jié)點(diǎn)出現(xiàn)故障,則優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)配置為主控制節(jié)點(diǎn),將除優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)以外的其他備控制節(jié)點(diǎn)的優(yōu)先級(jí)各自提高一級(jí)。
      [0056]S43、如果探測(cè)到備控制節(jié)點(diǎn)出現(xiàn)故障,將優(yōu)先級(jí)低于該出現(xiàn)故障的備控制節(jié)點(diǎn)的所有備控制節(jié)點(diǎn)的優(yōu)先級(jí)各自提高一級(jí)。
      [0057]本實(shí)施例可以靈活更改控制節(jié)點(diǎn)的優(yōu)先級(jí),并且在主控制節(jié)點(diǎn)出現(xiàn)故障時(shí),能夠及時(shí)將優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)設(shè)置為主控制節(jié)點(diǎn)。實(shí)現(xiàn)了控制節(jié)點(diǎn)出現(xiàn)故障時(shí)平滑過(guò)渡。
      [0058]S5、主控制節(jié)點(diǎn)分析存儲(chǔ)在主控制節(jié)點(diǎn)的存儲(chǔ)器上存儲(chǔ)的健康狀態(tài)數(shù)據(jù),根據(jù)分析結(jié)果對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理。
      [0059]可選地,如圖4所示,所述步驟S5包括以下子步驟:
      [0060]S51、主控制節(jié)點(diǎn)逐列分析健康狀態(tài)數(shù)據(jù)歷史值矩陣,每列健康狀態(tài)數(shù)據(jù)對(duì)應(yīng)一個(gè)計(jì)算節(jié)點(diǎn)。
      [0061]S52、判斷所有的計(jì)算節(jié)點(diǎn)是否都分析了一遍,如果所有的計(jì)算節(jié)點(diǎn)都分析了一遍,則跳轉(zhuǎn)到步驟S57。如果存在計(jì)算節(jié)點(diǎn)沒(méi)有分析,則跳轉(zhuǎn)到步驟S53。
      [0062]S53、分別統(tǒng)計(jì)當(dāng)前計(jì)算節(jié)點(diǎn)超過(guò)健康狀態(tài)參考范圍以及低于健康狀態(tài)參考范圍的采集的次數(shù);
      [0063]S54、如果超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)小于kl,并且低于健康狀態(tài)參考范圍的采集的次數(shù)小于k2,則判定該計(jì)算節(jié)點(diǎn)為健康狀態(tài),并跳轉(zhuǎn)到步驟S55。如果超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)大于或等于kl,或者低于健康狀態(tài)參考范圍的采集的次數(shù)大于或等于k2,則判定該計(jì)算節(jié)點(diǎn)為非健康狀態(tài),并跳轉(zhuǎn)到步驟S56。
      [0064]kl/p表示對(duì)超過(guò)健康狀態(tài)參考范圍的容忍度(越大越保守,越小越激進(jìn)),K2/p表示對(duì)低于健康狀態(tài)參考范圍的容忍度(越大越保守,越小越激進(jìn))。容忍度也可根據(jù)高可用系統(tǒng)的要求進(jìn)行配置,靈活配置。
      [0065]S55、將該計(jì)算節(jié)點(diǎn)的非健康標(biāo)志值設(shè)置為0,并跳轉(zhuǎn)到步驟S51。
      [0066]S56、獲取超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)和低于健康狀態(tài)參考范圍的采集的次數(shù)的最大值,將該最大值設(shè)置為該計(jì)算節(jié)點(diǎn)的非健康狀態(tài)值,并跳轉(zhuǎn)到步驟S51。
      [0067]S57、分析所有計(jì)算節(jié)點(diǎn)的非健康標(biāo)志值,判斷是否存在非O值的計(jì)算節(jié)點(diǎn);如果不存在非O值的計(jì)算節(jié)點(diǎn),則確定所有的計(jì)算節(jié)點(diǎn)都是健康的,如果存在非O值的計(jì)算節(jié)點(diǎn),則確定存在非健康的計(jì)算節(jié)點(diǎn)。
      [0068]S58、按照設(shè)置策略對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理,等待第一預(yù)設(shè)時(shí)間Tl后跳轉(zhuǎn)到步驟S21。
      [0069]可選地,如圖5所示,所述步驟S58包括以下子步驟:
      [0070]S581、設(shè)置第一策略、第二策略、第三策略,第一策略包括提示告警、自動(dòng)遷移任務(wù)出去、告警同時(shí)自動(dòng)遷移任務(wù)出去三個(gè)選項(xiàng);第二策略包括提不告警、自動(dòng)關(guān)機(jī)、告警同時(shí)自動(dòng)關(guān)機(jī)等三個(gè)選項(xiàng);第三策略包括提示告警、自動(dòng)遷移任務(wù)回來(lái)、告警同時(shí)自動(dòng)遷移任務(wù)回來(lái)三個(gè)選項(xiàng)。
      [0071]S582、判斷非健康的計(jì)算節(jié)點(diǎn)是否存在處理任務(wù),如果非健康的計(jì)算節(jié)點(diǎn)存在處理任務(wù),則查詢(xún)第一策略并按照第一策略進(jìn)行處理。如果非健康的計(jì)算節(jié)點(diǎn)不存在處理任務(wù),則查詢(xún)第二策略并按照第二策略進(jìn)行處理。
      [0072]S583、判斷健康的計(jì)算節(jié)點(diǎn)是否存在處理任務(wù),如果健康的計(jì)算節(jié)點(diǎn)存在處理任務(wù),則對(duì)該健康的計(jì)算節(jié)點(diǎn)不做操作;如果健康的計(jì)算節(jié)點(diǎn)不存在處理任務(wù),則確定該健康的計(jì)算節(jié)點(diǎn)是從非健康狀態(tài)恢復(fù)成健康狀態(tài)的,并記錄下當(dāng)前時(shí)間戳,如果當(dāng)前時(shí)間戳減去上次時(shí)間戳的差值小于第二預(yù)設(shè)時(shí)間T2,或者沒(méi)有上次時(shí)間戳,則不作任何操作,如果差值大于或等于第二預(yù)設(shè)時(shí)間T2則按照第三策略進(jìn)行處理。
      [0073]S584、等待第一預(yù)設(shè)時(shí)間Tl后跳轉(zhuǎn)到步驟S21。
      [0074]本發(fā)明實(shí)施例通過(guò)分析健康狀態(tài)數(shù)據(jù)觸發(fā)計(jì)算節(jié)點(diǎn)的任務(wù)遷移,相比宕機(jī)時(shí)自動(dòng)觸發(fā)任務(wù)遷移,或手動(dòng)進(jìn)行任務(wù)遷移,健康狀態(tài)數(shù)據(jù)檢測(cè)更加科學(xué)和靈活。并且在計(jì)算節(jié)點(diǎn)出現(xiàn)趨勢(shì)性損耗故障前,在健康狀態(tài)數(shù)據(jù)上都有提前反應(yīng)(亞健康),因此提高了系統(tǒng)的故障提前感知能力。相比其他技術(shù),本發(fā)明實(shí)施例更加節(jié)省高可用系統(tǒng)本身的資源開(kāi)銷(xiāo)。
      [0075]以下結(jié)合圖6至圖10對(duì)本發(fā)明實(shí)施例的原理做更進(jìn)一步的說(shuō)明。
      [0076]圖6是本發(fā)明實(shí)施例中高可用系統(tǒng)的邏輯關(guān)系圖??梢钥闯雒總€(gè)控制節(jié)點(diǎn)都對(duì)應(yīng)所有的計(jì)算節(jié)點(diǎn)。低優(yōu)先級(jí)的控制節(jié)點(diǎn)通過(guò)心跳檢測(cè)高一級(jí)優(yōu)先權(quán)的控制節(jié)點(diǎn)是否出現(xiàn)故障。
      [0077]結(jié)合附圖7和圖9對(duì)本發(fā)明的本實(shí)施方式作詳細(xì)說(shuō)明。
      [0078]結(jié)合附圖7對(duì)本發(fā)明的主控制節(jié)點(diǎn)和備控制節(jié)點(diǎn)工作流程進(jìn)行說(shuō)明,詳細(xì)流程如下所示。
      [0079]步驟1.1:控制節(jié)點(diǎn)收集所有計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù),然后進(jìn)入步驟1.2。
      [0080]步驟1.2:讀取配置文件,判斷當(dāng)前控制節(jié)點(diǎn)是否是主控制節(jié)點(diǎn)。如果不是主控制節(jié)點(diǎn)(即備控制節(jié)點(diǎn)),進(jìn)入步驟1.3 ;如果是主控制節(jié)點(diǎn),進(jìn)入步驟1.5。
      [0081]步驟1.3:通過(guò)心跳檢測(cè)網(wǎng)絡(luò)探測(cè)主控制節(jié)點(diǎn)和優(yōu)先級(jí)更高的備控制節(jié)點(diǎn)是否故障,如果有控制節(jié)點(diǎn)故障進(jìn)入步驟1.4,如果沒(méi)有控制節(jié)點(diǎn)故障則等待時(shí)間Tl,進(jìn)入步驟
      1.1。
      [0082]步驟1.4:修改控制節(jié)點(diǎn)的優(yōu)先順序,可參考附圖8,圖8是本發(fā)明實(shí)施例中控制節(jié)點(diǎn)接管順序示意圖。如果主控制節(jié)點(diǎn)故障,優(yōu)先級(jí)最高的第一備控制節(jié)點(diǎn)成為主控制節(jié)點(diǎn);如果備控制節(jié)點(diǎn)出現(xiàn)故障,則比該備控制節(jié)點(diǎn)更低優(yōu)先級(jí)的備控制節(jié)點(diǎn)自動(dòng)提高一級(jí)優(yōu)先級(jí)。修改完控制節(jié)點(diǎn)的優(yōu)先順序后,進(jìn)入步驟1.2。
      [0083]步驟1.5:對(duì)健康狀態(tài)數(shù)據(jù)進(jìn)行分析處理,可參考附圖9。
      [0084]圖9是本發(fā)明實(shí)施例中健康狀態(tài)數(shù)據(jù)采集分析處理工作流程圖;
      [0085]結(jié)合附圖9對(duì)本發(fā)明的健康狀態(tài)數(shù)據(jù)分析處理的工作流程進(jìn)行說(shuō)明,詳細(xì)流程如下所示。該健康狀態(tài)數(shù)據(jù)分析處理工作流程適用于溫度、風(fēng)扇、電壓、電流等健康狀態(tài)數(shù)據(jù)類(lèi)型。
      [0086]步驟2.1:采集當(dāng)前所有計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù),然后進(jìn)入步驟2.2。
      [0087]步驟2.2:如果采集的次數(shù)小于P,則表示采集的歷史數(shù)據(jù)不夠,等待時(shí)間T后進(jìn)入步驟2.1。如果采集的時(shí)間點(diǎn)個(gè)數(shù)大于或等于P次,則進(jìn)入步驟2.3。
      [0088]步驟2.3:刪除多余的歷史數(shù)據(jù),只保留最近P次采集的健康狀態(tài)數(shù)據(jù),此時(shí)共P個(gè)時(shí)間點(diǎn)下η個(gè)計(jì)算節(jié)點(diǎn)的數(shù)據(jù)組成一個(gè)P行η列的健康狀態(tài)數(shù)據(jù)歷史值矩陣,可參考附圖10。矩陣的行對(duì)應(yīng)每個(gè)時(shí)間點(diǎn),該矩陣的列對(duì)應(yīng)每個(gè)計(jì)算節(jié)點(diǎn),進(jìn)入步驟2.4。
      [0089]步驟2.4:對(duì)健康狀態(tài)數(shù)據(jù)歷史值矩陣進(jìn)行逐列分析,每列數(shù)據(jù)對(duì)應(yīng)一個(gè)計(jì)算節(jié)點(diǎn),進(jìn)入步驟2.5。
      [0090]步驟2.5:還有計(jì)算節(jié)點(diǎn)沒(méi)有分析完畢,進(jìn)入步驟2.6 ;如果所有計(jì)算節(jié)點(diǎn)都分析了一遍,則當(dāng)前一次采集的健康狀態(tài)數(shù)據(jù)分析已經(jīng)完成,進(jìn)入步驟2.10。
      [0091]步驟2.6:統(tǒng)計(jì)當(dāng)前列超過(guò)健康狀態(tài)參考范圍的采集次數(shù),統(tǒng)計(jì)當(dāng)前列低于健康狀態(tài)參考范圍的采集次數(shù),然后進(jìn)入步驟2.7。
      [0092]步驟2.7:如果超過(guò)健康狀態(tài)參考范圍的時(shí)間點(diǎn)次數(shù)小于kl,且低于健康狀態(tài)參考范圍的時(shí)間點(diǎn)次數(shù)小于k2,則仍然判定該計(jì)算節(jié)點(diǎn)為健康狀態(tài),進(jìn)入步驟2.8 ;如果超過(guò)健康狀態(tài)參考范圍的時(shí)間點(diǎn)次數(shù)大于等于kl,或者低于健康狀態(tài)參考范圍的時(shí)間點(diǎn)次數(shù)大于等于k2,則表示該計(jì)算節(jié)點(diǎn)多次超過(guò)或低于健康狀態(tài)參考范圍,且趨于穩(wěn)定,判定該計(jì)算節(jié)點(diǎn)為非健康狀態(tài),進(jìn)入步驟2.9。
      [0093]步驟2.8:置當(dāng)前計(jì)算節(jié)點(diǎn)的非健康標(biāo)志值為0,然后進(jìn)入步驟2.4。
      [0094]步驟2.9:取超過(guò)健康狀態(tài)參考范圍的采集次數(shù)和低于健康狀態(tài)參考范圍的時(shí)間點(diǎn)次數(shù)的最大值,作為該計(jì)算節(jié)點(diǎn)的非健康標(biāo)志值,然后進(jìn)入步驟2.4。
      [0095]步驟2.10:分析所有計(jì)算節(jié)點(diǎn)的非健康標(biāo)志值,如果不存在非O值的計(jì)算節(jié)點(diǎn),貝U表示所有計(jì)算節(jié)點(diǎn)都是健康的,如果存在非O值的計(jì)算節(jié)點(diǎn),則表示存在非健康計(jì)算節(jié)點(diǎn),進(jìn)入步驟2.11。
      [0096]步驟2.11:第一策略設(shè)置包括提示告警、自動(dòng)遷移任務(wù)出去、告警同時(shí)自動(dòng)遷移任務(wù)出去等三個(gè)選項(xiàng);第二策略設(shè)置包括提示告警、自動(dòng)關(guān)機(jī)、告警同時(shí)自動(dòng)關(guān)機(jī)等三個(gè)選項(xiàng);第三策略包括提示告警、自動(dòng)遷移任務(wù)回來(lái)、告警同時(shí)自動(dòng)遷移任務(wù)回來(lái)等三個(gè)選項(xiàng)。根據(jù)設(shè)置策略的要求對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行相應(yīng)的操作:
      [0097]查看非健康計(jì)算節(jié)點(diǎn)是否存在處理任務(wù),如果存在處理任務(wù)則查詢(xún)第一策略,并按照第一策略的操作進(jìn)行處理;如果不存在處理任務(wù)則查詢(xún)第二策略,并按照第二策略的操作進(jìn)行處理;
      [0098]查看健康計(jì)算節(jié)點(diǎn)是否存在處理任務(wù),如果存在處理任務(wù)則不做操作;如果不存在處理任務(wù),則表示該計(jì)算節(jié)點(diǎn)是從非健康狀態(tài)恢復(fù)成健康狀態(tài)的,并記錄下當(dāng)前時(shí)間戳,如果當(dāng)前時(shí)間戳減去上次時(shí)間戳的差值小于第二預(yù)設(shè)時(shí)間T2,或者沒(méi)有上次時(shí)間戳,則不作任何操作,如果差值大于或等于第二預(yù)設(shè)時(shí)間T2則按照第三策略進(jìn)行處理
      [0099]等待時(shí)間Tl返回步驟2.1。
      [0100]健康狀態(tài)數(shù)據(jù)分析處理中牽涉的參數(shù)定義如下:
      [0101]η:表示參與的計(jì)算節(jié)點(diǎn)個(gè)數(shù);
      [0102]P:表示采集健康狀態(tài)數(shù)據(jù)的次數(shù);
      [0103]kl:表示能夠容忍超過(guò)健康狀態(tài)參考范圍的時(shí)間點(diǎn)次數(shù),該值不大于P,kl/p表示對(duì)超過(guò)健康狀態(tài)參考范圍的容忍度(越大越保守,越小越激進(jìn));
      [0104]k2:表示能夠容忍低于健康狀態(tài)參考范圍的時(shí)間點(diǎn)次數(shù),該值不大于P,k2/p表示對(duì)低于健康狀態(tài)參考范圍的容忍度(越大越保守,越小越激進(jìn));
      [0105]Tl:表示每次健康狀態(tài)數(shù)據(jù)分析處理的時(shí)間周期,該值不小于健康狀態(tài)數(shù)據(jù)采集的時(shí)間周期,否則會(huì)出現(xiàn)收集重復(fù)數(shù)據(jù)的情況。
      [0106]如圖11所示,本發(fā)明實(shí)施例還提供一種基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng),所述基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng)包括如下模塊:
      [0107]節(jié)點(diǎn)配置模塊10,用于設(shè)置至少兩個(gè)控制節(jié)點(diǎn)和至少兩個(gè)計(jì)算節(jié)點(diǎn)。并用于將其中一個(gè)控制節(jié)點(diǎn)設(shè)置為主控制節(jié)點(diǎn),將其他的控制節(jié)點(diǎn)設(shè)置為備控制節(jié)點(diǎn)并配置備控制節(jié)點(diǎn)的優(yōu)先級(jí)順序。并用于設(shè)置主控制節(jié)點(diǎn)的優(yōu)先級(jí)高于任何一備控制節(jié)點(diǎn)。
      [0108]數(shù)據(jù)采集模塊20,用于通過(guò)各控制節(jié)點(diǎn)分別重復(fù)采集并存儲(chǔ)所有的計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù)。
      [0109]優(yōu)選地,如圖12所示,所述數(shù)據(jù)采集模塊20包括以下單元:
      [0110]數(shù)據(jù)采集單元21,用于通過(guò)各控制節(jié)點(diǎn)分別每隔一固定時(shí)間Tl采集一次所有的計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù),并將采集的所述健康狀態(tài)數(shù)據(jù)保存到各控制節(jié)點(diǎn)各自的存儲(chǔ)器上。
      [0111]采集次數(shù)判斷單元22,用于判斷采集的次數(shù)是否小于預(yù)定次數(shù)P,當(dāng)果采集的次數(shù)小于預(yù)定次數(shù)P時(shí),啟動(dòng)數(shù)據(jù)采集單元21的功能。并用于當(dāng)采集的次數(shù)大于預(yù)定次數(shù)P時(shí),刪除各控制節(jié)點(diǎn)存儲(chǔ)器上多余的歷史健康狀態(tài)數(shù)據(jù),保留最近的P次采集到的健康狀態(tài)數(shù)據(jù)。并用于當(dāng)采集的次數(shù)等于預(yù)定次數(shù)P時(shí),則直接保留最近的P次采集到的健康狀態(tài)數(shù)據(jù);。
      [0112]矩陣配置單元23,用于將各控制節(jié)點(diǎn)P次采集到的η個(gè)計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù)設(shè)置成一個(gè)P行η列的健康狀態(tài)數(shù)據(jù)歷史值矩陣。
      [0113]節(jié)點(diǎn)判斷模塊30,用于判斷當(dāng)前控制節(jié)點(diǎn)是否為主控制節(jié)點(diǎn),如果當(dāng)前控制節(jié)點(diǎn)是主控制節(jié)點(diǎn),則跳轉(zhuǎn)到數(shù)據(jù)分析模塊50。如果當(dāng)前控制節(jié)點(diǎn)是備控制節(jié)點(diǎn),則跳轉(zhuǎn)到故障判斷模塊40。
      [0114]故障判斷模塊40,用于通過(guò)優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)主控制節(jié)點(diǎn)是否出現(xiàn)故障。并用于通過(guò)優(yōu)先級(jí)低的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)比其優(yōu)先級(jí)高一級(jí)的備控制節(jié)點(diǎn)是否出現(xiàn)故障。并用于當(dāng)控制節(jié)點(diǎn)出現(xiàn)故障時(shí),修改優(yōu)先級(jí)順序。
      [0115]優(yōu)選地,如圖13所示,所述故障判斷模塊40包括以下單元:
      [0116]故障判斷單元41,用于通過(guò)優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)主控制節(jié)點(diǎn)是否出現(xiàn)故障;并用于通過(guò)優(yōu)先級(jí)低的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)比其優(yōu)先級(jí)高一級(jí)的備控制節(jié)點(diǎn)是否出現(xiàn)故障。
      [0117]第一調(diào)整單元42,用于當(dāng)探測(cè)到主控制節(jié)點(diǎn)出現(xiàn)故障時(shí),通過(guò)優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)配置為主控制節(jié)點(diǎn),將除優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)以外的其他備控制節(jié)點(diǎn)的優(yōu)先級(jí)各自提聞一級(jí)。
      [0118]第二調(diào)整單元43,用于當(dāng)探測(cè)到備控制節(jié)點(diǎn)出現(xiàn)故障時(shí),將優(yōu)先級(jí)低于該出現(xiàn)故障的備控制節(jié)點(diǎn)的所有備控制節(jié)點(diǎn)的優(yōu)先級(jí)各自提高一級(jí)。
      [0119]數(shù)據(jù)分析模塊50,用于通過(guò)主控制節(jié)點(diǎn)分析存儲(chǔ)在主控制節(jié)點(diǎn)的存儲(chǔ)器上存儲(chǔ)的健康狀態(tài)數(shù)據(jù),根據(jù)分析結(jié)果對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理。
      [0120]優(yōu)選地,如圖14所示,所述數(shù)據(jù)分析模塊50包括以下單元:
      [0121]分析單元51,用于通過(guò)主控制節(jié)點(diǎn)逐列分析健康狀態(tài)數(shù)據(jù)歷史值矩陣,每列健康狀態(tài)數(shù)據(jù)對(duì)應(yīng)一個(gè)計(jì)算節(jié)點(diǎn)。
      [0122]分析判斷單元52,用于判斷所有的計(jì)算節(jié)點(diǎn)是否都分析了一遍,當(dāng)所有的計(jì)算節(jié)點(diǎn)都分析了一遍時(shí),啟動(dòng)計(jì)算節(jié)點(diǎn)判斷單元的功能。并用于當(dāng)存在計(jì)算節(jié)點(diǎn)沒(méi)有分析時(shí),啟動(dòng)統(tǒng)計(jì)單元53的功能。
      [0123]統(tǒng)計(jì)單元53,用于分別統(tǒng)計(jì)當(dāng)前計(jì)算節(jié)點(diǎn)超過(guò)健康狀態(tài)參考范圍以及低于健康狀態(tài)參考范圍的采集的次數(shù)。
      [0124]狀態(tài)判斷單元54,用于在超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)小于kl,并且低于健康狀態(tài)參考范圍的采集的次數(shù)小于k2時(shí),判定該計(jì)算節(jié)點(diǎn)為健康狀態(tài),并啟動(dòng)第一標(biāo)志值設(shè)置單元55的功能。并用于當(dāng)超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)大于或等于kl,或者低于健康狀態(tài)參考范圍的采集的次數(shù)大于或等于k2時(shí),則判定該計(jì)算節(jié)點(diǎn)為非健康狀態(tài),并啟動(dòng)第二標(biāo)志值設(shè)置單元56的功能。
      [0125]第一標(biāo)志值設(shè)置單元55,用于將該計(jì)算節(jié)點(diǎn)的非健康標(biāo)志值設(shè)置為0,并啟動(dòng)分析單元51的功能。
      [0126]第二標(biāo)志值設(shè)置單元56,用于獲取超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)和低于健康狀態(tài)參考范圍的采集的次數(shù)的最大值,將該最大值設(shè)置為該計(jì)算節(jié)點(diǎn)的非健康狀態(tài)值,并啟動(dòng)分析單元51的功能。
      [0127]計(jì)算節(jié)點(diǎn)判斷單元57,用于分析所有計(jì)算節(jié)點(diǎn)的非健康標(biāo)志值,判斷是否存在非O值的計(jì)算節(jié)點(diǎn)。并用于當(dāng)不存在非O值的計(jì)算節(jié)點(diǎn)時(shí),確定所有的計(jì)算節(jié)點(diǎn)都是健康的,當(dāng)存在非O值的計(jì)算節(jié)點(diǎn),則確定存在非健康的計(jì)算節(jié)點(diǎn)。
      [0128]計(jì)算節(jié)點(diǎn)管理單元58,用于按照設(shè)置策略對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理,等待第一預(yù)設(shè)時(shí)間Tl后啟動(dòng)數(shù)據(jù)采集單元21的功能。
      [0129]優(yōu)選地,如圖15所示,所述計(jì)算節(jié)點(diǎn)管理單元58包括以下子單元:
      [0130]策略設(shè)置子單兀581,用于設(shè)置第一策略、第二策略、第三策略,第一策略包括提不告警、自動(dòng)遷移任務(wù)出去、告警同時(shí)自動(dòng)遷移任務(wù)出去三個(gè)選項(xiàng);第二策略包括提不告警、自動(dòng)關(guān)機(jī)、告警同時(shí)自動(dòng)關(guān)機(jī)等三個(gè)選項(xiàng);第三策略包括提示告警、自動(dòng)遷移任務(wù)回來(lái)、告警同時(shí)自動(dòng)遷移任務(wù)回來(lái)三個(gè)選項(xiàng)。
      [0131]第一任務(wù)判斷子單元582,用于判斷非健康的計(jì)算節(jié)點(diǎn)是否存在處理任務(wù),當(dāng)非健康的計(jì)算節(jié)點(diǎn)存在處理任務(wù)時(shí),查詢(xún)第一策略并按照第一策略進(jìn)行處理。并用于當(dāng)非健康的計(jì)算節(jié)點(diǎn)不存在處理任務(wù)時(shí),查詢(xún)第二策略并按照第二策略進(jìn)行處理。
      [0132]第二任務(wù)判斷子單元583,用于判斷健康的計(jì)算節(jié)點(diǎn)是否存在處理任務(wù),當(dāng)健康的計(jì)算節(jié)點(diǎn)存在處理任務(wù)時(shí),對(duì)該健康的計(jì)算節(jié)點(diǎn)不做操作。當(dāng)健康的計(jì)算節(jié)點(diǎn)不存在處理任務(wù)時(shí),確定該健康的計(jì)算節(jié)點(diǎn)是從非健康狀態(tài)恢復(fù)成健康狀態(tài)的,并對(duì)該健康的計(jì)算節(jié)點(diǎn)計(jì)時(shí),計(jì)時(shí)不到第二預(yù)設(shè)時(shí)間T2時(shí)不作任何操作,計(jì)時(shí)到T2則按照第三策略進(jìn)行處理。
      [0133]跳轉(zhuǎn)子單元584,用于在等待第一預(yù)設(shè)時(shí)間Tl后啟動(dòng)數(shù)據(jù)采集單元21的功能。
      [0134]本發(fā)明提供的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng),通過(guò)靈活配置控制節(jié)點(diǎn)的數(shù)量以及優(yōu)先級(jí),配置非常靈活,支持其它應(yīng)用程序的容錯(cuò)計(jì)算。并通過(guò)主控制節(jié)點(diǎn)分析存儲(chǔ)在主控制節(jié)點(diǎn)的存儲(chǔ)器上存儲(chǔ)的健康狀態(tài)數(shù)據(jù),根據(jù)分析結(jié)果對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理,實(shí)現(xiàn)了提前預(yù)知計(jì)算節(jié)點(diǎn)的趨勢(shì)性損耗故障。健康狀態(tài)數(shù)據(jù)通過(guò)計(jì)算節(jié)點(diǎn)的旁路獲取,不占用計(jì)算節(jié)點(diǎn)的CPU、內(nèi)存、網(wǎng)絡(luò)等資源,相對(duì)于雙機(jī)冷備份技術(shù)、雙機(jī)熱備份技術(shù)、虛擬機(jī)高可用容錯(cuò)技術(shù),節(jié)省了系統(tǒng)資源開(kāi)銷(xiāo)。
      [0135]以上裝置實(shí)施例與方法實(shí)施例是一一對(duì)應(yīng)的,裝置實(shí)施例簡(jiǎn)略之處,參見(jiàn)方法實(shí)施例即可。
      [0136]本說(shuō)明書(shū)中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說(shuō)明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似部分互相參見(jiàn)即可。
      [0137]專(zhuān)業(yè)人員還可以進(jìn)一步意識(shí)到,結(jié)合本文中所公開(kāi)的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來(lái)實(shí)現(xiàn),為了清楚地說(shuō)明硬件和軟件的可互換性,在上述說(shuō)明中已經(jīng)按照功能性一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來(lái)執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專(zhuān)業(yè)技術(shù)人員可以對(duì)每個(gè)特定的應(yīng)用來(lái)使用不同方法來(lái)實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)超過(guò)本發(fā)明的范圍。
      [0138]結(jié)合本文中所公開(kāi)的實(shí)施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來(lái)實(shí)施。軟件模塊可以置于隨機(jī)儲(chǔ)存器、內(nèi)存、只讀存儲(chǔ)器、電可編程ROM、電可檫除可編程ROM、寄存器、硬盤(pán)、可移動(dòng)磁盤(pán)、CD-ROM、或【技術(shù)領(lǐng)域】?jī)?nèi)所公知的任意其他形式的存儲(chǔ)介質(zhì)中。
      [0139]上面結(jié)合附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行了描述,但是本發(fā)明并不局限于上述的【具體實(shí)施方式】,上述的【具體實(shí)施方式】?jī)H僅是示意性的,而不是限制性的,本領(lǐng)域的普通技術(shù)人員在本發(fā)明的啟示下,在不脫離本發(fā)明宗旨和權(quán)利要求所保護(hù)的范圍情況下,還可做出很多形式,這些均屬于本發(fā)明的保護(hù)之內(nèi)。
      【權(quán)利要求】
      1.一種基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法,其特征在于,所述基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法包括如下步驟: 51、設(shè)置至少兩個(gè)控制節(jié)點(diǎn)和至少兩個(gè)計(jì)算節(jié)點(diǎn);將其中一個(gè)控制節(jié)點(diǎn)設(shè)置為主控制節(jié)點(diǎn),將其他的控制節(jié)點(diǎn)設(shè)置為備控制節(jié)點(diǎn)并配置備控制節(jié)點(diǎn)的優(yōu)先級(jí)順序;設(shè)置主控制節(jié)點(diǎn)的優(yōu)先級(jí)高于任何一備控制節(jié)點(diǎn); 52、各控制節(jié)點(diǎn)分別重復(fù)采集并存儲(chǔ)所有的計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù); 53、判斷當(dāng)前控制節(jié)點(diǎn)是否為主控制節(jié)點(diǎn),如果當(dāng)前控制節(jié)點(diǎn)是主控制節(jié)點(diǎn),則跳轉(zhuǎn)到步驟S5 ;如果當(dāng)前控制節(jié)點(diǎn)是備控制節(jié)點(diǎn),則跳轉(zhuǎn)到步驟S4 ; 54、優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)主控制節(jié)點(diǎn)是否出現(xiàn)故障;優(yōu)先級(jí)低的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)比其優(yōu)先級(jí)高一級(jí)的備控制節(jié)點(diǎn)是否出現(xiàn)故障;如果控制節(jié)點(diǎn)出現(xiàn)故障,則修改優(yōu)先級(jí)順序; 55、主控制節(jié)點(diǎn)分析存儲(chǔ)在主控制節(jié)點(diǎn)的存儲(chǔ)器上存儲(chǔ)的健康狀態(tài)數(shù)據(jù),根據(jù)分析結(jié)果對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理。
      2.根據(jù)權(quán)利要求1所述的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法,其特征在于,所述步驟S2包括以下子步驟: 521、各控制節(jié)點(diǎn)分別采集一次所有的計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù),并將采集的所述健康狀態(tài)數(shù)據(jù)保存到各控制節(jié)點(diǎn)各自的存儲(chǔ)器上; 522、判斷采集的次數(shù)是否小于預(yù)定次數(shù)p,如果采集的次數(shù)小于預(yù)定次數(shù)P,則等待第一預(yù)設(shè)時(shí)間Tl后跳轉(zhuǎn)到步驟S21 ;如果采集的次數(shù)大于預(yù)定次數(shù)P,則刪除各控制節(jié)點(diǎn)存儲(chǔ)器上多余的歷史健康狀態(tài)數(shù)據(jù),保留最近的P次采集到的健康狀態(tài)數(shù)據(jù),則跳轉(zhuǎn)到步驟S23 ;如果采集的次數(shù)等于預(yù)定次數(shù)P,則跳轉(zhuǎn)到步驟S23 ; 523、將各控制節(jié)點(diǎn)P次采集到的η個(gè)計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù)設(shè)置成一個(gè)P行η列的健康狀態(tài)數(shù)據(jù)歷史值矩陣。
      3.根據(jù)權(quán)利要求2所述的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法,其特征在于,所述步驟S4包括以下子步驟: 541、優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)主控制節(jié)點(diǎn)是否出現(xiàn)故障;優(yōu)先級(jí)低的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)比其優(yōu)先級(jí)高一級(jí)的備控制節(jié)點(diǎn)是否出現(xiàn)故障; 542、如果探測(cè)到主控制節(jié)點(diǎn)出現(xiàn)故障,則優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)配置為主控制節(jié)點(diǎn),將除優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)以外的其他備控制節(jié)點(diǎn)的優(yōu)先級(jí)各自提高一級(jí); 543、如果探測(cè)到備控制節(jié)點(diǎn)出現(xiàn)故障,將優(yōu)先級(jí)低于該出現(xiàn)故障的備控制節(jié)點(diǎn)的所有備控制節(jié)點(diǎn)的優(yōu)先級(jí)各自提高一級(jí)。
      4.根據(jù)權(quán)利要求3所述的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法,其特征在于,所述步驟S5包括以下子步驟: 551、主控制節(jié)點(diǎn)逐列分析健康狀態(tài)數(shù)據(jù)歷史值矩陣,每列健康狀態(tài)數(shù)據(jù)對(duì)應(yīng)一個(gè)計(jì)算節(jié)點(diǎn); 552、判斷所有的計(jì)算節(jié)點(diǎn)是否都分析了一遍,如果所有的計(jì)算節(jié)點(diǎn)都分析了一遍,則跳轉(zhuǎn)到步驟S57 ;如果存在計(jì)算節(jié)點(diǎn)沒(méi)有分析,則跳轉(zhuǎn)到步驟S53 ; 553、分別統(tǒng)計(jì)當(dāng)前計(jì)算節(jié)點(diǎn)超過(guò)健康狀態(tài)參考范圍以及低于健康狀態(tài)參考范圍的采集的次數(shù); 554、如果超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)小于kI,并且低于健康狀態(tài)參考范圍的采集的次數(shù)小于k2,則判定該計(jì)算節(jié)點(diǎn)為健康狀態(tài),并跳轉(zhuǎn)到步驟S55 ;如果超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)大于或等于kl,或者低于健康狀態(tài)參考范圍的采集的次數(shù)大于或等于k2,則判定該計(jì)算節(jié)點(diǎn)為非健康狀態(tài),并跳轉(zhuǎn)到步驟S56 ; 555、將該計(jì)算節(jié)點(diǎn)的非健康標(biāo)志值設(shè)置為O,并跳轉(zhuǎn)到步驟S51; 556、獲取超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)和低于健康狀態(tài)參考范圍的采集的次數(shù)的最大值,將該最大值設(shè)置為該計(jì)算節(jié)點(diǎn)的非健康狀態(tài)值,并跳轉(zhuǎn)到步驟S51 ; 557、分析所有計(jì)算節(jié)點(diǎn)的非健康標(biāo)志值,判斷是否存在非O值的計(jì)算節(jié)點(diǎn);如果不存在非O值的計(jì)算節(jié)點(diǎn),則確定所有的計(jì)算節(jié)點(diǎn)都是健康的,如果存在非O值的計(jì)算節(jié)點(diǎn),則確定存在非健康的計(jì)算節(jié)點(diǎn); 558、按照設(shè)置策略對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理,等待第一預(yù)設(shè)時(shí)間Tl后跳轉(zhuǎn)到步驟S21。
      5.根據(jù)權(quán)利要求4所述的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)方法,其特征在于,所述步驟S58包括以下子步驟: 5581、設(shè)置第一策略、第二策略、第三策略,第一策略包括提示告警、自動(dòng)遷移任務(wù)出去、告警同時(shí)自動(dòng)遷移任務(wù)出去三個(gè)選項(xiàng);第二策略包括提不告警、自動(dòng)關(guān)機(jī)、告警同時(shí)自動(dòng)關(guān)機(jī)等三個(gè)選項(xiàng);第三策略包括提示告警、自動(dòng)遷移任務(wù)回來(lái)、告警同時(shí)自動(dòng)遷移任務(wù)回來(lái)三個(gè)選項(xiàng); 5582、判斷非健康的計(jì)算節(jié)點(diǎn)是否存在處理任務(wù),如果非健康的計(jì)算節(jié)點(diǎn)存在處理任務(wù),則查詢(xún)第一策略并按照第一策略進(jìn)行處理;如果非健康的計(jì)算節(jié)點(diǎn)不存在處理任務(wù),則查詢(xún)第二策略并按照第二策略進(jìn)行處理; 5583、判斷健康的計(jì)算節(jié)點(diǎn)是否存在處理任務(wù),如果健康的計(jì)算節(jié)點(diǎn)存在處理任務(wù),則對(duì)該健康的計(jì)算節(jié)點(diǎn)不做操作;如果健康的計(jì)算節(jié)點(diǎn)不存在處理任務(wù),則確定該健康的計(jì)算節(jié)點(diǎn)是從非健康狀態(tài)恢復(fù)成健康狀態(tài)的,并記錄下當(dāng)前時(shí)間戳,如果當(dāng)前時(shí)間戳減去上次時(shí)間戳的差值小于第二預(yù)設(shè)時(shí)間T2,或者沒(méi)有上次時(shí)間戳,則不作任何操作,如果差值大于或等于第二預(yù)設(shè)時(shí)間T2則按照第三策略進(jìn)行處理; 5584、等待第一預(yù)設(shè)時(shí)間Tl后跳轉(zhuǎn)到步驟S21。
      6.一種基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng),其特征在于,所述基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng)包括如下模塊: 節(jié)點(diǎn)配置模塊,用于設(shè)置至少兩個(gè)控制節(jié)點(diǎn)和至少兩個(gè)計(jì)算節(jié)點(diǎn);將其中一個(gè)控制節(jié)點(diǎn)設(shè)置為主控制節(jié)點(diǎn),將其他的控制節(jié)點(diǎn)設(shè)置為備控制節(jié)點(diǎn)并配置備控制節(jié)點(diǎn)的優(yōu)先級(jí)順序;設(shè)置主控制節(jié)點(diǎn)的優(yōu)先級(jí)高于任何一備控制節(jié)點(diǎn); 數(shù)據(jù)采集模塊,用于通過(guò)各控制節(jié)點(diǎn)分別重復(fù)采集并存儲(chǔ)所有的計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù); 節(jié)點(diǎn)判斷模塊,用于判斷當(dāng)前控制節(jié)點(diǎn)是否為主控制節(jié)點(diǎn),如果當(dāng)前控制節(jié)點(diǎn)是主控制節(jié)點(diǎn),則跳轉(zhuǎn)到數(shù)據(jù)分析模塊;如果當(dāng)前控制節(jié)點(diǎn)是備控制節(jié)點(diǎn),則跳轉(zhuǎn)到故障判斷模塊; 故障判斷模塊,用于通過(guò)優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)主控制節(jié)點(diǎn)是否出現(xiàn)故障;通過(guò)優(yōu)先級(jí)低的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)比其優(yōu)先級(jí)高一級(jí)的備控制節(jié)點(diǎn)是否出現(xiàn)故障;當(dāng)控制節(jié)點(diǎn)出現(xiàn)故障時(shí),修改優(yōu)先級(jí)順序; 數(shù)據(jù)分析模塊,用于通過(guò)主控制節(jié)點(diǎn)分析存儲(chǔ)在主控制節(jié)點(diǎn)的存儲(chǔ)器上存儲(chǔ)的健康狀態(tài)數(shù)據(jù),根據(jù)分析結(jié)果對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理。
      7.根據(jù)權(quán)利要求6所述的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng),其特征在于,所述數(shù)據(jù)采集模塊包括以下單元: 數(shù)據(jù)采集單元,用于通過(guò)各控制節(jié)點(diǎn)分別每隔一固定時(shí)間Tl采集一次所有的計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù),并將采集的所述健康狀態(tài)數(shù)據(jù)保存到各控制節(jié)點(diǎn)各自的存儲(chǔ)器上; 采集次數(shù)判斷單元,用于判斷采集的次數(shù)是否小于預(yù)定次數(shù)P,當(dāng)果采集的次數(shù)小于預(yù)定次數(shù)P時(shí),啟動(dòng)數(shù)據(jù)采集單元的功能;當(dāng)采集的次數(shù)大于預(yù)定次數(shù)P時(shí),刪除各控制節(jié)點(diǎn)存儲(chǔ)器上多余的歷史健康狀態(tài)數(shù)據(jù),保留最近的P次采集到的健康狀態(tài)數(shù)據(jù);當(dāng)采集的次數(shù)等于預(yù)定次數(shù)P時(shí),則直接保留最近的P次采集到的健康狀態(tài)數(shù)據(jù); 矩陣配置單元,用于將各控制節(jié)點(diǎn)P次采集到的η個(gè)計(jì)算節(jié)點(diǎn)的健康狀態(tài)數(shù)據(jù)設(shè)置成一個(gè)P行η列的健康狀態(tài)數(shù)據(jù)歷史值矩陣。
      8.根據(jù)權(quán)利要求7所述的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng),其特征在于,所述故障判斷模塊包括以下單元: 故障判斷單元,用于通過(guò)優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)主控制節(jié)點(diǎn)是否出現(xiàn)故障;通過(guò)優(yōu)先級(jí)低的備控制節(jié)點(diǎn)實(shí)時(shí)通過(guò)心跳探測(cè)比其優(yōu)先級(jí)高一級(jí)的備控制節(jié)點(diǎn)是否出現(xiàn)故障; 第一調(diào)整單元,用于當(dāng)探測(cè)到主控制節(jié)點(diǎn)出現(xiàn)故障時(shí),將優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)配置為主控制節(jié)點(diǎn),將除優(yōu)先級(jí)最高的備控制節(jié)點(diǎn)以外的其他備控制節(jié)點(diǎn)的優(yōu)先級(jí)各自提高一級(jí); 第二調(diào)整單元,用于當(dāng)探測(cè)到備控制節(jié)點(diǎn)出現(xiàn)故障時(shí),將優(yōu)先級(jí)低于該出現(xiàn)故障的備控制節(jié)點(diǎn)的所有備控制節(jié)點(diǎn)的優(yōu)先級(jí)各自提高一級(jí)。
      9.根據(jù)權(quán)利要求8所述的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng),其特征在于,所述數(shù)據(jù)分析模塊包括以下單元: 分析單元,用于通過(guò)主控制節(jié)點(diǎn)逐列分析健康狀態(tài)數(shù)據(jù)歷史值矩陣,每列健康狀態(tài)數(shù)據(jù)對(duì)應(yīng)一個(gè)計(jì)算節(jié)點(diǎn); 分析判斷單元,用于判斷所有的計(jì)算節(jié)點(diǎn)是否都分析了一遍,當(dāng)所有的計(jì)算節(jié)點(diǎn)都分析了一遍時(shí),啟動(dòng)計(jì)算節(jié)點(diǎn)判斷單元的功能;當(dāng)存在計(jì)算節(jié)點(diǎn)沒(méi)有分析時(shí),啟動(dòng)統(tǒng)計(jì)單元的功能; 統(tǒng)計(jì)單元,用于分別統(tǒng)計(jì)當(dāng)前計(jì)算節(jié)點(diǎn)超過(guò)健康狀態(tài)參考范圍以及低于健康狀態(tài)參考范圍的采集的次數(shù); 狀態(tài)判斷單元,用于在超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)小于kl,并且低于健康狀態(tài)參考范圍的采集的次數(shù)小于k2時(shí),判定該計(jì)算節(jié)點(diǎn)為健康狀態(tài),并啟動(dòng)第一標(biāo)志值設(shè)置單元的功能;當(dāng)超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)大于或等于kl,或者低于健康狀態(tài)參考范圍的采集的次數(shù)大于或等于k2時(shí),則判定該計(jì)算節(jié)點(diǎn)為非健康狀態(tài),并啟動(dòng)第二標(biāo)志值設(shè)置單元的功能; 第一標(biāo)志值設(shè)置單元,用于將該計(jì)算節(jié)點(diǎn)的非健康標(biāo)志值設(shè)置為O,并啟動(dòng)分析單元的功能; 第二標(biāo)志值設(shè)置單元,用于獲取超過(guò)健康狀態(tài)參考范圍的采集的次數(shù)和低于健康狀態(tài)參考范圍的采集的次數(shù)的最大值,將該最大值設(shè)置為該計(jì)算節(jié)點(diǎn)的非健康狀態(tài)值,并啟動(dòng)分析單元的功能; 計(jì)算節(jié)點(diǎn)判斷單元,用于分析所有計(jì)算節(jié)點(diǎn)的非健康標(biāo)志值,判斷是否存在非O值的計(jì)算節(jié)點(diǎn);當(dāng)不存在非O值的計(jì)算節(jié)點(diǎn)時(shí),確定所有的計(jì)算節(jié)點(diǎn)都是健康的,當(dāng)存在非O值的計(jì)算節(jié)點(diǎn),則確定存在非健康的計(jì)算節(jié)點(diǎn); 計(jì)算節(jié)點(diǎn)管理單元,用于按照設(shè)置策略對(duì)計(jì)算節(jié)點(diǎn)進(jìn)行管理,等待第一預(yù)設(shè)時(shí)間Tl后啟動(dòng)數(shù)據(jù)采集單元的功能。
      10.根據(jù)權(quán)利要求9所述的基于健康管理的高可用系統(tǒng)實(shí)現(xiàn)系統(tǒng),其特征在于,所述計(jì)算節(jié)點(diǎn)管理單元包括以下子單元: 策略設(shè)置子單元,用于設(shè)置第一策略、第二策略、第三策略,第一策略包括提示告警、自動(dòng)遷移任務(wù)出去、告警同時(shí)自動(dòng)遷移任務(wù)出去三個(gè)選項(xiàng);第二策略包括提示告警、自動(dòng)關(guān)機(jī)、告警同時(shí)自動(dòng)關(guān)機(jī)等三個(gè)選項(xiàng);第三策略包括提示告警、自動(dòng)遷移任務(wù)回來(lái)、告警同時(shí)自動(dòng)遷移任務(wù)回來(lái)三個(gè)選項(xiàng); 第一任務(wù)判斷子單元,用于判斷非健康的計(jì)算節(jié)點(diǎn)是否存在處理任務(wù),當(dāng)非健康的計(jì)算節(jié)點(diǎn)存在處理任務(wù)時(shí),查詢(xún)第一策略并按照第一策略進(jìn)行處理;當(dāng)非健康的計(jì)算節(jié)點(diǎn)不存在處理任務(wù)時(shí),查詢(xún)第二策略并按照第二策略進(jìn)行處理; 第二任務(wù)判斷子單元,用于判斷健康的計(jì)算節(jié)點(diǎn)是否存在處理任務(wù),當(dāng)健康的計(jì)算節(jié)點(diǎn)存在處理任務(wù)時(shí),對(duì)該健康的計(jì)算節(jié)點(diǎn)不做操作;當(dāng)健康的計(jì)算節(jié)點(diǎn)不存在處理任務(wù)時(shí),確定該健康的計(jì)算節(jié)點(diǎn)是從非健康狀態(tài)恢復(fù)成健康狀態(tài)的,并記錄下當(dāng)前時(shí)間戳,如果當(dāng)前時(shí)間戳減去上次時(shí)間戳的差值小于第二預(yù)設(shè)時(shí)間T2,或者沒(méi)有上次時(shí)間戳,則不作任何操作,如果差值大于或等于第二預(yù)設(shè)時(shí)間T2則按照第三策略進(jìn)行處理; 跳轉(zhuǎn)子單元,用于在等待第一預(yù)設(shè)時(shí)間Tl后啟動(dòng)數(shù)據(jù)采集單元的功能。
      【文檔編號(hào)】G06F11/07GK104199747SQ201410403247
      【公開(kāi)日】2014年12月10日 申請(qǐng)日期:2014年8月15日 優(yōu)先權(quán)日:2014年8月15日
      【發(fā)明者】伍華鳳, 何龍, 龔念, 戴新發(fā), 代征 申請(qǐng)人:中國(guó)船舶重工集團(tuán)公司第七0九研究所
      網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
      • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1