本申請涉及計算機(jī),尤其涉及一種故障處理方法及設(shè)備。
背景技術(shù):
1、近年來,隨著互聯(lián)網(wǎng)技術(shù)(internet?technology,it)系統(tǒng)分布式架構(gòu)的普及,逐漸出現(xiàn)了大量由單個節(jié)點構(gòu)建的業(yè)務(wù)系統(tǒng)。目前,當(dāng)業(yè)務(wù)系統(tǒng)中某個節(jié)點的操作系統(tǒng)出現(xiàn)故障時,只能人工介入處理,效率較低且耗費人力。
技術(shù)實現(xiàn)思路
1、本申請?zhí)峁┮环N故障處理方法及設(shè)備,用以提升故障處理效率,降低成本。
2、第一方面,本申請?zhí)峁┮环N故障處理方法,該方法可應(yīng)用于包含有多個操作系統(tǒng)的計算節(jié)點。具體的,該方法包括:計算節(jié)點在接收到第一啟動指令后,首先判斷預(yù)設(shè)的啟動標(biāo)識信息在多個操作系統(tǒng)對應(yīng)的哪個系統(tǒng)盤上。比如,確定預(yù)設(shè)的啟動標(biāo)識信息設(shè)置在多個操作系統(tǒng)中的第一操作系統(tǒng)對應(yīng)的第一系統(tǒng)盤上,則啟動第一操作系統(tǒng)。然后,計算節(jié)點在啟動第一操作系統(tǒng)后,將第一系統(tǒng)盤上設(shè)置的所述啟動標(biāo)識信息刪除,并在第二系統(tǒng)盤上設(shè)置所述啟動標(biāo)識信息,該第二系統(tǒng)盤是所述多個操作系統(tǒng)中除第一操作系統(tǒng)之外的任一第二操作系統(tǒng)對應(yīng)的系統(tǒng)盤。最后,在檢測到當(dāng)前運(yùn)行的第一操作系統(tǒng)出現(xiàn)故障時,在確定所述啟動標(biāo)識信息設(shè)置在所述第二系統(tǒng)盤時,啟動第二操作系統(tǒng)接替第一操作系統(tǒng)工作。
3、通過上述技術(shù)方案,當(dāng)計算節(jié)點的操作系統(tǒng)出現(xiàn)故障時,可根據(jù)啟動標(biāo)識信息自動將操作系統(tǒng)切換到其它正常的操作系統(tǒng),無需人工參與重啟過程,能夠提升故障處理效率,提升用戶體驗。
4、在一種可能的實現(xiàn)中,計算節(jié)點在檢測到當(dāng)前運(yùn)行的所述第一操作系統(tǒng)出現(xiàn)故障之前,所述方法還包括:計算節(jié)點將所述第一操作系統(tǒng)的第一配置文件同步到所述第二系統(tǒng)盤。
5、通過上述技術(shù)方案,在第一操作系統(tǒng)啟動之后,計算節(jié)點可將第一操作系統(tǒng)的第一配置文件同步給第二系統(tǒng)盤,以保證對端系統(tǒng)盤的數(shù)據(jù)一致性。
6、在一種可能的實現(xiàn)中,計算節(jié)點啟動所述第二操作系統(tǒng)接替所述第一操作系統(tǒng)工作之后,所述方法還包括:在所述第一操作系統(tǒng)的故障消除后,將所述第二系統(tǒng)盤上設(shè)置的所述啟動標(biāo)識信息刪除,并在所述第一系統(tǒng)盤上設(shè)置所述啟動標(biāo)識信息。
7、通過上述技術(shù)方案,當(dāng)?shù)诙僮飨到y(tǒng)接替第一操作系統(tǒng)繼續(xù)進(jìn)行工作后,可將第二系統(tǒng)盤的啟動標(biāo)識信息更新到第一系統(tǒng)盤上,以使得當(dāng)?shù)谝徊僮飨到y(tǒng)恢復(fù)正常運(yùn)行時,后續(xù)可以重啟第一操作系統(tǒng),實現(xiàn)循環(huán)啟動操作系統(tǒng)。
8、在一種可能的實現(xiàn)中,在所述第一系統(tǒng)盤上設(shè)置所述啟動標(biāo)識信息之后,還包括:計算節(jié)點確定所述第二系統(tǒng)盤出現(xiàn)故障,在確定出所述啟動標(biāo)識信息設(shè)置在所述第一系統(tǒng)盤時,則啟動所述第一操作系統(tǒng)接替所述第二操作系統(tǒng)工作。
9、通過上述技術(shù)方案,當(dāng)檢測到對端操作系統(tǒng)的系統(tǒng)盤故障時,可將啟動標(biāo)識信息恢復(fù)到原系統(tǒng)盤上,避免由于系統(tǒng)盤硬件故障導(dǎo)致的數(shù)據(jù)同步異常的情況發(fā)生。
10、在一種可能的實現(xiàn)中,計算節(jié)點啟動所述第二操作系統(tǒng)接替所述第一操作系統(tǒng)工作之后,所述方法還包括:計算節(jié)點將所述第二操作系統(tǒng)的第二配置文件同步到所述第一系統(tǒng)盤。通過上述技術(shù)方案,可將第二配置文件同步給第一系統(tǒng)盤,以保證兩個數(shù)據(jù)盤上的數(shù)據(jù)一致。
11、在一種可能的實現(xiàn)中,所述方法還包括:計算節(jié)點將第二系統(tǒng)盤上的第一配置文件發(fā)送給第一系統(tǒng)盤。然后計算節(jié)點根據(jù)所述第一配置文件對所述第一操作系統(tǒng)進(jìn)行數(shù)據(jù)恢復(fù)。
12、通過上述技術(shù)方案,可利用第一系統(tǒng)盤在發(fā)生故障之前同步給第二系統(tǒng)盤的文件對第一系統(tǒng)盤對應(yīng)的操作系統(tǒng)進(jìn)行數(shù)據(jù)恢復(fù)。
13、在一種可能的實現(xiàn)中,計算節(jié)點將所述第一操作系統(tǒng)的第一配置文件同步到所述第二系統(tǒng)盤之前,所述方法還包括:計算節(jié)點對所述第一配置文件的文件變化狀態(tài)進(jìn)行檢測;根據(jù)檢測結(jié)果確定所述第一配置文件的文件變化狀態(tài)為文件大小修改或者文件內(nèi)容修改。
14、在一種可能的實現(xiàn)中,計算節(jié)點將所述第二操作系統(tǒng)的第二配置文件同步到所述第一系統(tǒng)盤之前,所述方法還包括:計算節(jié)點對所述第二配置文件的文件變化狀態(tài)進(jìn)行檢測,根據(jù)檢測結(jié)果確定所述第二配置文件的文件變化狀態(tài)為文件大小修改或者文件內(nèi)容修改。
15、通過上述技術(shù)方案,可以避免由于誤操作等原因?qū)е碌墓收贤降綄Χ讼到y(tǒng)盤。
16、第二方面,本申請?zhí)峁┮环N故障處理裝置,該裝置可包括:接收模塊和處理模塊。示例性的,接收模塊卡用于接收第一啟動指令。處理模塊可用于將所述第一系統(tǒng)盤上設(shè)置的所述啟動標(biāo)識信息刪除,并在第二系統(tǒng)盤上設(shè)置所述啟動標(biāo)識信息,所述第二系統(tǒng)盤是所述多個操作系統(tǒng)中除所述第一操作系統(tǒng)之外的任一第二操作系統(tǒng)對應(yīng)的系統(tǒng)盤;并在檢測到當(dāng)前運(yùn)行的所述第一操作系統(tǒng)出現(xiàn)故障時,在確定出所述啟動標(biāo)識信息設(shè)置在所述第二系統(tǒng)盤時,則啟動所述第二操作系統(tǒng)接替所述第一操作系統(tǒng)工作。
17、第三方面,本申請還提供一種計算設(shè)備集群,包括至少一個計算設(shè)備,每個計算設(shè)備包括處理器和存儲器;所述至少一個計算設(shè)備的處理器用于執(zhí)行所述至少一個計算設(shè)備的存儲器中存儲的指令,以使得所述計算設(shè)備集群執(zhí)行上述第一方面或第一方面任一種可能實現(xiàn)方式中所述的方法。
18、第四方面,本申請還提供一種計算機(jī)可讀存儲介質(zhì),包括計算機(jī)程序指令,當(dāng)所述計算機(jī)程序指令由計算設(shè)備集群執(zhí)行時,所述計算設(shè)備集群執(zhí)行上述第一方面或第一方面任一種可能實現(xiàn)方式中所述的方法。
19、第五方面,本申請還提供一種包含指令的計算機(jī)程序產(chǎn)品,當(dāng)所述指令被計算設(shè)備集群運(yùn)行時,使得所述計算設(shè)備集群執(zhí)行上述第一方面或第一方面任一種可能實現(xiàn)方式中所述的方法。
20、關(guān)于第二方面至第五方面各種實施方式所帶來的技術(shù)效果,可以參考對于第一方面或第一方面的各種實施方式的技術(shù)效果的介紹,在此處不作過多贅述。
1.一種故障處理方法,其特征在于,所述方法應(yīng)用于包含有多個操作系統(tǒng)的計算節(jié)點,所述方法包括:
2.如權(quán)利要求1所述的方法,其特征在于,所述計算節(jié)點在檢測到當(dāng)前運(yùn)行的所述第一操作系統(tǒng)出現(xiàn)故障之前,所述方法還包括:
3.如權(quán)利要求1所述的方法,其特征在于,所述計算節(jié)點啟動所述第二操作系統(tǒng)接替所述第一操作系統(tǒng)工作之后,所述方法還包括:
4.如權(quán)利要求3所述的方法,其特征在于,在所述第一系統(tǒng)盤上設(shè)置所述啟動標(biāo)識信息之后,還包括:
5.如權(quán)利要求3或4所述的方法,其特征在于,在所述第一系統(tǒng)盤上設(shè)置所述啟動標(biāo)識信息之后,所述方法還包括:
6.如權(quán)利要求2所述的方法,其特征在于,所述計算節(jié)點將所述第一操作系統(tǒng)的第一配置文件同步到所述第二系統(tǒng)盤之前,所述方法還包括:
7.如權(quán)利要求5所述的方法,其特征在于,所述計算節(jié)點將所述第二操作系統(tǒng)的第二配置文件同步到所述第一系統(tǒng)盤之前,所述方法還包括:
8.一種計算設(shè)備集群,其特征在于,包括至少一個計算設(shè)備,每個計算設(shè)備包括處理器和存儲器;
9.一種計算機(jī)可讀存儲介質(zhì),其特征在于,包括計算機(jī)程序指令,當(dāng)所述計算機(jī)程序指令由計算設(shè)備集群執(zhí)行時,所述計算設(shè)備集群執(zhí)行如權(quán)利要求1-7中任一項所述的方法。
10.一種包含指令的計算機(jī)程序產(chǎn)品,其特征在于,當(dāng)所述指令被計算設(shè)備集群運(yùn)行時,使得所述計算設(shè)備集群執(zhí)行如權(quán)利要求1-7中任一項所述的方法。