国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種解決芯片失效故障的方法

      文檔序號(hào):6557013閱讀:1313來源:國知局
      專利名稱:一種解決芯片失效故障的方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及一種解決芯片失效故障而提高整個(gè)系統(tǒng)工作可靠性和穩(wěn)定性的方法,該方法尤其在具有多CPU芯片的通信系統(tǒng)中具有較大的應(yīng)用價(jià)值。
      背景技術(shù)
      在計(jì)算機(jī)系統(tǒng)中,硬件總是會(huì)存在一定的硬件失效率,特別是在系統(tǒng)運(yùn)行過程中,CPU系統(tǒng)的內(nèi)存或寄存器受周圍環(huán)境等各方面因素的影響,很容易導(dǎo)致失效,如果系統(tǒng)中的軟件沒有對(duì)這種異常情況進(jìn)行考慮并加以規(guī)避,可能會(huì)引起系統(tǒng)性能指標(biāo)的下降,甚至導(dǎo)致整個(gè)系統(tǒng)的癱瘓。比如存儲(chǔ)程序的內(nèi)存段出現(xiàn)故障,可能會(huì)導(dǎo)致下面兩種情況一種情況是某些程序指令被改寫,程序異常而跑飛,引起CPU復(fù)位,這種故障容易發(fā)現(xiàn),并能及時(shí)處理;另外一種情況是內(nèi)存的某個(gè)bit故障,而該bit故障剛好改變指令的某個(gè)參數(shù),程序雖然能繼續(xù)運(yùn)行,但是狀態(tài)不對(duì),會(huì)引起意想不到的情況,從而導(dǎo)致系統(tǒng)性能指標(biāo)的下降。
      在具有多CPU芯片的通信系統(tǒng)中,一般將其中一個(gè)CPU作為主CPU,其余的CPU作為從CPU?,F(xiàn)有的從CPU的檢測一般是通過主從CPU之間的簡單握手來判定從CPU是否出現(xiàn)故障,即主CPU發(fā)送一個(gè)測試消息包給從CPU,要求從CPU收到測試消息包后馬上產(chǎn)生應(yīng)答消息包回復(fù)給主CPU,通過主從CPU的簡單握手得出的測試結(jié)果如果正常,僅能說明消息通道通行正常,這種方法雖然能檢查出大部分的芯片故障,但是測試過程是不全面的。因?yàn)閷?shí)際上,從CPU運(yùn)行了許多程序模塊,而不同的程序模塊占用CPU不同的資源與內(nèi)存,上面的簡單握手只牽涉到對(duì)從CPU的維護(hù)模塊的檢測,其他很多軟件模塊都沒有運(yùn)行測試,對(duì)芯片的檢測不是特別充分,因?yàn)閱伟逭_\(yùn)行的大部分模塊都沒有被檢測到,因此測試不全。當(dāng)從CPU的內(nèi)存出現(xiàn)部分失效的情況下,僅僅通過主從CPU之間的簡單握手是不能完全判定的。在從CPU的程序區(qū)內(nèi)存的個(gè)別bit出現(xiàn)故障的情況下,如果該失效bit剛好改變從CPU程序區(qū)指令某個(gè)參數(shù),該從CPU程序雖然能運(yùn)行,但是運(yùn)行的結(jié)果或狀態(tài)不對(duì)。通常在這種情況下,由于內(nèi)存失效的從CPU能與主CPU簡單握手,主CPU仍然認(rèn)為該從CPU工作正常,并且不停地給該從CPU分配話路,但是該從CPU已經(jīng)無法得到正確的運(yùn)算結(jié)果,而系統(tǒng)卻無法檢查出該故障,從而導(dǎo)致系統(tǒng)整體性能指標(biāo)的下降。
      有鑒于此,有必要提供一種改進(jìn)方法以對(duì)從CPU進(jìn)行全面檢測,從而避免芯片的個(gè)別bit失效故障的發(fā)生。

      發(fā)明內(nèi)容
      本發(fā)明所要解決的技術(shù)問題在于提供一種解決芯片失效故障而提高整個(gè)系統(tǒng)工作可靠性和穩(wěn)定性的方法,用以規(guī)避芯片的內(nèi)存出現(xiàn)部分失效故障的情況發(fā)生。
      為解決上述技術(shù)問題,本發(fā)明是通過采用如下技術(shù)方案來實(shí)現(xiàn)的一種解決芯片失效故障的方法,其特征在于主CPU的業(yè)務(wù)模塊向從CPU發(fā)起業(yè)務(wù)功能檢測的測試消息請(qǐng)求;從CPU收到所述測試消息請(qǐng)求后調(diào)用其內(nèi)正常運(yùn)行的程序模塊進(jìn)行環(huán)回測試,判斷測試結(jié)果的正確性;從CPU根據(jù)所述測試結(jié)果向主CPU業(yè)務(wù)模塊回復(fù)一條測試響應(yīng)消息;主CPU的業(yè)務(wù)模塊根據(jù)所述測試響應(yīng)消息進(jìn)行相應(yīng)處理。
      依據(jù)該方法,如果所述測試結(jié)果為正確,則不對(duì)所述從CPU的話路分配做任何改動(dòng)。
      依據(jù)該方法,如果所述測試結(jié)果為錯(cuò)誤,或者等待測試響應(yīng)消息超時(shí),則主CPU的業(yè)務(wù)模塊將所述從CPU的所有話路分配的優(yōu)先級(jí)降低。
      依據(jù)該方法,如果等待所述從CPU測試響應(yīng)消息超時(shí),主CPU的業(yè)務(wù)模塊需要通知所述從CPU釋放。
      依據(jù)該方法,如果所述從CPU給主CPU的業(yè)務(wù)模塊回了測試響應(yīng)消息,則需要自行釋放時(shí)隙資源和拆除環(huán)回線路,由測試狀態(tài)恢復(fù)到正常狀態(tài)。
      依據(jù)該方法,主CPU發(fā)出的一條測試消息請(qǐng)求僅對(duì)一個(gè)從CPU進(jìn)行測試。
      依據(jù)該方法,所述從CPU測試完成后,主CPU再?zèng)Q定和選擇下一個(gè)需要測試的從CPU。
      依據(jù)該方法,其特征在于,所述測試過程選擇在從CPU運(yùn)行的空閑時(shí)間進(jìn)行。
      與現(xiàn)有技術(shù)相比,本發(fā)明通過利用芯片運(yùn)行的空閑時(shí)間,模擬CPU實(shí)際運(yùn)行的程序,來判斷CPU的失效,并采用相應(yīng)的規(guī)避措施,從根本上避免了CPU故障(如部分內(nèi)存部分bit失效等)引起的系統(tǒng)問題,提高了系統(tǒng)的可靠性和穩(wěn)定性,避免了網(wǎng)上事故的發(fā)生。


      圖1是根據(jù)本發(fā)明具體實(shí)施方式
      解決芯片失效故障的方法中主CPU對(duì)其中一從CPU進(jìn)行測試的流程圖。
      具體實(shí)施例方式
      為了使本發(fā)明的特征和優(yōu)點(diǎn)更加清楚明白,下面參照附圖結(jié)合具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步的描述。
      本發(fā)明具體實(shí)施例的一種解決芯片失效故障的方法,其發(fā)明的基本思路是主CPU利用空閑時(shí)間定時(shí)向從CPU發(fā)出測試消息請(qǐng)求,由從CPU接到測試消息請(qǐng)求后對(duì)其內(nèi)正常運(yùn)行的程序模塊進(jìn)行環(huán)回測試,主CPU根據(jù)測試結(jié)果的正確性來決定是否給該從CPU分配話路。
      本發(fā)明具體實(shí)施例的一種解決芯片失效故障的方法,如圖1所示首先,由主CPU的業(yè)務(wù)模塊定時(shí)在本單板內(nèi)輪尋有空閑通道的其中一從CPU進(jìn)行測試,向該從CPU發(fā)起業(yè)務(wù)功能檢測的測試消息請(qǐng)求,通知從CPU進(jìn)行指定通道或話路的正常性測試。主CPU發(fā)出的一條測試消息請(qǐng)求僅對(duì)一個(gè)從CPU進(jìn)行測試。
      其次,該從CPU收到該測試消息請(qǐng)求后,按照給出的特定測試序列,自行產(chǎn)生測試包,將測試語音包進(jìn)行環(huán)回測試。
      該環(huán)回測試能夠模擬CPU實(shí)際運(yùn)行的程序(即測試時(shí)運(yùn)行的程序模塊同正常運(yùn)行的程序模塊基本相同,保證同實(shí)際運(yùn)行基本一致)調(diào)用其內(nèi)正常運(yùn)行的程序模塊進(jìn)行檢測,該從CPU通過進(jìn)行環(huán)回測試能夠確保測試的全面性。
      再次,該從CPU測試完成后自行將測試結(jié)果與預(yù)先設(shè)定的結(jié)果進(jìn)行對(duì)比,判斷該測試結(jié)果的正確性,并根據(jù)測試結(jié)果向主CPU業(yè)務(wù)模塊回復(fù)一條測試響應(yīng)消息。
      最后,主CPU的業(yè)務(wù)模塊根據(jù)測試響應(yīng)消息進(jìn)行相應(yīng)處理,如果測試結(jié)果為正確,則不對(duì)該從CPU的話路分配做任何改動(dòng);如果測試結(jié)果為錯(cuò)誤,或者等待測試響應(yīng)消息超時(shí),則主CPU的業(yè)務(wù)模塊將該從CPU的所有話路分配的優(yōu)先級(jí)降低,并寫日志“從CPU性能下降”。如果等待從CPU測試響應(yīng)消息超時(shí),主CPU的業(yè)務(wù)模塊需要通知從CPU釋放;如果從CPU給主CPU的業(yè)務(wù)模塊回了測試響應(yīng)消息,則需要自行釋放時(shí)隙資源和拆除環(huán)回線路,由測試狀態(tài)恢復(fù)到正常狀態(tài)。
      主CPU業(yè)務(wù)模塊在測試完一個(gè)從CPU后,再?zèng)Q定和選擇下一個(gè)需要測試的從CPU,繼續(xù)重復(fù)上述的測試過程,直到把本單板內(nèi)的所有從CPU測試完。
      由于在測試過程中需要占用從CPU的話路資源,導(dǎo)致正在測試的話路不能再用來分配呼叫,因此,該測試一般選擇在夜間業(yè)務(wù)量低的情況下運(yùn)行,如可以考慮定在每天夜間2點(diǎn)等系統(tǒng)空閑時(shí)間開始測試。
      本發(fā)明采用定時(shí)在線檢測的方法,利用芯片運(yùn)行的空閑時(shí)間,模擬CPU實(shí)際運(yùn)行的程序,對(duì)單板正常運(yùn)行的程序模塊進(jìn)行環(huán)回測試,因?yàn)樵摐y試檢查過程是全面和完善的,所以能夠及時(shí)發(fā)現(xiàn)影響設(shè)備但還暫未引發(fā)致命問題的芯片故障,從而可以提前發(fā)現(xiàn)故障隱患,有效規(guī)避芯片的失效故障,極大地提高了系統(tǒng)的可靠性和穩(wěn)定性。
      以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
      權(quán)利要求
      1.一種解決芯片失效故障的方法,其特征在于主CPU的業(yè)務(wù)模塊向從CPU發(fā)起業(yè)務(wù)功能檢測的測試消息請(qǐng)求;從CPU收到所述測試消息請(qǐng)求后調(diào)用其內(nèi)正常運(yùn)行的程序模塊進(jìn)行環(huán)回測試,判斷測試結(jié)果的正確性;從CPU根據(jù)所述測試結(jié)果向主CPU業(yè)務(wù)模塊回復(fù)一條測試響應(yīng)消息;主CPU的業(yè)務(wù)模塊根據(jù)所述測試響應(yīng)消息進(jìn)行相應(yīng)處理。
      2.根據(jù)權(quán)利要求1所述的方法,其特征在于,如果所述測試結(jié)果為正確,則不對(duì)所述從CPU的話路分配做任何改動(dòng)。
      3.根據(jù)權(quán)利要求1所述的方法,其特征在于,如果所述測試結(jié)果為錯(cuò)誤,或者等待測試響應(yīng)消息超時(shí),則主CPU的業(yè)務(wù)模塊將所述從CPU的所有話路分配的優(yōu)先級(jí)降低。
      4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其特征在于,如果等待所述從CPU測試響應(yīng)消息超時(shí),主CPU的業(yè)務(wù)模塊需要通知所述從CPU釋放。
      5.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的方法,其特征在于,如果所述從CPU給主CPU的業(yè)務(wù)模塊回了測試響應(yīng)消息,則需要自行釋放時(shí)隙資源和拆除環(huán)回線路,由測試狀態(tài)恢復(fù)到正常狀態(tài)。
      6.根據(jù)權(quán)利要求1所述的方法,其特征在于,主CPU發(fā)出的一條測試消息請(qǐng)求僅對(duì)一個(gè)從CPU進(jìn)行測試。
      7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述從CPU測試完成后,主CPU再?zèng)Q定和選擇下一個(gè)需要測試的從CPU。
      8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述測試過程選擇在從CPU運(yùn)行的空閑時(shí)間進(jìn)行。
      全文摘要
      本發(fā)明公開一種解決芯片失效故障的方法,其包括主CPU利用從CPU的空閑時(shí)間定時(shí)向從CPU發(fā)起業(yè)務(wù)功能檢測的測試消息請(qǐng)求,通知從CPU進(jìn)行指定通道或話路的正常性測試;從CPU收到該測試消息請(qǐng)求后調(diào)用其內(nèi)正常運(yùn)行的程序模塊進(jìn)行環(huán)回測試,判斷測試結(jié)果的正確性;從CPU測試完成后,根據(jù)測試結(jié)果向主CPU回復(fù)一條測試響應(yīng)消息;主CPU根據(jù)測試響應(yīng)消息進(jìn)行相應(yīng)處理,如果測試結(jié)果為正確,則不對(duì)該從CPU的話路分配做任何改動(dòng);如果測試結(jié)果為錯(cuò)誤或等待測試響應(yīng)消息超時(shí),則主CPU將從CPU的所有話路分配的優(yōu)先級(jí)降低。通過采用該方法,可以提前發(fā)現(xiàn)故障隱患,確保了整個(gè)系統(tǒng)的可靠性和穩(wěn)定性。
      文檔編號(hào)G06F11/00GK101042661SQ20061006034
      公開日2007年9月26日 申請(qǐng)日期2006年4月16日 優(yōu)先權(quán)日2006年4月16日
      發(fā)明者蔣麟軍, 謝建湘 申請(qǐng)人:華為技術(shù)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1