国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      片上網(wǎng)絡(luò)中針對瞬時故障和間歇性故障的高可靠鏈路容錯模塊及其方法

      文檔序號:9891316閱讀:485來源:國知局
      片上網(wǎng)絡(luò)中針對瞬時故障和間歇性故障的高可靠鏈路容錯模塊及其方法
      【技術(shù)領(lǐng)域】
      [0001]本發(fā)明屬于集成電路芯片設(shè)計的容錯技術(shù)領(lǐng)域,特別是一種片上網(wǎng)絡(luò)中針對瞬時故障和間歇性故障的高可靠鏈路容錯模塊及其方法。
      【背景技術(shù)】
      [0002]隨著半導(dǎo)體技術(shù)的發(fā)展,單個芯片上集成的核數(shù)目越來越多,相較于傳統(tǒng)的基于總線架構(gòu)的片上系統(tǒng)(System-on_Chip,SoC),片上網(wǎng)絡(luò)(Network-on-Chip,NoC)作為一種新的片上多核系統(tǒng)互連通信架構(gòu)的解決方案,由于其可擴展性高、低延時和高帶寬的優(yōu)點被提出。
      [0003]NoC系統(tǒng)的主要功能是通過路由器保證數(shù)據(jù)包能夠正確無損的從源節(jié)點傳輸?shù)侥康墓?jié)點。鏈路作為路由器之間連接的關(guān)鍵數(shù)據(jù)通路,起著至關(guān)重要的作用。然而由于軟錯誤、線間串?dāng)_、溫度和老化等問題,鏈路傳輸可靠性受到了極大的挑戰(zhàn)。當(dāng)鏈路故障發(fā)生時,即使路由器無故障,也不能發(fā)揮其正常的路由功能,大大降低了整體網(wǎng)絡(luò)性能。因此針對鏈路的容錯設(shè)計顯得尤為重要。
      [0004]在鏈路上發(fā)生的故障可分為永久性故障、瞬時故障和間歇性故障。鏈路一旦發(fā)生就會一直存在不會消失,可控性好,容錯一般采用重路由或硬件冗余來解決。
      [0005]瞬時故障的發(fā)生隨機且沒有規(guī)律,一般發(fā)生是瞬時性的且可恢復(fù)。大約有8O %的通信故障為瞬時故障。對于瞬時故障容錯,一般可以分為以下兩大類:第一類基于隨機通信的容錯機制,如洪泛算法,通過廣播和擴散,目的節(jié)點會收到很多冗余的數(shù)據(jù)包備份,帶來了很大的功耗開銷;第二類是基于檢錯碼和糾錯碼的請求重傳機制,主要有端到端(end-to-end ,e2e)的重傳,和跳到跳(switch-to-switch,s2s)的重傳,e2e重傳機制在發(fā)送端和接收端的網(wǎng)絡(luò)接口中進行ECC編解碼,該方法僅在目的節(jié)點進行錯誤檢測,發(fā)生重傳時會導(dǎo)致延時翻倍。s2s重傳機制在每個路由器內(nèi)部設(shè)置重傳緩沖區(qū)(Buffer)暫存?zhèn)鬏數(shù)臄?shù)據(jù),但是ECC只能覆蓋一位數(shù)據(jù)錯誤,多位數(shù)據(jù)出錯時會觸發(fā)重傳機制,也會增大網(wǎng)絡(luò)延時。
      [0006]間歇性故障是由于溫度、電壓等因素的影響導(dǎo)致故障間歇性發(fā)生,且持續(xù)多個時鐘周期,其可控性差。既不能通過重傳機制來解決,也不能定義為永久性故障進行解決,間歇性故障發(fā)生時,數(shù)據(jù)包的傳輸路徑被故障鏈路截斷。已通過故障鏈路的數(shù)據(jù)由于缺少尾微片(flit)對其所占用資源的釋放,長時間的資源占用會造成網(wǎng)絡(luò)擁塞,降低了網(wǎng)絡(luò)性能;同樣地,由于故障鏈路的存在,未通過故障鏈路的數(shù)據(jù)缺少頭flit的路由引導(dǎo),長時間占用Buffer資源會造成網(wǎng)絡(luò)擁塞,甚至有可能導(dǎo)致死鎖。綜上所述,在考慮容忍瞬時故障和間歇性故障方面顯得十分必要。

      【發(fā)明內(nèi)容】

      [0007]本發(fā)明是為了避免上述現(xiàn)有技術(shù)存在的不足之處,提供一種片上網(wǎng)絡(luò)中針對瞬時故障和間歇性故障的高可靠鏈路容錯模塊及其方法,分別針對瞬時故障和間歇性故障進行了詳細的分析,添加相應(yīng)的容錯模塊進行故障的容錯,以期能在以較小的硬件開銷為代價,從而能在瞬時故障和間歇性故障發(fā)生時,保障網(wǎng)絡(luò)的可靠性,提高系統(tǒng)的性能。
      [0008]本發(fā)明解決技術(shù)問題所采用的技術(shù)方案是:
      [0009]本發(fā)明一種片上網(wǎng)絡(luò)中針對瞬時故障和間歇性故障的高可靠鏈路容錯模塊,是應(yīng)用于由輸入端口模塊、路由計算模塊、交叉開關(guān)、交叉開關(guān)分配模塊、虛通道仲裁模塊、和輸出端口模塊所組成的路由器中;所述輸入端口模塊中包含η個虛通道VC,多路數(shù)據(jù)分配器和多路數(shù)據(jù)選擇器;由鏈路傳輸?shù)臄?shù)據(jù)包通過所述輸入端口模塊的數(shù)據(jù)分配器進入η個虛通道VC,并通過數(shù)據(jù)選擇器進行選擇傳輸;
      [0010]所述數(shù)據(jù)包劃分為若干個flit進行傳輸,并根據(jù)數(shù)據(jù)包沿著所經(jīng)過的路由節(jié)點的順序,定義所經(jīng)過的任意一個路由節(jié)點均是以上一個路由節(jié)點為上游節(jié)點,以下一個路由節(jié)點為下游節(jié)點的當(dāng)前路由節(jié)點;將所述當(dāng)前路由節(jié)點記為第i個路由節(jié)點;則上游節(jié)點為第1-Ι個路由節(jié)點;下游節(jié)點為第i+Ι個路由節(jié)點;其特點是:
      [0011]在所述第i個路由節(jié)點的輸入端口模塊的輸入端設(shè)置有第一錯誤檢測單元ECCl;在所述η個虛通道上分別有三態(tài)門和截斷恢復(fù)單元TRU;每個虛通道和相應(yīng)的截斷恢復(fù)單元TRU通過2選I的多路數(shù)據(jù)選擇器傳輸至所述多路數(shù)據(jù)選擇器中;在所述多路數(shù)據(jù)選擇器的輸出端設(shè)置有重傳恢復(fù)單元RRU和第二錯誤檢測單元ECC2;從而構(gòu)成高可靠鏈路容錯模塊;
      [0012]當(dāng)?shù)趇個路由節(jié)點通過鏈路接收到第1-Ι個路由節(jié)點通過其第二錯誤檢測單元ECC2編碼的數(shù)據(jù)包時,第i個路由節(jié)點的第一錯誤檢測單元ECCl檢測所述數(shù)據(jù)包中的數(shù)據(jù)位是否出錯,若沒有出錯,則所述數(shù)據(jù)包通過所述第i個輸入端口模塊的數(shù)據(jù)分配器進入η個虛通道中進行傳輸,若出錯,則第i個路由節(jié)點的第一錯誤檢測單元ECCl判斷錯誤是否能正確糾正,若能正確糾正,則在自動糾正后進行傳輸,否則,告知第1-Ι個路由節(jié)點的輸入端口模塊的重傳恢復(fù)單元RRU,重傳出錯的數(shù)據(jù),同時第i個路由節(jié)點和第1-Ι個路由節(jié)點的計數(shù)器分別加一;表示第1-Ι個路由節(jié)點和第i個路由節(jié)點之間的鏈路中存在瞬時故障;
      [0013]當(dāng)所述計數(shù)器連續(xù)加一并達到故障閾值時,表示第1-Ι個路由節(jié)點和第i個路由節(jié)點之間的鏈路中存在間歇性故障,則通過第i個路由節(jié)點的2選I多路數(shù)據(jù)選擇器,選通第i個路由節(jié)點中的間歇性故障鏈路所對應(yīng)的截斷恢復(fù)單元TRU進行資源釋放;通過第1-Ι個路由節(jié)點的2選I多路數(shù)據(jù)選擇器,選通第1-Ι個路由節(jié)點中間歇性故障鏈路所對應(yīng)的截斷恢復(fù)單元TRU重新選擇路徑并傳輸至交叉開關(guān)。
      [0014]本發(fā)明所述的片上網(wǎng)絡(luò)中針對瞬時故障和間歇性故障的高可靠鏈路容錯模塊的特點也在于:
      [0015]所述第1-Ι個路由節(jié)點中輸入端口模塊的重傳恢復(fù)單元RRU包括:存儲空間為兩個flit的重傳buff er、一個2選I的多路選擇器、計數(shù)器、RRU控制器和一張VC追蹤表;所述VC追蹤表中存儲有所述重傳buffer內(nèi)的虛通道ID;
      [0016]當(dāng)?shù)?-Ι個路由節(jié)點和第i個路由節(jié)點之間的鏈路中存在瞬時故障時,第i個路由節(jié)點的第一錯誤檢測單元ECCl發(fā)送NACK信號給第1-Ι個路由節(jié)點的RRU控制器;
      [0017]所述第1-Ι個路由節(jié)點的RRU控制器控制所述計數(shù)器加一,并控制所述2選I的多路選擇器選通所述兩個f I i t的重傳buf fer內(nèi)的數(shù)據(jù)進行重傳;
      [0018]當(dāng)?shù)?-Ι個路由節(jié)點和第i個路由節(jié)點之間的鏈路中存在間歇性故障時,所述第1-1個路由節(jié)點的RRU控制器發(fā)送RX信號給所述第1-Ι個路由節(jié)點的截斷恢復(fù)單元TRU用于重新選擇路徑;第i個路由節(jié)點的第一錯誤檢測單元ECCl發(fā)送TX信號給所述第i個路由節(jié)點的截斷恢復(fù)單元TRU用于資源釋放。
      [0019]所述第i個路由節(jié)點中的截斷恢復(fù)單元TRU包括:存儲空間為一個flit的buffer、一個2選I的多路選擇器、一個2路數(shù)據(jù)分配器、偽頭flit修改通路Head和偽尾flit修改通路Tail、TRU控制器;所述buffer中存儲有數(shù)據(jù)包的頭flit;
      [0020]當(dāng)?shù)?-Ι個路由節(jié)點和第i個路由節(jié)點之間的鏈路中存在間歇性故障時,所述第i個路由節(jié)點的截斷恢復(fù)單元TRU接收到第i個路由節(jié)點的第一錯誤檢測單元ECCl發(fā)送TX信號,選通偽尾flit修改通路Tai I進行資源釋放;
      [0021]所述第1-Ι個路由節(jié)點的截斷恢復(fù)單元TRU接收到第1-Ι個路由節(jié)點的RRU控制器發(fā)送RX信號,選通偽頭flit修改通路通路Head進行重新路由;
      [0022]所述TRU控制器在完成數(shù)據(jù)包的傳輸后,刪除buffer中存儲的頭flit。
      [0023]本發(fā)明一種片上網(wǎng)絡(luò)中針對瞬時故障和間歇性故障的高可靠鏈路容錯方法,是應(yīng)用于
      當(dāng)前第1頁1 2 3 4 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1